Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 4191 |
Missing cells | 75 |
Missing cells (%) | 0.2% |
Duplicate rows | 55 |
Duplicate rows (%) | 1.3% |
Total size in memory | 266.2 KiB |
Average record size in memory | 65.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 4 |
Text | 2 |
Numeric | 1 |
Dataset
Description | 전라북도 고창군 대형폐기물 수거 현황( 수거일자, 폐기물 구분, 폐기물 명, 폐기물 규경, 개수, 행정동, 관리기관, 전화번호)에 관한 데이터입니다. |
---|---|
URL | https://www.data.go.kr/data/15097585/fileData.do |
행정동 has constant value "" | Constant |
관리기관 has constant value "" | Constant |
Dataset has 55 (1.3%) duplicate rows | Duplicates |
폐기물 구분 is highly imbalanced (61.1%) | Imbalance |
개수 has 73 (1.7%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 17:52:16.333608 |
---|---|
Analysis finished | 2023-12-12 17:52:17.673647 |
Duration | 1.34 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
수거일자
Date
Distinct | 612 |
---|---|
Distinct (%) | 14.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.9 KiB |
Minimum | 2021-01-20 00:00:00 |
---|---|
Maximum | 2023-08-21 00:00:00 |
폐기물 구분
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.9 KiB |
가구류 | |
---|---|
기타 | |
가구 | 6 |
가루규 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.779289 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 기타 |
---|---|
2nd row | 가구류 |
3rd row | 기타 |
4th row | 가구 |
5th row | 기타 |
Common Values
Value | Count | Frequency (%) |
가구류 | 3265 | |
기타 | 919 | 21.9% |
가구 | 6 | 0.1% |
가루규 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
가구류 | 3265 | |
기타 | 919 | 21.9% |
가구 | 6 | 0.1% |
가루규 | 1 | < 0.1% |
폐기물 명
Text
Distinct | 2705 |
---|---|
Distinct (%) | 64.6% |
Missing | 2 |
Missing (%) | < 0.1% |
Memory size | 32.9 KiB |
Length
Max length | 90 |
---|---|
Median length | 67 |
Mean length | 10.142516 |
Min length | 2 |
Characters and Unicode
Total characters | 42487 |
---|---|
Distinct characters | 466 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 2449 ? |
---|---|
Unique (%) | 58.5% |
Sample
1st row | 의자2+ 상3+ 옷걸이+ 돗자리 등 |
---|---|
2nd row | 싱글침대1+ CD장1+ 책장2+ 책상1+ 쇼파베드1 |
3rd row | 전기장판1 |
4th row | 책상1+ 쇼파1+ 침대 프레임1 |
5th row | 침대매트리스2 |
Value | Count | Frequency (%) |
매트리스1 | 467 | 5.2% |
의자1 | 318 | 3.5% |
등 | 246 | 2.7% |
쇼파1 | 211 | 2.3% |
책상1 | 196 | 2.2% |
소파1 | 181 | 2.0% |
서랍장1 | 174 | 1.9% |
의자2 | 142 | 1.6% |
장롱1 | 139 | 1.5% |
단스1 | 130 | 1.4% |
Other values (2019) | 6795 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 5193 | 12.2% |
4878 | 11.5% | |
+ | 4068 | 9.6% |
장 | 1763 | 4.1% |
2 | 1210 | 2.8% |
트 | 1209 | 2.8% |
자 | 1148 | 2.7% |
스 | 1126 | 2.7% |
매 | 1059 | 2.5% |
리 | 989 | 2.3% |
Other values (456) | 19844 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 25396 | |
Decimal Number | 7427 | 17.5% |
Space Separator | 4878 | 11.5% |
Math Symbol | 4089 | 9.6% |
Close Punctuation | 238 | 0.6% |
Open Punctuation | 238 | 0.6% |
Uppercase Letter | 156 | 0.4% |
Lowercase Letter | 38 | 0.1% |
Other Punctuation | 11 | < 0.1% |
Modifier Symbol | 8 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 1763 | 6.9% |
트 | 1209 | 4.8% |
자 | 1148 | 4.5% |
스 | 1126 | 4.4% |
매 | 1059 | 4.2% |
리 | 989 | 3.9% |
의 | 839 | 3.3% |
대 | 737 | 2.9% |
파 | 732 | 2.9% |
책 | 626 | 2.5% |
Other values (418) | 15168 |
Decimal Number
Value | Count | Frequency (%) |
1 | 5193 | |
2 | 1210 | 16.3% |
3 | 496 | 6.7% |
4 | 232 | 3.1% |
5 | 129 | 1.7% |
6 | 64 | 0.9% |
0 | 52 | 0.7% |
7 | 32 | 0.4% |
8 | 15 | 0.2% |
9 | 4 | 0.1% |
Uppercase Letter
Value | Count | Frequency (%) |
V | 70 | |
T | 70 | |
L | 6 | 3.8% |
D | 2 | 1.3% |
C | 2 | 1.3% |
S | 2 | 1.3% |
Q | 1 | 0.6% |
P | 1 | 0.6% |
R | 1 | 0.6% |
F | 1 | 0.6% |
Lowercase Letter
Value | Count | Frequency (%) |
v | 15 | |
t | 14 | |
k | 3 | 7.9% |
g | 3 | 7.9% |
c | 1 | 2.6% |
r | 1 | 2.6% |
s | 1 | 2.6% |
Other Punctuation
Value | Count | Frequency (%) |
. | 7 | |
: | 2 | 18.2% |
& | 1 | 9.1% |
/ | 1 | 9.1% |
Math Symbol
Value | Count | Frequency (%) |
+ | 4068 | |
~ | 21 | 0.5% |
Space Separator
Value | Count | Frequency (%) |
4878 |
Close Punctuation
Value | Count | Frequency (%) |
) | 238 |
Open Punctuation
Value | Count | Frequency (%) |
( | 238 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 8 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 25396 | |
Common | 16897 | |
Latin | 194 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 1763 | 6.9% |
트 | 1209 | 4.8% |
자 | 1148 | 4.5% |
스 | 1126 | 4.4% |
매 | 1059 | 4.2% |
리 | 989 | 3.9% |
의 | 839 | 3.3% |
대 | 737 | 2.9% |
파 | 732 | 2.9% |
책 | 626 | 2.5% |
Other values (418) | 15168 |
Common
Value | Count | Frequency (%) |
1 | 5193 | |
4878 | ||
+ | 4068 | |
2 | 1210 | 7.2% |
3 | 496 | 2.9% |
) | 238 | 1.4% |
( | 238 | 1.4% |
4 | 232 | 1.4% |
5 | 129 | 0.8% |
6 | 64 | 0.4% |
Other values (11) | 151 | 0.9% |
Latin
Value | Count | Frequency (%) |
V | 70 | |
T | 70 | |
v | 15 | 7.7% |
t | 14 | 7.2% |
L | 6 | 3.1% |
k | 3 | 1.5% |
g | 3 | 1.5% |
D | 2 | 1.0% |
C | 2 | 1.0% |
S | 2 | 1.0% |
Other values (7) | 7 | 3.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 25396 | |
ASCII | 17091 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 5193 | |
4878 | ||
+ | 4068 | |
2 | 1210 | 7.1% |
3 | 496 | 2.9% |
) | 238 | 1.4% |
( | 238 | 1.4% |
4 | 232 | 1.4% |
5 | 129 | 0.8% |
V | 70 | 0.4% |
Other values (28) | 339 | 2.0% |
Hangul
Value | Count | Frequency (%) |
장 | 1763 | 6.9% |
트 | 1209 | 4.8% |
자 | 1148 | 4.5% |
스 | 1126 | 4.4% |
매 | 1059 | 4.2% |
리 | 989 | 3.9% |
의 | 839 | 3.3% |
대 | 737 | 2.9% |
파 | 732 | 2.9% |
책 | 626 | 2.5% |
Other values (418) | 15168 |
폐기물 규격
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.9 KiB |
대형 | |
---|---|
중형 | |
<NA> | |
소형 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.2047244 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 중형 |
---|---|
2nd row | 중형 |
3rd row | 소형 |
4th row | 중형 |
5th row | 중형 |
Common Values
Value | Count | Frequency (%) |
대형 | 2500 | |
중형 | 902 | 21.5% |
<NA> | 429 | 10.2% |
소형 | 360 | 8.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대형 | 2500 | |
중형 | 902 | 21.5% |
na | 429 | 10.2% |
소형 | 360 | 8.6% |
개수
Real number (ℝ)
MISSING
 
Distinct | 33 |
---|---|
Distinct (%) | 0.8% |
Missing | 73 |
Missing (%) | 1.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.0271977 |
Minimum | 1 |
---|---|
Maximum | 67 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 37.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 4 |
95-th percentile | 9 |
Maximum | 67 |
Range | 66 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 3.3936514 |
---|---|
Coefficient of variation (CV) | 1.1210538 |
Kurtosis | 54.56224 |
Mean | 3.0271977 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 5.1928899 |
Sum | 12466 |
Variance | 11.51687 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1618 | |
2 | 879 | |
3 | 532 | 12.7% |
4 | 347 | 8.3% |
5 | 225 | 5.4% |
6 | 141 | 3.4% |
7 | 86 | 2.1% |
8 | 72 | 1.7% |
10 | 53 | 1.3% |
9 | 43 | 1.0% |
Other values (23) | 122 | 2.9% |
(Missing) | 73 | 1.7% |
Value | Count | Frequency (%) |
1 | 1618 | |
2 | 879 | |
3 | 532 | 12.7% |
4 | 347 | 8.3% |
5 | 225 | 5.4% |
6 | 141 | 3.4% |
7 | 86 | 2.1% |
8 | 72 | 1.7% |
9 | 43 | 1.0% |
10 | 53 | 1.3% |
Value | Count | Frequency (%) |
67 | 1 | |
50 | 1 | |
37 | 1 | |
35 | 1 | |
33 | 1 | |
32 | 2 | |
30 | 1 | |
28 | 1 | |
27 | 1 | |
26 | 1 |
행정동
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.9 KiB |
고창읍 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 고창읍 |
---|---|
2nd row | 고창읍 |
3rd row | 고창읍 |
4th row | 고창읍 |
5th row | 고창읍 |
Common Values
Value | Count | Frequency (%) |
고창읍 | 4191 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
고창읍 | 4191 |
관리기관
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.9 KiB |
환경미화팀 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 환경미화팀 |
---|---|
2nd row | 환경미화팀 |
3rd row | 환경미화팀 |
4th row | 환경미화팀 |
5th row | 환경미화팀 |
Common Values
Value | Count | Frequency (%) |
환경미화팀 | 4191 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
환경미화팀 | 4191 |
전화번호
Text
Distinct | 1354 |
---|---|
Distinct (%) | 32.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 32.9 KiB |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 12 |
Min length | 12 |
Characters and Unicode
Total characters | 50292 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 1353 ? |
---|---|
Unique (%) | 32.3% |
Sample
1st row | 063-560-8109 |
---|---|
2nd row | 063-560-8109 |
3rd row | 063-560-8109 |
4th row | 063-560-8109 |
5th row | 063-560-8109 |
Value | Count | Frequency (%) |
063-560-8109 | 2838 | |
063-560-9014 | 1 | < 0.1% |
063-560-9022 | 1 | < 0.1% |
063-560-9021 | 1 | < 0.1% |
063-560-9020 | 1 | < 0.1% |
063-560-9019 | 1 | < 0.1% |
063-560-9018 | 1 | < 0.1% |
063-560-9017 | 1 | < 0.1% |
063-560-9015 | 1 | < 0.1% |
063-560-9047 | 1 | < 0.1% |
Other values (1344) | 1344 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 11584 | |
6 | 8757 | |
- | 8382 | |
3 | 4667 | |
5 | 4561 | 9.1% |
8 | 4084 | 8.1% |
9 | 3671 | 7.3% |
1 | 3303 | 6.6% |
2 | 476 | 0.9% |
4 | 445 | 0.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 41910 | |
Dash Punctuation | 8382 | 16.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 11584 | |
6 | 8757 | |
3 | 4667 | |
5 | 4561 | 10.9% |
8 | 4084 | 9.7% |
9 | 3671 | 8.8% |
1 | 3303 | 7.9% |
2 | 476 | 1.1% |
4 | 445 | 1.1% |
7 | 362 | 0.9% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 8382 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 50292 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 11584 | |
6 | 8757 | |
- | 8382 | |
3 | 4667 | |
5 | 4561 | 9.1% |
8 | 4084 | 8.1% |
9 | 3671 | 7.3% |
1 | 3303 | 6.6% |
2 | 476 | 0.9% |
4 | 445 | 0.9% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 50292 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 11584 | |
6 | 8757 | |
- | 8382 | |
3 | 4667 | |
5 | 4561 | 9.1% |
8 | 4084 | 8.1% |
9 | 3671 | 7.3% |
1 | 3303 | 6.6% |
2 | 476 | 0.9% |
4 | 445 | 0.9% |
폐기물 구분 | 폐기물 규격 | 개수 | |
---|---|---|---|
폐기물 구분 | 1.000 | 0.211 | 0.000 |
폐기물 규격 | 0.211 | 1.000 | 0.139 |
개수 | 0.000 | 0.139 | 1.000 |
폐기물 구분 | 폐기물 규격 | |
---|---|---|
폐기물 구분 | 1.000 | 0.201 |
폐기물 규격 | 0.201 | 1.000 |
개수 | 폐기물 구분 | 폐기물 규격 | |
---|---|---|---|
개수 | 1.000 | 0.000 | 0.088 |
폐기물 구분 | 0.000 | 1.000 | 0.201 |
폐기물 규격 | 0.088 | 0.201 | 1.000 |
수거일자 | 폐기물 구분 | 폐기물 명 | 폐기물 규격 | 개수 | 행정동 | 관리기관 | 전화번호 | |
---|---|---|---|---|---|---|---|---|
0 | 2021-01-22 | 기타 | 의자2+ 상3+ 옷걸이+ 돗자리 등 | 중형 | 8 | 고창읍 | 환경미화팀 | 063-560-8109 |
1 | 2021-01-22 | 가구류 | 싱글침대1+ CD장1+ 책장2+ 책상1+ 쇼파베드1 | 중형 | 6 | 고창읍 | 환경미화팀 | 063-560-8109 |
2 | 2021-01-22 | 기타 | 전기장판1 | 소형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 |
3 | 2021-01-25 | 가구 | 책상1+ 쇼파1+ 침대 프레임1 | 중형 | 3 | 고창읍 | 환경미화팀 | 063-560-8109 |
4 | 2021-01-25 | 기타 | 침대매트리스2 | 중형 | 2 | 고창읍 | 환경미화팀 | 063-560-8109 |
5 | 2021-01-25 | 기타 | 매트리스1 | 소형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 |
6 | 2021-01-25 | 가구류 | 책상1 | 소형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 |
7 | 2021-01-25 | 가구류 | 선풍기1+ 식탁테이블1+ 의자2+ 선반1 등 | 중형 | 5 | 고창읍 | 환경미화팀 | 063-560-8109 |
8 | 2021-01-25 | 가구류 | 책장2+ 책상1 | 중형 | 3 | 고창읍 | 환경미화팀 | 063-560-8109 |
9 | 2021-01-25 | 가구류 | 쇼파1 | 중형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 |
수거일자 | 폐기물 구분 | 폐기물 명 | 폐기물 규격 | 개수 | 행정동 | 관리기관 | 전화번호 | |
---|---|---|---|---|---|---|---|---|
4181 | 2023-08-21 | 가구류 | 침대(분해)1 | 대형 | 1 | 고창읍 | 환경미화팀 | 063-560-9461 |
4182 | 2023-08-21 | 기타 | 음식물쓰레기통(60L)1 | 대형 | 1 | 고창읍 | 환경미화팀 | 063-560-9462 |
4183 | 2023-08-21 | 기타 | 거울틀 | 소형 | 1 | 고창읍 | 환경미화팀 | 063-560-9463 |
4184 | 2023-08-21 | 가구류 | 매트1+ 쇼파1+ 매트리스1 | 대형 | 3 | 고창읍 | 환경미화팀 | 063-560-9464 |
4185 | 2023-08-21 | 가구류 | 가구류(책상 등) | 대형 | 1 | 고창읍 | 환경미화팀 | 063-560-9465 |
4186 | 2023-08-21 | 기타 | 대자리2+ 밥상1 | 대형 | 3 | 고창읍 | 환경미화팀 | 063-560-9466 |
4187 | 2023-08-21 | 가구류 | 쇼파1 | 대형 | 1 | 고창읍 | 환경미화팀 | 063-560-9467 |
4188 | 2023-08-21 | 가구류 | 쇼파1+ 매트리스1+ 의자1 | 대형 | 3 | 고창읍 | 환경미화팀 | 063-560-9468 |
4189 | 2023-08-21 | 가구류 | 쇼파1+ 매트1 | 대형 | 2 | 고창읍 | 환경미화팀 | 063-560-9469 |
4190 | 2023-08-21 | 가구류 | 나무침대1+ 판넬 다수 | 대형 | 2 | 고창읍 | 환경미화팀 | 063-560-9470 |
Most frequently occurring
수거일자 | 폐기물 구분 | 폐기물 명 | 폐기물 규격 | 개수 | 행정동 | 관리기관 | 전화번호 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
12 | 2021-06-21 | 가구류 | 쇼파1 | 중형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 | 4 |
53 | 2022-11-21 | 가구류 | 소파1 | 대형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 | 3 |
0 | 2021-02-22 | 가구류 | 쇼파1 | 대형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 | 2 |
1 | 2021-03-22 | 가구류 | 침대세트(프레임+ 매트리스)2 | 중형 | 4 | 고창읍 | 환경미화팀 | 063-560-8109 | 2 |
2 | 2021-03-24 | 기타 | 매트리스2 | 중형 | 2 | 고창읍 | 환경미화팀 | 063-560-8109 | 2 |
3 | 2021-03-29 | 가구류 | 쇼파1 | 대형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 | 2 |
4 | 2021-03-30 | 기타 | 매트리스1 | 중형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 | 2 |
5 | 2021-04-02 | 기타 | 씽크대1 | <NA> | 1 | 고창읍 | 환경미화팀 | 063-560-8109 | 2 |
6 | 2021-04-15 | 가구류 | 쇼파1 | 중형 | 1 | 고창읍 | 환경미화팀 | 063-560-8109 | 2 |
7 | 2021-05-06 | 기타 | 변기1 | <NA> | 1 | 고창읍 | 환경미화팀 | 063-560-8109 | 2 |