Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1388 |
Duplicate rows (%) | 13.9% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
Categorical | 3 |
---|---|
DateTime | 1 |
Text | 2 |
Numeric | 1 |
Dataset
Description | 경기도 안산시 대형페기물인터넷배출시스템 배출신고 현황입니다. 결제구분,접수일자,품목,규격,단가,수량,데이터기준일자 등의 목록을 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15042356/fileData.do |
수량 has constant value "" | Constant |
데이터기준일자 has constant value "" | Constant |
Dataset has 1388 (13.9%) duplicate rows | Duplicates |
단가 has 783 (7.8%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-13 00:39:17.141130 |
---|---|
Analysis finished | 2023-12-13 00:39:17.723680 |
Duration | 0.58 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
결제구분
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
결제 | |
---|---|
미결제 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.2329 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 결제 |
---|---|
2nd row | 결제 |
3rd row | 결제 |
4th row | 결제 |
5th row | 미결제 |
Common Values
Value | Count | Frequency (%) |
결제 | 7671 | |
미결제 | 2329 | 23.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
결제 | 7671 | |
미결제 | 2329 | 23.3% |
접수일자
Date
Distinct | 432 |
---|---|
Distinct (%) | 4.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2022-01-01 00:00:00 |
---|---|
Maximum | 2023-03-08 00:00:00 |
품목
Text
Distinct | 148 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
의자 | 1478 | 14.7% |
서랍장 | 641 | 6.4% |
소파 | 614 | 6.1% |
매트리스 | 459 | 4.6% |
책상 | 397 | 3.9% |
나무묶음 | 345 | 3.4% |
소화기 | 331 | 3.3% |
장롱 | 303 | 3.0% |
책장 | 255 | 2.5% |
식탁 | 254 | 2.5% |
Other values (142) | 4984 |
Most occurring characters
Value | Count | Frequency (%) |
장 | 2151 | 6.7% |
자 | 1722 | 5.4% |
의 | 1490 | 4.6% |
기 | 1215 | 3.8% |
소 | 1086 | 3.4% |
파 | 900 | 2.8% |
트 | 888 | 2.8% |
책 | 788 | 2.5% |
대 | 751 | 2.3% |
리 | 749 | 2.3% |
Other values (192) | 20352 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31036 | |
Other Punctuation | 621 | 1.9% |
Uppercase Letter | 374 | 1.2% |
Space Separator | 61 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 2151 | 6.9% |
자 | 1722 | 5.5% |
의 | 1490 | 4.8% |
기 | 1215 | 3.9% |
소 | 1086 | 3.5% |
파 | 900 | 2.9% |
트 | 888 | 2.9% |
책 | 788 | 2.5% |
대 | 751 | 2.4% |
리 | 749 | 2.4% |
Other values (186) | 19296 |
Uppercase Letter
Value | Count | Frequency (%) |
V | 185 | |
T | 181 | |
D | 8 | 2.1% |
Other Punctuation
Value | Count | Frequency (%) |
· | 348 | |
, | 273 |
Space Separator
Value | Count | Frequency (%) |
61 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31036 | |
Common | 682 | 2.1% |
Latin | 374 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 2151 | 6.9% |
자 | 1722 | 5.5% |
의 | 1490 | 4.8% |
기 | 1215 | 3.9% |
소 | 1086 | 3.5% |
파 | 900 | 2.9% |
트 | 888 | 2.9% |
책 | 788 | 2.5% |
대 | 751 | 2.4% |
리 | 749 | 2.4% |
Other values (186) | 19296 |
Common
Value | Count | Frequency (%) |
· | 348 | |
, | 273 | |
61 | 8.9% |
Latin
Value | Count | Frequency (%) |
V | 185 | |
T | 181 | |
D | 8 | 2.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31036 | |
ASCII | 708 | 2.2% |
None | 348 | 1.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
장 | 2151 | 6.9% |
자 | 1722 | 5.5% |
의 | 1490 | 4.8% |
기 | 1215 | 3.9% |
소 | 1086 | 3.5% |
파 | 900 | 2.9% |
트 | 888 | 2.9% |
책 | 788 | 2.5% |
대 | 751 | 2.4% |
리 | 749 | 2.4% |
Other values (186) | 19296 |
None
Value | Count | Frequency (%) |
· | 348 |
ASCII
Value | Count | Frequency (%) |
, | 273 | |
V | 185 | |
T | 181 | |
61 | 8.6% | |
D | 8 | 1.1% |
규격
Text
Distinct | 115 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
1인용 | 1619 | 13.1% |
이상 | 1189 | 9.6% |
미만 | 1025 | 8.3% |
이하 | 872 | 7.0% |
높이 | 681 | 5.5% |
1m | 628 | 5.1% |
4단 | 595 | 4.8% |
120cm | 528 | 4.3% |
일반용 | 390 | 3.1% |
모든규격 | 362 | 2.9% |
Other values (88) | 4498 |
Most occurring characters
Value | Count | Frequency (%) |
5811 | 12.5% | |
1 | 4726 | 10.2% |
이 | 3239 | 7.0% |
용 | 2997 | 6.4% |
인 | 2700 | 5.8% |
0 | 2274 | 4.9% |
m | 2141 | 4.6% |
상 | 1460 | 3.1% |
2 | 1397 | 3.0% |
만 | 1212 | 2.6% |
Other values (101) | 18563 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 23230 | |
Decimal Number | 11350 | |
Space Separator | 5811 | 12.5% |
Lowercase Letter | 5262 | 11.3% |
Other Punctuation | 556 | 1.2% |
Close Punctuation | 221 | 0.5% |
Uppercase Letter | 86 | 0.2% |
Other Symbol | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 3239 | |
용 | 2997 | |
인 | 2700 | 11.6% |
상 | 1460 | 6.3% |
만 | 1212 | 5.2% |
미 | 1212 | 5.2% |
단 | 896 | 3.9% |
하 | 872 | 3.8% |
높 | 683 | 2.9% |
모 | 495 | 2.1% |
Other values (80) | 7464 |
Decimal Number
Value | Count | Frequency (%) |
1 | 4726 | |
0 | 2274 | |
2 | 1397 | 12.3% |
3 | 988 | 8.7% |
4 | 759 | 6.7% |
5 | 584 | 5.1% |
8 | 248 | 2.2% |
9 | 199 | 1.8% |
6 | 157 | 1.4% |
7 | 18 | 0.2% |
Lowercase Letter
Value | Count | Frequency (%) |
m | 2141 | |
c | 1118 | |
k | 704 | 13.4% |
g | 704 | 13.4% |
x | 595 | 11.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 331 | |
, | 225 |
Space Separator
Value | Count | Frequency (%) |
5811 |
Close Punctuation
Value | Count | Frequency (%) |
) | 221 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 86 |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 23230 | |
Common | 17942 | |
Latin | 5348 | 11.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 3239 | |
용 | 2997 | |
인 | 2700 | 11.6% |
상 | 1460 | 6.3% |
만 | 1212 | 5.2% |
미 | 1212 | 5.2% |
단 | 896 | 3.9% |
하 | 872 | 3.8% |
높 | 683 | 2.9% |
모 | 495 | 2.1% |
Other values (80) | 7464 |
Common
Value | Count | Frequency (%) |
5811 | ||
1 | 4726 | |
0 | 2274 | 12.7% |
2 | 1397 | 7.8% |
3 | 988 | 5.5% |
4 | 759 | 4.2% |
5 | 584 | 3.3% |
. | 331 | 1.8% |
8 | 248 | 1.4% |
, | 225 | 1.3% |
Other values (5) | 599 | 3.3% |
Latin
Value | Count | Frequency (%) |
m | 2141 | |
c | 1118 | |
k | 704 | 13.2% |
g | 704 | 13.2% |
x | 595 | 11.1% |
L | 86 | 1.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 23286 | |
Hangul | 23230 | |
CJK Compat | 4 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
5811 | ||
1 | 4726 | |
0 | 2274 | 9.8% |
m | 2141 | 9.2% |
2 | 1397 | 6.0% |
c | 1118 | 4.8% |
3 | 988 | 4.2% |
4 | 759 | 3.3% |
k | 704 | 3.0% |
g | 704 | 3.0% |
Other values (10) | 2664 |
Hangul
Value | Count | Frequency (%) |
이 | 3239 | |
용 | 2997 | |
인 | 2700 | 11.6% |
상 | 1460 | 6.3% |
만 | 1212 | 5.2% |
미 | 1212 | 5.2% |
단 | 896 | 3.9% |
하 | 872 | 3.8% |
높 | 683 | 2.9% |
모 | 495 | 2.1% |
Other values (80) | 7464 |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 4 |
단가
Real number (ℝ)
ZEROS
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3695.6 |
Minimum | 0 |
---|---|
Maximum | 13000 |
Zeros | 783 |
Zeros (%) | 7.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 2000 |
median | 2000 |
Q3 | 5000 |
95-th percentile | 11000 |
Maximum | 13000 |
Range | 13000 |
Interquartile range (IQR) | 3000 |
Descriptive statistics
Standard deviation | 2992.1958 |
---|---|
Coefficient of variation (CV) | 0.80966442 |
Kurtosis | 1.3798018 |
Mean | 3695.6 |
Median Absolute Deviation (MAD) | 1000 |
Skewness | 1.3407719 |
Sum | 36956000 |
Variance | 8953236 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2000 | 4194 | |
5000 | 2113 | |
8000 | 981 | 9.8% |
3000 | 835 | 8.3% |
0 | 783 | 7.8% |
1000 | 492 | 4.9% |
11000 | 334 | 3.3% |
13000 | 268 | 2.7% |
Value | Count | Frequency (%) |
0 | 783 | 7.8% |
1000 | 492 | 4.9% |
2000 | 4194 | |
3000 | 835 | 8.3% |
5000 | 2113 | |
8000 | 981 | 9.8% |
11000 | 334 | 3.3% |
13000 | 268 | 2.7% |
Value | Count | Frequency (%) |
13000 | 268 | 2.7% |
11000 | 334 | 3.3% |
8000 | 981 | 9.8% |
5000 | 2113 | |
3000 | 835 | 8.3% |
2000 | 4194 | |
1000 | 492 | 4.9% |
0 | 783 | 7.8% |
수량
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
1 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 10000 |
데이터기준일자
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2023-03-08 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-03-08 |
---|---|
2nd row | 2023-03-08 |
3rd row | 2023-03-08 |
4th row | 2023-03-08 |
5th row | 2023-03-08 |
Common Values
Value | Count | Frequency (%) |
2023-03-08 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-03-08 | 10000 |
결제구분 | 단가 | |
---|---|---|
결제구분 | 1.000 | 0.082 |
단가 | 0.082 | 1.000 |
단가 | 결제구분 | |
---|---|---|
단가 | 1.000 | 0.088 |
결제구분 | 0.088 | 1.000 |
결제구분 | 접수일자 | 품목 | 규격 | 단가 | 수량 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|
9379 | 결제 | 2023-01-08 | 서랍장 | 4단 이하 | 2000 | 1 | 2023-03-08 |
17171 | 결제 | 2022-11-06 | 의자 | 1인용 | 2000 | 1 | 2023-03-08 |
46703 | 결제 | 2022-01-01 | 나무묶음 | 10kg이내 | 1000 | 1 | 2023-03-08 |
7853 | 결제 | 2023-01-20 | 나무묶음 | 10kg이내 | 1000 | 1 | 2023-03-08 |
45045 | 미결제 | 2022-02-10 | 거울 | 110x120cm이상 | 5000 | 1 | 2023-03-08 |
15380 | 결제 | 2022-11-22 | 의자 | 1인용 | 2000 | 1 | 2023-03-08 |
43832 | 결제 | 2022-02-19 | 파렛트 | 5000 | 1 | 2023-03-08 | |
38569 | 결제 | 2022-03-30 | 고무통 | 70x80cm 이하 | 2000 | 1 | 2023-03-08 |
45439 | 미결제 | 2022-02-05 | 매트리스 | 8000 | 1 | 2023-03-08 | |
38473 | 결제 | 2022-03-31 | 책상 | 일반용 | 5000 | 1 | 2023-03-08 |
결제구분 | 접수일자 | 품목 | 규격 | 단가 | 수량 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|
5833 | 미결제 | 2023-02-06 | 욕조 | 유아욕조 | 2000 | 1 | 2023-03-08 |
2270 | 미결제 | 2023-02-24 | 나무묶음 | 10kg이내 | 1000 | 1 | 2023-03-08 |
36086 | 미결제 | 2022-04-19 | 침대 | 1인용세트 | 11000 | 1 | 2023-03-08 |
24594 | 결제 | 2022-09-14 | 소파 | 3인용 | 5000 | 1 | 2023-03-08 |
17523 | 결제 | 2022-11-02 | 거울 | 110x120cm미만 | 2000 | 1 | 2023-03-08 |
7386 | 결제 | 2023-01-26 | 식탁 | 의자별도 | 3000 | 1 | 2023-03-08 |
17041 | 결제 | 2022-11-07 | 침대틀 | 1,2인용 | 8000 | 1 | 2023-03-08 |
32535 | 결제 | 2022-05-16 | 액자 | 높이 1m 미만 | 2000 | 1 | 2023-03-08 |
3979 | 결제 | 2023-02-15 | 컴퓨터 | 모니터 | 0 | 1 | 2023-03-08 |
38345 | 결제 | 2022-04-01 | 냉장고 | 300L 이상 | 8000 | 1 | 2023-03-08 |
Most frequently occurring
결제구분 | 접수일자 | 품목 | 규격 | 단가 | 수량 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|---|
1280 | 미결제 | 2022-12-27 | 소파 | 3인용 | 5000 | 1 | 2023-03-08 | 110 |
1207 | 미결제 | 2022-09-16 | 소화기 | 3.3kg 미만 | 2000 | 1 | 2023-03-08 | 95 |
1208 | 미결제 | 2022-09-16 | 소화기 | 3.3kg 이상 | 3000 | 1 | 2023-03-08 | 61 |
1243 | 미결제 | 2022-11-15 | 샌드위치·전기판넬 | 높이 2m 이하 | 5000 | 1 | 2023-03-08 | 33 |
73 | 결제 | 2022-02-23 | 의자 | 1인용 | 2000 | 1 | 2023-03-08 | 29 |
40 | 결제 | 2022-02-16 | 의자 | 1인용 | 2000 | 1 | 2023-03-08 | 27 |
1058 | 결제 | 2023-02-24 | 의자 | 1인용 | 2000 | 1 | 2023-03-08 | 27 |
555 | 결제 | 2022-09-16 | 소화기 | 3.3kg 미만 | 2000 | 1 | 2023-03-08 | 26 |
586 | 결제 | 2022-09-26 | 나무묶음 | 10kg이내 | 1000 | 1 | 2023-03-08 | 26 |
918 | 결제 | 2023-01-20 | 협탁 | 보조책상 | 2000 | 1 | 2023-03-08 | 25 |