Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 2729 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 16 |
Duplicate rows (%) | 0.6% |
Total size in memory | 133.4 KiB |
Average record size in memory | 50.0 B |
Variable types
DateTime | 2 |
---|---|
Categorical | 1 |
Text | 1 |
Numeric | 2 |
Dataset
Description | 포천시 대형폐기물시스템에서 제공하는 대형폐기물 수거일자, 접수일자, 결제 방법, 폐기물 종류, 수량, 금액 데이터 입니다. |
---|---|
Author | 경기도 포천시 |
URL | https://www.data.go.kr/data/15061837/fileData.do |
Dataset has 16 (0.6%) duplicate rows | Duplicates |
수량 is highly overall correlated with 금액 | High correlation |
금액 is highly overall correlated with 수량 | High correlation |
Reproduction
Analysis started | 2023-12-12 18:11:28.814769 |
---|---|
Analysis finished | 2023-12-12 18:11:29.742566 |
Duration | 0.93 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
접수일자
Date
Distinct | 1272 |
---|---|
Distinct (%) | 46.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 21.4 KiB |
Minimum | 2014-06-23 00:00:00 |
---|---|
Maximum | 2021-09-24 00:00:00 |
수거일자
Date
Distinct | 622 |
---|---|
Distinct (%) | 22.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 21.4 KiB |
Minimum | 2014-12-22 00:00:00 |
---|---|
Maximum | 2021-09-30 00:00:00 |
결재방법
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 21.4 KiB |
카드 | |
---|---|
이체 | |
현금 | 13 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 현금 |
---|---|
2nd row | 현금 |
3rd row | 현금 |
4th row | 이체 |
5th row | 이체 |
Common Values
Value | Count | Frequency (%) |
카드 | 2107 | |
이체 | 609 | 22.3% |
현금 | 13 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
카드 | 2107 | |
이체 | 609 | 22.3% |
현금 | 13 | 0.5% |
폐기물종류
Text
Distinct | 351 |
---|---|
Distinct (%) | 12.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 21.4 KiB |
Value | Count | Frequency (%) |
외 | 1214 | |
1종 | 502 | 9.6% |
매트리스 | 342 | 6.6% |
응접세트 | 301 | 5.8% |
의자 | 285 | 5.5% |
2종 | 250 | 4.8% |
서랍장 | 235 | 4.5% |
교자상 | 136 | 2.6% |
3종 | 125 | 2.4% |
침대(매트리스포함 | 121 | 2.3% |
Other values (90) | 1695 |
Most occurring characters
Value | Count | Frequency (%) |
2480 | 15.6% | |
종 | 1214 | 7.6% |
외 | 1214 | 7.6% |
트 | 782 | 4.9% |
1 | 579 | 3.6% |
장 | 574 | 3.6% |
리 | 522 | 3.3% |
스 | 496 | 3.1% |
자 | 479 | 3.0% |
매 | 463 | 2.9% |
Other values (149) | 7067 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 11630 | |
Space Separator | 2480 | 15.6% |
Decimal Number | 1283 | 8.1% |
Open Punctuation | 194 | 1.2% |
Close Punctuation | 194 | 1.2% |
Other Punctuation | 45 | 0.3% |
Uppercase Letter | 44 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
종 | 1214 | 10.4% |
외 | 1214 | 10.4% |
트 | 782 | 6.7% |
장 | 574 | 4.9% |
리 | 522 | 4.5% |
스 | 496 | 4.3% |
자 | 479 | 4.1% |
매 | 463 | 4.0% |
세 | 316 | 2.7% |
접 | 301 | 2.6% |
Other values (131) | 5269 |
Decimal Number
Value | Count | Frequency (%) |
1 | 579 | |
2 | 263 | |
3 | 129 | 10.1% |
4 | 82 | 6.4% |
5 | 73 | 5.7% |
6 | 54 | 4.2% |
7 | 37 | 2.9% |
8 | 25 | 1.9% |
9 | 22 | 1.7% |
0 | 19 | 1.5% |
Other Punctuation
Value | Count | Frequency (%) |
, | 24 | |
/ | 11 | |
· | 10 |
Uppercase Letter
Value | Count | Frequency (%) |
V | 22 | |
T | 22 |
Space Separator
Value | Count | Frequency (%) |
2480 |
Open Punctuation
Value | Count | Frequency (%) |
( | 194 |
Close Punctuation
Value | Count | Frequency (%) |
) | 194 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 11630 | |
Common | 4196 | 26.4% |
Latin | 44 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
종 | 1214 | 10.4% |
외 | 1214 | 10.4% |
트 | 782 | 6.7% |
장 | 574 | 4.9% |
리 | 522 | 4.5% |
스 | 496 | 4.3% |
자 | 479 | 4.1% |
매 | 463 | 4.0% |
세 | 316 | 2.7% |
접 | 301 | 2.6% |
Other values (131) | 5269 |
Common
Value | Count | Frequency (%) |
2480 | ||
1 | 579 | 13.8% |
2 | 263 | 6.3% |
( | 194 | 4.6% |
) | 194 | 4.6% |
3 | 129 | 3.1% |
4 | 82 | 2.0% |
5 | 73 | 1.7% |
6 | 54 | 1.3% |
7 | 37 | 0.9% |
Other values (6) | 111 | 2.6% |
Latin
Value | Count | Frequency (%) |
V | 22 | |
T | 22 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 11630 | |
ASCII | 4230 | 26.7% |
None | 10 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2480 | ||
1 | 579 | 13.7% |
2 | 263 | 6.2% |
( | 194 | 4.6% |
) | 194 | 4.6% |
3 | 129 | 3.0% |
4 | 82 | 1.9% |
5 | 73 | 1.7% |
6 | 54 | 1.3% |
7 | 37 | 0.9% |
Other values (7) | 145 | 3.4% |
Hangul
Value | Count | Frequency (%) |
종 | 1214 | 10.4% |
외 | 1214 | 10.4% |
트 | 782 | 6.7% |
장 | 574 | 4.9% |
리 | 522 | 4.5% |
스 | 496 | 4.3% |
자 | 479 | 4.1% |
매 | 463 | 4.0% |
세 | 316 | 2.7% |
접 | 301 | 2.6% |
Other values (131) | 5269 |
None
Value | Count | Frequency (%) |
· | 10 |
수량
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 48 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.913155 |
Minimum | 1 |
---|---|
Maximum | 101 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.1 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 4 |
95-th percentile | 15 |
Maximum | 101 |
Range | 100 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 6.3370165 |
---|---|
Coefficient of variation (CV) | 1.6194136 |
Kurtosis | 46.596451 |
Mean | 3.913155 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 5.3621959 |
Sum | 10679 |
Variance | 40.157778 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1245 | |
2 | 488 | 17.9% |
3 | 257 | 9.4% |
4 | 146 | 5.3% |
5 | 107 | 3.9% |
6 | 71 | 2.6% |
7 | 68 | 2.5% |
8 | 51 | 1.9% |
9 | 34 | 1.2% |
11 | 31 | 1.1% |
Other values (38) | 231 | 8.5% |
Value | Count | Frequency (%) |
1 | 1245 | |
2 | 488 | 17.9% |
3 | 257 | 9.4% |
4 | 146 | 5.3% |
5 | 107 | 3.9% |
6 | 71 | 2.6% |
7 | 68 | 2.5% |
8 | 51 | 1.9% |
9 | 34 | 1.2% |
10 | 30 | 1.1% |
Value | Count | Frequency (%) |
101 | 1 | |
80 | 1 | |
71 | 1 | |
69 | 1 | |
53 | 2 | |
48 | 2 | |
47 | 1 | |
44 | 1 | |
42 | 1 | |
41 | 1 |
금액
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 132 |
---|---|
Distinct (%) | 4.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 16147.307 |
Minimum | 2000 |
---|---|
Maximum | 277000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.1 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2000 |
Q1 | 4000 |
median | 7000 |
Q3 | 15000 |
95-th percentile | 63000 |
Maximum | 277000 |
Range | 275000 |
Interquartile range (IQR) | 11000 |
Descriptive statistics
Standard deviation | 25810.916 |
---|---|
Coefficient of variation (CV) | 1.5984657 |
Kurtosis | 26.221466 |
Mean | 16147.307 |
Median Absolute Deviation (MAD) | 4000 |
Skewness | 4.3234057 |
Sum | 44066000 |
Variance | 6.6620337 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2000 | 362 | |
5000 | 359 | |
4000 | 228 | 8.4% |
3000 | 200 | 7.3% |
8000 | 189 | 6.9% |
6000 | 144 | 5.3% |
10000 | 142 | 5.2% |
15000 | 86 | 3.2% |
7000 | 77 | 2.8% |
12000 | 68 | 2.5% |
Other values (122) | 874 |
Value | Count | Frequency (%) |
2000 | 362 | |
3000 | 200 | |
4000 | 228 | |
5000 | 359 | |
6000 | 144 | 5.3% |
7000 | 77 | 2.8% |
8000 | 189 | |
9000 | 64 | 2.3% |
10000 | 142 | 5.2% |
11000 | 39 | 1.4% |
Value | Count | Frequency (%) |
277000 | 2 | |
257000 | 1 | |
241000 | 1 | |
240000 | 1 | |
233000 | 1 | |
212000 | 1 | |
198000 | 1 | |
197000 | 1 | |
196000 | 1 | |
186000 | 1 |
결재방법 | 수량 | 금액 | |
---|---|---|---|
결재방법 | 1.000 | 0.044 | 0.049 |
수량 | 0.044 | 1.000 | 0.838 |
금액 | 0.049 | 0.838 | 1.000 |
수량 | 금액 | 결재방법 | |
---|---|---|---|
수량 | 1.000 | 0.824 | 0.025 |
금액 | 0.824 | 1.000 | 0.033 |
결재방법 | 0.025 | 0.033 | 1.000 |
접수일자 | 수거일자 | 결재방법 | 폐기물종류 | 수량 | 금액 | |
---|---|---|---|---|---|---|
0 | 2014-11-27 | 2014-12-22 | 현금 | 응접세트 | 1 | 12000 |
1 | 2014-11-27 | 2014-12-22 | 현금 | 매트리스 | 1 | 5000 |
2 | 2014-11-27 | 2014-12-22 | 현금 | 매트리스 | 1 | 5000 |
3 | 2014-12-20 | 2014-12-24 | 이체 | 인형·장난감류 외 1종 | 4 | 8000 |
4 | 2014-12-20 | 2014-12-24 | 이체 | 쌀통 | 1 | 3000 |
5 | 2014-12-19 | 2014-12-24 | 현금 | 매트리스 | 1 | 5000 |
6 | 2014-12-18 | 2014-12-24 | 이체 | TV 다이 외 3종 | 5 | 11000 |
7 | 2014-12-20 | 2014-12-31 | 현금 | 서랍장 외 17종 | 32 | 105000 |
8 | 2014-12-20 | 2014-12-31 | 현금 | 서랍장 외 15종 | 29 | 98000 |
9 | 2015-01-06 | 2015-01-09 | 이체 | 장식장 외 7종 | 8 | 40000 |
접수일자 | 수거일자 | 결재방법 | 폐기물종류 | 수량 | 금액 | |
---|---|---|---|---|---|---|
2719 | 2021-09-18 | 2021-09-29 | 이체 | 응접세트 외 1종 | 3 | 15000 |
2720 | 2021-09-24 | 2021-09-30 | 카드 | 식탁 | 7 | 28000 |
2721 | 2021-09-12 | 2021-09-30 | 이체 | 의자 외 4종 | 11 | 37000 |
2722 | 2021-09-17 | 2021-09-30 | 카드 | 의자 외 4종 | 11 | 33000 |
2723 | 2021-09-16 | 2021-09-30 | 카드 | 청소기 | 1 | 2000 |
2724 | 2021-09-13 | 2021-09-30 | 카드 | 컴퓨터 외 1종 | 3 | 7000 |
2725 | 2021-09-12 | 2021-09-30 | 이체 | 의자 외 4종 | 11 | 37000 |
2726 | 2021-09-01 | 2021-09-30 | 카드 | 응접세트 | 1 | 3000 |
2727 | 2021-09-09 | 2021-09-30 | 카드 | 매트리스 | 1 | 5000 |
2728 | 2021-09-19 | 2021-09-30 | 카드 | 장식장 외 1종 | 3 | 13000 |
Most frequently occurring
접수일자 | 수거일자 | 결재방법 | 폐기물종류 | 수량 | 금액 | # duplicates | |
---|---|---|---|---|---|---|---|
11 | 2021-04-26 | 2021-05-07 | 카드 | 매트리스 | 1 | 8000 | 9 |
5 | 2020-07-13 | 2020-07-21 | 카드 | 서랍장 | 1 | 3000 | 6 |
10 | 2021-04-26 | 2021-05-07 | 카드 | 매트리스 | 1 | 5000 | 6 |
8 | 2021-01-06 | 2021-02-17 | 이체 | 의자 | 1 | 2000 | 3 |
0 | 2014-11-27 | 2014-12-22 | 현금 | 매트리스 | 1 | 5000 | 2 |
1 | 2017-03-27 | 2017-04-10 | 카드 | 응접세트 | 1 | 3000 | 2 |
2 | 2017-11-07 | 2017-11-15 | 카드 | 컴퓨터 외 4종 | 5 | 13000 | 2 |
3 | 2018-12-04 | 2018-12-05 | 카드 | 문갑 | 1 | 4000 | 2 |
4 | 2020-06-23 | 2020-08-05 | 카드 | 의자 | 1 | 2000 | 2 |
6 | 2020-07-16 | 2020-09-04 | 카드 | 변기 | 1 | 5000 | 2 |