Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 10000 |
Missing cells | 3 |
Missing cells (%) | < 0.1% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 410.2 KiB |
Average record size in memory | 42.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 2 |
Dataset
Description | 조사년월일,측정소이름,측정지역,일일강수량 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-22140/S/1/datasetView.do |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
측정지역 is highly overall correlated with 측정소이름 | High correlation |
측정소이름 is highly overall correlated with 측정지역 | High correlation |
일일강수량 has 7679 (76.8%) zeros | Zeros |
Reproduction
Analysis started | 2024-05-18 06:01:27.732336 |
---|---|
Analysis finished | 2024-05-18 06:01:30.224727 |
Duration | 2.49 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
조사년월일
Real number (ℝ)
Distinct | 3712 |
---|---|
Distinct (%) | 37.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20174066 |
Minimum | 20120102 |
---|---|
Maximum | 20240229 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 20120102 |
---|---|
5-th percentile | 20120706 |
Q1 | 20140712 |
median | 20170216 |
Q3 | 20210217 |
95-th percentile | 20230722 |
Maximum | 20240229 |
Range | 120127 |
Interquartile range (IQR) | 69505.25 |
Descriptive statistics
Standard deviation | 36685.873 |
---|---|
Coefficient of variation (CV) | 0.001818467 |
Kurtosis | -1.3367571 |
Mean | 20174066 |
Median Absolute Deviation (MAD) | 30493 |
Skewness | 0.10390207 |
Sum | 2.0174066 × 1011 |
Variance | 1.3458533 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20121025 | 10 | 0.1% |
20160513 | 9 | 0.1% |
20140613 | 8 | 0.1% |
20141218 | 8 | 0.1% |
20150618 | 8 | 0.1% |
20210210 | 8 | 0.1% |
20130414 | 8 | 0.1% |
20151201 | 8 | 0.1% |
20190612 | 8 | 0.1% |
20240205 | 8 | 0.1% |
Other values (3702) | 9917 |
Value | Count | Frequency (%) |
20120102 | 3 | |
20120103 | 3 | |
20120104 | 2 | < 0.1% |
20120105 | 1 | < 0.1% |
20120107 | 7 | |
20120108 | 3 | |
20120109 | 2 | < 0.1% |
20120110 | 4 | |
20120111 | 2 | < 0.1% |
20120112 | 2 | < 0.1% |
Value | Count | Frequency (%) |
20240229 | 2 | < 0.1% |
20240228 | 1 | < 0.1% |
20240227 | 2 | < 0.1% |
20240226 | 2 | < 0.1% |
20240224 | 3 | |
20240222 | 7 | |
20240221 | 3 | |
20240220 | 2 | < 0.1% |
20240219 | 2 | < 0.1% |
20240218 | 6 |
측정소이름
Categorical
HIGH CORRELATION
 
Distinct | 27 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
성북 | 456 |
---|---|
중구 | 445 |
은평 | 431 |
광진 | 429 |
영등포 | 428 |
Other values (22) |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.1246 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 중랑 |
---|---|
2nd row | 양천 |
3rd row | 관악 |
4th row | 구로 |
5th row | 동작 |
Common Values
Value | Count | Frequency (%) |
성북 | 456 | 4.6% |
중구 | 445 | 4.5% |
은평 | 431 | 4.3% |
광진 | 429 | 4.3% |
영등포 | 428 | 4.3% |
강북 | 427 | 4.3% |
송파 | 425 | 4.2% |
노원 | 419 | 4.2% |
용산 | 417 | 4.2% |
동대문 | 414 | 4.1% |
Other values (17) | 5709 |
Length
Value | Count | Frequency (%) |
성북 | 456 | 4.6% |
중구 | 445 | 4.5% |
강북 | 436 | 4.4% |
은평 | 431 | 4.3% |
광진 | 429 | 4.3% |
영등포 | 428 | 4.3% |
송파 | 425 | 4.2% |
노원 | 419 | 4.2% |
용산 | 417 | 4.2% |
동대문 | 414 | 4.1% |
Other values (16) | 5700 |
측정지역
Categorical
HIGH CORRELATION
 
Distinct | 27 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
성북구 | 456 |
---|---|
강북구 | 436 |
은평구 | 431 |
광진구 | 429 |
영등포구 | 428 |
Other values (22) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.1049 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 중랑구 |
---|---|
2nd row | 양천구 |
3rd row | 관악구 |
4th row | 구로구 |
5th row | 동작구 |
Common Values
Value | Count | Frequency (%) |
성북구 | 456 | 4.6% |
강북구 | 436 | 4.4% |
은평구 | 431 | 4.3% |
광진구 | 429 | 4.3% |
영등포구 | 428 | 4.3% |
송파구 | 425 | 4.2% |
노원구 | 419 | 4.2% |
용산구 | 417 | 4.2% |
구로구 | 414 | 4.1% |
동대문구 | 414 | 4.1% |
Other values (17) | 5731 |
Length
Value | Count | Frequency (%) |
성북구 | 456 | 4.6% |
강북구 | 436 | 4.4% |
은평구 | 431 | 4.3% |
광진구 | 429 | 4.3% |
영등포구 | 428 | 4.3% |
송파구 | 425 | 4.2% |
노원구 | 419 | 4.2% |
용산구 | 417 | 4.2% |
구로구 | 414 | 4.1% |
동대문구 | 414 | 4.1% |
Other values (17) | 5731 |
일일강수량
Real number (ℝ)
ZEROS
 
Distinct | 196 |
---|---|
Distinct (%) | 2.0% |
Missing | 3 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.3918175 |
Minimum | 0 |
---|---|
Maximum | 354.5 |
Zeros | 7679 |
Zeros (%) | 76.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 20 |
Maximum | 354.5 |
Range | 354.5 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 13.557769 |
---|---|
Coefficient of variation (CV) | 3.9971988 |
Kurtosis | 120.46054 |
Mean | 3.3918175 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 8.6217209 |
Sum | 33908 |
Variance | 183.8131 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 7679 | |
0.5 | 296 | 3.0% |
1.0 | 180 | 1.8% |
1.5 | 152 | 1.5% |
2.0 | 120 | 1.2% |
2.5 | 92 | 0.9% |
3.0 | 87 | 0.9% |
3.5 | 74 | 0.7% |
4.5 | 64 | 0.6% |
4.0 | 60 | 0.6% |
Other values (186) | 1193 | 11.9% |
Value | Count | Frequency (%) |
0.0 | 7679 | |
0.5 | 296 | 3.0% |
1.0 | 180 | 1.8% |
1.5 | 152 | 1.5% |
2.0 | 120 | 1.2% |
2.5 | 92 | 0.9% |
3.0 | 87 | 0.9% |
3.5 | 74 | 0.7% |
4.0 | 60 | 0.6% |
4.5 | 64 | 0.6% |
Value | Count | Frequency (%) |
354.5 | 1 | |
305.5 | 1 | |
208.5 | 1 | |
200.5 | 1 | |
198.0 | 1 | |
190.5 | 1 | |
182.5 | 1 | |
166.5 | 1 | |
164.5 | 1 | |
163.0 | 1 |
조사년월일 | 측정소이름 | 측정지역 | 일일강수량 | |
---|---|---|---|---|
조사년월일 | 1.000 | 0.247 | 0.289 | 0.068 |
측정소이름 | 0.247 | 1.000 | 1.000 | 0.000 |
측정지역 | 0.289 | 1.000 | 1.000 | 0.027 |
일일강수량 | 0.068 | 0.000 | 0.027 | 1.000 |
측정지역 | 측정소이름 | |
---|---|---|
측정지역 | 1.000 | 0.981 |
측정소이름 | 0.981 | 1.000 |
조사년월일 | 일일강수량 | 측정소이름 | 측정지역 | |
---|---|---|---|---|
조사년월일 | 1.000 | 0.045 | 0.091 | 0.108 |
일일강수량 | 0.045 | 1.000 | 0.000 | 0.011 |
측정소이름 | 0.091 | 0.000 | 1.000 | 0.981 |
측정지역 | 0.108 | 0.011 | 0.981 | 1.000 |
조사년월일 | 측정소이름 | 측정지역 | 일일강수량 | |
---|---|---|---|---|
49752 | 20161102 | 중랑 | 중랑구 | 0.0 |
51733 | 20160814 | 양천 | 양천구 | 0.0 |
61138 | 20150731 | 관악 | 관악구 | 0.0 |
70648 | 20140624 | 구로 | 구로구 | 0.0 |
89195 | 20120627 | 동작 | 동작구 | 0.0 |
80402 | 20130604 | 강남 | 강남구 | 0.0 |
20332 | 20210722 | 강서 | 강서구 | 0.0 |
24388 | 20210113 | 강서 | 강서구 | 0.0 |
19856 | 20210814 | 송파 | 송파구 | 0.0 |
48827 | 20161212 | 서대문 | 서대문구 | 0.0 |
조사년월일 | 측정소이름 | 측정지역 | 일일강수량 | |
---|---|---|---|---|
22532 | 20210408 | 관악 | 관악구 | 0.0 |
64183 | 20150313 | 동대문 | 동대문구 | 0.0 |
34464 | 20191004 | 영등포 | 영등포구 | 0.0 |
83315 | 20130212 | 중랑 | 중랑구 | 0.0 |
45570 | 20180225 | 강북 | 강북구 | 0.0 |
46393 | 20180116 | 강남 | 강남구 | 0.0 |
2942 | 20231014 | 중구 | 중구 | 3.0 |
43017 | 20180701 | 은평 | 은평구 | 69.0 |
43439 | 20180611 | 성북 | 성북구 | 0.0 |
11487 | 20220908 | 관악 | 관악구 | 0.0 |
Most frequently occurring
조사년월일 | 측정소이름 | 측정지역 | 일일강수량 | # duplicates | |
---|---|---|---|---|---|
0 | 20190614 | 송파 | 송파구 | 0.0 | 2 |