Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 722.7 KiB |
Average record size in memory | 74.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 6 |
Dataset
Description | 일자,사업소 구분 코드,사업소 구분명,사업소 코드,사업소 명,유량 구분 코드,유량 구분 명,측정값(톤) |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-20565/S/1/datasetView.do |
유량 구분 명 is highly overall correlated with 사업소 구분 코드 and 4 other fields | High correlation |
사업소 구분 코드 is highly overall correlated with 사업소 구분명 and 4 other fields | High correlation |
유량 구분 코드 is highly overall correlated with 사업소 구분 코드 and 4 other fields | High correlation |
사업소 코드 is highly overall correlated with 사업소 구분 코드 and 4 other fields | High correlation |
사업소 구분명 is highly overall correlated with 사업소 구분 코드 and 4 other fields | High correlation |
사업소 명 is highly overall correlated with 사업소 구분 코드 and 4 other fields | High correlation |
측정값(톤) is highly skewed (γ1 = -89.53798489) | Skewed |
Reproduction
Analysis started | 2024-05-10 22:19:04.892323 |
---|---|
Analysis finished | 2024-05-10 22:19:08.255163 |
Duration | 3.36 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
일자
Real number (ℝ)
Distinct | 1562 |
---|---|
Distinct (%) | 15.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20217269 |
Minimum | 20200101 |
---|---|
Maximum | 20240509 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 20200101 |
---|---|
5-th percentile | 20200317 |
Q1 | 20210112 |
median | 20220210 |
Q3 | 20230322 |
95-th percentile | 20240216 |
Maximum | 20240509 |
Range | 40408 |
Interquartile range (IQR) | 20210 |
Descriptive statistics
Standard deviation | 12680.83 |
---|---|
Coefficient of variation (CV) | 0.00062722762 |
Kurtosis | -1.1482819 |
Mean | 20217269 |
Median Absolute Deviation (MAD) | 10105 |
Skewness | 0.15482534 |
Sum | 2.0217269 × 1011 |
Variance | 1.6080344 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20210626 | 14 | 0.1% |
20201222 | 13 | 0.1% |
20220226 | 12 | 0.1% |
20221225 | 12 | 0.1% |
20210826 | 12 | 0.1% |
20211118 | 12 | 0.1% |
20201128 | 12 | 0.1% |
20220527 | 12 | 0.1% |
20221002 | 12 | 0.1% |
20210125 | 12 | 0.1% |
Other values (1552) | 9877 |
Value | Count | Frequency (%) |
20200101 | 8 | |
20200102 | 6 | |
20200103 | 7 | |
20200104 | 9 | |
20200105 | 8 | |
20200106 | 9 | |
20200107 | 4 | |
20200108 | 9 | |
20200109 | 6 | |
20200110 | 4 |
Value | Count | Frequency (%) |
20240509 | 7 | |
20240508 | 8 | |
20240507 | 5 | |
20240506 | 5 | |
20240505 | 5 | |
20240504 | 4 | |
20240503 | 7 | |
20240502 | 7 | |
20240501 | 8 | |
20240430 | 6 |
사업소 구분 코드
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
P | |
---|---|
W |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | W |
---|---|
2nd row | P |
3rd row | P |
4th row | W |
5th row | P |
Common Values
Value | Count | Frequency (%) |
P | 5440 | |
W | 4560 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
p | 5440 | |
w | 4560 |
사업소 구분명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
정수센터 | |
---|---|
수도사업소 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.456 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 수도사업소 |
---|---|
2nd row | 정수센터 |
3rd row | 정수센터 |
4th row | 수도사업소 |
5th row | 정수센터 |
Common Values
Value | Count | Frequency (%) |
정수센터 | 5440 | |
수도사업소 | 4560 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정수센터 | 5440 | |
수도사업소 | 4560 |
사업소 코드
Categorical
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
PR0055 | |
---|---|
PR0370 | |
PR0710 | |
PR0407 | |
PR0183 | |
Other values (11) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | WW0003 |
---|---|
2nd row | PR0407 |
3rd row | PR0065 |
4th row | WW0011 |
5th row | PR0055 |
Common Values
Value | Count | Frequency (%) |
PR0055 | 926 | 9.3% |
PR0370 | 911 | 9.1% |
PR0710 | 910 | 9.1% |
PR0407 | 906 | 9.1% |
PR0183 | 904 | 9.0% |
PR0065 | 883 | 8.8% |
WW0010 | 476 | 4.8% |
RW0003 | 471 | 4.7% |
WW0011 | 470 | 4.7% |
WW0007 | 464 | 4.6% |
Other values (6) | 2679 |
Length
Value | Count | Frequency (%) |
pr0055 | 926 | 9.3% |
pr0370 | 911 | 9.1% |
pr0710 | 910 | 9.1% |
pr0407 | 906 | 9.1% |
pr0183 | 904 | 9.0% |
pr0065 | 883 | 8.8% |
ww0010 | 476 | 4.8% |
rw0003 | 471 | 4.7% |
ww0011 | 470 | 4.7% |
ww0007 | 464 | 4.6% |
Other values (6) | 2679 |
사업소 명
Categorical
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
광암 | |
---|---|
암사 | |
강북 | |
영등포 | |
뚝도 | |
Other values (11) |
Length
Max length | 7 |
---|---|
Median length | 2 |
Mean length | 2.5431 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 동부 |
---|---|
2nd row | 영등포 |
3rd row | 구의 |
4th row | 강동 |
5th row | 광암 |
Common Values
Value | Count | Frequency (%) |
광암 | 926 | 9.3% |
암사 | 911 | 9.1% |
강북 | 910 | 9.1% |
영등포 | 906 | 9.1% |
뚝도 | 904 | 9.0% |
구의 | 883 | 8.8% |
강남 | 476 | 4.8% |
동부(시계외) | 471 | 4.7% |
강동 | 470 | 4.7% |
강서 | 464 | 4.6% |
Other values (6) | 2679 |
Length
Value | Count | Frequency (%) |
광암 | 926 | 9.3% |
암사 | 911 | 9.1% |
강북 | 910 | 9.1% |
영등포 | 906 | 9.1% |
뚝도 | 904 | 9.0% |
구의 | 883 | 8.8% |
강남 | 476 | 4.8% |
동부(시계외 | 471 | 4.7% |
강동 | 470 | 4.7% |
강서 | 464 | 4.6% |
Other values (6) | 2679 |
유량 구분 코드
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
T | |
---|---|
C | |
S |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | T |
---|---|
2nd row | S |
3rd row | S |
4th row | T |
5th row | C |
Common Values
Value | Count | Frequency (%) |
T | 4560 | |
C | 2763 | |
S | 2677 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
t | 4560 | |
c | 2763 | |
s | 2677 |
유량 구분 명
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
공급량 | |
---|---|
취수 | |
송수 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.456 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공급량 |
---|---|
2nd row | 송수 |
3rd row | 송수 |
4th row | 공급량 |
5th row | 취수 |
Common Values
Value | Count | Frequency (%) |
공급량 | 4560 | |
취수 | 2763 | |
송수 | 2677 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
공급량 | 4560 | |
취수 | 2763 | |
송수 | 2677 |
측정값(톤)
Real number (ℝ)
SKEWED
 
Distinct | 9279 |
---|---|
Distinct (%) | 92.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 85253.904 |
Minimum | -4.2946647 × 109 |
---|---|
Maximum | 1.0719865 × 109 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 15 |
Negative (%) | 0.1% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | -4.2946647 × 109 |
---|---|
5-th percentile | 72972.95 |
Q1 | 306026.75 |
median | 387587.5 |
Q3 | 468544.75 |
95-th percentile | 952225 |
Maximum | 1.0719865 × 109 |
Range | 5.3666512 × 109 |
Interquartile range (IQR) | 162518 |
Descriptive statistics
Standard deviation | 44331493 |
---|---|
Coefficient of variation (CV) | 519.9937 |
Kurtosis | 8845.8853 |
Mean | 85253.904 |
Median Absolute Deviation (MAD) | 81229.5 |
Skewness | -89.537985 |
Sum | 8.5253904 × 108 |
Variance | 1.9652813 × 1015 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
222500 | 11 | 0.1% |
218400 | 8 | 0.1% |
218700 | 7 | 0.1% |
221600 | 7 | 0.1% |
215000 | 7 | 0.1% |
222000 | 6 | 0.1% |
218500 | 6 | 0.1% |
217500 | 6 | 0.1% |
211500 | 6 | 0.1% |
219400 | 6 | 0.1% |
Other values (9269) | 9930 |
Value | Count | Frequency (%) |
-4294664741 | 1 | |
-99628626 | 1 | |
-89806583 | 1 | |
-89615122 | 1 | |
-54032502 | 1 | |
-52837400 | 1 | |
-45677489 | 1 | |
-9644589 | 1 | |
-9518026 | 1 | |
-2860612 | 1 |
Value | Count | Frequency (%) |
1071986500 | 1 | |
103866986 | 1 | |
82532072 | 1 | |
53711716 | 1 | |
27042433 | 1 | |
3482411 | 1 | |
3420049 | 1 | |
1857494 | 1 | |
1157000 | 1 | |
1154377 | 1 |
일자 | 사업소 구분 코드 | 사업소 구분명 | 사업소 코드 | 사업소 명 | 유량 구분 코드 | 유량 구분 명 | 측정값(톤) | |
---|---|---|---|---|---|---|---|---|
일자 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.026 |
사업소 구분 코드 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.014 |
사업소 구분명 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.014 |
사업소 코드 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.848 | 0.848 | 0.016 |
사업소 명 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.848 | 0.848 | 0.016 |
유량 구분 코드 | 0.000 | 1.000 | 1.000 | 0.848 | 0.848 | 1.000 | 1.000 | 0.058 |
유량 구분 명 | 0.000 | 1.000 | 1.000 | 0.848 | 0.848 | 1.000 | 1.000 | 0.058 |
측정값(톤) | 0.026 | 0.014 | 0.014 | 0.016 | 0.016 | 0.058 | 0.058 | 1.000 |
유량 구분 명 | 사업소 구분 코드 | 유량 구분 코드 | 사업소 코드 | 사업소 구분명 | 사업소 명 | |
---|---|---|---|---|---|---|
유량 구분 명 | 1.000 | 1.000 | 1.000 | 0.706 | 1.000 | 0.706 |
사업소 구분 코드 | 1.000 | 1.000 | 1.000 | 0.999 | 1.000 | 0.999 |
유량 구분 코드 | 1.000 | 1.000 | 1.000 | 0.706 | 1.000 | 0.706 |
사업소 코드 | 0.706 | 0.999 | 0.706 | 1.000 | 0.999 | 1.000 |
사업소 구분명 | 1.000 | 1.000 | 1.000 | 0.999 | 1.000 | 0.999 |
사업소 명 | 0.706 | 0.999 | 0.706 | 1.000 | 0.999 | 1.000 |
일자 | 측정값(톤) | 사업소 구분 코드 | 사업소 구분명 | 사업소 코드 | 사업소 명 | 유량 구분 코드 | 유량 구분 명 | |
---|---|---|---|---|---|---|---|---|
일자 | 1.000 | -0.047 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 |
측정값(톤) | -0.047 | 1.000 | 0.024 | 0.024 | 0.015 | 0.015 | 0.016 | 0.016 |
사업소 구분 코드 | 0.000 | 0.024 | 1.000 | 1.000 | 0.999 | 0.999 | 1.000 | 1.000 |
사업소 구분명 | 0.000 | 0.024 | 1.000 | 1.000 | 0.999 | 0.999 | 1.000 | 1.000 |
사업소 코드 | 0.000 | 0.015 | 0.999 | 0.999 | 1.000 | 1.000 | 0.706 | 0.706 |
사업소 명 | 0.000 | 0.015 | 0.999 | 0.999 | 1.000 | 1.000 | 0.706 | 0.706 |
유량 구분 코드 | 0.000 | 0.016 | 1.000 | 1.000 | 0.706 | 0.706 | 1.000 | 1.000 |
유량 구분 명 | 0.000 | 0.016 | 1.000 | 1.000 | 0.706 | 0.706 | 1.000 | 1.000 |
일자 | 사업소 구분 코드 | 사업소 구분명 | 사업소 코드 | 사업소 명 | 유량 구분 코드 | 유량 구분 명 | 측정값(톤) | |
---|---|---|---|---|---|---|---|---|
468 | 20240418 | W | 수도사업소 | WW0003 | 동부 | T | 공급량 | 567048 |
4610 | 20231005 | P | 정수센터 | PR0407 | 영등포 | S | 송수 | 411227 |
2504 | 20240110 | P | 정수센터 | PR0065 | 구의 | S | 송수 | 343852 |
1760 | 20240216 | W | 수도사업소 | WW0011 | 강동 | T | 공급량 | 305925 |
3255 | 20231206 | P | 정수센터 | PR0055 | 광암 | C | 취수 | 215800 |
6491 | 20230708 | W | 수도사업소 | WW0010 | 강남 | T | 공급량 | 345171 |
11914 | 20221030 | P | 정수센터 | PR0407 | 영등포 | C | 취수 | 397370 |
24188 | 20210407 | P | 정수센터 | PR0710 | 강북 | C | 취수 | 669656 |
23860 | 20210422 | P | 정수센터 | PR0407 | 영등포 | C | 취수 | 442530 |
24066 | 20210413 | P | 정수센터 | PR0055 | 광암 | C | 취수 | 218100 |
일자 | 사업소 구분 코드 | 사업소 구분명 | 사업소 코드 | 사업소 명 | 유량 구분 코드 | 유량 구분 명 | 측정값(톤) | |
---|---|---|---|---|---|---|---|---|
31713 | 20200430 | P | 정수센터 | PR0710 | 강북 | S | 송수 | 714059 |
27241 | 20201119 | W | 수도사업소 | WW0005 | 북부 | T | 공급량 | 310177 |
12093 | 20221022 | P | 정수센터 | PR0370 | 암사 | C | 취수 | 934500 |
18074 | 20220123 | P | 정수센터 | PR0407 | 영등포 | S | 송수 | 431571 |
27854 | 20201022 | W | 수도사업소 | WW0009 | 남부 | T | 공급량 | 460016 |
27110 | 20201125 | W | 수도사업소 | WW0003 | 동부 | T | 공급량 | 479640 |
14568 | 20220701 | W | 수도사업소 | WW0006 | 서부 | T | 공급량 | 331158 |
1268 | 20240310 | P | 정수센터 | PR0370 | 암사 | S | 송수 | 803900 |
16733 | 20220325 | P | 정수센터 | PR0407 | 영등포 | C | 취수 | 416650 |
26421 | 20201227 | P | 정수센터 | PR0055 | 광암 | S | 송수 | 212400 |