Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.5 KiB |
Average record size in memory | 76.3 B |
Variable types
Text | 2 |
---|---|
Categorical | 6 |
Numeric | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=7f548830-24bc-11eb-a877-a5b67dc5814b |
Reproduction
Analysis started | 2023-12-10 13:15:10.966078 |
---|---|
Analysis finished | 2023-12-10 13:15:12.411367 |
Duration | 1.45 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시설명
Text
Distinct | 99 |
---|---|
Distinct (%) | 99.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
배수지 | 3 | 2.9% |
가학배수지 | 2 | 1.9% |
노안배수지 | 1 | 1.0% |
논산배수지 | 1 | 1.0% |
당포배수지 | 1 | 1.0% |
당인배수지 | 1 | 1.0% |
당산배수지 | 1 | 1.0% |
달아배수지 | 1 | 1.0% |
달도배수지 | 1 | 1.0% |
단양배수지 | 1 | 1.0% |
Other values (91) | 91 |
Most occurring characters
Value | Count | Frequency (%) |
배 | 88 | |
지 | 88 | |
수 | 87 | |
동 | 12 | 2.4% |
도 | 10 | 2.0% |
산 | 8 | 1.6% |
고 | 7 | 1.4% |
대 | 6 | 1.2% |
) | 6 | 1.2% |
( | 6 | 1.2% |
Other values (90) | 173 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 474 | |
Close Punctuation | 6 | 1.2% |
Open Punctuation | 6 | 1.2% |
Space Separator | 4 | 0.8% |
Other Punctuation | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
배 | 88 | |
지 | 88 | |
수 | 87 | |
동 | 12 | 2.5% |
도 | 10 | 2.1% |
산 | 8 | 1.7% |
고 | 7 | 1.5% |
대 | 6 | 1.3% |
신 | 6 | 1.3% |
가 | 5 | 1.1% |
Other values (86) | 157 |
Close Punctuation
Value | Count | Frequency (%) |
) | 6 |
Open Punctuation
Value | Count | Frequency (%) |
( | 6 |
Space Separator
Value | Count | Frequency (%) |
4 |
Other Punctuation
Value | Count | Frequency (%) |
? | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 474 | |
Common | 17 | 3.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
배 | 88 | |
지 | 88 | |
수 | 87 | |
동 | 12 | 2.5% |
도 | 10 | 2.1% |
산 | 8 | 1.7% |
고 | 7 | 1.5% |
대 | 6 | 1.3% |
신 | 6 | 1.3% |
가 | 5 | 1.1% |
Other values (86) | 157 |
Common
Value | Count | Frequency (%) |
) | 6 | |
( | 6 | |
4 | ||
? | 1 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 474 | |
ASCII | 16 | 3.3% |
None | 1 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
배 | 88 | |
지 | 88 | |
수 | 87 | |
동 | 12 | 2.5% |
도 | 10 | 2.1% |
산 | 8 | 1.7% |
고 | 7 | 1.5% |
대 | 6 | 1.3% |
신 | 6 | 1.3% |
가 | 5 | 1.1% |
Other values (86) | 157 |
ASCII
Value | Count | Frequency (%) |
) | 6 | |
( | 6 | |
4 |
None
Value | Count | Frequency (%) |
? | 1 |
권역
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
0 | |
---|---|
낙동강권역 | 1 |
Length
Max length | 5 |
---|---|
Median length | 1 |
Mean length | 1.04 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 99 | |
낙동강권역 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 99 | |
낙동강권역 | 1 | 1.0% |
사업명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
지방상수도 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지방상수도 |
---|---|
2nd row | 지방상수도 |
3rd row | 지방상수도 |
4th row | 지방상수도 |
5th row | 지방상수도 |
Common Values
Value | Count | Frequency (%) |
지방상수도 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지방상수도 | 100 |
사업단계명
Categorical
HIGH CORRELATION
 
Distinct | 18 |
---|---|
Distinct (%) | 18.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
완도수도관리단 | |
---|---|
광주수도관리단 | |
고령권관리단 | |
진도수도관리단 | |
통영수도관리단 | |
Other values (13) |
Length
Max length | 8 |
---|---|
Median length | 7 |
Mean length | 6.88 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 광주수도관리단 |
---|---|
2nd row | 광주수도관리단 |
3rd row | 광주수도관리단 |
4th row | 광주수도관리단 |
5th row | 광주수도관리단 |
Common Values
Value | Count | Frequency (%) |
완도수도관리단 | 24 | |
광주수도관리단 | 11 | |
고령권관리단 | 10 | |
진도수도관리단 | 7 | 7.0% |
통영수도관리단 | 6 | 6.0% |
경남서부권관리단 | 5 | 5.0% |
거제권관리단 | 4 | 4.0% |
고성수도관리단 | 4 | 4.0% |
금산권관리단 | 3 | 3.0% |
예천수도관리단 | 3 | 3.0% |
Other values (8) | 23 |
Length
Value | Count | Frequency (%) |
완도수도관리단 | 24 | |
광주수도관리단 | 11 | |
고령권관리단 | 10 | |
진도수도관리단 | 7 | 7.0% |
통영수도관리단 | 6 | 6.0% |
경남서부권관리단 | 5 | 5.0% |
거제권관리단 | 4 | 4.0% |
고성수도관리단 | 4 | 4.0% |
양주수도관리단 | 3 | 3.0% |
단양수도관리단 | 3 | 3.0% |
Other values (8) | 23 |
시설약칭
Text
Distinct | 63 |
---|---|
Distinct (%) | 63.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
0 | 38 | |
덕정(배 | 1 | 1.0% |
대죽(배 | 1 | 1.0% |
나리배 | 1 | 1.0% |
남동배 | 1 | 1.0% |
남평(배 | 1 | 1.0% |
내장(배 | 1 | 1.0% |
내행(배 | 1 | 1.0% |
노안(배 | 1 | 1.0% |
논산(배 | 1 | 1.0% |
Other values (53) | 53 |
Most occurring characters
Value | Count | Frequency (%) |
배 | 51 | |
( | 47 | |
) | 47 | |
0 | 38 | 12.1% |
동 | 9 | 2.9% |
도 | 7 | 2.2% |
산 | 5 | 1.6% |
신 | 4 | 1.3% |
덕 | 4 | 1.3% |
광 | 4 | 1.3% |
Other values (69) | 99 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 183 | |
Open Punctuation | 47 | 14.9% |
Close Punctuation | 47 | 14.9% |
Decimal Number | 38 | 12.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
배 | 51 | |
동 | 9 | 4.9% |
도 | 7 | 3.8% |
산 | 5 | 2.7% |
신 | 4 | 2.2% |
덕 | 4 | 2.2% |
광 | 4 | 2.2% |
진 | 3 | 1.6% |
장 | 3 | 1.6% |
고 | 3 | 1.6% |
Other values (66) | 90 |
Open Punctuation
Value | Count | Frequency (%) |
( | 47 |
Close Punctuation
Value | Count | Frequency (%) |
) | 47 |
Decimal Number
Value | Count | Frequency (%) |
0 | 38 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 183 | |
Common | 132 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
배 | 51 | |
동 | 9 | 4.9% |
도 | 7 | 3.8% |
산 | 5 | 2.7% |
신 | 4 | 2.2% |
덕 | 4 | 2.2% |
광 | 4 | 2.2% |
진 | 3 | 1.6% |
장 | 3 | 1.6% |
고 | 3 | 1.6% |
Other values (66) | 90 |
Common
Value | Count | Frequency (%) |
( | 47 | |
) | 47 | |
0 | 38 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 183 | |
ASCII | 132 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
배 | 51 | |
동 | 9 | 4.9% |
도 | 7 | 3.8% |
산 | 5 | 2.7% |
신 | 4 | 2.2% |
덕 | 4 | 2.2% |
광 | 4 | 2.2% |
진 | 3 | 1.6% |
장 | 3 | 1.6% |
고 | 3 | 1.6% |
Other values (66) | 90 |
ASCII
Value | Count | Frequency (%) |
( | 47 | |
) | 47 | |
0 | 38 |
소재지
Categorical
HIGH CORRELATION
 
Distinct | 31 |
---|---|
Distinct (%) | 31.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | |
---|---|
경북 고령군 고령읍 장기리 260-3번지 | |
경남 통영시 광도면 죽림리 1574-10 미래메디컬센터 9층 (죽림2로 49-10) | 6 |
경남 사천시 축동면 배춘리 18번지 (수자원길 30) | 5 |
전라남도 완도군 노화읍 | 4 |
Other values (26) |
Length
Max length | 46 |
---|---|
Median length | 34 |
Mean length | 25.09 |
Min length | 12 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 5.0% |
Sample
1st row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
---|---|
2nd row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
3rd row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
4th row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
5th row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
Common Values
Value | Count | Frequency (%) |
경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 11 | 11.0% |
경북 고령군 고령읍 장기리 260-3번지 | 10 | 10.0% |
경남 통영시 광도면 죽림리 1574-10 미래메디컬센터 9층 (죽림2로 49-10) | 6 | 6.0% |
경남 사천시 축동면 배춘리 18번지 (수자원길 30) | 5 | 5.0% |
전라남도 완도군 노화읍 | 4 | 4.0% |
전라남도 완도군 완도읍 | 4 | 4.0% |
경남 고성군 고성읍 기월리 603-4번지 (기월2길 59) | 4 | 4.0% |
경남 거제시 장평동 1195-41번지 (장평로 16-5) | 4 | 4.0% |
경북 예천군 예천읍 남본리 258-20 베스트프라자 B동 | 3 | 3.0% |
전남 나주시 이창동 191번지 (예향로 3803) | 3 | 3.0% |
Other values (21) | 46 |
Length
Value | Count | Frequency (%) |
전라남도 | 31 | 5.8% |
완도군 | 24 | 4.5% |
경기도 | 19 | 3.6% |
경남 | 19 | 3.6% |
경북 | 13 | 2.4% |
송정동 | 11 | 2.1% |
466-5번지 | 11 | 2.1% |
회안대로 | 11 | 2.1% |
1061-51 | 11 | 2.1% |
광주시 | 11 | 2.1% |
Other values (102) | 371 |
시설용량
Real number (ℝ)
ZEROS
 
Distinct | 54 |
---|---|
Distinct (%) | 54.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1684.82 |
Minimum | 0 |
---|---|
Maximum | 32800 |
Zeros | 18 |
Zeros (%) | 18.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 30 |
median | 220 |
Q3 | 1700 |
95-th percentile | 6150 |
Maximum | 32800 |
Range | 32800 |
Interquartile range (IQR) | 1670 |
Descriptive statistics
Standard deviation | 4002.8583 |
---|---|
Coefficient of variation (CV) | 2.3758374 |
Kurtosis | 37.430143 |
Mean | 1684.82 |
Median Absolute Deviation (MAD) | 220 |
Skewness | 5.3687872 |
Sum | 168482 |
Variance | 16022875 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 18 | 18.0% |
30 | 5 | 5.0% |
50 | 4 | 4.0% |
500 | 4 | 4.0% |
200 | 3 | 3.0% |
20 | 3 | 3.0% |
100 | 3 | 3.0% |
2000 | 3 | 3.0% |
300 | 2 | 2.0% |
140 | 2 | 2.0% |
Other values (44) | 53 |
Value | Count | Frequency (%) |
0 | 18 | |
3 | 1 | 1.0% |
20 | 3 | 3.0% |
30 | 5 | 5.0% |
32 | 1 | 1.0% |
40 | 1 | 1.0% |
50 | 4 | 4.0% |
60 | 2 | 2.0% |
70 | 1 | 1.0% |
72 | 1 | 1.0% |
Value | Count | Frequency (%) |
32800 | 1 | |
13000 | 1 | |
10500 | 1 | |
10000 | 1 | |
9000 | 1 | |
6000 | 2 | |
5500 | 1 | |
5240 | 1 | |
5000 | 2 | |
4800 | 1 |
관로길이
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 100 |
취수원
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 100 |
시설명 | 권역 | 사업단계명 | 시설약칭 | 소재지 | 시설용량 | |
---|---|---|---|---|---|---|
시설명 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 |
권역 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
사업단계명 | 1.000 | 0.000 | 1.000 | 0.986 | 1.000 | 0.706 |
시설약칭 | 1.000 | 0.000 | 0.986 | 1.000 | 0.000 | 0.991 |
소재지 | 0.000 | 0.000 | 1.000 | 0.000 | 1.000 | 0.501 |
시설용량 | 1.000 | 0.000 | 0.706 | 0.991 | 0.501 | 1.000 |
사업단계명 | 소재지 | 권역 | |
---|---|---|---|
사업단계명 | 1.000 | 0.917 | 0.000 |
소재지 | 0.917 | 1.000 | 0.000 |
권역 | 0.000 | 0.000 | 1.000 |
시설용량 | 권역 | 사업단계명 | 소재지 | |
---|---|---|---|---|
시설용량 | 1.000 | 0.000 | 0.423 | 0.217 |
권역 | 0.000 | 1.000 | 0.000 | 0.000 |
사업단계명 | 0.423 | 0.000 | 1.000 | 0.917 |
소재지 | 0.217 | 0.000 | 0.917 | 1.000 |
시설명 | 권역 | 사업명 | 사업단계명 | 시설약칭 | 소재지 | 시설용량 | 관로길이 | 취수원 | |
---|---|---|---|---|---|---|---|---|---|
0 | 검복 | 0 | 지방상수도 | 광주수도관리단 | 검복 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 200 | 0 | 0 |
1 | 능평 | 0 | 지방상수도 | 광주수도관리단 | 능평 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 4000 | 0 | 0 |
2 | 도마 | 0 | 지방상수도 | 광주수도관리단 | 도마 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 2200 | 0 | 0 |
3 | 산성 | 0 | 지방상수도 | 광주수도관리단 | 산성 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 500 | 0 | 0 |
4 | 오전 | 0 | 지방상수도 | 광주수도관리단 | 오전 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 200 | 0 | 0 |
5 | 오향 | 0 | 지방상수도 | 광주수도관리단 | 오향 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 2000 | 0 | 0 |
6 | 진우 | 0 | 지방상수도 | 광주수도관리단 | 진우 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 2000 | 0 | 0 |
7 | 추자 | 0 | 지방상수도 | 광주수도관리단 | 추자 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
8 | 학동 | 0 | 지방상수도 | 광주수도관리단 | 학동 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
9 | 대산 배수지 | 0 | 지방상수도 | 서산권관리단 | 대산(배) | 충남 서산시 석림동 800-3 | 5240 | 0 | 0 |
시설명 | 권역 | 사업명 | 사업단계명 | 시설약칭 | 소재지 | 시설용량 | 관로길이 | 취수원 | |
---|---|---|---|---|---|---|---|---|---|
90 | 동문배수지 | 0 | 지방상수도 | 서산권관리단 | 동문(배) | 충남 서산시 석림동 800-3 | 100 | 0 | 0 |
91 | 동부배수지 | 0 | 지방상수도 | 거제권관리단 | 동부(배) | 경남 거제시 장평동 1195-41번지 (장평로 16-5) | 3 | 0 | 0 |
92 | 동안배수지 | 0 | 지방상수도 | 동두천수도관리단 | 동안(배) | 경기도 동두천시 하봉암동 155번지 (평화로 3208번길 1) | 10500 | 0 | 0 |
93 | 동외배수지 | 0 | 지방상수도 | 진도수도관리단 | 동외배 | 전라남도 진도군 진도읍 | 1050 | 0 | 0 |
94 | 동진배수지 | 0 | 지방상수도 | 완도수도관리단 | 0 | 전라남도 완도군 소안면 | 72 | 0 | 0 |
95 | 동천배수지 | 0 | 지방상수도 | 경남서부권관리단 | 동천(배) | 경남 사천시 축동면 배춘리 18번지 (수자원길 30) | 100 | 0 | 0 |
96 | 둔덕배수지 | 0 | 지방상수도 | 거제권관리단 | 둔덕(배) | 경남 거제시 장평동 1195-41번지 (장평로 16-5) | 700 | 0 | 0 |
97 | 득성배수지 | 0 | 지방상수도 | 고령권관리단 | 0 | 경북 고령군 고령읍 장기리 260-3번지 | 0 | 0 | 0 |
98 | 마곡배수지 | 0 | 지방상수도 | 정읍권관리단 | 마곡(배) | 전북 정읍시 농소동 78-22번지 (서부산업도로 418) | 13000 | 0 | 0 |
99 | 마동배수지 | 0 | 지방상수도 | 고성수도관리단 | 마동(배) | 경남 고성군 고성읍 기월리 603-4번지 (기월2길 59) | 200 | 0 | 0 |