Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.6 KiB |
Average record size in memory | 77.3 B |
Variable types
Text | 2 |
---|---|
Categorical | 6 |
Numeric | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=59ea5050-24b9-11eb-bc79-3b11eb915d6d |
권역 has constant value "" | Constant |
사업명 has constant value "" | Constant |
관로길이 has constant value "" | Constant |
취수원 has constant value "" | Constant |
소재지 is highly overall correlated with 사업단계명 | High correlation |
사업단계명 is highly overall correlated with 소재지 | High correlation |
시설명 has unique values | Unique |
시설용량 has 43 (43.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 13:16:47.884461 |
---|---|
Analysis finished | 2023-12-10 13:16:49.143207 |
Duration | 1.26 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시설명
Text
UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
가압장 | 25 | 17.5% |
소규모가압장 | 11 | 7.7% |
소규모 | 3 | 2.1% |
여미리 | 1 | 0.7% |
정광마을 | 1 | 0.7% |
고암가압장 | 1 | 0.7% |
고봉가압장 | 1 | 0.7% |
고막가압장 | 1 | 0.7% |
객현가압장 | 1 | 0.7% |
갈구가압장 | 1 | 0.7% |
Other values (97) | 97 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 78 | 13.7% |
장 | 76 | 13.3% |
압 | 73 | 12.8% |
45 | 7.9% | |
리 | 20 | 3.5% |
소 | 15 | 2.6% |
규 | 14 | 2.5% |
모 | 14 | 2.5% |
산 | 10 | 1.8% |
동 | 9 | 1.6% |
Other values (110) | 216 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 519 | |
Space Separator | 45 | 7.9% |
Close Punctuation | 3 | 0.5% |
Open Punctuation | 3 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 78 | 15.0% |
장 | 76 | 14.6% |
압 | 73 | 14.1% |
리 | 20 | 3.9% |
소 | 15 | 2.9% |
규 | 14 | 2.7% |
모 | 14 | 2.7% |
산 | 10 | 1.9% |
동 | 9 | 1.7% |
광 | 8 | 1.5% |
Other values (107) | 202 |
Space Separator
Value | Count | Frequency (%) |
45 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 519 | |
Common | 51 | 8.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 78 | 15.0% |
장 | 76 | 14.6% |
압 | 73 | 14.1% |
리 | 20 | 3.9% |
소 | 15 | 2.9% |
규 | 14 | 2.7% |
모 | 14 | 2.7% |
산 | 10 | 1.9% |
동 | 9 | 1.7% |
광 | 8 | 1.5% |
Other values (107) | 202 |
Common
Value | Count | Frequency (%) |
45 | ||
) | 3 | 5.9% |
( | 3 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 519 | |
ASCII | 51 | 8.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 78 | 15.0% |
장 | 76 | 14.6% |
압 | 73 | 14.1% |
리 | 20 | 3.9% |
소 | 15 | 2.9% |
규 | 14 | 2.7% |
모 | 14 | 2.7% |
산 | 10 | 1.9% |
동 | 9 | 1.7% |
광 | 8 | 1.5% |
Other values (107) | 202 |
ASCII
Value | Count | Frequency (%) |
45 | ||
) | 3 | 5.9% |
( | 3 | 5.9% |
권역
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 100 |
사업명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
지방상수도 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지방상수도 |
---|---|
2nd row | 지방상수도 |
3rd row | 지방상수도 |
4th row | 지방상수도 |
5th row | 지방상수도 |
Common Values
Value | Count | Frequency (%) |
지방상수도 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지방상수도 | 100 |
사업단계명
Categorical
HIGH CORRELATION
 
Distinct | 19 |
---|---|
Distinct (%) | 19.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
광주수도관리단 | |
---|---|
서산권관리단 | |
나주수도관리단 | |
완도수도관리단 | |
고성수도관리단 | |
Other values (14) |
Length
Max length | 8 |
---|---|
Median length | 7 |
Mean length | 6.89 |
Min length | 6 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 2.0% |
Sample
1st row | 서산권관리단 |
---|---|
2nd row | 광주수도관리단 |
3rd row | 광주수도관리단 |
4th row | 광주수도관리단 |
5th row | 광주수도관리단 |
Common Values
Value | Count | Frequency (%) |
광주수도관리단 | 23 | |
서산권관리단 | 14 | |
나주수도관리단 | 9 | 9.0% |
완도수도관리단 | 7 | 7.0% |
고성수도관리단 | 6 | 6.0% |
예천수도관리단 | 6 | 6.0% |
경남서부권관리단 | 5 | 5.0% |
파주수도관리단 | 4 | 4.0% |
진도수도관리단 | 4 | 4.0% |
단양수도관리단 | 3 | 3.0% |
Other values (9) | 19 |
Length
Value | Count | Frequency (%) |
광주수도관리단 | 23 | |
서산권관리단 | 14 | |
나주수도관리단 | 9 | 9.0% |
완도수도관리단 | 7 | 7.0% |
고성수도관리단 | 6 | 6.0% |
예천수도관리단 | 6 | 6.0% |
경남서부권관리단 | 5 | 5.0% |
파주수도관리단 | 4 | 4.0% |
진도수도관리단 | 4 | 4.0% |
장흥수도관리단 | 3 | 3.0% |
Other values (9) | 19 |
시설약칭
Text
Distinct | 87 |
---|---|
Distinct (%) | 87.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
0 | 14 | 13.1% |
가 | 5 | 4.7% |
고봉(가 | 1 | 0.9% |
고암(가 | 1 | 0.9% |
객현(가 | 1 | 0.9% |
갈구가압장 | 1 | 0.9% |
갈곡(가 | 1 | 0.9% |
가업(가 | 1 | 0.9% |
가산(가 | 1 | 0.9% |
정광마을(가 | 1 | 0.9% |
Other values (80) | 80 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 66 | 16.4% |
) | 53 | 13.2% |
( | 53 | 13.2% |
0 | 14 | 3.5% |
장 | 8 | 2.0% |
광 | 8 | 2.0% |
산 | 8 | 2.0% |
리 | 7 | 1.7% |
7 | 1.7% | |
동 | 7 | 1.7% |
Other values (93) | 171 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 275 | |
Close Punctuation | 53 | 13.2% |
Open Punctuation | 53 | 13.2% |
Decimal Number | 14 | 3.5% |
Space Separator | 7 | 1.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 66 | |
장 | 8 | 2.9% |
광 | 8 | 2.9% |
산 | 8 | 2.9% |
리 | 7 | 2.5% |
동 | 7 | 2.5% |
압 | 6 | 2.2% |
구 | 6 | 2.2% |
현 | 6 | 2.2% |
도 | 5 | 1.8% |
Other values (89) | 148 |
Close Punctuation
Value | Count | Frequency (%) |
) | 53 |
Open Punctuation
Value | Count | Frequency (%) |
( | 53 |
Decimal Number
Value | Count | Frequency (%) |
0 | 14 |
Space Separator
Value | Count | Frequency (%) |
7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 275 | |
Common | 127 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 66 | |
장 | 8 | 2.9% |
광 | 8 | 2.9% |
산 | 8 | 2.9% |
리 | 7 | 2.5% |
동 | 7 | 2.5% |
압 | 6 | 2.2% |
구 | 6 | 2.2% |
현 | 6 | 2.2% |
도 | 5 | 1.8% |
Other values (89) | 148 |
Common
Value | Count | Frequency (%) |
) | 53 | |
( | 53 | |
0 | 14 | 11.0% |
7 | 5.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 275 | |
ASCII | 127 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 66 | |
장 | 8 | 2.9% |
광 | 8 | 2.9% |
산 | 8 | 2.9% |
리 | 7 | 2.5% |
동 | 7 | 2.5% |
압 | 6 | 2.2% |
구 | 6 | 2.2% |
현 | 6 | 2.2% |
도 | 5 | 1.8% |
Other values (89) | 148 |
ASCII
Value | Count | Frequency (%) |
) | 53 | |
( | 53 | |
0 | 14 | 11.0% |
7 | 5.5% |
소재지
Categorical
HIGH CORRELATION
 
Distinct | 26 |
---|---|
Distinct (%) | 26.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | |
---|---|
충남 서산시 석림동 800-3 | |
전남 나주시 이창동 191번지 (예향로 3803) | |
경남 고성군 고성읍 기월리 603-4번지 (기월2길 59) | |
경북 예천군 예천읍 남본리 258-20 베스트프라자 B동 | |
Other values (21) |
Length
Max length | 46 |
---|---|
Median length | 34 |
Mean length | 26.81 |
Min length | 12 |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 9.0% |
Sample
1st row | 충남 서산시 석림동 800-3 |
---|---|
2nd row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
3rd row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
4th row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
5th row | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) |
Common Values
Value | Count | Frequency (%) |
경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 23 | |
충남 서산시 석림동 800-3 | 14 | |
전남 나주시 이창동 191번지 (예향로 3803) | 9 | 9.0% |
경남 고성군 고성읍 기월리 603-4번지 (기월2길 59) | 6 | 6.0% |
경북 예천군 예천읍 남본리 258-20 베스트프라자 B동 | 6 | 6.0% |
경남 사천시 축동면 배춘리 18번지 (수자원길 30) | 5 | 5.0% |
경기도 파주시 문산읍 선유리 343번지 (화석정로 43-2) | 4 | 4.0% |
경기도 양주시 덕정동 162-9번지 (화합로 1402번길 9-24) | 3 | 3.0% |
충북 단양군 단양읍 별곡리 637번지 (수변로 137) | 3 | 3.0% |
전라남도 진도군 조도면 | 3 | 3.0% |
Other values (16) | 24 |
Length
Value | Count | Frequency (%) |
경기도 | 33 | 5.9% |
송정동 | 23 | 4.1% |
466-5번지 | 23 | 4.1% |
회안대로 | 23 | 4.1% |
1061-51 | 23 | 4.1% |
광주시 | 23 | 4.1% |
충남 | 17 | 3.0% |
800-3 | 14 | 2.5% |
경남 | 14 | 2.5% |
전라남도 | 14 | 2.5% |
Other values (98) | 354 |
시설용량
Real number (ℝ)
ZEROS
 
Distinct | 51 |
---|---|
Distinct (%) | 51.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 390.25 |
Minimum | 0 |
---|---|
Maximum | 5500 |
Zeros | 43 |
Zeros (%) | 43.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 42 |
Q3 | 197 |
95-th percentile | 2544 |
Maximum | 5500 |
Range | 5500 |
Interquartile range (IQR) | 197 |
Descriptive statistics
Standard deviation | 1002.9213 |
---|---|
Coefficient of variation (CV) | 2.5699457 |
Kurtosis | 13.838977 |
Mean | 390.25 |
Median Absolute Deviation (MAD) | 42 |
Skewness | 3.6919271 |
Sum | 39025 |
Variance | 1005851.2 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 43 | |
115 | 4 | 4.0% |
144 | 2 | 2.0% |
140 | 2 | 2.0% |
96 | 2 | 2.0% |
150 | 2 | 2.0% |
3000 | 1 | 1.0% |
5500 | 1 | 1.0% |
1440 | 1 | 1.0% |
650 | 1 | 1.0% |
Other values (41) | 41 |
Value | Count | Frequency (%) |
0 | 43 | |
6 | 1 | 1.0% |
12 | 1 | 1.0% |
14 | 1 | 1.0% |
15 | 1 | 1.0% |
20 | 1 | 1.0% |
33 | 1 | 1.0% |
36 | 1 | 1.0% |
48 | 1 | 1.0% |
50 | 1 | 1.0% |
Value | Count | Frequency (%) |
5500 | 1 | |
5000 | 1 | |
4500 | 1 | |
3600 | 1 | |
3000 | 1 | |
2520 | 1 | |
1440 | 1 | |
1400 | 1 | |
1296 | 1 | |
1060 | 1 |
관로길이
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 100 |
취수원
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 100 |
시설명 | 사업단계명 | 시설약칭 | 소재지 | 시설용량 | |
---|---|---|---|---|---|
시설명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
사업단계명 | 1.000 | 1.000 | 0.000 | 1.000 | 0.571 |
시설약칭 | 1.000 | 0.000 | 1.000 | 0.000 | 0.989 |
소재지 | 1.000 | 1.000 | 0.000 | 1.000 | 0.410 |
시설용량 | 1.000 | 0.571 | 0.989 | 0.410 | 1.000 |
소재지 | 사업단계명 | |
---|---|---|
소재지 | 1.000 | 0.956 |
사업단계명 | 0.956 | 1.000 |
시설용량 | 사업단계명 | 소재지 | |
---|---|---|---|
시설용량 | 1.000 | 0.261 | 0.150 |
사업단계명 | 0.261 | 1.000 | 0.956 |
소재지 | 0.150 | 0.956 | 1.000 |
시설명 | 권역 | 사업명 | 사업단계명 | 시설약칭 | 소재지 | 시설용량 | 관로길이 | 취수원 | |
---|---|---|---|---|---|---|---|---|---|
0 | 여미리 소규모가압장 | 0 | 지방상수도 | 서산권관리단 | 여미(가) | 충남 서산시 석림동 800-3 | 196 | 0 | 0 |
1 | 검복 | 0 | 지방상수도 | 광주수도관리단 | 검복 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
2 | 광남 | 0 | 지방상수도 | 광주수도관리단 | 광남 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
3 | 목동 | 0 | 지방상수도 | 광주수도관리단 | 목동 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
4 | 목현 | 0 | 지방상수도 | 광주수도관리단 | 목현 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
5 | 문형 | 0 | 지방상수도 | 광주수도관리단 | 문형 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
6 | 봉골 | 0 | 지방상수도 | 광주수도관리단 | 봉골 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
7 | 산성 | 0 | 지방상수도 | 광주수도관리단 | 산성 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
8 | 삼리 | 0 | 지방상수도 | 광주수도관리단 | 삼리 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
9 | 송정 | 0 | 지방상수도 | 광주수도관리단 | 송정 | 경기도 광주시 송정동 466-5번지 (회안대로 1061-51) | 0 | 0 | 0 |
시설명 | 권역 | 사업명 | 사업단계명 | 시설약칭 | 소재지 | 시설용량 | 관로길이 | 취수원 | |
---|---|---|---|---|---|---|---|---|---|
90 | 금곡가압장 | 0 | 지방상수도 | 파주수도관리단 | 금곡(가) | 경기도 파주시 문산읍 선유리 343번지 (화석정로 43-2) | 1400 | 0 | 0 |
91 | 금산가압장 | 0 | 지방상수도 | 장흥수도관리단 | 금산가 | 전라남도 장흥군 장흥읍 | 76 | 0 | 0 |
92 | 기동가압장 | 0 | 지방상수도 | 장흥수도관리단 | 기동가 | 전라남도 장흥군 장평면 | 290 | 0 | 0 |
93 | 기산가압장 | 0 | 지방상수도 | 양주수도관리단 | 기산(가) | 경기도 양주시 덕정동 162-9번지 (화합로 1402번길 9-24) | 540 | 0 | 0 |
94 | 기촌가압장 | 0 | 지방상수도 | 단양수도관리단 | 기촌(가) | 충북 단양군 단양읍 별곡리 637번지 (수변로 137) | 200 | 0 | 0 |
95 | 남영가압장 | 0 | 지방상수도 | 정읍권관리단 | 0 | 전북 정읍시 농소동 78-22번지 (서부산업도로 418) | 0 | 0 | 0 |
96 | 내동가압장 | 0 | 지방상수도 | 충남중부권관리단 | 내동(가) | 충남 논산시 내동 273-2번지 (중앙2로 14-27) | 0 | 0 | 0 |
97 | 내행가압장 | 0 | 지방상수도 | 동두천수도관리단 | 내행(가) | 경기도 동두천시 하봉암동 155번지 (평화로 3208번길 1) | 5000 | 0 | 0 |
98 | 노동가압장 | 0 | 지방상수도 | 나주수도관리단 | 노동(가) | 전남 나주시 이창동 191번지 (예향로 3803) | 0 | 0 | 0 |
99 | 다복가압장 | 0 | 지방상수도 | 금산권관리단 | 0 | 충남 금산군 금산읍 아인리 620-8번지 아인택지개발지구내 | 86 | 0 | 0 |