Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 300 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 16.8 KiB |
Average record size in memory | 57.4 B |
Variable types
Numeric | 1 |
---|---|
Text | 1 |
Categorical | 5 |
Dataset
Description | 한국수자원공사에서 정수장 원·정수에 대해 조사 중인 300항목 현황입니다. 제공정보 - 번호, 항목, 단위, 물질구분, 대상시료, 검사주기, 구분 등 |
---|---|
URL | https://www.data.go.kr/data/15065464/fileData.do |
번호 is highly overall correlated with 물질구분 and 3 other fields | High correlation |
물질구분 is highly overall correlated with 번호 and 1 other fields | High correlation |
대상시료 is highly overall correlated with 번호 and 3 other fields | High correlation |
검사주기 is highly overall correlated with 번호 and 2 other fields | High correlation |
구분 is highly overall correlated with 번호 and 2 other fields | High correlation |
단위 is highly imbalanced (75.2%) | Imbalance |
번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 12:32:37.232073 |
---|---|
Analysis finished | 2023-12-12 12:32:38.000400 |
Duration | 0.77 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 300 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 150.5 |
Minimum | 1 |
---|---|
Maximum | 300 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 15.95 |
Q1 | 75.75 |
median | 150.5 |
Q3 | 225.25 |
95-th percentile | 285.05 |
Maximum | 300 |
Range | 299 |
Interquartile range (IQR) | 149.5 |
Descriptive statistics
Standard deviation | 86.746758 |
---|---|
Coefficient of variation (CV) | 0.57639042 |
Kurtosis | -1.2 |
Mean | 150.5 |
Median Absolute Deviation (MAD) | 75 |
Skewness | 0 |
Sum | 45150 |
Variance | 7525 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.3% |
208 | 1 | 0.3% |
206 | 1 | 0.3% |
205 | 1 | 0.3% |
204 | 1 | 0.3% |
203 | 1 | 0.3% |
202 | 1 | 0.3% |
201 | 1 | 0.3% |
200 | 1 | 0.3% |
199 | 1 | 0.3% |
Other values (290) | 290 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
300 | 1 | |
299 | 1 | |
298 | 1 | |
297 | 1 | |
296 | 1 | |
295 | 1 | |
294 | 1 | |
293 | 1 | |
292 | 1 | |
291 | 1 |
항목
Text
Distinct | 299 |
---|---|
Distinct (%) | 99.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
Length
Max length | 43 |
---|---|
Median length | 34 |
Mean length | 14.123333 |
Min length | 2 |
Characters and Unicode
Total characters | 4237 |
---|---|
Distinct characters | 66 |
Distinct categories | 11 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 298 ? |
---|---|
Unique (%) | 99.3% |
Sample
1st row | Total Colony Counts(35℃) |
---|---|
2nd row | Total coliforms |
3rd row | Fecal coliforms |
4th row | Escherichia coli |
5th row | Lead |
Value | Count | Frequency (%) |
acid | 10 | 2.6% |
total | 5 | 1.3% |
aminocarb | 2 | 0.5% |
fecal | 2 | 0.5% |
vinyl | 2 | 0.5% |
colony | 2 | 0.5% |
chloride | 2 | 0.5% |
sulfonate | 2 | 0.5% |
potassium | 2 | 0.5% |
sodium | 2 | 0.5% |
Other values (346) | 353 |
Most occurring characters
Value | Count | Frequency (%) |
o | 427 | 10.1% |
e | 361 | 8.5% |
i | 312 | 7.4% |
r | 269 | 6.3% |
n | 265 | 6.3% |
a | 256 | 6.0% |
l | 238 | 5.6% |
c | 180 | 4.2% |
t | 179 | 4.2% |
h | 171 | 4.0% |
Other values (56) | 1579 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 3401 | |
Uppercase Letter | 423 | 10.0% |
Decimal Number | 100 | 2.4% |
Space Separator | 99 | 2.3% |
Dash Punctuation | 72 | 1.7% |
Close Punctuation | 46 | 1.1% |
Open Punctuation | 46 | 1.1% |
Other Punctuation | 45 | 1.1% |
Other Symbol | 2 | < 0.1% |
Letter Number | 2 | < 0.1% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
C | 51 | |
D | 50 | |
T | 42 | |
P | 40 | |
M | 31 | 7.3% |
A | 28 | 6.6% |
B | 28 | 6.6% |
N | 27 | 6.4% |
S | 22 | 5.2% |
F | 21 | 5.0% |
Other values (14) | 83 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 427 | |
e | 361 | |
i | 312 | |
r | 269 | 7.9% |
n | 265 | 7.8% |
a | 256 | 7.5% |
l | 238 | 7.0% |
c | 180 | 5.3% |
t | 179 | 5.3% |
h | 171 | 5.0% |
Other values (13) | 743 |
Decimal Number
Value | Count | Frequency (%) |
1 | 38 | |
2 | 28 | |
4 | 15 | 15.0% |
3 | 10 | 10.0% |
6 | 4 | 4.0% |
5 | 3 | 3.0% |
0 | 1 | 1.0% |
7 | 1 | 1.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 45 | |
] | 1 | 2.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 45 | |
[ | 1 | 2.2% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 1 | |
Ⅱ | 1 |
Space Separator
Value | Count | Frequency (%) |
99 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 72 |
Other Punctuation
Value | Count | Frequency (%) |
, | 45 |
Other Symbol
Value | Count | Frequency (%) |
℃ | 2 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 3826 | |
Common | 411 | 9.7% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
o | 427 | 11.2% |
e | 361 | 9.4% |
i | 312 | 8.2% |
r | 269 | 7.0% |
n | 265 | 6.9% |
a | 256 | 6.7% |
l | 238 | 6.2% |
c | 180 | 4.7% |
t | 179 | 4.7% |
h | 171 | 4.5% |
Other values (39) | 1168 |
Common
Value | Count | Frequency (%) |
99 | ||
- | 72 | |
) | 45 | |
( | 45 | |
, | 45 | |
1 | 38 | 9.2% |
2 | 28 | 6.8% |
4 | 15 | 3.6% |
3 | 10 | 2.4% |
6 | 4 | 1.0% |
Other values (7) | 10 | 2.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 4233 | |
Letterlike Symbols | 2 | < 0.1% |
Number Forms | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
o | 427 | 10.1% |
e | 361 | 8.5% |
i | 312 | 7.4% |
r | 269 | 6.4% |
n | 265 | 6.3% |
a | 256 | 6.0% |
l | 238 | 5.6% |
c | 180 | 4.3% |
t | 179 | 4.2% |
h | 171 | 4.0% |
Other values (53) | 1575 |
Letterlike Symbols
Value | Count | Frequency (%) |
℃ | 2 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 1 | |
Ⅱ | 1 |
단위
Categorical
IMBALANCE
 
Distinct | 18 |
---|---|
Distinct (%) | 6.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
mg/L | |
---|---|
Bq/L | 7 |
㎍/L | 7 |
/250 mL | 4 |
- | 3 |
Other values (13) | 18 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.08 |
Min length | 1 |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 3.3% |
Sample
1st row | CFU/mL |
---|---|
2nd row | /100mL |
3rd row | /100mL |
4th row | /100mL |
5th row | mg/L |
Common Values
Value | Count | Frequency (%) |
mg/L | 261 | |
Bq/L | 7 | 2.3% |
㎍/L | 7 | 2.3% |
/250 mL | 4 | 1.3% |
- | 3 | 1.0% |
/100 mL | 3 | 1.0% |
/100mL | 3 | 1.0% |
CFU/mL | 2 | 0.7% |
/L | 1 | 0.3% |
/50 mL | 1 | 0.3% |
Other values (8) | 8 | 2.7% |
Length
Value | Count | Frequency (%) |
mg/l | 261 | |
ml | 8 | 2.6% |
bq/l | 7 | 2.3% |
㎍/l | 7 | 2.3% |
250 | 4 | 1.3% |
4 | 1.3% | |
100 | 3 | 1.0% |
100ml | 3 | 1.0% |
l | 2 | 0.6% |
cfu/ml | 2 | 0.6% |
Other values (8) | 8 | 2.6% |
물질구분
Categorical
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 5.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
농약 | |
---|---|
유해영향 유기물질 | |
소독부산물 | |
중금속 및 무기물 | |
미생물 | |
Other values (11) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 4.8466667 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 미생물 |
---|---|
2nd row | 미생물 |
3rd row | 미생물 |
4th row | 미생물 |
5th row | 중금속 및 무기물 |
Common Values
Value | Count | Frequency (%) |
농약 | 102 | |
유해영향 유기물질 | 49 | |
소독부산물 | 34 | 11.3% |
중금속 및 무기물 | 32 | 10.7% |
미생물 | 19 | 6.3% |
의약물질 | 17 | 5.7% |
심미적 영향물질 | 10 | 3.3% |
방사성물질 | 8 | 2.7% |
조류독소 | 8 | 2.7% |
이온 | 7 | 2.3% |
Other values (6) | 14 | 4.7% |
Length
Value | Count | Frequency (%) |
농약 | 102 | |
유해영향 | 49 | |
유기물질 | 49 | |
소독부산물 | 34 | 8.0% |
중금속 | 32 | 7.6% |
및 | 32 | 7.6% |
무기물 | 32 | 7.6% |
미생물 | 19 | 4.5% |
의약물질 | 17 | 4.0% |
영향물질 | 10 | 2.4% |
Other values (10) | 47 |
대상시료
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
원수, 정수 | |
---|---|
정수 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 4.52 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 정수 |
---|---|
2nd row | 정수 |
3rd row | 정수 |
4th row | 정수 |
5th row | 정수 |
Common Values
Value | Count | Frequency (%) |
원수, 정수 | 189 | |
정수 | 111 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정수 | 300 | |
원수 | 189 |
검사주기
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
년 1회 | |
---|---|
월 1회 | |
분기 1회 | 15 |
반기 1회 | 1 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.0533333 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 월 1회 |
---|---|
2nd row | 월 1회 |
3rd row | 월 1회 |
4th row | 월 1회 |
5th row | 월 1회 |
Common Values
Value | Count | Frequency (%) |
년 1회 | 222 | |
월 1회 | 62 | 20.7% |
분기 1회 | 15 | 5.0% |
반기 1회 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1회 | 300 | |
년 | 222 | |
월 | 62 | 10.3% |
분기 | 15 | 2.5% |
반기 | 1 | 0.2% |
구분
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
K-water 자체관리항목 | |
---|---|
먹는물 수질기준항목 | |
먹는물 수질감시항목 | |
먹는물 수질기준항목(지하수수원) | 1 |
먹는물 수질감시항목(지하수수원) | 1 |
Length
Max length | 17 |
---|---|
Median length | 14 |
Mean length | 12.82 |
Min length | 10 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.7% |
Sample
1st row | 먹는물 수질기준항목 |
---|---|
2nd row | 먹는물 수질기준항목 |
3rd row | 먹는물 수질기준항목 |
4th row | 먹는물 수질기준항목 |
5th row | 먹는물 수질기준항목 |
Common Values
Value | Count | Frequency (%) |
K-water 자체관리항목 | 208 | |
먹는물 수질기준항목 | 60 | 20.0% |
먹는물 수질감시항목 | 30 | 10.0% |
먹는물 수질기준항목(지하수수원) | 1 | 0.3% |
먹는물 수질감시항목(지하수수원) | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
k-water | 208 | |
자체관리항목 | 208 | |
먹는물 | 92 | |
수질기준항목 | 60 | 10.0% |
수질감시항목 | 30 | 5.0% |
수질기준항목(지하수수원 | 1 | 0.2% |
수질감시항목(지하수수원 | 1 | 0.2% |
번호 | 단위 | 물질구분 | 대상시료 | 검사주기 | 구분 | |
---|---|---|---|---|---|---|
번호 | 1.000 | 0.580 | 0.855 | 0.969 | 0.833 | 0.950 |
단위 | 0.580 | 1.000 | 0.815 | 0.340 | 0.425 | 0.338 |
물질구분 | 0.855 | 0.815 | 1.000 | 0.842 | 0.664 | 0.633 |
대상시료 | 0.969 | 0.340 | 0.842 | 1.000 | 0.896 | 0.676 |
검사주기 | 0.833 | 0.425 | 0.664 | 0.896 | 1.000 | 0.899 |
구분 | 0.950 | 0.338 | 0.633 | 0.676 | 0.899 | 1.000 |
물질구분 | 구분 | 검사주기 | 대상시료 | 단위 | |
---|---|---|---|---|---|
물질구분 | 1.000 | 0.379 | 0.362 | 0.678 | 0.417 |
구분 | 0.379 | 1.000 | 0.899 | 0.804 | 0.175 |
검사주기 | 0.362 | 0.899 | 1.000 | 0.706 | 0.239 |
대상시료 | 0.678 | 0.804 | 0.706 | 1.000 | 0.261 |
단위 | 0.417 | 0.175 | 0.239 | 0.261 | 1.000 |
번호 | 단위 | 물질구분 | 대상시료 | 검사주기 | 구분 | |
---|---|---|---|---|---|---|
번호 | 1.000 | 0.261 | 0.551 | 0.836 | 0.664 | 0.689 |
단위 | 0.261 | 1.000 | 0.417 | 0.261 | 0.239 | 0.175 |
물질구분 | 0.551 | 0.417 | 1.000 | 0.678 | 0.362 | 0.379 |
대상시료 | 0.836 | 0.261 | 0.678 | 1.000 | 0.706 | 0.804 |
검사주기 | 0.664 | 0.239 | 0.362 | 0.706 | 1.000 | 0.899 |
구분 | 0.689 | 0.175 | 0.379 | 0.804 | 0.899 | 1.000 |
번호 | 항목 | 단위 | 물질구분 | 대상시료 | 검사주기 | 구분 | |
---|---|---|---|---|---|---|---|
0 | 1 | Total Colony Counts(35℃) | CFU/mL | 미생물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
1 | 2 | Total coliforms | /100mL | 미생물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
2 | 3 | Fecal coliforms | /100mL | 미생물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
3 | 4 | Escherichia coli | /100mL | 미생물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
4 | 5 | Lead | mg/L | 중금속 및 무기물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
5 | 6 | Fluoride | mg/L | 이온 | 정수 | 월 1회 | 먹는물 수질기준항목 |
6 | 7 | Arsenic | mg/L | 중금속 및 무기물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
7 | 8 | Selenium | mg/L | 중금속 및 무기물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
8 | 9 | Mercury | mg/L | 중금속 및 무기물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
9 | 10 | Cyanide | mg/L | 중금속 및 무기물 | 정수 | 월 1회 | 먹는물 수질기준항목 |
번호 | 항목 | 단위 | 물질구분 | 대상시료 | 검사주기 | 구분 | |
---|---|---|---|---|---|---|---|
290 | 291 | N-Nitroso-di-n-propylamine (NDPA) | mg/L | 니트로스아민 | 정수 | 년 1회 | K-water 자체관리항목 |
291 | 292 | N-Nitrosodiphenylamine (NDPHA) | mg/L | 니트로스아민 | 정수 | 년 1회 | K-water 자체관리항목 |
292 | 293 | Sodium perfluoro-a-decanesulfonate (PFDS) | mg/L | 과불화화합물 | 원수, 정수 | 년 1회 | K-water 자체관리항목 |
293 | 294 | Perfluorononanoic acid (PFNA) | mg/L | 과불화화합물 | 원수, 정수 | 년 1회 | K-water 자체관리항목 |
294 | 295 | Perfluorohexanoic acid (PFHxA) | mg/L | 과불화화합물 | 원수, 정수 | 년 1회 | K-water 자체관리항목 |
295 | 296 | Bisphenol-A | mg/L | 알킬페놀 | 원수, 정수 | 년 1회 | K-water 자체관리항목 |
296 | 297 | n-Octylphenol | mg/L | 알킬페놀 | 원수, 정수 | 년 1회 | K-water 자체관리항목 |
297 | 298 | Nonylphenol | mg/L | 알킬페놀 | 원수, 정수 | 년 1회 | K-water 자체관리항목 |
298 | 299 | n-Pentylphenol | mg/L | 알킬페놀 | 원수, 정수 | 년 1회 | K-water 자체관리항목 |
299 | 300 | Total Organic Carbon (TOC) | mg/L | 기타 | 원수, 정수 | 년 1회 | K-water 자체관리항목 |