Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 54 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.2 KiB |
Average record size in memory | 42.4 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=005ffab0-24b6-11eb-bc79-3b11eb915d6d |
측정일 has constant value "" | Constant |
측정지점 is highly overall correlated with 시설명 and 1 other fields | High correlation |
시설명 is highly overall correlated with 측정지점 and 1 other fields | High correlation |
수치 is highly overall correlated with 시설명 and 1 other fields | High correlation |
측정지점 is highly imbalanced (86.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 10:18:57.494107 |
---|---|
Analysis finished | 2023-12-10 10:18:58.067814 |
Duration | 0.57 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
측정일
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
Minimum | 2020-10-05 00:00:00 |
---|---|
Maximum | 2020-10-05 00:00:00 |
시설명
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 5.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
곤명정수장 | |
---|---|
금당정수장 | |
고령정수장 | 1 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 금당정수장 |
---|---|
2nd row | 금당정수장 |
3rd row | 곤명정수장 |
4th row | 금당정수장 |
5th row | 금당정수장 |
Common Values
Value | Count | Frequency (%) |
곤명정수장 | 35 | |
금당정수장 | 18 | |
고령정수장 | 1 | 1.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
곤명정수장 | 35 | |
금당정수장 | 18 | |
고령정수장 | 1 | 1.9% |
측정지점
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
정수지 | |
---|---|
침전지 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 정수지 |
---|---|
2nd row | 정수지 |
3rd row | 정수지 |
4th row | 정수지 |
5th row | 정수지 |
Common Values
Value | Count | Frequency (%) |
정수지 | 53 | |
침전지 | 1 | 1.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정수지 | 53 | |
침전지 | 1 | 1.9% |
검사항목
Text
Distinct | 43 |
---|---|
Distinct (%) | 79.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
Value | Count | Frequency (%) |
사염화탄소 | 2 | 3.7% |
과망간산칼륨소비량 | 2 | 3.7% |
색도 | 2 | 3.7% |
셀레늄 | 2 | 3.7% |
경도 | 2 | 3.7% |
대장균 | 2 | 3.7% |
벤젠 | 2 | 3.7% |
ph | 2 | 3.7% |
브로모디클로로메탄 | 2 | 3.7% |
세제(음이온계면활성제 | 2 | 3.7% |
Other values (33) | 34 |
Most occurring characters
Value | Count | Frequency (%) |
로 | 20 | 7.9% |
소 | 8 | 3.2% |
클 | 8 | 3.2% |
아 | 6 | 2.4% |
산 | 6 | 2.4% |
세 | 6 | 2.4% |
디 | 6 | 2.4% |
트 | 5 | 2.0% |
탄 | 5 | 2.0% |
이 | 5 | 2.0% |
Other values (93) | 177 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 231 | |
Lowercase Letter | 5 | 2.0% |
Decimal Number | 4 | 1.6% |
Dash Punctuation | 3 | 1.2% |
Uppercase Letter | 3 | 1.2% |
Other Punctuation | 2 | 0.8% |
Open Punctuation | 2 | 0.8% |
Close Punctuation | 2 | 0.8% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 20 | 8.7% |
소 | 8 | 3.5% |
클 | 8 | 3.5% |
아 | 6 | 2.6% |
산 | 6 | 2.6% |
세 | 6 | 2.6% |
디 | 6 | 2.6% |
트 | 5 | 2.2% |
탄 | 5 | 2.2% |
이 | 5 | 2.2% |
Other values (81) | 156 |
Lowercase Letter
Value | Count | Frequency (%) |
p | 2 | |
h | 1 | |
l | 1 | |
a | 1 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
4 | 1 | 25.0% |
Uppercase Letter
Value | Count | Frequency (%) |
H | 2 | |
C | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 231 | |
Common | 13 | 5.2% |
Latin | 8 | 3.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 20 | 8.7% |
소 | 8 | 3.5% |
클 | 8 | 3.5% |
아 | 6 | 2.6% |
산 | 6 | 2.6% |
세 | 6 | 2.6% |
디 | 6 | 2.6% |
트 | 5 | 2.2% |
탄 | 5 | 2.2% |
이 | 5 | 2.2% |
Other values (81) | 156 |
Common
Value | Count | Frequency (%) |
- | 3 | |
1 | 3 | |
. | 2 | |
( | 2 | |
) | 2 | |
4 | 1 | 7.7% |
Latin
Value | Count | Frequency (%) |
p | 2 | |
H | 2 | |
C | 1 | |
h | 1 | |
l | 1 | |
a | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 231 | |
ASCII | 21 | 8.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
로 | 20 | 8.7% |
소 | 8 | 3.5% |
클 | 8 | 3.5% |
아 | 6 | 2.6% |
산 | 6 | 2.6% |
세 | 6 | 2.6% |
디 | 6 | 2.6% |
트 | 5 | 2.2% |
탄 | 5 | 2.2% |
이 | 5 | 2.2% |
Other values (81) | 156 |
ASCII
Value | Count | Frequency (%) |
- | 3 | |
1 | 3 | |
. | 2 | |
( | 2 | |
) | 2 | |
p | 2 | |
H | 2 | |
C | 1 | 4.8% |
h | 1 | 4.8% |
l | 1 | 4.8% |
Other values (2) | 2 |
수치
Categorical
HIGH CORRELATION
 
Distinct | 20 |
---|---|
Distinct (%) | 37.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
불검출 | |
---|---|
0.0016 | 1 |
0.007 | 1 |
1.0 | 1 |
1.9 | 1 |
Other values (15) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.2037037 |
Min length | 1 |
Unique
Unique | 19 ? |
---|---|
Unique (%) | 35.2% |
Sample
1st row | 0.0016 |
---|---|
2nd row | 불검출 |
3rd row | 불검출 |
4th row | 0.007 |
5th row | 불검출 |
Common Values
Value | Count | Frequency (%) |
불검출 | 35 | |
0.0016 | 1 | 1.9% |
0.007 | 1 | 1.9% |
1.0 | 1 | 1.9% |
1.9 | 1 | 1.9% |
96 | 1 | 1.9% |
4 | 1 | 1.9% |
7 | 1 | 1.9% |
0.003 | 1 | 1.9% |
0.006 | 1 | 1.9% |
Other values (10) | 10 | 18.5% |
Length
Value | Count | Frequency (%) |
불검출 | 35 | |
0.0016 | 1 | 1.9% |
0.7 | 1 | 1.9% |
0.60 | 1 | 1.9% |
7.4 | 1 | 1.9% |
39 | 1 | 1.9% |
0.0023 | 1 | 1.9% |
6.7 | 1 | 1.9% |
0.012 | 1 | 1.9% |
0.010 | 1 | 1.9% |
Other values (10) | 10 | 18.5% |
시설명 | 측정지점 | 검사항목 | 수치 | |
---|---|---|---|---|
시설명 | 1.000 | 1.000 | 0.000 | 0.856 |
측정지점 | 1.000 | 1.000 | 1.000 | 1.000 |
검사항목 | 0.000 | 1.000 | 1.000 | 0.678 |
수치 | 0.856 | 1.000 | 0.678 | 1.000 |
측정지점 | 수치 | 시설명 | |
---|---|---|---|
측정지점 | 1.000 | 0.809 | 0.990 |
수치 | 0.809 | 1.000 | 0.567 |
시설명 | 0.990 | 0.567 | 1.000 |
시설명 | 측정지점 | 수치 | |
---|---|---|---|
시설명 | 1.000 | 0.990 | 0.567 |
측정지점 | 0.990 | 1.000 | 0.809 |
수치 | 0.567 | 0.809 | 1.000 |
측정일 | 시설명 | 측정지점 | 검사항목 | 수치 | |
---|---|---|---|---|---|
0 | 2020-10-05 | 금당정수장 | 정수지 | 브롬산염 | 0.0016 |
1 | 2020-10-05 | 금당정수장 | 정수지 | 셀레늄 | 불검출 |
2 | 2020-10-05 | 곤명정수장 | 정수지 | 파라티온 | 불검출 |
3 | 2020-10-05 | 금당정수장 | 정수지 | 브로모디클로로메탄 | 0.007 |
4 | 2020-10-05 | 금당정수장 | 정수지 | 세제(음이온계면활성제) | 불검출 |
5 | 2020-10-05 | 곤명정수장 | 정수지 | 세제(음이온계면활성제) | 불검출 |
6 | 2020-10-05 | 곤명정수장 | 정수지 | 질산성질소 | 1.0 |
7 | 2020-10-05 | 곤명정수장 | 정수지 | 트리클로로에틸렌 | 불검출 |
8 | 2020-10-05 | 금당정수장 | 정수지 | 과망간산칼륨소비량 | 1.9 |
9 | 2020-10-05 | 금당정수장 | 정수지 | 불소 | 불검출 |
측정일 | 시설명 | 측정지점 | 검사항목 | 수치 | |
---|---|---|---|---|---|
44 | 2020-10-05 | 금당정수장 | 정수지 | 디클로로아세토니트릴 | 0.0023 |
45 | 2020-10-05 | 금당정수장 | 정수지 | 벤젠 | 불검출 |
46 | 2020-10-05 | 곤명정수장 | 정수지 | 경도 | 39 |
47 | 2020-10-05 | 곤명정수장 | 정수지 | 셀레늄 | 불검출 |
48 | 2020-10-05 | 곤명정수장 | 정수지 | pH | 7.4 |
49 | 2020-10-05 | 곤명정수장 | 정수지 | 1.4-다이옥산 | 불검출 |
50 | 2020-10-05 | 고령정수장 | 침전지 | Chl-a | 0.60 |
51 | 2020-10-05 | 곤명정수장 | 정수지 | 과망간산칼륨소비량 | 0.7 |
52 | 2020-10-05 | 곤명정수장 | 정수지 | 납 | 불검출 |
53 | 2020-10-05 | 곤명정수장 | 정수지 | 냄새 | 없음 |