Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 24 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 5 |
Duplicate rows (%) | 20.8% |
Total size in memory | 1.7 KiB |
Average record size in memory | 74.5 B |
Variable types
Text | 2 |
---|---|
Categorical | 6 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=416d97b0-432e-11eb-87b4-fdbbc4b3fd5c |
수온값 has constant value "" | Constant |
수위 has constant value "" | Constant |
Dataset has 5 (20.8%) duplicate rows | Duplicates |
상부굴착구경(mm) is highly overall correlated with 설치일자 and 2 other fields | High correlation |
하부굴착구경(mm) is highly overall correlated with 관리기관명 and 1 other fields | High correlation |
관리기관명 is highly overall correlated with 상부굴착구경(mm) and 1 other fields | High correlation |
설치일자 is highly overall correlated with 상부굴착구경(mm) | High correlation |
Reproduction
Analysis started | 2023-12-10 11:42:27.992756 |
---|---|
Analysis finished | 2023-12-10 11:42:28.642957 |
Duration | 0.65 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
관측소명
Text
Distinct | 19 |
---|---|
Distinct (%) | 79.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
Value | Count | Frequency (%) |
안산원시 | 2 | 8.0% |
익산망성 | 2 | 8.0% |
안산성곡2 | 2 | 8.0% |
안산신길 | 2 | 8.0% |
안산성곡1 | 2 | 8.0% |
용인남곡 | 1 | 4.0% |
신촌동 | 1 | 4.0% |
보령오천 | 1 | 4.0% |
사천곤명 | 1 | 4.0% |
안산목내 | 1 | 4.0% |
Other values (10) | 10 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 14 | 12.7% |
안 | 9 | 8.2% |
성 | 7 | 6.4% |
화 | 6 | 5.5% |
곡 | 5 | 4.5% |
신 | 5 | 4.5% |
원 | 4 | 3.6% |
강 | 4 | 3.6% |
도 | 2 | 1.8% |
동 | 2 | 1.8% |
Other values (41) | 52 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 103 | |
Decimal Number | 4 | 3.6% |
Connector Punctuation | 2 | 1.8% |
Space Separator | 1 | 0.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 14 | 13.6% |
안 | 9 | 8.7% |
성 | 7 | 6.8% |
화 | 6 | 5.8% |
곡 | 5 | 4.9% |
신 | 5 | 4.9% |
원 | 4 | 3.9% |
강 | 4 | 3.9% |
도 | 2 | 1.9% |
동 | 2 | 1.9% |
Other values (37) | 45 |
Decimal Number
Value | Count | Frequency (%) |
2 | 2 | |
1 | 2 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 103 | |
Common | 7 | 6.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 14 | 13.6% |
안 | 9 | 8.7% |
성 | 7 | 6.8% |
화 | 6 | 5.8% |
곡 | 5 | 4.9% |
신 | 5 | 4.9% |
원 | 4 | 3.9% |
강 | 4 | 3.9% |
도 | 2 | 1.9% |
동 | 2 | 1.9% |
Other values (37) | 45 |
Common
Value | Count | Frequency (%) |
_ | 2 | |
2 | 2 | |
1 | 2 | |
1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 103 | |
ASCII | 7 | 6.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 14 | 13.6% |
안 | 9 | 8.7% |
성 | 7 | 6.8% |
화 | 6 | 5.8% |
곡 | 5 | 4.9% |
신 | 5 | 4.9% |
원 | 4 | 3.9% |
강 | 4 | 3.9% |
도 | 2 | 1.9% |
동 | 2 | 1.9% |
Other values (37) | 45 |
ASCII
Value | Count | Frequency (%) |
_ | 2 | |
2 | 2 | |
1 | 2 | |
1 |
설치일자
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 16.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
20201231 | |
---|---|
20200421 | |
20200724 | 1 |
20201221 | 1 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 8 |
Min length | 8 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 8.3% |
Sample
1st row | 20200724 |
---|---|
2nd row | 20200421 |
3rd row | 20200421 |
4th row | 20200421 |
5th row | 20201231 |
Common Values
Value | Count | Frequency (%) |
20201231 | 19 | |
20200421 | 3 | 12.5% |
20200724 | 1 | 4.2% |
20201221 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20201231 | 19 | |
20200421 | 3 | 12.5% |
20200724 | 1 | 4.2% |
20201221 | 1 | 4.2% |
주소
Text
Distinct | 19 |
---|---|
Distinct (%) | 79.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
Length
Max length | 27 |
---|---|
Median length | 24.5 |
Mean length | 21.208333 |
Min length | 18 |
Characters and Unicode
Total characters | 509 |
---|---|
Distinct characters | 82 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 14 ? |
---|---|
Unique (%) | 58.3% |
Sample
1st row | 경상남도 창원시 성산구 신촌동 22-4 |
---|---|
2nd row | 인천광역시 강화군 강화읍 남산리 438-5 |
3rd row | 인천광역시 강화군 선원면 선행리 190-5 |
4th row | 인천광역시 강화군 화도면 상방리 산 131 |
5th row | 충청남도 금산군 진산면 묵산리 175 |
Value | Count | Frequency (%) |
경기도 | 12 | 9.9% |
단원구 | 9 | 7.4% |
안산시 | 9 | 7.4% |
경상남도 | 4 | 3.3% |
성곡동 | 4 | 3.3% |
강화군 | 3 | 2.5% |
인천광역시 | 3 | 2.5% |
전라북도 | 2 | 1.7% |
847 | 2 | 1.7% |
망성면 | 2 | 1.7% |
Other values (62) | 71 |
Most occurring characters
Value | Count | Frequency (%) |
98 | 19.3% | |
도 | 25 | 4.9% |
시 | 23 | 4.5% |
산 | 22 | 4.3% |
경 | 16 | 3.1% |
원 | 16 | 3.1% |
7 | 13 | 2.6% |
1 | 13 | 2.6% |
기 | 12 | 2.4% |
면 | 12 | 2.4% |
Other values (72) | 259 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 314 | |
Space Separator | 98 | 19.3% |
Decimal Number | 87 | 17.1% |
Dash Punctuation | 10 | 2.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 25 | 8.0% |
시 | 23 | 7.3% |
산 | 22 | 7.0% |
경 | 16 | 5.1% |
원 | 16 | 5.1% |
기 | 12 | 3.8% |
면 | 12 | 3.8% |
구 | 12 | 3.8% |
안 | 11 | 3.5% |
동 | 10 | 3.2% |
Other values (60) | 155 |
Decimal Number
Value | Count | Frequency (%) |
7 | 13 | |
1 | 13 | |
2 | 12 | |
3 | 10 | |
4 | 9 | |
8 | 8 | |
5 | 6 | |
0 | 6 | |
9 | 6 | |
6 | 4 | 4.6% |
Space Separator
Value | Count | Frequency (%) |
98 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 314 | |
Common | 195 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 25 | 8.0% |
시 | 23 | 7.3% |
산 | 22 | 7.0% |
경 | 16 | 5.1% |
원 | 16 | 5.1% |
기 | 12 | 3.8% |
면 | 12 | 3.8% |
구 | 12 | 3.8% |
안 | 11 | 3.5% |
동 | 10 | 3.2% |
Other values (60) | 155 |
Common
Value | Count | Frequency (%) |
98 | ||
7 | 13 | 6.7% |
1 | 13 | 6.7% |
2 | 12 | 6.2% |
3 | 10 | 5.1% |
- | 10 | 5.1% |
4 | 9 | 4.6% |
8 | 8 | 4.1% |
5 | 6 | 3.1% |
0 | 6 | 3.1% |
Other values (2) | 10 | 5.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 314 | |
ASCII | 195 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
98 | ||
7 | 13 | 6.7% |
1 | 13 | 6.7% |
2 | 12 | 6.2% |
3 | 10 | 5.1% |
- | 10 | 5.1% |
4 | 9 | 4.6% |
8 | 8 | 4.1% |
5 | 6 | 3.1% |
0 | 6 | 3.1% |
Other values (2) | 10 | 5.1% |
Hangul
Value | Count | Frequency (%) |
도 | 25 | 8.0% |
시 | 23 | 7.3% |
산 | 22 | 7.0% |
경 | 16 | 5.1% |
원 | 16 | 5.1% |
기 | 12 | 3.8% |
면 | 12 | 3.8% |
구 | 12 | 3.8% |
안 | 11 | 3.5% |
동 | 10 | 3.2% |
Other values (60) | 155 |
관리기관명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 8.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
- | |
---|---|
환경부 한국환경공단 |
Length
Max length | 10 |
---|---|
Median length | 1 |
Mean length | 4.375 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | - |
---|---|
2nd row | - |
3rd row | - |
4th row | - |
5th row | - |
Common Values
Value | Count | Frequency (%) |
- | 15 | |
환경부 한국환경공단 | 9 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
15 | ||
환경부 | 9 | |
한국환경공단 | 9 |
상부굴착구경(mm)
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 12.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
0 | |
---|---|
300 | |
200 | 1 |
Length
Max length | 3 |
---|---|
Median length | 1 |
Mean length | 1.8333333 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 4.2% |
Sample
1st row | 200 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 14 | |
300 | 9 | |
200 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 14 | |
300 | 9 | |
200 | 1 | 4.2% |
하부굴착구경(mm)
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 8.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
0 | |
---|---|
250 |
Length
Max length | 3 |
---|---|
Median length | 1 |
Mean length | 1.75 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 15 | |
250 | 9 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 15 | |
250 | 9 |
수온값
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 24 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 24 |
수위
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 24 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 24 |
관측소명 | 설치일자 | 주소 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | |
---|---|---|---|---|---|---|
관측소명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
설치일자 | 1.000 | 1.000 | 1.000 | 0.291 | 0.680 | 0.291 |
주소 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
관리기관명 | 1.000 | 0.291 | 1.000 | 1.000 | 1.000 | 0.989 |
상부굴착구경(mm) | 1.000 | 0.680 | 1.000 | 1.000 | 1.000 | 1.000 |
하부굴착구경(mm) | 1.000 | 0.291 | 1.000 | 0.989 | 1.000 | 1.000 |
상부굴착구경(mm) | 하부굴착구경(mm) | 관리기관명 | 설치일자 | |
---|---|---|---|---|
상부굴착구경(mm) | 1.000 | 0.977 | 0.977 | 0.692 |
하부굴착구경(mm) | 0.977 | 1.000 | 0.907 | 0.169 |
관리기관명 | 0.977 | 0.907 | 1.000 | 0.169 |
설치일자 | 0.692 | 0.169 | 0.169 | 1.000 |
설치일자 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | |
---|---|---|---|---|
설치일자 | 1.000 | 0.169 | 0.692 | 0.169 |
관리기관명 | 0.169 | 1.000 | 0.977 | 0.907 |
상부굴착구경(mm) | 0.692 | 0.977 | 1.000 | 0.977 |
하부굴착구경(mm) | 0.169 | 0.907 | 0.977 | 1.000 |
관측소명 | 설치일자 | 주소 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | 수온값 | 수위 | |
---|---|---|---|---|---|---|---|---|
0 | 신촌동 동성아파트 | 20200724 | 경상남도 창원시 성산구 신촌동 22-4 | - | 200 | 0 | 0 | 0 |
1 | 강화강화 | 20200421 | 인천광역시 강화군 강화읍 남산리 438-5 | - | 0 | 0 | 0 | 0 |
2 | 강화선원 | 20200421 | 인천광역시 강화군 선원면 선행리 190-5 | - | 0 | 0 | 0 | 0 |
3 | 강화화도 | 20200421 | 인천광역시 강화군 화도면 상방리 산 131 | - | 0 | 0 | 0 | 0 |
4 | 금산진산 | 20201231 | 충청남도 금산군 진산면 묵산리 175 | - | 0 | 0 | 0 | 0 |
5 | 보령오천 | 20201231 | 충청남도 보령시 오천면 원산도3길 108 | - | 0 | 0 | 0 | 0 |
6 | 사천곤명 | 20201231 | 경상남도 사천시 곤명면 37-1 | - | 0 | 0 | 0 | 0 |
7 | 안산목내 | 20201231 | 경기도 안산시 단원구 목내동 472 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 |
8 | 안산신길 | 20201231 | 경기도 안산시 단원구 신길동 1053 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 |
9 | 안산신길 | 20201231 | 경기도 안산시 단원구 신길동 1053 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 |
관측소명 | 설치일자 | 주소 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | 수온값 | 수위 | |
---|---|---|---|---|---|---|---|---|
14 | 익산망성 | 20201231 | 전라북도 익산시 망성면 안성로 726 | - | 0 | 0 | 0 | 0 |
15 | 익산망성 | 20201231 | 전라북도 익산시 망성면 안성로 726 | - | 0 | 0 | 0 | 0 |
16 | 통영도산 | 20201231 | 경상남도 통영시 도산면 수월리 산257-4 | - | 0 | 0 | 0 | 0 |
17 | 인제서화_신 | 20201231 | 강원도 인제군 서화면 천도리 1092 | - | 0 | 0 | 0 | 0 |
18 | 창원진전_신 | 20201221 | 경상남도 창원시마산합포구 진전면 오서리 484번지 | - | 0 | 0 | 0 | 0 |
19 | 광주곤지암 | 20201231 | 경기도 광주시 곤지암읍 평촌길 12-137 | - | 0 | 0 | 0 | 0 |
20 | 안산성곡1 | 20201231 | 경기도 안산시 단원구 성곡동 627-2 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 |
21 | 안산성곡1 | 20201231 | 경기도 안산시 단원구 성곡동 627-2 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 |
22 | 안산성곡2 | 20201231 | 경기도 안산시 단원구 성곡동 793 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 |
23 | 안산성곡2 | 20201231 | 경기도 안산시 단원구 성곡동 793 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 |
Most frequently occurring
관측소명 | 설치일자 | 주소 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | 수온값 | 수위 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
0 | 안산성곡1 | 20201231 | 경기도 안산시 단원구 성곡동 627-2 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 | 2 |
1 | 안산성곡2 | 20201231 | 경기도 안산시 단원구 성곡동 793 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 | 2 |
2 | 안산신길 | 20201231 | 경기도 안산시 단원구 신길동 1053 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 | 2 |
3 | 안산원시 | 20201231 | 경기도 안산시 단원구 원시동 847 | 환경부 한국환경공단 | 300 | 250 | 0 | 0 | 2 |
4 | 익산망성 | 20201231 | 전라북도 익산시 망성면 안성로 726 | - | 0 | 0 | 0 | 0 | 2 |