Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 41 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.9 KiB |
Average record size in memory | 72.2 B |
Variable types
Text | 2 |
---|---|
Categorical | 4 |
Numeric | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=416d97b0-432e-11eb-87b4-fdbbc4b3fd5c |
하부굴착구경(mm) is highly overall correlated with 수온값 and 2 other fields | High correlation |
관리기관명 is highly overall correlated with 수온값 and 2 other fields | High correlation |
설치일자 is highly overall correlated with 수온값 and 2 other fields | High correlation |
수온값 is highly overall correlated with 설치일자 and 2 other fields | High correlation |
상부굴착구경(mm) is highly imbalanced (83.5%) | Imbalance |
수온값 has 8 (19.5%) zeros | Zeros |
수위 has 8 (19.5%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 11:42:21.525196 |
---|---|
Analysis finished | 2023-12-10 11:42:22.999067 |
Duration | 1.47 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
관측소명
Text
Distinct | 29 |
---|---|
Distinct (%) | 70.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 460.0 B |
Value | Count | Frequency (%) |
울산화산 | 2 | 4.9% |
창원팔용 | 2 | 4.9% |
창원천선 | 2 | 4.9% |
부산송정3 | 2 | 4.9% |
부산송정1 | 2 | 4.9% |
해남북일 | 2 | 4.9% |
부산송정2 | 2 | 4.9% |
울산원산 | 2 | 4.9% |
창원신촌 | 2 | 4.9% |
창원성산 | 2 | 4.9% |
Other values (19) | 21 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 24 | 14.0% |
원 | 11 | 6.4% |
송 | 9 | 5.2% |
창 | 9 | 5.2% |
부 | 8 | 4.7% |
정 | 8 | 4.7% |
울 | 7 | 4.1% |
흥 | 5 | 2.9% |
고 | 5 | 2.9% |
성 | 5 | 2.9% |
Other values (45) | 81 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 164 | |
Decimal Number | 8 | 4.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 24 | 14.6% |
원 | 11 | 6.7% |
송 | 9 | 5.5% |
창 | 9 | 5.5% |
부 | 8 | 4.9% |
정 | 8 | 4.9% |
울 | 7 | 4.3% |
흥 | 5 | 3.0% |
고 | 5 | 3.0% |
성 | 5 | 3.0% |
Other values (41) | 73 |
Decimal Number
Value | Count | Frequency (%) |
4 | 2 | |
3 | 2 | |
2 | 2 | |
1 | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 164 | |
Common | 8 | 4.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 24 | 14.6% |
원 | 11 | 6.7% |
송 | 9 | 5.5% |
창 | 9 | 5.5% |
부 | 8 | 4.9% |
정 | 8 | 4.9% |
울 | 7 | 4.3% |
흥 | 5 | 3.0% |
고 | 5 | 3.0% |
성 | 5 | 3.0% |
Other values (41) | 73 |
Common
Value | Count | Frequency (%) |
4 | 2 | |
3 | 2 | |
2 | 2 | |
1 | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 164 | |
ASCII | 8 | 4.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 24 | 14.6% |
원 | 11 | 6.7% |
송 | 9 | 5.5% |
창 | 9 | 5.5% |
부 | 8 | 4.9% |
정 | 8 | 4.9% |
울 | 7 | 4.3% |
흥 | 5 | 3.0% |
고 | 5 | 3.0% |
성 | 5 | 3.0% |
Other values (41) | 73 |
ASCII
Value | Count | Frequency (%) |
4 | 2 | |
3 | 2 | |
2 | 2 | |
1 | 2 |
설치일자
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 7.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 460.0 B |
20211214 | |
---|---|
20211201 | |
20211216 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 8 |
Min length | 8 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 20211201 |
---|---|
2nd row | 20211201 |
3rd row | 20211201 |
4th row | 20211201 |
5th row | 20211201 |
Common Values
Value | Count | Frequency (%) |
20211214 | 23 | |
20211201 | 11 | |
20211216 | 7 | 17.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20211214 | 23 | |
20211201 | 11 | |
20211216 | 7 | 17.1% |
주소
Text
Distinct | 28 |
---|---|
Distinct (%) | 68.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 460.0 B |
Length
Max length | 25 |
---|---|
Median length | 24 |
Mean length | 20.634146 |
Min length | 16 |
Characters and Unicode
Total characters | 846 |
---|---|
Distinct characters | 89 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 41.5% |
Sample
1st row | 전라남도 고흥군 고흥읍 고소리 산6-5 |
---|---|
2nd row | 전라남도 고흥군 과역면 신곡리 1117-9 |
3rd row | 전라남도 고흥군 남양면 장담리 3056 |
4th row | 전라남도 고흥군 봉래면 외초리 108-3 |
5th row | 전라남도 보성군 보성읍 대야리 산177-10 |
Value | Count | Frequency (%) |
부산광역시 | 8 | 4.1% |
송정동 | 8 | 4.1% |
강서구 | 8 | 4.1% |
경상남도 | 8 | 4.1% |
창원시 | 8 | 4.1% |
울산광역시 | 7 | 3.6% |
전라남도 | 7 | 3.6% |
온산읍 | 7 | 3.6% |
울주군 | 7 | 3.6% |
경상북도 | 7 | 3.6% |
Other values (82) | 120 |
Most occurring characters
Value | Count | Frequency (%) |
154 | 18.2% | |
1 | 41 | 4.8% |
산 | 40 | 4.7% |
도 | 29 | 3.4% |
시 | 28 | 3.3% |
리 | 23 | 2.7% |
동 | 21 | 2.5% |
- | 21 | 2.5% |
군 | 20 | 2.4% |
5 | 19 | 2.2% |
Other values (79) | 450 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 517 | |
Space Separator | 154 | 18.2% |
Decimal Number | 154 | 18.2% |
Dash Punctuation | 21 | 2.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 40 | 7.7% |
도 | 29 | 5.6% |
시 | 28 | 5.4% |
리 | 23 | 4.4% |
동 | 21 | 4.1% |
군 | 20 | 3.9% |
남 | 19 | 3.7% |
구 | 16 | 3.1% |
역 | 16 | 3.1% |
경 | 16 | 3.1% |
Other values (67) | 289 |
Decimal Number
Value | Count | Frequency (%) |
1 | 41 | |
5 | 19 | |
2 | 18 | |
7 | 15 | 9.7% |
0 | 13 | 8.4% |
4 | 11 | 7.1% |
9 | 11 | 7.1% |
6 | 10 | 6.5% |
3 | 10 | 6.5% |
8 | 6 | 3.9% |
Space Separator
Value | Count | Frequency (%) |
154 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 21 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 517 | |
Common | 329 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 40 | 7.7% |
도 | 29 | 5.6% |
시 | 28 | 5.4% |
리 | 23 | 4.4% |
동 | 21 | 4.1% |
군 | 20 | 3.9% |
남 | 19 | 3.7% |
구 | 16 | 3.1% |
역 | 16 | 3.1% |
경 | 16 | 3.1% |
Other values (67) | 289 |
Common
Value | Count | Frequency (%) |
154 | ||
1 | 41 | 12.5% |
- | 21 | 6.4% |
5 | 19 | 5.8% |
2 | 18 | 5.5% |
7 | 15 | 4.6% |
0 | 13 | 4.0% |
4 | 11 | 3.3% |
9 | 11 | 3.3% |
6 | 10 | 3.0% |
Other values (2) | 16 | 4.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 517 | |
ASCII | 329 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
154 | ||
1 | 41 | 12.5% |
- | 21 | 6.4% |
5 | 19 | 5.8% |
2 | 18 | 5.5% |
7 | 15 | 4.6% |
0 | 13 | 4.0% |
4 | 11 | 3.3% |
9 | 11 | 3.3% |
6 | 10 | 3.0% |
Other values (2) | 16 | 4.9% |
Hangul
Value | Count | Frequency (%) |
산 | 40 | 7.7% |
도 | 29 | 5.6% |
시 | 28 | 5.4% |
리 | 23 | 4.4% |
동 | 21 | 4.1% |
군 | 20 | 3.9% |
남 | 19 | 3.7% |
구 | 16 | 3.1% |
역 | 16 | 3.1% |
경 | 16 | 3.1% |
Other values (67) | 289 |
관리기관명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 4.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 460.0 B |
환경부. 한국환경공단 | |
---|---|
환경부. 한국수자원공사 |
Length
Max length | 12 |
---|---|
Median length | 11 |
Mean length | 11.439024 |
Min length | 11 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 환경부. 한국수자원공사 |
---|---|
2nd row | 환경부. 한국수자원공사 |
3rd row | 환경부. 한국수자원공사 |
4th row | 환경부. 한국수자원공사 |
5th row | 환경부. 한국수자원공사 |
Common Values
Value | Count | Frequency (%) |
환경부. 한국환경공단 | 23 | |
환경부. 한국수자원공사 | 18 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
환경부 | 41 | |
한국환경공단 | 23 | |
한국수자원공사 | 18 |
상부굴착구경(mm)
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 4.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 460.0 B |
300 | |
---|---|
400 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 2.4% |
Sample
1st row | 300 |
---|---|
2nd row | 300 |
3rd row | 300 |
4th row | 300 |
5th row | 300 |
Common Values
Value | Count | Frequency (%) |
300 | 40 | |
400 | 1 | 2.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
300 | 40 | |
400 | 1 | 2.4% |
하부굴착구경(mm)
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 4.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 460.0 B |
300 | |
---|---|
200 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 200 |
---|---|
2nd row | 200 |
3rd row | 200 |
4th row | 200 |
5th row | 200 |
Common Values
Value | Count | Frequency (%) |
300 | 24 | |
200 | 17 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
300 | 24 | |
200 | 17 |
수온값
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 27 |
---|---|
Distinct (%) | 65.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 12.207317 |
Minimum | 0 |
---|---|
Maximum | 17.5 |
Zeros | 8 |
Zeros (%) | 19.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 501.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 12.3 |
median | 14.6 |
Q3 | 16.7 |
95-th percentile | 17.3 |
Maximum | 17.5 |
Range | 17.5 |
Interquartile range (IQR) | 4.4 |
Descriptive statistics
Standard deviation | 6.3140474 |
---|---|
Coefficient of variation (CV) | 0.51723466 |
Kurtosis | 0.15930032 |
Mean | 12.207317 |
Median Absolute Deviation (MAD) | 2.2 |
Skewness | -1.3327577 |
Sum | 500.5 |
Variance | 39.867195 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 8 | |
17.3 | 3 | 7.3% |
12.4 | 2 | 4.9% |
13.9 | 2 | 4.9% |
17.0 | 2 | 4.9% |
16.1 | 2 | 4.9% |
16.7 | 2 | 4.9% |
17.2 | 1 | 2.4% |
17.4 | 1 | 2.4% |
17.1 | 1 | 2.4% |
Other values (17) | 17 |
Value | Count | Frequency (%) |
0.0 | 8 | |
11.7 | 1 | 2.4% |
12.1 | 1 | 2.4% |
12.3 | 1 | 2.4% |
12.4 | 2 | 4.9% |
12.9 | 1 | 2.4% |
13.3 | 1 | 2.4% |
13.4 | 1 | 2.4% |
13.5 | 1 | 2.4% |
13.9 | 2 | 4.9% |
Value | Count | Frequency (%) |
17.5 | 1 | 2.4% |
17.4 | 1 | 2.4% |
17.3 | 3 | |
17.2 | 1 | 2.4% |
17.1 | 1 | 2.4% |
17.0 | 2 | |
16.8 | 1 | 2.4% |
16.7 | 2 | |
16.1 | 2 | |
16.0 | 1 | 2.4% |
수위
Real number (ℝ)
ZEROS
 
Distinct | 31 |
---|---|
Distinct (%) | 75.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.1960976 |
Minimum | 0 |
---|---|
Maximum | 24.6 |
Zeros | 8 |
Zeros (%) | 19.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 501.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1.66 |
median | 3.4 |
Q3 | 5.24 |
95-th percentile | 10.77 |
Maximum | 24.6 |
Range | 24.6 |
Interquartile range (IQR) | 3.58 |
Descriptive statistics
Standard deviation | 4.6549392 |
---|---|
Coefficient of variation (CV) | 1.1093496 |
Kurtosis | 9.1922179 |
Mean | 4.1960976 |
Median Absolute Deviation (MAD) | 1.84 |
Skewness | 2.6395694 |
Sum | 172.04 |
Variance | 21.668459 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 8 | 19.5% |
3.2 | 2 | 4.9% |
5.0 | 2 | 4.9% |
3.58 | 2 | 4.9% |
1.95 | 1 | 2.4% |
5.61 | 1 | 2.4% |
5.46 | 1 | 2.4% |
5.24 | 1 | 2.4% |
24.6 | 1 | 2.4% |
1.66 | 1 | 2.4% |
Other values (21) | 21 |
Value | Count | Frequency (%) |
0.0 | 8 | |
1.2 | 1 | 2.4% |
1.31 | 1 | 2.4% |
1.66 | 1 | 2.4% |
1.7 | 1 | 2.4% |
1.9 | 1 | 2.4% |
1.95 | 1 | 2.4% |
2.17 | 1 | 2.4% |
2.78 | 1 | 2.4% |
2.92 | 1 | 2.4% |
Value | Count | Frequency (%) |
24.6 | 1 | |
16.3 | 1 | |
10.77 | 1 | |
9.9 | 1 | |
8.66 | 1 | |
6.1 | 1 | |
5.61 | 1 | |
5.54 | 1 | |
5.46 | 1 | |
5.41 | 1 |
관측소명 | 설치일자 | 주소 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | 수온값 | 수위 | |
---|---|---|---|---|---|---|---|---|
관측소명 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.958 | 0.938 | 0.931 |
설치일자 | 1.000 | 1.000 | 1.000 | 1.000 | 0.086 | 0.705 | 0.785 | 0.460 |
주소 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.991 | 0.941 | 0.960 |
관리기관명 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.987 | 0.718 | 0.337 |
상부굴착구경(mm) | 0.000 | 0.086 | 0.000 | 0.000 | 1.000 | 0.000 | 0.064 | 0.000 |
하부굴착구경(mm) | 0.958 | 0.705 | 0.991 | 0.987 | 0.000 | 1.000 | 0.660 | 0.274 |
수온값 | 0.938 | 0.785 | 0.941 | 0.718 | 0.064 | 0.660 | 1.000 | 0.590 |
수위 | 0.931 | 0.460 | 0.960 | 0.337 | 0.000 | 0.274 | 0.590 | 1.000 |
상부굴착구경(mm) | 하부굴착구경(mm) | 관리기관명 | 설치일자 | |
---|---|---|---|---|
상부굴착구경(mm) | 1.000 | 0.000 | 0.000 | 0.137 |
하부굴착구경(mm) | 0.000 | 1.000 | 0.899 | 0.938 |
관리기관명 | 0.000 | 0.899 | 1.000 | 0.987 |
설치일자 | 0.137 | 0.938 | 0.987 | 1.000 |
수온값 | 수위 | 설치일자 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | |
---|---|---|---|---|---|---|
수온값 | 1.000 | 0.285 | 0.777 | 0.818 | 0.057 | 0.759 |
수위 | 0.285 | 1.000 | 0.325 | 0.332 | 0.000 | 0.267 |
설치일자 | 0.777 | 0.325 | 1.000 | 0.987 | 0.137 | 0.938 |
관리기관명 | 0.818 | 0.332 | 0.987 | 1.000 | 0.000 | 0.899 |
상부굴착구경(mm) | 0.057 | 0.000 | 0.137 | 0.000 | 1.000 | 0.000 |
하부굴착구경(mm) | 0.759 | 0.267 | 0.938 | 0.899 | 0.000 | 1.000 |
관측소명 | 설치일자 | 주소 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | 수온값 | 수위 | |
---|---|---|---|---|---|---|---|---|
0 | 고흥고흥 | 20211201 | 전라남도 고흥군 고흥읍 고소리 산6-5 | 환경부. 한국수자원공사 | 300 | 200 | 0.0 | 0.0 |
1 | 고흥과역 | 20211201 | 전라남도 고흥군 과역면 신곡리 1117-9 | 환경부. 한국수자원공사 | 300 | 200 | 0.0 | 0.0 |
2 | 고흥남양 | 20211201 | 전라남도 고흥군 남양면 장담리 3056 | 환경부. 한국수자원공사 | 300 | 200 | 0.0 | 0.0 |
3 | 고흥봉래 | 20211201 | 전라남도 고흥군 봉래면 외초리 108-3 | 환경부. 한국수자원공사 | 300 | 200 | 0.0 | 0.0 |
4 | 보성보성 | 20211201 | 전라남도 보성군 보성읍 대야리 산177-10 | 환경부. 한국수자원공사 | 300 | 200 | 0.0 | 0.0 |
5 | 안동남후 | 20211216 | 경상북도 안동시 남후면 광음리 427-1 | 환경부. 한국수자원공사 | 300 | 200 | 12.1 | 1.9 |
6 | 안동도산 | 20211216 | 경상북도 안동시 도산면 단천리 532 | 환경부. 한국수자원공사 | 300 | 200 | 13.3 | 16.3 |
7 | 안동송천 | 20211216 | 경상북도 안동시 송천동 1319-101 | 환경부. 한국수자원공사 | 300 | 200 | 12.4 | 5.0 |
8 | 영양석보 | 20211216 | 경상북도 영양군 석보면 요원리 282-1 | 환경부. 한국수자원공사 | 300 | 200 | 13.9 | 6.1 |
9 | 영양섬촌 | 20211216 | 경상북도 영양군 일월면 섬촌리 1-2 | 환경부. 한국수자원공사 | 300 | 200 | 12.9 | 4.6 |
관측소명 | 설치일자 | 주소 | 관리기관명 | 상부굴착구경(mm) | 하부굴착구경(mm) | 수온값 | 수위 | |
---|---|---|---|---|---|---|---|---|
31 | 해남북일 | 20211201 | 전라남도 해남군 북일면 용일리 1550 | 환경부. 한국수자원공사 | 400 | 300 | 0.0 | 0.0 |
32 | 해남북일 | 20211201 | 전라남도 해남군 북일면 용일리 1550 | 환경부. 한국수자원공사 | 300 | 200 | 0.0 | 0.0 |
33 | 부산송정1 | 20211214 | 부산광역시 강서구 송정동 1456 | 환경부. 한국환경공단 | 300 | 300 | 17.1 | 1.95 |
34 | 부산송정1 | 20211214 | 부산광역시 강서구 송정동 1456 | 환경부. 한국환경공단 | 300 | 300 | 17.3 | 1.66 |
35 | 부산송정2 | 20211214 | 부산광역시 강서구 송정동 1499-2 | 환경부. 한국환경공단 | 300 | 300 | 16.7 | 3.2 |
36 | 부산송정2 | 20211214 | 부산광역시 강서구 송정동 1499-2 | 환경부. 한국환경공단 | 300 | 300 | 17.3 | 3.1 |
37 | 부산송정3 | 20211214 | 부산광역시 강서구 송정동 1718 | 환경부. 한국환경공단 | 300 | 300 | 17.0 | 3.93 |
38 | 부산송정3 | 20211214 | 부산광역시 강서구 송정동 1718 | 환경부. 한국환경공단 | 300 | 300 | 17.4 | 3.53 |
39 | 부산송정4 | 20211214 | 부산광역시 강서구 송정동 1718 | 환경부. 한국환경공단 | 300 | 300 | 17.0 | 3.61 |
40 | 부산송정4 | 20211214 | 부산광역시 강서구 송정동 1718 | 환경부. 한국환경공단 | 300 | 300 | 16.1 | 1.31 |