Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.2 KiB |
Average record size in memory | 43.3 B |
Variable types
Categorical | 1 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=74a55d00-40d8-11eb-bdda-25af7f339cc7 |
Reproduction
Analysis started | 2023-12-10 10:53:45.994318 |
---|---|
Analysis finished | 2023-12-10 10:53:47.892393 |
Duration | 1.9 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도명
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
경기도 | |
---|---|
경상북도 | |
강원도 | |
경상남도 | |
전라남도 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.51 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강원도 |
---|---|
2nd row | 강원도 |
3rd row | 강원도 |
4th row | 강원도 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 31 | |
경상북도 | 23 | |
강원도 | 18 | |
경상남도 | 18 | |
전라남도 | 10 | 10.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
경기도 | 31 | |
경상북도 | 23 | |
강원도 | 18 | |
경상남도 | 18 | |
전라남도 | 10 | 10.0% |
시군명
Text
Distinct | 99 |
---|---|
Distinct (%) | 99.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
고성군 | 2 | 2.0% |
경산시 | 1 | 1.0% |
김해시 | 1 | 1.0% |
영천시 | 1 | 1.0% |
영주시 | 1 | 1.0% |
구미시 | 1 | 1.0% |
안동시 | 1 | 1.0% |
경주시 | 1 | 1.0% |
포항시 | 1 | 1.0% |
김천시 | 1 | 1.0% |
Other values (89) | 89 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 303 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 303 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 303 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
강수량(mm)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 76 |
---|---|
Distinct (%) | 76.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 15.627 |
Minimum | 3 |
---|---|
Maximum | 78.1 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 5.88 |
Q1 | 8.875 |
median | 12.9 |
Q3 | 18.05 |
95-th percentile | 35.44 |
Maximum | 78.1 |
Range | 75.1 |
Interquartile range (IQR) | 9.175 |
Descriptive statistics
Standard deviation | 10.496828 |
---|---|
Coefficient of variation (CV) | 0.67171103 |
Kurtosis | 11.974139 |
Mean | 15.627 |
Median Absolute Deviation (MAD) | 4.55 |
Skewness | 2.7104885 |
Sum | 1562.7 |
Variance | 110.18341 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
9.1 | 4 | 4.0% |
16.3 | 3 | 3.0% |
15.5 | 3 | 3.0% |
17.8 | 3 | 3.0% |
11.1 | 3 | 3.0% |
6.8 | 2 | 2.0% |
14.7 | 2 | 2.0% |
21.3 | 2 | 2.0% |
16.7 | 2 | 2.0% |
11.7 | 2 | 2.0% |
Other values (66) | 74 |
Value | Count | Frequency (%) |
3.0 | 1 | |
4.9 | 1 | |
5.0 | 1 | |
5.1 | 1 | |
5.5 | 1 | |
5.9 | 1 | |
6.4 | 2 | |
6.5 | 1 | |
6.6 | 1 | |
6.8 | 2 |
Value | Count | Frequency (%) |
78.1 | 1 | |
39.7 | 1 | |
37.2 | 1 | |
37.0 | 1 | |
36.2 | 1 | |
35.4 | 1 | |
35.2 | 1 | |
34.5 | 1 | |
33.0 | 1 | |
32.2 | 1 |
평년(mm)
Real number (ℝ)
Distinct | 81 |
---|---|
Distinct (%) | 81.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 26.641 |
Minimum | 16.3 |
---|---|
Maximum | 114.2 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 16.3 |
---|---|
5-th percentile | 18.48 |
Q1 | 20.775 |
median | 23.75 |
Q3 | 29.725 |
95-th percentile | 40.595 |
Maximum | 114.2 |
Range | 97.9 |
Interquartile range (IQR) | 8.95 |
Descriptive statistics
Standard deviation | 11.045216 |
---|---|
Coefficient of variation (CV) | 0.41459463 |
Kurtosis | 39.743861 |
Mean | 26.641 |
Median Absolute Deviation (MAD) | 3.85 |
Skewness | 5.292122 |
Sum | 2664.1 |
Variance | 121.99679 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
30.9 | 3 | 3.0% |
19.4 | 3 | 3.0% |
21.2 | 3 | 3.0% |
20.9 | 2 | 2.0% |
24.5 | 2 | 2.0% |
23.5 | 2 | 2.0% |
22.6 | 2 | 2.0% |
19.9 | 2 | 2.0% |
24.2 | 2 | 2.0% |
22.0 | 2 | 2.0% |
Other values (71) | 77 |
Value | Count | Frequency (%) |
16.3 | 1 | 1.0% |
17.0 | 1 | 1.0% |
17.2 | 1 | 1.0% |
17.8 | 1 | 1.0% |
18.1 | 1 | 1.0% |
18.5 | 1 | 1.0% |
18.9 | 1 | 1.0% |
19.0 | 1 | 1.0% |
19.3 | 1 | 1.0% |
19.4 | 3 |
Value | Count | Frequency (%) |
114.2 | 1 | |
45.6 | 1 | |
45.0 | 1 | |
44.2 | 1 | |
42.4 | 1 | |
40.5 | 1 | |
39.6 | 1 | |
39.3 | 1 | |
38.1 | 1 | |
35.4 | 1 |
부족량
Text
Distinct | 69 |
---|---|
Distinct (%) | 69.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
9 | 9.0% | |
16.8 | 3 | 3.0% |
12.8 | 3 | 3.0% |
13.0 | 3 | 3.0% |
8.2 | 3 | 3.0% |
14.2 | 2 | 2.0% |
12.6 | 2 | 2.0% |
11.1 | 2 | 2.0% |
5.9 | 2 | 2.0% |
3.4 | 2 | 2.0% |
Other values (59) | 69 |
Most occurring characters
Value | Count | Frequency (%) |
. | 91 | |
91 | ||
1 | 62 | |
2 | 30 | 7.0% |
3 | 25 | 5.8% |
8 | 23 | 5.4% |
6 | 21 | 4.9% |
4 | 19 | 4.4% |
9 | 19 | 4.4% |
0 | 16 | 3.7% |
Other values (3) | 31 | 7.2% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 237 | |
Other Punctuation | 91 | 21.3% |
Space Separator | 91 | 21.3% |
Dash Punctuation | 9 | 2.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 62 | |
2 | 30 | |
3 | 25 | |
8 | 23 | 9.7% |
6 | 21 | 8.9% |
4 | 19 | 8.0% |
9 | 19 | 8.0% |
0 | 16 | 6.8% |
7 | 12 | 5.1% |
5 | 10 | 4.2% |
Other Punctuation
Value | Count | Frequency (%) |
. | 91 |
Space Separator
Value | Count | Frequency (%) |
91 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 428 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
. | 91 | |
91 | ||
1 | 62 | |
2 | 30 | 7.0% |
3 | 25 | 5.8% |
8 | 23 | 5.4% |
6 | 21 | 4.9% |
4 | 19 | 4.4% |
9 | 19 | 4.4% |
0 | 16 | 3.7% |
Other values (3) | 31 | 7.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 428 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
. | 91 | |
91 | ||
1 | 62 | |
2 | 30 | 7.0% |
3 | 25 | 5.8% |
8 | 23 | 5.4% |
6 | 21 | 4.9% |
4 | 19 | 4.4% |
9 | 19 | 4.4% |
0 | 16 | 3.7% |
Other values (3) | 31 | 7.2% |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | 부족량 | |
---|---|---|---|---|---|
시도명 | 1.000 | 0.837 | 0.705 | 0.432 | 0.771 |
시군명 | 0.837 | 1.000 | 0.981 | 1.000 | 0.998 |
강수량(mm) | 0.705 | 0.981 | 1.000 | 0.780 | 0.000 |
평년(mm) | 0.432 | 1.000 | 0.780 | 1.000 | 0.500 |
부족량 | 0.771 | 0.998 | 0.000 | 0.500 | 1.000 |
강수량(mm) | 평년(mm) | 시도명 | |
---|---|---|---|
강수량(mm) | 1.000 | 0.342 | 0.567 |
평년(mm) | 0.342 | 1.000 | 0.363 |
시도명 | 0.567 | 0.363 | 1.000 |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | 부족량 | |
---|---|---|---|---|---|
0 | 강원도 | 정선군 | 5.9 | 20.9 | 15.0 |
1 | 강원도 | 평창군 | 11.7 | 28.5 | 16.8 |
2 | 강원도 | 영월군 | 9.1 | 17.0 | 7.9 |
3 | 강원도 | 횡성군 | 12.4 | 20.6 | 8.2 |
4 | 강원도 | 홍천군 | 13.6 | 20.5 | 6.9 |
5 | 강원도 | 삼척시 | 5.1 | 34.5 | 29.4 |
6 | 강원도 | 양양군 | 9.1 | 42.4 | 33.3 |
7 | 강원도 | 고성군 | 9.9 | 26.7 | 16.8 |
8 | 강원도 | 인제군 | 7.2 | 19.4 | 12.2 |
9 | 강원도 | 양구군 | 4.9 | 17.2 | 12.3 |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | 부족량 | |
---|---|---|---|---|---|
90 | 전라남도 | 화순군 | 31.5 | 26.1 | - |
91 | 전라남도 | 장흥군 | 35.2 | 29.1 | - |
92 | 전라남도 | 강진군 | 37.0 | 29.7 | - |
93 | 전라남도 | 해남군 | 35.4 | 32.2 | - |
94 | 전라남도 | 영암군 | 34.5 | 32.2 | - |
95 | 전라남도 | 무안군 | 33.0 | 35.4 | 2.4 |
96 | 전라남도 | 함평군 | 37.2 | 38.1 | 0.9 |
97 | 전라남도 | 영광군 | 36.2 | 39.6 | 3.4 |
98 | 전라남도 | 장성군 | 32.2 | 39.3 | 7.1 |
99 | 전라남도 | 완도군 | 39.7 | 33.5 | - |