Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.2 KiB |
Average record size in memory | 43.3 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Numeric | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=74a55d00-40d8-11eb-bdda-25af7f339cc7 |
Reproduction
Analysis started | 2023-12-10 10:53:40.950887 |
---|---|
Analysis finished | 2023-12-10 10:53:42.176508 |
Duration | 1.23 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도명
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
경기도 | |
---|---|
경상북도 | |
강원도 | |
경상남도 | |
전라남도 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.51 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강원도 |
---|---|
2nd row | 강원도 |
3rd row | 강원도 |
4th row | 강원도 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 31 | |
경상북도 | 23 | |
강원도 | 18 | |
경상남도 | 18 | |
전라남도 | 10 | 10.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
경기도 | 31 | |
경상북도 | 23 | |
강원도 | 18 | |
경상남도 | 18 | |
전라남도 | 10 | 10.0% |
시군명
Text
Distinct | 99 |
---|---|
Distinct (%) | 99.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
고성군 | 2 | 2.0% |
경산시 | 1 | 1.0% |
김해시 | 1 | 1.0% |
영천시 | 1 | 1.0% |
영주시 | 1 | 1.0% |
구미시 | 1 | 1.0% |
안동시 | 1 | 1.0% |
경주시 | 1 | 1.0% |
포항시 | 1 | 1.0% |
김천시 | 1 | 1.0% |
Other values (89) | 89 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 303 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 303 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 303 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
강수량(mm)
Real number (ℝ)
Distinct | 87 |
---|---|
Distinct (%) | 87.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 65.962 |
Minimum | 42.8 |
---|---|
Maximum | 104.7 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 42.8 |
---|---|
5-th percentile | 51.795 |
Q1 | 59.325 |
median | 63.7 |
Q3 | 70.525 |
95-th percentile | 85.68 |
Maximum | 104.7 |
Range | 61.9 |
Interquartile range (IQR) | 11.2 |
Descriptive statistics
Standard deviation | 11.009204 |
---|---|
Coefficient of variation (CV) | 0.16690222 |
Kurtosis | 2.5892729 |
Mean | 65.962 |
Median Absolute Deviation (MAD) | 5.2 |
Skewness | 1.2815962 |
Sum | 6596.2 |
Variance | 121.20258 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
60.5 | 6 | 6.0% |
63.7 | 3 | 3.0% |
57.3 | 2 | 2.0% |
67.5 | 2 | 2.0% |
73.4 | 2 | 2.0% |
67.7 | 2 | 2.0% |
59.0 | 2 | 2.0% |
63.1 | 2 | 2.0% |
60.9 | 1 | 1.0% |
54.0 | 1 | 1.0% |
Other values (77) | 77 |
Value | Count | Frequency (%) |
42.8 | 1 | |
47.9 | 1 | |
49.2 | 1 | |
50.8 | 1 | |
51.7 | 1 | |
51.8 | 1 | |
53.1 | 1 | |
53.6 | 1 | |
54.0 | 1 | |
54.1 | 1 |
Value | Count | Frequency (%) |
104.7 | 1 | |
103.0 | 1 | |
99.4 | 1 | |
94.9 | 1 | |
91.0 | 1 | |
85.4 | 1 | |
84.8 | 1 | |
81.6 | 1 | |
81.1 | 1 | |
78.4 | 1 |
평년(mm)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 31.011796 |
Minimum | 17.111271 |
---|---|
Maximum | 77.38 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 17.111271 |
---|---|
5-th percentile | 18.955575 |
Q1 | 21.33445 |
median | 28.444326 |
Q3 | 38.687673 |
95-th percentile | 46.79377 |
Maximum | 77.38 |
Range | 60.268729 |
Interquartile range (IQR) | 17.353223 |
Descriptive statistics
Standard deviation | 11.107351 |
---|---|
Coefficient of variation (CV) | 0.35816536 |
Kurtosis | 2.0266731 |
Mean | 31.011796 |
Median Absolute Deviation (MAD) | 7.6975906 |
Skewness | 1.1750801 |
Sum | 3101.1796 |
Variance | 123.37325 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
25.9497725351256 | 1 | 1.0% |
46.7715373728539 | 1 | 1.0% |
31.0222746548802 | 1 | 1.0% |
30.6564403164712 | 1 | 1.0% |
27.5551936767039 | 1 | 1.0% |
27.2375160657999 | 1 | 1.0% |
24.1277098725656 | 1 | 1.0% |
34.6638531240184 | 1 | 1.0% |
35.7738275381787 | 1 | 1.0% |
31.6612262573872 | 1 | 1.0% |
Other values (90) | 90 |
Value | Count | Frequency (%) |
17.1112709916502 | 1 | |
18.4274914603401 | 1 | |
18.5067512780002 | 1 | |
18.7224466717472 | 1 | |
18.8043366161531 | 1 | |
18.9635351204019 | 1 | |
19.1549877124064 | 1 | |
19.4392697061898 | 1 | |
19.5263532932975 | 1 | |
19.6808224306974 | 1 |
Value | Count | Frequency (%) |
77.38 | 1 | |
60.0842373771975 | 1 | |
59.5805822856357 | 1 | |
51.9266718267235 | 1 | |
47.216182108547 | 1 | |
46.7715373728539 | 1 | |
46.4682584505133 | 1 | |
45.5170123234086 | 1 | |
45.3758706401262 | 1 | |
45.3586577941773 | 1 |
부족량
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
- |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | - |
---|---|
2nd row | - |
3rd row | - |
4th row | - |
5th row | - |
Common Values
Value | Count | Frequency (%) |
- | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
100 |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | |
---|---|---|---|---|
시도명 | 1.000 | 0.837 | 0.530 | 0.700 |
시군명 | 0.837 | 1.000 | 1.000 | 0.955 |
강수량(mm) | 0.530 | 1.000 | 1.000 | 0.667 |
평년(mm) | 0.700 | 0.955 | 0.667 | 1.000 |
강수량(mm) | 평년(mm) | 시도명 | |
---|---|---|---|
강수량(mm) | 1.000 | 0.197 | 0.239 |
평년(mm) | 0.197 | 1.000 | 0.519 |
시도명 | 0.239 | 0.519 | 1.000 |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | 부족량 | |
---|---|---|---|---|---|
0 | 강원도 | 정선군 | 66.7 | 25.949773 | - |
1 | 강원도 | 평창군 | 64.7 | 29.520301 | - |
2 | 강원도 | 영월군 | 66.6 | 20.975397 | - |
3 | 강원도 | 횡성군 | 69.8 | 23.303127 | - |
4 | 강원도 | 홍천군 | 73.4 | 21.499525 | - |
5 | 강원도 | 삼척시 | 60.2 | 35.423412 | - |
6 | 강원도 | 양양군 | 59.5 | 39.459605 | - |
7 | 강원도 | 고성군 | 75.3 | 29.571352 | - |
8 | 강원도 | 인제군 | 61.1 | 20.194997 | - |
9 | 강원도 | 양구군 | 63.7 | 17.111271 | - |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | 부족량 | |
---|---|---|---|---|---|
90 | 전라남도 | 화순군 | 63.7 | 38.59704 | - |
91 | 전라남도 | 장흥군 | 85.4 | 45.517012 | - |
92 | 전라남도 | 강진군 | 81.1 | 45.375871 | - |
93 | 전라남도 | 해남군 | 66.0 | 45.358658 | - |
94 | 전라남도 | 영암군 | 67.3 | 43.914049 | - |
95 | 전라남도 | 무안군 | 58.0 | 41.62559 | - |
96 | 전라남도 | 함평군 | 74.8 | 40.564131 | - |
97 | 전라남도 | 영광군 | 67.7 | 40.546346 | - |
98 | 전라남도 | 장성군 | 73.1 | 43.056502 | - |
99 | 전라남도 | 완도군 | 71.7 | 51.926672 | - |