Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.2 KiB |
Average record size in memory | 43.3 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Numeric | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=74a55d00-40d8-11eb-bdda-25af7f339cc7 |
Reproduction
Analysis started | 2024-04-17 13:04:35.123895 |
---|---|
Analysis finished | 2024-04-17 13:04:35.641074 |
Duration | 0.52 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도명
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
경기도 | |
---|---|
경상북도 | |
강원도 | |
경상남도 | |
전라남도 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.51 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강원도 |
---|---|
2nd row | 강원도 |
3rd row | 강원도 |
4th row | 강원도 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 31 | |
경상북도 | 23 | |
강원도 | 18 | |
경상남도 | 18 | |
전라남도 | 10 | 10.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
경기도 | 31 | |
경상북도 | 23 | |
강원도 | 18 | |
경상남도 | 18 | |
전라남도 | 10 | 10.0% |
시군명
Text
Distinct | 99 |
---|---|
Distinct (%) | 99.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
고성군 | 2 | 2.0% |
경산시 | 1 | 1.0% |
김해시 | 1 | 1.0% |
영천시 | 1 | 1.0% |
영주시 | 1 | 1.0% |
구미시 | 1 | 1.0% |
안동시 | 1 | 1.0% |
경주시 | 1 | 1.0% |
포항시 | 1 | 1.0% |
김천시 | 1 | 1.0% |
Other values (89) | 89 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 303 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 303 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 303 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 54 | |
군 | 49 | 16.2% |
천 | 14 | 4.6% |
양 | 12 | 4.0% |
주 | 11 | 3.6% |
성 | 9 | 3.0% |
영 | 8 | 2.6% |
안 | 6 | 2.0% |
산 | 5 | 1.7% |
남 | 5 | 1.7% |
Other values (75) | 130 |
강수량(mm)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 93 |
---|---|
Distinct (%) | 93.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 105.872 |
Minimum | 52.4 |
---|---|
Maximum | 180.2 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 52.4 |
---|---|
5-th percentile | 79.13 |
Q1 | 93.6 |
median | 100.2 |
Q3 | 111.225 |
95-th percentile | 153.64 |
Maximum | 180.2 |
Range | 127.8 |
Interquartile range (IQR) | 17.625 |
Descriptive statistics
Standard deviation | 21.74233 |
---|---|
Coefficient of variation (CV) | 0.20536431 |
Kurtosis | 1.6506497 |
Mean | 105.872 |
Median Absolute Deviation (MAD) | 7.55 |
Skewness | 1.1694069 |
Sum | 10587.2 |
Variance | 472.72891 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
98.9 | 2 | 2.0% |
94.1 | 2 | 2.0% |
101.6 | 2 | 2.0% |
95.6 | 2 | 2.0% |
93.6 | 2 | 2.0% |
90.1 | 2 | 2.0% |
101.3 | 2 | 2.0% |
147.9 | 1 | 1.0% |
101.2 | 1 | 1.0% |
102.2 | 1 | 1.0% |
Other values (83) | 83 |
Value | Count | Frequency (%) |
52.4 | 1 | |
70.7 | 1 | |
71.2 | 1 | |
77.0 | 1 | |
77.8 | 1 | |
79.2 | 1 | |
87.2 | 1 | |
87.3 | 1 | |
87.9 | 1 | |
88.2 | 1 |
Value | Count | Frequency (%) |
180.2 | 1 | |
166.7 | 1 | |
156.4 | 1 | |
154.9 | 1 | |
154.4 | 1 | |
153.6 | 1 | |
150.5 | 1 | |
147.9 | 1 | |
146.8 | 1 | |
146.0 | 1 |
평년(mm)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 48.289423 |
Minimum | 25.774622 |
---|---|
Maximum | 107.66615 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 25.774622 |
---|---|
5-th percentile | 27.316923 |
Q1 | 34.470639 |
median | 45.258741 |
Q3 | 56.611035 |
95-th percentile | 80.641303 |
Maximum | 107.66615 |
Range | 81.891533 |
Interquartile range (IQR) | 22.140396 |
Descriptive statistics
Standard deviation | 18.16408 |
---|---|
Coefficient of variation (CV) | 0.37615029 |
Kurtosis | 1.1850923 |
Mean | 48.289423 |
Median Absolute Deviation (MAD) | 11.044982 |
Skewness | 1.1246035 |
Sum | 4828.9423 |
Variance | 329.93382 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
38.8773618300655 | 1 | 1.0% |
77.8318722952222 | 1 | 1.0% |
49.9306954320286 | 1 | 1.0% |
48.0830420895047 | 1 | 1.0% |
46.6992867134315 | 1 | 1.0% |
44.3657418643781 | 1 | 1.0% |
43.6295528018822 | 1 | 1.0% |
60.1220585798623 | 1 | 1.0% |
54.8354867988857 | 1 | 1.0% |
48.3618515133258 | 1 | 1.0% |
Other values (90) | 90 |
Value | Count | Frequency (%) |
25.774621816353 | 1 | |
25.8344134900118 | 1 | |
26.8101857950199 | 1 | |
27.2210237976548 | 1 | |
27.3128148061475 | 1 | |
27.3171391424834 | 1 | |
27.5164851608996 | 1 | |
27.9557561588718 | 1 | |
28.4133333333333 | 1 | |
28.4786155304235 | 1 |
Value | Count | Frequency (%) |
107.666154484586 | 1 | |
104.610658651183 | 1 | |
100.070041280454 | 1 | |
90.5771118908256 | 1 | |
80.8179209881452 | 1 | |
80.6320077467095 | 1 | |
79.2042491723884 | 1 | |
78.7731579265829 | 1 | |
77.8318722952222 | 1 | |
75.64337508191 | 1 |
부족량
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
- |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | - |
---|---|
2nd row | - |
3rd row | - |
4th row | - |
5th row | - |
Common Values
Value | Count | Frequency (%) |
- | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
100 |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | |
---|---|---|---|---|
시도명 | 1.000 | 0.837 | 0.667 | 0.755 |
시군명 | 0.837 | 1.000 | 0.770 | 0.904 |
강수량(mm) | 0.667 | 0.770 | 1.000 | 0.676 |
평년(mm) | 0.755 | 0.904 | 0.676 | 1.000 |
강수량(mm) | 평년(mm) | 시도명 | |
---|---|---|---|
강수량(mm) | 1.000 | 0.642 | 0.328 |
평년(mm) | 0.642 | 1.000 | 0.553 |
시도명 | 0.328 | 0.553 | 1.000 |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | 부족량 | |
---|---|---|---|---|---|
0 | 강원도 | 정선군 | 101.8 | 38.877362 | - |
1 | 강원도 | 평창군 | 98.4 | 41.870559 | - |
2 | 강원도 | 영월군 | 99.3 | 34.532331 | - |
3 | 강원도 | 횡성군 | 96.0 | 37.423503 | - |
4 | 강원도 | 홍천군 | 100.3 | 34.724629 | - |
5 | 강원도 | 삼척시 | 104.0 | 49.921944 | - |
6 | 강원도 | 양양군 | 94.1 | 49.644382 | - |
7 | 강원도 | 고성군 | 118.2 | 41.977318 | - |
8 | 강원도 | 인제군 | 93.8 | 33.784414 | - |
9 | 강원도 | 양구군 | 88.2 | 25.774622 | - |
시도명 | 시군명 | 강수량(mm) | 평년(mm) | 부족량 | |
---|---|---|---|---|---|
90 | 전라남도 | 화순군 | 117.1 | 59.663592 | - |
91 | 전라남도 | 장흥군 | 166.7 | 79.204249 | - |
92 | 전라남도 | 강진군 | 146.8 | 78.773158 | - |
93 | 전라남도 | 해남군 | 131.4 | 75.643375 | - |
94 | 전라남도 | 영암군 | 126.6 | 63.646736 | - |
95 | 전라남도 | 무안군 | 105.1 | 59.293499 | - |
96 | 전라남도 | 함평군 | 99.6 | 56.375528 | - |
97 | 전라남도 | 영광군 | 96.2 | 55.411035 | - |
98 | 전라남도 | 장성군 | 101.6 | 57.317555 | - |
99 | 전라남도 | 완도군 | 129.2 | 100.070041 | - |