Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 6 |
Duplicate rows (%) | 6.0% |
Total size in memory | 5.9 KiB |
Average record size in memory | 60.3 B |
Variable types
Categorical | 5 |
---|---|
Numeric | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=5f955e00-1f19-11eb-8f72-932712f5aa3c |
년도 has constant value "" | Constant |
시점 has constant value "" | Constant |
Dataset has 6 (6.0%) duplicate rows | Duplicates |
행정구역(시도).1 is highly overall correlated with 행정구역(시도) | High correlation |
행정구역(시도) is highly overall correlated with 행정구역(시도).1 | High correlation |
음용 is highly overall correlated with 비음용 | High correlation |
비음용 is highly overall correlated with 음용 | High correlation |
행정구역(시도) is highly imbalanced (70.1%) | Imbalance |
행정구역(시도).1 is highly imbalanced (70.1%) | Imbalance |
음용 has 55 (55.0%) zeros | Zeros |
비음용 has 20 (20.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 10:56:06.108418 |
---|---|
Analysis finished | 2023-12-10 10:56:07.889014 |
Duration | 1.78 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
년도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
2017 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2017 |
---|---|
2nd row | 2017 |
3rd row | 2017 |
4th row | 2017 |
5th row | 2017 |
Common Values
Value | Count | Frequency (%) |
2017 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2017 | 100 |
시점
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
전반기 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전반기 |
---|---|
2nd row | 전반기 |
3rd row | 전반기 |
4th row | 전반기 |
5th row | 전반기 |
Common Values
Value | Count | Frequency (%) |
전반기 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
전반기 | 100 |
행정구역(시도)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 16 |
---|---|
Distinct (%) | 16.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
전체 | |
---|---|
종로구 | 1 |
중구 | 1 |
용산구 | 1 |
성동구 | 1 |
Other values (11) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.16 |
Min length | 2 |
Unique
Unique | 15 ? |
---|---|
Unique (%) | 15.0% |
Sample
1st row | 전체 |
---|---|
2nd row | 전체 |
3rd row | 전체 |
4th row | 전체 |
5th row | 전체 |
Common Values
Value | Count | Frequency (%) |
전체 | 85 | |
종로구 | 1 | 1.0% |
중구 | 1 | 1.0% |
용산구 | 1 | 1.0% |
성동구 | 1 | 1.0% |
광진구 | 1 | 1.0% |
동대문구 | 1 | 1.0% |
중랑구 | 1 | 1.0% |
성북구 | 1 | 1.0% |
강북구 | 1 | 1.0% |
Other values (6) | 6 | 6.0% |
Length
Value | Count | Frequency (%) |
전체 | 85 | |
종로구 | 1 | 1.0% |
중구 | 1 | 1.0% |
용산구 | 1 | 1.0% |
성동구 | 1 | 1.0% |
광진구 | 1 | 1.0% |
동대문구 | 1 | 1.0% |
중랑구 | 1 | 1.0% |
성북구 | 1 | 1.0% |
강북구 | 1 | 1.0% |
Other values (6) | 6 | 6.0% |
행정구역(시도).1
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 16 |
---|---|
Distinct (%) | 16.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
전체 | |
---|---|
종로구 | 1 |
중구 | 1 |
용산구 | 1 |
성동구 | 1 |
Other values (11) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.16 |
Min length | 2 |
Unique
Unique | 15 ? |
---|---|
Unique (%) | 15.0% |
Sample
1st row | 전체 |
---|---|
2nd row | 전체 |
3rd row | 전체 |
4th row | 전체 |
5th row | 전체 |
Common Values
Value | Count | Frequency (%) |
전체 | 85 | |
종로구 | 1 | 1.0% |
중구 | 1 | 1.0% |
용산구 | 1 | 1.0% |
성동구 | 1 | 1.0% |
광진구 | 1 | 1.0% |
동대문구 | 1 | 1.0% |
중랑구 | 1 | 1.0% |
성북구 | 1 | 1.0% |
강북구 | 1 | 1.0% |
Other values (6) | 6 | 6.0% |
Length
Value | Count | Frequency (%) |
전체 | 85 | |
종로구 | 1 | 1.0% |
중구 | 1 | 1.0% |
용산구 | 1 | 1.0% |
성동구 | 1 | 1.0% |
광진구 | 1 | 1.0% |
동대문구 | 1 | 1.0% |
중랑구 | 1 | 1.0% |
성북구 | 1 | 1.0% |
강북구 | 1 | 1.0% |
Other values (6) | 6 | 6.0% |
구분
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
전체 | |
---|---|
생활 | |
공업 | |
농업 | |
기타 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전체 |
---|---|
2nd row | 전체 |
3rd row | 전체 |
4th row | 전체 |
5th row | 전체 |
Common Values
Value | Count | Frequency (%) |
전체 | 32 | |
생활 | 17 | |
공업 | 17 | |
농업 | 17 | |
기타 | 17 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
전체 | 32 | |
생활 | 17 | |
공업 | 17 | |
농업 | 17 | |
기타 | 17 |
음용
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 22 |
---|---|
Distinct (%) | 22.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.32 |
Minimum | 0 |
---|---|
Maximum | 102 |
Zeros | 55 |
Zeros (%) | 55.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 19 |
95-th percentile | 62.35 |
Maximum | 102 |
Range | 102 |
Interquartile range (IQR) | 19 |
Descriptive statistics
Standard deviation | 24.907863 |
---|---|
Coefficient of variation (CV) | 1.7393759 |
Kurtosis | 2.9215576 |
Mean | 14.32 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.8853039 |
Sum | 1432 |
Variance | 620.40162 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 55 | |
1 | 5 | 5.0% |
4 | 4 | 4.0% |
54 | 4 | 4.0% |
18 | 3 | 3.0% |
19 | 3 | 3.0% |
3 | 2 | 2.0% |
33 | 2 | 2.0% |
88 | 2 | 2.0% |
38 | 2 | 2.0% |
Other values (12) | 18 | 18.0% |
Value | Count | Frequency (%) |
0 | 55 | |
1 | 5 | 5.0% |
2 | 2 | 2.0% |
3 | 2 | 2.0% |
4 | 4 | 4.0% |
9 | 2 | 2.0% |
18 | 3 | 3.0% |
19 | 3 | 3.0% |
20 | 2 | 2.0% |
30 | 2 | 2.0% |
Value | Count | Frequency (%) |
102 | 2 | |
88 | 2 | |
69 | 1 | 1.0% |
62 | 1 | 1.0% |
56 | 1 | 1.0% |
55 | 1 | 1.0% |
54 | 4 | |
50 | 1 | 1.0% |
48 | 1 | 1.0% |
47 | 2 |
비음용
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 47 |
---|---|
Distinct (%) | 47.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 27.01 |
Minimum | 0 |
---|---|
Maximum | 167 |
Zeros | 20 |
Zeros (%) | 20.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1.75 |
median | 8 |
Q3 | 38 |
95-th percentile | 114.05 |
Maximum | 167 |
Range | 167 |
Interquartile range (IQR) | 36.25 |
Descriptive statistics
Standard deviation | 38.220386 |
---|---|
Coefficient of variation (CV) | 1.4150457 |
Kurtosis | 2.4176839 |
Mean | 27.01 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 1.7478941 |
Sum | 2701 |
Variance | 1460.7979 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 20 | |
4 | 10 | 10.0% |
1 | 5 | 5.0% |
7 | 5 | 5.0% |
10 | 4 | 4.0% |
8 | 4 | 4.0% |
3 | 4 | 4.0% |
75 | 2 | 2.0% |
28 | 2 | 2.0% |
11 | 2 | 2.0% |
Other values (37) | 42 |
Value | Count | Frequency (%) |
0 | 20 | |
1 | 5 | 5.0% |
2 | 1 | 1.0% |
3 | 4 | 4.0% |
4 | 10 | |
5 | 2 | 2.0% |
6 | 2 | 2.0% |
7 | 5 | 5.0% |
8 | 4 | 4.0% |
9 | 1 | 1.0% |
Value | Count | Frequency (%) |
167 | 1 | |
152 | 1 | |
118 | 2 | |
115 | 1 | |
114 | 1 | |
111 | 1 | |
110 | 1 | |
107 | 1 | |
97 | 1 | |
78 | 1 |
행정구역(시도) | 행정구역(시도).1 | 구분 | 음용 | 비음용 | |
---|---|---|---|---|---|
행정구역(시도) | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
행정구역(시도).1 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
구분 | 0.000 | 0.000 | 1.000 | 0.397 | 0.471 |
음용 | 0.000 | 0.000 | 0.397 | 1.000 | 0.872 |
비음용 | 0.000 | 0.000 | 0.471 | 0.872 | 1.000 |
행정구역(시도).1 | 행정구역(시도) | 구분 | |
---|---|---|---|
행정구역(시도).1 | 1.000 | 1.000 | 0.000 |
행정구역(시도) | 1.000 | 1.000 | 0.000 |
구분 | 0.000 | 0.000 | 1.000 |
음용 | 비음용 | 행정구역(시도) | 행정구역(시도).1 | 구분 | |
---|---|---|---|---|---|
음용 | 1.000 | 0.746 | 0.000 | 0.000 | 0.236 |
비음용 | 0.746 | 1.000 | 0.000 | 0.000 | 0.288 |
행정구역(시도) | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
행정구역(시도).1 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
구분 | 0.236 | 0.288 | 0.000 | 0.000 | 1.000 |
년도 | 시점 | 행정구역(시도) | 행정구역(시도).1 | 구분 | 음용 | 비음용 | |
---|---|---|---|---|---|---|---|
0 | 2017 | 전반기 | 전체 | 전체 | 전체 | 47 | 75 |
1 | 2017 | 전반기 | 전체 | 전체 | 전체 | 38 | 152 |
2 | 2017 | 전반기 | 전체 | 전체 | 전체 | 30 | 38 |
3 | 2017 | 전반기 | 전체 | 전체 | 전체 | 9 | 40 |
4 | 2017 | 전반기 | 전체 | 전체 | 전체 | 19 | 30 |
5 | 2017 | 전반기 | 전체 | 전체 | 전체 | 20 | 38 |
6 | 2017 | 전반기 | 전체 | 전체 | 전체 | 4 | 6 |
7 | 2017 | 전반기 | 전체 | 전체 | 전체 | 102 | 167 |
8 | 2017 | 전반기 | 전체 | 전체 | 전체 | 55 | 78 |
9 | 2017 | 전반기 | 전체 | 전체 | 전체 | 54 | 63 |
년도 | 시점 | 행정구역(시도) | 행정구역(시도).1 | 구분 | 음용 | 비음용 | |
---|---|---|---|---|---|---|---|
90 | 2017 | 전반기 | 중랑구 | 중랑구 | 전체 | 0 | 7 |
91 | 2017 | 전반기 | 성북구 | 성북구 | 전체 | 0 | 4 |
92 | 2017 | 전반기 | 강북구 | 강북구 | 전체 | 0 | 4 |
93 | 2017 | 전반기 | 도봉구 | 도봉구 | 전체 | 1 | 3 |
94 | 2017 | 전반기 | 노원구 | 노원구 | 전체 | 4 | 3 |
95 | 2017 | 전반기 | 은평구 | 은평구 | 전체 | 1 | 5 |
96 | 2017 | 전반기 | 서대문구 | 서대문구 | 전체 | 0 | 4 |
97 | 2017 | 전반기 | 마포구 | 마포구 | 전체 | 0 | 8 |
98 | 2017 | 전반기 | 양천구 | 양천구 | 전체 | 3 | 1 |
99 | 2017 | 전반기 | 전체 | 전체 | 전체 | 18 | 118 |
Most frequently occurring
년도 | 시점 | 행정구역(시도) | 행정구역(시도).1 | 구분 | 음용 | 비음용 | # duplicates | |
---|---|---|---|---|---|---|---|---|
2 | 2017 | 전반기 | 전체 | 전체 | 기타 | 0 | 0 | 17 |
4 | 2017 | 전반기 | 전체 | 전체 | 농업 | 0 | 1 | 4 |
0 | 2017 | 전반기 | 전체 | 전체 | 공업 | 0 | 7 | 2 |
1 | 2017 | 전반기 | 전체 | 전체 | 공업 | 0 | 10 | 2 |
3 | 2017 | 전반기 | 전체 | 전체 | 농업 | 0 | 0 | 2 |
5 | 2017 | 전반기 | 전체 | 전체 | 농업 | 0 | 10 | 2 |