Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.6 KiB |
Average record size in memory | 26.3 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 1 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국수자원공사 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=bc3aa060-38bb-11ea-be28-4fa0eb812a46 |
Reproduction
Analysis started | 2023-12-10 13:11:42.868576 |
---|---|
Analysis finished | 2023-12-10 13:11:43.446733 |
Duration | 0.58 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
행정동 코드
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.765232 × 109 |
Minimum | 1.100101 × 109 |
---|---|
Maximum | 3.5101 × 109 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1.100101 × 109 |
---|---|
5-th percentile | 1.100601 × 109 |
Q1 | 2.220375 × 109 |
median | 3.21025 × 109 |
Q3 | 3.320525 × 109 |
95-th percentile | 3.421105 × 109 |
Maximum | 3.5101 × 109 |
Range | 2.409999 × 109 |
Interquartile range (IQR) | 1.10015 × 109 |
Descriptive statistics
Standard deviation | 8.6470842 × 108 |
---|---|
Coefficient of variation (CV) | 0.31270737 |
Kurtosis | -0.1711789 |
Mean | 2.765232 × 109 |
Median Absolute Deviation (MAD) | 1.105 × 108 |
Skewness | -1.2514618 |
Sum | 2.765232 × 1011 |
Variance | 7.4772065 × 1017 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1100101000 | 1 | 1.0% |
3221300000 | 1 | 1.0% |
3320500000 | 1 | 1.0% |
3320400000 | 1 | 1.0% |
3320300000 | 1 | 1.0% |
3320200000 | 1 | 1.0% |
3320100000 | 1 | 1.0% |
3310100000 | 1 | 1.0% |
3240100000 | 1 | 1.0% |
3230100000 | 1 | 1.0% |
Other values (90) | 90 |
Value | Count | Frequency (%) |
1100101000 | 1 | |
1100202000 | 1 | |
1100303000 | 1 | |
1100404000 | 1 | |
1100505000 | 1 | |
1100606000 | 1 | |
1100707000 | 1 | |
1100808000 | 1 | |
1100909000 | 1 | |
1101010000 | 1 |
Value | Count | Frequency (%) |
3510100000 | 1 | |
3421500000 | 1 | |
3421400000 | 1 | |
3421300000 | 1 | |
3421200000 | 1 | |
3421100000 | 1 | |
3421000000 | 1 | |
3420900000 | 1 | |
3420800000 | 1 | |
3420700000 | 1 |
시도명
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 8.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
함경북도 | |
---|---|
함경남도 | |
평양직할시 | |
자강도 | |
양강도 | |
Other values (3) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.97 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 2.0% |
Sample
1st row | 평양직할시 |
---|---|
2nd row | 평양직할시 |
3rd row | 평양직할시 |
4th row | 평양직할시 |
5th row | 평양직할시 |
Common Values
Value | Count | Frequency (%) |
함경북도 | 21 | |
함경남도 | 21 | |
평양직할시 | 19 | |
자강도 | 18 | |
양강도 | 12 | |
남포특별시 | 7 | 7.0% |
나선특별시 | 1 | 1.0% |
평안북도 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
함경북도 | 21 | |
함경남도 | 21 | |
평양직할시 | 19 | |
자강도 | 18 | |
양강도 | 12 | |
남포특별시 | 7 | 7.0% |
나선특별시 | 1 | 1.0% |
평안북도 | 1 | 1.0% |
시군구명
Text
UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
대동강구역 | 1 | 1.0% |
장진군 | 1 | 1.0% |
김형직군 | 1 | 1.0% |
김형권군 | 1 | 1.0% |
김정숙군 | 1 | 1.0% |
갑산군 | 1 | 1.0% |
혜산시 | 1 | 1.0% |
금호지구 | 1 | 1.0% |
수동구 | 1 | 1.0% |
홍원군 | 1 | 1.0% |
Other values (90) | 90 |
Most occurring characters
Value | Count | Frequency (%) |
군 | 59 | 17.2% |
구 | 30 | 8.7% |
역 | 28 | 8.2% |
시 | 14 | 4.1% |
천 | 9 | 2.6% |
성 | 8 | 2.3% |
강 | 8 | 2.3% |
원 | 8 | 2.3% |
대 | 7 | 2.0% |
동 | 6 | 1.7% |
Other values (91) | 166 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 343 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 59 | 17.2% |
구 | 30 | 8.7% |
역 | 28 | 8.2% |
시 | 14 | 4.1% |
천 | 9 | 2.6% |
성 | 8 | 2.3% |
강 | 8 | 2.3% |
원 | 8 | 2.3% |
대 | 7 | 2.0% |
동 | 6 | 1.7% |
Other values (91) | 166 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 343 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 59 | 17.2% |
구 | 30 | 8.7% |
역 | 28 | 8.2% |
시 | 14 | 4.1% |
천 | 9 | 2.6% |
성 | 8 | 2.3% |
강 | 8 | 2.3% |
원 | 8 | 2.3% |
대 | 7 | 2.0% |
동 | 6 | 1.7% |
Other values (91) | 166 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 343 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
군 | 59 | 17.2% |
구 | 30 | 8.7% |
역 | 28 | 8.2% |
시 | 14 | 4.1% |
천 | 9 | 2.6% |
성 | 8 | 2.3% |
강 | 8 | 2.3% |
원 | 8 | 2.3% |
대 | 7 | 2.0% |
동 | 6 | 1.7% |
Other values (91) | 166 |
행정동 코드 | 시도명 | 시군구명 | |
---|---|---|---|
행정동 코드 | 1.000 | 1.000 | 1.000 |
시도명 | 1.000 | 1.000 | 1.000 |
시군구명 | 1.000 | 1.000 | 1.000 |
행정동 코드 | 시도명 | |
---|---|---|
행정동 코드 | 1.000 | 0.979 |
시도명 | 0.979 | 1.000 |
행정동 코드 | 시도명 | 시군구명 | |
---|---|---|---|
0 | 1100101000 | 평양직할시 | 대동강구역 |
1 | 1100202000 | 평양직할시 | 대성구역 |
2 | 1100303000 | 평양직할시 | 동대원구역 |
3 | 1100404000 | 평양직할시 | 낙랑구역 |
4 | 1100505000 | 평양직할시 | 역포구역 |
5 | 1100606000 | 평양직할시 | 용성구역 |
6 | 1100707000 | 평양직할시 | 만경대구역 |
7 | 1100808000 | 평양직할시 | 모란봉구역 |
8 | 1100909000 | 평양직할시 | 보통강구역 |
9 | 1101010000 | 평양직할시 | 사동구역 |
행정동 코드 | 시도명 | 시군구명 | |
---|---|---|---|
90 | 3420700000 | 자강도 | 시중군 |
91 | 3420800000 | 자강도 | 우시군 |
92 | 3420900000 | 자강도 | 위원군 |
93 | 3421000000 | 자강도 | 자성군 |
94 | 3421100000 | 자강도 | 장강군 |
95 | 3421200000 | 자강도 | 전천군 |
96 | 3421300000 | 자강도 | 중강군 |
97 | 3421400000 | 자강도 | 초산군 |
98 | 3421500000 | 자강도 | 화평군 |
99 | 3510100000 | 평안북도 | 신의주시 |