Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 4934 |
Missing cells | 224 |
Missing cells (%) | 0.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 197.7 KiB |
Average record size in memory | 41.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 3 |
Categorical | 1 |
Dataset
Description | 북한의 행정구역에 관한 내용입니다.(연번,행정구역명,시·도 구분,시·군·구역·지구 구분,구·읍·면·동·리 구분) |
---|---|
Author | 법무부 |
URL | https://www.data.go.kr/data/15042255/fileData.do |
연번 is highly overall correlated with 시·도 구분 | High correlation |
시·도 구분 is highly overall correlated with 연번 | High correlation |
구·읍·면·동·리 구분 has 224 (4.5%) missing values | Missing |
연번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 01:05:31.083219 |
---|---|
Analysis finished | 2023-12-12 01:05:32.065921 |
Duration | 0.98 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 4934 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2467.5 |
Minimum | 1 |
---|---|
Maximum | 4934 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 43.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 247.65 |
Q1 | 1234.25 |
median | 2467.5 |
Q3 | 3700.75 |
95-th percentile | 4687.35 |
Maximum | 4934 |
Range | 4933 |
Interquartile range (IQR) | 2466.5 |
Descriptive statistics
Standard deviation | 1424.4674 |
---|---|
Coefficient of variation (CV) | 0.57729177 |
Kurtosis | -1.2 |
Mean | 2467.5 |
Median Absolute Deviation (MAD) | 1233.5 |
Skewness | 0 |
Sum | 12174645 |
Variance | 2029107.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
3289 | 1 | < 0.1% |
3296 | 1 | < 0.1% |
3295 | 1 | < 0.1% |
3294 | 1 | < 0.1% |
3293 | 1 | < 0.1% |
3292 | 1 | < 0.1% |
3291 | 1 | < 0.1% |
3290 | 1 | < 0.1% |
3288 | 1 | < 0.1% |
Other values (4924) | 4924 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
4934 | 1 | |
4933 | 1 | |
4932 | 1 | |
4931 | 1 | |
4930 | 1 | |
4929 | 1 | |
4928 | 1 | |
4927 | 1 | |
4926 | 1 | |
4925 | 1 |
행정구역명
Text
Distinct | 4929 |
---|---|
Distinct (%) | 99.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 38.7 KiB |
Length
Max length | 27 |
---|---|
Median length | 13 |
Mean length | 13.315363 |
Min length | 4 |
Characters and Unicode
Total characters | 65698 |
---|---|
Distinct characters | 348 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4924 ? |
---|---|
Unique (%) | 99.8% |
Sample
1st row | 강원도 |
---|---|
2nd row | 강원도 고산군 |
3rd row | 강원도 고산군 고산읍 |
4th row | 강원도 고산군 광명리 |
5th row | 강원도 고산군 구령리 |
Value | Count | Frequency (%) |
함경남도 | 702 | 4.8% |
평안북도 | 651 | 4.4% |
평안남도 | 521 | 3.5% |
황해남도 | 497 | 3.4% |
강원도 | 487 | 3.3% |
평양특별시 | 427 | 2.9% |
함경북도 | 419 | 2.8% |
황해북도 | 362 | 2.5% |
자강도 | 353 | 2.4% |
양강도 | 263 | 1.8% |
Other values (3693) | 10035 |
Most occurring characters
Value | Count | Frequency (%) |
14717 | ||
도 | 4364 | 6.6% |
군 | 3363 | 5.1% |
리 | 3276 | 5.0% |
남 | 2135 | 3.2% |
평 | 2014 | 3.1% |
동 | 1876 | 2.9% |
시 | 1787 | 2.7% |
북 | 1562 | 2.4% |
강 | 1451 | 2.2% |
Other values (338) | 29153 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 50918 | |
Space Separator | 14717 | 22.4% |
Open Punctuation | 29 | < 0.1% |
Close Punctuation | 29 | < 0.1% |
Decimal Number | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 4364 | 8.6% |
군 | 3363 | 6.6% |
리 | 3276 | 6.4% |
남 | 2135 | 4.2% |
평 | 2014 | 4.0% |
동 | 1876 | 3.7% |
시 | 1787 | 3.5% |
북 | 1562 | 3.1% |
강 | 1451 | 2.8% |
안 | 1411 | 2.8% |
Other values (332) | 27679 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
0 | 1 | 20.0% |
5 | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
14717 |
Open Punctuation
Value | Count | Frequency (%) |
( | 29 |
Close Punctuation
Value | Count | Frequency (%) |
) | 29 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 50918 | |
Common | 14780 | 22.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 4364 | 8.6% |
군 | 3363 | 6.6% |
리 | 3276 | 6.4% |
남 | 2135 | 4.2% |
평 | 2014 | 4.0% |
동 | 1876 | 3.7% |
시 | 1787 | 3.5% |
북 | 1562 | 3.1% |
강 | 1451 | 2.8% |
안 | 1411 | 2.8% |
Other values (332) | 27679 |
Common
Value | Count | Frequency (%) |
14717 | ||
( | 29 | 0.2% |
) | 29 | 0.2% |
1 | 3 | < 0.1% |
0 | 1 | < 0.1% |
5 | 1 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 50918 | |
ASCII | 14780 | 22.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
14717 | ||
( | 29 | 0.2% |
) | 29 | 0.2% |
1 | 3 | < 0.1% |
0 | 1 | < 0.1% |
5 | 1 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
도 | 4364 | 8.6% |
군 | 3363 | 6.6% |
리 | 3276 | 6.4% |
남 | 2135 | 4.2% |
평 | 2014 | 4.0% |
동 | 1876 | 3.7% |
시 | 1787 | 3.5% |
북 | 1562 | 3.1% |
강 | 1451 | 2.8% |
안 | 1411 | 2.8% |
Other values (332) | 27679 |
시·도 구분
Categorical
HIGH CORRELATION
 
Distinct | 18 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 38.7 KiB |
함경남도 | |
---|---|
평안북도 | |
평안남도 | |
황해남도 | |
강원도 | |
Other values (13) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.3145521 |
Min length | 4 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 강원도 |
---|---|
2nd row | 강원도 |
3rd row | 강원도 |
4th row | 강원도 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
함경남도 | 701 | |
평안북도 | 651 | |
평안남도 | 521 | |
황해남도 | 496 | |
강원도 | 487 | |
평양특별시 | 427 | |
함경북도 | 418 | |
황해북도 | 361 | |
자강도 | 353 | |
양강도 | 263 | 5.3% |
Other values (8) | 256 | 5.2% |
Length
Value | Count | Frequency (%) |
함경남도 | 702 | |
평안북도 | 651 | |
평안남도 | 521 | |
황해남도 | 497 | |
강원도 | 487 | |
평양특별시 | 427 | |
함경북도 | 419 | |
황해북도 | 362 | |
자강도 | 353 | |
양강도 | 263 | 5.3% |
Other values (4) | 252 | 5.1% |
시·군·구역·지구 구분
Text
Distinct | 284 |
---|---|
Distinct (%) | 5.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 38.7 KiB |
Value | Count | Frequency (%) |
청진시 | 117 | 2.3% |
함흥시 | 81 | 1.6% |
단천시 | 79 | 1.6% |
원산시 | 61 | 1.2% |
신의주시 | 59 | 1.2% |
금야군 | 56 | 1.1% |
흥남시 | 50 | 1.0% |
정평군 | 46 | 0.9% |
구성시 | 44 | 0.9% |
북청군 | 43 | 0.8% |
Other values (224) | 4423 |
Most occurring characters
Value | Count | Frequency (%) |
6089 | ||
군 | 3331 | |
시 | 1098 | 5.0% |
천 | 752 | 3.4% |
구 | 750 | 3.4% |
역 | 561 | 2.5% |
산 | 503 | 2.3% |
원 | 393 | 1.8% |
성 | 354 | 1.6% |
주 | 321 | 1.4% |
Other values (139) | 8022 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 16085 | |
Space Separator | 6089 | 27.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 3331 | |
시 | 1098 | 6.8% |
천 | 752 | 4.7% |
구 | 750 | 4.7% |
역 | 561 | 3.5% |
산 | 503 | 3.1% |
원 | 393 | 2.4% |
성 | 354 | 2.2% |
주 | 321 | 2.0% |
강 | 270 | 1.7% |
Other values (138) | 7752 |
Space Separator
Value | Count | Frequency (%) |
6089 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 16085 | |
Common | 6089 | 27.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 3331 | |
시 | 1098 | 6.8% |
천 | 752 | 4.7% |
구 | 750 | 4.7% |
역 | 561 | 3.5% |
산 | 503 | 3.1% |
원 | 393 | 2.4% |
성 | 354 | 2.2% |
주 | 321 | 2.0% |
강 | 270 | 1.7% |
Other values (138) | 7752 |
Common
Value | Count | Frequency (%) |
6089 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 16085 | |
ASCII | 6089 | 27.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6089 |
Hangul
Value | Count | Frequency (%) |
군 | 3331 | |
시 | 1098 | 6.8% |
천 | 752 | 4.7% |
구 | 750 | 4.7% |
역 | 561 | 3.5% |
산 | 503 | 3.1% |
원 | 393 | 2.4% |
성 | 354 | 2.2% |
주 | 321 | 2.0% |
강 | 270 | 1.7% |
Other values (138) | 7752 |
구·읍·면·동·리 구분
Text
MISSING
 
Distinct | 3631 |
---|---|
Distinct (%) | 77.1% |
Missing | 224 |
Missing (%) | 4.5% |
Memory size | 38.7 KiB |
Value | Count | Frequency (%) |
역 | 66 | 1.4% |
구 | 22 | 0.5% |
신흥리 | 19 | 0.4% |
은덕군 | 18 | 0.4% |
역전동 | 17 | 0.4% |
신풍리 | 12 | 0.2% |
신성리 | 12 | 0.2% |
룡산리 | 12 | 0.2% |
오봉리 | 11 | 0.2% |
로동자구 | 11 | 0.2% |
Other values (3466) | 4635 |
Most occurring characters
Value | Count | Frequency (%) |
4334 | ||
리 | 3216 | 16.1% |
동 | 1639 | 8.2% |
구 | 391 | 2.0% |
산 | 358 | 1.8% |
자 | 299 | 1.5% |
로 | 299 | 1.5% |
룡 | 289 | 1.4% |
신 | 275 | 1.4% |
흥 | 243 | 1.2% |
Other values (334) | 8664 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15610 | |
Space Separator | 4334 | 21.7% |
Close Punctuation | 29 | 0.1% |
Open Punctuation | 29 | 0.1% |
Decimal Number | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 3216 | 20.6% |
동 | 1639 | 10.5% |
구 | 391 | 2.5% |
산 | 358 | 2.3% |
자 | 299 | 1.9% |
로 | 299 | 1.9% |
룡 | 289 | 1.9% |
신 | 275 | 1.8% |
흥 | 243 | 1.6% |
성 | 229 | 1.5% |
Other values (328) | 8372 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
0 | 1 | 20.0% |
5 | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
4334 |
Close Punctuation
Value | Count | Frequency (%) |
) | 29 |
Open Punctuation
Value | Count | Frequency (%) |
( | 29 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15610 | |
Common | 4397 | 22.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 3216 | 20.6% |
동 | 1639 | 10.5% |
구 | 391 | 2.5% |
산 | 358 | 2.3% |
자 | 299 | 1.9% |
로 | 299 | 1.9% |
룡 | 289 | 1.9% |
신 | 275 | 1.8% |
흥 | 243 | 1.6% |
성 | 229 | 1.5% |
Other values (328) | 8372 |
Common
Value | Count | Frequency (%) |
4334 | ||
) | 29 | 0.7% |
( | 29 | 0.7% |
1 | 3 | 0.1% |
0 | 1 | < 0.1% |
5 | 1 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 15610 | |
ASCII | 4397 | 22.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4334 | ||
) | 29 | 0.7% |
( | 29 | 0.7% |
1 | 3 | 0.1% |
0 | 1 | < 0.1% |
5 | 1 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
리 | 3216 | 20.6% |
동 | 1639 | 10.5% |
구 | 391 | 2.5% |
산 | 358 | 2.3% |
자 | 299 | 1.9% |
로 | 299 | 1.9% |
룡 | 289 | 1.9% |
신 | 275 | 1.8% |
흥 | 243 | 1.6% |
성 | 229 | 1.5% |
Other values (328) | 8372 |
연번 | 시·도 구분 | |
---|---|---|
연번 | 1.000 | 0.972 |
시·도 구분 | 0.972 | 1.000 |
연번 | 시·도 구분 | |
---|---|---|
연번 | 1.000 | 0.859 |
시·도 구분 | 0.859 | 1.000 |
연번 | 행정구역명 | 시·도 구분 | 시·군·구역·지구 구분 | 구·읍·면·동·리 구분 | |
---|---|---|---|---|---|
0 | 1 | 강원도 | 강원도 | <NA> | |
1 | 2 | 강원도 고산군 | 강원도 | 고산군 | <NA> |
2 | 3 | 강원도 고산군 고산읍 | 강원도 | 고산군 | 고산읍 |
3 | 4 | 강원도 고산군 광명리 | 강원도 | 고산군 | 광명리 |
4 | 5 | 강원도 고산군 구령리 | 강원도 | 고산군 | 구령리 |
5 | 6 | 강원도 고산군 구읍리 | 강원도 | 고산군 | 구읍리 |
6 | 7 | 강원도 고산군 금리 | 강원도 | 고산군 | 금리 |
7 | 8 | 강원도 고산군 금천리 | 강원도 | 고산군 | 금천리 |
8 | 9 | 강원도 고산군 금풍리 | 강원도 | 고산군 | 금풍리 |
9 | 10 | 강원도 고산군 남산리 | 강원도 | 고산군 | 남산리 |
연번 | 행정구역명 | 시·도 구분 | 시·군·구역·지구 구분 | 구·읍·면·동·리 구분 | |
---|---|---|---|---|---|
4924 | 4925 | 황해북도 황주군 장사리 | 황해북도 | 황주군 | 장사리 |
4925 | 4926 | 황해북도 황주군 장천리 | 황해북도 | 황주군 | 장천리 |
4926 | 4927 | 황해북도 황주군 천주리 | 황해북도 | 황주군 | 천주리 |
4927 | 4928 | 황해북도 황주군 철도리 | 황해북도 | 황주군 | 철도리 |
4928 | 4929 | 황해북도 황주군 청룡리 | 황해북도 | 황주군 | 청룡리 |
4929 | 4930 | 황해북도 황주군 청운리 | 황해북도 | 황주군 | 청운리 |
4930 | 4931 | 황해북도 황주군 침촌리 | 황해북도 | 황주군 | 침촌리 |
4931 | 4932 | 황해북도 황주군 포남리 | 황해북도 | 황주군 | 포남리 |
4932 | 4933 | 황해북도 황주군 황주읍 | 황해북도 | 황주군 | 황주읍 |
4933 | 4934 | 황해북도 황주군 흑교리 | 황해북도 | 황주군 | 흑교리 |