Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 6534 |
Missing cells (%) | 10.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 556.6 KiB |
Average record size in memory | 57.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 4 |
Categorical | 1 |
Dataset
Description | 홈페이지 우편번호 데이터 제공을 위한 우편번호 도 시군구 동 상세주소를 제공하기 위하여 데이터화 시켰으며 상세주소를 공공데이터 화하고자함. |
---|---|
Author | 동해시시설관리공단 |
URL | https://www.data.go.kr/data/15075517/fileData.do |
Reproduction
Analysis started | 2023-12-12 22:36:05.973053 |
---|---|
Analysis finished | 2023-12-12 22:36:07.270811 |
Duration | 1.3 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
고유번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 24921.046 |
Minimum | 14 |
---|---|
Maximum | 49699 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 14 |
---|---|
5-th percentile | 2658.8 |
Q1 | 12630.75 |
median | 24939 |
Q3 | 37295.5 |
95-th percentile | 47231.4 |
Maximum | 49699 |
Range | 49685 |
Interquartile range (IQR) | 24664.75 |
Descriptive statistics
Standard deviation | 14288.515 |
---|---|
Coefficient of variation (CV) | 0.57335135 |
Kurtosis | -1.1985577 |
Mean | 24921.046 |
Median Absolute Deviation (MAD) | 12339.5 |
Skewness | 0.0045044353 |
Sum | 2.4921046 × 108 |
Variance | 2.0416167 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
24172 | 1 | < 0.1% |
49353 | 1 | < 0.1% |
24439 | 1 | < 0.1% |
36958 | 1 | < 0.1% |
12326 | 1 | < 0.1% |
19162 | 1 | < 0.1% |
36420 | 1 | < 0.1% |
40294 | 1 | < 0.1% |
34261 | 1 | < 0.1% |
12165 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
14 | 1 | |
20 | 1 | |
26 | 1 | |
37 | 1 | |
49 | 1 | |
52 | 1 | |
55 | 1 | |
61 | 1 | |
65 | 1 | |
67 | 1 |
Value | Count | Frequency (%) |
49699 | 1 | |
49698 | 1 | |
49693 | 1 | |
49691 | 1 | |
49686 | 1 | |
49685 | 1 | |
49680 | 1 | |
49678 | 1 | |
49674 | 1 | |
49667 | 1 |
우편번호
Text
Distinct | 8486 |
---|---|
Distinct (%) | 84.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
138-873 | 9 | 0.1% |
701-819 | 8 | 0.1% |
486-859 | 7 | 0.1% |
476-809 | 7 | 0.1% |
701-813 | 7 | 0.1% |
482-869 | 6 | 0.1% |
138-819 | 6 | 0.1% |
706-808 | 6 | 0.1% |
701-810 | 6 | 0.1% |
702-843 | 5 | < 0.1% |
Other values (8476) | 9933 |
Most occurring characters
Value | Count | Frequency (%) |
- | 10000 | |
0 | 7625 | |
8 | 7507 | |
1 | 7152 | |
3 | 6297 | |
7 | 6288 | |
2 | 5618 | |
6 | 5420 | |
4 | 5392 | |
5 | 5321 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 60000 | |
Dash Punctuation | 10000 | 14.3% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 7625 | |
8 | 7507 | |
1 | 7152 | |
3 | 6297 | |
7 | 6288 | |
2 | 5618 | |
6 | 5420 | |
4 | 5392 | |
5 | 5321 | |
9 | 3380 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 70000 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 10000 | |
0 | 7625 | |
8 | 7507 | |
1 | 7152 | |
3 | 6297 | |
7 | 6288 | |
2 | 5618 | |
6 | 5420 | |
4 | 5392 | |
5 | 5321 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 70000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 10000 | |
0 | 7625 | |
8 | 7507 | |
1 | 7152 | |
3 | 6297 | |
7 | 6288 | |
2 | 5618 | |
6 | 5420 | |
4 | 5392 | |
5 | 5321 |
도
Categorical
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기 | |
---|---|
서울 | |
경북 | |
전남 | |
경남 | |
Other values (11) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경기 |
---|---|
2nd row | 대구 |
3rd row | 충북 |
4th row | 경북 |
5th row | 전북 |
Common Values
Value | Count | Frequency (%) |
경기 | 1593 | |
서울 | 1491 | |
경북 | 989 | |
전남 | 799 | |
경남 | 728 | |
부산 | 670 | |
충남 | 639 | |
강원 | 540 | 5.4% |
전북 | 536 | 5.4% |
대구 | 512 | 5.1% |
Other values (6) | 1503 |
Length
Value | Count | Frequency (%) |
경기 | 1593 | |
서울 | 1491 | |
경북 | 989 | |
전남 | 799 | |
경남 | 728 | |
부산 | 670 | |
충남 | 639 | |
강원 | 540 | 5.4% |
전북 | 536 | 5.4% |
대구 | 512 | 5.1% |
Other values (6) | 1503 |
시군구
Text
Distinct | 225 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
남구 | 322 | 3.0% |
북구 | 286 | 2.6% |
중구 | 251 | 2.3% |
동구 | 230 | 2.1% |
서구 | 221 | 2.0% |
고양시 | 114 | 1.0% |
용인시 | 113 | 1.0% |
전주시 | 111 | 1.0% |
강남구 | 104 | 1.0% |
수성구 | 103 | 0.9% |
Other values (223) | 9043 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 4572 | 13.9% |
시 | 4067 | 12.4% |
군 | 2638 | 8.0% |
주 | 1116 | 3.4% |
산 | 974 | 3.0% |
천 | 900 | 2.7% |
898 | 2.7% | |
성 | 805 | 2.5% |
양 | 784 | 2.4% |
남 | 769 | 2.3% |
Other values (130) | 15285 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31910 | |
Space Separator | 898 | 2.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 4572 | 14.3% |
시 | 4067 | 12.7% |
군 | 2638 | 8.3% |
주 | 1116 | 3.5% |
산 | 974 | 3.1% |
천 | 900 | 2.8% |
성 | 805 | 2.5% |
양 | 784 | 2.5% |
남 | 769 | 2.4% |
동 | 738 | 2.3% |
Other values (129) | 14547 |
Space Separator
Value | Count | Frequency (%) |
898 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31910 | |
Common | 898 | 2.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 4572 | 14.3% |
시 | 4067 | 12.7% |
군 | 2638 | 8.3% |
주 | 1116 | 3.5% |
산 | 974 | 3.1% |
천 | 900 | 2.8% |
성 | 805 | 2.5% |
양 | 784 | 2.5% |
남 | 769 | 2.4% |
동 | 738 | 2.3% |
Other values (129) | 14547 |
Common
Value | Count | Frequency (%) |
898 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31910 | |
ASCII | 898 | 2.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 4572 | 14.3% |
시 | 4067 | 12.7% |
군 | 2638 | 8.3% |
주 | 1116 | 3.5% |
산 | 974 | 3.1% |
천 | 900 | 2.8% |
성 | 805 | 2.5% |
양 | 784 | 2.5% |
남 | 769 | 2.4% |
동 | 738 | 2.3% |
Other values (129) | 14547 |
ASCII
Value | Count | Frequency (%) |
898 |
동
Text
Distinct | 8192 |
---|---|
Distinct (%) | 81.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 27 |
---|---|
Median length | 21 |
Mean length | 6.8186 |
Min length | 2 |
Characters and Unicode
Total characters | 68186 |
---|---|
Distinct characters | 568 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 7302 ? |
---|---|
Unique (%) | 73.0% |
Sample
1st row | 정왕1동 금강아파트 |
---|---|
2nd row | 평리3동 |
3rd row | 호암동 |
4th row | 석적읍 남율리 우방신천지아파트 |
5th row | 쌍치면 도고리 |
Value | Count | Frequency (%) |
사서함 | 78 | 0.5% |
주공아파트 | 75 | 0.5% |
남면 | 44 | 0.3% |
서면 | 43 | 0.3% |
현대아파트 | 42 | 0.3% |
북면 | 29 | 0.2% |
중동 | 26 | 0.2% |
금곡동 | 23 | 0.1% |
동면 | 21 | 0.1% |
서울중앙우체국사서함 | 21 | 0.1% |
Other values (8033) | 15874 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 6309 | 9.3% |
6276 | 9.2% | |
리 | 4018 | 5.9% |
면 | 3269 | 4.8% |
아 | 1633 | 2.4% |
파 | 1513 | 2.2% |
트 | 1495 | 2.2% |
1 | 1380 | 2.0% |
2 | 1323 | 1.9% |
산 | 1176 | 1.7% |
Other values (558) | 39794 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 57494 | |
Space Separator | 6276 | 9.2% |
Decimal Number | 4147 | 6.1% |
Uppercase Letter | 160 | 0.2% |
Open Punctuation | 32 | < 0.1% |
Close Punctuation | 32 | < 0.1% |
Other Punctuation | 27 | < 0.1% |
Dash Punctuation | 9 | < 0.1% |
Lowercase Letter | 8 | < 0.1% |
Letter Number | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 6309 | 11.0% |
리 | 4018 | 7.0% |
면 | 3269 | 5.7% |
아 | 1633 | 2.8% |
파 | 1513 | 2.6% |
트 | 1495 | 2.6% |
산 | 1176 | 2.0% |
읍 | 1028 | 1.8% |
대 | 918 | 1.6% |
성 | 775 | 1.3% |
Other values (518) | 35360 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 30 | |
T | 25 | |
S | 24 | |
G | 19 | |
L | 17 | |
C | 11 | 6.9% |
B | 8 | 5.0% |
I | 7 | 4.4% |
A | 3 | 1.9% |
D | 2 | 1.2% |
Other values (10) | 14 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1380 | |
2 | 1323 | |
3 | 659 | |
4 | 315 | 7.6% |
5 | 167 | 4.0% |
6 | 113 | 2.7% |
7 | 73 | 1.8% |
8 | 54 | 1.3% |
9 | 39 | 0.9% |
0 | 24 | 0.6% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 6 | |
t | 1 | 12.5% |
h | 1 | 12.5% |
Other Punctuation
Value | Count | Frequency (%) |
. | 24 | |
& | 3 | 11.1% |
Space Separator
Value | Count | Frequency (%) |
6276 |
Open Punctuation
Value | Count | Frequency (%) |
( | 32 |
Close Punctuation
Value | Count | Frequency (%) |
) | 32 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 9 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 57494 | |
Common | 10523 | 15.4% |
Latin | 169 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 6309 | 11.0% |
리 | 4018 | 7.0% |
면 | 3269 | 5.7% |
아 | 1633 | 2.8% |
파 | 1513 | 2.6% |
트 | 1495 | 2.6% |
산 | 1176 | 2.0% |
읍 | 1028 | 1.8% |
대 | 918 | 1.6% |
성 | 775 | 1.3% |
Other values (518) | 35360 |
Latin
Value | Count | Frequency (%) |
K | 30 | |
T | 25 | |
S | 24 | |
G | 19 | |
L | 17 | |
C | 11 | 6.5% |
B | 8 | 4.7% |
I | 7 | 4.1% |
e | 6 | 3.6% |
A | 3 | 1.8% |
Other values (14) | 19 |
Common
Value | Count | Frequency (%) |
6276 | ||
1 | 1380 | 13.1% |
2 | 1323 | 12.6% |
3 | 659 | 6.3% |
4 | 315 | 3.0% |
5 | 167 | 1.6% |
6 | 113 | 1.1% |
7 | 73 | 0.7% |
8 | 54 | 0.5% |
9 | 39 | 0.4% |
Other values (6) | 124 | 1.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 57494 | |
ASCII | 10691 | 15.7% |
Number Forms | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 6309 | 11.0% |
리 | 4018 | 7.0% |
면 | 3269 | 5.7% |
아 | 1633 | 2.8% |
파 | 1513 | 2.6% |
트 | 1495 | 2.6% |
산 | 1176 | 2.0% |
읍 | 1028 | 1.8% |
대 | 918 | 1.6% |
성 | 775 | 1.3% |
Other values (518) | 35360 |
ASCII
Value | Count | Frequency (%) |
6276 | ||
1 | 1380 | 12.9% |
2 | 1323 | 12.4% |
3 | 659 | 6.2% |
4 | 315 | 2.9% |
5 | 167 | 1.6% |
6 | 113 | 1.1% |
7 | 73 | 0.7% |
8 | 54 | 0.5% |
9 | 39 | 0.4% |
Other values (29) | 292 | 2.7% |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 |
상세주소
Text
MISSING
 
Distinct | 2910 |
---|---|
Distinct (%) | 84.0% |
Missing | 6534 |
Missing (%) | 65.3% |
Memory size | 156.2 KiB |
Length
Max length | 15 |
---|---|
Median length | 14 |
Mean length | 7.3098673 |
Min length | 1 |
Characters and Unicode
Total characters | 25336 |
---|---|
Distinct characters | 28 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 2701 ? |
---|---|
Unique (%) | 77.9% |
Sample
1st row | 679∼687 |
---|---|
2nd row | (101∼206동) |
3rd row | 601∼1900 |
4th row | (51∼53동) |
5th row | (201∼304동) |
Value | Count | Frequency (%) |
101∼106동 | 28 | 0.8% |
101∼108동 | 28 | 0.8% |
101∼107동 | 25 | 0.7% |
101∼105동 | 22 | 0.6% |
101∼103동 | 20 | 0.6% |
101∼104동 | 19 | 0.5% |
101∼110동 | 15 | 0.4% |
101∼109동 | 13 | 0.4% |
101∼111동 | 12 | 0.3% |
101∼113동 | 12 | 0.3% |
Other values (2900) | 3272 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 4497 | |
∼ | 3104 | |
0 | 2924 | |
2 | 1854 | |
3 | 1741 | 6.9% |
5 | 1539 | 6.1% |
4 | 1504 | 5.9% |
9 | 1475 | 5.8% |
6 | 1399 | 5.5% |
7 | 1277 | 5.0% |
Other values (18) | 4022 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 19353 | |
Math Symbol | 3104 | 12.3% |
Open Punctuation | 910 | 3.6% |
Close Punctuation | 910 | 3.6% |
Other Letter | 854 | 3.4% |
Dash Punctuation | 199 | 0.8% |
Uppercase Letter | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 711 | |
산 | 127 | 14.9% |
가 | 5 | 0.6% |
라 | 3 | 0.4% |
나 | 2 | 0.2% |
다 | 1 | 0.1% |
블 | 1 | 0.1% |
록 | 1 | 0.1% |
구 | 1 | 0.1% |
획 | 1 | 0.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 4497 | |
0 | 2924 | |
2 | 1854 | |
3 | 1741 | 9.0% |
5 | 1539 | 8.0% |
4 | 1504 | 7.8% |
9 | 1475 | 7.6% |
6 | 1399 | 7.2% |
7 | 1277 | 6.6% |
8 | 1143 | 5.9% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 3 | |
A | 2 | |
F | 1 | 16.7% |
Math Symbol
Value | Count | Frequency (%) |
∼ | 3104 |
Open Punctuation
Value | Count | Frequency (%) |
( | 910 |
Close Punctuation
Value | Count | Frequency (%) |
) | 910 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 199 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 24476 | |
Hangul | 854 | 3.4% |
Latin | 6 | < 0.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 4497 | |
∼ | 3104 | |
0 | 2924 | |
2 | 1854 | |
3 | 1741 | 7.1% |
5 | 1539 | 6.3% |
4 | 1504 | 6.1% |
9 | 1475 | 6.0% |
6 | 1399 | 5.7% |
7 | 1277 | 5.2% |
Other values (4) | 3162 |
Hangul
Value | Count | Frequency (%) |
동 | 711 | |
산 | 127 | 14.9% |
가 | 5 | 0.6% |
라 | 3 | 0.4% |
나 | 2 | 0.2% |
다 | 1 | 0.1% |
블 | 1 | 0.1% |
록 | 1 | 0.1% |
구 | 1 | 0.1% |
획 | 1 | 0.1% |
Latin
Value | Count | Frequency (%) |
B | 3 | |
A | 2 | |
F | 1 | 16.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 21378 | |
Math Operators | 3104 | 12.3% |
Hangul | 854 | 3.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 4497 | |
0 | 2924 | |
2 | 1854 | |
3 | 1741 | 8.1% |
5 | 1539 | 7.2% |
4 | 1504 | 7.0% |
9 | 1475 | 6.9% |
6 | 1399 | 6.5% |
7 | 1277 | 6.0% |
8 | 1143 | 5.3% |
Other values (6) | 2025 |
Math Operators
Value | Count | Frequency (%) |
∼ | 3104 |
Hangul
Value | Count | Frequency (%) |
동 | 711 | |
산 | 127 | 14.9% |
가 | 5 | 0.6% |
라 | 3 | 0.4% |
나 | 2 | 0.2% |
다 | 1 | 0.1% |
블 | 1 | 0.1% |
록 | 1 | 0.1% |
구 | 1 | 0.1% |
획 | 1 | 0.1% |
고유번호 | 도 | |
---|---|---|
고유번호 | 1.000 | 0.953 |
도 | 0.953 | 1.000 |
고유번호 | 도 | |
---|---|---|
고유번호 | 1.000 | 0.797 |
도 | 0.797 | 1.000 |
고유번호 | 우편번호 | 도 | 시군구 | 동 | 상세주소 | |
---|---|---|---|---|---|---|
24171 | 24172 | 429-744 | 경기 | 시흥시 | 정왕1동 금강아파트 | <NA> |
12565 | 12566 | 703-840 | 대구 | 서구 | 평리3동 | 679∼687 |
48084 | 48085 | 380-130 | 충북 | 충주시 | 호암동 | <NA> |
36984 | 36985 | 718-702 | 경북 | 칠곡군 | 석적읍 남율리 우방신천지아파트 | (101∼206동) |
43286 | 43287 | 595-891 | 전북 | 순창군 | 쌍치면 도고리 | <NA> |
27109 | 27110 | 450-722 | 경기 | 평택시 | 비전1동 은행아파트 | <NA> |
45228 | 45229 | 336-768 | 충남 | 아산시 | 풍기동 주은아파트 | <NA> |
48328 | 48329 | 367-883 | 충북 | 괴산군 | 연풍면 율전리 | <NA> |
6522 | 6523 | 122-753 | 서울 | 은평구 | 불광1동 대한생명빌딩 | <NA> |
6836 | 6837 | 110-786 | 서울 | 종로구 | 신문로1가 흥국생명빌딩 | <NA> |
고유번호 | 우편번호 | 도 | 시군구 | 동 | 상세주소 | |
---|---|---|---|---|---|---|
14623 | 14624 | 406-715 | 인천 | 연수구 | 옥련동 서해아파트 | <NA> |
8653 | 8654 | 607-782 | 부산 | 동래구 | 온천3동 반도보라스카이뷰오피스텔 | <NA> |
47692 | 47693 | 360-823 | 충북 | 청주시 상당구 | 용암1동 | 1100∼1599 |
4077 | 4078 | 121-887 | 서울 | 마포구 | 합정동 | 430∼445 |
19505 | 19506 | 215-811 | 강원 | 양양군 | 서면 영덕리 | <NA> |
15257 | 15258 | 503-207 | 광주 | 남구 | 석정동 | <NA> |
25337 | 25338 | 487-809 | 경기 | 양주시 | 봉양동 사서함 | 118-(34∼38) |
1398 | 1399 | 157-905 | 서울 | 강서구 | 화곡2동 | 861∼870 |
18766 | 18767 | 220-802 | 강원 | 원주시 | 문막읍 동화12리 | <NA> |
18563 | 18564 | 220-933 | 강원 | 원주시 | 관설동 | 산1 |