Dataset statistics
Number of variables | 2 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 486 |
Duplicate rows (%) | 4.9% |
Total size in memory | 244.1 KiB |
Average record size in memory | 25.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 1 |
Dataset
Description | 한국의료기기안전정보원이 제공하는 우편번호 데이터 중 우편 번호 한국의료기기안전정보원이 제공하는 우편번호 데이터 중 주소 |
---|---|
URL | https://www.data.go.kr/data/15070441/fileData.do |
Dataset has 486 (4.9%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-12 17:27:38.684495 |
---|---|
Analysis finished | 2023-12-12 17:27:39.541710 |
Duration | 0.86 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
우편번호
Real number (ℝ)
Distinct | 8182 |
---|---|
Distinct (%) | 81.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 464227.46 |
Minimum | 100012 |
---|---|
Maximum | 799822 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 100012 |
---|---|
5-th percentile | 133777.55 |
Q1 | 314882 |
median | 480081 |
Q3 | 619735.75 |
95-th percentile | 750916 |
Maximum | 799822 |
Range | 699810 |
Interquartile range (IQR) | 304853.75 |
Descriptive statistics
Standard deviation | 200375.88 |
---|---|
Coefficient of variation (CV) | 0.43163298 |
Kurtosis | -1.037123 |
Mean | 464227.46 |
Median Absolute Deviation (MAD) | 148861 |
Skewness | -0.30735118 |
Sum | 4.6422746 × 109 |
Variance | 4.0150493 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
601820 | 10 | 0.1% |
138873 | 9 | 0.1% |
706853 | 7 | 0.1% |
252829 | 7 | 0.1% |
705833 | 7 | 0.1% |
601814 | 7 | 0.1% |
482839 | 6 | 0.1% |
209819 | 6 | 0.1% |
469853 | 6 | 0.1% |
719811 | 6 | 0.1% |
Other values (8172) | 9929 |
Value | Count | Frequency (%) |
100012 | 1 | |
100070 | 1 | |
100080 | 1 | |
100091 | 1 | |
100100 | 1 | |
100102 | 1 | |
100110 | 1 | |
100141 | 1 | |
100192 | 1 | |
100193 | 1 |
Value | Count | Frequency (%) |
799822 | 2 | |
799821 | 2 | |
799820 | 1 | < 0.1% |
799813 | 1 | < 0.1% |
799811 | 1 | < 0.1% |
799810 | 1 | < 0.1% |
799800 | 1 | < 0.1% |
791948 | 2 | |
791945 | 3 | |
791944 | 1 | < 0.1% |
주소
Text
Distinct | 9514 |
---|---|
Distinct (%) | 95.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 46 |
---|---|
Median length | 41 |
Mean length | 20.2759 |
Min length | 10 |
Characters and Unicode
Total characters | 202759 |
---|---|
Distinct characters | 601 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 9028 ? |
---|---|
Unique (%) | 90.3% |
Sample
1st row | 경상남도 창원시 진해구 회현동 |
---|---|
2nd row | 경기도 성남시 중원구 상대원3동 1979~2954 |
3rd row | 서울특별시 은평구 대조동 삼성아파트 |
4th row | 경상북도 구미시 도량동 귀빈맨션 (101~103동) |
5th row | 부산광역시 금정구 구서1동 420~440 |
Value | Count | Frequency (%) |
경기도 | 1722 | 4.1% |
서울특별시 | 1598 | 3.8% |
경상북도 | 960 | 2.3% |
전라남도 | 753 | 1.8% |
부산광역시 | 724 | 1.7% |
경상남도 | 700 | 1.7% |
강원도 | 643 | 1.5% |
전라북도 | 608 | 1.5% |
대구광역시 | 570 | 1.4% |
충청남도 | 439 | 1.1% |
Other values (11021) | 32850 |
Most occurring characters
Value | Count | Frequency (%) |
31604 | 15.6% | |
동 | 8696 | 4.3% |
시 | 8105 | 4.0% |
1 | 7332 | 3.6% |
도 | 6776 | 3.3% |
구 | 6049 | 3.0% |
0 | 3992 | 2.0% |
2 | 3746 | 1.8% |
경 | 3725 | 1.8% |
리 | 3655 | 1.8% |
Other values (591) | 119079 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 135939 | |
Space Separator | 31604 | 15.6% |
Decimal Number | 28396 | 14.0% |
Math Symbol | 3650 | 1.8% |
Close Punctuation | 1135 | 0.6% |
Open Punctuation | 1135 | 0.6% |
Dash Punctuation | 572 | 0.3% |
Uppercase Letter | 234 | 0.1% |
Other Punctuation | 61 | < 0.1% |
Lowercase Letter | 31 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 8696 | 6.4% |
시 | 8105 | 6.0% |
도 | 6776 | 5.0% |
구 | 6049 | 4.4% |
경 | 3725 | 2.7% |
리 | 3655 | 2.7% |
남 | 3228 | 2.4% |
산 | 3198 | 2.4% |
서 | 2995 | 2.2% |
광 | 2981 | 2.2% |
Other values (548) | 86531 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 50 | |
S | 35 | |
T | 33 | |
C | 16 | 6.8% |
L | 15 | 6.4% |
I | 14 | 6.0% |
B | 14 | 6.0% |
G | 12 | 5.1% |
A | 11 | 4.7% |
N | 6 | 2.6% |
Other values (11) | 28 |
Decimal Number
Value | Count | Frequency (%) |
1 | 7332 | |
0 | 3992 | |
2 | 3746 | |
3 | 2714 | 9.6% |
4 | 2037 | 7.2% |
5 | 2028 | 7.1% |
6 | 1813 | 6.4% |
9 | 1775 | 6.3% |
7 | 1558 | 5.5% |
8 | 1401 | 4.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 47 | |
, | 10 | 16.4% |
& | 4 | 6.6% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 29 | |
d | 1 | 3.2% |
a | 1 | 3.2% |
Space Separator
Value | Count | Frequency (%) |
31604 |
Math Symbol
Value | Count | Frequency (%) |
~ | 3650 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1135 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1135 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 572 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 135935 | |
Common | 66553 | |
Latin | 267 | 0.1% |
Han | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 8696 | 6.4% |
시 | 8105 | 6.0% |
도 | 6776 | 5.0% |
구 | 6049 | 4.4% |
경 | 3725 | 2.7% |
리 | 3655 | 2.7% |
남 | 3228 | 2.4% |
산 | 3198 | 2.4% |
서 | 2995 | 2.2% |
광 | 2981 | 2.2% |
Other values (545) | 86527 |
Latin
Value | Count | Frequency (%) |
K | 50 | |
S | 35 | |
T | 33 | |
e | 29 | |
C | 16 | 6.0% |
L | 15 | 5.6% |
I | 14 | 5.2% |
B | 14 | 5.2% |
G | 12 | 4.5% |
A | 11 | 4.1% |
Other values (15) | 38 |
Common
Value | Count | Frequency (%) |
31604 | ||
1 | 7332 | 11.0% |
0 | 3992 | 6.0% |
2 | 3746 | 5.6% |
~ | 3650 | 5.5% |
3 | 2714 | 4.1% |
4 | 2037 | 3.1% |
5 | 2028 | 3.0% |
6 | 1813 | 2.7% |
9 | 1775 | 2.7% |
Other values (8) | 5862 | 8.8% |
Han
Value | Count | Frequency (%) |
山 | 2 | |
花 | 1 | |
華 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 135935 | |
ASCII | 66818 | |
CJK | 4 | < 0.1% |
Number Forms | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
31604 | ||
1 | 7332 | 11.0% |
0 | 3992 | 6.0% |
2 | 3746 | 5.6% |
~ | 3650 | 5.5% |
3 | 2714 | 4.1% |
4 | 2037 | 3.0% |
5 | 2028 | 3.0% |
6 | 1813 | 2.7% |
9 | 1775 | 2.7% |
Other values (32) | 6127 | 9.2% |
Hangul
Value | Count | Frequency (%) |
동 | 8696 | 6.4% |
시 | 8105 | 6.0% |
도 | 6776 | 5.0% |
구 | 6049 | 4.4% |
경 | 3725 | 2.7% |
리 | 3655 | 2.7% |
남 | 3228 | 2.4% |
산 | 3198 | 2.4% |
서 | 2995 | 2.2% |
광 | 2981 | 2.2% |
Other values (545) | 86527 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 2 |
CJK
Value | Count | Frequency (%) |
山 | 2 | |
花 | 1 | |
華 | 1 |
우편번호 | 주소 | |
---|---|---|
19644 | 645130 | 경상남도 창원시 진해구 회현동 |
62184 | 462814 | 경기도 성남시 중원구 상대원3동 1979~2954 |
38991 | 122768 | 서울특별시 은평구 대조동 삼성아파트 |
19050 | 730758 | 경상북도 구미시 도량동 귀빈맨션 (101~103동) |
22568 | 609853 | 부산광역시 금정구 구서1동 420~440 |
72013 | 618820 | 부산광역시 강서구 송정동 1700~1799 |
49370 | 423823 | 경기도 광명시 소하2동 294~420 |
81255 | 606041 | 부산광역시 영도구 영선동1가 |
65047 | 799822 | 경상북도 울릉군 북면 천부4리 |
75085 | 501082 | 광주광역시 동구 계림2동 |
우편번호 | 주소 | |
---|---|---|
74020 | 704941 | 대구광역시 달서구 이곡2동 1270~1335 |
59166 | 425865 | 경기도 안산시 단원구 초지동 605~610 |
58800 | 448525 | 경기도 용인시 수지구 상현1동 상현마을현대2차아이파크아파트 (201~207동) |
56405 | 469863 | 경기도 여주군 강천면 부평리 |
1695 | 269813 | 강원도 철원군 동송읍 양지리 |
38352 | 110609 | 서울특별시 종로구 광화문우체국사서함 900~999 |
45899 | 550766 | 전라남도 여수시 문수동 주공아파트 |
91678 | 122805 | 서울특별시 은평구 갈현1동 292~301 |
96904 | 530768 | 전라남도 목포시 부흥동 우미오션빌아파트 |
69538 | 668852 | 경상남도 남해군 창선면 광천리 |
Most frequently occurring
우편번호 | 주소 | # duplicates | |
---|---|---|---|
0 | 100230 | 서울특별시 중구 수표동 | 2 |
1 | 100282 | 서울특별시 중구 인현동2가 | 2 |
2 | 100683 | 서울특별시 중구 서울중앙우체국사서함 8300~8399 | 2 |
3 | 100703 | 서울특별시 중구 남대문로2가 국민은행본점빌딩 | 2 |
4 | 110150 | 서울특별시 종로구 중학동 | 2 |
5 | 110843 | 서울특별시 종로구 창신2동 688~700 | 2 |
6 | 110873 | 서울특별시 종로구 내수동 경희궁의아침4단지 | 2 |
7 | 120160 | 서울특별시 서대문구 대신동 | 2 |
8 | 121756 | 서울특별시 마포구 동교동 상진빌딩 | 2 |
9 | 121871 | 서울특별시 마포구 염리동 20~50 | 2 |