Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 322.3 KiB |
Average record size in memory | 33.0 B |
Variable types
Categorical | 1 |
---|---|
Numeric | 1 |
Text | 1 |
Dataset
Description | 건강보험심사평가원 데이터베이스에 구축된 행정구역 코드마스터 정보 |
---|---|
Author | 건강보험심사평가원 |
URL | https://www.data.go.kr/data/15067469/fileData.do |
Reproduction
Analysis started | 2023-12-12 05:19:01.360898 |
---|---|
Analysis finished | 2023-12-12 05:19:02.169090 |
Duration | 0.81 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
코드구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
우편번호 | |
---|---|
지역(시군구)코드 | 44 |
지역(시도)코드 | 1 |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 4.0224 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 우편번호 |
---|---|
2nd row | 우편번호 |
3rd row | 우편번호 |
4th row | 우편번호 |
5th row | 우편번호 |
Common Values
Value | Count | Frequency (%) |
우편번호 | 9955 | |
지역(시군구)코드 | 44 | 0.4% |
지역(시도)코드 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
우편번호 | 9955 | |
지역(시군구)코드 | 44 | 0.4% |
지역(시도)코드 | 1 | < 0.1% |
코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 8483 |
---|---|
Distinct (%) | 84.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 459590.72 |
Minimum | 31 |
---|---|
Maximum | 799812 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 31 |
---|---|
5-th percentile | 134671.9 |
Q1 | 325852.5 |
median | 467852.5 |
Q3 | 616837.25 |
95-th percentile | 750892.45 |
Maximum | 799812 |
Range | 799781 |
Interquartile range (IQR) | 290984.75 |
Descriptive statistics
Standard deviation | 197137.3 |
---|---|
Coefficient of variation (CV) | 0.42894099 |
Kurtosis | -1.0168527 |
Mean | 459590.72 |
Median Absolute Deviation (MAD) | 146951 |
Skewness | -0.24040818 |
Sum | 4.5959072 × 109 |
Variance | 3.8863114 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
138873 | 10 | 0.1% |
482869 | 9 | 0.1% |
209819 | 8 | 0.1% |
430835 | 8 | 0.1% |
601809 | 7 | 0.1% |
701819 | 7 | 0.1% |
250889 | 7 | 0.1% |
487868 | 6 | 0.1% |
482879 | 6 | 0.1% |
138820 | 6 | 0.1% |
Other values (8473) | 9926 |
Value | Count | Frequency (%) |
31 | 1 | |
100051 | 1 | |
100070 | 1 | |
100101 | 1 | |
100130 | 1 | |
100141 | 1 | |
100151 | 1 | |
100260 | 1 | |
100360 | 1 | |
100372 | 1 |
Value | Count | Frequency (%) |
799812 | 1 | |
799811 | 2 | |
799810 | 1 | |
799805 | 1 | |
799803 | 1 | |
799801 | 1 | |
799800 | 1 | |
791948 | 1 | |
791947 | 1 | |
791945 | 2 |
코드명
Text
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 47 |
---|---|
Median length | 42 |
Mean length | 18.2183 |
Min length | 2 |
Characters and Unicode
Total characters | 182183 |
---|---|
Distinct characters | 596 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 10000 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 부산 남구 용호1동 487 |
---|---|
2nd row | 부산 연제구 연산9동 135~150 |
3rd row | 경북 영주시 휴천3동 산12~159 |
4th row | 경북 경주시 산내면 내일2리 |
5th row | 충북 괴산군 괴산읍 서부리 |
Value | Count | Frequency (%) |
경기 | 1597 | 3.8% |
서울 | 1509 | 3.6% |
경북 | 929 | 2.2% |
전남 | 725 | 1.7% |
경남 | 697 | 1.7% |
부산 | 657 | 1.6% |
충남 | 589 | 1.4% |
강원 | 589 | 1.4% |
전북 | 519 | 1.2% |
대구 | 510 | 1.2% |
Other values (11473) | 33347 |
Most occurring characters
Value | Count | Frequency (%) |
31707 | 17.4% | |
동 | 8577 | 4.7% |
1 | 7120 | 3.9% |
구 | 5920 | 3.2% |
시 | 4463 | 2.4% |
리 | 3857 | 2.1% |
0 | 3789 | 2.1% |
2 | 3766 | 2.1% |
경 | 3611 | 2.0% |
~ | 3586 | 2.0% |
Other values (586) | 105787 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 116139 | |
Space Separator | 31707 | 17.4% |
Decimal Number | 27592 | 15.1% |
Math Symbol | 3586 | 2.0% |
Open Punctuation | 1171 | 0.6% |
Close Punctuation | 1171 | 0.6% |
Dash Punctuation | 511 | 0.3% |
Uppercase Letter | 230 | 0.1% |
Other Punctuation | 50 | < 0.1% |
Lowercase Letter | 24 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 8577 | 7.4% |
구 | 5920 | 5.1% |
시 | 4463 | 3.8% |
리 | 3857 | 3.3% |
경 | 3611 | 3.1% |
남 | 3384 | 2.9% |
산 | 3276 | 2.8% |
면 | 2979 | 2.6% |
서 | 2969 | 2.6% |
북 | 2618 | 2.3% |
Other values (541) | 74485 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 32 | |
S | 31 | |
T | 30 | |
A | 22 | |
L | 15 | 6.5% |
G | 13 | 5.7% |
C | 13 | 5.7% |
I | 12 | 5.2% |
B | 12 | 5.2% |
P | 8 | 3.5% |
Other values (12) | 42 |
Decimal Number
Value | Count | Frequency (%) |
1 | 7120 | |
0 | 3789 | |
2 | 3766 | |
3 | 2617 | 9.5% |
4 | 2051 | 7.4% |
5 | 1962 | 7.1% |
6 | 1736 | 6.3% |
9 | 1676 | 6.1% |
7 | 1534 | 5.6% |
8 | 1341 | 4.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 39 | |
, | 9 | 18.0% |
& | 2 | 4.0% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 22 | |
w | 1 | 4.2% |
i | 1 | 4.2% |
Letter Number
Value | Count | Frequency (%) |
Ⅳ | 1 | |
Ⅲ | 1 |
Space Separator
Value | Count | Frequency (%) |
31707 |
Math Symbol
Value | Count | Frequency (%) |
~ | 3586 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1171 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1171 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 511 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 116135 | |
Common | 65788 | |
Latin | 256 | 0.1% |
Han | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 8577 | 7.4% |
구 | 5920 | 5.1% |
시 | 4463 | 3.8% |
리 | 3857 | 3.3% |
경 | 3611 | 3.1% |
남 | 3384 | 2.9% |
산 | 3276 | 2.8% |
면 | 2979 | 2.6% |
서 | 2969 | 2.6% |
북 | 2618 | 2.3% |
Other values (537) | 74481 |
Latin
Value | Count | Frequency (%) |
K | 32 | |
S | 31 | |
T | 30 | |
e | 22 | |
A | 22 | |
L | 15 | 5.9% |
G | 13 | 5.1% |
C | 13 | 5.1% |
I | 12 | 4.7% |
B | 12 | 4.7% |
Other values (17) | 54 |
Common
Value | Count | Frequency (%) |
31707 | ||
1 | 7120 | 10.8% |
0 | 3789 | 5.8% |
2 | 3766 | 5.7% |
~ | 3586 | 5.5% |
3 | 2617 | 4.0% |
4 | 2051 | 3.1% |
5 | 1962 | 3.0% |
6 | 1736 | 2.6% |
9 | 1676 | 2.5% |
Other values (8) | 5778 | 8.8% |
Han
Value | Count | Frequency (%) |
山 | 1 | |
花 | 1 | |
基 | 1 | |
岩 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 116135 | |
ASCII | 66042 | |
CJK | 4 | < 0.1% |
Number Forms | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
31707 | ||
1 | 7120 | 10.8% |
0 | 3789 | 5.7% |
2 | 3766 | 5.7% |
~ | 3586 | 5.4% |
3 | 2617 | 4.0% |
4 | 2051 | 3.1% |
5 | 1962 | 3.0% |
6 | 1736 | 2.6% |
9 | 1676 | 2.5% |
Other values (33) | 6032 | 9.1% |
Hangul
Value | Count | Frequency (%) |
동 | 8577 | 7.4% |
구 | 5920 | 5.1% |
시 | 4463 | 3.8% |
리 | 3857 | 3.3% |
경 | 3611 | 3.1% |
남 | 3384 | 2.9% |
산 | 3276 | 2.8% |
면 | 2979 | 2.6% |
서 | 2969 | 2.6% |
북 | 2618 | 2.3% |
Other values (537) | 74481 |
CJK
Value | Count | Frequency (%) |
山 | 1 | |
花 | 1 | |
基 | 1 | |
岩 | 1 |
Number Forms
Value | Count | Frequency (%) |
Ⅳ | 1 | |
Ⅲ | 1 |
코드구분 | 코드 | |
---|---|---|
코드구분 | 1.000 | 0.816 |
코드 | 0.816 | 1.000 |
코드 | 코드구분 | |
---|---|---|
코드 | 1.000 | 0.714 |
코드구분 | 0.714 | 1.000 |
코드구분 | 코드 | 코드명 | |
---|---|---|---|
38335 | 우편번호 | 608837 | 부산 남구 용호1동 487 |
38741 | 우편번호 | 611812 | 부산 연제구 연산9동 135~150 |
50626 | 우편번호 | 750916 | 경북 영주시 휴천3동 산12~159 |
52507 | 우편번호 | 780882 | 경북 경주시 산내면 내일2리 |
16576 | 우편번호 | 367802 | 충북 괴산군 괴산읍 서부리 |
26336 | 우편번호 | 467831 | 경기 이천시 백사면 신대리 |
42665 | 우편번호 | 656871 | 경남 거제시 둔덕면 거림리 |
21243 | 우편번호 | 422801 | 경기 부천시 소사구 괴안동 80~89 |
35864 | 우편번호 | 579932 | 전북 부안군 백산면 덕신리 |
39299 | 우편번호 | 613809 | 부산 수영구 광안4동 731~769 |
코드구분 | 코드 | 코드명 | |
---|---|---|---|
26003 | 우편번호 | 464808 | 경기 광주시 태전동 1~275 |
3582 | 우편번호 | 135809 | 서울 강남구 개포4동 우성6차아파트 (1~8동) |
32579 | 우편번호 | 539844 | 전남 진도군 임회면 죽림리 |
2047 | 우편번호 | 130829 | 서울 동대문구 이문1동 257 |
40815 | 우편번호 | 626860 | 경남 양산시 하북면 |
2614 | 우편번호 | 132822 | 서울 도봉구 도봉2동 627~641 |
1253 | 우편번호 | 120861 | 서울 서대문구 홍제1동 457~458 |
49868 | 우편번호 | 740979 | 경북 김천시 신음동 1272~1284 |
50508 | 우편번호 | 750871 | 경북 영주시 안정면 용산리 |
35683 | 우편번호 | 576933 | 전북 김제시 황산면 진흥리 |