Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 500 |
Missing cells | 153 |
Missing cells (%) | 4.4% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 28.4 KiB |
Average record size in memory | 58.3 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 3 |
Text | 3 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | KB국민은행 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=1 |
Reproduction
Analysis started | 2023-12-10 14:51:16.514600 |
---|---|
Analysis finished | 2023-12-10 14:51:17.365609 |
Duration | 0.85 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
법정동코드
Real number (ℝ)
UNIQUE
 
Distinct | 500 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.3360896 × 109 |
Minimum | 1.1170109 × 109 |
---|---|
Maximum | 5.0130253 × 109 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 1.1170109 × 109 |
---|---|
5-th percentile | 2.7110157 × 109 |
Q1 | 4.223025 × 109 |
median | 4.4827817 × 109 |
Q3 | 4.717039 × 109 |
95-th percentile | 4.8850321 × 109 |
Maximum | 5.0130253 × 109 |
Range | 3.8960144 × 109 |
Interquartile range (IQR) | 4.94014 × 108 |
Descriptive statistics
Standard deviation | 6.799384 × 108 |
---|---|
Coefficient of variation (CV) | 0.15680912 |
Kurtosis | 8.1440326 |
Mean | 4.3360896 × 109 |
Median Absolute Deviation (MAD) | 2.3725085 × 108 |
Skewness | -2.6750845 |
Sum | 2.1680448 × 1012 |
Variance | 4.6231622 × 1017 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4717025021 | 1 | 0.2% |
4420010500 | 1 | 0.2% |
4423036029 | 1 | 0.2% |
4372037023 | 1 | 0.2% |
4575035531 | 1 | 0.2% |
4136025326 | 1 | 0.2% |
4223036026 | 1 | 0.2% |
4514012000 | 1 | 0.2% |
3611034047 | 1 | 0.2% |
4672039027 | 1 | 0.2% |
Other values (490) | 490 |
Value | Count | Frequency (%) |
1117010900 | 1 | |
1117013100 | 1 | |
1123010900 | 1 | |
1141010500 | 1 | |
1141011700 | 1 | |
1144000000 | 1 | |
1147010300 | 1 | |
1156012200 | 1 | |
1159010600 | 1 | |
2614010100 | 1 |
Value | Count | Frequency (%) |
5013025321 | 1 | |
5013012000 | 1 | |
5013000000 | 1 | |
5011025326 | 1 | |
5011012300 | 1 | |
4972025026 | 1 | |
4972025023 | 1 | |
4971025900 | 1 | |
4971025624 | 1 | |
4913011700 | 1 |
시도
Categorical
Distinct | 18 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
경상북도 | |
---|---|
전라남도 | |
경상남도 | |
경기도 | |
충청남도 | |
Other values (13) |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.938 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전라남도 |
---|---|
2nd row | 강원도 |
3rd row | 전라북도 |
4th row | 강원도 |
5th row | 경상남도 |
Common Values
Value | Count | Frequency (%) |
경상북도 | 82 | |
전라남도 | 67 | |
경상남도 | 62 | |
경기도 | 61 | |
충청남도 | 52 | |
강원도 | 40 | |
전라북도 | 37 | |
충청북도 | 35 | |
서울특별시 | 12 | 2.4% |
부산광역시 | 9 | 1.8% |
Other values (8) | 43 |
Length
Value | Count | Frequency (%) |
경상북도 | 82 | |
전라남도 | 67 | |
경상남도 | 62 | |
경기도 | 61 | |
충청남도 | 52 | |
강원도 | 40 | |
전라북도 | 37 | |
충청북도 | 35 | |
서울특별시 | 12 | 2.4% |
부산광역시 | 9 | 1.8% |
Other values (8) | 43 |
구시군
Text
Distinct | 160 |
---|---|
Distinct (%) | 32.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
청주시 | 12 | 2.4% |
중구 | 10 | 2.0% |
포항시 | 10 | 2.0% |
창원시 | 9 | 1.8% |
영천시 | 9 | 1.8% |
상주시 | 8 | 1.6% |
제천시 | 8 | 1.6% |
화성시 | 7 | 1.4% |
경주시 | 7 | 1.4% |
예산군 | 7 | 1.4% |
Other values (150) | 413 |
Most occurring characters
Value | Count | Frequency (%) |
군 | 235 | 15.6% |
시 | 234 | 15.6% |
주 | 78 | 5.2% |
천 | 61 | 4.1% |
산 | 49 | 3.3% |
성 | 48 | 3.2% |
구 | 46 | 3.1% |
영 | 36 | 2.4% |
양 | 32 | 2.1% |
안 | 28 | 1.9% |
Other values (106) | 656 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1503 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 235 | 15.6% |
시 | 234 | 15.6% |
주 | 78 | 5.2% |
천 | 61 | 4.1% |
산 | 49 | 3.3% |
성 | 48 | 3.2% |
구 | 46 | 3.1% |
영 | 36 | 2.4% |
양 | 32 | 2.1% |
안 | 28 | 1.9% |
Other values (106) | 656 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1503 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 235 | 15.6% |
시 | 234 | 15.6% |
주 | 78 | 5.2% |
천 | 61 | 4.1% |
산 | 49 | 3.3% |
성 | 48 | 3.2% |
구 | 46 | 3.1% |
영 | 36 | 2.4% |
양 | 32 | 2.1% |
안 | 28 | 1.9% |
Other values (106) | 656 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1503 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
군 | 235 | 15.6% |
시 | 234 | 15.6% |
주 | 78 | 5.2% |
천 | 61 | 4.1% |
산 | 49 | 3.3% |
성 | 48 | 3.2% |
구 | 46 | 3.1% |
영 | 36 | 2.4% |
양 | 32 | 2.1% |
안 | 28 | 1.9% |
Other values (106) | 656 |
구
Categorical
IMBALANCE
 
Distinct | 19 |
---|---|
Distinct (%) | 3.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
<NA> | |
---|---|
남구 | 5 |
상당구 | 4 |
북구 | 3 |
흥덕구 | 3 |
Other values (14) | 24 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.92 |
Min length | 2 |
Unique
Unique | 8 ? |
---|---|
Unique (%) | 1.6% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 461 | |
남구 | 5 | 1.0% |
상당구 | 4 | 0.8% |
북구 | 3 | 0.6% |
흥덕구 | 3 | 0.6% |
서원구 | 3 | 0.6% |
처인구 | 3 | 0.6% |
동남구 | 3 | 0.6% |
마산합포구 | 3 | 0.6% |
청원구 | 2 | 0.4% |
Other values (9) | 10 | 2.0% |
Length
Value | Count | Frequency (%) |
na | 461 | |
남구 | 5 | 1.0% |
상당구 | 4 | 0.8% |
북구 | 3 | 0.6% |
흥덕구 | 3 | 0.6% |
서원구 | 3 | 0.6% |
처인구 | 3 | 0.6% |
동남구 | 3 | 0.6% |
마산합포구 | 3 | 0.6% |
서북구 | 2 | 0.4% |
Other values (9) | 10 | 2.0% |
동읍면
Text
MISSING
 
Distinct | 415 |
---|---|
Distinct (%) | 84.3% |
Missing | 8 |
Missing (%) | 1.6% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
성산읍 | 5 | 1.0% |
동면 | 4 | 0.8% |
남면 | 4 | 0.8% |
입장면 | 4 | 0.8% |
모동면 | 3 | 0.6% |
옥천읍 | 3 | 0.6% |
가덕면 | 3 | 0.6% |
현도면 | 3 | 0.6% |
광석면 | 3 | 0.6% |
옥산면 | 3 | 0.6% |
Other values (405) | 457 |
Most occurring characters
Value | Count | Frequency (%) |
면 | 337 | |
동 | 112 | 7.5% |
읍 | 76 | 5.1% |
산 | 34 | 2.3% |
성 | 33 | 2.2% |
남 | 27 | 1.8% |
북 | 24 | 1.6% |
가 | 22 | 1.5% |
천 | 21 | 1.4% |
안 | 20 | 1.3% |
Other values (199) | 781 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1480 | |
Decimal Number | 7 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
면 | 337 | |
동 | 112 | 7.6% |
읍 | 76 | 5.1% |
산 | 34 | 2.3% |
성 | 33 | 2.2% |
남 | 27 | 1.8% |
북 | 24 | 1.6% |
가 | 22 | 1.5% |
천 | 21 | 1.4% |
안 | 20 | 1.4% |
Other values (195) | 774 |
Decimal Number
Value | Count | Frequency (%) |
2 | 3 | |
1 | 2 | |
7 | 1 | 14.3% |
3 | 1 | 14.3% |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1480 | |
Common | 7 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
면 | 337 | |
동 | 112 | 7.6% |
읍 | 76 | 5.1% |
산 | 34 | 2.3% |
성 | 33 | 2.2% |
남 | 27 | 1.8% |
북 | 24 | 1.6% |
가 | 22 | 1.5% |
천 | 21 | 1.4% |
안 | 20 | 1.4% |
Other values (195) | 774 |
Common
Value | Count | Frequency (%) |
2 | 3 | |
1 | 2 | |
7 | 1 | 14.3% |
3 | 1 | 14.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1480 | |
ASCII | 7 | 0.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
면 | 337 | |
동 | 112 | 7.6% |
읍 | 76 | 5.1% |
산 | 34 | 2.3% |
성 | 33 | 2.2% |
남 | 27 | 1.8% |
북 | 24 | 1.6% |
가 | 22 | 1.5% |
천 | 21 | 1.4% |
안 | 20 | 1.4% |
Other values (195) | 774 |
ASCII
Value | Count | Frequency (%) |
2 | 3 | |
1 | 2 | |
7 | 1 | 14.3% |
3 | 1 | 14.3% |
리
Text
MISSING
 
Distinct | 341 |
---|---|
Distinct (%) | 96.1% |
Missing | 145 |
Missing (%) | 29.0% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
중리 | 3 | 0.8% |
신대리 | 2 | 0.6% |
신영리 | 2 | 0.6% |
신흥리 | 2 | 0.6% |
용정리 | 2 | 0.6% |
황곡리 | 2 | 0.6% |
학산리 | 2 | 0.6% |
고산리 | 2 | 0.6% |
매화리 | 2 | 0.6% |
평지리 | 2 | 0.6% |
Other values (331) | 334 |
Most occurring characters
Value | Count | Frequency (%) |
리 | 355 | |
산 | 30 | 2.8% |
대 | 23 | 2.2% |
동 | 20 | 1.9% |
곡 | 19 | 1.8% |
신 | 19 | 1.8% |
도 | 15 | 1.4% |
송 | 15 | 1.4% |
양 | 15 | 1.4% |
정 | 14 | 1.3% |
Other values (171) | 537 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1059 | |
Decimal Number | 3 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 355 | |
산 | 30 | 2.8% |
대 | 23 | 2.2% |
동 | 20 | 1.9% |
곡 | 19 | 1.8% |
신 | 19 | 1.8% |
도 | 15 | 1.4% |
송 | 15 | 1.4% |
양 | 15 | 1.4% |
정 | 14 | 1.3% |
Other values (170) | 534 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1059 | |
Common | 3 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 355 | |
산 | 30 | 2.8% |
대 | 23 | 2.2% |
동 | 20 | 1.9% |
곡 | 19 | 1.8% |
신 | 19 | 1.8% |
도 | 15 | 1.4% |
송 | 15 | 1.4% |
양 | 15 | 1.4% |
정 | 14 | 1.3% |
Other values (170) | 534 |
Common
Value | Count | Frequency (%) |
1 | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1059 | |
ASCII | 3 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
리 | 355 | |
산 | 30 | 2.8% |
대 | 23 | 2.2% |
동 | 20 | 1.9% |
곡 | 19 | 1.8% |
신 | 19 | 1.8% |
도 | 15 | 1.4% |
송 | 15 | 1.4% |
양 | 15 | 1.4% |
정 | 14 | 1.3% |
Other values (170) | 534 |
ASCII
Value | Count | Frequency (%) |
1 | 3 |
조회대상여부
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
1 | |
---|---|
0 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 405 | |
0 | 95 | 19.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 405 | |
0 | 95 | 19.0% |
법정동코드 | 시도 | 구 | 조회대상여부 | |
---|---|---|---|---|
법정동코드 | 1.000 | 0.203 | 0.754 | 0.061 |
시도 | 0.203 | 1.000 | 0.000 | 0.135 |
구 | 0.754 | 0.000 | 1.000 | 0.372 |
조회대상여부 | 0.061 | 0.135 | 0.372 | 1.000 |
시도 | 구 | 조회대상여부 | |
---|---|---|---|
시도 | 1.000 | 0.000 | 0.104 |
구 | 0.000 | 1.000 | 0.195 |
조회대상여부 | 0.104 | 0.195 | 1.000 |
법정동코드 | 시도 | 구 | 조회대상여부 | |
---|---|---|---|---|
법정동코드 | 1.000 | 0.083 | 0.308 | 0.050 |
시도 | 0.083 | 1.000 | 0.000 | 0.104 |
구 | 0.308 | 0.000 | 1.000 | 0.195 |
조회대상여부 | 0.050 | 0.104 | 0.195 | 1.000 |
법정동코드 | 시도 | 구시군 | 구 | 동읍면 | 리 | 조회대상여부 | |
---|---|---|---|---|---|---|---|
0 | 4717025021 | 전라남도 | 북제주군 | <NA> | <NA> | 천장리 | 0 |
1 | 4481036030 | 강원도 | 청주시 | <NA> | 가례면 | 금호리 | 1 |
2 | 4311425324 | 전라북도 | 제주시 | <NA> | 한경면 | 대감리 | 1 |
3 | 4615033024 | 강원도 | 안산시 | <NA> | 용궁면 | 부연리 | 1 |
4 | 4873032036 | 경상남도 | 중구 | <NA> | 반남면 | 창선1리 | 1 |
5 | 4421033027 | 경상남도 | 제천시 | <NA> | 덕적면 | 기지시리 | 0 |
6 | 4480036025 | 경기도 | 장수군 | <NA> | 노곡면 | <NA> | 1 |
7 | 4886036027 | 충청남도 | 포항시 | <NA> | 음봉면 | 월산리 | 0 |
8 | 4816025023 | 전라남도 | 경산시 | <NA> | 부석면 | <NA> | 1 |
9 | 4885038022 | 전라북도 | 용인시 | <NA> | 중앙동 | <NA> | 1 |
법정동코드 | 시도 | 구시군 | 구 | 동읍면 | 리 | 조회대상여부 | |
---|---|---|---|---|---|---|---|
490 | 4476034023 | 충청북도 | 서구 | <NA> | 광석면 | 광령1리 | 1 |
491 | 4481040021 | 경상북도 | 구례군 | <NA> | 동면 | 전동리 | 1 |
492 | 4683037029 | 경상북도 | 종로구 | <NA> | 거동동 | 읍리 | 1 |
493 | 4575035522 | 경상남도 | 군위군 | <NA> | 함안면 | <NA> | 1 |
494 | 4427011100 | 전라남도 | 홍성군 | <NA> | <NA> | 하추리 | 1 |
495 | 4574032026 | 충청북도 | 봉화군 | <NA> | 정남면 | 옥계리 | 1 |
496 | 4311325000 | 경상북도 | 영천시 | <NA> | 영광읍 | 대판리 | 1 |
497 | 4882036028 | 부산광역시 | 강진군 | <NA> | 용평면 | <NA> | 1 |
498 | 4223034024 | 경상남도 | 성남시 | <NA> | 옥천면 | 산양리 | 1 |
499 | 4572035000 | 경기도 | 영등포구 | <NA> | 고령읍 | 송포리 | 1 |