Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 546.9 KiB |
Average record size in memory | 56.0 B |
Variable types
Text | 3 |
---|---|
Categorical | 3 |
Dataset
Description | 관리_부속_지번_PK,관리_건축물대장_PK,부속_대장_구분_코드,부속_시군구_코드,부속_법정동_코드,부속_대지_구분_코드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15394/S/1/datasetView.do |
부속_대지_구분_코드 is highly imbalanced (87.3%) | Imbalance |
관리_부속_지번_PK has unique values | Unique |
Reproduction
Analysis started | 2024-05-10 23:52:09.386097 |
---|---|
Analysis finished | 2024-05-10 23:52:12.098846 |
Duration | 2.71 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
관리_부속_지번_PK
Text
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 28 |
---|---|
Median length | 15 |
Mean length | 12.8647 |
Min length | 7 |
Characters and Unicode
Total characters | 128647 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 10000 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 11620-1000000000000000596578 |
---|---|
2nd row | 11650-100063467 |
3rd row | 11380-100025825 |
4th row | 11560-100010627 |
5th row | 11230-5274 |
Value | Count | Frequency (%) |
11620-1000000000000000596578 | 1 | < 0.1% |
11230-1685 | 1 | < 0.1% |
11170-900 | 1 | < 0.1% |
11215-5458 | 1 | < 0.1% |
11230-2592 | 1 | < 0.1% |
11215-6224 | 1 | < 0.1% |
11215-100024877 | 1 | < 0.1% |
11410-100016643 | 1 | < 0.1% |
11110-100012378 | 1 | < 0.1% |
11290-100008864 | 1 | < 0.1% |
Other values (9990) | 9990 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 35543 | |
0 | 34201 | |
- | 10000 | 7.8% |
2 | 8612 | 6.7% |
5 | 8161 | 6.3% |
4 | 6633 | 5.2% |
3 | 6580 | 5.1% |
6 | 5581 | 4.3% |
7 | 4500 | 3.5% |
9 | 4450 | 3.5% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 118647 | |
Dash Punctuation | 10000 | 7.8% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 35543 | |
0 | 34201 | |
2 | 8612 | 7.3% |
5 | 8161 | 6.9% |
4 | 6633 | 5.6% |
3 | 6580 | 5.5% |
6 | 5581 | 4.7% |
7 | 4500 | 3.8% |
9 | 4450 | 3.8% |
8 | 4386 | 3.7% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 128647 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 35543 | |
0 | 34201 | |
- | 10000 | 7.8% |
2 | 8612 | 6.7% |
5 | 8161 | 6.3% |
4 | 6633 | 5.2% |
3 | 6580 | 5.1% |
6 | 5581 | 4.3% |
7 | 4500 | 3.5% |
9 | 4450 | 3.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 128647 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 35543 | |
0 | 34201 | |
- | 10000 | 7.8% |
2 | 8612 | 6.7% |
5 | 8161 | 6.3% |
4 | 6633 | 5.2% |
3 | 6580 | 5.1% |
6 | 5581 | 4.3% |
7 | 4500 | 3.5% |
9 | 4450 | 3.5% |
관리_건축물대장_PK
Text
Distinct | 6809 |
---|---|
Distinct (%) | 68.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 28 |
---|---|
Median length | 15 |
Mean length | 12.8016 |
Min length | 7 |
Characters and Unicode
Total characters | 128016 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 5673 ? |
---|---|
Unique (%) | 56.7% |
Sample
1st row | 11620-1000000000000000659900 |
---|---|
2nd row | 11650-100284701 |
3rd row | 11380-100285515 |
4th row | 11560-100218676 |
5th row | 11230-36131 |
Value | Count | Frequency (%) |
11500-100346752 | 42 | 0.4% |
11500-100299412 | 26 | 0.3% |
11650-100284655 | 23 | 0.2% |
11500-100202802 | 22 | 0.2% |
11650-100284707 | 22 | 0.2% |
11215-100206904 | 22 | 0.2% |
11650-100284608 | 21 | 0.2% |
11650-100284558 | 21 | 0.2% |
11215-100206905 | 21 | 0.2% |
11215-15214 | 21 | 0.2% |
Other values (6799) | 9759 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 35403 | |
0 | 26614 | |
2 | 12534 | 9.8% |
- | 10000 | 7.8% |
5 | 8812 | 6.9% |
4 | 7074 | 5.5% |
3 | 6555 | 5.1% |
6 | 5803 | 4.5% |
8 | 5304 | 4.1% |
9 | 5067 | 4.0% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 118016 | |
Dash Punctuation | 10000 | 7.8% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 35403 | |
0 | 26614 | |
2 | 12534 | 10.6% |
5 | 8812 | 7.5% |
4 | 7074 | 6.0% |
3 | 6555 | 5.6% |
6 | 5803 | 4.9% |
8 | 5304 | 4.5% |
9 | 5067 | 4.3% |
7 | 4850 | 4.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 128016 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 35403 | |
0 | 26614 | |
2 | 12534 | 9.8% |
- | 10000 | 7.8% |
5 | 8812 | 6.9% |
4 | 7074 | 5.5% |
3 | 6555 | 5.1% |
6 | 5803 | 4.5% |
8 | 5304 | 4.1% |
9 | 5067 | 4.0% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 128016 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 35403 | |
0 | 26614 | |
2 | 12534 | 9.8% |
- | 10000 | 7.8% |
5 | 8812 | 6.9% |
4 | 7074 | 5.5% |
3 | 6555 | 5.1% |
6 | 5803 | 4.5% |
8 | 5304 | 4.1% |
9 | 5067 | 4.0% |
부속_대장_구분_코드
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
일반 | |
---|---|
집합 | |
<NA> | 75 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.015 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반 |
---|---|
2nd row | 일반 |
3rd row | 집합 |
4th row | 집합 |
5th row | 일반 |
Common Values
Value | Count | Frequency (%) |
일반 | 6348 | |
집합 | 3577 | |
<NA> | 75 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반 | 6348 | |
집합 | 3577 | |
na | 75 | 0.8% |
부속_시군구_코드
Categorical
Distinct | 30 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
광진구 | |
---|---|
성북구 | |
서초구 | |
서대문구 | |
종로구 | 588 |
Other values (25) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.1099 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 관악구 |
---|---|
2nd row | 서초구 |
3rd row | 은평구 |
4th row | 영등포구 |
5th row | 동대문구 |
Common Values
Value | Count | Frequency (%) |
광진구 | 894 | 8.9% |
성북구 | 812 | 8.1% |
서초구 | 782 | 7.8% |
서대문구 | 758 | 7.6% |
종로구 | 588 | 5.9% |
강서구 | 574 | 5.7% |
은평구 | 566 | 5.7% |
동대문구 | 485 | 4.9% |
중구 | 451 | 4.5% |
용산구 | 441 | 4.4% |
Other values (20) | 3649 |
Length
Value | Count | Frequency (%) |
광진구 | 894 | 8.9% |
성북구 | 812 | 8.1% |
서초구 | 782 | 7.8% |
서대문구 | 758 | 7.6% |
종로구 | 588 | 5.9% |
강서구 | 574 | 5.7% |
은평구 | 566 | 5.7% |
동대문구 | 485 | 4.9% |
중구 | 451 | 4.5% |
용산구 | 441 | 4.4% |
Other values (20) | 3649 |
부속_법정동_코드
Text
Distinct | 441 |
---|---|
Distinct (%) | 4.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
내곡동 | 524 | 5.3% |
광장동 | 328 | 3.3% |
정릉동 | 224 | 2.3% |
북아현동 | 206 | 2.1% |
불광동 | 187 | 1.9% |
화양동 | 181 | 1.8% |
개화동 | 147 | 1.5% |
미아동 | 146 | 1.5% |
면목동 | 128 | 1.3% |
군자동 | 123 | 1.2% |
Other values (430) | 7753 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 9813 | |
가 | 1097 | 3.4% |
곡 | 903 | 2.8% |
신 | 791 | 2.4% |
내 | 610 | 1.9% |
화 | 541 | 1.7% |
광 | 538 | 1.7% |
장 | 464 | 1.4% |
현 | 434 | 1.3% |
정 | 402 | 1.2% |
Other values (200) | 16701 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31328 | |
Decimal Number | 913 | 2.8% |
Space Separator | 53 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 9813 | |
가 | 1097 | 3.5% |
곡 | 903 | 2.9% |
신 | 791 | 2.5% |
내 | 610 | 1.9% |
화 | 541 | 1.7% |
광 | 538 | 1.7% |
장 | 464 | 1.5% |
현 | 434 | 1.4% |
정 | 402 | 1.3% |
Other values (191) | 15735 |
Decimal Number
Value | Count | Frequency (%) |
2 | 282 | |
1 | 185 | |
3 | 172 | |
5 | 133 | |
4 | 65 | 7.1% |
6 | 53 | 5.8% |
7 | 22 | 2.4% |
8 | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
53 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31328 | |
Common | 966 | 3.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 9813 | |
가 | 1097 | 3.5% |
곡 | 903 | 2.9% |
신 | 791 | 2.5% |
내 | 610 | 1.9% |
화 | 541 | 1.7% |
광 | 538 | 1.7% |
장 | 464 | 1.5% |
현 | 434 | 1.4% |
정 | 402 | 1.3% |
Other values (191) | 15735 |
Common
Value | Count | Frequency (%) |
2 | 282 | |
1 | 185 | |
3 | 172 | |
5 | 133 | |
4 | 65 | 6.7% |
6 | 53 | 5.5% |
53 | 5.5% | |
7 | 22 | 2.3% |
8 | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31328 | |
ASCII | 966 | 3.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 9813 | |
가 | 1097 | 3.5% |
곡 | 903 | 2.9% |
신 | 791 | 2.5% |
내 | 610 | 1.9% |
화 | 541 | 1.7% |
광 | 538 | 1.7% |
장 | 464 | 1.5% |
현 | 434 | 1.4% |
정 | 402 | 1.3% |
Other values (191) | 15735 |
ASCII
Value | Count | Frequency (%) |
2 | 282 | |
1 | 185 | |
3 | 172 | |
5 | 133 | |
4 | 65 | 6.7% |
6 | 53 | 5.5% |
53 | 5.5% | |
7 | 22 | 2.3% |
8 | 1 | 0.1% |
부속_대지_구분_코드
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대지 | |
---|---|
산 | 278 |
<NA> | 84 |
블록 | 1 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 1.989 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 대지 |
---|---|
2nd row | 대지 |
3rd row | 대지 |
4th row | 대지 |
5th row | 대지 |
Common Values
Value | Count | Frequency (%) |
대지 | 9637 | |
산 | 278 | 2.8% |
<NA> | 84 | 0.8% |
블록 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대지 | 9637 | |
산 | 278 | 2.8% |
na | 84 | 0.8% |
블록 | 1 | < 0.1% |
부속_대장_구분_코드 | 부속_시군구_코드 | 부속_대지_구분_코드 | |
---|---|---|---|
부속_대장_구분_코드 | 1.000 | 0.366 | 0.059 |
부속_시군구_코드 | 0.366 | 1.000 | 0.232 |
부속_대지_구분_코드 | 0.059 | 0.232 | 1.000 |
부속_대지_구분_코드 | 부속_시군구_코드 | 부속_대장_구분_코드 | |
---|---|---|---|
부속_대지_구분_코드 | 1.000 | 0.120 | 0.098 |
부속_시군구_코드 | 0.120 | 1.000 | 0.313 |
부속_대장_구분_코드 | 0.098 | 0.313 | 1.000 |
부속_대장_구분_코드 | 부속_시군구_코드 | 부속_대지_구분_코드 | |
---|---|---|---|
부속_대장_구분_코드 | 1.000 | 0.313 | 0.098 |
부속_시군구_코드 | 0.313 | 1.000 | 0.120 |
부속_대지_구분_코드 | 0.098 | 0.120 | 1.000 |
관리_부속_지번_PK | 관리_건축물대장_PK | 부속_대장_구분_코드 | 부속_시군구_코드 | 부속_법정동_코드 | 부속_대지_구분_코드 | |
---|---|---|---|---|---|---|
71614 | 11620-1000000000000000596578 | 11620-1000000000000000659900 | 일반 | 관악구 | 남현동 | 대지 |
81943 | 11650-100063467 | 11650-100284701 | 일반 | 서초구 | 내곡동 | 대지 |
34815 | 11380-100025825 | 11380-100285515 | 집합 | 은평구 | 응암동 | 대지 |
95221 | 11560-100010627 | 11560-100218676 | 집합 | 영등포구 | 영등포동 | 대지 |
45590 | 11230-5274 | 11230-36131 | 일반 | 동대문구 | 답십리동 | 대지 |
13569 | 11290-100025471 | 11290-100265106 | 일반 | 성북구 | 종암동 | 대지 |
53326 | 11680-2353 | 11680-1821 | 집합 | 강남구 | 도곡동 | 산 |
25942 | 11440-7086 | 11440-32432 | 집합 | 마포구 | 중동 | 대지 |
55545 | 11215-100027037 | 11215-100267291 | 집합 | 광진구 | 중곡동 | 대지 |
56232 | 11290-4326 | 11290-21469 | 일반 | 성북구 | 정릉동 | 대지 |
관리_부속_지번_PK | 관리_건축물대장_PK | 부속_대장_구분_코드 | 부속_시군구_코드 | 부속_법정동_코드 | 부속_대지_구분_코드 | |
---|---|---|---|---|---|---|
62917 | 11440-3818 | 11440-18539 | <NA> | 마포구 | <NA> | |
56484 | 11260-450 | 11260-13147 | 일반 | 중랑구 | 면목동 | 대지 |
69717 | 11215-100003360 | 11215-15241 | 일반 | 광진구 | 광장동 | 대지 |
7247 | 11620-2937 | 11620-28873 | 일반 | 관악구 | 봉천동 | 대지 |
80484 | 11350-100007689 | 11350-100201712 | 집합 | 노원구 | 상계동 | 대지 |
55730 | 11650-100027979 | 11650-100284563 | 일반 | 서초구 | 내곡동 | 대지 |
87148 | 11215-2411 | 11215-15222 | 일반 | 광진구 | 광장동 | 대지 |
93054 | 11380-2600 | 11380-12075 | 집합 | 은평구 | 불광동 | 대지 |
30029 | 11650-3825 | 11650-15518 | 일반 | 서초구 | 서초동 | 대지 |
34846 | 11740-100019777 | 11740-100274688 | 일반 | 강동구 | 고덕동 | 대지 |