Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 546.9 KiB |
Average record size in memory | 56.0 B |
Variable types
Text | 3 |
---|---|
Categorical | 3 |
Dataset
Description | 관리_부속_지번_PK,관리_폐쇄말소대장_PK,부속_대장_구분_코드,부속_시군구_코드,부속_법정동_코드,부속_대지_구분_코드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15399/S/1/datasetView.do |
부속_대지_구분_코드 is highly imbalanced (72.3%) | Imbalance |
관리_부속_지번_PK has unique values | Unique |
Reproduction
Analysis started | 2024-05-11 09:03:37.829162 |
---|---|
Analysis finished | 2024-05-11 09:03:40.472109 |
Duration | 2.64 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
관리_부속_지번_PK
Text
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 28 |
---|---|
Median length | 15 |
Mean length | 13.0919 |
Min length | 7 |
Characters and Unicode
Total characters | 130919 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 10000 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 11350-100036642 |
---|---|
2nd row | 11305-100003184 |
3rd row | 11230-100052158 |
4th row | 11650-100012528 |
5th row | 11440-100007300 |
Value | Count | Frequency (%) |
11350-100036642 | 1 | < 0.1% |
11230-4930 | 1 | < 0.1% |
11470-100045714 | 1 | < 0.1% |
11470-100010865 | 1 | < 0.1% |
11710-1234 | 1 | < 0.1% |
11650-1589 | 1 | < 0.1% |
11140-100004952 | 1 | < 0.1% |
11440-100017707 | 1 | < 0.1% |
11530-100018400 | 1 | < 0.1% |
11560-100031305 | 1 | < 0.1% |
Other values (9990) | 9990 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 35456 | |
1 | 34459 | |
- | 10000 | 7.6% |
4 | 8249 | 6.3% |
5 | 8010 | 6.1% |
3 | 7600 | 5.8% |
2 | 6854 | 5.2% |
7 | 5534 | 4.2% |
6 | 5305 | 4.1% |
9 | 4753 | 3.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 120919 | |
Dash Punctuation | 10000 | 7.6% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 35456 | |
1 | 34459 | |
4 | 8249 | 6.8% |
5 | 8010 | 6.6% |
3 | 7600 | 6.3% |
2 | 6854 | 5.7% |
7 | 5534 | 4.6% |
6 | 5305 | 4.4% |
9 | 4753 | 3.9% |
8 | 4699 | 3.9% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 130919 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 35456 | |
1 | 34459 | |
- | 10000 | 7.6% |
4 | 8249 | 6.3% |
5 | 8010 | 6.1% |
3 | 7600 | 5.8% |
2 | 6854 | 5.2% |
7 | 5534 | 4.2% |
6 | 5305 | 4.1% |
9 | 4753 | 3.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 130919 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 35456 | |
1 | 34459 | |
- | 10000 | 7.6% |
4 | 8249 | 6.3% |
5 | 8010 | 6.1% |
3 | 7600 | 5.8% |
2 | 6854 | 5.2% |
7 | 5534 | 4.2% |
6 | 5305 | 4.1% |
9 | 4753 | 3.6% |
관리_폐쇄말소대장_PK
Text
Distinct | 6111 |
---|---|
Distinct (%) | 61.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 28 |
---|---|
Median length | 15 |
Mean length | 13.3545 |
Min length | 7 |
Characters and Unicode
Total characters | 133545 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 4802 ? |
---|---|
Unique (%) | 48.0% |
Sample
1st row | 11350-100190375 |
---|---|
2nd row | 11305-100009261 |
3rd row | 11230-100288092 |
4th row | 11650-100021301 |
5th row | 11440-100015365 |
Value | Count | Frequency (%) |
11305-100124765 | 30 | 0.3% |
11500-100412262 | 30 | 0.3% |
11305-100124709 | 24 | 0.2% |
11410-100030519 | 23 | 0.2% |
11305-100124289 | 23 | 0.2% |
11500-100399071 | 22 | 0.2% |
11290-100009002 | 21 | 0.2% |
11410-2516 | 20 | 0.2% |
11305-100124606 | 20 | 0.2% |
11305-100124546 | 19 | 0.2% |
Other values (6101) | 9768 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 34970 | |
0 | 32423 | |
- | 10000 | 7.5% |
4 | 9286 | 7.0% |
5 | 9183 | 6.9% |
3 | 8300 | 6.2% |
2 | 7497 | 5.6% |
7 | 5980 | 4.5% |
6 | 5634 | 4.2% |
9 | 5470 | 4.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 123545 | |
Dash Punctuation | 10000 | 7.5% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 34970 | |
0 | 32423 | |
4 | 9286 | 7.5% |
5 | 9183 | 7.4% |
3 | 8300 | 6.7% |
2 | 7497 | 6.1% |
7 | 5980 | 4.8% |
6 | 5634 | 4.6% |
9 | 5470 | 4.4% |
8 | 4802 | 3.9% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 133545 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 34970 | |
0 | 32423 | |
- | 10000 | 7.5% |
4 | 9286 | 7.0% |
5 | 9183 | 6.9% |
3 | 8300 | 6.2% |
2 | 7497 | 5.6% |
7 | 5980 | 4.5% |
6 | 5634 | 4.2% |
9 | 5470 | 4.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 133545 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 34970 | |
0 | 32423 | |
- | 10000 | 7.5% |
4 | 9286 | 7.0% |
5 | 9183 | 6.9% |
3 | 8300 | 6.2% |
2 | 7497 | 5.6% |
7 | 5980 | 4.5% |
6 | 5634 | 4.2% |
9 | 5470 | 4.1% |
부속_대장_구분_코드
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
일반 | |
---|---|
집합 | |
<NA> | 573 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1146 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반 |
---|---|
2nd row | 일반 |
3rd row | 일반 |
4th row | 일반 |
5th row | 일반 |
Common Values
Value | Count | Frequency (%) |
일반 | 6601 | |
집합 | 2826 | |
<NA> | 573 | 5.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반 | 6601 | |
집합 | 2826 | |
na | 573 | 5.7% |
부속_시군구_코드
Categorical
Distinct | 26 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
마포구 | |
---|---|
동대문구 | |
용산구 | |
동작구 | |
강북구 | 587 |
Other values (21) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.113 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 노원구 |
---|---|
2nd row | 강북구 |
3rd row | 동대문구 |
4th row | 서초구 |
5th row | 마포구 |
Common Values
Value | Count | Frequency (%) |
마포구 | 961 | 9.6% |
동대문구 | 838 | 8.4% |
용산구 | 682 | 6.8% |
동작구 | 645 | 6.5% |
강북구 | 587 | 5.9% |
종로구 | 534 | 5.3% |
서초구 | 486 | 4.9% |
강서구 | 480 | 4.8% |
중구 | 467 | 4.7% |
서대문구 | 448 | 4.5% |
Other values (16) | 3872 |
Length
Value | Count | Frequency (%) |
마포구 | 961 | 9.6% |
동대문구 | 838 | 8.4% |
용산구 | 682 | 6.8% |
동작구 | 645 | 6.5% |
강북구 | 587 | 5.9% |
종로구 | 534 | 5.3% |
서초구 | 486 | 4.9% |
강서구 | 480 | 4.8% |
중구 | 467 | 4.7% |
서대문구 | 448 | 4.5% |
Other values (16) | 3872 |
부속_법정동_코드
Text
Distinct | 415 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
회기동 | 351 | 3.5% |
상도동 | 289 | 2.9% |
신문로2가 | 255 | 2.6% |
미아동 | 249 | 2.5% |
번동 | 249 | 2.5% |
신정동 | 240 | 2.4% |
합정동 | 238 | 2.4% |
이문동 | 227 | 2.3% |
당인동 | 225 | 2.3% |
반포동 | 179 | 1.8% |
Other values (404) | 7470 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 9550 | |
가 | 1455 | 4.5% |
신 | 1242 | 3.8% |
문 | 666 | 2.0% |
산 | 657 | 2.0% |
정 | 595 | 1.8% |
로 | 563 | 1.7% |
2 | 554 | 1.7% |
상 | 497 | 1.5% |
당 | 485 | 1.5% |
Other values (195) | 16421 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31368 | |
Decimal Number | 1289 | 3.9% |
Space Separator | 28 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 9550 | |
가 | 1455 | 4.6% |
신 | 1242 | 4.0% |
문 | 666 | 2.1% |
산 | 657 | 2.1% |
정 | 595 | 1.9% |
로 | 563 | 1.8% |
상 | 497 | 1.6% |
당 | 485 | 1.5% |
아 | 455 | 1.5% |
Other values (186) | 15203 |
Decimal Number
Value | Count | Frequency (%) |
2 | 554 | |
3 | 312 | |
1 | 172 | 13.3% |
5 | 105 | 8.1% |
6 | 56 | 4.3% |
4 | 50 | 3.9% |
7 | 27 | 2.1% |
8 | 13 | 1.0% |
Space Separator
Value | Count | Frequency (%) |
28 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31368 | |
Common | 1317 | 4.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 9550 | |
가 | 1455 | 4.6% |
신 | 1242 | 4.0% |
문 | 666 | 2.1% |
산 | 657 | 2.1% |
정 | 595 | 1.9% |
로 | 563 | 1.8% |
상 | 497 | 1.6% |
당 | 485 | 1.5% |
아 | 455 | 1.5% |
Other values (186) | 15203 |
Common
Value | Count | Frequency (%) |
2 | 554 | |
3 | 312 | |
1 | 172 | 13.1% |
5 | 105 | 8.0% |
6 | 56 | 4.3% |
4 | 50 | 3.8% |
28 | 2.1% | |
7 | 27 | 2.1% |
8 | 13 | 1.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31368 | |
ASCII | 1317 | 4.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 9550 | |
가 | 1455 | 4.6% |
신 | 1242 | 4.0% |
문 | 666 | 2.1% |
산 | 657 | 2.1% |
정 | 595 | 1.9% |
로 | 563 | 1.8% |
상 | 497 | 1.6% |
당 | 485 | 1.5% |
아 | 455 | 1.5% |
Other values (186) | 15203 |
ASCII
Value | Count | Frequency (%) |
2 | 554 | |
3 | 312 | |
1 | 172 | 13.1% |
5 | 105 | 8.0% |
6 | 56 | 4.3% |
4 | 50 | 3.8% |
28 | 2.1% | |
7 | 27 | 2.1% |
8 | 13 | 1.0% |
부속_대지_구분_코드
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대지 | |
---|---|
산 | 492 |
<NA> | 461 |
블록 | 4 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.043 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대지 |
---|---|
2nd row | 대지 |
3rd row | 대지 |
4th row | 대지 |
5th row | 대지 |
Common Values
Value | Count | Frequency (%) |
대지 | 9043 | |
산 | 492 | 4.9% |
<NA> | 461 | 4.6% |
블록 | 4 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대지 | 9043 | |
산 | 492 | 4.9% |
na | 461 | 4.6% |
블록 | 4 | < 0.1% |
부속_대장_구분_코드 | 부속_시군구_코드 | 부속_대지_구분_코드 | |
---|---|---|---|
부속_대장_구분_코드 | 1.000 | 0.519 | 0.015 |
부속_시군구_코드 | 0.519 | 1.000 | 0.309 |
부속_대지_구분_코드 | 0.015 | 0.309 | 1.000 |
부속_대장_구분_코드 | 부속_대지_구분_코드 | 부속_시군구_코드 | |
---|---|---|---|
부속_대장_구분_코드 | 1.000 | 0.024 | 0.451 |
부속_대지_구분_코드 | 0.024 | 1.000 | 0.166 |
부속_시군구_코드 | 0.451 | 0.166 | 1.000 |
부속_대장_구분_코드 | 부속_시군구_코드 | 부속_대지_구분_코드 | |
---|---|---|---|
부속_대장_구분_코드 | 1.000 | 0.451 | 0.024 |
부속_시군구_코드 | 0.451 | 1.000 | 0.166 |
부속_대지_구분_코드 | 0.024 | 0.166 | 1.000 |
관리_부속_지번_PK | 관리_폐쇄말소대장_PK | 부속_대장_구분_코드 | 부속_시군구_코드 | 부속_법정동_코드 | 부속_대지_구분_코드 | |
---|---|---|---|---|---|---|
85928 | 11350-100036642 | 11350-100190375 | 일반 | 노원구 | 상계동 | 대지 |
16948 | 11305-100003184 | 11305-100009261 | 일반 | 강북구 | 미아동 | 대지 |
73023 | 11230-100052158 | 11230-100288092 | 일반 | 동대문구 | 제기동 | 대지 |
47882 | 11650-100012528 | 11650-100021301 | 일반 | 서초구 | 방배동 | 대지 |
1 | 11440-100007300 | 11440-100015365 | 일반 | 마포구 | 아현동 | 대지 |
25865 | 11380-100001943 | 11380-100007388 | 일반 | 은평구 | 진관동 | 대지 |
29673 | 11440-5339 | 11440-10432 | 일반 | 마포구 | 상암동 | 대지 |
39586 | 11650-12 | 11650-477 | 일반 | 서초구 | 방배동 | 대지 |
30272 | 11680-1157 | 11680-7751 | 일반 | 강남구 | 논현동 | 대지 |
28168 | 11440-901 | 11440-233 | 일반 | 마포구 | 대흥동 | 대지 |
관리_부속_지번_PK | 관리_폐쇄말소대장_PK | 부속_대장_구분_코드 | 부속_시군구_코드 | 부속_법정동_코드 | 부속_대지_구분_코드 | |
---|---|---|---|---|---|---|
46855 | 11140-100069426 | 11140-100664231 | 집합 | 중구 | 신당동 | 대지 |
97455 | 11110-1000000000000001537574 | 11110-1000000000000001431394 | 일반 | 종로구 | 신문로2가 | 대지 |
10598 | 11440-156 | 11440-1364 | 집합 | 마포구 | 아현동 | 대지 |
56696 | 11440-100035088 | 11440-100095308 | 일반 | 마포구 | 용강동 | 대지 |
10267 | 11230-100081484 | 11230-100481245 | 일반 | 동대문구 | 청량리동 | 대지 |
95093 | 11140-100095890 | 11140-100959971 | 일반 | 중구 | 필동1가 | 대지 |
46406 | 11500-100009175 | 11500-100023514 | 일반 | 강서구 | 등촌동 | 대지 |
2607 | 11140-1515 | 11140-3311 | 집합 | 중구 | 신당동 | 대지 |
9333 | 11230-4806 | 11230-5956 | 일반 | 동대문구 | 이문동 | 대지 |
27103 | 11620-727 | 11620-7305 | 집합 | 관악구 | 신림동 | 산 |