Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 10000 |
Missing cells | 1228 |
Missing cells (%) | 3.1% |
Duplicate rows | 844 |
Duplicate rows (%) | 8.4% |
Total size in memory | 390.6 KiB |
Average record size in memory | 40.0 B |
Variable types
Text | 2 |
---|---|
Categorical | 2 |
Dataset
Description | 서울특별시 각 구 별로 보상 실지목 리스트 현황을 정리한 파일 데이터 입니다. 토지 구분, 지목, 해당 토지에 대한 면적 현황입니다. |
---|---|
URL | https://www.data.go.kr/data/15118778/fileData.do |
Dataset has 844 (8.4%) duplicate rows | Duplicates |
토지구분 is highly imbalanced (54.1%) | Imbalance |
장소 has 1228 (12.3%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 21:30:42.300123 |
---|---|
Analysis finished | 2023-12-12 21:30:42.801799 |
Duration | 0.5 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
장소
Text
MISSING
 
Distinct | 80 |
---|---|
Distinct (%) | 0.9% |
Missing | 1228 |
Missing (%) | 12.3% |
Memory size | 156.2 KiB |
Length
Max length | 13 |
---|---|
Median length | 11 |
Mean length | 11.308254 |
Min length | 9 |
Characters and Unicode
Total characters | 99196 |
---|---|
Distinct characters | 107 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 서울시 중구 입정동 |
---|---|
2nd row | 서울시 의정부시 장암동 |
3rd row | 서울시 은평구 진관내동 |
4th row | 서울시 강서구 공항동 |
5th row | 서울시 마포구 성산동 |
Value | Count | Frequency (%) |
서울시 | 8736 | |
은평구 | 2224 | 8.5% |
진관외동 | 1254 | 4.8% |
강서구 | 1070 | 4.1% |
마포구 | 1061 | 4.0% |
상암동 | 932 | 3.5% |
중구 | 755 | 2.9% |
송파구 | 752 | 2.9% |
강동구 | 662 | 2.5% |
진관내동 | 586 | 2.2% |
Other values (95) | 8284 |
Most occurring characters
Value | Count | Frequency (%) |
17544 | ||
서 | 10361 | 10.4% |
구 | 9419 | 9.5% |
동 | 9145 | 9.2% |
시 | 8892 | 9.0% |
울 | 8736 | 8.8% |
은 | 2237 | 2.3% |
평 | 2224 | 2.2% |
강 | 2174 | 2.2% |
관 | 1885 | 1.9% |
Other values (97) | 26579 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 81086 | |
Space Separator | 17544 | 17.7% |
Decimal Number | 566 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 10361 | |
구 | 9419 | 11.6% |
동 | 9145 | 11.3% |
시 | 8892 | 11.0% |
울 | 8736 | 10.8% |
은 | 2237 | 2.8% |
평 | 2224 | 2.7% |
강 | 2174 | 2.7% |
관 | 1885 | 2.3% |
진 | 1840 | 2.3% |
Other values (91) | 24173 |
Decimal Number
Value | Count | Frequency (%) |
4 | 185 | |
2 | 152 | |
3 | 123 | |
1 | 101 | |
5 | 5 | 0.9% |
Space Separator
Value | Count | Frequency (%) |
17544 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 81086 | |
Common | 18110 | 18.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 10361 | |
구 | 9419 | 11.6% |
동 | 9145 | 11.3% |
시 | 8892 | 11.0% |
울 | 8736 | 10.8% |
은 | 2237 | 2.8% |
평 | 2224 | 2.7% |
강 | 2174 | 2.7% |
관 | 1885 | 2.3% |
진 | 1840 | 2.3% |
Other values (91) | 24173 |
Common
Value | Count | Frequency (%) |
17544 | ||
4 | 185 | 1.0% |
2 | 152 | 0.8% |
3 | 123 | 0.7% |
1 | 101 | 0.6% |
5 | 5 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 81086 | |
ASCII | 18110 | 18.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
17544 | ||
4 | 185 | 1.0% |
2 | 152 | 0.8% |
3 | 123 | 0.7% |
1 | 101 | 0.6% |
5 | 5 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
서 | 10361 | |
구 | 9419 | 11.6% |
동 | 9145 | 11.3% |
시 | 8892 | 11.0% |
울 | 8736 | 10.8% |
은 | 2237 | 2.8% |
평 | 2224 | 2.7% |
강 | 2174 | 2.7% |
관 | 1885 | 2.3% |
진 | 1840 | 2.3% |
Other values (91) | 24173 |
토지구분
Categorical
IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
사유지 | |
---|---|
국,공유지(보상용지) | |
국,공유지(무상귀속) | |
존치 | 86 |
시유지(원가반영) | 80 |
Other values (2) | 44 |
Length
Max length | 11 |
---|---|
Median length | 3 |
Mean length | 5.2362 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 국,공유지(보상용지) |
---|---|
2nd row | 국,공유지(보상용지) |
3rd row | 사유지 |
4th row | 국,공유지(무상귀속) |
5th row | 시유지(원가반영) |
Common Values
Value | Count | Frequency (%) |
사유지 | 7067 | |
국,공유지(보상용지) | 1497 | 15.0% |
국,공유지(무상귀속) | 1226 | 12.3% |
존치 | 86 | 0.9% |
시유지(원가반영) | 80 | 0.8% |
하천점용대상 | 31 | 0.3% |
공사자산(원가반영) | 13 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
사유지 | 7067 | |
국,공유지(보상용지 | 1497 | 15.0% |
국,공유지(무상귀속 | 1226 | 12.3% |
존치 | 86 | 0.9% |
시유지(원가반영 | 80 | 0.8% |
하천점용대상 | 31 | 0.3% |
공사자산(원가반영 | 13 | 0.1% |
지목
Categorical
Distinct | 27 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대 | |
---|---|
도로 | |
전 | |
답 | |
임야 | |
Other values (22) |
Length
Max length | 7 |
---|---|
Median length | 1 |
Mean length | 1.5421 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 대 |
---|---|
2nd row | 공장용지 |
3rd row | 도로 |
4th row | 구거 |
5th row | 대 |
Common Values
Value | Count | Frequency (%) |
대 | 3168 | |
도로 | 2024 | |
전 | 1550 | |
답 | 1432 | |
임야 | 475 | 4.8% |
구거 | 346 | 3.5% |
잡종지 | 331 | 3.3% |
하천 | 176 | 1.8% |
견사 및 건물 | 164 | 1.6% |
철도용지 | 105 | 1.1% |
Other values (17) | 229 | 2.3% |
Length
Value | Count | Frequency (%) |
대 | 3168 | |
도로 | 2024 | |
전 | 1550 | |
답 | 1432 | |
임야 | 475 | 4.6% |
구거 | 346 | 3.4% |
잡종지 | 331 | 3.2% |
하천 | 176 | 1.7% |
견사 | 164 | 1.6% |
및 | 164 | 1.6% |
Other values (19) | 498 | 4.8% |
면적
Text
Distinct | 1871 |
---|---|
Distinct (%) | 18.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
1 | 188 | 1.9% |
2 | 143 | 1.4% |
3 | 141 | 1.4% |
7 | 121 | 1.2% |
4 | 118 | 1.2% |
17 | 100 | 1.0% |
10 | 100 | 1.0% |
6 | 99 | 1.0% |
5 | 98 | 1.0% |
9 | 86 | 0.9% |
Other values (1861) | 8806 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 4935 | |
2 | 3350 | |
3 | 2873 | |
6 | 2408 | |
4 | 2284 | |
5 | 2169 | |
9 | 2002 | |
7 | 1916 | 7.1% |
8 | 1888 | 7.0% |
0 | 1813 | 6.7% |
Other values (2) | 1341 | 5.0% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 25638 | |
Other Punctuation | 1341 | 5.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 4935 | |
2 | 3350 | |
3 | 2873 | |
6 | 2408 | |
4 | 2284 | |
5 | 2169 | |
9 | 2002 | |
7 | 1916 | 7.5% |
8 | 1888 | 7.4% |
0 | 1813 | 7.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1338 | |
. | 3 | 0.2% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 26979 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 4935 | |
2 | 3350 | |
3 | 2873 | |
6 | 2408 | |
4 | 2284 | |
5 | 2169 | |
9 | 2002 | |
7 | 1916 | 7.1% |
8 | 1888 | 7.0% |
0 | 1813 | 6.7% |
Other values (2) | 1341 | 5.0% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 26979 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 4935 | |
2 | 3350 | |
3 | 2873 | |
6 | 2408 | |
4 | 2284 | |
5 | 2169 | |
9 | 2002 | |
7 | 1916 | 7.1% |
8 | 1888 | 7.0% |
0 | 1813 | 6.7% |
Other values (2) | 1341 | 5.0% |
장소 | 토지구분 | 지목 | |
---|---|---|---|
장소 | 1.000 | 0.512 | 0.673 |
토지구분 | 0.512 | 1.000 | 0.584 |
지목 | 0.673 | 0.584 | 1.000 |
지목 | 토지구분 | |
---|---|---|
지목 | 1.000 | 0.288 |
토지구분 | 0.288 | 1.000 |
토지구분 | 지목 | |
---|---|---|
토지구분 | 1.000 | 0.288 |
지목 | 0.288 | 1.000 |
장소 | 토지구분 | 지목 | 면적 | |
---|---|---|---|---|
31477 | 서울시 중구 입정동 | 국,공유지(보상용지) | 대 | 16 |
29886 | 서울시 의정부시 장암동 | 국,공유지(보상용지) | 공장용지 | 66 |
25730 | 서울시 은평구 진관내동 | 사유지 | 도로 | 7 |
6801 | 서울시 강서구 공항동 | 국,공유지(무상귀속) | 구거 | 6 |
31250 | 서울시 마포구 성산동 | 시유지(원가반영) | 대 | 3 |
46437 | <NA> | 국,공유지(보상용지) | 제방 | 25 |
35953 | 서울시 중구 인현동2가 | 사유지 | 대 | 36 |
26462 | 서울시 은평구 진관내동 | 사유지 | 대 | 78 |
2629 | 서울시 강남구 율현동 | 사유지 | 전 | 318 |
15585 | 서울시 서초구 내곡동 | 국,공유지(무상귀속) | 도로 | 40 |
장소 | 토지구분 | 지목 | 면적 | |
---|---|---|---|---|
44971 | <NA> | 하천점용대상 | 전 | 1 |
14426 | 서울시 강서구 공항동 | 국,공유지(보상용지) | 답 | 29 |
25914 | 서울시 은평구 진관외동 | 국,공유지(보상용지) | 대 | 192 |
7487 | 서울시 강서구 가양동 | 사유지 | 전 | 2 |
2772 | 서울시 강남구 수서동 | 국,공유지(무상귀속) | 도로 | 42 |
37370 | 서울시 구로구 항동 | 사유지 | 대 | 188 |
10243 | 서울시 은평구 구파발동 | 사유지 | 도로 | 6 |
25871 | 서울시 은평구 진관외동 | 사유지 | 대 | 202 |
16368 | 서울시 강동구 하일동 | 사유지 | 도로 | 2 |
410 | 서울시 마포구 상암동 | 국,공유지(보상용지) | 구거 | 163 |
Most frequently occurring
장소 | 토지구분 | 지목 | 면적 | # duplicates | |
---|---|---|---|---|---|
375 | 서울시 은평구 진관내동 | 사유지 | 대 | 165 | 26 |
30 | 서울시 강동구 하일동 | 사유지 | 대 | 43 | 25 |
546 | 서울시 은평구 진관외동 | 사유지 | 도로 | 2 | 18 |
551 | 서울시 은평구 진관외동 | 사유지 | 도로 | 3 | 17 |
17 | 서울시 강동구 하일동 | 사유지 | 대 | 21 | 16 |
28 | 서울시 강동구 하일동 | 사유지 | 대 | 40 | 15 |
450 | 서울시 은평구 진관외동 | 사유지 | 대 | 132 | 15 |
464 | 서울시 은평구 진관외동 | 사유지 | 대 | 165 | 15 |
31 | 서울시 강동구 하일동 | 사유지 | 대 | 46 | 14 |
376 | 서울시 은평구 진관내동 | 사유지 | 대 | 166 | 14 |