Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 390.6 KiB |
Average record size in memory | 40.0 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Dataset
Description | 서울특별시 은평구의 필지별 용도지역에 대한 데이터로 필지별 지번, 지목, 용도지역 등의 항목에 대하여 제공합니다. 2022년 3월 기준입니다. |
---|---|
Author | 서울특별시 은평구 |
URL | https://www.data.go.kr/data/15100363/fileData.do |
지목 is highly imbalanced (70.5%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 18:24:43.438958 |
---|---|
Analysis finished | 2023-12-12 18:24:43.975042 |
Duration | 0.54 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
읍면동면
Categorical
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
불광동 | |
---|---|
응암동 | |
갈현동 | |
역촌동 | |
신사동 | |
Other values (6) |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 응암동 |
---|---|
2nd row | 증산동 |
3rd row | 갈현동 |
4th row | 역촌동 |
5th row | 응암동 |
Common Values
Value | Count | Frequency (%) |
불광동 | 1706 | |
응암동 | 1552 | |
갈현동 | 1230 | |
역촌동 | 988 | |
신사동 | 920 | |
대조동 | 877 | |
녹번동 | 761 | |
수색동 | 561 | 5.6% |
구산동 | 534 | 5.3% |
진관동 | 464 | 4.6% |
Length
Value | Count | Frequency (%) |
불광동 | 1706 | |
응암동 | 1552 | |
갈현동 | 1230 | |
역촌동 | 988 | |
신사동 | 920 | |
대조동 | 877 | |
녹번동 | 761 | |
수색동 | 561 | 5.6% |
구산동 | 534 | 5.3% |
진관동 | 464 | 4.6% |
지번
Text
Distinct | 9440 |
---|---|
Distinct (%) | 94.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
대 | 836 | 7.3% |
도 | 405 | 3.5% |
임 | 88 | 0.8% |
전 | 41 | 0.4% |
공 | 29 | 0.3% |
구 | 20 | 0.2% |
종 | 19 | 0.2% |
답 | 17 | 0.1% |
학 | 10 | 0.1% |
산 | 8 | 0.1% |
Other values (9431) | 10031 |
Most occurring characters
Value | Count | Frequency (%) |
11504 | ||
- | 9789 | |
1 | 8098 | |
대 | 7583 | |
2 | 6577 | |
3 | 5451 | |
4 | 4665 | 6.2% |
5 | 3674 | 4.9% |
8 | 3334 | 4.4% |
7 | 3251 | 4.3% |
Other values (21) | 11742 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 44046 | |
Space Separator | 11504 | 15.2% |
Other Letter | 10329 | 13.7% |
Dash Punctuation | 9789 | 12.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 7583 | |
도 | 1568 | 15.2% |
임 | 377 | 3.6% |
산 | 329 | 3.2% |
전 | 157 | 1.5% |
구 | 79 | 0.8% |
답 | 46 | 0.4% |
공 | 41 | 0.4% |
잡 | 33 | 0.3% |
천 | 33 | 0.3% |
Other values (9) | 83 | 0.8% |
Decimal Number
Value | Count | Frequency (%) |
1 | 8098 | |
2 | 6577 | |
3 | 5451 | |
4 | 4665 | |
5 | 3674 | |
8 | 3334 | |
7 | 3251 | |
9 | 3024 | 6.9% |
6 | 3008 | 6.8% |
0 | 2964 | 6.7% |
Space Separator
Value | Count | Frequency (%) |
11504 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 9789 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 65339 | |
Hangul | 10329 | 13.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 7583 | |
도 | 1568 | 15.2% |
임 | 377 | 3.6% |
산 | 329 | 3.2% |
전 | 157 | 1.5% |
구 | 79 | 0.8% |
답 | 46 | 0.4% |
공 | 41 | 0.4% |
잡 | 33 | 0.3% |
천 | 33 | 0.3% |
Other values (9) | 83 | 0.8% |
Common
Value | Count | Frequency (%) |
11504 | ||
- | 9789 | |
1 | 8098 | |
2 | 6577 | |
3 | 5451 | |
4 | 4665 | |
5 | 3674 | 5.6% |
8 | 3334 | 5.1% |
7 | 3251 | 5.0% |
9 | 3024 | 4.6% |
Other values (2) | 5972 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 65339 | |
Hangul | 10329 | 13.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
11504 | ||
- | 9789 | |
1 | 8098 | |
2 | 6577 | |
3 | 5451 | |
4 | 4665 | |
5 | 3674 | 5.6% |
8 | 3334 | 5.1% |
7 | 3251 | 5.0% |
9 | 3024 | 4.6% |
Other values (2) | 5972 |
Hangul
Value | Count | Frequency (%) |
대 | 7583 | |
도 | 1568 | 15.2% |
임 | 377 | 3.6% |
산 | 329 | 3.2% |
전 | 157 | 1.5% |
구 | 79 | 0.8% |
답 | 46 | 0.4% |
공 | 41 | 0.4% |
잡 | 33 | 0.3% |
천 | 33 | 0.3% |
Other values (9) | 83 | 0.8% |
지목
Categorical
IMBALANCE
 
Distinct | 19 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대 | |
---|---|
도 | |
임 | 376 |
전 | 157 |
구 | 79 |
Other values (14) | 238 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 도 |
---|---|
2nd row | 도 |
3rd row | 대 |
4th row | 대 |
5th row | 대 |
Common Values
Value | Count | Frequency (%) |
대 | 7581 | |
도 | 1569 | 15.7% |
임 | 376 | 3.8% |
전 | 157 | 1.6% |
구 | 79 | 0.8% |
답 | 46 | 0.5% |
공 | 41 | 0.4% |
잡 | 34 | 0.3% |
천 | 33 | 0.3% |
종 | 30 | 0.3% |
Other values (9) | 54 | 0.5% |
Length
Value | Count | Frequency (%) |
대 | 7581 | |
도 | 1569 | 15.7% |
임 | 376 | 3.8% |
전 | 157 | 1.6% |
구 | 79 | 0.8% |
답 | 46 | 0.5% |
공 | 41 | 0.4% |
잡 | 34 | 0.3% |
천 | 33 | 0.3% |
종 | 30 | 0.3% |
Other values (8) | 53 | 0.5% |
용도지역
Text
Distinct | 134 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 72 |
---|---|
Median length | 63 |
Mean length | 23.3864 |
Min length | 17 |
Characters and Unicode
Total characters | 233864 |
---|---|
Distinct characters | 44 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 62 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | 도시지역(1)|제2종일반주거지역(1) |
---|---|
2nd row | 도시지역(1)|준주거지역(1) |
3rd row | 제2종일반주거지역(7층이하)(1)|도시지역(1) |
4th row | 도시지역(1)|제3종일반주거지역(1) |
5th row | 제3종일반주거지역(1)|도시지역(1) |
Value | Count | Frequency (%) |
제2종일반주거지역(7층이하)(1)|도시지역(1 | 1996 | |
도시지역(1)|제2종일반주거지역(7층이하)(1 | 1979 | |
제2종일반주거지역(1)|도시지역(1 | 782 | 7.8% |
도시지역(1)|제2종일반주거지역(1 | 754 | 7.5% |
도시지역(1)|제3종일반주거지역(1 | 749 | 7.5% |
제3종일반주거지역(1)|도시지역(1 | 733 | 7.3% |
도시지역(1)|제1종일반주거지역(1 | 517 | 5.1% |
제1종일반주거지역(1)|도시지역(1 | 495 | 4.9% |
준주거지역(1)|도시지역(1 | 331 | 3.3% |
도시지역(1)|준주거지역(1 | 321 | 3.2% |
Other values (129) | 1382 |
Most occurring characters
Value | Count | Frequency (%) |
) | 24534 | 10.5% |
( | 24534 | 10.5% |
지 | 20973 | 9.0% |
1 | 20858 | 8.9% |
역 | 20359 | 8.7% |
| | 10346 | 4.4% |
10039 | 4.3% | |
시 | 10013 | 4.3% |
도 | 10013 | 4.3% |
주 | 9312 | 4.0% |
Other values (34) | 72883 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 131295 | |
Decimal Number | 33116 | 14.2% |
Close Punctuation | 24534 | 10.5% |
Open Punctuation | 24534 | 10.5% |
Math Symbol | 10346 | 4.4% |
Space Separator | 10039 | 4.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 20973 | |
역 | 20359 | |
시 | 10013 | |
도 | 10013 | |
주 | 9312 | |
거 | 9312 | |
일 | 8831 | |
반 | 8831 | |
제 | 8595 | |
종 | 8595 | |
Other values (26) | 16461 |
Decimal Number
Value | Count | Frequency (%) |
1 | 20858 | |
2 | 6518 | 19.7% |
7 | 4175 | 12.6% |
3 | 1565 | 4.7% |
Close Punctuation
Value | Count | Frequency (%) |
) | 24534 |
Open Punctuation
Value | Count | Frequency (%) |
( | 24534 |
Math Symbol
Value | Count | Frequency (%) |
| | 10346 |
Space Separator
Value | Count | Frequency (%) |
10039 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 131295 | |
Common | 102569 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 20973 | |
역 | 20359 | |
시 | 10013 | |
도 | 10013 | |
주 | 9312 | |
거 | 9312 | |
일 | 8831 | |
반 | 8831 | |
제 | 8595 | |
종 | 8595 | |
Other values (26) | 16461 |
Common
Value | Count | Frequency (%) |
) | 24534 | |
( | 24534 | |
1 | 20858 | |
| | 10346 | |
10039 | ||
2 | 6518 | 6.4% |
7 | 4175 | 4.1% |
3 | 1565 | 1.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 131295 | |
ASCII | 102569 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
) | 24534 | |
( | 24534 | |
1 | 20858 | |
| | 10346 | |
10039 | ||
2 | 6518 | 6.4% |
7 | 4175 | 4.1% |
3 | 1565 | 1.5% |
Hangul
Value | Count | Frequency (%) |
지 | 20973 | |
역 | 20359 | |
시 | 10013 | |
도 | 10013 | |
주 | 9312 | |
거 | 9312 | |
일 | 8831 | |
반 | 8831 | |
제 | 8595 | |
종 | 8595 | |
Other values (26) | 16461 |
읍면동면 | 지목 | |
---|---|---|
읍면동면 | 1.000 | 0.426 |
지목 | 0.426 | 1.000 |
읍면동면 | 지목 | |
---|---|---|
읍면동면 | 1.000 | 0.170 |
지목 | 0.170 | 1.000 |
읍면동면 | 지목 | |
---|---|---|
읍면동면 | 1.000 | 0.170 |
지목 | 0.170 | 1.000 |
읍면동면 | 지번 | 지목 | 용도지역 | |
---|---|---|---|---|
31430 | 응암동 | 597-41도 | 도 | 도시지역(1)|제2종일반주거지역(1) |
43712 | 증산동 | 239-4도 | 도 | 도시지역(1)|준주거지역(1) |
18779 | 갈현동 | 515-36대 | 대 | 제2종일반주거지역(7층이하)(1)|도시지역(1) |
34094 | 역촌동 | 14-14대 | 대 | 도시지역(1)|제3종일반주거지역(1) |
30575 | 응암동 | 578-22 대 | 대 | 제3종일반주거지역(1)|도시지역(1) |
21427 | 구산동 | 342-1 대 | 대 | 도시지역(1)|제2종일반주거지역(7층이하)(1) |
1758 | 수색동 | 346-9대 | 대 | 도시지역(1)|제2종일반주거지역(7층이하)(1) |
5822 | 녹번동 | 282-3 공 | 공 | 도시지역(1)|제2종일반주거지역(1) |
41650 | 신사동 | 349-5대 | 대 | 도시지역(1)|제1종일반주거지역(1) |
28337 | 응암동 | 123-8대 | 대 | 도시지역(1)|준주거지역(1) |
읍면동면 | 지번 | 지목 | 용도지역 | |
---|---|---|---|---|
132 | 수색동 | 16-3대 | 대 | 제2종일반주거지역(7층이하)(1)|도시지역(1) |
42379 | 증산동 | 164-3대 | 대 | 제3종일반주거지역(1)|도시지역(1) |
20889 | 구산동 | 210-28대 | 대 | 제2종일반주거지역(7층이하)(1)|도시지역(1) |
23194 | 대조동 | 70-9대 | 대 | 제2종일반주거지역(2)|도시지역(1)|제2종일반주거지역(7층이하)(2) |
31654 | 응암동 | 602-36대 | 대 | 제3종일반주거지역(1)|도시지역(1) |
26342 | 응암동 | 32-1도 | 도 | 제2종일반주거지역(7층이하)(2)|제3종일반주거지역(2)|도시지역(1) |
6622 | 불광동 | 37-2 전 | 전 | 도시지역(1)|자연녹지지역(1) |
8385 | 불광동 | 244-113대 | 대 | 제2종일반주거지역(1)|도시지역(1) |
42608 | 증산동 | 176-6대 | 대 | 도시지역(1)|제2종일반주거지역(1) |
31312 | 응암동 | 594-97대 | 대 | 도시지역(1)|제2종일반주거지역(7층이하)(1) |