Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 2959 |
Missing cells (%) | 4.2% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 625.0 KiB |
Average record size in memory | 64.0 B |
Variable types
Categorical | 5 |
---|---|
Text | 2 |
Dataset
Description | 충청남도 보령시 도로명주소(건물번호)에 관련된 자료로 시군구명, 읍면동명, 도로명주소, 건축물용도, 형태, 건물표지판의 용도로 구성되어있습니다. |
---|---|
Author | 충청남도 |
URL | https://alldam.chungnam.go.kr/index.chungnam?menuCd=DOM_000000201001001001&st=&cds=&orgCd=&apiType=&isOpen=Y&pageIndex=400&beforeMenuCd=DOM_000000201001001000&publicdatapk=15041819 |
시군구명 has constant value "" | Constant |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
형태 is highly overall correlated with 용도 | High correlation |
용도 is highly overall correlated with 형태 | High correlation |
건축물용도 is highly imbalanced (55.3%) | Imbalance |
형태 is highly imbalanced (97.5%) | Imbalance |
용도 is highly imbalanced (96.3%) | Imbalance |
리명 has 2959 (29.6%) missing values | Missing |
Reproduction
Analysis started | 2024-01-14 06:39:45.054164 |
---|---|
Analysis finished | 2024-01-14 06:39:46.334828 |
Duration | 1.28 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군구명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
보령시 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 보령시 |
---|---|
2nd row | 보령시 |
3rd row | 보령시 |
4th row | 보령시 |
5th row | 보령시 |
Common Values
Value | Count | Frequency (%) |
보령시 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
보령시 | 10000 |
읍면동명
Categorical
Distinct | 21 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
웅천읍 | |
---|---|
대천동 | |
남포면 | |
오천면 | |
주교면 | |
Other values (16) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 동대동 |
---|---|
2nd row | 청라면 |
3rd row | 성주면 |
4th row | 청라면 |
5th row | 주교면 |
Common Values
Value | Count | Frequency (%) |
웅천읍 | 1106 | |
대천동 | 1012 | |
남포면 | 929 | 9.3% |
오천면 | 811 | 8.1% |
주교면 | 724 | 7.2% |
청라면 | 709 | 7.1% |
천북면 | 701 | 7.0% |
동대동 | 534 | 5.3% |
신흑동 | 508 | 5.1% |
청소면 | 506 | 5.1% |
Other values (11) | 2460 |
Length
Value | Count | Frequency (%) |
웅천읍 | 1106 | |
대천동 | 1012 | |
남포면 | 929 | 9.3% |
오천면 | 811 | 8.1% |
주교면 | 724 | 7.2% |
청라면 | 709 | 7.1% |
천북면 | 701 | 7.0% |
동대동 | 534 | 5.3% |
신흑동 | 508 | 5.1% |
청소면 | 506 | 5.1% |
Other values (11) | 2460 |
리명
Text
MISSING
 
Distinct | 101 |
---|---|
Distinct (%) | 1.4% |
Missing | 2959 |
Missing (%) | 29.6% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
대창리 | 261 | 3.7% |
성주리 | 248 | 3.5% |
원산도리 | 174 | 2.5% |
주교리 | 161 | 2.3% |
신대리 | 157 | 2.2% |
관당리 | 151 | 2.1% |
진죽리 | 147 | 2.1% |
삽시도리 | 139 | 2.0% |
하만리 | 138 | 2.0% |
나원리 | 137 | 1.9% |
Other values (91) | 5328 |
Most occurring characters
Value | Count | Frequency (%) |
리 | 7041 | |
성 | 710 | 3.3% |
산 | 585 | 2.7% |
도 | 570 | 2.6% |
창 | 545 | 2.5% |
대 | 526 | 2.4% |
주 | 460 | 2.1% |
신 | 435 | 2.0% |
동 | 385 | 1.8% |
현 | 363 | 1.7% |
Other values (86) | 9941 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 21561 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 7041 | |
성 | 710 | 3.3% |
산 | 585 | 2.7% |
도 | 570 | 2.6% |
창 | 545 | 2.5% |
대 | 526 | 2.4% |
주 | 460 | 2.1% |
신 | 435 | 2.0% |
동 | 385 | 1.8% |
현 | 363 | 1.7% |
Other values (86) | 9941 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 21561 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 7041 | |
성 | 710 | 3.3% |
산 | 585 | 2.7% |
도 | 570 | 2.6% |
창 | 545 | 2.5% |
대 | 526 | 2.4% |
주 | 460 | 2.1% |
신 | 435 | 2.0% |
동 | 385 | 1.8% |
현 | 363 | 1.7% |
Other values (86) | 9941 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 21561 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
리 | 7041 | |
성 | 710 | 3.3% |
산 | 585 | 2.7% |
도 | 570 | 2.6% |
창 | 545 | 2.5% |
대 | 526 | 2.4% |
주 | 460 | 2.1% |
신 | 435 | 2.0% |
동 | 385 | 1.8% |
현 | 363 | 1.7% |
Other values (86) | 9941 |
도로명주소
Text
Distinct | 9999 |
---|---|
Distinct (%) | > 99.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 14 |
---|---|
Median length | 12 |
Mean length | 8.5429 |
Min length | 4 |
Characters and Unicode
Total characters | 85429 |
---|---|
Distinct characters | 310 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 9998 ? |
---|---|
Unique (%) | > 99.9% |
Sample
1st row | 평원길 52 |
---|---|
2nd row | 원모루길 194 |
3rd row | 심원계곡로 152-2 |
4th row | 당안길 3 |
5th row | 신대1길 90-3 |
Value | Count | Frequency (%) |
충서로 | 182 | 0.9% |
토정로 | 128 | 0.6% |
홍보로 | 99 | 0.5% |
죽성로 | 94 | 0.5% |
만수로 | 85 | 0.4% |
성주산로 | 84 | 0.4% |
중앙로 | 84 | 0.4% |
대해로 | 79 | 0.4% |
보령남로 | 71 | 0.4% |
10 | 66 | 0.3% |
Other values (5062) | 19028 |
Most occurring characters
Value | Count | Frequency (%) |
10000 | 11.7% | |
길 | 7570 | 8.9% |
1 | 7132 | 8.3% |
2 | 5037 | 5.9% |
- | 4563 | 5.3% |
3 | 4095 | 4.8% |
4 | 3316 | 3.9% |
5 | 2885 | 3.4% |
6 | 2601 | 3.0% |
로 | 2475 | 2.9% |
Other values (300) | 35755 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 36921 | |
Decimal Number | 33945 | |
Space Separator | 10000 | 11.7% |
Dash Punctuation | 4563 | 5.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
길 | 7570 | 20.5% |
로 | 2475 | 6.7% |
대 | 836 | 2.3% |
산 | 784 | 2.1% |
장 | 699 | 1.9% |
도 | 603 | 1.6% |
천 | 602 | 1.6% |
동 | 564 | 1.5% |
성 | 506 | 1.4% |
골 | 477 | 1.3% |
Other values (288) | 21805 |
Decimal Number
Value | Count | Frequency (%) |
1 | 7132 | |
2 | 5037 | |
3 | 4095 | |
4 | 3316 | |
5 | 2885 | |
6 | 2601 | 7.7% |
7 | 2447 | 7.2% |
8 | 2183 | 6.4% |
0 | 2150 | 6.3% |
9 | 2099 | 6.2% |
Space Separator
Value | Count | Frequency (%) |
10000 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4563 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 48508 | |
Hangul | 36921 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
길 | 7570 | 20.5% |
로 | 2475 | 6.7% |
대 | 836 | 2.3% |
산 | 784 | 2.1% |
장 | 699 | 1.9% |
도 | 603 | 1.6% |
천 | 602 | 1.6% |
동 | 564 | 1.5% |
성 | 506 | 1.4% |
골 | 477 | 1.3% |
Other values (288) | 21805 |
Common
Value | Count | Frequency (%) |
10000 | ||
1 | 7132 | |
2 | 5037 | |
- | 4563 | |
3 | 4095 | |
4 | 3316 | 6.8% |
5 | 2885 | 5.9% |
6 | 2601 | 5.4% |
7 | 2447 | 5.0% |
8 | 2183 | 4.5% |
Other values (2) | 4249 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 48508 | |
Hangul | 36921 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10000 | ||
1 | 7132 | |
2 | 5037 | |
- | 4563 | |
3 | 4095 | |
4 | 3316 | 6.8% |
5 | 2885 | 5.9% |
6 | 2601 | 5.4% |
7 | 2447 | 5.0% |
8 | 2183 | 4.5% |
Other values (2) | 4249 |
Hangul
Value | Count | Frequency (%) |
길 | 7570 | 20.5% |
로 | 2475 | 6.7% |
대 | 836 | 2.3% |
산 | 784 | 2.1% |
장 | 699 | 1.9% |
도 | 603 | 1.6% |
천 | 602 | 1.6% |
동 | 564 | 1.5% |
성 | 506 | 1.4% |
골 | 477 | 1.3% |
Other values (288) | 21805 |
건축물용도
Categorical
IMBALANCE
 
Distinct | 22 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
단독주택 | |
---|---|
창고시설 | |
제2종근린생활시설 | 479 |
제1종근린생활시설 | 315 |
판매 및 영업시설 | 232 |
Other values (17) |
Length
Max length | 11 |
---|---|
Median length | 4 |
Mean length | 4.6671 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 창고시설 |
---|---|
2nd row | 단독주택 |
3rd row | 제2종근린생활시설 |
4th row | 단독주택 |
5th row | 단독주택 |
Common Values
Value | Count | Frequency (%) |
단독주택 | 6106 | |
창고시설 | 1969 | 19.7% |
제2종근린생활시설 | 479 | 4.8% |
제1종근린생활시설 | 315 | 3.1% |
판매 및 영업시설 | 232 | 2.3% |
동식물관련시설 | 203 | 2.0% |
숙박시설 | 166 | 1.7% |
업무시설 | 119 | 1.2% |
공장 | 90 | 0.9% |
교육연구 및 복지시설 | 74 | 0.7% |
Other values (12) | 247 | 2.5% |
Length
Value | Count | Frequency (%) |
단독주택 | 6106 | |
창고시설 | 1969 | 18.4% |
제2종근린생활시설 | 479 | 4.5% |
및 | 350 | 3.3% |
제1종근린생활시설 | 315 | 2.9% |
판매 | 232 | 2.2% |
영업시설 | 232 | 2.2% |
동식물관련시설 | 203 | 1.9% |
숙박시설 | 166 | 1.6% |
업무시설 | 119 | 1.1% |
Other values (16) | 529 | 4.9% |
형태
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
표준형 | |
---|---|
비표준형 | 25 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0025 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 표준형 |
---|---|
2nd row | 표준형 |
3rd row | 표준형 |
4th row | 표준형 |
5th row | 표준형 |
Common Values
Value | Count | Frequency (%) |
표준형 | 9975 | |
비표준형 | 25 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
표준형 | 9975 | |
비표준형 | 25 | 0.2% |
용도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
일반용(오각형) | |
---|---|
관공서용 | 35 |
자율형 | 25 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.9735 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반용(오각형) |
---|---|
2nd row | 일반용(오각형) |
3rd row | 일반용(오각형) |
4th row | 일반용(오각형) |
5th row | 일반용(오각형) |
Common Values
Value | Count | Frequency (%) |
일반용(오각형) | 9940 | |
관공서용 | 35 | 0.4% |
자율형 | 25 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반용(오각형 | 9940 | |
관공서용 | 35 | 0.4% |
자율형 | 25 | 0.2% |
읍면동명 | 건축물용도 | 형태 | 용도 | |
---|---|---|---|---|
읍면동명 | 1.000 | 0.529 | 0.030 | 0.095 |
건축물용도 | 0.529 | 1.000 | 0.000 | 0.220 |
형태 | 0.030 | 0.000 | 1.000 | 1.000 |
용도 | 0.095 | 0.220 | 1.000 | 1.000 |
건축물용도 | 읍면동명 | 형태 | 용도 | |
---|---|---|---|---|
건축물용도 | 1.000 | 0.171 | 0.000 | 0.116 |
읍면동명 | 0.171 | 1.000 | 0.026 | 0.043 |
형태 | 0.000 | 0.026 | 1.000 | 1.000 |
용도 | 0.116 | 0.043 | 1.000 | 1.000 |
읍면동명 | 건축물용도 | 형태 | 용도 | |
---|---|---|---|---|
읍면동명 | 1.000 | 0.171 | 0.026 | 0.043 |
건축물용도 | 0.171 | 1.000 | 0.000 | 0.116 |
형태 | 0.026 | 0.000 | 1.000 | 1.000 |
용도 | 0.043 | 0.116 | 1.000 | 1.000 |
시군구명 | 읍면동명 | 리명 | 도로명주소 | 건축물용도 | 형태 | 용도 | |
---|---|---|---|---|---|---|---|
3565 | 보령시 | 동대동 | <NA> | 평원길 52 | 창고시설 | 표준형 | 일반용(오각형) |
11679 | 보령시 | 청라면 | 나원리 | 원모루길 194 | 단독주택 | 표준형 | 일반용(오각형) |
14918 | 보령시 | 성주면 | 성주리 | 심원계곡로 152-2 | 제2종근린생활시설 | 표준형 | 일반용(오각형) |
26956 | 보령시 | 청라면 | 나원리 | 당안길 3 | 단독주택 | 표준형 | 일반용(오각형) |
15683 | 보령시 | 주교면 | 신대리 | 신대1길 90-3 | 단독주택 | 표준형 | 일반용(오각형) |
19007 | 보령시 | 남포면 | 삼현리 | 삼현3길 8-70 | 단독주택 | 표준형 | 일반용(오각형) |
17215 | 보령시 | 대천동 | <NA> | 소미1길 68 | 단독주택 | 표준형 | 일반용(오각형) |
4117 | 보령시 | 주교면 | 은포리 | 토정로 486-26 | 창고시설 | 표준형 | 일반용(오각형) |
23184 | 보령시 | 동대동 | <NA> | 매방아1길 12-15 | 단독주택 | 표준형 | 일반용(오각형) |
27237 | 보령시 | 내항동 | <NA> | 녹문3길 39-16 | 단독주택 | 표준형 | 일반용(오각형) |
시군구명 | 읍면동명 | 리명 | 도로명주소 | 건축물용도 | 형태 | 용도 | |
---|---|---|---|---|---|---|---|
12833 | 보령시 | 주산면 | 황율리 | 옹동말길 59 | 단독주택 | 표준형 | 일반용(오각형) |
23434 | 보령시 | 웅천읍 | 수부리 | 만수로 582-25 | 단독주택 | 표준형 | 일반용(오각형) |
11221 | 보령시 | 오천면 | 원산도리 | 원산도5길 19-7 | 단독주택 | 표준형 | 일반용(오각형) |
21459 | 보령시 | 대천동 | <NA> | 벼루길 11-12 | 단독주택 | 표준형 | 일반용(오각형) |
27649 | 보령시 | 청라면 | 의평리 | 냉풍욕장길 45-6 | 제2종근린생활시설 | 표준형 | 일반용(오각형) |
4629 | 보령시 | 동대동 | <NA> | 큰오랏3길 30 | 제2종근린생활시설 | 표준형 | 일반용(오각형) |
15565 | 보령시 | 주교면 | 신대리 | 신대동길 177 | 단독주택 | 표준형 | 일반용(오각형) |
23460 | 보령시 | 웅천읍 | 수부리 | 만수로 454-12 | 창고시설 | 표준형 | 일반용(오각형) |
26789 | 보령시 | 미산면 | 늑전리 | 대늑길 33 | 창고시설 | 표준형 | 일반용(오각형) |
1608 | 보령시 | 오천면 | 효자도리 | 허육도길 18 | 단독주택 | 표준형 | 일반용(오각형) |
Most frequently occurring
시군구명 | 읍면동명 | 리명 | 도로명주소 | 건축물용도 | 형태 | 용도 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 보령시 | 주포면 | 관산리 | 대학길 106 | 교육연구 및 복지시설 | 표준형 | 일반용(오각형) | 2 |