Overview

Dataset statistics

Number of variables5
Number of observations10000
Missing cells19
Missing cells (%)< 0.1%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory468.8 KiB
Average record size in memory48.0 B

Variable types

Text3
DateTime2

Dataset

Description제주특별자치도 서귀포시 도로명주소 고시 현황에 관한 데이터로 종전주소와 도로명주소를 비교해서 확인 가능한 정보입니다.
Author제주특별자치도 서귀포시
URLhttps://www.data.go.kr/data/3067645/fileData.do

Alerts

도로명주소 has unique valuesUnique

Reproduction

Analysis started2024-04-21 02:45:04.169004
Analysis finished2024-04-21 02:45:05.377882
Duration1.21 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct9883
Distinct (%)98.8%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-04-21T11:45:05.659238image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length128
Median length103
Mean length25.2103
Min length18

Characters and Unicode

Total characters252103
Distinct characters96
Distinct categories5 ?
Distinct scripts2 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique9800 ?
Unique (%)98.0%

Sample

1st row제주특별자치도 서귀포시 동홍동 430-29
2nd row제주특별자치도 서귀포시 남원읍 남원리 1550
3rd row제주특별자치도 서귀포시 호근동 801-1
4th row제주특별자치도 서귀포시 안덕면 상천리 471-9
5th row제주특별자치도 서귀포시 동홍동 1523
ValueCountFrequency (%)
제주특별자치도 10000
21.2%
서귀포시 10000
21.2%
남원읍 1944
 
4.1%
대정읍 1232
 
2.6%
성산읍 1149
 
2.4%
안덕면 983
 
2.1%
표선면 737
 
1.6%
위미리 470
 
1.0%
서귀동 453
 
1.0%
강정동 372
 
0.8%
Other values (8994) 19898
42.1%
2024-04-21T11:45:06.134537image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
37238
 
14.8%
11071
 
4.4%
1 10738
 
4.3%
10604
 
4.2%
10240
 
4.1%
10179
 
4.0%
10122
 
4.0%
10000
 
4.0%
10000
 
4.0%
10000
 
4.0%
Other values (86) 121911
48.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 158183
62.7%
Decimal Number 47742
 
18.9%
Space Separator 37238
 
14.8%
Dash Punctuation 7749
 
3.1%
Other Punctuation 1191
 
0.5%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
11071
 
7.0%
10604
 
6.7%
10240
 
6.5%
10179
 
6.4%
10122
 
6.4%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
Other values (73) 55967
35.4%
Decimal Number
ValueCountFrequency (%)
1 10738
22.5%
2 6413
13.4%
3 5039
10.6%
4 4491
9.4%
5 3974
 
8.3%
6 3736
 
7.8%
7 3448
 
7.2%
8 3335
 
7.0%
0 3315
 
6.9%
9 3253
 
6.8%
Space Separator
ValueCountFrequency (%)
37238
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 7749
100.0%
Other Punctuation
ValueCountFrequency (%)
1191
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 158183
62.7%
Common 93920
37.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
11071
 
7.0%
10604
 
6.7%
10240
 
6.5%
10179
 
6.4%
10122
 
6.4%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
Other values (73) 55967
35.4%
Common
ValueCountFrequency (%)
37238
39.6%
1 10738
 
11.4%
- 7749
 
8.3%
2 6413
 
6.8%
3 5039
 
5.4%
4 4491
 
4.8%
5 3974
 
4.2%
6 3736
 
4.0%
7 3448
 
3.7%
8 3335
 
3.6%
Other values (3) 7759
 
8.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 158183
62.7%
ASCII 92729
36.8%
None 1191
 
0.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
37238
40.2%
1 10738
 
11.6%
- 7749
 
8.4%
2 6413
 
6.9%
3 5039
 
5.4%
4 4491
 
4.8%
5 3974
 
4.3%
6 3736
 
4.0%
7 3448
 
3.7%
8 3335
 
3.6%
Other values (2) 6568
 
7.1%
Hangul
ValueCountFrequency (%)
11071
 
7.0%
10604
 
6.7%
10240
 
6.5%
10179
 
6.4%
10122
 
6.4%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
10000
 
6.3%
Other values (73) 55967
35.4%
None
ValueCountFrequency (%)
1191
100.0%

도로명주소
Text

UNIQUE 

Distinct10000
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-04-21T11:45:06.455184image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length35
Median length31
Mean length25.6329
Min length18

Characters and Unicode

Total characters256329
Distinct characters230
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10000 ?
Unique (%)100.0%

Sample

1st row제주특별자치도 서귀포시 문부로 12-5
2nd row제주특별자치도 서귀포시 남원읍 수은로 20-25
3rd row제주특별자치도 서귀포시 중산간동로 8244
4th row제주특별자치도 서귀포시 안덕면 병악로404번길 9
5th row제주특별자치도 서귀포시 장수로20번길 3-7
ValueCountFrequency (%)
제주특별자치도 10000
21.7%
서귀포시 10000
21.7%
남원읍 1944
 
4.2%
대정읍 1232
 
2.7%
성산읍 1149
 
2.5%
안덕면 983
 
2.1%
표선면 737
 
1.6%
중산간동로 290
 
0.6%
일주동로 260
 
0.6%
일주서로 135
 
0.3%
Other values (5445) 19315
41.9%
2024-04-21T11:45:06.930352image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
36045
 
14.1%
11460
 
4.5%
10564
 
4.1%
10240
 
4.0%
10234
 
4.0%
10182
 
4.0%
10090
 
3.9%
10087
 
3.9%
10024
 
3.9%
10000
 
3.9%
Other values (220) 127403
49.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 175709
68.5%
Decimal Number 40273
 
15.7%
Space Separator 36045
 
14.1%
Dash Punctuation 4302
 
1.7%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
11460
 
6.5%
10564
 
6.0%
10240
 
5.8%
10234
 
5.8%
10182
 
5.8%
10090
 
5.7%
10087
 
5.7%
10024
 
5.7%
10000
 
5.7%
10000
 
5.7%
Other values (208) 72828
41.4%
Decimal Number
ValueCountFrequency (%)
1 8206
20.4%
2 5631
14.0%
3 4239
10.5%
4 3854
9.6%
5 3591
8.9%
6 3437
8.5%
7 3047
 
7.6%
8 2882
 
7.2%
0 2721
 
6.8%
9 2665
 
6.6%
Space Separator
ValueCountFrequency (%)
36045
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 4302
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 175709
68.5%
Common 80620
31.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
11460
 
6.5%
10564
 
6.0%
10240
 
5.8%
10234
 
5.8%
10182
 
5.8%
10090
 
5.7%
10087
 
5.7%
10024
 
5.7%
10000
 
5.7%
10000
 
5.7%
Other values (208) 72828
41.4%
Common
ValueCountFrequency (%)
36045
44.7%
1 8206
 
10.2%
2 5631
 
7.0%
- 4302
 
5.3%
3 4239
 
5.3%
4 3854
 
4.8%
5 3591
 
4.5%
6 3437
 
4.3%
7 3047
 
3.8%
8 2882
 
3.6%
Other values (2) 5386
 
6.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 175709
68.5%
ASCII 80620
31.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
36045
44.7%
1 8206
 
10.2%
2 5631
 
7.0%
- 4302
 
5.3%
3 4239
 
5.3%
4 3854
 
4.8%
5 3591
 
4.5%
6 3437
 
4.3%
7 3047
 
3.8%
8 2882
 
3.6%
Other values (2) 5386
 
6.7%
Hangul
ValueCountFrequency (%)
11460
 
6.5%
10564
 
6.0%
10240
 
5.8%
10234
 
5.8%
10182
 
5.8%
10090
 
5.7%
10087
 
5.7%
10024
 
5.7%
10000
 
5.7%
10000
 
5.7%
Other values (208) 72828
41.4%
Distinct45
Distinct (%)0.5%
Missing1
Missing (%)< 0.1%
Memory size156.2 KiB
Minimum2003-12-31 00:00:00
Maximum2024-03-04 00:00:00
2024-04-21T11:45:07.054764image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-04-21T11:45:07.191818image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=45)
Distinct635
Distinct (%)6.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
Minimum2011-07-29 00:00:00
Maximum2024-03-27 00:00:00
2024-04-21T11:45:07.321067image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-04-21T11:45:07.462312image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
Distinct1374
Distinct (%)13.8%
Missing18
Missing (%)0.2%
Memory size156.2 KiB
2024-04-21T11:45:07.722179image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length94
Median length59
Mean length29.070928
Min length6

Characters and Unicode

Total characters290186
Distinct characters437
Distinct categories12 ?
Distinct scripts4 ?
Distinct blocks6 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique199 ?
Unique (%)2.0%

Sample

1st row예전에 살림이 궁색한 양반 "문부로"가 살았던 지역의 주변을 반영하여 부여
2nd row남원리 수은동지역 자연부락명칭 사용
3rd row중산간지역을 동쪽으로 순환도로 상징 의미부여
4th row병악로의 시작지점에서부터 약 4,040m지점에서 오른쪽으로 분기되는 도로
5th row장수로의 시작지점에서부터 약 200m지점에서 오른쪽으로 분기되는 도로
ValueCountFrequency (%)
도로 5131
 
8.7%
3991
 
6.7%
분기되는 3976
 
6.7%
시작지점에서부터 3952
 
6.7%
오른쪽으로 2067
 
3.5%
왼쪽으로 1920
 
3.2%
부여 1768
 
3.0%
상징 956
 
1.6%
의미 689
 
1.2%
반영하여 602
 
1.0%
Other values (1777) 34244
57.8%
2024-04-21T11:45:08.089847image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
49601
 
17.1%
19024
 
6.6%
10701
 
3.7%
10679
 
3.7%
9618
 
3.3%
9144
 
3.2%
8121
 
2.8%
6581
 
2.3%
6465
 
2.2%
5818
 
2.0%
Other values (427) 154434
53.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 217674
75.0%
Space Separator 49601
 
17.1%
Decimal Number 15171
 
5.2%
Lowercase Letter 4209
 
1.5%
Other Punctuation 2407
 
0.8%
Open Punctuation 472
 
0.2%
Close Punctuation 472
 
0.2%
Dash Punctuation 73
 
< 0.1%
Uppercase Letter 36
 
< 0.1%
Initial Punctuation 35
 
< 0.1%
Other values (2) 36
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
19024
 
8.7%
10701
 
4.9%
10679
 
4.9%
9618
 
4.4%
9144
 
4.2%
8121
 
3.7%
6581
 
3.0%
6465
 
3.0%
5818
 
2.7%
5446
 
2.5%
Other values (385) 126077
57.9%
Lowercase Letter
ValueCountFrequency (%)
m 4035
95.9%
k 22
 
0.5%
t 16
 
0.4%
a 16
 
0.4%
u 16
 
0.4%
l 16
 
0.4%
o 16
 
0.4%
i 16
 
0.4%
y 8
 
0.2%
c 8
 
0.2%
Other values (5) 40
 
1.0%
Decimal Number
ValueCountFrequency (%)
0 4895
32.3%
1 2344
15.5%
2 1754
 
11.6%
4 1031
 
6.8%
3 999
 
6.6%
6 888
 
5.9%
5 847
 
5.6%
8 809
 
5.3%
7 808
 
5.3%
9 796
 
5.2%
Other Punctuation
ValueCountFrequency (%)
2129
88.5%
. 139
 
5.8%
" 116
 
4.8%
: 15
 
0.6%
' 8
 
0.3%
Uppercase Letter
ValueCountFrequency (%)
G 8
22.2%
E 8
22.2%
J 8
22.2%
C 8
22.2%
R 4
11.1%
Space Separator
ValueCountFrequency (%)
49601
100.0%
Open Punctuation
ValueCountFrequency (%)
( 472
100.0%
Close Punctuation
ValueCountFrequency (%)
) 472
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 73
100.0%
Initial Punctuation
ValueCountFrequency (%)
35
100.0%
Final Punctuation
ValueCountFrequency (%)
35
100.0%
Other Symbol
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 217654
75.0%
Common 68267
 
23.5%
Latin 4245
 
1.5%
Han 20
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
19024
 
8.7%
10701
 
4.9%
10679
 
4.9%
9618
 
4.4%
9144
 
4.2%
8121
 
3.7%
6581
 
3.0%
6465
 
3.0%
5818
 
2.7%
5446
 
2.5%
Other values (383) 126057
57.9%
Common
ValueCountFrequency (%)
49601
72.7%
0 4895
 
7.2%
1 2344
 
3.4%
2129
 
3.1%
2 1754
 
2.6%
4 1031
 
1.5%
3 999
 
1.5%
6 888
 
1.3%
5 847
 
1.2%
8 809
 
1.2%
Other values (12) 2970
 
4.4%
Latin
ValueCountFrequency (%)
m 4035
95.1%
k 22
 
0.5%
t 16
 
0.4%
a 16
 
0.4%
u 16
 
0.4%
l 16
 
0.4%
o 16
 
0.4%
i 16
 
0.4%
G 8
 
0.2%
E 8
 
0.2%
Other values (10) 76
 
1.8%
Han
ValueCountFrequency (%)
10
50.0%
10
50.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 217654
75.0%
ASCII 70312
 
24.2%
None 2129
 
0.7%
Punctuation 70
 
< 0.1%
CJK 20
 
< 0.1%
CJK Compat 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
49601
70.5%
0 4895
 
7.0%
m 4035
 
5.7%
1 2344
 
3.3%
2 1754
 
2.5%
4 1031
 
1.5%
3 999
 
1.4%
6 888
 
1.3%
5 847
 
1.2%
8 809
 
1.2%
Other values (28) 3109
 
4.4%
Hangul
ValueCountFrequency (%)
19024
 
8.7%
10701
 
4.9%
10679
 
4.9%
9618
 
4.4%
9144
 
4.2%
8121
 
3.7%
6581
 
3.0%
6465
 
3.0%
5818
 
2.7%
5446
 
2.5%
Other values (383) 126057
57.9%
None
ValueCountFrequency (%)
2129
100.0%
Punctuation
ValueCountFrequency (%)
35
50.0%
35
50.0%
CJK
ValueCountFrequency (%)
10
50.0%
10
50.0%
CJK Compat
ValueCountFrequency (%)
1
100.0%

Missing values

2024-04-21T11:45:05.151785image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-04-21T11:45:05.239410image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2024-04-21T11:45:05.325580image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

종전주소도로명주소도로명고시일도로명주소고시일도로명부여사유
6779제주특별자치도 서귀포시 동홍동 430-29제주특별자치도 서귀포시 문부로 12-52009-12-312011-07-29예전에 살림이 궁색한 양반 "문부로"가 살았던 지역의 주변을 반영하여 부여
38752제주특별자치도 서귀포시 남원읍 남원리 1550제주특별자치도 서귀포시 남원읍 수은로 20-252011-10-272011-10-26남원리 수은동지역 자연부락명칭 사용
4818제주특별자치도 서귀포시 호근동 801-1제주특별자치도 서귀포시 중산간동로 82442009-04-132019-02-07중산간지역을 동쪽으로 순환도로 상징 의미부여
55433제주특별자치도 서귀포시 안덕면 상천리 471-9제주특별자치도 서귀포시 안덕면 병악로404번길 92009-12-312011-07-29병악로의 시작지점에서부터 약 4,040m지점에서 오른쪽으로 분기되는 도로
7719제주특별자치도 서귀포시 동홍동 1523제주특별자치도 서귀포시 장수로20번길 3-72009-12-312011-07-29장수로의 시작지점에서부터 약 200m지점에서 오른쪽으로 분기되는 도로
60528제주특별자치도 서귀포시 표선면 하천리 433-1제주특별자치도 서귀포시 표선면 하천달산로 65-102009-12-312011-07-29구간에 달산봉(오름)이 있는 지역특성을 반영
20941제주특별자치도 서귀포시 강정동 330-2제주특별자치도 서귀포시 월드컵로30번길 382009-12-312011-07-29월드컵로의 시작지점에서부터 약 300m지점에서 오른쪽으로 분기되는 도로
1465제주특별자치도 서귀포시 서귀동 321-19제주특별자치도 서귀포시 서문로41번길 1-12009-12-312011-07-29서문로의 시작지점에서부터 약 410m지점에서 왼쪽으로 분기되는 도로
26016제주특별자치도 서귀포시 대정읍 하모리 1417-4제주특별자치도 서귀포시 대정읍 동일하모로 206-12009-12-312011-07-29제 2훈련소 정문 및 강병대 교회가 있어 쉽게 위치를 인지할수 있음
24092제주특별자치도 서귀포시 하예동 1029-1제주특별자치도 서귀포시 예래로 322-92009-12-312011-07-29예래동의 지역명칭 적용
종전주소도로명주소도로명고시일도로명주소고시일도로명부여사유
9200제주특별자치도 서귀포시 서홍동 744-25제주특별자치도 서귀포시 남성로 1232009-12-312011-07-29남성마을 안길을 의미하여 부여
21615제주특별자치도 서귀포시 도순동 1108제주특별자치도 서귀포시 일주서로344번길 972009-12-312011-07-29일주서로의 시작지점에서부터 약 3,440m지점에서 오른쪽으로 분기되는 도로
33170제주특별자치도 서귀포시 남원읍 남원리 2299제주특별자치도 서귀포시 남원읍 일주동로 7331-52009-04-132011-07-29제주도를 동쪽으로 순환 일주도로 상징 의미 부여
57949제주특별자치도 서귀포시 표선면 토산리 440-5제주특별자치도 서귀포시 표선면 일주동로 6480-52009-04-132011-07-29제주도를 동쪽으로 순환 일주도로 상징 의미 부여
61285제주특별자치도 서귀포시 표선면 세화리 684-4제주특별자치도 서귀포시 표선면 돈오름로23번길 36-462009-12-312013-07-16돈오름로의 시작지점에서부터 약 230m지점에서 왼쪽으로 분기되는 도로
30086제주특별자치도 서귀포시 대정읍 상모리 3825-14제주특별자치도 서귀포시 대정읍 상모대서로44번길 5-42009-12-312011-07-29상모대서로의 시작지점에서부터 약 440m지점에서 오른쪽으로 분기되는 도로
59296제주특별자치도 서귀포시 표선면 세화리 399-6제주특별자치도 서귀포시 표선면 세성로 105-32009-12-312016-07-12성읍리에서 표선면 세화리로 가는 도로
52037제주특별자치도 서귀포시 안덕면 감산리 363-3제주특별자치도 서귀포시 안덕면 감산중로 16-112009-12-312011-07-29감산마을 동측에 위치한 도로
7638제주특별자치도 서귀포시 동홍동 440제주특별자치도 서귀포시 문부로11번길 212009-12-312015-01-20문부로 시작지점에서부터 약 110m지점에서 왼쪽으로 분기되는 도로
31395제주특별자치도 서귀포시 대정읍 무릉리 442-15제주특별자치도 서귀포시 대정읍 중산간서로2881번길 862009-12-312021-09-14중산간서로의 시작지점에서부터 약 28,810m지점에서 왼쪽으로 분기되는 도로