Overview

Dataset statistics

Number of variables14
Number of observations10000
Missing cells15574
Missing cells (%)11.1%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory1.1 MiB
Average record size in memory120.0 B

Variable types

Text7
Categorical7

Dataset

Description프로젝트코드,지자체코드,입안계획유형,입안업무유형,업무절차,처리상태,담당자,담당부서,안건명,안건사유,입안자,결정권자,안건목적,위치
Author서울특별시
URLhttps://data.seoul.go.kr/dataList/OA-20284/S/1/datasetView.do

Alerts

입안업무유형 is highly overall correlated with 입안계획유형High correlation
결정권자 is highly overall correlated with 입안계획유형 and 1 other fieldsHigh correlation
입안계획유형 is highly overall correlated with 지자체코드 and 5 other fieldsHigh correlation
지자체코드 is highly overall correlated with 입안계획유형High correlation
처리상태 is highly overall correlated with 입안계획유형High correlation
업무절차 is highly overall correlated with 입안계획유형High correlation
입안자 is highly overall correlated with 입안계획유형 and 1 other fieldsHigh correlation
입안계획유형 is highly imbalanced (93.3%)Imbalance
업무절차 is highly imbalanced (61.3%)Imbalance
처리상태 is highly imbalanced (70.6%)Imbalance
안건사유 has 4805 (48.0%) missing valuesMissing
안건목적 has 6098 (61.0%) missing valuesMissing
위치 has 4671 (46.7%) missing valuesMissing
프로젝트코드 has unique valuesUnique

Reproduction

Analysis started2024-04-29 20:08:28.859967
Analysis finished2024-04-29 20:08:33.169637
Duration4.31 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

프로젝트코드
Text

UNIQUE 

Distinct10000
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-04-30T05:08:33.293703image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length20
Median length20
Mean length20
Min length20

Characters and Unicode

Total characters200000
Distinct characters12
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10000 ?
Unique (%)100.0%

Sample

1st row11000PPL200706071101
2nd row11000PPL202403060055
3rd row11000PPL200703020788
4th row11000PPL999901011474
5th row11530PPL202309220003
ValueCountFrequency (%)
11000ppl200706071101 1
 
< 0.1%
11000ppl201104216058 1
 
< 0.1%
11000ppl200712281704 1
 
< 0.1%
11000ppl200704050898 1
 
< 0.1%
11000ppl201903290093 1
 
< 0.1%
11000ppl201506117495 1
 
< 0.1%
11000ppl200812102434 1
 
< 0.1%
11000ppl201510297625 1
 
< 0.1%
11290ppl202108200002 1
 
< 0.1%
11000ppl200611230529 1
 
< 0.1%
Other values (9990) 9990
99.9%
2024-04-30T05:08:33.577940image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 63324
31.7%
1 37827
18.9%
2 22383
 
11.2%
P 20000
 
10.0%
L 10000
 
5.0%
9 7952
 
4.0%
3 7349
 
3.7%
7 6622
 
3.3%
6 6440
 
3.2%
5 6154
 
3.1%
Other values (2) 11949
 
6.0%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 170000
85.0%
Uppercase Letter 30000
 
15.0%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
0 63324
37.2%
1 37827
22.3%
2 22383
 
13.2%
9 7952
 
4.7%
3 7349
 
4.3%
7 6622
 
3.9%
6 6440
 
3.8%
5 6154
 
3.6%
8 6060
 
3.6%
4 5889
 
3.5%
Uppercase Letter
ValueCountFrequency (%)
P 20000
66.7%
L 10000
33.3%

Most occurring scripts

ValueCountFrequency (%)
Common 170000
85.0%
Latin 30000
 
15.0%

Most frequent character per script

Common
ValueCountFrequency (%)
0 63324
37.2%
1 37827
22.3%
2 22383
 
13.2%
9 7952
 
4.7%
3 7349
 
4.3%
7 6622
 
3.9%
6 6440
 
3.8%
5 6154
 
3.6%
8 6060
 
3.6%
4 5889
 
3.5%
Latin
ValueCountFrequency (%)
P 20000
66.7%
L 10000
33.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 200000
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 63324
31.7%
1 37827
18.9%
2 22383
 
11.2%
P 20000
 
10.0%
L 10000
 
5.0%
9 7952
 
4.0%
3 7349
 
3.7%
7 6622
 
3.3%
6 6440
 
3.2%
5 6154
 
3.1%
Other values (2) 11949
 
6.0%

지자체코드
Categorical

HIGH CORRELATION 

Distinct27
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
서울특별시
5416 
마포구
 
257
동작구
 
253
구로구
 
242
성북구
 
241
Other values (22)
3591 

Length

Max length5
Median length5
Mean length4.1215
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row서울특별시
2nd row강북구
3rd row서울특별시
4th row서울특별시
5th row구로구

Common Values

ValueCountFrequency (%)
서울특별시 5416
54.2%
마포구 257
 
2.6%
동작구 253
 
2.5%
구로구 242
 
2.4%
성북구 241
 
2.4%
은평구 228
 
2.3%
영등포구 223
 
2.2%
중구 223
 
2.2%
강북구 219
 
2.2%
서초구 216
 
2.2%
Other values (17) 2482
24.8%

Length

2024-04-30T05:08:33.717424image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
서울특별시 5416
54.2%
마포구 257
 
2.6%
동작구 253
 
2.5%
구로구 242
 
2.4%
성북구 241
 
2.4%
은평구 228
 
2.3%
영등포구 223
 
2.2%
중구 223
 
2.2%
강북구 219
 
2.2%
서초구 216
 
2.2%
Other values (17) 2482
24.8%

입안계획유형
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
도시관리계획
9920 
<NA>
 
80

Length

Max length6
Median length6
Mean length5.984
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row도시관리계획
2nd row도시관리계획
3rd row도시관리계획
4th row도시관리계획
5th row도시관리계획

Common Values

ValueCountFrequency (%)
도시관리계획 9920
99.2%
<NA> 80
 
0.8%

Length

2024-04-30T05:08:34.003942image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-30T05:08:34.094823image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
도시관리계획 9920
99.2%
na 80
 
0.8%

입안업무유형
Categorical

HIGH CORRELATION 

Distinct7
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
도시계획시설
3175 
정비 및 개발사업
2698 
도시계획시설사업
2681 
지구단위계획
1150 
용도지역/지구/구역
 
248
Other values (2)
 
48

Length

Max length10
Median length9
Mean length7.4258
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row도시계획시설사업
2nd row정비 및 개발사업
3rd row정비 및 개발사업
4th row도시계획시설
5th row도시계획시설사업

Common Values

ValueCountFrequency (%)
도시계획시설 3175
31.8%
정비 및 개발사업 2698
27.0%
도시계획시설사업 2681
26.8%
지구단위계획 1150
 
11.5%
용도지역/지구/구역 248
 
2.5%
기타 47
 
0.5%
<NA> 1
 
< 0.1%

Length

2024-04-30T05:08:34.187339image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-30T05:08:34.297792image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
도시계획시설 3175
20.6%
정비 2698
17.5%
2698
17.5%
개발사업 2698
17.5%
도시계획시설사업 2681
17.4%
지구단위계획 1150
 
7.5%
용도지역/지구/구역 248
 
1.6%
기타 47
 
0.3%
na 1
 
< 0.1%

업무절차
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct14
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
결정고시관리
6546 
계획안 완료
2238 
열람공고 및 의견청취
747 
기초조사 및 공공기여
 
257
입안도형/조서
 
77
Other values (9)
 
135

Length

Max length11
Median length6
Mean length6.5139
Min length4

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row결정고시관리
2nd row열람공고 및 의견청취
3rd row결정고시관리
4th row열람공고 및 의견청취
5th row기초조사 및 공공기여

Common Values

ValueCountFrequency (%)
결정고시관리 6546
65.5%
계획안 완료 2238
 
22.4%
열람공고 및 의견청취 747
 
7.5%
기초조사 및 공공기여 257
 
2.6%
입안도형/조서 77
 
0.8%
계획안 생성 34
 
0.3%
입안부서 제공자료 30
 
0.3%
부서협의 29
 
0.3%
실시계획인가 14
 
0.1%
결정(변경)요청 10
 
0.1%
Other values (4) 18
 
0.2%

Length

2024-04-30T05:08:34.408759image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
결정고시관리 6546
45.7%
계획안 2272
 
15.9%
완료 2238
 
15.6%
1004
 
7.0%
열람공고 747
 
5.2%
의견청취 747
 
5.2%
기초조사 257
 
1.8%
공공기여 257
 
1.8%
입안도형/조서 77
 
0.5%
생성 34
 
0.2%
Other values (10) 138
 
1.0%

처리상태
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct9
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
종료
8358 
진행중
944 
공고완료
 
386
고시완료
 
139
공고등록
 
85
Other values (4)
 
88

Length

Max length4
Median length2
Mean length2.234
Min length2

Unique

Unique2 ?
Unique (%)< 0.1%

Sample

1st row종료
2nd row고시완료
3rd row종료
4th row진행중
5th row공고완료

Common Values

ValueCountFrequency (%)
종료 8358
83.6%
진행중 944
 
9.4%
공고완료 386
 
3.9%
고시완료 139
 
1.4%
공고등록 85
 
0.9%
고시등록 49
 
0.5%
공고보완 37
 
0.4%
<NA> 1
 
< 0.1%
단계완료 1
 
< 0.1%

Length

2024-04-30T05:08:34.519991image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-30T05:08:34.619734image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
종료 8358
83.6%
진행중 944
 
9.4%
공고완료 386
 
3.9%
고시완료 139
 
1.4%
공고등록 85
 
0.9%
고시등록 49
 
0.5%
공고보완 37
 
0.4%
na 1
 
< 0.1%
단계완료 1
 
< 0.1%
Distinct1181
Distinct (%)11.8%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-04-30T05:08:34.923020image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length8
Median length3
Mean length5.2781
Min length2

Characters and Unicode

Total characters52781
Distinct characters212
Distinct categories5 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique461 ?
Unique (%)4.6%

Sample

1st rowsysadmin
2nd row함준기
3rd rowsysadmin
4th rowsysadmin
5th row권정빈
ValueCountFrequency (%)
sysadmin 4545
45.5%
김선화 137
 
1.4%
함준기 119
 
1.2%
구축자1 79
 
0.8%
이종명 71
 
0.7%
정다희 60
 
0.6%
송유진 59
 
0.6%
안시현 51
 
0.5%
정성일 51
 
0.5%
이세림 50
 
0.5%
Other values (1171) 4778
47.8%
2024-04-30T05:08:35.348086image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
s 9090
17.2%
y 4545
 
8.6%
a 4545
 
8.6%
d 4545
 
8.6%
m 4545
 
8.6%
i 4545
 
8.6%
n 4545
 
8.6%
1191
 
2.3%
771
 
1.5%
715
 
1.4%
Other values (202) 13744
26.0%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 36360
68.9%
Other Letter 16339
31.0%
Decimal Number 79
 
0.1%
Space Separator 2
 
< 0.1%
Connector Punctuation 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
1191
 
7.3%
771
 
4.7%
715
 
4.4%
499
 
3.1%
451
 
2.8%
442
 
2.7%
369
 
2.3%
369
 
2.3%
343
 
2.1%
334
 
2.0%
Other values (192) 10855
66.4%
Lowercase Letter
ValueCountFrequency (%)
s 9090
25.0%
y 4545
12.5%
a 4545
12.5%
d 4545
12.5%
m 4545
12.5%
i 4545
12.5%
n 4545
12.5%
Decimal Number
ValueCountFrequency (%)
1 79
100.0%
Space Separator
ValueCountFrequency (%)
2
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 36360
68.9%
Hangul 16339
31.0%
Common 82
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
1191
 
7.3%
771
 
4.7%
715
 
4.4%
499
 
3.1%
451
 
2.8%
442
 
2.7%
369
 
2.3%
369
 
2.3%
343
 
2.1%
334
 
2.0%
Other values (192) 10855
66.4%
Latin
ValueCountFrequency (%)
s 9090
25.0%
y 4545
12.5%
a 4545
12.5%
d 4545
12.5%
m 4545
12.5%
i 4545
12.5%
n 4545
12.5%
Common
ValueCountFrequency (%)
1 79
96.3%
2
 
2.4%
_ 1
 
1.2%

Most occurring blocks

ValueCountFrequency (%)
ASCII 36442
69.0%
Hangul 16339
31.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
s 9090
24.9%
y 4545
12.5%
a 4545
12.5%
d 4545
12.5%
m 4545
12.5%
i 4545
12.5%
n 4545
12.5%
1 79
 
0.2%
2
 
< 0.1%
_ 1
 
< 0.1%
Hangul
ValueCountFrequency (%)
1191
 
7.3%
771
 
4.7%
715
 
4.4%
499
 
3.1%
451
 
2.8%
442
 
2.7%
369
 
2.3%
369
 
2.3%
343
 
2.1%
334
 
2.0%
Other values (192) 10855
66.4%
Distinct333
Distinct (%)3.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-04-30T05:08:35.565327image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length30
Median length29
Mean length17.9613
Min length3

Characters and Unicode

Total characters179613
Distinct characters175
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique74 ?
Unique (%)0.7%

Sample

1st row서울특별시 도시계획국 도시계획과
2nd row서울특별시 주택정책실 주거환경개선과
3rd row서울특별시 도시계획국 도시계획과
4th row서울특별시 도시계획국 도시계획과
5th row서울특별시 구로구 주택정책국 도시계획과
ValueCountFrequency (%)
서울특별시 9994
30.8%
도시계획과 6491
20.0%
도시계획국 4841
14.9%
도시관리국 1514
 
4.7%
도시환경국 536
 
1.7%
마포구 290
 
0.9%
강서구 274
 
0.8%
주택정책실 273
 
0.8%
동작구 258
 
0.8%
강동구 191
 
0.6%
Other values (271) 7811
24.1%
2024-04-30T05:08:35.880439image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
25350
14.1%
22473
12.5%
15711
 
8.7%
11886
 
6.6%
11516
 
6.4%
10573
 
5.9%
10011
 
5.6%
9994
 
5.6%
9994
 
5.6%
8975
 
5.0%
Other values (165) 43130
24.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 157129
87.5%
Space Separator 22473
 
12.5%
Decimal Number 11
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
25350
16.1%
15711
10.0%
11886
 
7.6%
11516
 
7.3%
10573
 
6.7%
10011
 
6.4%
9994
 
6.4%
9994
 
6.4%
8975
 
5.7%
8336
 
5.3%
Other values (162) 34783
22.1%
Decimal Number
ValueCountFrequency (%)
1 8
72.7%
2 3
 
27.3%
Space Separator
ValueCountFrequency (%)
22473
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 157129
87.5%
Common 22484
 
12.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
25350
16.1%
15711
10.0%
11886
 
7.6%
11516
 
7.3%
10573
 
6.7%
10011
 
6.4%
9994
 
6.4%
9994
 
6.4%
8975
 
5.7%
8336
 
5.3%
Other values (162) 34783
22.1%
Common
ValueCountFrequency (%)
22473
> 99.9%
1 8
 
< 0.1%
2 3
 
< 0.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 157129
87.5%
ASCII 22484
 
12.5%

Most frequent character per block

Hangul
ValueCountFrequency (%)
25350
16.1%
15711
10.0%
11886
 
7.6%
11516
 
7.3%
10573
 
6.7%
10011
 
6.4%
9994
 
6.4%
9994
 
6.4%
8975
 
5.7%
8336
 
5.3%
Other values (162) 34783
22.1%
ASCII
ValueCountFrequency (%)
22473
> 99.9%
1 8
 
< 0.1%
2 3
 
< 0.1%
Distinct7826
Distinct (%)78.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-04-30T05:08:36.096955image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length144
Median length92
Mean length33.4607
Min length1

Characters and Unicode

Total characters334607
Distinct characters555
Distinct categories18 ?
Distinct scripts3 ?
Distinct blocks9 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique6842 ?
Unique (%)68.4%

Sample

1st row창천주거환경개선정비구역및정비계획변경에따른지형도면
2nd row수유제2지구 ○ 2023. 08. 04. 주거환경개선계획 변경결정 (강북구고시 제2023-82호)사업시행기간변경(1년 연장)
3rd row신공덕제4주택재개발정비구역변경지정
4th row도시계획시설(공공공지)
5th row도시관리계획(도시계획시설:도로) 결정(안)
ValueCountFrequency (%)
5243
 
10.1%
지형도면 3929
 
7.6%
고시 3323
 
6.4%
결정 1317
 
2.5%
변경결정 1190
 
2.3%
변경 1163
 
2.2%
결정(변경 955
 
1.8%
지구단위계획 700
 
1.4%
지정 642
 
1.2%
일대 532
 
1.0%
Other values (9374) 32827
63.3%
2024-04-30T05:08:36.488899image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
42271
 
12.6%
16363
 
4.9%
13714
 
4.1%
13382
 
4.0%
13279
 
4.0%
11539
 
3.4%
11301
 
3.4%
10146
 
3.0%
9312
 
2.8%
( 9265
 
2.8%
Other values (545) 184035
55.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 247018
73.8%
Space Separator 42271
 
12.6%
Decimal Number 19898
 
5.9%
Open Punctuation 9523
 
2.8%
Close Punctuation 9512
 
2.8%
Other Punctuation 3281
 
1.0%
Dash Punctuation 2700
 
0.8%
Uppercase Letter 99
 
< 0.1%
Math Symbol 98
 
< 0.1%
Other Symbol 79
 
< 0.1%
Other values (8) 128
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
16363
 
6.6%
13714
 
5.6%
13382
 
5.4%
13279
 
5.4%
11539
 
4.7%
11301
 
4.6%
10146
 
4.1%
9312
 
3.8%
7443
 
3.0%
6230
 
2.5%
Other values (458) 134309
54.4%
Uppercase Letter
ValueCountFrequency (%)
C 18
18.2%
I 15
15.2%
A 14
14.1%
T 8
8.1%
B 6
 
6.1%
E 5
 
5.1%
J 5
 
5.1%
D 5
 
5.1%
M 5
 
5.1%
R 4
 
4.0%
Other values (7) 14
14.1%
Other Punctuation
ValueCountFrequency (%)
, 1433
43.7%
: 823
25.1%
? 414
 
12.6%
. 407
 
12.4%
125
 
3.8%
/ 39
 
1.2%
34
 
1.0%
& 2
 
0.1%
# 2
 
0.1%
* 1
 
< 0.1%
Decimal Number
ValueCountFrequency (%)
1 5209
26.2%
2 3729
18.7%
0 2453
12.3%
3 1797
 
9.0%
4 1534
 
7.7%
5 1316
 
6.6%
6 1201
 
6.0%
7 1008
 
5.1%
8 841
 
4.2%
9 810
 
4.1%
Open Punctuation
ValueCountFrequency (%)
( 9265
97.3%
[ 179
 
1.9%
39
 
0.4%
19
 
0.2%
8
 
0.1%
7
 
0.1%
5
 
0.1%
1
 
< 0.1%
Close Punctuation
ValueCountFrequency (%)
) 9259
97.3%
] 179
 
1.9%
39
 
0.4%
19
 
0.2%
6
 
0.1%
5
 
0.1%
4
 
< 0.1%
1
 
< 0.1%
Lowercase Letter
ValueCountFrequency (%)
t 6
31.6%
s 4
21.1%
e 3
15.8%
i 2
 
10.5%
m 1
 
5.3%
c 1
 
5.3%
u 1
 
5.3%
p 1
 
5.3%
Letter Number
ValueCountFrequency (%)
6
23.1%
6
23.1%
6
23.1%
4
15.4%
3
11.5%
1
 
3.8%
Math Symbol
ValueCountFrequency (%)
~ 80
81.6%
8
 
8.2%
> 5
 
5.1%
< 4
 
4.1%
+ 1
 
1.0%
Other Number
ValueCountFrequency (%)
4
50.0%
3
37.5%
1
 
12.5%
Other Symbol
ValueCountFrequency (%)
76
96.2%
3
 
3.8%
Initial Punctuation
ValueCountFrequency (%)
4
80.0%
1
 
20.0%
Final Punctuation
ValueCountFrequency (%)
4
80.0%
1
 
20.0%
Space Separator
ValueCountFrequency (%)
42271
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 2700
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 63
100.0%
Modifier Symbol
ValueCountFrequency (%)
` 1
100.0%
Control
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 247018
73.8%
Common 87445
 
26.1%
Latin 144
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
16363
 
6.6%
13714
 
5.6%
13382
 
5.4%
13279
 
5.4%
11539
 
4.7%
11301
 
4.6%
10146
 
4.1%
9312
 
3.8%
7443
 
3.0%
6230
 
2.5%
Other values (458) 134309
54.4%
Common
ValueCountFrequency (%)
42271
48.3%
( 9265
 
10.6%
) 9259
 
10.6%
1 5209
 
6.0%
2 3729
 
4.3%
- 2700
 
3.1%
0 2453
 
2.8%
3 1797
 
2.1%
4 1534
 
1.8%
, 1433
 
1.6%
Other values (46) 7795
 
8.9%
Latin
ValueCountFrequency (%)
C 18
 
12.5%
I 15
 
10.4%
A 14
 
9.7%
T 8
 
5.6%
B 6
 
4.2%
6
 
4.2%
6
 
4.2%
6
 
4.2%
t 6
 
4.2%
E 5
 
3.5%
Other values (21) 54
37.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 246928
73.8%
ASCII 87146
 
26.0%
None 312
 
0.1%
Compat Jamo 90
 
< 0.1%
Geometric Shapes 76
 
< 0.1%
Number Forms 26
 
< 0.1%
Enclosed Alphanum 11
 
< 0.1%
Punctuation 10
 
< 0.1%
Arrows 8
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
42271
48.5%
( 9265
 
10.6%
) 9259
 
10.6%
1 5209
 
6.0%
2 3729
 
4.3%
- 2700
 
3.1%
0 2453
 
2.8%
3 1797
 
2.1%
4 1534
 
1.8%
, 1433
 
1.6%
Other values (47) 7496
 
8.6%
Hangul
ValueCountFrequency (%)
16363
 
6.6%
13714
 
5.6%
13382
 
5.4%
13279
 
5.4%
11539
 
4.7%
11301
 
4.6%
10146
 
4.1%
9312
 
3.8%
7443
 
3.0%
6230
 
2.5%
Other values (449) 134219
54.4%
None
ValueCountFrequency (%)
125
40.1%
39
 
12.5%
39
 
12.5%
34
 
10.9%
19
 
6.1%
19
 
6.1%
8
 
2.6%
7
 
2.2%
6
 
1.9%
5
 
1.6%
Other values (4) 11
 
3.5%
Geometric Shapes
ValueCountFrequency (%)
76
100.0%
Compat Jamo
ValueCountFrequency (%)
73
81.1%
6
 
6.7%
3
 
3.3%
2
 
2.2%
2
 
2.2%
1
 
1.1%
1
 
1.1%
1
 
1.1%
1
 
1.1%
Arrows
ValueCountFrequency (%)
8
100.0%
Number Forms
ValueCountFrequency (%)
6
23.1%
6
23.1%
6
23.1%
4
15.4%
3
11.5%
1
 
3.8%
Punctuation
ValueCountFrequency (%)
4
40.0%
4
40.0%
1
 
10.0%
1
 
10.0%
Enclosed Alphanum
ValueCountFrequency (%)
4
36.4%
3
27.3%
3
27.3%
1
 
9.1%

안건사유
Text

MISSING 

Distinct4761
Distinct (%)91.6%
Missing4805
Missing (%)48.0%
Memory size156.2 KiB
2024-04-30T05:08:36.745586image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length1024
Median length692
Mean length130.28835
Min length1

Characters and Unicode

Total characters676848
Distinct characters777
Distinct categories19 ?
Distinct scripts4 ?
Distinct blocks13 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique4549 ?
Unique (%)87.6%

Sample

1st row1. 건설부고시 제1992-561호(1992.10.23.)로 주거환경개선지구 지정, 서울특별시고시 제1993-243호(1993.8.9.)로 개선계획 수립, 서울특별시고시 제1994-203호(1994.6.20.), 서울특별시고시 제1994-339호(1994.10.15.), 강북구고시 제1995-38호(1995.10.16), 강북구고시 제1996-39호(1996.7.18.)로 개선계획 변경결정, 서울시고시 제1998-24호(1998.1.30.)로 지구지정 변경, 강북구고시 제1998-12호(1998.2.10.), 강북구고시 제2000-9호(2000.2.21.), 강북구고시 제2002-107호(2002.12.30.), 강북구고시 제2003-57호(2003.7.14.), 강북구고시 제2006-50호 (2006.7.20.), 강북구고시 제2007-48호(2007.6.14.), 강북구고시 제2009-48호(2009.7.30.), 강북구고시 제2010-46호(2010.7.22.), 강북구고시 제2011-29호(2011.7.28.), 강북구고시 제2012-148호(2012.7.27.), 강북구고시 제2013-195호(2013.8.1.), 강북구고시 제2014-204호(2014.9.11.), 강북구고시 제2015-182호(2015.8.13.), 강북구고시 제2016-123호(2016.8.5.), 강북구고시 제2017-108호(2017.8.9.), 강북구고시 제2018-114호(2018.8.10.), 강북구고시 제2019-119호(2018.8.23.), 강북구고시 제2020-126호(2020.8.8.), 강북구고시 제2021-149호(2021.7.30.), 강북구고시 제2022-102호(2022.7.29.)로 주거환경개선계획 변경결정 된 수유제2주거환경개선지구에 대하여, 2. 주거환경개선사업 미완료에 따라 「도시 및 주거환경정비법」 제7조 제1항, 같은법 시행령 제6조 제4항에 따라 주거환경개선계획을 변경수립하고 같은법 제16조 제2항에 따라 다음과 같이 고시합니다.
2nd row항동 철길로 단절된 막다른 도로로써, 서해안로를 이용하는 지역 주민들의 통행 불편 해소 및 인근 도로와 연결성 있는 도로를 개설하고자 도시계획시설(도로) 결정하고자 함.
3rd row구로구 신도림동 361번지에 위치한 대성주유소(GS칼텍스)는 대성디큐브시티 교통영향분석개선대책 수립결과에 따라 도시계획선에 맞추어 도로가 확폭되어 대지규모가 축소됨에 따라 주유차량의 접근이 원활하지 못하여 경인로변 차량불허구간의 일부를 변경하기 위한 도시관리계획(제1종지구단위계획) 결정(변경) 사항임
4th row측량성과로 인한 경계보정에 따른 면적 정정
5th row마곡도시개발사업 개발계획변경수립 및 실시계획변경인가
ValueCountFrequency (%)
6526
 
5.5%
따라 2076
 
1.8%
변경 1683
 
1.4%
서울특별시고시 1381
 
1.2%
관한 1355
 
1.1%
규정에 1288
 
1.1%
시행령 1259
 
1.1%
대하여 1166
 
1.0%
강북구고시 1154
 
1.0%
1112
 
0.9%
Other values (22383) 99619
84.0%
2024-04-30T05:08:37.118512image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
120277
 
17.8%
2 20143
 
3.0%
19252
 
2.8%
1 17536
 
2.6%
0 16941
 
2.5%
. 16383
 
2.4%
13367
 
2.0%
12708
 
1.9%
12084
 
1.8%
10646
 
1.6%
Other values (767) 417511
61.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 408393
60.3%
Space Separator 120278
 
17.8%
Decimal Number 88868
 
13.1%
Other Punctuation 25659
 
3.8%
Close Punctuation 12924
 
1.9%
Open Punctuation 12846
 
1.9%
Dash Punctuation 5863
 
0.9%
Other Symbol 694
 
0.1%
Math Symbol 319
 
< 0.1%
Uppercase Letter 289
 
< 0.1%
Other values (9) 715
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
19252
 
4.7%
13367
 
3.3%
12708
 
3.1%
12084
 
3.0%
10646
 
2.6%
10143
 
2.5%
9657
 
2.4%
8935
 
2.2%
8392
 
2.1%
8245
 
2.0%
Other values (641) 294964
72.2%
Uppercase Letter
ValueCountFrequency (%)
D 39
13.5%
C 32
11.1%
I 27
9.3%
B 25
 
8.7%
S 22
 
7.6%
L 19
 
6.6%
A 17
 
5.9%
E 16
 
5.5%
K 13
 
4.5%
R 12
 
4.2%
Other values (15) 67
23.2%
Lowercase Letter
ValueCountFrequency (%)
m 87
41.4%
t 20
 
9.5%
k 13
 
6.2%
r 12
 
5.7%
l 10
 
4.8%
i 9
 
4.3%
x 9
 
4.3%
o 8
 
3.8%
s 7
 
3.3%
h 6
 
2.9%
Other values (8) 29
 
13.8%
Other Punctuation
ValueCountFrequency (%)
. 16383
63.8%
, 7169
27.9%
: 851
 
3.3%
? 570
 
2.2%
344
 
1.3%
' 125
 
0.5%
59
 
0.2%
% 48
 
0.2%
40
 
0.2%
/ 30
 
0.1%
Other values (5) 40
 
0.2%
Other Symbol
ValueCountFrequency (%)
396
57.1%
255
36.7%
14
 
2.0%
8
 
1.2%
6
 
0.9%
5
 
0.7%
4
 
0.6%
2
 
0.3%
1
 
0.1%
1
 
0.1%
Other values (2) 2
 
0.3%
Decimal Number
ValueCountFrequency (%)
2 20143
22.7%
1 17536
19.7%
0 16941
19.1%
3 6192
 
7.0%
9 6106
 
6.9%
8 4767
 
5.4%
4 4398
 
4.9%
6 4327
 
4.9%
5 4231
 
4.8%
7 4227
 
4.8%
Math Symbol
ValueCountFrequency (%)
~ 216
67.7%
59
 
18.5%
= 18
 
5.6%
> 14
 
4.4%
4
 
1.3%
< 4
 
1.3%
3
 
0.9%
+ 1
 
0.3%
Close Punctuation
ValueCountFrequency (%)
) 9899
76.6%
2704
 
20.9%
250
 
1.9%
] 51
 
0.4%
12
 
0.1%
7
 
0.1%
1
 
< 0.1%
Open Punctuation
ValueCountFrequency (%)
( 9829
76.5%
2694
 
21.0%
251
 
2.0%
[ 54
 
0.4%
10
 
0.1%
7
 
0.1%
1
 
< 0.1%
Other Number
ValueCountFrequency (%)
12
50.0%
² 4
 
16.7%
2
 
8.3%
2
 
8.3%
2
 
8.3%
1
 
4.2%
1
 
4.2%
Letter Number
ValueCountFrequency (%)
9
40.9%
5
22.7%
4
18.2%
3
 
13.6%
1
 
4.5%
Space Separator
ValueCountFrequency (%)
120277
> 99.9%
  1
 
< 0.1%
Final Punctuation
ValueCountFrequency (%)
170
78.3%
47
 
21.7%
Initial Punctuation
ValueCountFrequency (%)
162
77.5%
47
 
22.5%
Control
ValueCountFrequency (%)
2
66.7%
1
33.3%
Dash Punctuation
ValueCountFrequency (%)
- 5863
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 21
100.0%
Modifier Symbol
ValueCountFrequency (%)
` 8
100.0%
Currency Symbol
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 408394
60.3%
Common 267930
39.6%
Latin 521
 
0.1%
Han 3
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
19252
 
4.7%
13367
 
3.3%
12708
 
3.1%
12084
 
3.0%
10646
 
2.6%
10143
 
2.5%
9657
 
2.4%
8935
 
2.2%
8392
 
2.1%
8245
 
2.0%
Other values (639) 294965
72.2%
Common
ValueCountFrequency (%)
120277
44.9%
2 20143
 
7.5%
1 17536
 
6.5%
0 16941
 
6.3%
. 16383
 
6.1%
) 9899
 
3.7%
( 9829
 
3.7%
, 7169
 
2.7%
3 6192
 
2.3%
9 6106
 
2.3%
Other values (67) 37455
 
14.0%
Latin
ValueCountFrequency (%)
m 87
16.7%
D 39
 
7.5%
C 32
 
6.1%
I 27
 
5.2%
B 25
 
4.8%
S 22
 
4.2%
t 20
 
3.8%
L 19
 
3.6%
A 17
 
3.3%
E 16
 
3.1%
Other values (38) 217
41.7%
Han
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 408303
60.3%
ASCII 260816
38.5%
None 6391
 
0.9%
Punctuation 450
 
0.1%
Geometric Shapes 407
 
0.1%
CJK Compat 261
 
< 0.1%
Compat Jamo 87
 
< 0.1%
Arrows 66
 
< 0.1%
Number Forms 22
 
< 0.1%
Enclosed Alphanum 21
 
< 0.1%
Other values (3) 24
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
120277
46.1%
2 20143
 
7.7%
1 17536
 
6.7%
0 16941
 
6.5%
. 16383
 
6.3%
) 9899
 
3.8%
( 9829
 
3.8%
, 7169
 
2.7%
3 6192
 
2.4%
9 6106
 
2.3%
Other values (67) 30341
 
11.6%
Hangul
ValueCountFrequency (%)
19252
 
4.7%
13367
 
3.3%
12708
 
3.1%
12084
 
3.0%
10646
 
2.6%
10143
 
2.5%
9657
 
2.4%
8935
 
2.2%
8392
 
2.1%
8245
 
2.0%
Other values (630) 294874
72.2%
None
ValueCountFrequency (%)
2704
42.3%
2694
42.2%
344
 
5.4%
251
 
3.9%
250
 
3.9%
59
 
0.9%
40
 
0.6%
12
 
0.2%
10
 
0.2%
7
 
0.1%
Other values (8) 20
 
0.3%
Geometric Shapes
ValueCountFrequency (%)
396
97.3%
8
 
2.0%
2
 
0.5%
1
 
0.2%
CJK Compat
ValueCountFrequency (%)
255
97.7%
6
 
2.3%
Punctuation
ValueCountFrequency (%)
170
37.8%
162
36.0%
47
 
10.4%
47
 
10.4%
22
 
4.9%
2
 
0.4%
Arrows
ValueCountFrequency (%)
59
89.4%
4
 
6.1%
3
 
4.5%
Compat Jamo
ValueCountFrequency (%)
48
55.2%
26
29.9%
3
 
3.4%
3
 
3.4%
2
 
2.3%
2
 
2.3%
2
 
2.3%
1
 
1.1%
Misc Symbols
ValueCountFrequency (%)
14
73.7%
5
 
26.3%
Enclosed Alphanum
ValueCountFrequency (%)
12
57.1%
2
 
9.5%
2
 
9.5%
2
 
9.5%
1
 
4.8%
1
 
4.8%
1
 
4.8%
Number Forms
ValueCountFrequency (%)
9
40.9%
5
22.7%
4
18.2%
3
 
13.6%
1
 
4.5%
CJK
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%
Box Drawing
ValueCountFrequency (%)
1
50.0%
1
50.0%

입안자
Categorical

HIGH CORRELATION 

Distinct4
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
<NA>
5823 
구청장
3457 
시장
676 
장관
 
44

Length

Max length4
Median length4
Mean length3.5103
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row<NA>
2nd row<NA>
3rd row<NA>
4th row<NA>
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 5823
58.2%
구청장 3457
34.6%
시장 676
 
6.8%
장관 44
 
0.4%

Length

2024-04-30T05:08:37.271285image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-30T05:08:37.372508image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
na 5823
58.2%
구청장 3457
34.6%
시장 676
 
6.8%
장관 44
 
0.4%

결정권자
Categorical

HIGH CORRELATION 

Distinct4
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
<NA>
5843 
시장
2249 
구청장
1840 
장관
 
68

Length

Max length4
Median length4
Mean length3.3526
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row<NA>
2nd row<NA>
3rd row<NA>
4th row<NA>
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 5843
58.4%
시장 2249
 
22.5%
구청장 1840
 
18.4%
장관 68
 
0.7%

Length

2024-04-30T05:08:37.470277image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-30T05:08:37.559755image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
na 5843
58.4%
시장 2249
 
22.5%
구청장 1840
 
18.4%
장관 68
 
0.7%

안건목적
Text

MISSING 

Distinct3547
Distinct (%)90.9%
Missing6098
Missing (%)61.0%
Memory size156.2 KiB
2024-04-30T05:08:37.798545image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length1024
Median length498
Mean length112.26986
Min length1

Characters and Unicode

Total characters438077
Distinct characters713
Distinct categories18 ?
Distinct scripts3 ?
Distinct blocks11 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique3351 ?
Unique (%)85.9%

Sample

1st row측량성과로 인한 경계보정에 따른 면적 정정
2nd row- 현재 마곡구역은 발산 택지개발 시행, 방화 뉴타운 개발계획의 수립, 지하철9호선 건설 및 인천국제공항철도 계획 등 개별적인 대규모 개발계획이 수립되어 통합 관리의 필요성 - 지역균형발전차원에서 서울시 남서권역의 관문도시로 새로운 지구중심 창출 - 서울의 경쟁력 회복과 세계도시로 도약을 위하여 새로운 성장동력 필요 - 마곡구역을 국제적, 세계적 수준의 쾌적한 수변도시 조성
3rd row정비계획 변경 고시
4th row녹번제1주택재개발정비구역 변경지정 및 지형도면 고시
5th row주차문제가 심각한 대상 부지에 주차장을 조성하여 주민들의 주차불편 해소 및 전통시장 활성화에 기여하고자 함.
ValueCountFrequency (%)
4904
 
6.2%
따라 1663
 
2.1%
관한 1156
 
1.5%
규정에 1144
 
1.5%
시행령 1137
 
1.4%
같은 1084
 
1.4%
변경 1072
 
1.4%
1050
 
1.3%
서울특별시고시 982
 
1.2%
계획 910
 
1.2%
Other values (15303) 63609
80.8%
2024-04-30T05:08:38.186013image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
77933
 
17.8%
13097
 
3.0%
2 11190
 
2.6%
1 9960
 
2.3%
9535
 
2.2%
0 9305
 
2.1%
9133
 
2.1%
. 8822
 
2.0%
8507
 
1.9%
6886
 
1.6%
Other values (703) 273709
62.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 274303
62.6%
Space Separator 77933
 
17.8%
Decimal Number 50121
 
11.4%
Other Punctuation 14027
 
3.2%
Close Punctuation 8774
 
2.0%
Open Punctuation 8769
 
2.0%
Dash Punctuation 3247
 
0.7%
Uppercase Letter 169
 
< 0.1%
Final Punctuation 153
 
< 0.1%
Lowercase Letter 152
 
< 0.1%
Other values (8) 429
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
13097
 
4.8%
9535
 
3.5%
9133
 
3.3%
8507
 
3.1%
6886
 
2.5%
6448
 
2.4%
6255
 
2.3%
6234
 
2.3%
6062
 
2.2%
5949
 
2.2%
Other values (597) 196197
71.5%
Uppercase Letter
ValueCountFrequency (%)
D 25
14.8%
I 23
13.6%
C 21
12.4%
S 18
10.7%
K 9
 
5.3%
T 9
 
5.3%
P 8
 
4.7%
E 8
 
4.7%
L 7
 
4.1%
A 5
 
3.0%
Other values (13) 36
21.3%
Lowercase Letter
ValueCountFrequency (%)
m 30
19.7%
t 19
12.5%
r 13
8.6%
l 11
 
7.2%
k 11
 
7.2%
x 11
 
7.2%
i 9
 
5.9%
o 9
 
5.9%
s 8
 
5.3%
a 6
 
3.9%
Other values (7) 25
16.4%
Other Punctuation
ValueCountFrequency (%)
. 8822
62.9%
, 4230
30.2%
? 339
 
2.4%
247
 
1.8%
: 181
 
1.3%
' 98
 
0.7%
59
 
0.4%
/ 21
 
0.1%
% 20
 
0.1%
& 4
 
< 0.1%
Other values (2) 6
 
< 0.1%
Decimal Number
ValueCountFrequency (%)
2 11190
22.3%
1 9960
19.9%
0 9305
18.6%
3 3542
 
7.1%
8 3089
 
6.2%
9 2814
 
5.6%
7 2673
 
5.3%
5 2568
 
5.1%
4 2503
 
5.0%
6 2477
 
4.9%
Math Symbol
ValueCountFrequency (%)
~ 73
73.0%
12
 
12.0%
> 7
 
7.0%
= 4
 
4.0%
2
 
2.0%
< 1
 
1.0%
+ 1
 
1.0%
Other Symbol
ValueCountFrequency (%)
64
50.8%
43
34.1%
6
 
4.8%
4
 
3.2%
3
 
2.4%
3
 
2.4%
3
 
2.4%
Open Punctuation
ValueCountFrequency (%)
( 6192
70.6%
2347
 
26.8%
189
 
2.2%
[ 36
 
0.4%
4
 
< 0.1%
1
 
< 0.1%
Close Punctuation
ValueCountFrequency (%)
) 6190
70.5%
2355
 
26.8%
190
 
2.2%
] 34
 
0.4%
4
 
< 0.1%
1
 
< 0.1%
Letter Number
ValueCountFrequency (%)
9
56.2%
4
25.0%
2
 
12.5%
1
 
6.2%
Other Number
ValueCountFrequency (%)
6
50.0%
3
25.0%
2
 
16.7%
1
 
8.3%
Final Punctuation
ValueCountFrequency (%)
124
81.0%
29
 
19.0%
Initial Punctuation
ValueCountFrequency (%)
120
81.1%
28
 
18.9%
Control
ValueCountFrequency (%)
2
66.7%
1
33.3%
Space Separator
ValueCountFrequency (%)
77933
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 3247
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 20
100.0%
Modifier Symbol
ValueCountFrequency (%)
` 4
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 274306
62.6%
Common 163434
37.3%
Latin 337
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
13097
 
4.8%
9535
 
3.5%
9133
 
3.3%
8507
 
3.1%
6886
 
2.5%
6448
 
2.4%
6255
 
2.3%
6234
 
2.3%
6062
 
2.2%
5949
 
2.2%
Other values (598) 196200
71.5%
Common
ValueCountFrequency (%)
77933
47.7%
2 11190
 
6.8%
1 9960
 
6.1%
0 9305
 
5.7%
. 8822
 
5.4%
( 6192
 
3.8%
) 6190
 
3.8%
, 4230
 
2.6%
3 3542
 
2.2%
- 3247
 
2.0%
Other values (51) 22823
 
14.0%
Latin
ValueCountFrequency (%)
m 30
 
8.9%
D 25
 
7.4%
I 23
 
6.8%
C 21
 
6.2%
t 19
 
5.6%
S 18
 
5.3%
r 13
 
3.9%
l 11
 
3.3%
k 11
 
3.3%
x 11
 
3.3%
Other values (34) 155
46.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 274237
62.6%
ASCII 157905
36.0%
None 5400
 
1.2%
Punctuation 304
 
0.1%
Compat Jamo 66
 
< 0.1%
CJK Compat 64
 
< 0.1%
Geometric Shapes 49
 
< 0.1%
Number Forms 16
 
< 0.1%
Arrows 14
 
< 0.1%
Enclosed Alphanum 12
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
77933
49.4%
2 11190
 
7.1%
1 9960
 
6.3%
0 9305
 
5.9%
. 8822
 
5.6%
( 6192
 
3.9%
) 6190
 
3.9%
, 4230
 
2.7%
3 3542
 
2.2%
- 3247
 
2.1%
Other values (64) 17294
 
11.0%
Hangul
ValueCountFrequency (%)
13097
 
4.8%
9535
 
3.5%
9133
 
3.3%
8507
 
3.1%
6886
 
2.5%
6448
 
2.4%
6255
 
2.3%
6234
 
2.3%
6062
 
2.2%
5949
 
2.2%
Other values (590) 196131
71.5%
None
ValueCountFrequency (%)
2355
43.6%
2347
43.5%
247
 
4.6%
190
 
3.5%
189
 
3.5%
59
 
1.1%
4
 
0.1%
4
 
0.1%
3
 
0.1%
1
 
< 0.1%
Punctuation
ValueCountFrequency (%)
124
40.8%
120
39.5%
29
 
9.5%
28
 
9.2%
3
 
1.0%
CJK Compat
ValueCountFrequency (%)
64
100.0%
Compat Jamo
ValueCountFrequency (%)
50
75.8%
9
 
13.6%
3
 
4.5%
1
 
1.5%
1
 
1.5%
1
 
1.5%
1
 
1.5%
Geometric Shapes
ValueCountFrequency (%)
43
87.8%
3
 
6.1%
3
 
6.1%
Arrows
ValueCountFrequency (%)
12
85.7%
2
 
14.3%
Number Forms
ValueCountFrequency (%)
9
56.2%
4
25.0%
2
 
12.5%
1
 
6.2%
Enclosed Alphanum
ValueCountFrequency (%)
6
50.0%
3
25.0%
2
 
16.7%
1
 
8.3%
Misc Symbols
ValueCountFrequency (%)
6
60.0%
4
40.0%

위치
Text

MISSING 

Distinct4582
Distinct (%)86.0%
Missing4671
Missing (%)46.7%
Memory size156.2 KiB
2024-04-30T05:08:38.463166image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length96
Median length67
Mean length17.036029
Min length1

Characters and Unicode

Total characters90785
Distinct characters348
Distinct categories13 ?
Distinct scripts3 ?
Distinct blocks6 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique4109 ?
Unique (%)77.1%

Sample

1st row서울특별시 강북구 우이동 108번지 일대
2nd row오류동 246-5 ~ 오류동 산42-38
3rd row구로구 신도림동 361번지
4th row서울특별시 마포구 성산동 120-1, 중동 268, 서대문구 남가좌동 296-13 일원
5th row서울특별시 강서구 마곡동, 가양동, 공항동,방화동, 내외발산동 일대
ValueCountFrequency (%)
일대 2409
 
12.2%
일원 638
 
3.2%
서울특별시 587
 
3.0%
마포구 233
 
1.2%
성북구 198
 
1.0%
강북구 196
 
1.0%
영등포구 180
 
0.9%
은평구 178
 
0.9%
서초구 178
 
0.9%
동대문구 174
 
0.9%
Other values (4798) 14769
74.8%
2024-04-30T05:08:38.877270image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
14626
 
16.1%
6380
 
7.0%
1 4453
 
4.9%
4134
 
4.6%
3739
 
4.1%
- 3451
 
3.8%
3426
 
3.8%
2953
 
3.3%
2 2912
 
3.2%
2602
 
2.9%
Other values (338) 42109
46.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 49866
54.9%
Decimal Number 21109
23.3%
Space Separator 14626
 
16.1%
Dash Punctuation 3451
 
3.8%
Other Punctuation 929
 
1.0%
Math Symbol 375
 
0.4%
Open Punctuation 197
 
0.2%
Close Punctuation 196
 
0.2%
Uppercase Letter 27
 
< 0.1%
Other Symbol 5
 
< 0.1%
Other values (3) 4
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
6380
 
12.8%
4134
 
8.3%
3739
 
7.5%
3426
 
6.9%
2953
 
5.9%
2602
 
5.2%
1347
 
2.7%
1072
 
2.1%
871
 
1.7%
781
 
1.6%
Other values (305) 22561
45.2%
Decimal Number
ValueCountFrequency (%)
1 4453
21.1%
2 2912
13.8%
3 2369
11.2%
4 1942
9.2%
5 1883
8.9%
6 1808
8.6%
7 1539
 
7.3%
0 1513
 
7.2%
8 1370
 
6.5%
9 1320
 
6.3%
Other Punctuation
ValueCountFrequency (%)
, 827
89.0%
? 48
 
5.2%
. 22
 
2.4%
17
 
1.8%
/ 7
 
0.8%
: 7
 
0.8%
# 1
 
0.1%
Uppercase Letter
ValueCountFrequency (%)
C 13
48.1%
I 12
44.4%
M 1
 
3.7%
D 1
 
3.7%
Open Punctuation
ValueCountFrequency (%)
( 196
99.5%
[ 1
 
0.5%
Close Punctuation
ValueCountFrequency (%)
) 195
99.5%
] 1
 
0.5%
Other Symbol
ValueCountFrequency (%)
4
80.0%
1
 
20.0%
Space Separator
ValueCountFrequency (%)
14626
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 3451
100.0%
Math Symbol
ValueCountFrequency (%)
~ 375
100.0%
Lowercase Letter
ValueCountFrequency (%)
m 2
100.0%
Other Number
ValueCountFrequency (%)
² 1
100.0%
Control
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 49866
54.9%
Common 40890
45.0%
Latin 29
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
6380
 
12.8%
4134
 
8.3%
3739
 
7.5%
3426
 
6.9%
2953
 
5.9%
2602
 
5.2%
1347
 
2.7%
1072
 
2.1%
871
 
1.7%
781
 
1.6%
Other values (305) 22561
45.2%
Common
ValueCountFrequency (%)
14626
35.8%
1 4453
 
10.9%
- 3451
 
8.4%
2 2912
 
7.1%
3 2369
 
5.8%
4 1942
 
4.7%
5 1883
 
4.6%
6 1808
 
4.4%
7 1539
 
3.8%
0 1513
 
3.7%
Other values (18) 4394
 
10.7%
Latin
ValueCountFrequency (%)
C 13
44.8%
I 12
41.4%
m 2
 
6.9%
M 1
 
3.4%
D 1
 
3.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 49860
54.9%
ASCII 40896
45.0%
None 18
 
< 0.1%
Compat Jamo 6
 
< 0.1%
CJK Compat 4
 
< 0.1%
Geometric Shapes 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
14626
35.8%
1 4453
 
10.9%
- 3451
 
8.4%
2 2912
 
7.1%
3 2369
 
5.8%
4 1942
 
4.7%
5 1883
 
4.6%
6 1808
 
4.4%
7 1539
 
3.8%
0 1513
 
3.7%
Other values (19) 4400
 
10.8%
Hangul
ValueCountFrequency (%)
6380
 
12.8%
4134
 
8.3%
3739
 
7.5%
3426
 
6.9%
2953
 
5.9%
2602
 
5.2%
1347
 
2.7%
1072
 
2.2%
871
 
1.7%
781
 
1.6%
Other values (302) 22555
45.2%
None
ValueCountFrequency (%)
17
94.4%
² 1
 
5.6%
CJK Compat
ValueCountFrequency (%)
4
100.0%
Compat Jamo
ValueCountFrequency (%)
3
50.0%
2
33.3%
1
 
16.7%
Geometric Shapes
ValueCountFrequency (%)
1
100.0%

Correlations

2024-04-30T05:08:38.963478image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
지자체코드입안업무유형업무절차처리상태입안자결정권자
지자체코드1.0000.4470.5110.5200.6130.491
입안업무유형0.4471.0000.3680.2410.1110.285
업무절차0.5110.3681.0000.6430.1140.101
처리상태0.5200.2410.6431.0000.0600.106
입안자0.6130.1110.1140.0601.0000.905
결정권자0.4910.2850.1010.1060.9051.000
2024-04-30T05:08:39.062088image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
입안업무유형결정권자입안계획유형지자체코드처리상태업무절차입안자
입안업무유형1.0000.2241.0000.2140.1360.1920.084
결정권자0.2241.0001.0000.2900.0670.0450.625
입안계획유형1.0001.0001.0001.0001.0001.0001.000
지자체코드0.2140.2901.0001.0000.2370.1870.393
처리상태0.1360.0671.0000.2371.0000.3590.038
업무절차0.1920.0451.0000.1870.3591.0000.051
입안자0.0840.6251.0000.3930.0380.0511.000
2024-04-30T05:08:39.159328image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
지자체코드입안계획유형입안업무유형업무절차처리상태입안자결정권자
지자체코드1.0001.0000.2140.1870.2370.3930.290
입안계획유형1.0001.0001.0001.0001.0001.0001.000
입안업무유형0.2141.0001.0000.1920.1360.0840.224
업무절차0.1871.0000.1921.0000.3590.0510.045
처리상태0.2371.0000.1360.3591.0000.0380.067
입안자0.3931.0000.0840.0510.0381.0000.625
결정권자0.2901.0000.2240.0450.0670.6251.000

Missing values

2024-04-30T05:08:32.622319image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-04-30T05:08:32.845065image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2024-04-30T05:08:33.048498image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

프로젝트코드지자체코드입안계획유형입안업무유형업무절차처리상태담당자담당부서안건명안건사유입안자결정권자안건목적위치
1006911000PPL200706071101서울특별시도시관리계획도시계획시설사업결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과창천주거환경개선정비구역및정비계획변경에따른지형도면<NA><NA><NA><NA><NA>
29511000PPL202403060055강북구도시관리계획정비 및 개발사업열람공고 및 의견청취고시완료함준기서울특별시 주택정책실 주거환경개선과수유제2지구 ○ 2023. 08. 04. 주거환경개선계획 변경결정 (강북구고시 제2023-82호)사업시행기간변경(1년 연장)1. 건설부고시 제1992-561호(1992.10.23.)로 주거환경개선지구 지정, 서울특별시고시 제1993-243호(1993.8.9.)로 개선계획 수립, 서울특별시고시 제1994-203호(1994.6.20.), 서울특별시고시 제1994-339호(1994.10.15.), 강북구고시 제1995-38호(1995.10.16), 강북구고시 제1996-39호(1996.7.18.)로 개선계획 변경결정, 서울시고시 제1998-24호(1998.1.30.)로 지구지정 변경, 강북구고시 제1998-12호(1998.2.10.), 강북구고시 제2000-9호(2000.2.21.), 강북구고시 제2002-107호(2002.12.30.), 강북구고시 제2003-57호(2003.7.14.), 강북구고시 제2006-50호 (2006.7.20.), 강북구고시 제2007-48호(2007.6.14.), 강북구고시 제2009-48호(2009.7.30.), 강북구고시 제2010-46호(2010.7.22.), 강북구고시 제2011-29호(2011.7.28.), 강북구고시 제2012-148호(2012.7.27.), 강북구고시 제2013-195호(2013.8.1.), 강북구고시 제2014-204호(2014.9.11.), 강북구고시 제2015-182호(2015.8.13.), 강북구고시 제2016-123호(2016.8.5.), 강북구고시 제2017-108호(2017.8.9.), 강북구고시 제2018-114호(2018.8.10.), 강북구고시 제2019-119호(2018.8.23.), 강북구고시 제2020-126호(2020.8.8.), 강북구고시 제2021-149호(2021.7.30.), 강북구고시 제2022-102호(2022.7.29.)로 주거환경개선계획 변경결정 된 수유제2주거환경개선지구에 대하여, 2. 주거환경개선사업 미완료에 따라 「도시 및 주거환경정비법」 제7조 제1항, 같은법 시행령 제6조 제4항에 따라 주거환경개선계획을 변경수립하고 같은법 제16조 제2항에 따라 다음과 같이 고시합니다.<NA><NA><NA>서울특별시 강북구 우이동 108번지 일대
1047611000PPL200703020788서울특별시도시관리계획정비 및 개발사업결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과신공덕제4주택재개발정비구역변경지정<NA><NA><NA><NA><NA>
1143411000PPL999901011474서울특별시도시관리계획도시계획시설열람공고 및 의견청취진행중sysadmin서울특별시 도시계획국 도시계획과도시계획시설(공공공지)<NA><NA><NA><NA><NA>
83911530PPL202309220003구로구도시관리계획도시계획시설사업기초조사 및 공공기여공고완료권정빈서울특별시 구로구 주택정책국 도시계획과도시관리계획(도시계획시설:도로) 결정(안)항동 철길로 단절된 막다른 도로로써, 서해안로를 이용하는 지역 주민들의 통행 불편 해소 및 인근 도로와 연결성 있는 도로를 개설하고자 도시계획시설(도로) 결정하고자 함.<NA><NA><NA>오류동 246-5 ~ 오류동 산42-38
896411000PPL200906043428서울특별시도시관리계획도시계획시설결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과구의?자양 재정비촉진지구 재정비촉진계획결정 및 지형도면 작성<NA><NA><NA><NA><NA>
844511000PPL201007220174구로구도시관리계획지구단위계획계획안 완료진행중전용우서울특별시 구로구 안전건설국 도로과신도림동 361번지 지구단위계획 변경결정구로구 신도림동 361번지에 위치한 대성주유소(GS칼텍스)는 대성디큐브시티 교통영향분석개선대책 수립결과에 따라 도시계획선에 맞추어 도로가 확폭되어 대지규모가 축소됨에 따라 주유차량의 접근이 원활하지 못하여 경인로변 차량불허구간의 일부를 변경하기 위한 도시관리계획(제1종지구단위계획) 결정(변경) 사항임구청장시장<NA>구로구 신도림동 361번지
1152711000PPL199804117859서울특별시도시관리계획도시계획시설결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과도시계획시설(도로)결정(신설,변경,폐지)및지적승인<NA><NA><NA><NA><NA>
490511000PPL199801157594서울특별시도시관리계획도시계획시설사업결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과도시계획시설(도로)결정ㆍ변경결정및지적승인<NA><NA><NA><NA><NA>
965211000PPL200903052924서울특별시도시관리계획용도지역/지구/구역결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과행당제7 주택재개발정비구역 지정 및 지형도면(용도지역)<NA><NA><NA><NA><NA>
프로젝트코드지자체코드입안계획유형입안업무유형업무절차처리상태담당자담당부서안건명안건사유입안자결정권자안건목적위치
579811000PPL201610207907종로구도시관리계획정비 및 개발사업계획안 완료종료도기환서울특별시 서대문구 안전건설국 도로과서울시고시 2016-322 종로5,6가동 정비구역(충신성곽마을) 지정'서울 한양도성' 주변 성곽마을 중 하나로서, 주민참여를 통해 역사문화적 마을특성을 보전하고, 기반시설 및 공동이용시설을 확충하고, 주거환경 보전, 정비, 개량을 통해 지역공동체 활성화 및 주민들의 삶의 질 향상을 위해 구역을 지정함.구청장시장'서울 한양도성' 주변 성곽마을 중 하나로서, 주민참여를 통해 역사문화적 마을특성을 보전하고, 기반시설 및 공동이용시설을 확충하고, 주거환경 보전, 정비, 개량을 통해 지역공동체 활성화 및 주민들의 삶의 질 향상을 위해 구역을 지정함.종로5,6가동 202-3번지 일대(종로 5,6가동 일대)
764011000PPL201205010969송파구도시관리계획정비 및 개발사업결정고시관리진행중홍일표서울특별시장지택지개발예정지구 지정변경, 실시계획변경 승인서울시 임대주택 10만호 주택건설 정책에 부응 무주택 서민의 주거안정을 위하여 필요한 택지의 효율적인 공급으로 주택난 해소 친환경적이고 쾌적한 주거환경을 조성하여 주거생활의 안정에 기여 주변 개발사업과 연계되고 계획적, 합리적인 개발계획으로 지역균형개발에 기여구청장시장서울시 임대주택 10만호 주택건설 정책에 부응 무주택 서민의 주거안정을 위하여 필요한 택지의 효율적인 공급으로 주택난 해소 친환경적이고 쾌적한 주거환경을 조성하여 주거생활의 안정에 기여 주변 개발사업과 연계되고 계획적, 합리적인 개발계획으로 지역균형개발에 기여서울시 송파구 장지동 서울장지택지개발사업지구 일원
789411000PPL201205246496서대문구도시관리계획정비 및 개발사업계획안 완료종료정경일서울특별시가재울재정비촉진계획변경가재울 재정비촉진지구내 지역주민의 삶의 질 향상을 위해 도시계획시설 (폐기물처리시설)결정 변경구청장시장가재울 재정비촉진지구내 지역주민의 삶의 질 향상을 위해 도시계획시설 (폐기물처리시설)결정 변경서대문구 북가좌동 115-97
36211000PPL202403050003서울특별시도시관리계획도시계획시설사업결정고시관리고시완료김승진서울특별시 도시공간본부 시설계획과도시계획시설(학교) 세부시설조성계획 결정(변경) 및 지형도면 고시(삼육대학교)「국토의 계획 및 이용에 관한 법률」 제2조제4호 다목 및 동법시행령 제25조 제3항의 규정에 의한 도시계획시설(학교) 대학 세부시설조성계획 변경결정에 관한 사항으로서, 서울 특별시 노원구 공릉동 26-21에 위치한 삼육대학교의 건물 신?증축과 기존건물의 준공된 면적으로 정정하고자 하는 사항임.<NA><NA><NA>노원구 공릉동 26-21
604911000PPL201603102680마포구도시관리계획도시계획시설열람공고 및 의견청취진행중안종현서울특별시 마포구 도시환경국 도시계획과마포구공고 2016-216 도시관리계획 결정(안) 열람공고 (선형의숲 근린공원) 중동27-57~중동85-3도시계획시설(공원) 결정(안)구청장구청장도시계획시설(공원) 결정(안)마포구 중동 27-57 ~ 중동 85-3
1010011000PPL200811122334서울특별시도시관리계획도시계획시설결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과도시관리계획(도시계획시설:도로) 결정 및 지형도면<NA><NA><NA><NA><NA>
873511000PPL200910153964서울특별시도시관리계획도시계획시설결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과도시계획시설 (공공공지 ? 전기공급설비) 변경결정(경미한변경) 및 지형도면 고시<NA><NA><NA><NA><NA>
91011290PPL202308280002성북구도시관리계획도시계획시설사업기초조사 및 공공기여공고완료김양훈서울특별시 성북구 도시관리국 도시계획과장위4 재정비촉진구역 사업시행계획(변경)인가를 위한 주민공람 공고서울특별시 고시 제2008-111호(2008.04.03)로 장위재정비촉진지구 재정비촉진계획결정 고시되고, 2009.02.26. 조합설립인가 되었으며, 성북구고시 제2013-65호(2013.06.20.), 성북구고시 제2015-09호(2015.01.20.), 성북구고시 제2019-155호(2019.9.26.)로 사업시행인가 및 변경인가 고시된 장위4구역 주택재개발 정비사업에 대하여 「도시 및 주거환경정비법」 제56조 및 같은 법 시행령 제49조 규정에 의거 사업시행계획(변경)인가를 위한 관계도서를 아래와 같이 공람 공고합니다.<NA><NA><NA>서울특별시 성북구 장위동 62-1 일대
484511000PPL199805077945서울특별시도시관리계획도시계획시설사업결정고시관리종료sysadmin서울특별시 도시계획국 도시계획과도시계획시설(화원어린이공원)조성계획결정<NA><NA><NA><NA><NA>
145811230PPL202302070005동대문구도시관리계획정비 및 개발사업열람공고 및 의견청취공고완료이병원서울특별시 동대문구 주택도시국 건축과용두1구역 2지구 도시환경정비사업 사업시행계획인가 공람공고용두1구역2지구 도시환경정비사업에 대하여 사업시행자로부터 『도시 및 주거환경정비법』제50조 규정에 의한 사업시행계획인가 신청이 있어 동법 제56조 및 시행령 제49조의 규정에 따라 사업시행계획의 내용을 일반인에게 공람하고 이해관계자 등의 의견을 청취하고자함.<NA><NA><NA>동대문구 용두동 23-8번지 일대