Overview

Dataset statistics

Number of variables6
Number of observations94
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory4.5 KiB
Average record size in memory49.4 B

Variable types

Categorical4
Text2

Dataset

Description- 민선8기 광진구 공약사업(6대분야 94개 사업) 목록 및 추진부서, 이행현황 등 - 2022년 12월말 기준 12.8% 이행(12개 사업 완료, 82개 사업 정상추진 중)
URLhttps://www.data.go.kr/data/15036478/fileData.do

Alerts

데이터기준일자 has constant value ""Constant
분야 is highly overall correlated with 주관부서High correlation
주관부서 is highly overall correlated with 분야High correlation
이행현황 is highly imbalanced (56.5%)Imbalance
관리번호 has unique valuesUnique
사업명 has unique valuesUnique

Reproduction

Analysis started2023-12-12 02:04:09.968253
Analysis finished2023-12-12 02:04:10.524763
Duration0.56 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

분야
Categorical

HIGH CORRELATION 

Distinct6
Distinct (%)6.4%
Missing0
Missing (%)0.0%
Memory size884.0 B
안전환경
26 
상생복지
21 
문화교육
17 
균형발전
13 
열린소통

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row균형발전
2nd row균형발전
3rd row균형발전
4th row균형발전
5th row균형발전

Common Values

ValueCountFrequency (%)
안전환경 26
27.7%
상생복지 21
22.3%
문화교육 17
18.1%
균형발전 13
13.8%
열린소통 9
 
9.6%
경제활력 8
 
8.5%

Length

2023-12-12T11:04:10.604370image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T11:04:10.753143image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
안전환경 26
27.7%
상생복지 21
22.3%
문화교육 17
18.1%
균형발전 13
13.8%
열린소통 9
 
9.6%
경제활력 8
 
8.5%

관리번호
Text

UNIQUE 

Distinct94
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size884.0 B
2023-12-12T11:04:10.940417image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length7
Median length7
Mean length7
Min length7

Characters and Unicode

Total characters658
Distinct characters13
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique94 ?
Unique (%)100.0%

Sample

1st row01월 01일
2nd row01월 02일
3rd row01월 03일
4th row01월 04일
5th row01월 05일
ValueCountFrequency (%)
05월 26
 
13.8%
02월 21
 
11.2%
04월 17
 
9.0%
01월 13
 
6.9%
06월 9
 
4.8%
03월 8
 
4.3%
04일 6
 
3.2%
06일 6
 
3.2%
01일 6
 
3.2%
03일 6
 
3.2%
Other values (22) 70
37.2%
2023-12-12T11:04:11.311577image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 153
23.3%
94
14.3%
94
14.3%
94
14.3%
1 57
 
8.7%
2 41
 
6.2%
5 36
 
5.5%
4 27
 
4.1%
6 19
 
2.9%
3 19
 
2.9%
Other values (3) 24
 
3.6%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 376
57.1%
Other Letter 188
28.6%
Space Separator 94
 
14.3%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
0 153
40.7%
1 57
 
15.2%
2 41
 
10.9%
5 36
 
9.6%
4 27
 
7.2%
6 19
 
5.1%
3 19
 
5.1%
7 9
 
2.4%
8 8
 
2.1%
9 7
 
1.9%
Other Letter
ValueCountFrequency (%)
94
50.0%
94
50.0%
Space Separator
ValueCountFrequency (%)
94
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 470
71.4%
Hangul 188
 
28.6%

Most frequent character per script

Common
ValueCountFrequency (%)
0 153
32.6%
94
20.0%
1 57
 
12.1%
2 41
 
8.7%
5 36
 
7.7%
4 27
 
5.7%
6 19
 
4.0%
3 19
 
4.0%
7 9
 
1.9%
8 8
 
1.7%
Hangul
ValueCountFrequency (%)
94
50.0%
94
50.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 470
71.4%
Hangul 188
 
28.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 153
32.6%
94
20.0%
1 57
 
12.1%
2 41
 
8.7%
5 36
 
7.7%
4 27
 
5.7%
6 19
 
4.0%
3 19
 
4.0%
7 9
 
1.9%
8 8
 
1.7%
Hangul
ValueCountFrequency (%)
94
50.0%
94
50.0%

사업명
Text

UNIQUE 

Distinct94
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size884.0 B
2023-12-12T11:04:11.632710image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length47
Median length31.5
Mean length24.617021
Min length9

Characters and Unicode

Total characters2314
Distinct characters297
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique94 ?
Unique (%)100.0%

Sample

1st row도시발전계획 ‘2040 광진플랜’ 수립 추진
2nd row재개발, 재건축 등 공공지원 강화
3rd row신속통합기획 및 모아타운·주택 정책 활성화
4th row동북권 랜드마크 조성을 위한 동서울터미널 현대화사업 추진
5th row지하철2호선 지하화 추진 구체화
ValueCountFrequency (%)
24
 
4.2%
20
 
3.5%
추진 19
 
3.3%
지원 12
 
2.1%
운영 10
 
1.8%
개선 9
 
1.6%
확대 8
 
1.4%
조성 8
 
1.4%
활성화 7
 
1.2%
위한 7
 
1.2%
Other values (369) 445
78.2%
2023-12-12T11:04:12.142814image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
475
 
20.5%
50
 
2.2%
43
 
1.9%
33
 
1.4%
31
 
1.3%
30
 
1.3%
30
 
1.3%
30
 
1.3%
25
 
1.1%
25
 
1.1%
Other values (287) 1542
66.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1768
76.4%
Space Separator 475
 
20.5%
Decimal Number 23
 
1.0%
Other Punctuation 18
 
0.8%
Uppercase Letter 14
 
0.6%
Close Punctuation 6
 
0.3%
Open Punctuation 6
 
0.3%
Math Symbol 2
 
0.1%
Final Punctuation 1
 
< 0.1%
Initial Punctuation 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
50
 
2.8%
43
 
2.4%
33
 
1.9%
31
 
1.8%
30
 
1.7%
30
 
1.7%
30
 
1.7%
25
 
1.4%
25
 
1.4%
24
 
1.4%
Other values (263) 1447
81.8%
Uppercase Letter
ValueCountFrequency (%)
T 3
21.4%
I 2
14.3%
E 2
14.3%
C 2
14.3%
U 1
 
7.1%
K 1
 
7.1%
N 1
 
7.1%
R 1
 
7.1%
G 1
 
7.1%
Decimal Number
ValueCountFrequency (%)
0 9
39.1%
1 5
21.7%
2 3
 
13.0%
4 3
 
13.0%
5 2
 
8.7%
3 1
 
4.3%
Other Punctuation
ValueCountFrequency (%)
, 15
83.3%
· 3
 
16.7%
Math Symbol
ValueCountFrequency (%)
~ 1
50.0%
+ 1
50.0%
Space Separator
ValueCountFrequency (%)
475
100.0%
Close Punctuation
ValueCountFrequency (%)
) 6
100.0%
Open Punctuation
ValueCountFrequency (%)
( 6
100.0%
Final Punctuation
ValueCountFrequency (%)
1
100.0%
Initial Punctuation
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1768
76.4%
Common 532
 
23.0%
Latin 14
 
0.6%

Most frequent character per script

Hangul
ValueCountFrequency (%)
50
 
2.8%
43
 
2.4%
33
 
1.9%
31
 
1.8%
30
 
1.7%
30
 
1.7%
30
 
1.7%
25
 
1.4%
25
 
1.4%
24
 
1.4%
Other values (263) 1447
81.8%
Common
ValueCountFrequency (%)
475
89.3%
, 15
 
2.8%
0 9
 
1.7%
) 6
 
1.1%
( 6
 
1.1%
1 5
 
0.9%
· 3
 
0.6%
2 3
 
0.6%
4 3
 
0.6%
5 2
 
0.4%
Other values (5) 5
 
0.9%
Latin
ValueCountFrequency (%)
T 3
21.4%
I 2
14.3%
E 2
14.3%
C 2
14.3%
U 1
 
7.1%
K 1
 
7.1%
N 1
 
7.1%
R 1
 
7.1%
G 1
 
7.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1768
76.4%
ASCII 541
 
23.4%
None 3
 
0.1%
Punctuation 2
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
475
87.8%
, 15
 
2.8%
0 9
 
1.7%
) 6
 
1.1%
( 6
 
1.1%
1 5
 
0.9%
T 3
 
0.6%
2 3
 
0.6%
4 3
 
0.6%
I 2
 
0.4%
Other values (11) 14
 
2.6%
Hangul
ValueCountFrequency (%)
50
 
2.8%
43
 
2.4%
33
 
1.9%
31
 
1.8%
30
 
1.7%
30
 
1.7%
30
 
1.7%
25
 
1.4%
25
 
1.4%
24
 
1.4%
Other values (263) 1447
81.8%
None
ValueCountFrequency (%)
· 3
100.0%
Punctuation
ValueCountFrequency (%)
1
50.0%
1
50.0%

주관부서
Categorical

HIGH CORRELATION 

Distinct29
Distinct (%)30.9%
Missing0
Missing (%)0.0%
Memory size884.0 B
교육지원과
도시계획과
교통행정과
문화체육과
가정복지과
Other values (24)
56 

Length

Max length8
Median length5
Mean length4.8085106
Min length3

Unique

Unique8 ?
Unique (%)8.5%

Sample

1st row도시계획과
2nd row주택과
3rd row주택과
4th row도시계획과
5th row도로과

Common Values

ValueCountFrequency (%)
교육지원과 9
 
9.6%
도시계획과 8
 
8.5%
교통행정과 7
 
7.4%
문화체육과 7
 
7.4%
가정복지과 7
 
7.4%
도로과 6
 
6.4%
어르신복지과 4
 
4.3%
치수과 4
 
4.3%
아동청년과 4
 
4.3%
지역경제과 4
 
4.3%
Other values (19) 34
36.2%

Length

2023-12-12T11:04:12.295720image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
교육지원과 9
 
9.6%
도시계획과 8
 
8.5%
교통행정과 7
 
7.4%
문화체육과 7
 
7.4%
가정복지과 7
 
7.4%
도로과 6
 
6.4%
지역경제과 4
 
4.3%
공원녹지과 4
 
4.3%
아동청년과 4
 
4.3%
치수과 4
 
4.3%
Other values (19) 34
36.2%

이행현황
Categorical

IMBALANCE 

Distinct3
Distinct (%)3.2%
Missing0
Missing (%)0.0%
Memory size884.0 B
정상추진
79 
이행후계속추진
14 
완료
 
1

Length

Max length7
Median length4
Mean length4.4255319
Min length2

Unique

Unique1 ?
Unique (%)1.1%

Sample

1st row정상추진
2nd row정상추진
3rd row정상추진
4th row정상추진
5th row정상추진

Common Values

ValueCountFrequency (%)
정상추진 79
84.0%
이행후계속추진 14
 
14.9%
완료 1
 
1.1%

Length

2023-12-12T11:04:12.437746image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T11:04:12.545048image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
정상추진 79
84.0%
이행후계속추진 14
 
14.9%
완료 1
 
1.1%

데이터기준일자
Categorical

CONSTANT 

Distinct1
Distinct (%)1.1%
Missing0
Missing (%)0.0%
Memory size884.0 B
2023-06-30
94 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2023-06-30
2nd row2023-06-30
3rd row2023-06-30
4th row2023-06-30
5th row2023-06-30

Common Values

ValueCountFrequency (%)
2023-06-30 94
100.0%

Length

2023-12-12T11:04:12.667020image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T11:04:12.794041image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2023-06-30 94
100.0%

Correlations

2023-12-12T11:04:12.873998image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분야관리번호사업명주관부서이행현황
분야1.0001.0001.0000.9890.507
관리번호1.0001.0001.0001.0001.000
사업명1.0001.0001.0001.0001.000
주관부서0.9891.0001.0001.0000.120
이행현황0.5071.0001.0000.1201.000
2023-12-12T11:04:12.982373image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
주관부서분야이행현황
주관부서1.0000.8070.000
분야0.8071.0000.237
이행현황0.0000.2371.000
2023-12-12T11:04:13.094285image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분야주관부서이행현황
분야1.0000.8070.237
주관부서0.8071.0000.000
이행현황0.2370.0001.000

Missing values

2023-12-12T11:04:10.342648image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T11:04:10.467884image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

분야관리번호사업명주관부서이행현황데이터기준일자
0균형발전01월 01일도시발전계획 ‘2040 광진플랜’ 수립 추진도시계획과정상추진2023-06-30
1균형발전01월 02일재개발, 재건축 등 공공지원 강화주택과정상추진2023-06-30
2균형발전01월 03일신속통합기획 및 모아타운·주택 정책 활성화주택과정상추진2023-06-30
3균형발전01월 04일동북권 랜드마크 조성을 위한 동서울터미널 현대화사업 추진도시계획과정상추진2023-06-30
4균형발전01월 05일지하철2호선 지하화 추진 구체화도로과정상추진2023-06-30
5균형발전01월 06일현 구청부지(자양3구역) 공공복합개발 추진도시계획과정상추진2023-06-30
6균형발전01월 07일구의역 일대 상가 활성화, 스마트 안전시스템 구축, 도로·주차장 등 도시기반시설 개선도시재생과정상추진2023-06-30
7균형발전01월 08일중곡동 지역발전 도시계획 수립 추진도시계획과정상추진2023-06-30
8균형발전01월 09일역세권 고밀개발을 통한 청년주택 등 맞춤형 1인가구 주택 다량 공급건축과정상추진2023-06-30
9균형발전01월 10일저층주거지 개발 활성화를 위한 종합발전계획수립도시계획과정상추진2023-06-30
분야관리번호사업명주관부서이행현황데이터기준일자
84안전환경05월 26일용마초 학교운동장 입체 개발로 지하주차장 확보교통지도과정상추진2023-06-30
85열린소통06월 01일인사예산계약 등 구정 전반에 대한 청렴도 향상감사담당관이행후계속추진2023-06-30
86열린소통06월 02일구청장과 구민의 만남, 민원 현장방문 등 현장 소통 행정 강화감사담당관이행후계속추진2023-06-30
87열린소통06월 03일서울시, 정부와 유대강화로 외부자원 확보 등 재원의 다각화기획예산과정상추진2023-06-30
88열린소통06월 04일주민자치회, 자원봉사단체 등 민관협치에 의한 주민센터 운영자치행정과정상추진2023-06-30
89열린소통06월 05일전문성과 개별역량을 고려한 공정한 인사시스템 운용총무과정상추진2023-06-30
90열린소통06월 06일ICT, 빅데이터 등 스마트 기술을 기반한 선진행정 구현스마트정보과이행후계속추진2023-06-30
91열린소통06월 07일광진발전소통위원회 구성운영기획예산과이행후계속추진2023-06-30
92열린소통06월 08일온라인 정책방 운영 및 우수정책 콘테스트 개최 시상기획예산과이행후계속추진2023-06-30
93열린소통06월 09일유엔 글로벌 콤팩트 가입, 글로벌 스탠더드의 청렴도 제고감사담당관정상추진2023-06-30