Overview

Dataset statistics

Number of variables7
Number of observations111
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory6.4 KiB
Average record size in memory59.2 B

Variable types

Numeric1
Categorical3
Text2
DateTime1

Dataset

Description남동구 정책실명제 중점관리대상사업 현황으로 연번,대상연도,심의번호,정책실명제 중점관리 대상사업 등록부(총괄),선정기준,사업부서,데이터기준일자 데이터를 제공합니다.
URLhttps://www.data.go.kr/data/15087363/fileData.do

Alerts

데이터기준일자 has constant value ""Constant
연번 is highly overall correlated with 대상연도High correlation
대상연도 is highly overall correlated with 연번 and 1 other fieldsHigh correlation
선정기준 is highly overall correlated with 대상연도High correlation
연번 has unique valuesUnique

Reproduction

Analysis started2023-12-12 02:08:59.577839
Analysis finished2023-12-12 02:09:00.750199
Duration1.17 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연번
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct111
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean56
Minimum1
Maximum111
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.1 KiB
2023-12-12T11:09:00.870886image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile6.5
Q128.5
median56
Q383.5
95-th percentile105.5
Maximum111
Range110
Interquartile range (IQR)55

Descriptive statistics

Standard deviation32.186954
Coefficient of variation (CV)0.57476703
Kurtosis-1.2
Mean56
Median Absolute Deviation (MAD)28
Skewness0
Sum6216
Variance1036
MonotonicityStrictly increasing
2023-12-12T11:09:01.025683image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
0.9%
2 1
 
0.9%
83 1
 
0.9%
82 1
 
0.9%
81 1
 
0.9%
80 1
 
0.9%
79 1
 
0.9%
78 1
 
0.9%
77 1
 
0.9%
76 1
 
0.9%
Other values (101) 101
91.0%
ValueCountFrequency (%)
1 1
0.9%
2 1
0.9%
3 1
0.9%
4 1
0.9%
5 1
0.9%
6 1
0.9%
7 1
0.9%
8 1
0.9%
9 1
0.9%
10 1
0.9%
ValueCountFrequency (%)
111 1
0.9%
110 1
0.9%
109 1
0.9%
108 1
0.9%
107 1
0.9%
106 1
0.9%
105 1
0.9%
104 1
0.9%
103 1
0.9%
102 1
0.9%

대상연도
Categorical

HIGH CORRELATION 

Distinct4
Distinct (%)3.6%
Missing0
Missing (%)0.0%
Memory size1020.0 B
2019
30 
2020
28 
2021
28 
2022
25 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2019
2nd row2019
3rd row2019
4th row2019
5th row2019

Common Values

ValueCountFrequency (%)
2019 30
27.0%
2020 28
25.2%
2021 28
25.2%
2022 25
22.5%

Length

2023-12-12T11:09:01.244969image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T11:09:01.363950image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2019 30
27.0%
2020 28
25.2%
2021 28
25.2%
2022 25
22.5%
Distinct86
Distinct (%)77.5%
Missing0
Missing (%)0.0%
Memory size1020.0 B
2023-12-12T11:09:01.701373image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length8
Median length8
Mean length7.6756757
Min length7

Characters and Unicode

Total characters852
Distinct characters11
Distinct categories2 ?
Distinct scripts1 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique61 ?
Unique (%)55.0%

Sample

1st row02019-1
2nd row02019-2
3rd row02019-3
4th row02019-4
5th row02019-5
ValueCountFrequency (%)
02022-14 2
 
1.8%
02022-21 2
 
1.8%
02022-15 2
 
1.8%
02022-11 2
 
1.8%
02022-10 2
 
1.8%
02022-9 2
 
1.8%
02022-8 2
 
1.8%
02022-6 2
 
1.8%
02022-4 2
 
1.8%
02022-12 2
 
1.8%
Other values (76) 91
82.0%
2023-12-12T11:09:02.234014image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2 291
34.2%
0 231
27.1%
- 111
 
13.0%
1 110
 
12.9%
9 39
 
4.6%
3 13
 
1.5%
4 12
 
1.4%
5 12
 
1.4%
8 11
 
1.3%
7 11
 
1.3%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 741
87.0%
Dash Punctuation 111
 
13.0%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
2 291
39.3%
0 231
31.2%
1 110
 
14.8%
9 39
 
5.3%
3 13
 
1.8%
4 12
 
1.6%
5 12
 
1.6%
8 11
 
1.5%
7 11
 
1.5%
6 11
 
1.5%
Dash Punctuation
ValueCountFrequency (%)
- 111
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 852
100.0%

Most frequent character per script

Common
ValueCountFrequency (%)
2 291
34.2%
0 231
27.1%
- 111
 
13.0%
1 110
 
12.9%
9 39
 
4.6%
3 13
 
1.5%
4 12
 
1.4%
5 12
 
1.4%
8 11
 
1.3%
7 11
 
1.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 852
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2 291
34.2%
0 231
27.1%
- 111
 
13.0%
1 110
 
12.9%
9 39
 
4.6%
3 13
 
1.5%
4 12
 
1.4%
5 12
 
1.4%
8 11
 
1.3%
7 11
 
1.3%
Distinct82
Distinct (%)73.9%
Missing0
Missing (%)0.0%
Memory size1020.0 B
2023-12-12T11:09:02.577620image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length35
Median length27
Mean length15.252252
Min length5

Characters and Unicode

Total characters1693
Distinct characters237
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique62 ?
Unique (%)55.9%

Sample

1st row2019년 정책실명제 운영
2nd row마을만들기사업
3rd row2019년 CCTV 구축 및 개선 사업
4th row석촌근린공원 다목적체육관 건립사업
5th row유해성 폐기물 분리수거량 제고
ValueCountFrequency (%)
남동구 10
 
2.8%
지원 7
 
2.0%
지원사업 7
 
2.0%
조성 6
 
1.7%
건립 6
 
1.7%
설치 6
 
1.7%
도로개설공사 6
 
1.7%
6
 
1.7%
복합청사 6
 
1.7%
설치사업 5
 
1.4%
Other values (186) 286
81.5%
2023-12-12T11:09:03.122223image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
240
 
14.2%
62
 
3.7%
43
 
2.5%
39
 
2.3%
37
 
2.2%
35
 
2.1%
31
 
1.8%
29
 
1.7%
26
 
1.5%
25
 
1.5%
Other values (227) 1126
66.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1320
78.0%
Space Separator 240
 
14.2%
Decimal Number 72
 
4.3%
Close Punctuation 16
 
0.9%
Open Punctuation 16
 
0.9%
Uppercase Letter 12
 
0.7%
Dash Punctuation 9
 
0.5%
Other Punctuation 7
 
0.4%
Math Symbol 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
62
 
4.7%
43
 
3.3%
39
 
3.0%
37
 
2.8%
35
 
2.7%
31
 
2.3%
29
 
2.2%
26
 
2.0%
25
 
1.9%
22
 
1.7%
Other values (203) 971
73.6%
Decimal Number
ValueCountFrequency (%)
2 22
30.6%
1 11
15.3%
0 10
13.9%
3 7
 
9.7%
4 7
 
9.7%
7 6
 
8.3%
5 4
 
5.6%
9 3
 
4.2%
6 2
 
2.8%
Uppercase Letter
ValueCountFrequency (%)
C 4
33.3%
I 4
33.3%
B 2
16.7%
T 1
 
8.3%
V 1
 
8.3%
Other Punctuation
ValueCountFrequency (%)
· 3
42.9%
, 3
42.9%
? 1
 
14.3%
Close Punctuation
ValueCountFrequency (%)
) 15
93.8%
1
 
6.2%
Open Punctuation
ValueCountFrequency (%)
( 15
93.8%
1
 
6.2%
Space Separator
ValueCountFrequency (%)
240
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 9
100.0%
Math Symbol
ValueCountFrequency (%)
~ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1320
78.0%
Common 361
 
21.3%
Latin 12
 
0.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
62
 
4.7%
43
 
3.3%
39
 
3.0%
37
 
2.8%
35
 
2.7%
31
 
2.3%
29
 
2.2%
26
 
2.0%
25
 
1.9%
22
 
1.7%
Other values (203) 971
73.6%
Common
ValueCountFrequency (%)
240
66.5%
2 22
 
6.1%
) 15
 
4.2%
( 15
 
4.2%
1 11
 
3.0%
0 10
 
2.8%
- 9
 
2.5%
3 7
 
1.9%
4 7
 
1.9%
7 6
 
1.7%
Other values (9) 19
 
5.3%
Latin
ValueCountFrequency (%)
C 4
33.3%
I 4
33.3%
B 2
16.7%
T 1
 
8.3%
V 1
 
8.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1320
78.0%
ASCII 368
 
21.7%
None 5
 
0.3%

Most frequent character per block

ASCII
ValueCountFrequency (%)
240
65.2%
2 22
 
6.0%
) 15
 
4.1%
( 15
 
4.1%
1 11
 
3.0%
0 10
 
2.7%
- 9
 
2.4%
3 7
 
1.9%
4 7
 
1.9%
7 6
 
1.6%
Other values (11) 26
 
7.1%
Hangul
ValueCountFrequency (%)
62
 
4.7%
43
 
3.3%
39
 
3.0%
37
 
2.8%
35
 
2.7%
31
 
2.3%
29
 
2.2%
26
 
2.0%
25
 
1.9%
22
 
1.7%
Other values (203) 971
73.6%
None
ValueCountFrequency (%)
· 3
60.0%
1
 
20.0%
1
 
20.0%

선정기준
Categorical

HIGH CORRELATION 

Distinct11
Distinct (%)9.9%
Missing0
Missing (%)0.0%
Memory size1020.0 B
10억원 이상의 대규모 사업
25 
그 밖에 남동구청장이 정책실명이 필요하다고 인정하는 사항
18 
주요 구정 현안에 관한 사항
16 
대규모 예산이 투입되는 사업 (※ 10억원 이상)
16 
그 밖에 중점관리 필요 사업
15 
Other values (6)
21 

Length

Max length34
Median length15
Mean length21.900901
Min length15

Unique

Unique2 ?
Unique (%)1.8%

Sample

1st row그 밖에 중점관리 필요 사업
2nd row그 밖에 중점관리 필요 사업
3rd row주요 구정 현안에 관한 사항
4th row10억원 이상의 대규모 사업
5th row주요 구정 현안에 관한 사항

Common Values

ValueCountFrequency (%)
10억원 이상의 대규모 사업 25
22.5%
그 밖에 남동구청장이 정책실명이 필요하다고 인정하는 사항 18
16.2%
주요 구정 현안에 관한 사항 16
14.4%
대규모 예산이 투입되는 사업 (※ 10억원 이상) 16
14.4%
그 밖에 중점관리 필요 사업 15
13.5%
주요 구정 현안에 관한 사항 (※ 국정 및 주요업무과제 포함) 8
 
7.2%
남동구민의 생활에 밀접한 영향을 끼치는 사업 또는 정책 7
 
6.3%
5천만원 이상의 연구용역 사업 2
 
1.8%
일정규모 이상의 연구 용역 (※ 5천만원 이상) 2
 
1.8%
주요 국제교류 및 통상에 관한 사항 1
 
0.9%

Length

2023-12-12T11:09:03.283338image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
사업 65
 
9.8%
사항 43
 
6.5%
10억원 41
 
6.2%
대규모 41
 
6.2%
33
 
5.0%
밖에 33
 
5.0%
이상의 29
 
4.4%
26
 
3.9%
관한 25
 
3.8%
주요 25
 
3.8%
Other values (32) 300
45.4%

사업부서
Categorical

Distinct39
Distinct (%)35.1%
Missing0
Missing (%)0.0%
Memory size1020.0 B
재무과
 
7
건설과
 
7
보육정책과
 
6
공원녹지과
 
6
방재하수과
 
5
Other values (34)
80 

Length

Max length7
Median length5
Mean length4.7657658
Min length3

Unique

Unique9 ?
Unique (%)8.1%

Sample

1st row기획예산실
2nd row총무과
3rd row안전총괄실
4th row문화관광체육과
5th row청소과

Common Values

ValueCountFrequency (%)
재무과 7
 
6.3%
건설과 7
 
6.3%
보육정책과 6
 
5.4%
공원녹지과 6
 
5.4%
방재하수과 5
 
4.5%
일자리정책과 5
 
4.5%
기업지원과 5
 
4.5%
식품위생과 4
 
3.6%
공영개발과 4
 
3.6%
총무과 4
 
3.6%
Other values (29) 58
52.3%

Length

2023-12-12T11:09:03.449286image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
재무과 7
 
6.3%
건설과 7
 
6.3%
보육정책과 6
 
5.4%
공원녹지과 6
 
5.4%
방재하수과 5
 
4.5%
일자리정책과 5
 
4.5%
기업지원과 5
 
4.5%
식품위생과 4
 
3.6%
공영개발과 4
 
3.6%
총무과 4
 
3.6%
Other values (29) 58
52.3%

데이터기준일자
Date

CONSTANT 

Distinct1
Distinct (%)0.9%
Missing0
Missing (%)0.0%
Memory size1020.0 B
Minimum2023-06-13 00:00:00
Maximum2023-06-13 00:00:00
2023-12-12T11:09:03.577269image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T11:09:03.692580image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=1)

Interactions

2023-12-12T11:09:00.394920image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T11:09:03.778369image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연번대상연도심의번호정책실명제 중점관리 대상사업 등록부(총괄)선정기준사업부서
연번1.0000.9690.0000.0000.6420.000
대상연도0.9691.0000.0000.0000.7380.000
심의번호0.0000.0001.0000.9300.0000.977
정책실명제 중점관리 대상사업 등록부(총괄)0.0000.0000.9301.0000.9520.999
선정기준0.6420.7380.0000.9521.0000.743
사업부서0.0000.0000.9770.9990.7431.000
2023-12-12T11:09:03.896113image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
대상연도선정기준사업부서
대상연도1.0000.5330.000
선정기준0.5331.0000.294
사업부서0.0000.2941.000
2023-12-12T11:09:03.990146image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연번대상연도선정기준사업부서
연번1.0000.8870.3450.000
대상연도0.8871.0000.5330.000
선정기준0.3450.5331.0000.294
사업부서0.0000.0000.2941.000

Missing values

2023-12-12T11:09:00.545111image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T11:09:00.693339image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연번대상연도심의번호정책실명제 중점관리 대상사업 등록부(총괄)선정기준사업부서데이터기준일자
01201902019-12019년 정책실명제 운영그 밖에 중점관리 필요 사업기획예산실2023-06-13
12201902019-2마을만들기사업그 밖에 중점관리 필요 사업총무과2023-06-13
23201902019-32019년 CCTV 구축 및 개선 사업주요 구정 현안에 관한 사항안전총괄실2023-06-13
34201902019-4석촌근린공원 다목적체육관 건립사업10억원 이상의 대규모 사업문화관광체육과2023-06-13
45201902019-5유해성 폐기물 분리수거량 제고주요 구정 현안에 관한 사항청소과2023-06-13
56201902019-6평생학습관 증축10억원 이상의 대규모 사업재무과2023-06-13
67201902019-7구월1동 복합청사 신축(제2국민체육센터)10억원 이상의 대규모 사업재무과2023-06-13
78201902019-8사회적기업 제품 우선구매 추진주요 구정 현안에 관한 사항일자리정책과2023-06-13
89201902019-9마을기업 및 사회적협동조합 제품구매 추진주요 구정 현안에 관한 사항일자리정책과2023-06-13
910201902019-10해외박람회 참가지원(개별)그 밖에 중점관리 필요 사업기업지원과2023-06-13
연번대상연도심의번호정책실명제 중점관리 대상사업 등록부(총괄)선정기준사업부서데이터기준일자
101102202202022-16소규모 정원(쉼터) 조성사업남동구민의 생활에 밀접한 영향을 끼치는 사업 또는 정책공원녹지과2023-06-13
102103202202022-17만부마을 도시재생 뉴딜사업대규모 예산이 투입되는 사업 (※ 10억원 이상)도시재생과2023-06-13
103104202202022-18세대통합형 복합시설 건립대규모 예산이 투입되는 사업 (※ 10억원 이상)공영개발과2023-06-13
104105202202022-19노후불량 하수관로 정비사업대규모 예산이 투입되는 사업 (※ 10억원 이상)방재하수과2023-06-13
105106202202022-20화재안전성능보강 지원사업대규모 예산이 투입되는 사업 (※ 10억원 이상)건축과2023-06-13
106107202202022-21공동주택 보조금 지원그 밖에 남동구청장이 정책실명이 필요하다고 인정하는 사항공동주택과2023-06-13
107108202202022-22해충퇴치기(포충기) 설치·관리를 통한 환경친화적 방제 사업남동구민의 생활에 밀접한 영향을 끼치는 사업 또는 정책보건행정과2023-06-13
108109202202022-23산후조리비 지원사업주요 구정 현안에 관한 사항 (※ 국정 및 주요업무과제 포함)건강증진과2023-06-13
109110202202022-24치매예방관리사업주요 구정 현안에 관한 사항 (※ 국정 및 주요업무과제 포함)치매정신과2023-06-13
110111202202022-25식중독 예방관리남동구민의 생활에 밀접한 영향을 끼치는 사업 또는 정책식품위생과2023-06-13