Overview

Dataset statistics

Number of variables2
Number of observations211
Missing cells46
Missing cells (%)10.9%
Duplicate rows12
Duplicate rows (%)5.7%
Total size in memory3.4 KiB
Average record size in memory16.6 B

Variable types

Text2

Dataset

Description충청남도 청년정책의 비전과 목표를 수립하고 충남도 청년정책을 제안하며 권역별 청년정책 방향을 제안하기 위한 근거 기반 자료로 활용하기 위한 설문 조사 자료
Author충청남도
URLhttps://www.data.go.kr/data/15114711/fileData.do

Alerts

Dataset has 12 (5.7%) duplicate rowsDuplicates
구분 has 12 (5.7%) missing valuesMissing
Unnamed: 1 has 34 (16.1%) missing valuesMissing

Reproduction

Analysis started2024-03-14 14:05:30.632033
Analysis finished2024-03-14 14:05:31.617995
Duration0.99 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

구분
Text

MISSING 

Distinct188
Distinct (%)94.5%
Missing12
Missing (%)5.7%
Memory size1.8 KiB
2024-03-14T23:05:32.670687image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length16
Median length15
Mean length7.2211055
Min length2

Characters and Unicode

Total characters1437
Distinct characters80
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique177 ?
Unique (%)88.9%

Sample

1st row[가중치]
2nd row[응답자 특성]
3rd row[A. 정주의사 및 주거환경]
4th row[B. 정신건강]
5th row[C. 교육·훈련]
ValueCountFrequency (%)
적용 87
26.5%
6
 
1.8%
정책 4
 
1.2%
응답자 3
 
0.9%
e 2
 
0.6%
관계 2
 
0.6%
자산형성 2
 
0.6%
g 2
 
0.6%
가족 2
 
0.6%
f 2
 
0.6%
Other values (198) 216
65.9%
2024-03-14T23:05:34.079784image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
129
 
9.0%
1 97
 
6.8%
91
 
6.3%
89
 
6.2%
89
 
6.2%
87
 
6.1%
87
 
6.1%
( 87
 
6.1%
) 87
 
6.1%
- 58
 
4.0%
Other values (70) 536
37.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 557
38.8%
Decimal Number 259
18.0%
Uppercase Letter 193
 
13.4%
Space Separator 129
 
9.0%
Open Punctuation 109
 
7.6%
Close Punctuation 109
 
7.6%
Dash Punctuation 58
 
4.0%
Other Punctuation 23
 
1.6%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
91
16.3%
89
16.0%
89
16.0%
87
15.6%
87
15.6%
8
 
1.4%
6
 
1.1%
5
 
0.9%
5
 
0.9%
4
 
0.7%
Other values (43) 86
15.4%
Decimal Number
ValueCountFrequency (%)
1 97
37.5%
2 44
17.0%
3 32
 
12.4%
4 28
 
10.8%
6 18
 
6.9%
5 18
 
6.9%
7 10
 
3.9%
8 8
 
3.1%
9 2
 
0.8%
0 2
 
0.8%
Uppercase Letter
ValueCountFrequency (%)
D 52
26.9%
B 26
13.5%
A 24
12.4%
E 24
12.4%
C 22
11.4%
F 16
 
8.3%
G 14
 
7.3%
I 12
 
6.2%
H 3
 
1.6%
Open Punctuation
ValueCountFrequency (%)
( 87
79.8%
[ 22
 
20.2%
Close Punctuation
ValueCountFrequency (%)
) 87
79.8%
] 22
 
20.2%
Other Punctuation
ValueCountFrequency (%)
. 18
78.3%
· 5
 
21.7%
Space Separator
ValueCountFrequency (%)
129
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 58
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 687
47.8%
Hangul 557
38.8%
Latin 193
 
13.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
91
16.3%
89
16.0%
89
16.0%
87
15.6%
87
15.6%
8
 
1.4%
6
 
1.1%
5
 
0.9%
5
 
0.9%
4
 
0.7%
Other values (43) 86
15.4%
Common
ValueCountFrequency (%)
129
18.8%
1 97
14.1%
( 87
12.7%
) 87
12.7%
- 58
8.4%
2 44
 
6.4%
3 32
 
4.7%
4 28
 
4.1%
[ 22
 
3.2%
] 22
 
3.2%
Other values (8) 81
11.8%
Latin
ValueCountFrequency (%)
D 52
26.9%
B 26
13.5%
A 24
12.4%
E 24
12.4%
C 22
11.4%
F 16
 
8.3%
G 14
 
7.3%
I 12
 
6.2%
H 3
 
1.6%

Most occurring blocks

ValueCountFrequency (%)
ASCII 875
60.9%
Hangul 557
38.8%
None 5
 
0.3%

Most frequent character per block

ASCII
ValueCountFrequency (%)
129
14.7%
1 97
11.1%
( 87
 
9.9%
) 87
 
9.9%
- 58
 
6.6%
D 52
 
5.9%
2 44
 
5.0%
3 32
 
3.7%
4 28
 
3.2%
B 26
 
3.0%
Other values (16) 235
26.9%
Hangul
ValueCountFrequency (%)
91
16.3%
89
16.0%
89
16.0%
87
15.6%
87
15.6%
8
 
1.4%
6
 
1.1%
5
 
0.9%
5
 
0.9%
4
 
0.7%
Other values (43) 86
15.4%
None
ValueCountFrequency (%)
· 5
100.0%

Unnamed: 1
Text

MISSING 

Distinct90
Distinct (%)50.8%
Missing34
Missing (%)16.1%
Memory size1.8 KiB
2024-03-14T23:05:35.119761image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length124
Median length60
Mean length48.983051
Min length16

Characters and Unicode

Total characters8670
Distinct characters298
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique3 ?
Unique (%)1.7%

Sample

1st row응답자 기본사항(가중치 적용)
2nd row충남 내 거주·생활 여부(가중치 적용)
3rd rowA1. 귀하는 만 19세 이후 다른 시도에서 충청남도로 이사해 오셨습니까?
4th rowA1. 귀하는 만 19세 이후 다른 시도에서 충청남도로 이사해 오셨습니까?
5th rowA1-1. 귀하께서 다른 시도에서 충청남도로 이사해 온 가장 주요한 이유는 무엇입니까?
ValueCountFrequency (%)
귀하는 76
 
4.0%
가장 50
 
2.6%
귀하께서 48
 
2.5%
무엇입니까 46
 
2.4%
있는 38
 
2.0%
있으십니까 36
 
1.9%
생각하십니까 30
 
1.6%
모두 28
 
1.5%
필요한 24
 
1.3%
이유는 20
 
1.0%
Other values (481) 1509
79.2%
2024-03-14T23:05:36.620779image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1730
 
20.0%
286
 
3.3%
. 224
 
2.6%
210
 
2.4%
184
 
2.1%
? 168
 
1.9%
168
 
1.9%
154
 
1.8%
152
 
1.8%
121
 
1.4%
Other values (288) 5273
60.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 5806
67.0%
Space Separator 1730
 
20.0%
Other Punctuation 482
 
5.6%
Decimal Number 281
 
3.2%
Uppercase Letter 175
 
2.0%
Open Punctuation 66
 
0.8%
Close Punctuation 66
 
0.8%
Dash Punctuation 58
 
0.7%
Math Symbol 6
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
286
 
4.9%
210
 
3.6%
184
 
3.2%
168
 
2.9%
154
 
2.7%
152
 
2.6%
121
 
2.1%
104
 
1.8%
96
 
1.7%
92
 
1.6%
Other values (258) 4239
73.0%
Decimal Number
ValueCountFrequency (%)
1 107
38.1%
2 44
15.7%
3 38
 
13.5%
4 28
 
10.0%
6 20
 
7.1%
5 18
 
6.4%
7 10
 
3.6%
8 8
 
2.8%
9 6
 
2.1%
0 2
 
0.7%
Uppercase Letter
ValueCountFrequency (%)
D 50
28.6%
B 24
13.7%
A 22
12.6%
E 22
12.6%
C 20
 
11.4%
F 14
 
8.0%
G 12
 
6.9%
I 10
 
5.7%
H 1
 
0.6%
Other Punctuation
ValueCountFrequency (%)
. 224
46.5%
? 168
34.9%
, 37
 
7.7%
· 31
 
6.4%
" 20
 
4.1%
/ 2
 
0.4%
Space Separator
ValueCountFrequency (%)
1730
100.0%
Open Punctuation
ValueCountFrequency (%)
( 66
100.0%
Close Punctuation
ValueCountFrequency (%)
) 66
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 58
100.0%
Math Symbol
ValueCountFrequency (%)
~ 6
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 5806
67.0%
Common 2689
31.0%
Latin 175
 
2.0%

Most frequent character per script

Hangul
ValueCountFrequency (%)
286
 
4.9%
210
 
3.6%
184
 
3.2%
168
 
2.9%
154
 
2.7%
152
 
2.6%
121
 
2.1%
104
 
1.8%
96
 
1.7%
92
 
1.6%
Other values (258) 4239
73.0%
Common
ValueCountFrequency (%)
1730
64.3%
. 224
 
8.3%
? 168
 
6.2%
1 107
 
4.0%
( 66
 
2.5%
) 66
 
2.5%
- 58
 
2.2%
2 44
 
1.6%
3 38
 
1.4%
, 37
 
1.4%
Other values (11) 151
 
5.6%
Latin
ValueCountFrequency (%)
D 50
28.6%
B 24
13.7%
A 22
12.6%
E 22
12.6%
C 20
 
11.4%
F 14
 
8.0%
G 12
 
6.9%
I 10
 
5.7%
H 1
 
0.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 5806
67.0%
ASCII 2833
32.7%
None 31
 
0.4%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1730
61.1%
. 224
 
7.9%
? 168
 
5.9%
1 107
 
3.8%
( 66
 
2.3%
) 66
 
2.3%
- 58
 
2.0%
D 50
 
1.8%
2 44
 
1.6%
3 38
 
1.3%
Other values (19) 282
 
10.0%
Hangul
ValueCountFrequency (%)
286
 
4.9%
210
 
3.6%
184
 
3.2%
168
 
2.9%
154
 
2.7%
152
 
2.6%
121
 
2.1%
104
 
1.8%
96
 
1.7%
92
 
1.6%
Other values (258) 4239
73.0%
None
ValueCountFrequency (%)
· 31
100.0%

Missing values

2024-03-14T23:05:31.042498image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-14T23:05:31.249635image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2024-03-14T23:05:31.491772image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

구분Unnamed: 1
0[가중치]<NA>
1[응답자 특성]<NA>
2[A. 정주의사 및 주거환경]<NA>
3[B. 정신건강]<NA>
4[C. 교육·훈련]<NA>
5[D. 구직 및 취·창업]<NA>
6[E. 관계 및 정책 참여]<NA>
7[F. 가족 돌봄]<NA>
8[G. 자산형성]<NA>
9[H. 기타]<NA>
구분Unnamed: 1
201I1I1. 다음은 충청남도에서 실시하고 있는 "일자리" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.(중복응답)
202I1(가중치 적용)I1. 다음은 충청남도에서 실시하고 있는 "일자리" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.(중복응답)
203I2I2. 다음은 충청남도에서 실시하고 있는 "주거" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.
204I2(가중치 적용)I2. 다음은 충청남도에서 실시하고 있는 "주거" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.
205I3I3. 다음은 충청남도에서 실시하고 있는 "교육" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.
206I3(가중치 적용)I3. 다음은 충청남도에서 실시하고 있는 "교육" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.
207I4I4. 다음은 충청남도에서 실시하고 있는 "복지·문화" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.
208I4(가중치 적용)I4. 다음은 충청남도에서 실시하고 있는 "복지·문화" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.
209I5I5. 다음은 충청남도에서 실시하고 있는 "참여·권리" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.
210I5(가중치 적용)I5. 다음은 충청남도에서 실시하고 있는 "참여·권리" 관련 사업입니다. 알고 있는 사업을 모두 체크해주십시오.

Duplicate rows

Most frequently occurring

구분Unnamed: 1# duplicates
11<NA><NA>12
0[A. 정주의사 및 주거환경]<NA>2
1[B. 정신건강]<NA>2
2[C. 교육·훈련]<NA>2
3[D. 구직 및 취·창업]<NA>2
4[E. 관계 및 정책 참여]<NA>2
5[F. 가족 돌봄]<NA>2
6[G. 자산형성]<NA>2
7[H. 기타]<NA>2
8[I. 정책 인지도]<NA>2