Overview

Dataset statistics

Number of variables16
Number of observations375
Missing cells2018
Missing cells (%)33.6%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory48.8 KiB
Average record size in memory133.4 B

Variable types

Categorical7
Text3
Unsupported3
DateTime2
Numeric1

Dataset

Description경력단절 여성 취업지원 교육훈련 프로그램 현황
Author경기도
URLhttps://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=DRY8EVZ8P7SE3RG8FU1V19017366&infSeq=1

Alerts

훈련직종대분류명 is highly overall correlated with 교육년도 and 3 other fieldsHigh correlation
시군명 is highly overall correlated with 새일센터명High correlation
훈련직종중분류명 is highly overall correlated with 교육년도 and 3 other fieldsHigh correlation
새일센터명 is highly overall correlated with 시군명High correlation
교육년도 is highly overall correlated with 과정유형명 and 3 other fieldsHigh correlation
과정유형명 is highly overall correlated with 교육년도 and 3 other fieldsHigh correlation
과정세부유형명 is highly overall correlated with 교육년도 and 3 other fieldsHigh correlation
훈련과정주요정보 has 241 (64.3%) missing valuesMissing
훈련과정선정내역 has 250 (66.7%) missing valuesMissing
훈련구분명 has 375 (100.0%) missing valuesMissing
교육시간 has 375 (100.0%) missing valuesMissing
교육시작일자 has 134 (35.7%) missing valuesMissing
교육종료일자 has 134 (35.7%) missing valuesMissing
교육인원수(명) has 134 (35.7%) missing valuesMissing
현장실습시간 has 375 (100.0%) missing valuesMissing
훈련구분명 is an unsupported type, check if it needs cleaning or further analysisUnsupported
교육시간 is an unsupported type, check if it needs cleaning or further analysisUnsupported
현장실습시간 is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2023-12-10 21:16:26.209178
Analysis finished2023-12-10 21:16:28.002379
Duration1.79 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

교육년도
Categorical

HIGH CORRELATION 

Distinct3
Distinct (%)0.8%
Missing0
Missing (%)0.0%
Memory size3.1 KiB
2018
134 
2023
122 
2022
119 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2023
2nd row2023
3rd row2023
4th row2023
5th row2023

Common Values

ValueCountFrequency (%)
2018 134
35.7%
2023 122
32.5%
2022 119
31.7%

Length

2023-12-11T06:16:28.082618image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T06:16:28.178663image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2018 134
35.7%
2023 122
32.5%
2022 119
31.7%

시군명
Categorical

HIGH CORRELATION 

Distinct24
Distinct (%)6.4%
Missing0
Missing (%)0.0%
Memory size3.1 KiB
시흥시
35 
수원시
30 
<NA>
27 
고양시
 
23
의정부시
 
21
Other values (19)
239 

Length

Max length4
Median length3
Mean length3.1653333
Min length3

Unique

Unique1 ?
Unique (%)0.3%

Sample

1st row고양시
2nd row고양시
3rd row고양시
4th row고양시
5th row고양시

Common Values

ValueCountFrequency (%)
시흥시 35
 
9.3%
수원시 30
 
8.0%
<NA> 27
 
7.2%
고양시 23
 
6.1%
의정부시 21
 
5.6%
성남시 21
 
5.6%
안산시 19
 
5.1%
안양시 19
 
5.1%
용인시 19
 
5.1%
화성시 15
 
4.0%
Other values (14) 146
38.9%

Length

2023-12-11T06:16:28.284515image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
시흥시 35
 
9.3%
수원시 30
 
8.0%
na 27
 
7.2%
고양시 23
 
6.1%
의정부시 21
 
5.6%
성남시 21
 
5.6%
안산시 19
 
5.1%
안양시 19
 
5.1%
용인시 19
 
5.1%
화성시 15
 
4.0%
Other values (14) 146
38.9%

새일센터명
Categorical

HIGH CORRELATION 

Distinct34
Distinct (%)9.1%
Missing0
Missing (%)0.0%
Memory size3.1 KiB
성남새일센터
 
21
시흥새일센터
 
20
안산새일센터
 
19
경기IT새일센터
 
18
안양새일센터
 
17
Other values (29)
280 

Length

Max length11
Median length6
Mean length6.6746667
Min length6

Unique

Unique1 ?
Unique (%)0.3%

Sample

1st row고양새일센터
2nd row고양새일센터
3rd row고양새일센터
4th row고양MICE새일센터
5th row고양새일센터

Common Values

ValueCountFrequency (%)
성남새일센터 21
 
5.6%
시흥새일센터 20
 
5.3%
안산새일센터 19
 
5.1%
경기IT새일센터 18
 
4.8%
안양새일센터 17
 
4.5%
영통새일센터 16
 
4.3%
경기북부새일센터 16
 
4.3%
화성새일센터 15
 
4.0%
부천새일센터 15
 
4.0%
포천새일센터 14
 
3.7%
Other values (24) 204
54.4%

Length

2023-12-11T06:16:28.421868image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
성남새일센터 21
 
5.6%
시흥새일센터 20
 
5.3%
안산새일센터 19
 
5.1%
경기it새일센터 18
 
4.8%
안양새일센터 17
 
4.5%
영통새일센터 16
 
4.3%
경기북부새일센터 16
 
4.3%
화성새일센터 15
 
4.0%
부천새일센터 15
 
4.0%
포천새일센터 14
 
3.7%
Other values (24) 204
54.4%

과정유형명
Categorical

HIGH CORRELATION 

Distinct14
Distinct (%)3.7%
Missing0
Missing (%)0.0%
Memory size3.1 KiB
일반
162 
(1)일반
81 
전문기술
27 
(2)전문기술
25 
창업
17 
Other values (9)
63 

Length

Max length9
Median length8
Mean length3.6906667
Min length2

Unique

Unique1 ?
Unique (%)0.3%

Sample

1st row일반
2nd row일반
3rd row일반
4th row일반
5th row창업

Common Values

ValueCountFrequency (%)
일반 162
43.2%
(1)일반 81
21.6%
전문기술 27
 
7.2%
(2)전문기술 25
 
6.7%
창업 17
 
4.5%
새일역량교육 12
 
3.2%
고부가가치 11
 
2.9%
고부가 10
 
2.7%
<NA> 8
 
2.1%
(4)취약계층 7
 
1.9%
Other values (4) 15
 
4.0%

Length

2023-12-11T06:16:28.574491image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
일반 162
43.1%
1)일반 81
21.5%
전문기술 27
 
7.2%
2)전문기술 25
 
6.6%
창업 17
 
4.5%
새일역량교육 12
 
3.2%
고부가가치 11
 
2.9%
고부가 10
 
2.7%
na 8
 
2.1%
4)취약계층 7
 
1.9%
Other values (5) 16
 
4.3%

과정세부유형명
Categorical

HIGH CORRELATION 

Distinct17
Distinct (%)4.5%
Missing0
Missing (%)0.0%
Memory size3.1 KiB
일반
142 
(1-1)일반
72 
전문기술
39 
기업맞춤
35 
(2-1)전문기술
20 
Other values (12)
67 

Length

Max length14
Median length12
Mean length5.096
Min length2

Unique

Unique2 ?
Unique (%)0.5%

Sample

1st row일반
2nd row일반
3rd row일반
4th row일반
5th row일반

Common Values

ValueCountFrequency (%)
일반 142
37.9%
(1-1)일반 72
19.2%
전문기술 39
 
10.4%
기업맞춤 35
 
9.3%
(2-1)전문기술 20
 
5.3%
새일역량교육 12
 
3.2%
(1-2)일반-기업맞춤 9
 
2.4%
<NA> 9
 
2.4%
(공모-고부가)전문기술 8
 
2.1%
(4-1)취약계층-결혼이민 7
 
1.9%
Other values (7) 22
 
5.9%

Length

2023-12-11T06:16:28.730793image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
일반 142
37.9%
1-1)일반 72
19.2%
전문기술 39
 
10.4%
기업맞춤 35
 
9.3%
2-1)전문기술 20
 
5.3%
새일역량교육 12
 
3.2%
1-2)일반-기업맞춤 9
 
2.4%
na 9
 
2.4%
공모-고부가)전문기술 8
 
2.1%
4-1)취약계층-결혼이민 7
 
1.9%
Other values (7) 22
 
5.9%
Distinct331
Distinct (%)88.3%
Missing0
Missing (%)0.0%
Memory size3.1 KiB
2023-12-11T06:16:28.959616image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length29
Median length21
Mean length12.746667
Min length4

Characters and Unicode

Total characters4780
Distinct characters328
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique295 ?
Unique (%)78.7%

Sample

1st row디지털 코칭 전문가
2nd row보험총무사무원 양성과정
3rd row직업상담사 실무과정
4th rowSNS홍보마케팅 기획전문가
5th row온라인쇼핑몰창업 CEO 실무과정
ValueCountFrequency (%)
양성과정 113
 
14.0%
전문가 25
 
3.1%
양성 22
 
2.7%
과정 13
 
1.6%
실무과정 12
 
1.5%
사무원 11
 
1.4%
실무 10
 
1.2%
이모티콘 7
 
0.9%
사회복지 6
 
0.7%
실무자 6
 
0.7%
Other values (412) 585
72.2%
2023-12-11T06:16:29.378119image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
435
 
9.1%
241
 
5.0%
213
 
4.5%
204
 
4.3%
203
 
4.2%
188
 
3.9%
185
 
3.9%
110
 
2.3%
97
 
2.0%
92
 
1.9%
Other values (318) 2812
58.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 4025
84.2%
Space Separator 435
 
9.1%
Uppercase Letter 170
 
3.6%
Other Punctuation 54
 
1.1%
Lowercase Letter 36
 
0.8%
Close Punctuation 22
 
0.5%
Open Punctuation 22
 
0.5%
Dash Punctuation 10
 
0.2%
Decimal Number 5
 
0.1%
Connector Punctuation 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
241
 
6.0%
213
 
5.3%
204
 
5.1%
203
 
5.0%
188
 
4.7%
185
 
4.6%
110
 
2.7%
97
 
2.4%
92
 
2.3%
90
 
2.2%
Other values (268) 2402
59.7%
Uppercase Letter
ValueCountFrequency (%)
S 18
10.6%
E 17
10.0%
I 16
 
9.4%
A 13
 
7.6%
U 12
 
7.1%
R 12
 
7.1%
C 11
 
6.5%
P 11
 
6.5%
W 10
 
5.9%
D 10
 
5.9%
Other values (10) 40
23.5%
Lowercase Letter
ValueCountFrequency (%)
e 9
25.0%
i 4
11.1%
s 4
11.1%
o 2
 
5.6%
w 2
 
5.6%
g 2
 
5.6%
t 2
 
5.6%
n 2
 
5.6%
p 2
 
5.6%
l 2
 
5.6%
Other values (5) 5
13.9%
Other Punctuation
ValueCountFrequency (%)
? 20
37.0%
& 19
35.2%
· 5
 
9.3%
/ 4
 
7.4%
, 4
 
7.4%
! 2
 
3.7%
Decimal Number
ValueCountFrequency (%)
4 2
40.0%
1 1
20.0%
3 1
20.0%
5 1
20.0%
Space Separator
ValueCountFrequency (%)
435
100.0%
Close Punctuation
ValueCountFrequency (%)
) 22
100.0%
Open Punctuation
ValueCountFrequency (%)
( 22
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 10
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 4025
84.2%
Common 549
 
11.5%
Latin 206
 
4.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
241
 
6.0%
213
 
5.3%
204
 
5.1%
203
 
5.0%
188
 
4.7%
185
 
4.6%
110
 
2.7%
97
 
2.4%
92
 
2.3%
90
 
2.2%
Other values (268) 2402
59.7%
Latin
ValueCountFrequency (%)
S 18
 
8.7%
E 17
 
8.3%
I 16
 
7.8%
A 13
 
6.3%
U 12
 
5.8%
R 12
 
5.8%
C 11
 
5.3%
P 11
 
5.3%
W 10
 
4.9%
D 10
 
4.9%
Other values (25) 76
36.9%
Common
ValueCountFrequency (%)
435
79.2%
) 22
 
4.0%
( 22
 
4.0%
? 20
 
3.6%
& 19
 
3.5%
- 10
 
1.8%
· 5
 
0.9%
/ 4
 
0.7%
, 4
 
0.7%
4 2
 
0.4%
Other values (5) 6
 
1.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 4023
84.2%
ASCII 750
 
15.7%
None 5
 
0.1%
Compat Jamo 2
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
435
58.0%
) 22
 
2.9%
( 22
 
2.9%
? 20
 
2.7%
& 19
 
2.5%
S 18
 
2.4%
E 17
 
2.3%
I 16
 
2.1%
A 13
 
1.7%
U 12
 
1.6%
Other values (39) 156
 
20.8%
Hangul
ValueCountFrequency (%)
241
 
6.0%
213
 
5.3%
204
 
5.1%
203
 
5.0%
188
 
4.7%
185
 
4.6%
110
 
2.7%
97
 
2.4%
92
 
2.3%
90
 
2.2%
Other values (267) 2400
59.7%
None
ValueCountFrequency (%)
· 5
100.0%
Compat Jamo
ValueCountFrequency (%)
2
100.0%
Distinct133
Distinct (%)99.3%
Missing241
Missing (%)64.3%
Memory size3.1 KiB
2023-12-11T06:16:29.680615image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length157
Median length79
Mean length64.768657
Min length18

Characters and Unicode

Total characters8679
Distinct characters491
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique132 ?
Unique (%)98.5%

Sample

1st row일러스트, 포토샵 등 디자인 스킬과 실무교육, 포트폴리오 제작을 통해 MICE산업체가 원하는 광고를 효과적으로 만들어 낼 수 있는 광고기획전문가 양성
2nd row한국지식재산전략원과 연계하여 IP-R&D 기초 내용과 특허분석, 대응전략, 아이디어 창출 등의 실무 교육을 통하여 IP-R&D 전략전문가 양성
3rd row?IoT 프로그램(아두이노 프로그래밍, 피지컬 컴퓨팅, 앱인벤터, Visual Studio C#, 데이터베이스 등) 교육을 통한 사물인터넷(IoT)전문가 양성 과정
4th row?국내오픈마켓, 글로벌셀러 통합과정 등 온·오프라인 취·창업과정
5th row회계원리, 원가회계, 세무회계에 관한 지식을 갖추고, 기업에서 원하는 기본업무처리능력을 배양하여 자격증 취득 및 관련분야 취업자를 양성하는 과정
ValueCountFrequency (%)
80
 
4.3%
51
 
2.7%
양성 31
 
1.7%
22
 
1.2%
과정 19
 
1.0%
통해 19
 
1.0%
교육 16
 
0.9%
있는 16
 
0.9%
이해 14
 
0.8%
마케팅 11
 
0.6%
Other values (1148) 1582
85.0%
2023-12-11T06:16:30.233759image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1740
 
20.0%
, 323
 
3.7%
121
 
1.4%
120
 
1.4%
108
 
1.2%
106
 
1.2%
102
 
1.2%
101
 
1.2%
98
 
1.1%
96
 
1.1%
Other values (481) 5764
66.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 6240
71.9%
Space Separator 1740
 
20.0%
Other Punctuation 390
 
4.5%
Uppercase Letter 182
 
2.1%
Lowercase Letter 49
 
0.6%
Decimal Number 29
 
0.3%
Close Punctuation 19
 
0.2%
Open Punctuation 19
 
0.2%
Dash Punctuation 8
 
0.1%
Math Symbol 3
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
121
 
1.9%
120
 
1.9%
108
 
1.7%
106
 
1.7%
102
 
1.6%
101
 
1.6%
98
 
1.6%
96
 
1.5%
96
 
1.5%
95
 
1.5%
Other values (419) 5197
83.3%
Uppercase Letter
ValueCountFrequency (%)
S 21
11.5%
I 19
10.4%
D 17
9.3%
U 14
 
7.7%
T 13
 
7.1%
C 13
 
7.1%
A 13
 
7.1%
P 11
 
6.0%
E 11
 
6.0%
R 8
 
4.4%
Other values (12) 42
23.1%
Lowercase Letter
ValueCountFrequency (%)
o 8
16.3%
s 6
12.2%
a 4
 
8.2%
i 4
 
8.2%
r 3
 
6.1%
u 3
 
6.1%
n 3
 
6.1%
c 2
 
4.1%
e 2
 
4.1%
l 2
 
4.1%
Other values (11) 12
24.5%
Other Punctuation
ValueCountFrequency (%)
, 323
82.8%
/ 21
 
5.4%
. 14
 
3.6%
? 12
 
3.1%
' 8
 
2.1%
· 6
 
1.5%
& 5
 
1.3%
# 1
 
0.3%
Decimal Number
ValueCountFrequency (%)
3 10
34.5%
1 10
34.5%
2 5
17.2%
4 2
 
6.9%
6 1
 
3.4%
7 1
 
3.4%
Space Separator
ValueCountFrequency (%)
1740
100.0%
Close Punctuation
ValueCountFrequency (%)
) 19
100.0%
Open Punctuation
ValueCountFrequency (%)
( 19
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 8
100.0%
Math Symbol
ValueCountFrequency (%)
> 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 6240
71.9%
Common 2208
 
25.4%
Latin 231
 
2.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
121
 
1.9%
120
 
1.9%
108
 
1.7%
106
 
1.7%
102
 
1.6%
101
 
1.6%
98
 
1.6%
96
 
1.5%
96
 
1.5%
95
 
1.5%
Other values (419) 5197
83.3%
Latin
ValueCountFrequency (%)
S 21
 
9.1%
I 19
 
8.2%
D 17
 
7.4%
U 14
 
6.1%
T 13
 
5.6%
C 13
 
5.6%
A 13
 
5.6%
P 11
 
4.8%
E 11
 
4.8%
R 8
 
3.5%
Other values (33) 91
39.4%
Common
ValueCountFrequency (%)
1740
78.8%
, 323
 
14.6%
/ 21
 
1.0%
) 19
 
0.9%
( 19
 
0.9%
. 14
 
0.6%
? 12
 
0.5%
3 10
 
0.5%
1 10
 
0.5%
' 8
 
0.4%
Other values (9) 32
 
1.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 6239
71.9%
ASCII 2433
 
28.0%
None 6
 
0.1%
Compat Jamo 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1740
71.5%
, 323
 
13.3%
/ 21
 
0.9%
S 21
 
0.9%
) 19
 
0.8%
I 19
 
0.8%
( 19
 
0.8%
D 17
 
0.7%
. 14
 
0.6%
U 14
 
0.6%
Other values (51) 226
 
9.3%
Hangul
ValueCountFrequency (%)
121
 
1.9%
120
 
1.9%
108
 
1.7%
106
 
1.7%
102
 
1.6%
101
 
1.6%
98
 
1.6%
96
 
1.5%
96
 
1.5%
95
 
1.5%
Other values (418) 5196
83.3%
None
ValueCountFrequency (%)
· 6
100.0%
Compat Jamo
ValueCountFrequency (%)
1
100.0%
Distinct121
Distinct (%)96.8%
Missing250
Missing (%)66.7%
Memory size3.1 KiB
2023-12-11T06:16:30.551567image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length218
Median length117
Mean length87.52
Min length9

Characters and Unicode

Total characters10940
Distinct characters487
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique119 ?
Unique (%)95.2%

Sample

1st rowMICE산업 중심의 지역적 특성에 따라 컨벤션(Convention) 및 전시박람회와 이벤트(Exhibition&Event) 분야의 광고기획 구인업체의 인력수요 증대
2nd row4차 산업혁명 시대 도래 및 MICE산업 중심의 지역적 특성에 따라 기획회의(Meeting) 분야 등에 필요한 특허 관련 실무자 양성 교육의 필요성 증대
3rd row인성교육진흥법과 자유학년제 전면 시행에 따라 청소년 인성교육 및 진로지도 강사수요를 충족시키는 융합형 교육전문가를 양성하여 경력단절여성의 취업경쟁력을 강화함
4th row소자본 창업이 가능한 온-오프라인 통합 교육으로, 경력단절여성에 맞는 아이템 선정부터 창업실무교육, 사업자등록 및 수익마켓 참여지원까지의 One-Stop 시스템을 갖춤
5th row초?중학교에서의 소프트웨어 의무교육 단계적 시행에 따라, 청소년 소프트웨어 교육 프로그램 개발과 운영을 전문적으로 담당할 교육 전문가의 구인 수요를 충족시킴
ValueCountFrequency (%)
46
 
1.9%
있는 25
 
1.0%
25
 
1.0%
수요가 18
 
0.7%
통해 18
 
0.7%
따라 16
 
0.7%
대한 16
 
0.7%
교육 12
 
0.5%
있으며 12
 
0.5%
관련 11
 
0.5%
Other values (1534) 2236
91.8%
2023-12-11T06:16:31.309639image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2334
 
21.3%
177
 
1.6%
174
 
1.6%
150
 
1.4%
150
 
1.4%
147
 
1.3%
138
 
1.3%
138
 
1.3%
129
 
1.2%
129
 
1.2%
Other values (477) 7274
66.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 7920
72.4%
Space Separator 2334
 
21.3%
Decimal Number 231
 
2.1%
Other Punctuation 216
 
2.0%
Uppercase Letter 83
 
0.8%
Lowercase Letter 61
 
0.6%
Open Punctuation 40
 
0.4%
Close Punctuation 40
 
0.4%
Initial Punctuation 6
 
0.1%
Final Punctuation 4
 
< 0.1%
Other values (2) 5
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
177
 
2.2%
174
 
2.2%
150
 
1.9%
150
 
1.9%
147
 
1.9%
138
 
1.7%
138
 
1.7%
129
 
1.6%
129
 
1.6%
126
 
1.6%
Other values (417) 6462
81.6%
Uppercase Letter
ValueCountFrequency (%)
S 12
14.5%
W 10
12.0%
I 10
12.0%
C 9
10.8%
E 9
10.8%
M 6
 
7.2%
T 4
 
4.8%
A 4
 
4.8%
V 2
 
2.4%
J 2
 
2.4%
Other values (11) 15
18.1%
Lowercase Letter
ValueCountFrequency (%)
n 13
21.3%
i 10
16.4%
t 9
14.8%
e 9
14.8%
o 7
11.5%
v 4
 
6.6%
b 2
 
3.3%
x 2
 
3.3%
h 2
 
3.3%
g 2
 
3.3%
Decimal Number
ValueCountFrequency (%)
1 51
22.1%
0 48
20.8%
2 38
16.5%
4 23
10.0%
3 16
 
6.9%
5 15
 
6.5%
6 13
 
5.6%
8 12
 
5.2%
7 9
 
3.9%
9 6
 
2.6%
Other Punctuation
ValueCountFrequency (%)
, 122
56.5%
. 53
24.5%
% 20
 
9.3%
? 4
 
1.9%
' 4
 
1.9%
& 4
 
1.9%
· 4
 
1.9%
: 4
 
1.9%
/ 1
 
0.5%
Open Punctuation
ValueCountFrequency (%)
( 39
97.5%
1
 
2.5%
Close Punctuation
ValueCountFrequency (%)
) 39
97.5%
1
 
2.5%
Space Separator
ValueCountFrequency (%)
2334
100.0%
Initial Punctuation
ValueCountFrequency (%)
6
100.0%
Final Punctuation
ValueCountFrequency (%)
4
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 3
100.0%
Math Symbol
ValueCountFrequency (%)
~ 2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 7920
72.4%
Common 2876
 
26.3%
Latin 144
 
1.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
177
 
2.2%
174
 
2.2%
150
 
1.9%
150
 
1.9%
147
 
1.9%
138
 
1.7%
138
 
1.7%
129
 
1.6%
129
 
1.6%
126
 
1.6%
Other values (417) 6462
81.6%
Latin
ValueCountFrequency (%)
n 13
 
9.0%
S 12
 
8.3%
W 10
 
6.9%
i 10
 
6.9%
I 10
 
6.9%
t 9
 
6.2%
C 9
 
6.2%
E 9
 
6.2%
e 9
 
6.2%
o 7
 
4.9%
Other values (22) 46
31.9%
Common
ValueCountFrequency (%)
2334
81.2%
, 122
 
4.2%
. 53
 
1.8%
1 51
 
1.8%
0 48
 
1.7%
( 39
 
1.4%
) 39
 
1.4%
2 38
 
1.3%
4 23
 
0.8%
% 20
 
0.7%
Other values (18) 109
 
3.8%

Most occurring blocks

ValueCountFrequency (%)
Hangul 7918
72.4%
ASCII 3004
 
27.5%
Punctuation 10
 
0.1%
None 6
 
0.1%
Compat Jamo 2
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2334
77.7%
, 122
 
4.1%
. 53
 
1.8%
1 51
 
1.7%
0 48
 
1.6%
( 39
 
1.3%
) 39
 
1.3%
2 38
 
1.3%
4 23
 
0.8%
% 20
 
0.7%
Other values (45) 237
 
7.9%
Hangul
ValueCountFrequency (%)
177
 
2.2%
174
 
2.2%
150
 
1.9%
150
 
1.9%
147
 
1.9%
138
 
1.7%
138
 
1.7%
129
 
1.6%
129
 
1.6%
126
 
1.6%
Other values (416) 6460
81.6%
Punctuation
ValueCountFrequency (%)
6
60.0%
4
40.0%
None
ValueCountFrequency (%)
· 4
66.7%
1
 
16.7%
1
 
16.7%
Compat Jamo
ValueCountFrequency (%)
2
100.0%

훈련직종대분류명
Categorical

HIGH CORRELATION 

Distinct14
Distinct (%)3.7%
Missing0
Missing (%)0.0%
Memory size3.1 KiB
사무관리분야
98 
(1)일반
81 
서비스분야
55 
정보·통신분야
51 
(2)전문기술
25 
Other values (9)
65 

Length

Max length9
Median length8
Mean length5.784
Min length4

Unique

Unique2 ?
Unique (%)0.5%

Sample

1st row서비스분야
2nd row금융·보험분야
3rd row사무관리분야
4th row사무관리분야
5th row정보·통신분야

Common Values

ValueCountFrequency (%)
사무관리분야 98
26.1%
(1)일반 81
21.6%
서비스분야 55
14.7%
정보·통신분야 51
13.6%
(2)전문기술 25
 
6.7%
의료분야 15
 
4.0%
산업응용분야 15
 
4.0%
<NA> 8
 
2.1%
(4)취약계층 7
 
1.9%
금융·보험분야 6
 
1.6%
Other values (4) 14
 
3.7%

Length

2023-12-11T06:16:31.455184image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
사무관리분야 98
26.1%
1)일반 81
21.5%
서비스분야 55
14.6%
정보·통신분야 51
13.6%
2)전문기술 25
 
6.6%
의료분야 15
 
4.0%
산업응용분야 15
 
4.0%
na 8
 
2.1%
4)취약계층 7
 
1.9%
금융·보험분야 6
 
1.6%
Other values (5) 15
 
4.0%

훈련직종중분류명
Categorical

HIGH CORRELATION 

Distinct28
Distinct (%)7.5%
Missing0
Missing (%)0.0%
Memory size3.1 KiB
(1-1)일반
72 
정보·통신응용
43 
재무 및 경영
42 
기타 서비스
35 
사무지원
31 
Other values (23)
152 

Length

Max length14
Median length12
Mean length6.592
Min length2

Unique

Unique4 ?
Unique (%)1.1%

Sample

1st row기타 서비스
2nd row증권·보험
3rd row인사노무
4th row판매사무
5th row정보·통신응용

Common Values

ValueCountFrequency (%)
(1-1)일반 72
19.2%
정보·통신응용 43
11.5%
재무 및 경영 42
11.2%
기타 서비스 35
9.3%
사무지원 31
8.3%
(2-1)전문기술 20
 
5.3%
음식서비스 18
 
4.8%
디자인개발 15
 
4.0%
의료보조 14
 
3.7%
판매사무 9
 
2.4%
Other values (18) 76
20.3%

Length

2023-12-11T06:16:31.590502image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
1-1)일반 72
14.3%
44
 
8.7%
정보·통신응용 43
 
8.5%
재무 42
 
8.3%
경영 42
 
8.3%
기타 42
 
8.3%
서비스 35
 
6.9%
사무지원 31
 
6.1%
2-1)전문기술 20
 
4.0%
음식서비스 18
 
3.6%
Other values (22) 116
23.0%

훈련구분명
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing375
Missing (%)100.0%
Memory size3.4 KiB

교육시간
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing375
Missing (%)100.0%
Memory size3.4 KiB

교육시작일자
Date

MISSING 

Distinct116
Distinct (%)48.1%
Missing134
Missing (%)35.7%
Memory size3.1 KiB
Minimum2022-03-02 00:00:00
Maximum2023-09-11 00:00:00
2023-12-11T06:16:31.752928image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-11T06:16:31.903089image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

교육종료일자
Date

MISSING 

Distinct153
Distinct (%)63.5%
Missing134
Missing (%)35.7%
Memory size3.1 KiB
Minimum2022-04-11 00:00:00
Maximum2023-11-30 00:00:00
2023-12-11T06:16:32.037534image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-11T06:16:32.205078image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

교육인원수(명)
Real number (ℝ)

MISSING 

Distinct10
Distinct (%)4.1%
Missing134
Missing (%)35.7%
Infinite0
Infinite (%)0.0%
Mean19.443983
Minimum10
Maximum25
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size3.4 KiB
2023-12-11T06:16:32.347600image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum10
5-th percentile16
Q120
median20
Q320
95-th percentile20
Maximum25
Range15
Interquartile range (IQR)0

Descriptive statistics

Standard deviation1.7859332
Coefficient of variation (CV)0.091850171
Kurtosis10.298406
Mean19.443983
Median Absolute Deviation (MAD)0
Skewness-2.3172656
Sum4686
Variance3.1895574
MonotonicityNot monotonic
2023-12-11T06:16:32.461156image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%)
20 191
50.9%
18 20
 
5.3%
16 11
 
2.9%
15 6
 
1.6%
25 3
 
0.8%
10 3
 
0.8%
22 3
 
0.8%
19 2
 
0.5%
14 1
 
0.3%
17 1
 
0.3%
(Missing) 134
35.7%
ValueCountFrequency (%)
10 3
 
0.8%
14 1
 
0.3%
15 6
 
1.6%
16 11
 
2.9%
17 1
 
0.3%
18 20
 
5.3%
19 2
 
0.5%
20 191
50.9%
22 3
 
0.8%
25 3
 
0.8%
ValueCountFrequency (%)
25 3
 
0.8%
22 3
 
0.8%
20 191
50.9%
19 2
 
0.5%
18 20
 
5.3%
17 1
 
0.3%
16 11
 
2.9%
15 6
 
1.6%
14 1
 
0.3%
10 3
 
0.8%

현장실습시간
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing375
Missing (%)100.0%
Memory size3.4 KiB

Interactions

2023-12-11T06:16:27.237224image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-11T06:16:32.541232image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
교육년도시군명새일센터명과정유형명과정세부유형명훈련직종대분류명훈련직종중분류명교육인원수(명)
교육년도1.0000.0000.1670.8480.8570.8290.9060.231
시군명0.0001.0001.0000.4000.4760.3520.4820.720
새일센터명0.1671.0001.0000.6470.6630.5690.7370.728
과정유형명0.8480.4000.6471.0000.9850.9820.9510.601
과정세부유형명0.8570.4760.6630.9851.0000.9350.9770.607
훈련직종대분류명0.8290.3520.5690.9820.9351.0001.0000.000
훈련직종중분류명0.9060.4820.7370.9510.9771.0001.0000.000
교육인원수(명)0.2310.7200.7280.6010.6070.0000.0001.000
2023-12-11T06:16:32.651925image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
훈련직종대분류명교육년도시군명과정유형명과정세부유형명훈련직종중분류명새일센터명
훈련직종대분류명1.0000.6890.1210.7350.6900.9790.206
교육년도0.6891.0000.0000.7180.7070.6690.078
시군명0.1210.0001.0000.1400.1610.1410.983
과정유형명0.7350.7180.1401.0000.8860.7060.252
과정세부유형명0.6900.7070.1610.8861.0000.7890.241
훈련직종중분류명0.9790.6690.1410.7060.7891.0000.246
새일센터명0.2060.0780.9830.2520.2410.2461.000
2023-12-11T06:16:32.767848image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
교육인원수(명)교육년도시군명새일센터명과정유형명과정세부유형명훈련직종대분류명훈련직종중분류명
교육인원수(명)1.0000.1670.3620.3540.3400.3570.0000.000
교육년도0.1671.0000.0000.0780.7180.7070.6890.669
시군명0.3620.0001.0000.9830.1400.1610.1210.141
새일센터명0.3540.0780.9831.0000.2520.2410.2060.246
과정유형명0.3400.7180.1400.2521.0000.8860.7350.706
과정세부유형명0.3570.7070.1610.2410.8861.0000.6900.789
훈련직종대분류명0.0000.6890.1210.2060.7350.6901.0000.979
훈련직종중분류명0.0000.6690.1410.2460.7060.7890.9791.000

Missing values

2023-12-11T06:16:27.369296image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-11T06:16:27.646508image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-11T06:16:27.846280image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

교육년도시군명새일센터명과정유형명과정세부유형명훈련과정제목훈련과정주요정보훈련과정선정내역훈련직종대분류명훈련직종중분류명훈련구분명교육시간교육시작일자교육종료일자교육인원수(명)현장실습시간
02023고양시고양새일센터일반일반디지털 코칭 전문가<NA><NA>서비스분야기타 서비스<NA><NA>2023-04-102023-06-0520<NA>
12023고양시고양새일센터일반일반보험총무사무원 양성과정<NA><NA>금융·보험분야증권·보험<NA><NA>2023-06-272023-09-1920<NA>
22023고양시고양새일센터일반일반직업상담사 실무과정<NA><NA>사무관리분야인사노무<NA><NA>2023-03-292023-06-2320<NA>
32023고양시고양MICE새일센터일반일반SNS홍보마케팅 기획전문가<NA><NA>사무관리분야판매사무<NA><NA>2023-04-102023-06-2020<NA>
42023고양시고양새일센터창업일반온라인쇼핑몰창업 CEO 실무과정<NA><NA>정보·통신분야정보·통신응용<NA><NA>2023-04-032023-06-1420<NA>
52023고양시고양MICE새일센터전문기술전문기술FTA무역전문가양성<NA><NA>사무관리분야무역<NA><NA>2023-04-182023-07-1120<NA>
62023광명시광명새일센터일반기업맞춤공동주택 관리사무원 양성과정<NA><NA>사무관리분야재무 및 경영<NA><NA>2023-03-282023-05-3020<NA>
72023광명시광명새일센터일반일반사회복지 사무원 양성과정<NA><NA>사무관리분야사무지원<NA><NA>2023-06-132023-08-2220<NA>
82023광명시광명새일센터일반일반오피스 실무 사무원 양성과정<NA><NA>사무관리분야사무지원<NA><NA>2023-07-252023-10-1220<NA>
92023광명시광명새일센터일반기업맞춤시니어 활동 지도사 양성과정<NA><NA>서비스분야기타 서비스<NA><NA>2023-05-092023-07-1120<NA>
교육년도시군명새일센터명과정유형명과정세부유형명훈련과정제목훈련과정주요정보훈련과정선정내역훈련직종대분류명훈련직종중분류명훈련구분명교육시간교육시작일자교육종료일자교육인원수(명)현장실습시간
3652018포천시포천새일센터(1)일반(1-1)일반총무멀티 사무원출장경리과정으로 전반적인 경리업무교육, 품질관리사무원 기본교육, 엑셀 및 한글 실무교유에 대한 교육운영개소이후 사무행정과정에 대한 수요는 해마가 줄지 않고 있으며, 사무직종 교육과정운영후 매년 60%이상의 취업율을 달성하였으며, 현재 중소기업에서도 출장경리에 대한 수요가 많으므로 교육과정으로 선정함.(1)일반(1-1)일반<NA><NA><NA><NA><NA><NA>
3662018포천시포천새일센터(1)일반(1-1)일반맞춤형 급식조리사맞춤형 급식조리사로 한식조리사 및 실습을 진행하며, 아동요리대한 기본적인 교육또한 일부운영, 직무소양교육 및 창업마인드교육을 운영함.4년간 조리사과정을 운영함에 있어매년 60%의 높은 취업율을 달성하였으며, 조리사는 식당, 학교, 기업, 어린이집등 다양한 기업체에서 구인 수요가 높고, 포천의 경력단절여성에게 가정 선호가 높은 교육과정임(1)일반(1-1)일반<NA><NA><NA><NA><NA><NA>
3672018포천시포천새일센터(2)전문기술(2-2)전문기술-기업맞춤의류봉제 전문가미싱기계이론 및 실무과정, 패턴상의 및 하의 교육, 옷수섬 및 펫의류 활용과정, 직무소양교육 및 창업마인드 교육운영포천에는 크고작은 미싱업체가 많음에 있어 미싱전문인력에 대한 수요가 많으며, 2016,2017년 교육운영결과 2회연속60%이상의 취업율을 달성하였기에 선정함.(2)전문기술(2-2)전문기술-기업맞춤<NA><NA><NA><NA><NA><NA>
3682018하남시하남새일센터(2)전문기술(2-1)전문기술웹 디자이너 양성과정일러스트, 포토샵, 홈페이지 관리 등 일반 업체에서 다수 쓰이는 프로그램 교육을 통해 멀티 사무원을 양성5인 이하 사업체가 대부분인 하남에서 일반사무는 물론, 홈페이지와 상품 디자인 관리까지 한 번에 하길 원하는 구인업체의 수요를 충족하기 위한 교육훈련(2)전문기술(2-1)전문기술<NA><NA><NA><NA><NA><NA>
3692018화성시화성새일센터(1)일반(1-1)일반멀티사무원(ERP) 양성과정재무회계의 이론 및 유동자산/비유동자산/바채, 원가계산,과세거래, 세액의 계산 및 신고납부, 전산회계, 매입매출 전표입력, 부가가치세신고서, 엑셀 등고학력 경력단절여성 인력의 잠재력 개발과 전문성을 겸비한 인재 배출과 지역 구인난 해결 및 구직자 사회 진출 지우너(1)일반(1-1)일반<NA><NA><NA><NA><NA><NA>
3702018화성시화성새일센터(2)전문기술(2-4)전문기술-장기심화SW융합-드론지도사양성과정(기초과정)드론이론, 졸비, 안전교육, 드론비행훈 련 초, 중, 고급 , 드론창의력과 상상력키우기, 드론촬영 및 편집, 응용하기, 항공촬영4차산업혁명에 발맞추어 화성시 주력사업(2)전문기술(2-4)전문기술-장기심화<NA><NA><NA><NA><NA><NA>
3712018화성시화성새일센터(2)전문기술(2-4)전문기술-장기심화SW융합-드론지도사양성과정드론이론, 졸비, 안전교육, 드론비행훈 련 초, 중, 고급 , 드론창의력과 상상력키우기, 드론촬영 및 편집, 응용하기, 항공촬영4차산업혁명에 발맞추어 화성시 주력사업(2)전문기술(2-4)전문기술-장기심화<NA><NA><NA><NA><NA><NA>
3722018화성시화성새일센터(1)일반(1-1)일반실버전문사회복지사양성과정사회복지사 프로그램 기획, 사례관리, 평가를 하는 등의 전문적인 실무과정을 통해 요양전문기관에 파견할 실버전문 사회복지사 양성과정자격증 소지자가 꾸준히 증가하고 있음에도 불구하고 40~50대 경력단절여성들의 사회복지 취업률은 감소하고 있음. 따라서 직업훈련 전문적교육으로 실무를 겸비한 사회복지사로 역량강화의 훈련이 필요함.(1)일반(1-1)일반<NA><NA><NA><NA><NA><NA>
3732018화성시화성새일센터(1)일반(1-1)일반도시락&반찬 카페 취창업 과정도시락 양념별 특성에 따른 황금 배합비율 소스제조기술, 원재료와 부재료에 따른 반찬조리기술, 파트별 도시락 조리 완성 기술을 교육하는 과정1인가구의 증가와 혼밥족의 증가로 인해 혼밥 도시락의 수요가 급격히 늘어날 것으로 전망하여 교육과정을 선정함.(1)일반(1-1)일반<NA><NA><NA><NA><NA><NA>
3742018<NA>포천새일센터(4)취약계층(4-1)취약계층-결혼이민피부미용 컨설턴트피부미용사 이론 및 실습과정을 체계적으로 운영하며, 아토피상담사과정도 민간자격증 과정으로 운영함.포천관내에는 도농복합형 도시로 결혼이민여성 및 북한이탈주민등 55세이상의 구직자가 많이 살고 있음에 결혼이민여성 및 북한이탈주민이 사무직보다는 미용에 관심을 많이 가지고 있음에 교육과정으로 선정함.(4)취약계층(4-1)취약계층-결혼이민<NA><NA><NA><NA><NA><NA>