Overview

Dataset statistics

Number of variables5
Number of observations27
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory1.2 KiB
Average record size in memory46.9 B

Variable types

Categorical3
Text1
Numeric1

Dataset

Description정보기술분야 교육계획에 대한 자료입니다. 교육과정명, 시간, 교육인원, 일정 등에 대한 데이터입니다. 빅데이터, 인공지능, 엔지니어링과 관련된 정보기술분야 교육계획입니다.
URLhttps://www.data.go.kr/data/15105497/fileData.do

Alerts

시간 is highly overall correlated with 구분 and 1 other fieldsHigh correlation
구분 is highly overall correlated with 시간 and 1 other fieldsHigh correlation
인원 is highly overall correlated with 시간 and 1 other fieldsHigh correlation
교육과정명 has unique valuesUnique

Reproduction

Analysis started2023-12-12 12:48:35.109639
Analysis finished2023-12-12 12:48:35.606984
Duration0.5 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

구분
Categorical

HIGH CORRELATION 

Distinct3
Distinct (%)11.1%
Missing0
Missing (%)0.0%
Memory size348.0 B
디지털플랫폼 기반 구성
13 
플랫폼 서비스 발굴 및 확대
전력정보 고도화 및 안전관리 강화

Length

Max length18
Median length15
Mean length15.185185
Min length14

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row 디지털플랫폼 기반 구성
2nd row 디지털플랫폼 기반 구성
3rd row 디지털플랫폼 기반 구성
4th row 디지털플랫폼 기반 구성
5th row 디지털플랫폼 기반 구성

Common Values

ValueCountFrequency (%)
디지털플랫폼 기반 구성 13
48.1%
플랫폼 서비스 발굴 및 확대 8
29.6%
전력정보 고도화 및 안전관리 강화 6
22.2%

Length

2023-12-12T21:48:35.704020image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T21:48:35.816061image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
14
12.8%
디지털플랫폼 13
11.9%
기반 13
11.9%
구성 13
11.9%
플랫폼 8
7.3%
서비스 8
7.3%
발굴 8
7.3%
확대 8
7.3%
전력정보 6
5.5%
고도화 6
5.5%
Other values (2) 12
11.0%

교육과정명
Text

UNIQUE 

Distinct27
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size348.0 B
2023-12-12T21:48:36.056281image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length38
Median length33
Mean length25.740741
Min length8

Characters and Unicode

Total characters695
Distinct characters117
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique27 ?
Unique (%)100.0%

Sample

1st row 클라우드 서비스 플랫폼 전문인재 양성 교육코스 (인프라)
2nd row 클라우드 서비스 플랫폼 전문인재 양성 교육코스 (MSA 환경구축)
3rd row 클라우드 서비스 플랫폼 전문인재 양성 교육코스 (APP 통합)
4th row 클라우드 서비스 플랫폼 전문인재 양성 교육코스 (보안.비용관리)
5th row 데이터 사이언티스트 Basic1 파이썬 데이터 분석 입문
ValueCountFrequency (%)
클라우드 11
 
7.5%
전문인재 10
 
6.8%
양성 10
 
6.8%
교육코스 10
 
6.8%
인프라 6
 
4.1%
기본 5
 
3.4%
live 5
 
3.4%
고급 4
 
2.7%
파이썬 4
 
2.7%
sql 4
 
2.7%
Other values (47) 77
52.7%
2023-12-12T21:48:36.497182image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
173
24.9%
20
 
2.9%
17
 
2.4%
16
 
2.3%
15
 
2.2%
15
 
2.2%
A 14
 
2.0%
) 13
 
1.9%
( 13
 
1.9%
12
 
1.7%
Other values (107) 387
55.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 377
54.2%
Space Separator 173
24.9%
Uppercase Letter 65
 
9.4%
Lowercase Letter 21
 
3.0%
Close Punctuation 18
 
2.6%
Open Punctuation 18
 
2.6%
Math Symbol 15
 
2.2%
Decimal Number 7
 
1.0%
Other Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
20
 
5.3%
17
 
4.5%
16
 
4.2%
15
 
4.0%
15
 
4.0%
12
 
3.2%
11
 
2.9%
11
 
2.9%
11
 
2.9%
11
 
2.9%
Other values (70) 238
63.1%
Uppercase Letter
ValueCountFrequency (%)
A 14
21.5%
L 9
13.8%
S 8
12.3%
I 5
 
7.7%
E 5
 
7.7%
V 5
 
7.7%
Q 4
 
6.2%
D 4
 
6.2%
W 3
 
4.6%
B 3
 
4.6%
Other values (4) 5
 
7.7%
Lowercase Letter
ValueCountFrequency (%)
a 5
23.8%
r 3
14.3%
s 2
 
9.5%
o 2
 
9.5%
i 2
 
9.5%
c 2
 
9.5%
v 1
 
4.8%
e 1
 
4.8%
f 1
 
4.8%
m 1
 
4.8%
Math Symbol
ValueCountFrequency (%)
< 7
46.7%
> 7
46.7%
+ 1
 
6.7%
Decimal Number
ValueCountFrequency (%)
1 3
42.9%
2 3
42.9%
3 1
 
14.3%
Close Punctuation
ValueCountFrequency (%)
) 13
72.2%
] 5
 
27.8%
Open Punctuation
ValueCountFrequency (%)
( 13
72.2%
[ 5
 
27.8%
Space Separator
ValueCountFrequency (%)
173
100.0%
Other Punctuation
ValueCountFrequency (%)
. 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 377
54.2%
Common 232
33.4%
Latin 86
 
12.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
20
 
5.3%
17
 
4.5%
16
 
4.2%
15
 
4.0%
15
 
4.0%
12
 
3.2%
11
 
2.9%
11
 
2.9%
11
 
2.9%
11
 
2.9%
Other values (70) 238
63.1%
Latin
ValueCountFrequency (%)
A 14
16.3%
L 9
 
10.5%
S 8
 
9.3%
I 5
 
5.8%
E 5
 
5.8%
a 5
 
5.8%
V 5
 
5.8%
Q 4
 
4.7%
D 4
 
4.7%
W 3
 
3.5%
Other values (15) 24
27.9%
Common
ValueCountFrequency (%)
173
74.6%
) 13
 
5.6%
( 13
 
5.6%
< 7
 
3.0%
> 7
 
3.0%
[ 5
 
2.2%
] 5
 
2.2%
1 3
 
1.3%
2 3
 
1.3%
. 1
 
0.4%
Other values (2) 2
 
0.9%

Most occurring blocks

ValueCountFrequency (%)
Hangul 377
54.2%
ASCII 318
45.8%

Most frequent character per block

ASCII
ValueCountFrequency (%)
173
54.4%
A 14
 
4.4%
) 13
 
4.1%
( 13
 
4.1%
L 9
 
2.8%
S 8
 
2.5%
< 7
 
2.2%
> 7
 
2.2%
I 5
 
1.6%
E 5
 
1.6%
Other values (27) 64
 
20.1%
Hangul
ValueCountFrequency (%)
20
 
5.3%
17
 
4.5%
16
 
4.2%
15
 
4.0%
15
 
4.0%
12
 
3.2%
11
 
2.9%
11
 
2.9%
11
 
2.9%
11
 
2.9%
Other values (70) 238
63.1%

일정
Categorical

Distinct9
Distinct (%)33.3%
Missing0
Missing (%)0.0%
Memory size348.0 B
3월
4월
6월
5월
9월
Other values (4)

Length

Max length5
Median length4
Mean length4.1851852
Min length4

Unique

Unique1 ?
Unique (%)3.7%

Sample

1st row 5월
2nd row 8월
3rd row 9월
4th row 10월
5th row 7월

Common Values

ValueCountFrequency (%)
3월 5
18.5%
4월 4
14.8%
6월 4
14.8%
5월 3
11.1%
9월 3
11.1%
10월 3
11.1%
7월 2
 
7.4%
11월 2
 
7.4%
8월 1
 
3.7%

Length

2023-12-12T21:48:36.661035image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T21:48:36.815704image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
3월 5
18.5%
4월 4
14.8%
6월 4
14.8%
5월 3
11.1%
9월 3
11.1%
10월 3
11.1%
7월 2
 
7.4%
11월 2
 
7.4%
8월 1
 
3.7%

시간
Real number (ℝ)

HIGH CORRELATION 

Distinct6
Distinct (%)22.2%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean24.37037
Minimum14
Maximum35
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size375.0 B
2023-12-12T21:48:36.963308image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum14
5-th percentile20
Q120.5
median22
Q328
95-th percentile35
Maximum35
Range21
Interquartile range (IQR)7.5

Descriptive statistics

Standard deviation5.3143358
Coefficient of variation (CV)0.21806545
Kurtosis-0.097912956
Mean24.37037
Median Absolute Deviation (MAD)2
Skewness0.60188215
Sum658
Variance28.242165
MonotonicityNot monotonic
2023-12-12T21:48:37.061460image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=6)
ValueCountFrequency (%)
28 8
29.6%
22 6
22.2%
20 6
22.2%
35 3
 
11.1%
21 3
 
11.1%
14 1
 
3.7%
ValueCountFrequency (%)
14 1
 
3.7%
20 6
22.2%
21 3
 
11.1%
22 6
22.2%
28 8
29.6%
35 3
 
11.1%
ValueCountFrequency (%)
35 3
 
11.1%
28 8
29.6%
22 6
22.2%
21 3
 
11.1%
20 6
22.2%
14 1
 
3.7%

인원
Categorical

HIGH CORRELATION 

Distinct2
Distinct (%)7.4%
Missing0
Missing (%)0.0%
Memory size348.0 B
20
20 
15

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row20
2nd row20
3rd row20
4th row20
5th row20

Common Values

ValueCountFrequency (%)
20 20
74.1%
15 7
 
25.9%

Length

2023-12-12T21:48:37.198271image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T21:48:37.596359image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
20 20
74.1%
15 7
 
25.9%

Interactions

2023-12-12T21:48:35.361797image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T21:48:37.678445image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분교육과정명일정시간인원
구분1.0001.0000.0000.7600.359
교육과정명1.0001.0001.0001.0001.000
일정0.0001.0001.0000.0000.000
시간0.7601.0000.0001.0000.614
인원0.3591.0000.0000.6141.000
2023-12-12T21:48:37.793217image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분인원일정
구분1.0000.5590.000
인원0.5591.0000.000
일정0.0000.0001.000
2023-12-12T21:48:37.883219image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
시간구분일정인원
시간1.0000.7310.0000.692
구분0.7311.0000.0000.559
일정0.0000.0001.0000.000
인원0.6920.5590.0001.000

Missing values

2023-12-12T21:48:35.472385image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T21:48:35.570975image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

구분교육과정명일정시간인원
0디지털플랫폼 기반 구성클라우드 서비스 플랫폼 전문인재 양성 교육코스 (인프라)5월2820
1디지털플랫폼 기반 구성클라우드 서비스 플랫폼 전문인재 양성 교육코스 (MSA 환경구축)8월2820
2디지털플랫폼 기반 구성클라우드 서비스 플랫폼 전문인재 양성 교육코스 (APP 통합)9월2820
3디지털플랫폼 기반 구성클라우드 서비스 플랫폼 전문인재 양성 교육코스 (보안.비용관리)10월2820
4디지털플랫폼 기반 구성데이터 사이언티스트 Basic1 파이썬 데이터 분석 입문7월2820
5디지털플랫폼 기반 구성데이터 사이언티스트 Basic2 파이썬 분석을 위한 데이터 전처리11월2820
6디지털플랫폼 기반 구성<클라우드 인프라> AWS 핵심 서비스를 이용한 인프라 환경 구축9월2215
7디지털플랫폼 기반 구성<클라우드 인프라> Terraform on AWS(프로젝트 수행)10월2215
8디지털플랫폼 기반 구성<클라우드 인프라> AWS 3티어 인프라 구축(프로젝트)11월2215
9디지털플랫폼 기반 구성<클라우드 고급> 도커 컨테이너3월2215
구분교육과정명일정시간인원
17플랫폼 서비스 발굴 및 확대[LIVE] 비전공자를 위한 DB 기초 입문5월2120
18플랫폼 서비스 발굴 및 확대[LIVE] 비전공자를 위한 파이썬 코딩 입문10월2820
19플랫폼 서비스 발굴 및 확대[LIVE] SQL 최적화 튜닝 1+26월2820
20플랫폼 서비스 발굴 및 확대파이썬 프로그래밍 기본9월3520
21전력정보 고도화 및 안전관리 강화AA 전문인재 양성 교육코스 (기본)3월2020
22전력정보 고도화 및 안전관리 강화AA 전문인재 양성 교육코스 (심화)4월2020
23전력정보 고도화 및 안전관리 강화AA 전문인재 양성 교육코스 (전문가)6월2020
24전력정보 고도화 및 안전관리 강화DA 전문인재 양성 교육코스 (기본)3월2020
25전력정보 고도화 및 안전관리 강화DA 전문인재 양성 교육코스 (심화)4월2020
26전력정보 고도화 및 안전관리 강화DA 전문인재 양성 교육코스 (전문가)6월2020