Overview

Dataset statistics

Number of variables6
Number of observations108
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory5.4 KiB
Average record size in memory51.2 B

Variable types

Categorical5
Numeric1

Dataset

Description개인정보보호위원회에서 관리하는 데이터로 2018년 부터 2022년까지 개인정보 보호에 관련되어 구분 교육형태, 교육대상 등 다양한 데이터를 제공합니다.
URLhttps://www.data.go.kr/data/15119762/fileData.do

Alerts

구분 is highly overall correlated with 교육형태 and 1 other fieldsHigh correlation
교육형태 is highly overall correlated with 구분 and 1 other fieldsHigh correlation
교육대상 is highly overall correlated with 교육과정명High correlation
교육과정명 is highly overall correlated with 구분 and 2 other fieldsHigh correlation

Reproduction

Analysis started2023-12-13 00:47:49.213886
Analysis finished2023-12-13 00:47:49.684983
Duration0.47 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

기준연도
Categorical

Distinct5
Distinct (%)4.6%
Missing0
Missing (%)0.0%
Memory size996.0 B
2022
53 
2021
42 
2020
 
5
2019
 
4
2018
 
4

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2022
2nd row2021
3rd row2022
4th row2021
5th row2022

Common Values

ValueCountFrequency (%)
2022 53
49.1%
2021 42
38.9%
2020 5
 
4.6%
2019 4
 
3.7%
2018 4
 
3.7%

Length

2023-12-13T09:47:49.733929image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T09:47:49.818129image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2022 53
49.1%
2021 42
38.9%
2020 5
 
4.6%
2019 4
 
3.7%
2018 4
 
3.7%

구분
Categorical

HIGH CORRELATION 

Distinct2
Distinct (%)1.9%
Missing0
Missing (%)0.0%
Memory size996.0 B
온라인
77 
오프라인
31 

Length

Max length4
Median length3
Mean length3.287037
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row오프라인
2nd row오프라인
3rd row오프라인
4th row오프라인
5th row오프라인

Common Values

ValueCountFrequency (%)
온라인 77
71.3%
오프라인 31
28.7%

Length

2023-12-13T09:47:49.901399image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T09:47:49.971060image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
온라인 77
71.3%
오프라인 31
28.7%

교육형태
Categorical

HIGH CORRELATION 

Distinct8
Distinct (%)7.4%
Missing0
Missing (%)0.0%
Memory size996.0 B
개인수강
52 
단체수강
20 
집합교육(특화)
집합교육(일반)
현장교육
Other values (3)
15 

Length

Max length10
Median length4
Mean length5.1574074
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row집합교육(일반)
2nd row집합교육(일반)
3rd row집합교육(일반)
4th row집합교육(일반)
5th row집합교육(일반)

Common Values

ValueCountFrequency (%)
개인수강 52
48.1%
단체수강 20
 
18.5%
집합교육(특화) 9
 
8.3%
집합교육(일반) 6
 
5.6%
현장교육 6
 
5.6%
전문강사 활용 교육 5
 
4.6%
콘텐츠 공동활용 5
 
4.6%
찾아가는 교육 5
 
4.6%

Length

2023-12-13T09:47:50.051907image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T09:47:50.143468image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
개인수강 52
40.6%
단체수강 20
 
15.6%
교육 10
 
7.8%
집합교육(특화 9
 
7.0%
집합교육(일반 6
 
4.7%
현장교육 6
 
4.7%
전문강사 5
 
3.9%
활용 5
 
3.9%
콘텐츠 5
 
3.9%
공동활용 5
 
3.9%

교육대상
Categorical

HIGH CORRELATION 

Distinct6
Distinct (%)5.6%
Missing0
Missing (%)0.0%
Memory size996.0 B
개인정보 처리자
72 
청소년
14 
정보주체
 
7
취약계층
 
6
아동
 
5

Length

Max length8
Median length8
Mean length6.3703704
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row개인정보 처리자
2nd row개인정보 처리자
3rd row개인정보 처리자
4th row개인정보 처리자
5th row개인정보 처리자

Common Values

ValueCountFrequency (%)
개인정보 처리자 72
66.7%
청소년 14
 
13.0%
정보주체 7
 
6.5%
취약계층 6
 
5.6%
아동 5
 
4.6%
국민 4
 
3.7%

Length

2023-12-13T09:47:50.251807image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T09:47:50.341010image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
개인정보 72
40.0%
처리자 72
40.0%
청소년 14
 
7.8%
정보주체 7
 
3.9%
취약계층 6
 
3.3%
아동 5
 
2.8%
국민 4
 
2.2%

교육과정명
Categorical

HIGH CORRELATION 

Distinct38
Distinct (%)35.2%
Missing0
Missing (%)0.0%
Memory size996.0 B
<NA>
21 
수요기업-전문강사 파견
 
5
소상공인을 위한 개인정보 보호 이해하기
 
4
사업자 기본과정
 
4
개인정보보호 해결사 백실장이 간다! 학원업편
 
4
Other values (33)
70 

Length

Max length59
Median length29
Mean length14.25
Min length4

Unique

Unique6 ?
Unique (%)5.6%

Sample

1st row초급과정
2nd row초급과정
3rd row중급과정
4th row중급과정
5th row고급과정

Common Values

ValueCountFrequency (%)
<NA> 21
19.4%
수요기업-전문강사 파견 5
 
4.6%
소상공인을 위한 개인정보 보호 이해하기 4
 
3.7%
사업자 기본과정 4
 
3.7%
개인정보보호 해결사 백실장이 간다! 학원업편 4
 
3.7%
개인정보보호 해결사 백실장이 간다! 여행업편 4
 
3.7%
개인정보보호 해결사 백실장이 간다! 공인중개업편 4
 
3.7%
사업자 전문과정 4
 
3.7%
(신)개인정보보호법 이해하기 4
 
3.7%
사업자 실무과정 4
 
3.7%
Other values (28) 50
46.3%

Length

2023-12-13T09:47:50.435821image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
na 21
 
6.9%
개인정보보호 21
 
6.9%
간다 18
 
5.9%
해결사 18
 
5.9%
백실장이 18
 
5.9%
사업자 12
 
3.9%
개인정보 8
 
2.6%
이해하기 8
 
2.6%
위한 7
 
2.3%
파견 7
 
2.3%
Other values (70) 167
54.8%

교육인원
Real number (ℝ)

Distinct105
Distinct (%)97.2%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean46608.12
Minimum9
Maximum871026
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.1 KiB
2023-12-13T09:47:50.531615image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum9
5-th percentile13
Q1494.25
median2935
Q318884.75
95-th percentile228543.95
Maximum871026
Range871017
Interquartile range (IQR)18390.5

Descriptive statistics

Standard deviation118824.29
Coefficient of variation (CV)2.5494332
Kurtosis24.06079
Mean46608.12
Median Absolute Deviation (MAD)2914.5
Skewness4.4205738
Sum5033677
Variance1.4119212 × 1010
MonotonicityNot monotonic
2023-12-13T09:47:50.627065image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
13 3
 
2.8%
10 2
 
1.9%
1247 1
 
0.9%
170 1
 
0.9%
299 1
 
0.9%
20162 1
 
0.9%
37125 1
 
0.9%
109 1
 
0.9%
103888 1
 
0.9%
165215 1
 
0.9%
Other values (95) 95
88.0%
ValueCountFrequency (%)
9 1
 
0.9%
10 2
1.9%
11 1
 
0.9%
13 3
2.8%
14 1
 
0.9%
27 1
 
0.9%
90 1
 
0.9%
103 1
 
0.9%
109 1
 
0.9%
126 1
 
0.9%
ValueCountFrequency (%)
871026 1
0.9%
495565 1
0.9%
429790 1
0.9%
412710 1
0.9%
259121 1
0.9%
255579 1
0.9%
178336 1
0.9%
165215 1
0.9%
159548 1
0.9%
152208 1
0.9%

Interactions

2023-12-13T09:47:49.485087image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T09:47:50.699414image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
기준연도구분교육형태교육대상교육과정명교육인원
기준연도1.0000.2300.4500.0000.0000.519
구분0.2301.0001.0000.0001.0000.000
교육형태0.4501.0001.0000.5480.9780.249
교육대상0.0000.0000.5481.0001.0000.000
교육과정명0.0001.0000.9781.0001.0000.515
교육인원0.5190.0000.2490.0000.5151.000
2023-12-13T09:47:50.777779image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
교육과정명교육대상구분교육형태기준연도
교육과정명1.0000.7860.7670.6870.000
교육대상0.7861.0000.0000.3390.000
구분0.7670.0001.0000.9710.276
교육형태0.6870.3390.9711.0000.291
기준연도0.0000.0000.2760.2911.000
2023-12-13T09:47:50.851885image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
교육인원기준연도구분교육형태교육대상교육과정명
교육인원1.0000.3820.0000.1370.0000.213
기준연도0.3821.0000.2760.2910.0000.000
구분0.0000.2761.0000.9710.0000.767
교육형태0.1370.2910.9711.0000.3390.687
교육대상0.0000.0000.0000.3391.0000.786
교육과정명0.2130.0000.7670.6870.7861.000

Missing values

2023-12-13T09:47:49.562590image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T09:47:49.645507image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

기준연도구분교육형태교육대상교육과정명교육인원
02022오프라인집합교육(일반)개인정보 처리자초급과정2591
12021오프라인집합교육(일반)개인정보 처리자초급과정1618
22022오프라인집합교육(일반)개인정보 처리자중급과정2900
32021오프라인집합교육(일반)개인정보 처리자중급과정1560
42022오프라인집합교육(일반)개인정보 처리자고급과정1721
52021오프라인집합교육(일반)개인정보 처리자고급과정3503
62022오프라인집합교육(특화)개인정보 처리자신기술 분야 보호조치과정405
72021오프라인집합교육(특화)개인정보 처리자신기술 분야 보호조치과정301
82022오프라인집합교육(특화)개인정보 처리자중소·영세사업자 대상 보호조치과정236
92021오프라인집합교육(특화)개인정보 처리자중소·영세사업자 대상 보호조치과정191
기준연도구분교육형태교육대상교육과정명교육인원
982021온라인개인수강청소년High school student14
992022온라인개인수강국민General public103
1002021온라인개인수강국민General public140
1012022온라인개인수강취약계층<NA>10
1022021온라인개인수강취약계층<NA>11
1032022온라인개인수강취약계층<NA>13
1042020온라인개인수강정보주체<NA>126368
1052022온라인콘텐츠 공동활용정보주체<NA>17264
1062021온라인콘텐츠 공동활용정보주체포털 내 공동활용5744
1072021온라인콘텐츠 공동활용정보주체학교 동영상 공유27147