Overview

Dataset statistics

Number of variables4
Number of observations822
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory25.8 KiB
Average record size in memory32.2 B

Variable types

Categorical3
Text1

Dataset

Description보건복지부장관이 인정하는 외국학교 현황(직종별 인정학교 국가 및 학교명)을 제공합니다.인정학교는 "보건의료인국가시험 응시자격 관련 외국학교 등 인정기준" 제4조(재검토기한)에 의거 그 타당성을 검토하여 개선 등의 조치를 할 수 있으며, 인정현황은 인정심사 신청 시 작성된 국가 및 교명을 바탕으로 생성된 데이터이므로 현재 변경된 사항이 있을 수 있으며, 국가 및 학교명이 상이하거나 외국학교 졸업자의 응시자격 관련은 별도 문의가 필요합니다.
Author한국보건의료인국가시험원
URLhttps://www.data.go.kr/data/15126577/fileData.do

Alerts

직종 is highly overall correlated with 구분High correlation
구분 is highly overall correlated with 직종High correlation
구분 is highly imbalanced (65.2%)Imbalance

Reproduction

Analysis started2024-03-14 23:33:29.390574
Analysis finished2024-03-14 23:33:30.425566
Duration1.03 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

직종
Categorical

HIGH CORRELATION 

Distinct20
Distinct (%)2.4%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
간호사
256 
약사
186 
의사
162 
치과의사
131 
안경사
 
17
Other values (15)
70 

Length

Max length11
Median length9
Mean length2.9513382
Min length2

Unique

Unique4 ?
Unique (%)0.5%

Sample

1st row직종구분
2nd row의사
3rd row의사
4th row의사
5th row의사

Common Values

ValueCountFrequency (%)
간호사 256
31.1%
약사 186
22.6%
의사 162
19.7%
치과의사 131
15.9%
안경사 17
 
2.1%
2급 언어재활사 13
 
1.6%
조산사 8
 
1.0%
임상병리사 8
 
1.0%
치과기공사 7
 
0.9%
치과위생사 6
 
0.7%
Other values (10) 28
 
3.4%

Length

2024-03-15T08:33:30.650091image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
간호사 256
30.5%
약사 186
22.2%
의사 162
19.3%
치과의사 131
15.6%
안경사 17
 
2.0%
2급 15
 
1.8%
언어재활사 13
 
1.5%
조산사 8
 
1.0%
임상병리사 8
 
1.0%
치과기공사 7
 
0.8%
Other values (11) 36
 
4.3%

구분
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct8
Distinct (%)1.0%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
94.07.07 이후
670 
94.07.07 이전
73 
95.10.05 이후
 
43
<NA>
 
17
95.10.05 이전
 
13
Other values (3)
 
6

Length

Max length20
Median length11
Mean length10.86618
Min length4

Unique

Unique2 ?
Unique (%)0.2%

Sample

1st row관련 법령 개정에 따라 응시자격 구분
2nd row94.07.07 이전
3rd row94.07.07 이전
4th row94.07.07 이전
5th row94.07.07 이전

Common Values

ValueCountFrequency (%)
94.07.07 이후 670
81.5%
94.07.07 이전 73
 
8.9%
95.10.05 이후 43
 
5.2%
<NA> 17
 
2.1%
95.10.05 이전 13
 
1.6%
11.09.01 이후 4
 
0.5%
관련 법령 개정에 따라 응시자격 구분 1
 
0.1%
12.09.01 이후 1
 
0.1%

Length

2024-03-15T08:33:31.078617image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T08:33:31.417901image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
94.07.07 743
45.6%
이후 718
44.0%
이전 86
 
5.3%
95.10.05 56
 
3.4%
na 17
 
1.0%
11.09.01 4
 
0.2%
관련 1
 
0.1%
법령 1
 
0.1%
개정에 1
 
0.1%
따라 1
 
0.1%
Other values (3) 3
 
0.2%

국가명
Categorical

Distinct48
Distinct (%)5.8%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
미국
319 
일본
148 
필리핀
60 
호주
55 
독일
51 
Other values (43)
189 

Length

Max length8
Median length2
Mean length2.379562
Min length2

Unique

Unique17 ?
Unique (%)2.1%

Sample

1st row학교 소속 국가
2nd row대만
3rd row도미니카
4th row독일
5th row독일

Common Values

ValueCountFrequency (%)
미국 319
38.8%
일본 148
18.0%
필리핀 60
 
7.3%
호주 55
 
6.7%
독일 51
 
6.2%
영국 37
 
4.5%
캐나다 23
 
2.8%
대만 12
 
1.5%
러시아 11
 
1.3%
뉴질랜드 10
 
1.2%
Other values (38) 96
 
11.7%

Length

2024-03-15T08:33:31.879316image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
미국 319
38.7%
일본 148
18.0%
필리핀 60
 
7.3%
호주 55
 
6.7%
독일 53
 
6.4%
영국 37
 
4.5%
캐나다 23
 
2.8%
대만 12
 
1.5%
러시아 11
 
1.3%
뉴질랜드 10
 
1.2%
Other values (38) 96
 
11.7%
Distinct749
Distinct (%)91.1%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
2024-03-15T08:33:33.085522image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length195
Median length88
Mean length33.756691
Min length6

Characters and Unicode

Total characters27748
Distinct characters486
Distinct categories15 ?
Distinct scripts5 ?
Distinct blocks8 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique689 ?
Unique (%)83.8%

Sample

1st row인정학교는 "보건의료인국가시험 응시자격 관련 외국학교 등 인정기준" 제4조(재검토기한)에 의거 그 타당성을 검토하여 개선 등의 조치를 할 수 있으며, 인정 현황은 인정심사 신청 시 작성된 국가 및 교명을 바탕으로 생성된 데이터이므로 현재 변경된 사항이 있을 수 있으며, 국가 및 학교명이 상이하거나 외국학교 졸업자의 응시자격 관련은 별도 문의 필요.
2nd row臺北醫學院(Taipei Medical College)(교명변경, 臺北醫學大學(Taipei Medical University))
3rd rowRoss University School of Medicine
4th rowAlbert Ludwigs Universität Freiburg, Medizinisch Fakultät
5th rowUniversität Zu Köln, Medizinische Fakultät
ValueCountFrequency (%)
university 567
 
16.5%
of 389
 
11.3%
college 111
 
3.2%
school 70
 
2.0%
medical 69
 
2.0%
state 58
 
1.7%
medicine 47
 
1.4%
the 45
 
1.3%
pharmacy 31
 
0.9%
new 31
 
0.9%
Other values (1083) 2015
58.7%
2024-03-15T08:33:34.760271image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2621
 
9.4%
i 2372
 
8.5%
e 2290
 
8.3%
n 1640
 
5.9%
t 1559
 
5.6%
o 1374
 
5.0%
a 1365
 
4.9%
r 1364
 
4.9%
s 1295
 
4.7%
l 914
 
3.3%
Other values (476) 10954
39.5%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 19197
69.2%
Uppercase Letter 2770
 
10.0%
Space Separator 2621
 
9.4%
Other Letter 2401
 
8.7%
Other Punctuation 186
 
0.7%
Close Punctuation 185
 
0.7%
Open Punctuation 185
 
0.7%
Decimal Number 100
 
0.4%
Dash Punctuation 74
 
0.3%
Final Punctuation 20
 
0.1%
Other values (5) 9
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
208
 
8.7%
122
 
5.1%
82
 
3.4%
62
 
2.6%
59
 
2.5%
59
 
2.5%
59
 
2.5%
52
 
2.2%
39
 
1.6%
39
 
1.6%
Other values (384) 1620
67.5%
Lowercase Letter
ValueCountFrequency (%)
i 2372
12.4%
e 2290
11.9%
n 1640
 
8.5%
t 1559
 
8.1%
o 1374
 
7.2%
a 1365
 
7.1%
r 1364
 
7.1%
s 1295
 
6.7%
l 914
 
4.8%
y 801
 
4.2%
Other values (22) 4223
22.0%
Uppercase Letter
ValueCountFrequency (%)
U 670
24.2%
C 275
9.9%
S 270
9.7%
M 253
 
9.1%
T 126
 
4.5%
N 117
 
4.2%
P 114
 
4.1%
D 113
 
4.1%
A 102
 
3.7%
B 74
 
2.7%
Other values (17) 656
23.7%
Decimal Number
ValueCountFrequency (%)
0 39
39.0%
2 26
26.0%
1 17
17.0%
7 4
 
4.0%
3 4
 
4.0%
6 3
 
3.0%
4 3
 
3.0%
8 2
 
2.0%
9 1
 
1.0%
5 1
 
1.0%
Other Punctuation
ValueCountFrequency (%)
, 114
61.3%
. 51
27.4%
' 8
 
4.3%
& 8
 
4.3%
" 2
 
1.1%
: 1
 
0.5%
/ 1
 
0.5%
1
 
0.5%
Letter Number
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%
Dash Punctuation
ValueCountFrequency (%)
- 73
98.6%
1
 
1.4%
Final Punctuation
ValueCountFrequency (%)
19
95.0%
1
 
5.0%
Initial Punctuation
ValueCountFrequency (%)
1
50.0%
1
50.0%
Space Separator
ValueCountFrequency (%)
2621
100.0%
Close Punctuation
ValueCountFrequency (%)
) 185
100.0%
Open Punctuation
ValueCountFrequency (%)
( 185
100.0%
Control
ValueCountFrequency (%)
2
100.0%
Modifier Letter
ValueCountFrequency (%)
1
100.0%
Math Symbol
ValueCountFrequency (%)
= 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 21970
79.2%
Common 3377
 
12.2%
Han 1515
 
5.5%
Hangul 874
 
3.1%
Katakana 12
 
< 0.1%

Most frequent character per script

Han
ValueCountFrequency (%)
208
 
13.7%
122
 
8.1%
62
 
4.1%
59
 
3.9%
59
 
3.9%
52
 
3.4%
39
 
2.6%
37
 
2.4%
33
 
2.2%
29
 
1.9%
Other values (223) 815
53.8%
Hangul
ValueCountFrequency (%)
82
 
9.4%
59
 
6.8%
39
 
4.5%
34
 
3.9%
30
 
3.4%
29
 
3.3%
28
 
3.2%
26
 
3.0%
26
 
3.0%
25
 
2.9%
Other values (145) 496
56.8%
Latin
ValueCountFrequency (%)
i 2372
 
10.8%
e 2290
 
10.4%
n 1640
 
7.5%
t 1559
 
7.1%
o 1374
 
6.3%
a 1365
 
6.2%
r 1364
 
6.2%
s 1295
 
5.9%
l 914
 
4.2%
y 801
 
3.6%
Other values (52) 6996
31.8%
Common
ValueCountFrequency (%)
2621
77.6%
) 185
 
5.5%
( 185
 
5.5%
, 114
 
3.4%
- 73
 
2.2%
. 51
 
1.5%
0 39
 
1.2%
2 26
 
0.8%
19
 
0.6%
1 17
 
0.5%
Other values (20) 47
 
1.4%
Katakana
ValueCountFrequency (%)
3
25.0%
3
25.0%
3
25.0%
1
 
8.3%
1
 
8.3%
1
 
8.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 25251
91.0%
CJK 1503
 
5.4%
Hangul 874
 
3.1%
None 69
 
0.2%
Punctuation 23
 
0.1%
Katakana 13
 
< 0.1%
CJK Compat Ideographs 12
 
< 0.1%
Number Forms 3
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2621
 
10.4%
i 2372
 
9.4%
e 2290
 
9.1%
n 1640
 
6.5%
t 1559
 
6.2%
o 1374
 
5.4%
a 1365
 
5.4%
r 1364
 
5.4%
s 1295
 
5.1%
l 914
 
3.6%
Other values (65) 8457
33.5%
CJK
ValueCountFrequency (%)
208
 
13.8%
122
 
8.1%
62
 
4.1%
59
 
3.9%
59
 
3.9%
52
 
3.5%
39
 
2.6%
37
 
2.5%
33
 
2.2%
29
 
1.9%
Other values (216) 803
53.4%
Hangul
ValueCountFrequency (%)
82
 
9.4%
59
 
6.8%
39
 
4.5%
34
 
3.9%
30
 
3.4%
29
 
3.3%
28
 
3.2%
26
 
3.0%
26
 
3.0%
25
 
2.9%
Other values (145) 496
56.8%
None
ValueCountFrequency (%)
ä 49
71.0%
ü 12
 
17.4%
é 2
 
2.9%
ö 2
 
2.9%
ç 1
 
1.4%
ó 1
 
1.4%
Ö 1
 
1.4%
1
 
1.4%
Punctuation
ValueCountFrequency (%)
19
82.6%
1
 
4.3%
1
 
4.3%
1
 
4.3%
1
 
4.3%
CJK Compat Ideographs
ValueCountFrequency (%)
3
25.0%
3
25.0%
2
16.7%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
Katakana
ValueCountFrequency (%)
3
23.1%
3
23.1%
3
23.1%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
Number Forms
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%

Correlations

2024-03-15T08:33:35.033371image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
직종구분국가명
직종1.0000.9580.594
구분0.9581.0000.788
국가명0.5940.7881.000
2024-03-15T08:33:35.284263image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분국가명직종
구분1.0000.4460.855
국가명0.4461.0000.178
직종0.8550.1781.000
2024-03-15T08:33:35.611522image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
직종구분국가명
직종1.0000.8550.178
구분0.8551.0000.446
국가명0.1780.4461.000

Missing values

2024-03-15T08:33:30.018658image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-15T08:33:30.315189image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

직종구분국가명학교명
0직종구분관련 법령 개정에 따라 응시자격 구분학교 소속 국가인정학교는 "보건의료인국가시험 응시자격 관련 외국학교 등 인정기준" 제4조(재검토기한)에 의거 그 타당성을 검토하여 개선 등의 조치를 할 수 있으며, 인정 현황은 인정심사 신청 시 작성된 국가 및 교명을 바탕으로 생성된 데이터이므로 현재 변경된 사항이 있을 수 있으며, 국가 및 학교명이 상이하거나 외국학교 졸업자의 응시자격 관련은 별도 문의 필요.
1의사94.07.07 이전대만臺北醫學院(Taipei Medical College)(교명변경, 臺北醫學大學(Taipei Medical University))
2의사94.07.07 이전도미니카Ross University School of Medicine
3의사94.07.07 이전독일Albert Ludwigs Universität Freiburg, Medizinisch Fakultät
4의사94.07.07 이전독일Universität Zu Köln, Medizinische Fakultät
5의사94.07.07 이전미국Tulane University School of Medicine
6의사94.07.07 이전미국University of Nebraska College of Medicine
7의사94.07.07 이전미얀마Yangon University, Institute of Medicine
8의사94.07.07 이전아르헨티나Universidad de Cordoba
9의사94.07.07 이전일본九州大學(Kyushu University)
직종구분국가명학교명
8122급 언어재활사<NA>미국Kent State University(Master’s Degree)
8132급 언어재활사<NA>미국University of Northern colorado(Master’s Degree)
8142급 언어재활사<NA>미국Teachers College, Columbia University(Master’s Degree)
8152급 언어재활사<NA>미국University of Redlands(Master’s Degree)
8162급 언어재활사<NA>캐나다McGill University(Master’s Degree)
8172급 언어재활사<NA>호주University of Sydney
8181급 장애인재활상담사<NA>미국The University of Iowa(Doctor’s Degree)
8191급 응급구조사<NA>호주Flinders University
8202급 응급구조사<NA>미국Erie County Fire Training Academy
8212급 응급구조사<NA>미국EMT&FIRE TRAINING INCORPORATION