Overview

Dataset statistics

Number of variables3
Number of observations116
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory3.0 KiB
Average record size in memory26.1 B

Variable types

Categorical1
Text1
Numeric1

Dataset

Description국립국제교육원이 선발한 한국정부초청외국인장학생(KGSP) 정보를 국외인적자원관리시스템을 통해 누적 관리 중이며, 등록된 정부초청외국인장학생 대학별 누적관리인원 현황임
Author교육부 국립국제교육원
URLhttps://www.data.go.kr/data/15069760/fileData.do

Alerts

사업명 has constant value ""Constant
수학대학 has unique valuesUnique

Reproduction

Analysis started2023-12-12 21:01:38.248982
Analysis finished2023-12-12 21:01:38.564556
Duration0.32 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

사업명
Categorical

CONSTANT 

Distinct1
Distinct (%)0.9%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
정부초청 외국인 장학생 관리
116 

Length

Max length27
Median length27
Mean length27
Min length27

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row정부초청 외국인 장학생 관리
2nd row정부초청 외국인 장학생 관리
3rd row정부초청 외국인 장학생 관리
4th row정부초청 외국인 장학생 관리
5th row정부초청 외국인 장학생 관리

Common Values

ValueCountFrequency (%)
정부초청 외국인 장학생 관리 116
100.0%

Length

2023-12-13T06:01:38.622376image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T06:01:38.707851image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
정부초청 116
25.0%
외국인 116
25.0%
장학생 116
25.0%
관리 116
25.0%

수학대학
Text

UNIQUE 

Distinct116
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
2023-12-13T06:01:38.897715image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length18
Median length5
Mean length6.2068966
Min length3

Characters and Unicode

Total characters720
Distinct characters118
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique116 ?
Unique (%)100.0%

Sample

1st row가천대학교
2nd row가톨릭대학교
3rd row강릉원주대학교
4th row강원대학교
5th row건국대학교
ValueCountFrequency (%)
가천대학교 1
 
0.8%
원광대학교 1
 
0.8%
순천향대학교 1
 
0.8%
제주대학교 1
 
0.8%
정신문화연구원 1
 
0.8%
전주대학교 1
 
0.8%
전북대학교 1
 
0.8%
전남대학교 1
 
0.8%
장로회신학대학교 1
 
0.8%
인하대학교 1
 
0.8%
Other values (108) 108
91.5%
2023-12-13T06:01:39.271382image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
121
16.8%
112
15.6%
107
 
14.9%
26
 
3.6%
23
 
3.2%
22
 
3.1%
10
 
1.4%
10
 
1.4%
10
 
1.4%
9
 
1.2%
Other values (108) 270
37.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 708
98.3%
Space Separator 10
 
1.4%
Open Punctuation 1
 
0.1%
Close Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
121
17.1%
112
15.8%
107
15.1%
26
 
3.7%
23
 
3.2%
22
 
3.1%
10
 
1.4%
10
 
1.4%
9
 
1.3%
9
 
1.3%
Other values (105) 259
36.6%
Space Separator
ValueCountFrequency (%)
10
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 708
98.3%
Common 12
 
1.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
121
17.1%
112
15.8%
107
15.1%
26
 
3.7%
23
 
3.2%
22
 
3.1%
10
 
1.4%
10
 
1.4%
9
 
1.3%
9
 
1.3%
Other values (105) 259
36.6%
Common
ValueCountFrequency (%)
10
83.3%
( 1
 
8.3%
) 1
 
8.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 708
98.3%
ASCII 12
 
1.7%

Most frequent character per block

Hangul
ValueCountFrequency (%)
121
17.1%
112
15.8%
107
15.1%
26
 
3.7%
23
 
3.2%
22
 
3.1%
10
 
1.4%
10
 
1.4%
9
 
1.3%
9
 
1.3%
Other values (105) 259
36.6%
ASCII
ValueCountFrequency (%)
10
83.3%
( 1
 
8.3%
) 1
 
8.3%

누적관리인원
Real number (ℝ)

Distinct85
Distinct (%)73.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean119.09483
Minimum1
Maximum1779
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.1 KiB
2023-12-13T06:01:39.397544image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile1
Q16
median40.5
Q3118.25
95-th percentile461.75
Maximum1779
Range1778
Interquartile range (IQR)112.25

Descriptive statistics

Standard deviation236.65737
Coefficient of variation (CV)1.9871339
Kurtosis24.314152
Mean119.09483
Median Absolute Deviation (MAD)38.5
Skewness4.4087049
Sum13815
Variance56006.713
MonotonicityNot monotonic
2023-12-13T06:01:39.518447image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 15
 
12.9%
2 6
 
5.2%
3 4
 
3.4%
6 4
 
3.4%
12 3
 
2.6%
8 2
 
1.7%
73 2
 
1.7%
7 2
 
1.7%
18 2
 
1.7%
15 1
 
0.9%
Other values (75) 75
64.7%
ValueCountFrequency (%)
1 15
12.9%
2 6
 
5.2%
3 4
 
3.4%
5 1
 
0.9%
6 4
 
3.4%
7 2
 
1.7%
8 2
 
1.7%
9 1
 
0.9%
12 3
 
2.6%
13 1
 
0.9%
ValueCountFrequency (%)
1779 1
0.9%
1131 1
0.9%
968 1
0.9%
711 1
0.9%
569 1
0.9%
479 1
0.9%
456 1
0.9%
402 1
0.9%
380 1
0.9%
341 1
0.9%

Interactions

2023-12-13T06:01:38.356486image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Missing values

2023-12-13T06:01:38.472410image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T06:01:38.536858image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

사업명수학대학누적관리인원
0정부초청 외국인 장학생 관리가천대학교8
1정부초청 외국인 장학생 관리가톨릭대학교6
2정부초청 외국인 장학생 관리강릉원주대학교39
3정부초청 외국인 장학생 관리강원대학교193
4정부초청 외국인 장학생 관리건국대학교199
5정부초청 외국인 장학생 관리건양대학교25
6정부초청 외국인 장학생 관리경기대학교12
7정부초청 외국인 장학생 관리경남대학교2
8정부초청 외국인 장학생 관리경복대학교27
9정부초청 외국인 장학생 관리경북대학교341
사업명수학대학누적관리인원
106정부초청 외국인 장학생 관리한국항공대학교2
107정부초청 외국인 장학생 관리한국해양대학교18
108정부초청 외국인 장학생 관리한남대학교49
109정부초청 외국인 장학생 관리한동대학교24
110정부초청 외국인 장학생 관리한림대학교55
111정부초청 외국인 장학생 관리한서대학교2
112정부초청 외국인 장학생 관리한양대학교569
113정부초청 외국인 장학생 관리한양여자대학교16
114정부초청 외국인 장학생 관리호서대학교6
115정부초청 외국인 장학생 관리홍익대학교105