Overview

Dataset statistics

Number of variables6
Number of observations54
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.7 KiB
Average record size in memory50.4 B

Variable types

Categorical4
Text2

Dataset

Description한국연구재단에서 수행한 각종 조사한 보고서입니다. 대학연구활동실태조사부터 피인용상위 1%보고서 등 각종 성과 분석 보고서 내용이 있습니다
URLhttps://www.data.go.kr/data/15085439/fileData.do

Alerts

기관 has constant value ""Constant
자료종류 has constant value ""Constant
소속 is highly overall correlated with 주저자High correlation
주저자 is highly overall correlated with 소속High correlation
소속 is highly imbalanced (69.0%)Imbalance
자료제목 has unique valuesUnique
파일명 has unique valuesUnique

Reproduction

Analysis started2023-12-12 07:21:48.573633
Analysis finished2023-12-12 07:21:49.305877
Duration0.73 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

기관
Categorical

CONSTANT 

Distinct1
Distinct (%)1.9%
Missing0
Missing (%)0.0%
Memory size564.0 B
NRF
54 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st rowNRF
2nd rowNRF
3rd rowNRF
4th rowNRF
5th rowNRF

Common Values

ValueCountFrequency (%)
NRF 54
100.0%

Length

2023-12-12T16:21:49.372391image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T16:21:49.477935image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
nrf 54
100.0%

자료종류
Categorical

CONSTANT 

Distinct1
Distinct (%)1.9%
Missing0
Missing (%)0.0%
Memory size564.0 B
조사분석보고서
54 

Length

Max length7
Median length7
Mean length7
Min length7

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row조사분석보고서
2nd row조사분석보고서
3rd row조사분석보고서
4th row조사분석보고서
5th row조사분석보고서

Common Values

ValueCountFrequency (%)
조사분석보고서 54
100.0%

Length

2023-12-12T16:21:49.592613image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T16:21:49.709687image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
조사분석보고서 54
100.0%

자료제목
Text

UNIQUE 

Distinct54
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size564.0 B
2023-12-12T16:21:49.957206image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length52
Median length38
Mean length28.481481
Min length16

Characters and Unicode

Total characters1538
Distinct characters90
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique54 ?
Unique (%)100.0%

Sample

1st row2015년도 대학연구활동 실태조사 분석보고서
2nd row2016년도 대학연구활동 실태조사 분석보고서
3rd row2011년도 교육과학기술부 주요연구개발사업 성과분석보고서
4th row2005년도 대학연구활동 실태조사 분석보고서
5th row2006년도 대학연구활동 실태조사 분석보고서
ValueCountFrequency (%)
성과분석보고서 20
 
7.9%
분석보고서 16
 
6.3%
실태조사 15
 
5.9%
대학연구활동 14
 
5.5%
주요 10
 
4.0%
연구개발사업 10
 
4.0%
교육부 8
 
3.2%
보고서 8
 
3.2%
학술연구지원사업 7
 
2.8%
비교분석 6
 
2.4%
Other values (60) 139
54.9%
2023-12-12T16:21:50.412985image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
199
 
12.9%
0 85
 
5.5%
2 82
 
5.3%
59
 
3.8%
1 56
 
3.6%
53
 
3.4%
53
 
3.4%
48
 
3.1%
47
 
3.1%
47
 
3.1%
Other values (80) 809
52.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1028
66.8%
Decimal Number 280
 
18.2%
Space Separator 199
 
12.9%
Dash Punctuation 10
 
0.7%
Other Punctuation 6
 
0.4%
Open Punctuation 5
 
0.3%
Close Punctuation 5
 
0.3%
Uppercase Letter 4
 
0.3%
Math Symbol 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
59
 
5.7%
53
 
5.2%
53
 
5.2%
48
 
4.7%
47
 
4.6%
47
 
4.6%
46
 
4.5%
45
 
4.4%
45
 
4.4%
35
 
3.4%
Other values (58) 550
53.5%
Decimal Number
ValueCountFrequency (%)
0 85
30.4%
2 82
29.3%
1 56
20.0%
7 13
 
4.6%
9 12
 
4.3%
6 10
 
3.6%
8 9
 
3.2%
5 6
 
2.1%
3 5
 
1.8%
4 2
 
0.7%
Uppercase Letter
ValueCountFrequency (%)
I 1
25.0%
N 1
25.0%
B 1
25.0%
S 1
25.0%
Open Punctuation
ValueCountFrequency (%)
( 4
80.0%
[ 1
 
20.0%
Close Punctuation
ValueCountFrequency (%)
) 4
80.0%
] 1
 
20.0%
Space Separator
ValueCountFrequency (%)
199
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 10
100.0%
Other Punctuation
ValueCountFrequency (%)
% 6
100.0%
Math Symbol
ValueCountFrequency (%)
~ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1028
66.8%
Common 506
32.9%
Latin 4
 
0.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
59
 
5.7%
53
 
5.2%
53
 
5.2%
48
 
4.7%
47
 
4.6%
47
 
4.6%
46
 
4.5%
45
 
4.4%
45
 
4.4%
35
 
3.4%
Other values (58) 550
53.5%
Common
ValueCountFrequency (%)
199
39.3%
0 85
16.8%
2 82
16.2%
1 56
 
11.1%
7 13
 
2.6%
9 12
 
2.4%
- 10
 
2.0%
6 10
 
2.0%
8 9
 
1.8%
% 6
 
1.2%
Other values (8) 24
 
4.7%
Latin
ValueCountFrequency (%)
I 1
25.0%
N 1
25.0%
B 1
25.0%
S 1
25.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1028
66.8%
ASCII 510
33.2%

Most frequent character per block

ASCII
ValueCountFrequency (%)
199
39.0%
0 85
16.7%
2 82
16.1%
1 56
 
11.0%
7 13
 
2.5%
9 12
 
2.4%
- 10
 
2.0%
6 10
 
2.0%
8 9
 
1.8%
% 6
 
1.2%
Other values (12) 28
 
5.5%
Hangul
ValueCountFrequency (%)
59
 
5.7%
53
 
5.2%
53
 
5.2%
48
 
4.7%
47
 
4.6%
47
 
4.6%
46
 
4.5%
45
 
4.4%
45
 
4.4%
35
 
3.4%
Other values (58) 550
53.5%

소속
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)3.7%
Missing0
Missing (%)0.0%
Memory size564.0 B
한국연구재단
51 
한국학술진흥재단
 
3

Length

Max length8
Median length6
Mean length6.1111111
Min length6

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row한국연구재단
2nd row한국연구재단
3rd row한국연구재단
4th row한국학술진흥재단
5th row한국학술진흥재단

Common Values

ValueCountFrequency (%)
한국연구재단 51
94.4%
한국학술진흥재단 3
 
5.6%

Length

2023-12-12T16:21:50.599300image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T16:21:50.744243image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
한국연구재단 51
94.4%
한국학술진흥재단 3
 
5.6%

주저자
Categorical

HIGH CORRELATION 

Distinct24
Distinct (%)44.4%
Missing0
Missing (%)0.0%
Memory size564.0 B
전세림
11 
학술데이터분석팀
김소형
<NA>
전세림, 류환진, 김소형
Other values (19)
27 

Length

Max length18
Median length3
Mean length5.1851852
Min length3

Unique

Unique13 ?
Unique (%)24.1%

Sample

1st row조동욱
2nd row노유진
3rd row신희진
4th row한승환
5th row양정모

Common Values

ValueCountFrequency (%)
전세림 11
20.4%
학술데이터분석팀 5
 
9.3%
김소형 4
 
7.4%
<NA> 4
 
7.4%
전세림, 류환진, 김소형 3
 
5.6%
김흥기 3
 
5.6%
전세림, 류환진, 이유경, 김소형 3
 
5.6%
한승환 2
 
3.7%
조석민 2
 
3.7%
양정모 2
 
3.7%
Other values (14) 15
27.8%

Length

2023-12-12T16:21:50.852406image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
전세림 17
23.9%
김소형 11
15.5%
류환진 6
 
8.5%
학술데이터분석팀 5
 
7.0%
na 4
 
5.6%
김흥기 3
 
4.2%
이유경 3
 
4.2%
정종근 2
 
2.8%
임현정 2
 
2.8%
조석민 2
 
2.8%
Other values (14) 16
22.5%

파일명
Text

UNIQUE 

Distinct54
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size564.0 B
2023-12-12T16:21:51.123125image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length56
Median length46
Mean length31.37037
Min length16

Characters and Unicode

Total characters1694
Distinct characters99
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique54 ?
Unique (%)100.0%

Sample

1st row2015 대학연구활동실태조사분석보고서.pdf
2nd row최종[배포용]2016년도 전국대학 대학연구활동실태조사 분석보고서.pdf
3rd row2011 교과부 주요연구개발사업 성과분석보고서.pdf
4th row2005 대학연구활동실태조사 분석보고서.pdf
5th row2006 대학연구활동실태조사 분석보고서.pdf
ValueCountFrequency (%)
성과분석보고서.pdf 15
 
6.8%
분석보고서.pdf 14
 
6.4%
대학연구활동실태조사 13
 
5.9%
연구개발사업 10
 
4.5%
주요 9
 
4.1%
교육부 8
 
3.6%
학술연구지원사업 6
 
2.7%
2019 5
 
2.3%
2017 5
 
2.3%
산학협력활동 5
 
2.3%
Other values (72) 130
59.1%
2023-12-12T16:21:51.589241image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
166
 
9.8%
2 91
 
5.4%
0 87
 
5.1%
1 66
 
3.9%
57
 
3.4%
. 55
 
3.2%
d 52
 
3.1%
p 52
 
3.1%
52
 
3.1%
52
 
3.1%
Other values (89) 964
56.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 950
56.1%
Decimal Number 301
 
17.8%
Space Separator 166
 
9.8%
Lowercase Letter 156
 
9.2%
Other Punctuation 61
 
3.6%
Connector Punctuation 14
 
0.8%
Close Punctuation 14
 
0.8%
Open Punctuation 14
 
0.8%
Uppercase Letter 10
 
0.6%
Dash Punctuation 8
 
0.5%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
57
 
6.0%
52
 
5.5%
52
 
5.5%
45
 
4.7%
45
 
4.7%
44
 
4.6%
44
 
4.6%
43
 
4.5%
40
 
4.2%
33
 
3.5%
Other values (60) 495
52.1%
Decimal Number
ValueCountFrequency (%)
2 91
30.2%
0 87
28.9%
1 66
21.9%
7 13
 
4.3%
9 13
 
4.3%
6 10
 
3.3%
8 10
 
3.3%
3 6
 
2.0%
5 3
 
1.0%
4 2
 
0.7%
Uppercase Letter
ValueCountFrequency (%)
D 2
20.0%
F 2
20.0%
P 2
20.0%
N 1
10.0%
B 1
10.0%
S 1
10.0%
I 1
10.0%
Lowercase Letter
ValueCountFrequency (%)
d 52
33.3%
p 52
33.3%
f 52
33.3%
Other Punctuation
ValueCountFrequency (%)
. 55
90.2%
% 6
 
9.8%
Close Punctuation
ValueCountFrequency (%)
) 13
92.9%
] 1
 
7.1%
Open Punctuation
ValueCountFrequency (%)
( 13
92.9%
[ 1
 
7.1%
Space Separator
ValueCountFrequency (%)
166
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 14
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 8
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 950
56.1%
Common 578
34.1%
Latin 166
 
9.8%

Most frequent character per script

Hangul
ValueCountFrequency (%)
57
 
6.0%
52
 
5.5%
52
 
5.5%
45
 
4.7%
45
 
4.7%
44
 
4.6%
44
 
4.6%
43
 
4.5%
40
 
4.2%
33
 
3.5%
Other values (60) 495
52.1%
Common
ValueCountFrequency (%)
166
28.7%
2 91
15.7%
0 87
15.1%
1 66
 
11.4%
. 55
 
9.5%
_ 14
 
2.4%
7 13
 
2.2%
9 13
 
2.2%
) 13
 
2.2%
( 13
 
2.2%
Other values (9) 47
 
8.1%
Latin
ValueCountFrequency (%)
d 52
31.3%
p 52
31.3%
f 52
31.3%
D 2
 
1.2%
F 2
 
1.2%
P 2
 
1.2%
N 1
 
0.6%
B 1
 
0.6%
S 1
 
0.6%
I 1
 
0.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 950
56.1%
ASCII 744
43.9%

Most frequent character per block

ASCII
ValueCountFrequency (%)
166
22.3%
2 91
12.2%
0 87
11.7%
1 66
 
8.9%
. 55
 
7.4%
d 52
 
7.0%
p 52
 
7.0%
f 52
 
7.0%
_ 14
 
1.9%
7 13
 
1.7%
Other values (19) 96
12.9%
Hangul
ValueCountFrequency (%)
57
 
6.0%
52
 
5.5%
52
 
5.5%
45
 
4.7%
45
 
4.7%
44
 
4.6%
44
 
4.6%
43
 
4.5%
40
 
4.2%
33
 
3.5%
Other values (60) 495
52.1%

Correlations

2023-12-12T16:21:51.693201image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
자료제목소속주저자파일명
자료제목1.0001.0001.0001.000
소속1.0001.0000.8881.000
주저자1.0000.8881.0001.000
파일명1.0001.0001.0001.000
2023-12-12T16:21:51.807929image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
소속주저자
소속1.0000.618
주저자0.6181.000
2023-12-12T16:21:51.905448image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
소속주저자
소속1.0000.618
주저자0.6181.000

Missing values

2023-12-12T16:21:49.130819image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T16:21:49.267526image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

기관자료종류자료제목소속주저자파일명
0NRF조사분석보고서2015년도 대학연구활동 실태조사 분석보고서한국연구재단조동욱2015 대학연구활동실태조사분석보고서.pdf
1NRF조사분석보고서2016년도 대학연구활동 실태조사 분석보고서한국연구재단노유진최종[배포용]2016년도 전국대학 대학연구활동실태조사 분석보고서.pdf
2NRF조사분석보고서2011년도 교육과학기술부 주요연구개발사업 성과분석보고서한국연구재단신희진2011 교과부 주요연구개발사업 성과분석보고서.pdf
3NRF조사분석보고서2005년도 대학연구활동 실태조사 분석보고서한국학술진흥재단한승환2005 대학연구활동실태조사 분석보고서.pdf
4NRF조사분석보고서2006년도 대학연구활동 실태조사 분석보고서한국학술진흥재단양정모2006 대학연구활동실태조사 분석보고서.pdf
5NRF조사분석보고서2007년도 대학연구활동 실태조사 분석보고서한국학술진흥재단양정모2007 대학연구활동실태조사 분석보고서.pdf
6NRF조사분석보고서2008년도 대학연구활동 실태조사 분석보고서한국연구재단한승환2008 대학연구활동실태조사 분석보고서.pdf
7NRF조사분석보고서2009년도 대학연구활동 실태조사 분석보고서한국연구재단황구연2009 대학연구활동실태조사 분석보고서.pdf
8NRF조사분석보고서2011년도 대학연구활동 실태조사 분석보고서한국연구재단조석민2011 대학연구활동실태조사 분석보고서.pdf
9NRF조사분석보고서2012년도 대학연구활동 실태조사 분석보고서한국연구재단조석민2012 대학연구활동실태조사 분석보고서.pdf
기관자료종류자료제목소속주저자파일명
44NRF조사분석보고서2020 한국연구재단 주요 연구개발사업 성과분석보고서한국연구재단전세림, 류환진, 김소형2020 한국연구재단 주요 연구개발사업 성과분석보고서.pdf
45NRF조사분석보고서2020 교육부 학술연구지원사업 성과분석보고서한국연구재단전세림, 류환진, 김소형2020 교육부 학술연구지원사업 성과분석보고서.pdf
46NRF조사분석보고서2020 과학기술정보통신부 주요 연구개발사업 성과분석보고서한국연구재단전세림, 류환진, 김소형2020 과학기술정보통신부 주요 연구개발사업 성과분석보고서.pdf
47NRF조사분석보고서2010-2020 주요국의 피인용 상위 1% 논문실적 비교분석 보고서한국연구재단전세림2010-2020 주요국의 피인용 상위 1% 논문실적 비교분석 보고서_한국연구재단_2022발행.pdf
48NRF조사분석보고서2021 대학 산학협력활동 조사보고서한국연구재단학술데이터분석팀2021 대학 산학협력활동 조사보고서.PDF
49NRF조사분석보고서2022년도 대학연구활동 실태조사 분석보고서한국연구재단학술데이터분석팀2022년도 대학연구활동 실태조사 분석보고서_.pdf
50NRF조사분석보고서2022년 학술실태조사 보고서한국연구재단학술데이터분석팀2022년 학술실태조사 보고서.pdf
51NRF조사분석보고서2021 한국연구재단 주요 연구개발사업 성과분석보고서한국연구재단전세림, 류환진, 이유경, 김소형2021 한국연구재단 주요 연구개발사업 성과분석보고서.pdf
52NRF조사분석보고서2021 교육부 학술연구지원사업 성과분석보고서한국연구재단전세림, 류환진, 이유경, 김소형2021 교육부 학술연구지원사업 성과분석보고서.pdf
53NRF조사분석보고서2021 과학기술정보통신부 주요 연구개발사업 성과분석보고서한국연구재단전세림, 류환진, 이유경, 김소형2021 과학기술정보통신부 주요 연구개발사업 성과분석보고서.pdf