Overview

Dataset statistics

Number of variables4
Number of observations339
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory10.7 KiB
Average record size in memory32.4 B

Variable types

Text1
Categorical2
DateTime1

Dataset

Description바이오, 식품의약 등 다양한 연구분야에 관한 전문연구위원 분석물의 목록을 담고 있는 데이터입니다.
Author한국과학기술정보연구원
URLhttps://www.data.go.kr/data/3052487/fileData.do

Alerts

분류 is highly overall correlated with 니즈분류High correlation
니즈분류 is highly overall correlated with 분류High correlation
제목 has unique valuesUnique

Reproduction

Analysis started2023-12-12 11:16:51.259957
Analysis finished2023-12-12 11:16:51.901614
Duration0.64 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

제목
Text

UNIQUE 

Distinct339
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size2.8 KiB
2023-12-12T20:16:52.229419image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length70
Median length46
Mean length28.557522
Min length9

Characters and Unicode

Total characters9681
Distinct characters561
Distinct categories9 ?
Distinct scripts5 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique339 ?
Unique (%)100.0%

Sample

1st row육류부산물 이용에 있어 새로운 통찰
2nd row심부전증 치료를 위한 지방산 대사의 활용 가능성에 관한 고찰
3rd rowToll-유사 수용체의 결정적 역할-미생물의 인지로부터 자가면역까지
4th row천연 식용 색소 및 착색제
5th row미세유체를 이용한 항박테리아용 은나노입자-키토산 복합물의 합성
ValueCountFrequency (%)
42
 
1.9%
위한 29
 
1.3%
대한 23
 
1.0%
새로운 22
 
1.0%
의한 20
 
0.9%
식품 18
 
0.8%
이용한 16
 
0.7%
미치는 15
 
0.7%
효과 14
 
0.6%
개발 14
 
0.6%
Other values (1565) 2012
90.4%
2023-12-12T20:16:53.001087image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1893
 
19.6%
326
 
3.4%
165
 
1.7%
146
 
1.5%
138
 
1.4%
128
 
1.3%
127
 
1.3%
123
 
1.3%
97
 
1.0%
94
 
1.0%
Other values (551) 6444
66.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 6953
71.8%
Space Separator 1893
 
19.6%
Lowercase Letter 487
 
5.0%
Uppercase Letter 157
 
1.6%
Other Punctuation 56
 
0.6%
Decimal Number 39
 
0.4%
Dash Punctuation 36
 
0.4%
Close Punctuation 30
 
0.3%
Open Punctuation 30
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
326
 
4.7%
165
 
2.4%
146
 
2.1%
138
 
2.0%
128
 
1.8%
127
 
1.8%
123
 
1.8%
97
 
1.4%
94
 
1.4%
92
 
1.3%
Other values (482) 5517
79.3%
Lowercase Letter
ValueCountFrequency (%)
i 56
11.5%
e 51
10.5%
s 49
10.1%
a 38
 
7.8%
r 37
 
7.6%
o 36
 
7.4%
n 31
 
6.4%
t 26
 
5.3%
c 26
 
5.3%
l 24
 
4.9%
Other values (18) 113
23.2%
Uppercase Letter
ValueCountFrequency (%)
A 17
 
10.8%
C 16
 
10.2%
P 15
 
9.6%
R 11
 
7.0%
M 11
 
7.0%
N 10
 
6.4%
D 10
 
6.4%
S 9
 
5.7%
F 7
 
4.5%
T 7
 
4.5%
Other values (12) 44
28.0%
Decimal Number
ValueCountFrequency (%)
3 9
23.1%
1 6
15.4%
7 5
12.8%
5 5
12.8%
0 5
12.8%
4 4
10.3%
2 4
10.3%
6 1
 
2.6%
Other Punctuation
ValueCountFrequency (%)
, 24
42.9%
: 18
32.1%
· 6
 
10.7%
. 4
 
7.1%
? 2
 
3.6%
/ 1
 
1.8%
' 1
 
1.8%
Space Separator
ValueCountFrequency (%)
1893
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 36
100.0%
Close Punctuation
ValueCountFrequency (%)
) 30
100.0%
Open Punctuation
ValueCountFrequency (%)
( 30
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 6946
71.7%
Common 2084
 
21.5%
Latin 639
 
6.6%
Han 7
 
0.1%
Greek 5
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
326
 
4.7%
165
 
2.4%
146
 
2.1%
138
 
2.0%
128
 
1.8%
127
 
1.8%
123
 
1.8%
97
 
1.4%
94
 
1.4%
92
 
1.3%
Other values (475) 5510
79.3%
Latin
ValueCountFrequency (%)
i 56
 
8.8%
e 51
 
8.0%
s 49
 
7.7%
a 38
 
5.9%
r 37
 
5.8%
o 36
 
5.6%
n 31
 
4.9%
t 26
 
4.1%
c 26
 
4.1%
l 24
 
3.8%
Other values (36) 265
41.5%
Common
ValueCountFrequency (%)
1893
90.8%
- 36
 
1.7%
) 30
 
1.4%
( 30
 
1.4%
, 24
 
1.2%
: 18
 
0.9%
3 9
 
0.4%
· 6
 
0.3%
1 6
 
0.3%
7 5
 
0.2%
Other values (9) 27
 
1.3%
Han
ValueCountFrequency (%)
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
Greek
ValueCountFrequency (%)
ω 2
40.0%
λ 1
20.0%
α 1
20.0%
β 1
20.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 6946
71.7%
ASCII 2717
 
28.1%
None 11
 
0.1%
CJK 7
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1893
69.7%
i 56
 
2.1%
e 51
 
1.9%
s 49
 
1.8%
a 38
 
1.4%
r 37
 
1.4%
o 36
 
1.3%
- 36
 
1.3%
n 31
 
1.1%
) 30
 
1.1%
Other values (54) 460
 
16.9%
Hangul
ValueCountFrequency (%)
326
 
4.7%
165
 
2.4%
146
 
2.1%
138
 
2.0%
128
 
1.8%
127
 
1.8%
123
 
1.8%
97
 
1.4%
94
 
1.4%
92
 
1.3%
Other values (475) 5510
79.3%
None
ValueCountFrequency (%)
· 6
54.5%
ω 2
 
18.2%
λ 1
 
9.1%
α 1
 
9.1%
β 1
 
9.1%
CJK
ValueCountFrequency (%)
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%

분류
Categorical

HIGH CORRELATION 

Distinct2
Distinct (%)0.6%
Missing0
Missing (%)0.0%
Memory size2.8 KiB
식품·의약
205 
바이오
134 

Length

Max length5
Median length5
Mean length4.2094395
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row식품·의약
2nd row바이오
3rd row바이오
4th row식품·의약
5th row바이오

Common Values

ValueCountFrequency (%)
식품·의약 205
60.5%
바이오 134
39.5%

Length

2023-12-12T20:16:53.275302image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T20:16:53.497823image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
식품·의약 205
60.5%
바이오 134
39.5%

니즈분류
Categorical

HIGH CORRELATION 

Distinct13
Distinct (%)3.8%
Missing0
Missing (%)0.0%
Memory size2.8 KiB
바이오신약 개발을 위한 핵심 기술
89 
최신 건강기능식품
57 
식품 표시에 관한 기술동향
42 
생물학적 제제 및 단백질 분야
38 
식품 안전 및 위생에 관한 기술 동향
28 
Other values (8)
85 

Length

Max length20
Median length16
Mean length14.631268
Min length6

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row육류가공 기술의 최신 연구동향
2nd row바이오신약 개발을 위한 핵심 기술
3rd row바이오신약 개발을 위한 핵심 기술
4th row최신 건강기능식품
5th row바이오신약 개발을 위한 핵심 기술

Common Values

ValueCountFrequency (%)
바이오신약 개발을 위한 핵심 기술 89
26.3%
최신 건강기능식품 57
16.8%
식품 표시에 관한 기술동향 42
12.4%
생물학적 제제 및 단백질 분야 38
11.2%
식품 안전 및 위생에 관한 기술 동향 28
 
8.3%
육류가공 기술의 최신 연구동향 18
 
5.3%
유가공 분야의 최신 연구 동향 18
 
5.3%
최신 장류 기술 14
 
4.1%
가축 및 반려동물의 질환 11
 
3.2%
최신 냉동냉장 식품가공기술 11
 
3.2%
Other values (3) 13
 
3.8%

Length

2023-12-12T20:16:53.727562image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
기술 134
 
9.5%
최신 118
 
8.3%
바이오신약 89
 
6.3%
위한 89
 
6.3%
핵심 89
 
6.3%
개발을 89
 
6.3%
77
 
5.4%
식품 70
 
5.0%
관한 70
 
5.0%
건강기능식품 57
 
4.0%
Other values (25) 532
37.6%
Distinct104
Distinct (%)30.7%
Missing0
Missing (%)0.0%
Memory size2.8 KiB
Minimum2016-03-18 00:00:00
Maximum2016-09-27 00:00:00
2023-12-12T20:16:53.963319image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T20:16:54.228417image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

Correlations

2023-12-12T20:16:54.398247image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분류니즈분류
분류1.0000.896
니즈분류0.8961.000
2023-12-12T20:16:54.538623image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분류니즈분류
분류1.0000.874
니즈분류0.8741.000
2023-12-12T20:16:54.682099image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분류니즈분류
분류1.0000.874
니즈분류0.8741.000

Missing values

2023-12-12T20:16:51.729344image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T20:16:51.859077image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

제목분류니즈분류서비스일
0육류부산물 이용에 있어 새로운 통찰식품·의약육류가공 기술의 최신 연구동향2016-09-27
1심부전증 치료를 위한 지방산 대사의 활용 가능성에 관한 고찰바이오바이오신약 개발을 위한 핵심 기술2016-09-27
2Toll-유사 수용체의 결정적 역할-미생물의 인지로부터 자가면역까지바이오바이오신약 개발을 위한 핵심 기술2016-09-27
3천연 식용 색소 및 착색제식품·의약최신 건강기능식품2016-09-26
4미세유체를 이용한 항박테리아용 은나노입자-키토산 복합물의 합성바이오바이오신약 개발을 위한 핵심 기술2016-09-26
5낙농제품에서 분라한 Shiga 독소 생산 대장균식품·의약유가공 분야의 최신 연구 동향2016-09-26
6잔류농약관리 선진화를 위한 포지티브리스트 제도의 고찰식품·의약식품 표시에 관한 기술동향2016-09-26
7비피더스균의 유기농발효유에서 생존과 세포막 지방산조성의 관계식품·의약유가공 분야의 최신 연구 동향2016-09-26
8히알루론산(HA)-히드로겔의 생의학적 응용에 관한 최신 개발 현황바이오생물학적 제제 및 단백질 분야2016-09-23
9소시지 제조에 오르가노겔 사용 시 품질효과식품·의약육류가공 기술의 최신 연구동향2016-09-23
제목분류니즈분류서비스일
329알츠하이머병 예방과 치료를 위한 레스베리트롤과 다른 포도 유래 폴리페놀류 이용 전략바이오생물학적 제제 및 단백질 분야2016-04-05
330유기농산물 혐기성 소화시설의 경제성 평가바이오바이오에너지 활용기술2016-04-05
331새로운 식품표시와 광고 제도에 대한 합리적인 대응방안식품·의약식품 표시에 관한 기술동향2016-04-05
332인플루엔자 백신 후보 개발을 위한 정량법바이오생물학적 제제 및 단백질 분야2016-04-05
333포장식품의 부패?변패식품·의약식품 표시에 관한 기술동향2016-04-01
334식품표시법에서 강조되는 인쇄 기록기술식품·의약식품 표시에 관한 기술동향2016-03-31
335간장공장의 아민류 저감화 대책식품·의약최신 장류 기술2016-03-31
336우유와 우유제품에서 진균독소식품·의약식품 표시에 관한 기술동향2016-03-30
337심장질환에 유효한 한약재: 한의학과 현대적 개발바이오생물학적 제제 및 단백질 분야2016-03-28
338생선과 생선가공품에서 콜레스테롤의 산화식품·의약식품 표시에 관한 기술동향2016-03-18