Overview

Dataset statistics

Number of variables12
Number of observations127
Missing cells0
Missing cells (%)0.0%
Duplicate rows2
Duplicate rows (%)1.6%
Total size in memory12.0 KiB
Average record size in memory97.0 B

Variable types

Categorical10
Text2

Dataset

Description농림식품RnD 생명자원 성과 정보와 관련된 데이터. 분류,과제관리번호,과제명,생명정보,화합물명 등록,기탁기관 유형,생명자원 등록일 등의 항목으로 구성
Author농림식품기술기획평가원
URLhttps://www.data.go.kr/data/15097831/fileData.do

Alerts

Dataset has 2 (1.6%) duplicate rowsDuplicates
주관기관 is highly overall correlated with 과제관리번호 and 8 other fieldsHigh correlation
과제관리번호 is highly overall correlated with 과제구분 and 8 other fieldsHigh correlation
유형 is highly overall correlated with 과제관리번호 and 6 other fieldsHigh correlation
내역사업명 is highly overall correlated with 과제관리번호 and 8 other fieldsHigh correlation
등록_기탁기관 is highly overall correlated with 과제관리번호 and 8 other fieldsHigh correlation
분야 is highly overall correlated with 과제관리번호 and 6 other fieldsHigh correlation
과제명 is highly overall correlated with 과제관리번호 and 8 other fieldsHigh correlation
과제구분 is highly overall correlated with 과제관리번호 and 8 other fieldsHigh correlation
기업유형 is highly overall correlated with 과제관리번호 and 6 other fieldsHigh correlation
생명자원 등록일 is highly overall correlated with 과제관리번호 and 8 other fieldsHigh correlation
기업유형 is highly imbalanced (62.4%)Imbalance

Reproduction

Analysis started2024-03-14 18:47:45.588235
Analysis finished2024-03-14 18:47:48.400241
Duration2.81 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

과제관리번호
Categorical

HIGH CORRELATION 

Distinct21
Distinct (%)16.5%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
320043-5
72 
122012-2
 
6
321036-5
 
6
322076-3
 
5
321054-5
 
3
Other values (16)
35 

Length

Max length14
Median length8
Mean length8.0944882
Min length8

Unique

Unique2 ?
Unique (%)1.6%

Sample

1st row120087-5
2nd row120087-5
3rd row122012-2
4th row122012-2
5th row122012-2

Common Values

ValueCountFrequency (%)
320043-5 72
56.7%
122012-2 6
 
4.7%
321036-5 6
 
4.7%
322076-3 5
 
3.9%
321054-5 3
 
2.4%
321083-5 3
 
2.4%
421009-4 3
 
2.4%
122020-3 3
 
2.4%
321001-3 3
 
2.4%
321106-3 3
 
2.4%
Other values (11) 20
 
15.7%

Length

2024-03-15T03:47:48.676915image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
320043-5 72
56.7%
321036-5 6
 
4.7%
122012-2 6
 
4.7%
322076-3 5
 
3.9%
321054-5 3
 
2.4%
321083-5 3
 
2.4%
421009-4 3
 
2.4%
122020-3 3
 
2.4%
321001-3 3
 
2.4%
321106-3 3
 
2.4%
Other values (11) 20
 
15.7%

과제구분
Categorical

HIGH CORRELATION 

Distinct9
Distinct (%)7.1%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
작물 바이러스 및 병해충 대응 산업화 기술개발
79 
가축질병대응기술고도화지원
10 
핵심농자재국산화기술개발
10 
고부가가치식품기술개발
디지털육종전환기술개발
 
7
Other values (4)
13 

Length

Max length25
Median length25
Mean length20.551181
Min length11

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row작물 바이러스 및 병해충 대응 산업화 기술개발
2nd row작물 바이러스 및 병해충 대응 산업화 기술개발
3rd row가축질병대응기술고도화지원
4th row가축질병대응기술고도화지원
5th row가축질병대응기술고도화지원

Common Values

ValueCountFrequency (%)
작물 바이러스 및 병해충 대응 산업화 기술개발 79
62.2%
가축질병대응기술고도화지원 10
 
7.9%
핵심농자재국산화기술개발 10
 
7.9%
고부가가치식품기술개발 8
 
6.3%
디지털육종전환기술개발 7
 
5.5%
농식품기술융복합 창의인재 양성 사업 5
 
3.9%
축산현안대응산업화기술개발 3
 
2.4%
스마트팜다부처패키지혁신기술개발사업 3
 
2.4%
Golden Seed 프로젝트 2
 
1.6%

Length

2024-03-15T03:47:49.203381image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T03:47:49.582676image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
작물 79
12.7%
바이러스 79
12.7%
79
12.7%
병해충 79
12.7%
대응 79
12.7%
산업화 79
12.7%
기술개발 79
12.7%
가축질병대응기술고도화지원 10
 
1.6%
핵심농자재국산화기술개발 10
 
1.6%
고부가가치식품기술개발 8
 
1.3%
Other values (10) 39
6.3%

내역사업명
Categorical

HIGH CORRELATION 

Distinct12
Distinct (%)9.4%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
방제기술개발
74 
국내외 신변종 바이러스 협력체계 구축
10 
작물보호제 원제·제품 국산화
10 
미래대응식품 기술개발
교육훈련
 
5
Other values (7)
20 

Length

Max length24
Median length6
Mean length9.2047244
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row내역사업명없음
2nd row내역사업명없음
3rd row국내외 신변종 바이러스 협력체계 구축
4th row국내외 신변종 바이러스 협력체계 구축
5th row국내외 신변종 바이러스 협력체계 구축

Common Values

ValueCountFrequency (%)
방제기술개발 74
58.3%
국내외 신변종 바이러스 협력체계 구축 10
 
7.9%
작물보호제 원제·제품 국산화 10
 
7.9%
미래대응식품 기술개발 8
 
6.3%
교육훈련 5
 
3.9%
데이터 연계 디지털육종 활용 시스템 5
 
3.9%
가축생산효율성증진 3
 
2.4%
진단기술산업화 3
 
2.4%
스마트팜 실증고도화 3
 
2.4%
내역사업명없음 2
 
1.6%
Other values (2) 4
 
3.1%

Length

2024-03-15T03:47:50.091643image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
방제기술개발 74
31.9%
신변종 10
 
4.3%
바이러스 10
 
4.3%
협력체계 10
 
4.3%
구축 10
 
4.3%
작물보호제 10
 
4.3%
원제·제품 10
 
4.3%
국산화 10
 
4.3%
국내외 10
 
4.3%
미래대응식품 8
 
3.4%
Other values (20) 70
30.2%

과제명
Categorical

HIGH CORRELATION 

Distinct21
Distinct (%)16.5%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
병해충 예찰 방법 개선을 위한 거점대학 육성
72 
돼지급성설사증후군 코로나바이러스 기초기전 연구
 
6
마이크로바이옴 타겟 포스트바이오틱스 발굴 및 소재화 기술 개발
 
6
디지털육종기술 확대를 위한 자동화 연관분석 기술개발
 
5
미생물 및 생화학 살충제 제품화 연구단
 
3
Other values (16)
35 

Length

Max length47
Median length24
Mean length25.637795
Min length8

Unique

Unique2 ?
Unique (%)1.6%

Sample

1st row십자화과 작물의 검은썩음병 방제제 기술개발
2nd row십자화과 작물의 검은썩음병 방제제 기술개발
3rd row돼지급성설사증후군 코로나바이러스 기초기전 연구
4th row돼지급성설사증후군 코로나바이러스 기초기전 연구
5th row돼지급성설사증후군 코로나바이러스 기초기전 연구

Common Values

ValueCountFrequency (%)
병해충 예찰 방법 개선을 위한 거점대학 육성 72
56.7%
돼지급성설사증후군 코로나바이러스 기초기전 연구 6
 
4.7%
마이크로바이옴 타겟 포스트바이오틱스 발굴 및 소재화 기술 개발 6
 
4.7%
디지털육종기술 확대를 위한 자동화 연관분석 기술개발 5
 
3.9%
미생물 및 생화학 살충제 제품화 연구단 3
 
2.4%
가축 온실가스 발생 저감 기술 개발 3
 
2.4%
09. 수출용 북방형 스마트팜 패키지 모델 개발 3
 
2.4%
내생포자 기반 작물 생육 촉진용 미생물비료 개발 3
 
2.4%
농작물 병해충 관리 및 검역 기술개발과 산업인력 양성 3
 
2.4%
튤립, 수선화 등 구근 화훼류 발생 바이러스의 동정 및 진단시스템 개발 3
 
2.4%
Other values (11) 20
 
15.7%

Length

2024-03-15T03:47:50.602073image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
위한 79
 
9.0%
병해충 75
 
8.5%
육성 74
 
8.4%
방법 72
 
8.2%
개선을 72
 
8.2%
거점대학 72
 
8.2%
예찰 72
 
8.2%
21
 
2.4%
개발 20
 
2.3%
기술 9
 
1.0%
Other values (105) 313
35.6%

주관기관
Categorical

HIGH CORRELATION 

Distinct16
Distinct (%)12.6%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
전북대학교산학협력단
77 
충남대학교 산학협력단
 
6
고려대학교산학협력단
 
6
전남대학교 산학협력단
 
5
충북대학교 산학협력단
 
5
Other values (11)
28 

Length

Max length20
Median length10
Mean length10.125984
Min length5

Unique

Unique1 ?
Unique (%)0.8%

Sample

1st row한국생명공학연구원
2nd row한국생명공학연구원
3rd row충남대학교 산학협력단
4th row충남대학교 산학협력단
5th row충남대학교 산학협력단

Common Values

ValueCountFrequency (%)
전북대학교산학협력단 77
60.6%
충남대학교 산학협력단 6
 
4.7%
고려대학교산학협력단 6
 
4.7%
전남대학교 산학협력단 5
 
3.9%
충북대학교 산학협력단 5
 
3.9%
(주)디엔에이케어 5
 
3.9%
경북대학교 산학협력단 4
 
3.1%
순천대학교 산학협력단 3
 
2.4%
(사)국제원예연구원 3
 
2.4%
한국생명공학연구원 2
 
1.6%
Other values (6) 11
 
8.7%

Length

2024-03-15T03:47:51.084217image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
전북대학교산학협력단 77
49.7%
산학협력단 23
 
14.8%
충남대학교 6
 
3.9%
고려대학교산학협력단 6
 
3.9%
전남대학교 5
 
3.2%
충북대학교 5
 
3.2%
주)디엔에이케어 5
 
3.2%
경북대학교 4
 
2.6%
주식회사 3
 
1.9%
사)국제원예연구원 3
 
1.9%
Other values (9) 18
 
11.6%

기업유형
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct6
Distinct (%)4.7%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
대학
106 
중소기업
 
10
기타
 
5
정부출연기관
 
2
대기업
 
2

Length

Max length7
Median length2
Mean length2.3149606
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row정부출연기관
2nd row정부출연기관
3rd row대학
4th row대학
5th row대학

Common Values

ValueCountFrequency (%)
대학 106
83.5%
중소기업 10
 
7.9%
기타 5
 
3.9%
정부출연기관 2
 
1.6%
대기업 2
 
1.6%
중소기업연구소 2
 
1.6%

Length

2024-03-15T03:47:51.572172image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T03:47:52.175431image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
대학 106
83.5%
중소기업 10
 
7.9%
기타 5
 
3.9%
정부출연기관 2
 
1.6%
대기업 2
 
1.6%
중소기업연구소 2
 
1.6%

분야
Categorical

HIGH CORRELATION 

Distinct6
Distinct (%)4.7%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
농림식품 환경생태
90 
수의
12 
농림식품 융복합
10 
식품
 
8
농산
 
4

Length

Max length9
Median length9
Mean length7.4330709
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row농림식품 환경생태
2nd row농림식품 환경생태
3rd row수의
4th row수의
5th row수의

Common Values

ValueCountFrequency (%)
농림식품 환경생태 90
70.9%
수의 12
 
9.4%
농림식품 융복합 10
 
7.9%
식품 8
 
6.3%
농산 4
 
3.1%
축산 3
 
2.4%

Length

2024-03-15T03:47:52.574101image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T03:47:52.965819image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
농림식품 100
44.1%
환경생태 90
39.6%
수의 12
 
5.3%
융복합 10
 
4.4%
식품 8
 
3.5%
농산 4
 
1.8%
축산 3
 
1.3%
Distinct56
Distinct (%)44.1%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
2024-03-15T03:47:54.391659image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length53
Median length33
Mean length23.913386
Min length3

Characters and Unicode

Total characters3037
Distinct characters87
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique38 ?
Unique (%)29.9%

Sample

1st rowBacillus velezensis KLB21-128
2nd rowStreptomyces misionensis KLA23-28
3rd rowPorcine epidemic diarrhea virus spike
4th rowPorcine epidemic diarrhea virus spike
5th rowPorcine epidemic diarrhea virus spike
ValueCountFrequency (%)
erysiphe 25
 
7.6%
pseudocercospora 20
 
6.0%
puerariicola 12
 
3.6%
japonica 12
 
3.6%
pleurovularia 11
 
3.3%
pollinae 11
 
3.3%
virus 11
 
3.3%
chloranthi 9
 
2.7%
fatouae 8
 
2.4%
epidemic 6
 
1.8%
Other values (106) 206
62.2%
2024-03-15T03:47:56.123204image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
a 268
 
8.8%
i 239
 
7.9%
e 232
 
7.6%
r 207
 
6.8%
o 205
 
6.8%
204
 
6.7%
s 188
 
6.2%
c 168
 
5.5%
u 153
 
5.0%
l 149
 
4.9%
Other values (77) 1024
33.7%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 2413
79.5%
Uppercase Letter 243
 
8.0%
Space Separator 204
 
6.7%
Decimal Number 98
 
3.2%
Other Letter 49
 
1.6%
Dash Punctuation 15
 
0.5%
Other Punctuation 11
 
0.4%
Connector Punctuation 2
 
0.1%
Close Punctuation 1
 
< 0.1%
Open Punctuation 1
 
< 0.1%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
a 268
11.1%
i 239
9.9%
e 232
9.6%
r 207
8.6%
o 205
8.5%
s 188
 
7.8%
c 168
 
7.0%
u 153
 
6.3%
l 149
 
6.2%
p 124
 
5.1%
Other values (15) 480
19.9%
Other Letter
ValueCountFrequency (%)
5
 
10.2%
4
 
8.2%
3
 
6.1%
3
 
6.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
Other values (14) 22
44.9%
Uppercase Letter
ValueCountFrequency (%)
P 57
23.5%
E 29
11.9%
S 20
 
8.2%
G 19
 
7.8%
L 18
 
7.4%
K 13
 
5.3%
C 13
 
5.3%
B 13
 
5.3%
R 11
 
4.5%
I 10
 
4.1%
Other values (12) 40
16.5%
Decimal Number
ValueCountFrequency (%)
2 22
22.4%
1 20
20.4%
0 13
13.3%
6 9
9.2%
4 8
 
8.2%
8 7
 
7.1%
9 5
 
5.1%
3 5
 
5.1%
5 5
 
5.1%
7 4
 
4.1%
Space Separator
ValueCountFrequency (%)
204
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 15
100.0%
Other Punctuation
ValueCountFrequency (%)
. 11
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 2
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 2656
87.5%
Common 332
 
10.9%
Hangul 49
 
1.6%

Most frequent character per script

Latin
ValueCountFrequency (%)
a 268
 
10.1%
i 239
 
9.0%
e 232
 
8.7%
r 207
 
7.8%
o 205
 
7.7%
s 188
 
7.1%
c 168
 
6.3%
u 153
 
5.8%
l 149
 
5.6%
p 124
 
4.7%
Other values (37) 723
27.2%
Hangul
ValueCountFrequency (%)
5
 
10.2%
4
 
8.2%
3
 
6.1%
3
 
6.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
Other values (14) 22
44.9%
Common
ValueCountFrequency (%)
204
61.4%
2 22
 
6.6%
1 20
 
6.0%
- 15
 
4.5%
0 13
 
3.9%
. 11
 
3.3%
6 9
 
2.7%
4 8
 
2.4%
8 7
 
2.1%
9 5
 
1.5%
Other values (6) 18
 
5.4%

Most occurring blocks

ValueCountFrequency (%)
ASCII 2988
98.4%
Hangul 49
 
1.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
a 268
 
9.0%
i 239
 
8.0%
e 232
 
7.8%
r 207
 
6.9%
o 205
 
6.9%
204
 
6.8%
s 188
 
6.3%
c 168
 
5.6%
u 153
 
5.1%
l 149
 
5.0%
Other values (53) 975
32.6%
Hangul
ValueCountFrequency (%)
5
 
10.2%
4
 
8.2%
3
 
6.1%
3
 
6.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
2
 
4.1%
Other values (14) 22
44.9%
Distinct124
Distinct (%)97.6%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
2024-03-15T03:47:57.358758image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length20
Median length8
Mean length8.7244094
Min length1

Characters and Unicode

Total characters1108
Distinct characters29
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique121 ?
Unique (%)95.3%

Sample

1st rowKCTC19136P
2nd rowKCTC19143P
3rd rowOR529202
4th rowOR529201
5th rowOR529204
ValueCountFrequency (%)
kacc 14
 
9.2%
kctc 3
 
2.0%
3
 
2.0%
kccm 2
 
1.3%
or512527 2
 
1.3%
0 2
 
1.3%
or473072 2
 
1.3%
or573645 1
 
0.7%
oq268216 1
 
0.7%
or029245 1
 
0.7%
Other values (121) 121
79.6%
2024-03-15T03:47:59.260294image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2 111
 
10.0%
5 99
 
8.9%
O 86
 
7.8%
1 86
 
7.8%
9 77
 
6.9%
6 76
 
6.9%
8 63
 
5.7%
0 63
 
5.7%
7 61
 
5.5%
C 57
 
5.1%
Other values (19) 329
29.7%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 734
66.2%
Uppercase Letter 333
30.1%
Space Separator 25
 
2.3%
Dash Punctuation 12
 
1.1%
Math Symbol 3
 
0.3%
Other Punctuation 1
 
0.1%

Most frequent character per category

Uppercase Letter
ValueCountFrequency (%)
O 86
25.8%
C 57
17.1%
Q 49
14.7%
R 37
11.1%
K 26
 
7.8%
P 23
 
6.9%
A 16
 
4.8%
N 14
 
4.2%
T 8
 
2.4%
B 7
 
2.1%
Other values (5) 10
 
3.0%
Decimal Number
ValueCountFrequency (%)
2 111
15.1%
5 99
13.5%
1 86
11.7%
9 77
10.5%
6 76
10.4%
8 63
8.6%
0 63
8.6%
7 61
8.3%
3 50
6.8%
4 48
6.5%
Space Separator
ValueCountFrequency (%)
25
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 12
100.0%
Math Symbol
ValueCountFrequency (%)
~ 3
100.0%
Other Punctuation
ValueCountFrequency (%)
, 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 775
69.9%
Latin 333
30.1%

Most frequent character per script

Latin
ValueCountFrequency (%)
O 86
25.8%
C 57
17.1%
Q 49
14.7%
R 37
11.1%
K 26
 
7.8%
P 23
 
6.9%
A 16
 
4.8%
N 14
 
4.2%
T 8
 
2.4%
B 7
 
2.1%
Other values (5) 10
 
3.0%
Common
ValueCountFrequency (%)
2 111
14.3%
5 99
12.8%
1 86
11.1%
9 77
9.9%
6 76
9.8%
8 63
8.1%
0 63
8.1%
7 61
7.9%
3 50
6.5%
4 48
6.2%
Other values (4) 41
 
5.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 1108
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2 111
 
10.0%
5 99
 
8.9%
O 86
 
7.8%
1 86
 
7.8%
9 77
 
6.9%
6 76
 
6.9%
8 63
 
5.7%
0 63
 
5.7%
7 61
 
5.5%
C 57
 
5.1%
Other values (19) 329
29.7%

등록_기탁기관
Categorical

HIGH CORRELATION 

Distinct18
Distinct (%)14.2%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
GenBank
78 
농업생명공학정보센터(NABIC)
 
5
국립농업과학원
 
5
NCBI
 
5
KCTC
 
4
Other values (13)
30 

Length

Max length55
Median length7
Mean length9.5748031
Min length4

Unique

Unique2 ?
Unique (%)1.6%

Sample

1st rowKCTC
2nd rowKCTC
3rd rowGenBank
4th rowGenBank
5th rowGenBank

Common Values

ValueCountFrequency (%)
GenBank 78
61.4%
농업생명공학정보센터(NABIC) 5
 
3.9%
국립농업과학원 5
 
3.9%
NCBI 5
 
3.9%
KCTC 4
 
3.1%
한국미생물보존센터 4
 
3.1%
국립농업과학원 농업생물부 농업미생물과 3
 
2.4%
국립농업과학원 KACC 3
 
2.4%
NCBI GenBank 3
 
2.4%
KACC 3
 
2.4%
Other values (8) 14
 
11.0%

Length

2024-03-15T03:47:59.677010image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
genbank 82
50.3%
국립농업과학원 12
 
7.4%
ncbi 8
 
4.9%
kacc 6
 
3.7%
농업생명공학정보센터(nabic 5
 
3.1%
kctc 4
 
2.5%
한국미생물보존센터 4
 
2.5%
korean 4
 
2.5%
collection 4
 
2.5%
한국생명공학연구원 4
 
2.5%
Other values (16) 30
 
18.4%

유형
Categorical

HIGH CORRELATION 

Distinct4
Distinct (%)3.1%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
유전체정보
87 
미생물자원
35 
유전체자원
 
3
발현체정보
 
2

Length

Max length5
Median length5
Mean length5
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row미생물자원
2nd row미생물자원
3rd row유전체정보
4th row유전체정보
5th row유전체정보

Common Values

ValueCountFrequency (%)
유전체정보 87
68.5%
미생물자원 35
27.6%
유전체자원 3
 
2.4%
발현체정보 2
 
1.6%

Length

2024-03-15T03:47:59.919358image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T03:48:00.240211image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
유전체정보 87
68.5%
미생물자원 35
27.6%
유전체자원 3
 
2.4%
발현체정보 2
 
1.6%

생명자원 등록일
Categorical

HIGH CORRELATION 

Distinct44
Distinct (%)34.6%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
2023-09-24
11 
2023-05-31
2023-09-10
2023-06-19
 
6
2023-07-18
 
6
Other values (39)
86 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique15 ?
Unique (%)11.8%

Sample

1st row2023-11-28
2nd row2023-11-27
3rd row2023-09-08
4th row2023-09-08
5th row2023-09-08

Common Values

ValueCountFrequency (%)
2023-09-24 11
 
8.7%
2023-05-31 9
 
7.1%
2023-09-10 9
 
7.1%
2023-06-19 6
 
4.7%
2023-07-18 6
 
4.7%
2023-01-21 6
 
4.7%
2023-09-08 6
 
4.7%
2023-10-16 5
 
3.9%
2023-02-28 5
 
3.9%
2023-01-08 4
 
3.1%
Other values (34) 60
47.2%

Length

2024-03-15T03:48:00.605045image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
2023-09-24 11
 
8.7%
2023-09-10 9
 
7.1%
2023-05-31 9
 
7.1%
2023-06-19 6
 
4.7%
2023-07-18 6
 
4.7%
2023-01-21 6
 
4.7%
2023-09-08 6
 
4.7%
2023-10-16 5
 
3.9%
2023-02-28 5
 
3.9%
2023-01-08 4
 
3.1%
Other values (34) 60
47.2%

Correlations

2024-03-15T03:48:01.065670image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
과제관리번호과제구분내역사업명과제명주관기관기업유형분야생명정보_화합물명등록_기탁기관유형생명자원 등록일
과제관리번호1.0001.0001.0001.0001.0001.0001.0000.9990.9950.9960.996
과제구분1.0001.0001.0001.0000.9790.8960.9891.0000.9930.8250.996
내역사업명1.0001.0001.0001.0000.9910.9881.0001.0000.9860.9920.995
과제명1.0001.0001.0001.0001.0001.0001.0000.9990.9950.9960.996
주관기관1.0000.9790.9911.0001.0001.0000.9861.0000.9820.9610.997
기업유형1.0000.8960.9881.0001.0001.0000.8491.0000.9890.4900.997
분야1.0000.9891.0001.0000.9860.8491.0000.9980.9890.6630.991
생명정보_화합물명0.9991.0001.0000.9991.0001.0000.9981.0000.9991.0000.998
등록_기탁기관0.9950.9930.9860.9950.9820.9890.9890.9991.0000.9730.994
유형0.9960.8250.9920.9960.9610.4900.6631.0000.9731.0000.974
생명자원 등록일0.9960.9960.9950.9960.9970.9970.9910.9980.9940.9741.000
2024-03-15T03:48:01.401696image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
주관기관과제관리번호유형내역사업명등록_기탁기관분야생명자원 등록일과제명과제구분기업유형
주관기관1.0000.9770.7190.9060.8560.9100.8180.9770.8840.958
과제관리번호0.9771.0000.9230.9600.9270.9360.8151.0000.9480.936
유형0.7190.9231.0000.8470.8590.4880.6770.9230.6840.334
내역사업명0.9060.9600.8471.0000.8450.9430.7980.9600.9870.814
등록_기탁기관0.8560.9270.8590.8451.0000.8070.7910.9270.8230.807
분야0.9100.9360.4880.9430.8071.0000.7750.9360.9000.469
생명자원 등록일0.8180.8150.6770.7980.7910.7751.0000.8150.8040.812
과제명0.9771.0000.9230.9600.9270.9360.8151.0000.9480.936
과제구분0.8840.9480.6840.9870.8230.9000.8040.9481.0000.693
기업유형0.9580.9360.3340.8140.8070.4690.8120.9360.6931.000
2024-03-15T03:48:01.634001image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
과제관리번호과제구분내역사업명과제명주관기관기업유형분야등록_기탁기관유형생명자원 등록일
과제관리번호1.0000.9480.9601.0000.9770.9360.9360.9270.9230.815
과제구분0.9481.0000.9870.9480.8840.6930.9000.8230.6840.804
내역사업명0.9600.9871.0000.9600.9060.8140.9430.8450.8470.798
과제명1.0000.9480.9601.0000.9770.9360.9360.9270.9230.815
주관기관0.9770.8840.9060.9771.0000.9580.9100.8560.7190.818
기업유형0.9360.6930.8140.9360.9581.0000.4690.8070.3340.812
분야0.9360.9000.9430.9360.9100.4691.0000.8070.4880.775
등록_기탁기관0.9270.8230.8450.9270.8560.8070.8071.0000.8590.791
유형0.9230.6840.8470.9230.7190.3340.4880.8591.0000.677
생명자원 등록일0.8150.8040.7980.8150.8180.8120.7750.7910.6771.000

Missing values

2024-03-15T03:47:47.362433image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-15T03:47:48.036181image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

과제관리번호과제구분내역사업명과제명주관기관기업유형분야생명정보_화합물명등록_기탁번호등록_기탁기관유형생명자원 등록일
0120087-5작물 바이러스 및 병해충 대응 산업화 기술개발내역사업명없음십자화과 작물의 검은썩음병 방제제 기술개발한국생명공학연구원정부출연기관농림식품 환경생태Bacillus velezensis KLB21-128KCTC19136PKCTC미생물자원2023-11-28
1120087-5작물 바이러스 및 병해충 대응 산업화 기술개발내역사업명없음십자화과 작물의 검은썩음병 방제제 기술개발한국생명공학연구원정부출연기관농림식품 환경생태Streptomyces misionensis KLA23-28KCTC19143PKCTC미생물자원2023-11-27
2122012-2가축질병대응기술고도화지원국내외 신변종 바이러스 협력체계 구축돼지급성설사증후군 코로나바이러스 기초기전 연구충남대학교 산학협력단대학수의Porcine epidemic diarrhea virus spikeOR529202GenBank유전체정보2023-09-08
3122012-2가축질병대응기술고도화지원국내외 신변종 바이러스 협력체계 구축돼지급성설사증후군 코로나바이러스 기초기전 연구충남대학교 산학협력단대학수의Porcine epidemic diarrhea virus spikeOR529201GenBank유전체정보2023-09-08
4122012-2가축질병대응기술고도화지원국내외 신변종 바이러스 협력체계 구축돼지급성설사증후군 코로나바이러스 기초기전 연구충남대학교 산학협력단대학수의Porcine epidemic diarrhea virus spikeOR529204GenBank유전체정보2023-09-08
5122012-2가축질병대응기술고도화지원국내외 신변종 바이러스 협력체계 구축돼지급성설사증후군 코로나바이러스 기초기전 연구충남대학교 산학협력단대학수의Porcine epidemic diarrhea virus spikeOR529203GenBank유전체정보2023-09-08
6122012-2가축질병대응기술고도화지원국내외 신변종 바이러스 협력체계 구축돼지급성설사증후군 코로나바이러스 기초기전 연구충남대학교 산학협력단대학수의Porcine epidemic diarrhea virus spikeOR529200GenBank유전체정보2023-09-08
7122012-2가축질병대응기술고도화지원국내외 신변종 바이러스 협력체계 구축돼지급성설사증후군 코로나바이러스 기초기전 연구충남대학교 산학협력단대학수의Porcine epidemic diarrhea virus spikeOR529205GenBank유전체정보2023-09-08
8122014-2가축질병대응기술고도화지원국내외 신변종 바이러스 협력체계 구축오리유래 신변종 바이러스 질병의 국제 공동 감시시스템 구축 및 선제적 방제기술 체계화전북대학교산학협력단대학수의Influenza A virusOQ186732NCBI미생물자원2023-01-06
9122014-2가축질병대응기술고도화지원국내외 신변종 바이러스 협력체계 구축오리유래 신변종 바이러스 질병의 국제 공동 감시시스템 구축 및 선제적 방제기술 체계화전북대학교산학협력단대학수의Influenza A virusOQ186733NCBI미생물자원2023-01-06
과제관리번호과제구분내역사업명과제명주관기관기업유형분야생명정보_화합물명등록_기탁번호등록_기탁기관유형생명자원 등록일
117322076-3디지털육종전환기술개발데이터 연계 디지털육종 활용 시스템디지털육종기술 확대를 위한 자동화 연관분석 기술개발(주)디엔에이케어중소기업농림식품 융복합양배추 GBSNN-8691농업생명공학정보센터(NABIC)유전체정보2023-11-09
118322076-3디지털육종전환기술개발데이터 연계 디지털육종 활용 시스템디지털육종기술 확대를 위한 자동화 연관분석 기술개발(주)디엔에이케어중소기업농림식품 융복합고추 GBSNN-8692농업생명공학정보센터(NABIC)유전체정보2023-11-10
119322076-3디지털육종전환기술개발데이터 연계 디지털육종 활용 시스템디지털육종기술 확대를 위한 자동화 연관분석 기술개발(주)디엔에이케어중소기업농림식품 융복합고추 GBSNN-8693농업생명공학정보센터(NABIC)유전체정보2023-11-10
120322076-3디지털육종전환기술개발데이터 연계 디지털육종 활용 시스템디지털육종기술 확대를 위한 자동화 연관분석 기술개발(주)디엔에이케어중소기업농림식품 융복합고추 GBSNN-8695농업생명공학정보센터(NABIC)유전체정보2023-11-13
121322076-3디지털육종전환기술개발데이터 연계 디지털육종 활용 시스템디지털육종기술 확대를 위한 자동화 연관분석 기술개발(주)디엔에이케어중소기업농림식품 융복합양배추 GBSNN-8699농업생명공학정보센터(NABIC)유전체정보2023-11-13
122421009-4스마트팜다부처패키지혁신기술개발사업스마트팜 실증고도화09. 수출용 북방형 스마트팜 패키지 모델 개발(사)국제원예연구원기타농림식품 융복합Rhodococcus qingshengii SK2658KACC 92490P국립농업과학원 농업생물부 농업미생물과미생물자원2023-03-28
123421009-4스마트팜다부처패키지혁신기술개발사업스마트팜 실증고도화09. 수출용 북방형 스마트팜 패키지 모델 개발(사)국제원예연구원기타농림식품 융복합Microbacerium oxydans SK2665KACC 92491P국립농업과학원 농업생물부 농업미생물과미생물자원2023-03-28
124421009-4스마트팜다부처패키지혁신기술개발사업스마트팜 실증고도화09. 수출용 북방형 스마트팜 패키지 모델 개발(사)국제원예연구원기타농림식품 융복합Micrococcus luteus SK2676KACC 92492P국립농업과학원 농업생물부 농업미생물과미생물자원2023-03-28
125213007051SBE30Golden Seed 프로젝트Golden Seed 프로젝트고기능성 칼라토마토 품종 육성농업회사법인가나종묘중소기업연구소농산루비벨KACC 98142P국립농업과학원미생물자원2023-08-09
126213007051SBE30Golden Seed 프로젝트Golden Seed 프로젝트고기능성 칼라토마토 품종 육성농업회사법인가나종묘중소기업연구소농산파이토인KACC98143P국립농업과학원미생물자원2023-08-09

Duplicate rows

Most frequently occurring

과제관리번호과제구분내역사업명과제명주관기관기업유형분야생명정보_화합물명등록_기탁번호등록_기탁기관유형생명자원 등록일# duplicates
0320043-5작물 바이러스 및 병해충 대응 산업화 기술개발방제기술개발병해충 예찰 방법 개선을 위한 거점대학 육성전북대학교산학협력단대학농림식품 환경생태Erysiphe chloranthiOR512527GenBank유전체정보2023-09-102
1320043-5작물 바이러스 및 병해충 대응 산업화 기술개발방제기술개발병해충 예찰 방법 개선을 위한 거점대학 육성전북대학교산학협력단대학농림식품 환경생태Erysiphe moriOR473072GenBank유전체정보2023-08-282