Overview

Dataset statistics

Number of variables14
Number of observations404
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory44.3 KiB
Average record size in memory112.3 B

Variable types

Text3
Categorical10
DateTime1

Dataset

Description농림식품RnD 생명자원 성과 정보 데이터. 번호,분야,과제관리번호,과제구분,내역사업명,과제명,생명정보_화합물명 등의 항목으로 구성
Author농림식품기술기획평가원
URLhttps://www.data.go.kr/data/15111868/fileData.do

Alerts

과제구분 is highly overall correlated with 분야 and 8 other fieldsHigh correlation
분야 is highly overall correlated with 과제관리번호 and 6 other fieldsHigh correlation
과제명 is highly overall correlated with 분야 and 8 other fieldsHigh correlation
기업유형 is highly overall correlated with 과제관리번호 and 6 other fieldsHigh correlation
내역사업명 is highly overall correlated with 분야 and 8 other fieldsHigh correlation
주관기관 is highly overall correlated with 분야 and 8 other fieldsHigh correlation
연구책임자 is highly overall correlated with 분야 and 8 other fieldsHigh correlation
과제관리번호 is highly overall correlated with 분야 and 8 other fieldsHigh correlation
등록_기탁기관 is highly overall correlated with 분야 and 8 other fieldsHigh correlation
유형 is highly overall correlated with 과제관리번호 and 6 other fieldsHigh correlation
분야 is highly imbalanced (53.7%)Imbalance
주관기관 is highly imbalanced (52.4%)Imbalance
기업유형 is highly imbalanced (65.3%)Imbalance
유형 is highly imbalanced (72.3%)Imbalance
번호 has unique valuesUnique

Reproduction

Analysis started2023-12-12 06:37:25.823504
Analysis finished2023-12-12 06:37:27.441248
Duration1.62 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

번호
Text

UNIQUE 

Distinct404
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
2023-12-12T15:37:27.742534image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length9
Median length9
Mean length8.7326733
Min length7

Characters and Unicode

Total characters3528
Distinct characters12
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique404 ?
Unique (%)100.0%

Sample

1st rowL2022-1
2nd rowL2022-2
3rd rowL2022-3
4th rowL2022-4
5th rowL2022-5
ValueCountFrequency (%)
l2022-1 1
 
0.2%
l2022-266 1
 
0.2%
l2022-277 1
 
0.2%
l2022-276 1
 
0.2%
l2022-275 1
 
0.2%
l2022-274 1
 
0.2%
l2022-273 1
 
0.2%
l2022-272 1
 
0.2%
l2022-271 1
 
0.2%
l2022-270 1
 
0.2%
Other values (394) 394
97.5%
2023-12-12T15:37:28.263242image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2 1393
39.5%
0 479
 
13.6%
L 404
 
11.5%
- 404
 
11.5%
1 181
 
5.1%
3 181
 
5.1%
4 86
 
2.4%
5 80
 
2.3%
6 80
 
2.3%
7 80
 
2.3%
Other values (2) 160
 
4.5%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 2720
77.1%
Uppercase Letter 404
 
11.5%
Dash Punctuation 404
 
11.5%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
2 1393
51.2%
0 479
 
17.6%
1 181
 
6.7%
3 181
 
6.7%
4 86
 
3.2%
5 80
 
2.9%
6 80
 
2.9%
7 80
 
2.9%
8 80
 
2.9%
9 80
 
2.9%
Uppercase Letter
ValueCountFrequency (%)
L 404
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 404
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 3124
88.5%
Latin 404
 
11.5%

Most frequent character per script

Common
ValueCountFrequency (%)
2 1393
44.6%
0 479
 
15.3%
- 404
 
12.9%
1 181
 
5.8%
3 181
 
5.8%
4 86
 
2.8%
5 80
 
2.6%
6 80
 
2.6%
7 80
 
2.6%
8 80
 
2.6%
Latin
ValueCountFrequency (%)
L 404
100.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 3528
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2 1393
39.5%
0 479
 
13.6%
L 404
 
11.5%
- 404
 
11.5%
1 181
 
5.1%
3 181
 
5.1%
4 86
 
2.4%
5 80
 
2.3%
6 80
 
2.3%
7 80
 
2.3%
Other values (2) 160
 
4.5%

분야
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct6
Distinct (%)1.5%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
농림식품 환경생태
311 
수의
50 
농림식품 융복합
 
18
농산
 
14
식품
 
8

Length

Max length9
Median length9
Mean length7.6559406
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row수의
2nd row수의
3rd row농림식품 환경생태
4th row농림식품 환경생태
5th row농림식품 환경생태

Common Values

ValueCountFrequency (%)
농림식품 환경생태 311
77.0%
수의 50
 
12.4%
농림식품 융복합 18
 
4.5%
농산 14
 
3.5%
식품 8
 
2.0%
축산 3
 
0.7%

Length

2023-12-12T15:37:28.418702image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T15:37:28.535104image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
농림식품 329
44.9%
환경생태 311
42.4%
수의 50
 
6.8%
융복합 18
 
2.5%
농산 14
 
1.9%
식품 8
 
1.1%
축산 3
 
0.4%

과제관리번호
Categorical

HIGH CORRELATION 

Distinct36
Distinct (%)8.9%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
321001-3
202 
320043-5
49 
321018-1
47 
321110-4
29 
918017-4
 
10
Other values (31)
67 

Length

Max length8
Median length8
Mean length8
Min length8

Unique

Unique16 ?
Unique (%)4.0%

Sample

1st row321018-1
2nd row321018-1
3rd row321001-3
4th row321001-3
5th row321001-3

Common Values

ValueCountFrequency (%)
321001-3 202
50.0%
320043-5 49
 
12.1%
321018-1 47
 
11.6%
321110-4 29
 
7.2%
918017-4 10
 
2.5%
321036-5 7
 
1.7%
918023-4 6
 
1.5%
821025-3 5
 
1.2%
321057-5 5
 
1.2%
320037-5 4
 
1.0%
Other values (26) 40
 
9.9%

Length

2023-12-12T15:37:28.655032image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
321001-3 202
50.0%
320043-5 49
 
12.1%
321018-1 47
 
11.6%
321110-4 29
 
7.2%
918017-4 10
 
2.5%
321036-5 7
 
1.7%
918023-4 6
 
1.5%
821025-3 5
 
1.2%
321057-5 5
 
1.2%
320037-5 4
 
1.0%
Other values (26) 40
 
9.9%

과제구분
Categorical

HIGH CORRELATION 

Distinct12
Distinct (%)3.0%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
농식품기술융복합 창의인재 양성 사업
204 
작물 바이러스 및 병해충 대응 산업화 기술개발
94 
가축질병대응기술개발
47 
포스트게놈 신산업육성을 위한 다부처유전체사업
 
20
기술사업화지원
 
12
Other values (7)
27 

Length

Max length25
Median length19
Mean length18.747525
Min length7

Unique

Unique2 ?
Unique (%)0.5%

Sample

1st row가축질병대응기술개발
2nd row가축질병대응기술개발
3rd row농식품기술융복합 창의인재 양성 사업
4th row농식품기술융복합 창의인재 양성 사업
5th row농식품기술융복합 창의인재 양성 사업

Common Values

ValueCountFrequency (%)
농식품기술융복합 창의인재 양성 사업 204
50.5%
작물 바이러스 및 병해충 대응 산업화 기술개발 94
23.3%
가축질병대응기술개발 47
 
11.6%
포스트게놈 신산업육성을 위한 다부처유전체사업 20
 
5.0%
기술사업화지원 12
 
3.0%
디지털육종전환기술개발 7
 
1.7%
고부가가치식품기술개발 7
 
1.7%
핵심농자재국산화기술개발 7
 
1.7%
축산현안대응산업화기술개발 2
 
0.5%
농생명산업기술개발 2
 
0.5%
Other values (2) 2
 
0.5%

Length

2023-12-12T15:37:28.795884image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
농식품기술융복합 204
12.4%
양성 204
12.4%
사업 204
12.4%
창의인재 204
12.4%
산업화 95
 
5.8%
기술개발 95
 
5.8%
작물 94
 
5.7%
바이러스 94
 
5.7%
94
 
5.7%
병해충 94
 
5.7%
Other values (15) 261
15.9%

내역사업명
Categorical

HIGH CORRELATION 

Distinct17
Distinct (%)4.2%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
교육훈련
203 
방제기술개발
59 
동물의약품개발
47 
내역사업명없음
29 
부처연계
 
10
Other values (12)
56 

Length

Max length24
Median length4
Mean length6.1361386
Min length4

Unique

Unique3 ?
Unique (%)0.7%

Sample

1st row동물의약품개발
2nd row동물의약품개발
3rd row교육훈련
4th row교육훈련
5th row교육훈련

Common Values

ValueCountFrequency (%)
교육훈련 203
50.2%
방제기술개발 59
 
14.6%
동물의약품개발 47
 
11.6%
내역사업명없음 29
 
7.2%
부처연계 10
 
2.5%
산업화미생물유전체전략연구 10
 
2.5%
공공기술 사업화 촉진 8
 
2.0%
작물보호제 원제·제품 국산화 7
 
1.7%
미래대응식품 기술개발 7
 
1.7%
디지털육종 기반 마련을 위한 핵심기술 고도화 7
 
1.7%
Other values (7) 17
 
4.2%

Length

2023-12-12T15:37:28.948627image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
교육훈련 203
41.2%
방제기술개발 59
 
12.0%
동물의약품개발 47
 
9.5%
내역사업명없음 29
 
5.9%
사업화 12
 
2.4%
부처연계 10
 
2.0%
산업화미생물유전체전략연구 10
 
2.0%
공공기술 8
 
1.6%
촉진 8
 
1.6%
기술개발 8
 
1.6%
Other values (22) 99
20.1%

과제명
Categorical

HIGH CORRELATION 

Distinct36
Distinct (%)8.9%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
농작물 병해충 관리 및 검역 기술개발과 산업인력 양성
202 
병해충 예찰 방법 개선을 위한 거점대학 육성
49 
11. 지역적 돼지유행성설사 바이러스 유전학적 분석을 통한 예방 모델 개발
47 
16. 미생물 기반 유해 토양선충 방제 제반기술 개발 및 실증 연구
29 
벼 마이크로바이옴 분석 및 상호작용 기능 연구
 
10
Other values (31)
67 

Length

Max length67
Median length29
Mean length31.282178
Min length8

Unique

Unique16 ?
Unique (%)4.0%

Sample

1st row11. 지역적 돼지유행성설사 바이러스 유전학적 분석을 통한 예방 모델 개발
2nd row11. 지역적 돼지유행성설사 바이러스 유전학적 분석을 통한 예방 모델 개발
3rd row농작물 병해충 관리 및 검역 기술개발과 산업인력 양성
4th row농작물 병해충 관리 및 검역 기술개발과 산업인력 양성
5th row농작물 병해충 관리 및 검역 기술개발과 산업인력 양성

Common Values

ValueCountFrequency (%)
농작물 병해충 관리 및 검역 기술개발과 산업인력 양성 202
50.0%
병해충 예찰 방법 개선을 위한 거점대학 육성 49
 
12.1%
11. 지역적 돼지유행성설사 바이러스 유전학적 분석을 통한 예방 모델 개발 47
 
11.6%
16. 미생물 기반 유해 토양선충 방제 제반기술 개발 및 실증 연구 29
 
7.2%
벼 마이크로바이옴 분석 및 상호작용 기능 연구 10
 
2.5%
마이크로바이옴 타겟 포스트바이오틱스 발굴 및 소재화 기술 개발 7
 
1.7%
농림축산식품 미생물유전체전략연구사업단 6
 
1.5%
전통 발효식품 유래 유산균을 활용한 숙취 및 간보호 효능에 도움이 되는 기능성 식품 개발 5
 
1.2%
생장조정제 대체 미생물농약, 생화학농약 제품화 연구단 5
 
1.2%
천연 추출물 유래 항바이러스제 개발 및 상용화 기술개발 4
 
1.0%
Other values (26) 40
 
9.9%

Length

2023-12-12T15:37:29.107927image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
280
 
8.3%
병해충 251
 
7.4%
농작물 202
 
6.0%
관리 202
 
6.0%
검역 202
 
6.0%
기술개발과 202
 
6.0%
산업인력 202
 
6.0%
양성 202
 
6.0%
개발 121
 
3.6%
위한 61
 
1.8%
Other values (217) 1465
43.2%

연구책임자
Categorical

HIGH CORRELATION 

Distinct36
Distinct (%)8.9%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
이귀재
202 
최인영
49 
이창희
47 
손광희
29 
이용환
 
10
Other values (31)
67 

Length

Max length3
Median length3
Mean length2.9950495
Min length2

Unique

Unique16 ?
Unique (%)4.0%

Sample

1st row이창희
2nd row이창희
3rd row이귀재
4th row이귀재
5th row이귀재

Common Values

ValueCountFrequency (%)
이귀재 202
50.0%
최인영 49
 
12.1%
이창희 47
 
11.6%
손광희 29
 
7.2%
이용환 10
 
2.5%
김경헌 7
 
1.7%
김지현 6
 
1.5%
박상민 5
 
1.2%
김평일 5
 
1.2%
김희경 4
 
1.0%
Other values (26) 40
 
9.9%

Length

2023-12-12T15:37:29.241534image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
이귀재 202
50.0%
최인영 49
 
12.1%
이창희 47
 
11.6%
손광희 29
 
7.2%
이용환 10
 
2.5%
김경헌 7
 
1.7%
김지현 6
 
1.5%
박상민 5
 
1.2%
김평일 5
 
1.2%
김희경 4
 
1.0%
Other values (26) 40
 
9.9%

주관기관
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct29
Distinct (%)7.2%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
전북대학교산학협력단
251 
경상국립대학교 산학협력단
47 
한국생명공학연구원
29 
서울대학교 산학협력단
 
12
재단법인 농축산용미생물산업육성지원센터
 
8
Other values (24)
57 

Length

Max length20
Median length10
Mean length10.415842
Min length5

Unique

Unique12 ?
Unique (%)3.0%

Sample

1st row경상국립대학교 산학협력단
2nd row경상국립대학교 산학협력단
3rd row전북대학교산학협력단
4th row전북대학교산학협력단
5th row전북대학교산학협력단

Common Values

ValueCountFrequency (%)
전북대학교산학협력단 251
62.1%
경상국립대학교 산학협력단 47
 
11.6%
한국생명공학연구원 29
 
7.2%
서울대학교 산학협력단 12
 
3.0%
재단법인 농축산용미생물산업육성지원센터 8
 
2.0%
연세대학교 산학협력단 7
 
1.7%
고려대학교산학협력단 7
 
1.7%
(주)팜스빌 5
 
1.2%
경북대학교 산학협력단 5
 
1.2%
(주)제농 4
 
1.0%
Other values (19) 29
 
7.2%

Length

2023-12-12T15:37:29.393412image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
전북대학교산학협력단 251
50.5%
산학협력단 78
 
15.7%
경상국립대학교 47
 
9.5%
한국생명공학연구원 29
 
5.8%
서울대학교 12
 
2.4%
재단법인 8
 
1.6%
농축산용미생물산업육성지원센터 8
 
1.6%
연세대학교 7
 
1.4%
주식회사 7
 
1.4%
고려대학교산학협력단 7
 
1.4%
Other values (22) 43
 
8.7%

기업유형
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct6
Distinct (%)1.5%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
대학
340 
정부출연기관
 
31
중소기업
 
21
기타
 
9
대기업
 
2

Length

Max length6
Median length2
Mean length2.4207921
Min length2

Unique

Unique1 ?
Unique (%)0.2%

Sample

1st row대학
2nd row대학
3rd row대학
4th row대학
5th row대학

Common Values

ValueCountFrequency (%)
대학 340
84.2%
정부출연기관 31
 
7.7%
중소기업 21
 
5.2%
기타 9
 
2.2%
대기업 2
 
0.5%
중견기업 1
 
0.2%

Length

2023-12-12T15:37:29.540517image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T15:37:29.651299image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
대학 340
84.2%
정부출연기관 31
 
7.7%
중소기업 21
 
5.2%
기타 9
 
2.2%
대기업 2
 
0.5%
중견기업 1
 
0.2%
Distinct251
Distinct (%)62.1%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
2023-12-12T15:37:29.948381image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length81
Median length48
Mean length20.351485
Min length3

Characters and Unicode

Total characters8222
Distinct characters131
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique195 ?
Unique (%)48.3%

Sample

1st rowGNU-1914
2nd rowGNU-2112
3rd rowZucchini yellow mosaic virus-BS1 외피단백질
4th rowSUB9926204 A86
5th rowSUB9926204 A77
ValueCountFrequency (%)
falcileptoneta 110
 
12.6%
longileptoneta 39
 
4.5%
leptoneta 27
 
3.1%
erysiphe 19
 
2.2%
podosphaera 12
 
1.4%
sub9926204 12
 
1.4%
sp 11
 
1.3%
sp3 10
 
1.1%
8
 
0.9%
토양 8
 
0.9%
Other values (352) 618
70.7%
2023-12-12T15:37:30.518350image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
e 721
 
8.8%
a 646
 
7.9%
i 558
 
6.8%
s 536
 
6.5%
n 527
 
6.4%
470
 
5.7%
t 468
 
5.7%
o 453
 
5.5%
l 451
 
5.5%
p 353
 
4.3%
Other values (121) 3039
37.0%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 5889
71.6%
Uppercase Letter 760
 
9.2%
Decimal Number 754
 
9.2%
Space Separator 470
 
5.7%
Other Letter 207
 
2.5%
Dash Punctuation 98
 
1.2%
Other Punctuation 18
 
0.2%
Open Punctuation 9
 
0.1%
Close Punctuation 9
 
0.1%
Connector Punctuation 8
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
12
 
5.8%
11
 
5.3%
10
 
4.8%
10
 
4.8%
10
 
4.8%
9
 
4.3%
8
 
3.9%
8
 
3.9%
7
 
3.4%
7
 
3.4%
Other values (55) 115
55.6%
Lowercase Letter
ValueCountFrequency (%)
e 721
12.2%
a 646
11.0%
i 558
9.5%
s 536
9.1%
n 527
8.9%
t 468
7.9%
o 453
7.7%
l 451
7.7%
p 353
 
6.0%
c 267
 
4.5%
Other values (16) 909
15.4%
Uppercase Letter
ValueCountFrequency (%)
F 111
14.6%
L 94
12.4%
N 90
11.8%
U 63
8.3%
G 62
8.2%
A 52
 
6.8%
S 36
 
4.7%
P 34
 
4.5%
B 33
 
4.3%
M 31
 
4.1%
Other values (12) 154
20.3%
Decimal Number
ValueCountFrequency (%)
1 164
21.8%
0 163
21.6%
2 132
17.5%
3 51
 
6.8%
9 49
 
6.5%
4 46
 
6.1%
8 44
 
5.8%
7 43
 
5.7%
6 32
 
4.2%
5 30
 
4.0%
Other Punctuation
ValueCountFrequency (%)
. 14
77.8%
" 2
 
11.1%
, 2
 
11.1%
Space Separator
ValueCountFrequency (%)
470
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 98
100.0%
Open Punctuation
ValueCountFrequency (%)
( 9
100.0%
Close Punctuation
ValueCountFrequency (%)
) 9
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 8
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 6649
80.9%
Common 1366
 
16.6%
Hangul 207
 
2.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
12
 
5.8%
11
 
5.3%
10
 
4.8%
10
 
4.8%
10
 
4.8%
9
 
4.3%
8
 
3.9%
8
 
3.9%
7
 
3.4%
7
 
3.4%
Other values (55) 115
55.6%
Latin
ValueCountFrequency (%)
e 721
10.8%
a 646
 
9.7%
i 558
 
8.4%
s 536
 
8.1%
n 527
 
7.9%
t 468
 
7.0%
o 453
 
6.8%
l 451
 
6.8%
p 353
 
5.3%
c 267
 
4.0%
Other values (38) 1669
25.1%
Common
ValueCountFrequency (%)
470
34.4%
1 164
 
12.0%
0 163
 
11.9%
2 132
 
9.7%
- 98
 
7.2%
3 51
 
3.7%
9 49
 
3.6%
4 46
 
3.4%
8 44
 
3.2%
7 43
 
3.1%
Other values (8) 106
 
7.8%

Most occurring blocks

ValueCountFrequency (%)
ASCII 8015
97.5%
Hangul 207
 
2.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
e 721
 
9.0%
a 646
 
8.1%
i 558
 
7.0%
s 536
 
6.7%
n 527
 
6.6%
470
 
5.9%
t 468
 
5.8%
o 453
 
5.7%
l 451
 
5.6%
p 353
 
4.4%
Other values (56) 2832
35.3%
Hangul
ValueCountFrequency (%)
12
 
5.8%
11
 
5.3%
10
 
4.8%
10
 
4.8%
10
 
4.8%
9
 
4.3%
8
 
3.9%
8
 
3.9%
7
 
3.4%
7
 
3.4%
Other values (55) 115
55.6%
Distinct399
Distinct (%)98.8%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
2023-12-12T15:37:30.733393image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length20
Median length8
Mean length10.571782
Min length6

Characters and Unicode

Total characters4271
Distinct characters38
Distinct categories7 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique394 ?
Unique (%)97.5%

Sample

1st rowON263459
2nd rowON263452
3rd rowLC680888
4th rowMZ469923
5th rowMZ469924
ValueCountFrequency (%)
kacc 6
 
1.4%
kccm 4
 
1.0%
kctc15134bp 2
 
0.5%
kctc 2
 
0.5%
on041903 2
 
0.5%
on041814 2
 
0.5%
igem-0002705 2
 
0.5%
80380 2
 
0.5%
on041824 1
 
0.2%
on041854 1
 
0.2%
Other values (392) 392
94.2%
2023-12-12T15:37:31.161266image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 668
15.6%
1 447
10.5%
4 418
9.8%
2 398
9.3%
O 343
 
8.0%
N 318
 
7.4%
9 219
 
5.1%
3 214
 
5.0%
8 192
 
4.5%
6 183
 
4.3%
Other values (28) 871
20.4%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 3016
70.6%
Uppercase Letter 1052
 
24.6%
Dash Punctuation 91
 
2.1%
Lowercase Letter 72
 
1.7%
Connector Punctuation 27
 
0.6%
Space Separator 12
 
0.3%
Other Punctuation 1
 
< 0.1%

Most frequent character per category

Uppercase Letter
ValueCountFrequency (%)
O 343
32.6%
N 318
30.2%
C 76
 
7.2%
K 60
 
5.7%
P 51
 
4.8%
M 49
 
4.7%
B 45
 
4.3%
S 32
 
3.0%
R 28
 
2.7%
Z 12
 
1.1%
Other values (10) 38
 
3.6%
Decimal Number
ValueCountFrequency (%)
0 668
22.1%
1 447
14.8%
4 418
13.9%
2 398
13.2%
9 219
 
7.3%
3 214
 
7.1%
8 192
 
6.4%
6 183
 
6.1%
5 149
 
4.9%
7 128
 
4.2%
Lowercase Letter
ValueCountFrequency (%)
g 18
25.0%
e 18
25.0%
m 18
25.0%
i 18
25.0%
Dash Punctuation
ValueCountFrequency (%)
- 91
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 27
100.0%
Space Separator
ValueCountFrequency (%)
12
100.0%
Other Punctuation
ValueCountFrequency (%)
. 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 3147
73.7%
Latin 1124
 
26.3%

Most frequent character per script

Latin
ValueCountFrequency (%)
O 343
30.5%
N 318
28.3%
C 76
 
6.8%
K 60
 
5.3%
P 51
 
4.5%
M 49
 
4.4%
B 45
 
4.0%
S 32
 
2.8%
R 28
 
2.5%
g 18
 
1.6%
Other values (14) 104
 
9.3%
Common
ValueCountFrequency (%)
0 668
21.2%
1 447
14.2%
4 418
13.3%
2 398
12.6%
9 219
 
7.0%
3 214
 
6.8%
8 192
 
6.1%
6 183
 
5.8%
5 149
 
4.7%
7 128
 
4.1%
Other values (4) 131
 
4.2%

Most occurring blocks

ValueCountFrequency (%)
ASCII 4271
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 668
15.6%
1 447
10.5%
4 418
9.8%
2 398
9.3%
O 343
 
8.0%
N 318
 
7.4%
9 219
 
5.1%
3 214
 
5.0%
8 192
 
4.5%
6 183
 
4.3%
Other values (28) 871
20.4%

등록_기탁기관
Categorical

HIGH CORRELATION 

Distinct29
Distinct (%)7.2%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
NCBI
206 
GenBank
97 
국가생명연구자원정보센터
25 
미생물유전체정보자원관리시스템
 
10
한국미생물보존센터
 
9
Other values (24)
57 

Length

Max length51
Median length4
Mean length7.2376238
Min length4

Unique

Unique11 ?
Unique (%)2.7%

Sample

1st rowGenBank
2nd rowGenBank
3rd rowNCBI
4th rowNCBI
5th rowNCBI

Common Values

ValueCountFrequency (%)
NCBI 206
51.0%
GenBank 97
24.0%
국가생명연구자원정보센터 25
 
6.2%
미생물유전체정보자원관리시스템 10
 
2.5%
한국미생물보존센터 9
 
2.2%
한국생명공학연구원 생물자원센터 7
 
1.7%
농림축산식품 미생물유전체전략연구사업단 5
 
1.2%
한국미생물보존센터(KCCM) 5
 
1.2%
한국생명공학연구원 5
 
1.2%
국립농업과학원 5
 
1.2%
Other values (19) 30
 
7.4%

Length

2023-12-12T15:37:31.300654image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
ncbi 208
46.1%
genbank 99
22.0%
국가생명연구자원정보센터 25
 
5.5%
한국생명공학연구원 14
 
3.1%
미생물유전체정보자원관리시스템 10
 
2.2%
한국미생물보존센터 9
 
2.0%
생물자원센터 8
 
1.8%
for 6
 
1.3%
국립농업과학원 5
 
1.1%
한국미생물보존센터(kccm 5
 
1.1%
Other values (27) 62
 
13.7%

유형
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct6
Distinct (%)1.5%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
유전체정보
347 
미생물자원
48 
발현체정보
 
4
유전체자원
 
3
식물자원
 
1

Length

Max length5
Median length5
Mean length4.9950495
Min length4

Unique

Unique2 ?
Unique (%)0.5%

Sample

1st row유전체정보
2nd row유전체정보
3rd row미생물자원
4th row유전체정보
5th row유전체정보

Common Values

ValueCountFrequency (%)
유전체정보 347
85.9%
미생물자원 48
 
11.9%
발현체정보 4
 
1.0%
유전체자원 3
 
0.7%
식물자원 1
 
0.2%
동물자원 1
 
0.2%

Length

2023-12-12T15:37:31.418539image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T15:37:31.553755image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
유전체정보 347
85.9%
미생물자원 48
 
11.9%
발현체정보 4
 
1.0%
유전체자원 3
 
0.7%
식물자원 1
 
0.2%
동물자원 1
 
0.2%
Distinct60
Distinct (%)14.9%
Missing0
Missing (%)0.0%
Memory size3.3 KiB
Minimum2022-01-04 00:00:00
Maximum2022-12-22 00:00:00
2023-12-12T15:37:31.714060image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T15:37:31.910572image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

Correlations

2023-12-12T15:37:32.044845image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분야과제관리번호과제구분내역사업명과제명연구책임자주관기관기업유형등록_기탁기관유형생명자원 등록일
분야1.0001.0000.9920.9761.0001.0000.9920.6710.9350.7630.994
과제관리번호1.0001.0001.0001.0001.0001.0001.0001.0000.9940.9880.999
과제구분0.9921.0001.0001.0001.0001.0000.9930.9040.9610.9650.998
내역사업명0.9761.0001.0001.0001.0001.0000.9940.8980.9720.9370.996
과제명1.0001.0001.0001.0001.0001.0001.0001.0000.9940.9880.999
연구책임자1.0001.0001.0001.0001.0001.0001.0001.0000.9940.9880.999
주관기관0.9921.0000.9930.9941.0001.0001.0001.0000.9950.9700.998
기업유형0.6711.0000.9040.8981.0001.0001.0001.0000.9850.6750.999
등록_기탁기관0.9350.9940.9610.9720.9940.9940.9950.9851.0000.9430.995
유형0.7630.9880.9650.9370.9880.9880.9700.6750.9431.0001.000
생명자원 등록일0.9940.9990.9980.9960.9990.9990.9980.9990.9951.0001.000
2023-12-12T15:37:32.211707image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
과제구분분야과제명유형기업유형등록_기탁기관내역사업명주관기관연구책임자과제관리번호
과제구분1.0000.8610.9690.7270.5820.7430.9940.9220.9690.969
분야0.8611.0000.9620.3720.2980.7310.8960.9240.9620.962
과제명0.9690.9621.0000.8270.9620.8590.9750.9911.0001.000
유형0.7270.3720.8271.0000.3010.7500.7800.8300.8270.827
기업유형0.5820.2980.9620.3011.0000.8880.6900.9710.9620.962
등록_기탁기관0.7430.7310.8590.7500.8881.0000.7460.7640.8590.859
내역사업명0.9940.8960.9750.7800.6900.7461.0000.9180.9750.975
주관기관0.9220.9240.9910.8300.9710.7640.9181.0000.9910.991
연구책임자0.9690.9621.0000.8270.9620.8590.9750.9911.0001.000
과제관리번호0.9690.9621.0000.8270.9620.8590.9750.9911.0001.000
2023-12-12T15:37:32.370910image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분야과제관리번호과제구분내역사업명과제명연구책임자주관기관기업유형등록_기탁기관유형
분야1.0000.9620.8610.8960.9620.9620.9240.2980.7310.372
과제관리번호0.9621.0000.9690.9751.0001.0000.9910.9620.8590.827
과제구분0.8610.9691.0000.9940.9690.9690.9220.5820.7430.727
내역사업명0.8960.9750.9941.0000.9750.9750.9180.6900.7460.780
과제명0.9621.0000.9690.9751.0001.0000.9910.9620.8590.827
연구책임자0.9621.0000.9690.9751.0001.0000.9910.9620.8590.827
주관기관0.9240.9910.9220.9180.9910.9911.0000.9710.7640.830
기업유형0.2980.9620.5820.6900.9620.9620.9711.0000.8880.301
등록_기탁기관0.7310.8590.7430.7460.8590.8590.7640.8881.0000.750
유형0.3720.8270.7270.7800.8270.8270.8300.3010.7501.000

Missing values

2023-12-12T15:37:27.090893image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T15:37:27.351719image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

번호분야과제관리번호과제구분내역사업명과제명연구책임자주관기관기업유형생명정보_화합물명등록_기탁번호등록_기탁기관유형생명자원 등록일
0L2022-1수의321018-1가축질병대응기술개발동물의약품개발11. 지역적 돼지유행성설사 바이러스 유전학적 분석을 통한 예방 모델 개발이창희경상국립대학교 산학협력단대학GNU-1914ON263459GenBank유전체정보2022-04-20
1L2022-2수의321018-1가축질병대응기술개발동물의약품개발11. 지역적 돼지유행성설사 바이러스 유전학적 분석을 통한 예방 모델 개발이창희경상국립대학교 산학협력단대학GNU-2112ON263452GenBank유전체정보2022-04-20
2L2022-3농림식품 환경생태321001-3농식품기술융복합 창의인재 양성 사업교육훈련농작물 병해충 관리 및 검역 기술개발과 산업인력 양성이귀재전북대학교산학협력단대학Zucchini yellow mosaic virus-BS1 외피단백질LC680888NCBI미생물자원2022-02-02
3L2022-4농림식품 환경생태321001-3농식품기술융복합 창의인재 양성 사업교육훈련농작물 병해충 관리 및 검역 기술개발과 산업인력 양성이귀재전북대학교산학협력단대학SUB9926204 A86MZ469923NCBI유전체정보2022-09-22
4L2022-5농림식품 환경생태321001-3농식품기술융복합 창의인재 양성 사업교육훈련농작물 병해충 관리 및 검역 기술개발과 산업인력 양성이귀재전북대학교산학협력단대학SUB9926204 A77MZ469924NCBI유전체정보2022-09-22
5L2022-6농림식품 환경생태321001-3농식품기술융복합 창의인재 양성 사업교육훈련농작물 병해충 관리 및 검역 기술개발과 산업인력 양성이귀재전북대학교산학협력단대학Falcileptoneta sp22ON041813NCBI유전체정보2022-09-15
6L2022-7농림식품 환경생태321001-3농식품기술융복합 창의인재 양성 사업교육훈련농작물 병해충 관리 및 검역 기술개발과 산업인력 양성이귀재전북대학교산학협력단대학Falcileptoneta sp21ON041816NCBI유전체정보2022-09-15
7L2022-8농림식품 환경생태321001-3농식품기술융복합 창의인재 양성 사업교육훈련농작물 병해충 관리 및 검역 기술개발과 산업인력 양성이귀재전북대학교산학협력단대학Leptoneta chilbosanensisON041846NCBI유전체정보2022-09-15
8L2022-9농림식품 환경생태321001-3농식품기술융복합 창의인재 양성 사업교육훈련농작물 병해충 관리 및 검역 기술개발과 산업인력 양성이귀재전북대학교산학협력단대학Leptoneta namhensisON041848NCBI유전체정보2022-09-15
9L2022-10농림식품 환경생태321001-3농식품기술융복합 창의인재 양성 사업교육훈련농작물 병해충 관리 및 검역 기술개발과 산업인력 양성이귀재전북대학교산학협력단대학Longileptoneta jangseongensisON041912NCBI유전체정보2022-09-15
번호분야과제관리번호과제구분내역사업명과제명연구책임자주관기관기업유형생명정보_화합물명등록_기탁번호등록_기탁기관유형생명자원 등록일
394L2022-395농림식품 환경생태320043-5작물 바이러스 및 병해충 대응 산업화 기술개발방제기술개발병해충 예찰 방법 개선을 위한 거점대학 육성최인영전북대학교산학협력단대학Erysiphe magnoliicolaOM535823GenBank유전체정보2022-02-12
395L2022-396농림식품 환경생태320043-5작물 바이러스 및 병해충 대응 산업화 기술개발방제기술개발병해충 예찰 방법 개선을 위한 거점대학 육성최인영전북대학교산학협력단대학Phyllactinia sp.ON231591GenBank유전체정보2022-06-08
396L2022-397농림식품 환경생태320043-5작물 바이러스 및 병해충 대응 산업화 기술개발방제기술개발병해충 예찰 방법 개선을 위한 거점대학 육성최인영전북대학교산학협력단대학Phyllactinia sp.ON231593GenBank유전체정보2022-06-07
397L2022-398농림식품 환경생태320043-5작물 바이러스 및 병해충 대응 산업화 기술개발방제기술개발병해충 예찰 방법 개선을 위한 거점대학 육성최인영전북대학교산학협력단대학Podosphaera elsholtziaeOP108419GenBank유전체정보2022-08-05
398L2022-399식품321036-5고부가가치식품기술개발미래대응식품 기술개발마이크로바이옴 타겟 포스트바이오틱스 발굴 및 소재화 기술 개발김경헌고려대학교산학협력단대학Lactobacillus plantarum D2-3KCTC15134BP생물자원센터미생물자원2022-10-13
399L2022-400농림식품 환경생태321057-5핵심농자재국산화기술개발작물보호제 원제·제품 국산화생장조정제 대체 미생물농약, 생화학농약 제품화 연구단김평일재단법인 농축산용미생물산업육성지원센터기타Cedecea lapagei CWL-11KCTC15159BP한국생명공학연구원 생물자원센터미생물자원2022-10-28
400L2022-401농림식품 환경생태321110-4작물 바이러스 및 병해충 대응 산업화 기술개발내역사업명없음16. 미생물 기반 유해 토양선충 방제 제반기술 개발 및 실증 연구손광희한국생명공학연구원정부출연기관AN170004KBRS20221107_0000015국가생명연구자원정보센터유전체정보2022-11-07
401L2022-402농림식품 환경생태321110-4작물 바이러스 및 병해충 대응 산업화 기술개발내역사업명없음16. 미생물 기반 유해 토양선충 방제 제반기술 개발 및 실증 연구손광희한국생명공학연구원정부출연기관AN180008KBRS20221107_0000035국가생명연구자원정보센터유전체정보2022-11-07
402L2022-403농산316087-4농생명산업기술개발생명자원 생산·관리기술박과작물 육종지원을 위한 내병성 유전자마커 개발 및 적용 연구황성빈세종대학교산학협력단대학pGEM-T_WMV CP_YP215-1BP1915913한국생명공학연구원유전체자원2022-12-13
403L2022-404농산316087-4농생명산업기술개발생명자원 생산·관리기술박과작물 육종지원을 위한 내병성 유전자마커 개발 및 적용 연구황성빈세종대학교산학협력단대학pGEM-T_ZYMV CP_YG211-2BP1915914한국생명공학연구원유전체자원2022-12-13