Overview

Dataset statistics

Number of variables13
Number of observations274
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory28.5 KiB
Average record size in memory106.5 B

Variable types

Numeric2
Categorical7
DateTime2
Text2

Dataset

Description본 데이터는 2018년부터 2023년 11월까지 해당 과제의 성과로 등록된 생명정보(등록/기탁번호, 명칭, 등록/기탁기관, 과제시작일, 과제종료일 등)를 제공합니다.
Author한국환경산업기술원
URLhttps://www.data.go.kr/data/15087553/fileData.do

Alerts

연구기관 is highly overall correlated with 성과년도 and 6 other fieldsHigh correlation
성과구분 is highly overall correlated with 순번 and 6 other fieldsHigh correlation
연구책임자 is highly overall correlated with 성과년도 and 6 other fieldsHigh correlation
사업명 is highly overall correlated with 순번 and 7 other fieldsHigh correlation
연구과제명 is highly overall correlated with 성과년도 and 6 other fieldsHigh correlation
등록(기탁)기관 is highly overall correlated with 성과년도 and 6 other fieldsHigh correlation
연구기관유형 is highly overall correlated with 순번 and 6 other fieldsHigh correlation
순번 is highly overall correlated with 사업명 and 2 other fieldsHigh correlation
성과년도 is highly overall correlated with 사업명 and 4 other fieldsHigh correlation
연구과제명 is highly imbalanced (50.7%)Imbalance
연구기관 is highly imbalanced (51.8%)Imbalance
연구책임자 is highly imbalanced (50.7%)Imbalance
순번 has unique valuesUnique
등록(기탁)번호 has unique valuesUnique

Reproduction

Analysis started2023-12-12 20:23:40.346142
Analysis finished2023-12-12 20:23:41.481895
Duration1.14 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

순번
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct274
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean137.5
Minimum1
Maximum274
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size2.5 KiB
2023-12-13T05:23:41.551649image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile14.65
Q169.25
median137.5
Q3205.75
95-th percentile260.35
Maximum274
Range273
Interquartile range (IQR)136.5

Descriptive statistics

Standard deviation79.241193
Coefficient of variation (CV)0.57629959
Kurtosis-1.2
Mean137.5
Median Absolute Deviation (MAD)68.5
Skewness0
Sum37675
Variance6279.1667
MonotonicityStrictly increasing
2023-12-13T05:23:41.676338image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
0.4%
182 1
 
0.4%
188 1
 
0.4%
187 1
 
0.4%
186 1
 
0.4%
185 1
 
0.4%
184 1
 
0.4%
183 1
 
0.4%
181 1
 
0.4%
207 1
 
0.4%
Other values (264) 264
96.4%
ValueCountFrequency (%)
1 1
0.4%
2 1
0.4%
3 1
0.4%
4 1
0.4%
5 1
0.4%
6 1
0.4%
7 1
0.4%
8 1
0.4%
9 1
0.4%
10 1
0.4%
ValueCountFrequency (%)
274 1
0.4%
273 1
0.4%
272 1
0.4%
271 1
0.4%
270 1
0.4%
269 1
0.4%
268 1
0.4%
267 1
0.4%
266 1
0.4%
265 1
0.4%

사업명
Categorical

HIGH CORRELATION 

Distinct12
Distinct (%)4.4%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
야생생물 유래 친환경 신소재 및 공정 기술개발사업
168 
환경정책기반공공기술개발사업
36 
생태모방 기반 환경오염관리 기술개발사업
30 
수생태계 건강성 확보 기술개발사업
 
11
다부처 국가생명연구자원 선진화 사업
 
10
Other values (7)
19 

Length

Max length27
Median length27
Mean length23.343066
Min length12

Unique

Unique2 ?
Unique (%)0.7%

Sample

1st row다부처 국가생명연구자원 선진화 사업
2nd row다부처 국가생명연구자원 선진화 사업
3rd row다부처 국가생명연구자원 선진화 사업
4th row다부처 국가생명연구자원 선진화 사업
5th row다부처 국가생명연구자원 선진화 사업

Common Values

ValueCountFrequency (%)
야생생물 유래 친환경 신소재 및 공정 기술개발사업 168
61.3%
환경정책기반공공기술개발사업 36
 
13.1%
생태모방 기반 환경오염관리 기술개발사업 30
 
10.9%
수생태계 건강성 확보 기술개발사업 11
 
4.0%
다부처 국가생명연구자원 선진화 사업 10
 
3.6%
환경성질환 예방관리 핵심 기술개발사업 6
 
2.2%
표토보전관리기술개발사업 4
 
1.5%
생활화학제품 안전관리 기술개발사업 3
 
1.1%
생물다양성 위협 외래생물 관리 기술개발사업 2
 
0.7%
생활공감 환경보건기술개발사업 2
 
0.7%
Other values (2) 2
 
0.7%

Length

2023-12-13T05:23:41.799792image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
기술개발사업 221
15.0%
야생생물 168
11.4%
친환경 168
11.4%
신소재 168
11.4%
168
11.4%
공정 168
11.4%
유래 168
11.4%
환경정책기반공공기술개발사업 36
 
2.4%
생태모방 30
 
2.0%
기반 30
 
2.0%
Other values (24) 148
10.0%

연구과제명
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct23
Distinct (%)8.4%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
토착 담수미생물의 High-throughput screening 및 유전자 편집기술에 의한 화장품용 천연색소 개발
168 
멸종위기종 모니터링 및 지능형 객체 인식 기술 개발
36 
중금속 오염환경에서 미세조류 및 미생물의 군집형태를 모사한 수질정화 시스템 개발
23 
미생물 다차원 오믹스 기반 수생태계 건강성 평가기술 및 통합 플랫폼 개발
 
8
담수 생물소재의 오믹스 빅데이터 확보
 
6
Other values (18)
33 

Length

Max length63
Median length63
Mean length51.708029
Min length16

Unique

Unique9 ?
Unique (%)3.3%

Sample

1st row담수 미세조류 계통분류 및 유용정보 확보
2nd row담수 미세조류 계통분류 및 유용정보 확보
3rd row담수 생물소재의 오믹스 빅데이터 확보
4th row담수 생물소재의 오믹스 빅데이터 확보
5th row담수 생물소재의 오믹스 빅데이터 확보

Common Values

ValueCountFrequency (%)
토착 담수미생물의 High-throughput screening 및 유전자 편집기술에 의한 화장품용 천연색소 개발 168
61.3%
멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 36
 
13.1%
중금속 오염환경에서 미세조류 및 미생물의 군집형태를 모사한 수질정화 시스템 개발 23
 
8.4%
미생물 다차원 오믹스 기반 수생태계 건강성 평가기술 및 통합 플랫폼 개발 8
 
2.9%
담수 생물소재의 오믹스 빅데이터 확보 6
 
2.2%
환경보건취약지역에서 오믹스 프로파일링 및 건강 영향 분석 기술개발 5
 
1.8%
생태모방 기술을 이용한 미생물 담지필터 기반 실내 대기오염물질 저감화기술 개발 4
 
1.5%
균류-할로이사이트 복합 계층 구조에 기반한 고도 수처리용 필터 시스템 개발 3
 
1.1%
환경 내 항생물질 내성 발생 파악 및 국가 감시체계 구축 기술 개발 2
 
0.7%
살조제(algicide) 내 글루타르알데하이드 대체물질 개발 2
 
0.7%
Other values (13) 17
 
6.2%

Length

2023-12-13T05:23:41.927523image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
개발 256
 
9.3%
253
 
9.2%
의한 168
 
6.1%
담수미생물의 168
 
6.1%
천연색소 168
 
6.1%
화장품용 168
 
6.1%
토착 168
 
6.1%
편집기술에 168
 
6.1%
유전자 168
 
6.1%
screening 168
 
6.1%
Other values (126) 903
32.8%

연구기관
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct16
Distinct (%)5.8%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
한국생명공학연구원
177 
상명대학교 산학협력단
37 
전북대학교 산학협력단
23 
국립낙동강생물자원관
 
10
강원대학교 산학협력단
 
5
Other values (11)
22 

Length

Max length13
Median length9
Mean length9.5912409
Min length7

Unique

Unique5 ?
Unique (%)1.8%

Sample

1st row국립낙동강생물자원관
2nd row국립낙동강생물자원관
3rd row국립낙동강생물자원관
4th row국립낙동강생물자원관
5th row국립낙동강생물자원관

Common Values

ValueCountFrequency (%)
한국생명공학연구원 177
64.6%
상명대학교 산학협력단 37
 
13.5%
전북대학교 산학협력단 23
 
8.4%
국립낙동강생물자원관 10
 
3.6%
강원대학교 산학협력단 5
 
1.8%
한국원자력연구원 4
 
1.5%
한국지질자원연구원 4
 
1.5%
경상국립대학교 산학협력단 3
 
1.1%
중앙대학교 산학협력단 2
 
0.7%
주식회사 큐얼스 2
 
0.7%
Other values (6) 7
 
2.6%

Length

2023-12-13T05:23:42.040791image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
한국생명공학연구원 177
50.6%
산학협력단 73
20.9%
상명대학교 37
 
10.6%
전북대학교 23
 
6.6%
국립낙동강생물자원관 10
 
2.9%
강원대학교 5
 
1.4%
한국원자력연구원 4
 
1.1%
한국지질자원연구원 4
 
1.1%
경상국립대학교 3
 
0.9%
주식회사 3
 
0.9%
Other values (8) 11
 
3.1%

연구기관유형
Categorical

HIGH CORRELATION 

Distinct5
Distinct (%)1.8%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
정부출연연구기관
186 
대학
73 
기타공공기관
 
10
중소기업
 
3
벤처기업
 
2

Length

Max length8
Median length8
Mean length6.2554745
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row기타공공기관
2nd row기타공공기관
3rd row기타공공기관
4th row기타공공기관
5th row기타공공기관

Common Values

ValueCountFrequency (%)
정부출연연구기관 186
67.9%
대학 73
 
26.6%
기타공공기관 10
 
3.6%
중소기업 3
 
1.1%
벤처기업 2
 
0.7%

Length

2023-12-13T05:23:42.152208image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T05:23:42.274592image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
정부출연연구기관 186
67.9%
대학 73
 
26.6%
기타공공기관 10
 
3.6%
중소기업 3
 
1.1%
벤처기업 2
 
0.7%

연구책임자
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct23
Distinct (%)8.4%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
이형관
168 
김창배
36 
김대근
23 
안치용
 
8
유정남
 
6
Other values (18)
33 

Length

Max length3
Median length3
Mean length2.9927007
Min length2

Unique

Unique9 ?
Unique (%)3.3%

Sample

1st row이창수
2nd row이창수
3rd row유정남
4th row유정남
5th row유정남

Common Values

ValueCountFrequency (%)
이형관 168
61.3%
김창배 36
 
13.1%
김대근 23
 
8.4%
안치용 8
 
2.9%
유정남 6
 
2.2%
김우진 5
 
1.8%
정일래 4
 
1.5%
신승구 3
 
1.1%
차창준 2
 
0.7%
조훈 2
 
0.7%
Other values (13) 17
 
6.2%

Length

2023-12-13T05:23:42.392650image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
이형관 168
61.3%
김창배 36
 
13.1%
김대근 23
 
8.4%
안치용 8
 
2.9%
유정남 6
 
2.2%
김우진 5
 
1.8%
정일래 4
 
1.5%
신승구 3
 
1.1%
김민석 2
 
0.7%
조명현 2
 
0.7%
Other values (13) 17
 
6.2%
Distinct8
Distinct (%)2.9%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
Minimum2016-05-27 00:00:00
Maximum2022-04-01 00:00:00
2023-12-13T05:23:42.486664image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T05:23:42.615087image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=8)
Distinct7
Distinct (%)2.6%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
Minimum2018-12-31 00:00:00
Maximum2027-12-31 00:00:00
2023-12-13T05:23:42.736365image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T05:23:42.833107image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=7)

성과년도
Real number (ℝ)

HIGH CORRELATION 

Distinct6
Distinct (%)2.2%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2021.6058
Minimum2018
Maximum2023
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size2.5 KiB
2023-12-13T05:23:42.920420image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2018
5-th percentile2019
Q12022
median2022
Q32022
95-th percentile2022
Maximum2023
Range5
Interquartile range (IQR)0

Descriptive statistics

Standard deviation0.9404049
Coefficient of variation (CV)0.00046517718
Kurtosis3.0630367
Mean2021.6058
Median Absolute Deviation (MAD)0
Skewness-1.9332824
Sum553920
Variance0.88436138
MonotonicityNot monotonic
2023-12-13T05:23:43.010026image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=6)
ValueCountFrequency (%)
2022 202
73.7%
2021 33
 
12.0%
2019 22
 
8.0%
2023 9
 
3.3%
2020 7
 
2.6%
2018 1
 
0.4%
ValueCountFrequency (%)
2018 1
 
0.4%
2019 22
 
8.0%
2020 7
 
2.6%
2021 33
 
12.0%
2022 202
73.7%
2023 9
 
3.3%
ValueCountFrequency (%)
2023 9
 
3.3%
2022 202
73.7%
2021 33
 
12.0%
2020 7
 
2.6%
2019 22
 
8.0%
2018 1
 
0.4%

성과구분
Categorical

HIGH CORRELATION 

Distinct3
Distinct (%)1.1%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
생물자원
213 
생명정보
58 
화합물
 
3

Length

Max length4
Median length4
Mean length3.9890511
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row생명정보
2nd row생명정보
3rd row생명정보
4th row생명정보
5th row생명정보

Common Values

ValueCountFrequency (%)
생물자원 213
77.7%
생명정보 58
 
21.2%
화합물 3
 
1.1%

Length

2023-12-13T05:23:43.105958image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T05:23:43.188660image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
생물자원 213
77.7%
생명정보 58
 
21.2%
화합물 3
 
1.1%

명칭
Text

Distinct272
Distinct (%)99.3%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
2023-12-13T05:23:43.371631image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length94
Median length78
Mean length33.79927
Min length3

Characters and Unicode

Total characters9261
Distinct characters149
Distinct categories11 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique271 ?
Unique (%)98.9%

Sample

1st row담수 미세조류 유용생명정보 생산 데이터
2nd row담수 미세조류의 기초 유용성 정보
3rd row전사체
4th row대사체
5th row전장유전체
ValueCountFrequency (%)
flavobacterium 27
 
2.6%
gene 23
 
2.2%
cds 22
 
2.1%
partial 22
 
2.1%
mitochondrial 22
 
2.1%
sp 22
 
2.1%
cytochrome 19
 
1.8%
mucilaginibacter 18
 
1.7%
b 15
 
1.4%
cytb 15
 
1.4%
Other values (528) 834
80.3%
2023-12-13T05:23:43.711156image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
766
 
8.3%
a 687
 
7.4%
i 633
 
6.8%
o 562
 
6.1%
e 530
 
5.7%
c 477
 
5.2%
r 452
 
4.9%
s 434
 
4.7%
t 378
 
4.1%
n 351
 
3.8%
Other values (139) 3991
43.1%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 6547
70.7%
Uppercase Letter 935
 
10.1%
Space Separator 766
 
8.3%
Decimal Number 617
 
6.7%
Other Letter 199
 
2.1%
Other Punctuation 96
 
1.0%
Dash Punctuation 41
 
0.4%
Close Punctuation 26
 
0.3%
Open Punctuation 25
 
0.3%
Control 8
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
11
 
5.5%
10
 
5.0%
9
 
4.5%
7
 
3.5%
7
 
3.5%
7
 
3.5%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
Other values (71) 126
63.3%
Lowercase Letter
ValueCountFrequency (%)
a 687
10.5%
i 633
 
9.7%
o 562
 
8.6%
e 530
 
8.1%
c 477
 
7.3%
r 452
 
6.9%
s 434
 
6.6%
t 378
 
5.8%
n 351
 
5.4%
u 346
 
5.3%
Other values (16) 1697
25.9%
Uppercase Letter
ValueCountFrequency (%)
S 212
22.7%
U 180
19.3%
N 179
19.1%
C 59
 
6.3%
M 48
 
5.1%
F 33
 
3.5%
P 30
 
3.2%
B 30
 
3.2%
T 29
 
3.1%
J 20
 
2.1%
Other values (13) 115
12.3%
Decimal Number
ValueCountFrequency (%)
1 136
22.0%
0 136
22.0%
2 92
14.9%
3 48
 
7.8%
9 39
 
6.3%
4 38
 
6.2%
6 36
 
5.8%
7 34
 
5.5%
5 30
 
4.9%
8 28
 
4.5%
Other Punctuation
ValueCountFrequency (%)
. 44
45.8%
, 30
31.2%
; 22
22.9%
Space Separator
ValueCountFrequency (%)
766
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 41
100.0%
Close Punctuation
ValueCountFrequency (%)
) 26
100.0%
Open Punctuation
ValueCountFrequency (%)
( 25
100.0%
Control
ValueCountFrequency (%)
8
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 7482
80.8%
Common 1580
 
17.1%
Hangul 199
 
2.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
11
 
5.5%
10
 
5.0%
9
 
4.5%
7
 
3.5%
7
 
3.5%
7
 
3.5%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
Other values (71) 126
63.3%
Latin
ValueCountFrequency (%)
a 687
 
9.2%
i 633
 
8.5%
o 562
 
7.5%
e 530
 
7.1%
c 477
 
6.4%
r 452
 
6.0%
s 434
 
5.8%
t 378
 
5.1%
n 351
 
4.7%
u 346
 
4.6%
Other values (39) 2632
35.2%
Common
ValueCountFrequency (%)
766
48.5%
1 136
 
8.6%
0 136
 
8.6%
2 92
 
5.8%
3 48
 
3.0%
. 44
 
2.8%
- 41
 
2.6%
9 39
 
2.5%
4 38
 
2.4%
6 36
 
2.3%
Other values (9) 204
 
12.9%

Most occurring blocks

ValueCountFrequency (%)
ASCII 9062
97.9%
Hangul 199
 
2.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
766
 
8.5%
a 687
 
7.6%
i 633
 
7.0%
o 562
 
6.2%
e 530
 
5.8%
c 477
 
5.3%
r 452
 
5.0%
s 434
 
4.8%
t 378
 
4.2%
n 351
 
3.9%
Other values (58) 3792
41.8%
Hangul
ValueCountFrequency (%)
11
 
5.5%
10
 
5.0%
9
 
4.5%
7
 
3.5%
7
 
3.5%
7
 
3.5%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
Other values (71) 126
63.3%
Distinct274
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
2023-12-13T05:23:43.898613image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length41
Median length11
Mean length11.062044
Min length3

Characters and Unicode

Total characters3031
Distinct characters34
Distinct categories7 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique274 ?
Unique (%)100.0%

Sample

1st rowFBCC-AU73 등 76건
2nd rowFBCC-AU1 ~ FBCC-AU72
3rd rowFBCC-BT7 등 7건
4th rowFBCC-PM11 등 11건
5th rowFBCC-BG16 등 16건
ValueCountFrequency (%)
9
 
3.0%
kctc 3
 
1.0%
kacc 2
 
0.7%
fbcc-b11767 1
 
0.3%
fbcc-b11788 1
 
0.3%
fbcc-b11787 1
 
0.3%
fbcc-b11664 1
 
0.3%
fbcc-b11786 1
 
0.3%
fbcc-b11769 1
 
0.3%
fbcc-b11757 1
 
0.3%
Other values (278) 278
93.0%
2023-12-13T05:23:44.452170image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1 458
15.1%
B 398
13.1%
C 394
13.0%
- 186
 
6.1%
0 182
 
6.0%
F 180
 
5.9%
6 165
 
5.4%
8 162
 
5.3%
7 152
 
5.0%
2 133
 
4.4%
Other values (24) 621
20.5%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 1593
52.6%
Uppercase Letter 1192
39.3%
Dash Punctuation 186
 
6.1%
Space Separator 26
 
0.9%
Other Letter 18
 
0.6%
Connector Punctuation 10
 
0.3%
Math Symbol 6
 
0.2%

Most frequent character per category

Uppercase Letter
ValueCountFrequency (%)
B 398
33.4%
C 394
33.1%
F 180
15.1%
M 41
 
3.4%
P 40
 
3.4%
T 29
 
2.4%
K 27
 
2.3%
N 23
 
1.9%
R 14
 
1.2%
S 13
 
1.1%
Other values (8) 33
 
2.8%
Decimal Number
ValueCountFrequency (%)
1 458
28.8%
0 182
 
11.4%
6 165
 
10.4%
8 162
 
10.2%
7 152
 
9.5%
2 133
 
8.3%
5 110
 
6.9%
9 102
 
6.4%
4 69
 
4.3%
3 60
 
3.8%
Other Letter
ValueCountFrequency (%)
9
50.0%
9
50.0%
Dash Punctuation
ValueCountFrequency (%)
- 186
100.0%
Space Separator
ValueCountFrequency (%)
26
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 10
100.0%
Math Symbol
ValueCountFrequency (%)
~ 6
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 1821
60.1%
Latin 1192
39.3%
Hangul 18
 
0.6%

Most frequent character per script

Latin
ValueCountFrequency (%)
B 398
33.4%
C 394
33.1%
F 180
15.1%
M 41
 
3.4%
P 40
 
3.4%
T 29
 
2.4%
K 27
 
2.3%
N 23
 
1.9%
R 14
 
1.2%
S 13
 
1.1%
Other values (8) 33
 
2.8%
Common
ValueCountFrequency (%)
1 458
25.2%
- 186
10.2%
0 182
 
10.0%
6 165
 
9.1%
8 162
 
8.9%
7 152
 
8.3%
2 133
 
7.3%
5 110
 
6.0%
9 102
 
5.6%
4 69
 
3.8%
Other values (4) 102
 
5.6%
Hangul
ValueCountFrequency (%)
9
50.0%
9
50.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 3013
99.4%
Hangul 18
 
0.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1 458
15.2%
B 398
13.2%
C 394
13.1%
- 186
 
6.2%
0 182
 
6.0%
F 180
 
6.0%
6 165
 
5.5%
8 162
 
5.4%
7 152
 
5.0%
2 133
 
4.4%
Other values (22) 603
20.0%
Hangul
ValueCountFrequency (%)
9
50.0%
9
50.0%

등록(기탁)기관
Categorical

HIGH CORRELATION 

Distinct9
Distinct (%)3.3%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
국립낙동강생물자원관
179 
미국 국립생물공학정보센터
36 
한국생명공학연구원
23 
전북대학교 산학협력단
23 
Belgian Co-ordinated Collections of Micro-organism
 
4
Other values (4)
 
9

Length

Max length50
Median length10
Mean length11.273723
Min length5

Unique

Unique1 ?
Unique (%)0.4%

Sample

1st row국립낙동강생물자원관
2nd row국립낙동강생물자원관
3rd row국립낙동강생물자원관
4th row국립낙동강생물자원관
5th row국립낙동강생물자원관

Common Values

ValueCountFrequency (%)
국립낙동강생물자원관 179
65.3%
미국 국립생물공학정보센터 36
 
13.1%
한국생명공학연구원 23
 
8.4%
전북대학교 산학협력단 23
 
8.4%
Belgian Co-ordinated Collections of Micro-organism 4
 
1.5%
한국화학연구원 3
 
1.1%
National Center for Biotechnology Information 3
 
1.1%
농촌진흥청 2
 
0.7%
대구대학교 1
 
0.4%

Length

2023-12-13T05:23:44.582032image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T05:23:44.679237image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
국립낙동강생물자원관 179
49.6%
국립생물공학정보센터 36
 
10.0%
미국 36
 
10.0%
한국생명공학연구원 23
 
6.4%
전북대학교 23
 
6.4%
산학협력단 23
 
6.4%
collections 4
 
1.1%
micro-organism 4
 
1.1%
of 4
 
1.1%
co-ordinated 4
 
1.1%
Other values (9) 25
 
6.9%

Interactions

2023-12-13T05:23:41.111417image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T05:23:40.968585image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T05:23:41.176745image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T05:23:41.043818image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T05:23:44.770245image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
순번사업명연구과제명연구기관연구기관유형연구책임자과제시작일과제종료일성과년도성과구분등록(기탁)기관
순번1.0000.8100.8310.8010.8450.8310.7600.6860.8900.7210.745
사업명0.8101.0001.0000.9840.9491.0000.9930.9510.8101.0000.958
연구과제명0.8311.0001.0001.0001.0001.0001.0001.0000.8830.9920.985
연구기관0.8010.9841.0001.0001.0001.0000.9960.9670.9170.9790.963
연구기관유형0.8450.9491.0001.0001.0001.0000.8470.7140.7880.6990.766
연구책임자0.8311.0001.0001.0001.0001.0001.0001.0000.8830.9920.985
과제시작일0.7600.9931.0000.9960.8471.0001.0000.8980.7270.7190.898
과제종료일0.6860.9511.0000.9670.7141.0000.8981.0000.5900.8050.798
성과년도0.8900.8100.8830.9170.7880.8830.7270.5901.0000.5270.778
성과구분0.7211.0000.9920.9790.6990.9920.7190.8050.5271.0000.995
등록(기탁)기관0.7450.9580.9850.9630.7660.9850.8980.7980.7780.9951.000
2023-12-13T05:23:44.898760image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연구기관성과구분연구책임자사업명연구과제명등록(기탁)기관연구기관유형
연구기관1.0000.9430.9860.8810.9860.8370.979
성과구분0.9431.0000.9470.9630.9470.9020.679
연구책임자0.9860.9471.0000.9791.0000.8930.966
사업명0.8810.9630.9791.0000.9790.8200.876
연구과제명0.9860.9471.0000.9791.0000.8930.966
등록(기탁)기관0.8370.9020.8930.8200.8931.0000.575
연구기관유형0.9790.6790.9660.8760.9660.5751.000
2023-12-13T05:23:44.997037image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
순번성과년도사업명연구과제명연구기관연구기관유형연구책임자성과구분등록(기탁)기관
순번1.000-0.2210.5120.4810.4690.5050.4810.5760.459
성과년도-0.2211.0000.7010.7330.7130.4980.7330.4600.530
사업명0.5120.7011.0000.9790.8810.8760.9790.9630.820
연구과제명0.4810.7330.9791.0000.9860.9661.0000.9470.893
연구기관0.4690.7130.8810.9861.0000.9790.9860.9430.837
연구기관유형0.5050.4980.8760.9660.9791.0000.9660.6790.575
연구책임자0.4810.7330.9791.0000.9860.9661.0000.9470.893
성과구분0.5760.4600.9630.9470.9430.6790.9471.0000.902
등록(기탁)기관0.4590.5300.8200.8930.8370.5750.8930.9021.000

Missing values

2023-12-13T05:23:41.283499image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T05:23:41.423858image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

순번사업명연구과제명연구기관연구기관유형연구책임자과제시작일과제종료일성과년도성과구분명칭등록(기탁)번호등록(기탁)기관
01다부처 국가생명연구자원 선진화 사업담수 미세조류 계통분류 및 유용정보 확보국립낙동강생물자원관기타공공기관이창수2021-04-012026-12-312022생명정보담수 미세조류 유용생명정보 생산 데이터FBCC-AU73 등 76건국립낙동강생물자원관
12다부처 국가생명연구자원 선진화 사업담수 미세조류 계통분류 및 유용정보 확보국립낙동강생물자원관기타공공기관이창수2021-04-012026-12-312021생명정보담수 미세조류의 기초 유용성 정보FBCC-AU1 ~ FBCC-AU72국립낙동강생물자원관
23다부처 국가생명연구자원 선진화 사업담수 생물소재의 오믹스 빅데이터 확보국립낙동강생물자원관기타공공기관유정남2021-04-012026-12-312022생명정보전사체FBCC-BT7 등 7건국립낙동강생물자원관
34다부처 국가생명연구자원 선진화 사업담수 생물소재의 오믹스 빅데이터 확보국립낙동강생물자원관기타공공기관유정남2021-04-012026-12-312022생명정보대사체FBCC-PM11 등 11건국립낙동강생물자원관
45다부처 국가생명연구자원 선진화 사업담수 생물소재의 오믹스 빅데이터 확보국립낙동강생물자원관기타공공기관유정남2021-04-012026-12-312022생명정보전장유전체FBCC-BG16 등 16건국립낙동강생물자원관
56다부처 국가생명연구자원 선진화 사업담수 생물소재 기능성 정보 구축국립낙동강생물자원관기타공공기관이미화2021-04-012026-12-312021생명정보담수 생물소재 기능성 정보 9000건 기탁FBCC-BU1 등 9000건국립낙동강생물자원관
67다부처 국가생명연구자원 선진화 사업담수생물자원은행 활용기반 구축국립낙동강생물자원관기타공공기관류시현2021-04-012026-12-312022생명정보유전자원FBCC-GR1 등 500건국립낙동강생물자원관
78다부처 국가생명연구자원 선진화 사업담수 생물소재의 오믹스 빅데이터 확보국립낙동강생물자원관기타공공기관유정남2021-04-012026-12-312021생명정보담수생물자원은행FBCC-BG1 등 72건국립낙동강생물자원관
89다부처 국가생명연구자원 선진화 사업담수 생물소재의 오믹스 빅데이터 확보국립낙동강생물자원관기타공공기관유정남2021-04-012026-12-312022생명정보유전자마커FBCC-PS2 등 2건국립낙동강생물자원관
910다부처 국가생명연구자원 선진화 사업담수 생물소재의 오믹스 빅데이터 확보국립낙동강생물자원관기타공공기관유정남2021-04-012026-12-312022생명정보유용유전자 및 유전자바코드FBCC-BN41 등 55건국립낙동강생물자원관
순번사업명연구과제명연구기관연구기관유형연구책임자과제시작일과제종료일성과년도성과구분명칭등록(기탁)번호등록(기탁)기관
264265환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312019생명정보Cacatua ducorpsii cytochorome b (CYTB) gene, partial cds; mitochondrial.MN736980미국 국립생물공학정보센터
265266환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312019생명정보Cacatua alba cytochrome oxidase subunit 1 (COI) gene, partial cds; mitochondrial.MN736985미국 국립생물공학정보센터
266267환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312019생명정보Trichoglossus haematodus microsatellite sequence TH-10MN685681미국 국립생물공학정보센터
267268환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312019생명정보Trichoglossus haematodus microsatellite sequence TH-08MN685679미국 국립생물공학정보센터
268269환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312019생명정보Trichoglossus haematodus microsatellite sequence TH-03MN685674미국 국립생물공학정보센터
269270환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312019생명정보Trichoglossus haematodus microsatellite sequence TH-02MN685673미국 국립생물공학정보센터
270271환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312021생명정보Cacatua galerita mitochondrion, complete genome.MT920476미국 국립생물공학정보센터
271272환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312021생명정보Cacatia goffiniana mitochondrion, complete genome.MT920477미국 국립생물공학정보센터
272273환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312021생명정보Ara macao voucher SMUp016 cytochrome b (cytb) gene, partial cds; mitochondrialMT275992미국 국립생물공학정보센터
273274환경정책기반공공기술개발사업멸종위기종 모니터링 및 지능형 객체 인식 기술 개발상명대학교 산학협력단대학김창배2018-07-062020-12-312021생명정보Ara chloropterus voucher SMUp014 cytochrome b (cytb) gene, partial cds; mitochondrialMT275990미국 국립생물공학정보센터