Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 274 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 28.5 KiB |
Average record size in memory | 106.5 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 7 |
DateTime | 2 |
Text | 2 |
Dataset
Description | 본 데이터는 2018년부터 2023년 11월까지 해당 과제의 성과로 등록된 생명정보(등록/기탁번호, 명칭, 등록/기탁기관, 과제시작일, 과제종료일 등)를 제공합니다. |
---|---|
Author | 한국환경산업기술원 |
URL | https://www.data.go.kr/data/15087553/fileData.do |
연구기관 is highly overall correlated with 성과년도 and 6 other fields | High correlation |
성과구분 is highly overall correlated with 순번 and 6 other fields | High correlation |
연구책임자 is highly overall correlated with 성과년도 and 6 other fields | High correlation |
사업명 is highly overall correlated with 순번 and 7 other fields | High correlation |
연구과제명 is highly overall correlated with 성과년도 and 6 other fields | High correlation |
등록(기탁)기관 is highly overall correlated with 성과년도 and 6 other fields | High correlation |
연구기관유형 is highly overall correlated with 순번 and 6 other fields | High correlation |
순번 is highly overall correlated with 사업명 and 2 other fields | High correlation |
성과년도 is highly overall correlated with 사업명 and 4 other fields | High correlation |
연구과제명 is highly imbalanced (50.7%) | Imbalance |
연구기관 is highly imbalanced (51.8%) | Imbalance |
연구책임자 is highly imbalanced (50.7%) | Imbalance |
순번 has unique values | Unique |
등록(기탁)번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 20:23:40.346142 |
---|---|
Analysis finished | 2023-12-12 20:23:41.481895 |
Duration | 1.14 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 274 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 137.5 |
Minimum | 1 |
---|---|
Maximum | 274 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 14.65 |
Q1 | 69.25 |
median | 137.5 |
Q3 | 205.75 |
95-th percentile | 260.35 |
Maximum | 274 |
Range | 273 |
Interquartile range (IQR) | 136.5 |
Descriptive statistics
Standard deviation | 79.241193 |
---|---|
Coefficient of variation (CV) | 0.57629959 |
Kurtosis | -1.2 |
Mean | 137.5 |
Median Absolute Deviation (MAD) | 68.5 |
Skewness | 0 |
Sum | 37675 |
Variance | 6279.1667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.4% |
182 | 1 | 0.4% |
188 | 1 | 0.4% |
187 | 1 | 0.4% |
186 | 1 | 0.4% |
185 | 1 | 0.4% |
184 | 1 | 0.4% |
183 | 1 | 0.4% |
181 | 1 | 0.4% |
207 | 1 | 0.4% |
Other values (264) | 264 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
274 | 1 | |
273 | 1 | |
272 | 1 | |
271 | 1 | |
270 | 1 | |
269 | 1 | |
268 | 1 | |
267 | 1 | |
266 | 1 | |
265 | 1 |
사업명
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 4.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
야생생물 유래 친환경 신소재 및 공정 기술개발사업 | |
---|---|
환경정책기반공공기술개발사업 | |
생태모방 기반 환경오염관리 기술개발사업 | |
수생태계 건강성 확보 기술개발사업 | 11 |
다부처 국가생명연구자원 선진화 사업 | 10 |
Other values (7) |
Length
Max length | 27 |
---|---|
Median length | 27 |
Mean length | 23.343066 |
Min length | 12 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.7% |
Sample
1st row | 다부처 국가생명연구자원 선진화 사업 |
---|---|
2nd row | 다부처 국가생명연구자원 선진화 사업 |
3rd row | 다부처 국가생명연구자원 선진화 사업 |
4th row | 다부처 국가생명연구자원 선진화 사업 |
5th row | 다부처 국가생명연구자원 선진화 사업 |
Common Values
Value | Count | Frequency (%) |
야생생물 유래 친환경 신소재 및 공정 기술개발사업 | 168 | |
환경정책기반공공기술개발사업 | 36 | 13.1% |
생태모방 기반 환경오염관리 기술개발사업 | 30 | 10.9% |
수생태계 건강성 확보 기술개발사업 | 11 | 4.0% |
다부처 국가생명연구자원 선진화 사업 | 10 | 3.6% |
환경성질환 예방관리 핵심 기술개발사업 | 6 | 2.2% |
표토보전관리기술개발사업 | 4 | 1.5% |
생활화학제품 안전관리 기술개발사업 | 3 | 1.1% |
생물다양성 위협 외래생물 관리 기술개발사업 | 2 | 0.7% |
생활공감 환경보건기술개발사업 | 2 | 0.7% |
Other values (2) | 2 | 0.7% |
Length
Value | Count | Frequency (%) |
기술개발사업 | 221 | |
야생생물 | 168 | |
친환경 | 168 | |
신소재 | 168 | |
및 | 168 | |
공정 | 168 | |
유래 | 168 | |
환경정책기반공공기술개발사업 | 36 | 2.4% |
생태모방 | 30 | 2.0% |
기반 | 30 | 2.0% |
Other values (24) | 148 |
연구과제명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 23 |
---|---|
Distinct (%) | 8.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
토착 담수미생물의 High-throughput screening 및 유전자 편집기술에 의한 화장품용 천연색소 개발 | |
---|---|
멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | |
중금속 오염환경에서 미세조류 및 미생물의 군집형태를 모사한 수질정화 시스템 개발 | |
미생물 다차원 오믹스 기반 수생태계 건강성 평가기술 및 통합 플랫폼 개발 | 8 |
담수 생물소재의 오믹스 빅데이터 확보 | 6 |
Other values (18) |
Length
Max length | 63 |
---|---|
Median length | 63 |
Mean length | 51.708029 |
Min length | 16 |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 3.3% |
Sample
1st row | 담수 미세조류 계통분류 및 유용정보 확보 |
---|---|
2nd row | 담수 미세조류 계통분류 및 유용정보 확보 |
3rd row | 담수 생물소재의 오믹스 빅데이터 확보 |
4th row | 담수 생물소재의 오믹스 빅데이터 확보 |
5th row | 담수 생물소재의 오믹스 빅데이터 확보 |
Common Values
Value | Count | Frequency (%) |
토착 담수미생물의 High-throughput screening 및 유전자 편집기술에 의한 화장품용 천연색소 개발 | 168 | |
멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 36 | 13.1% |
중금속 오염환경에서 미세조류 및 미생물의 군집형태를 모사한 수질정화 시스템 개발 | 23 | 8.4% |
미생물 다차원 오믹스 기반 수생태계 건강성 평가기술 및 통합 플랫폼 개발 | 8 | 2.9% |
담수 생물소재의 오믹스 빅데이터 확보 | 6 | 2.2% |
환경보건취약지역에서 오믹스 프로파일링 및 건강 영향 분석 기술개발 | 5 | 1.8% |
생태모방 기술을 이용한 미생물 담지필터 기반 실내 대기오염물질 저감화기술 개발 | 4 | 1.5% |
균류-할로이사이트 복합 계층 구조에 기반한 고도 수처리용 필터 시스템 개발 | 3 | 1.1% |
환경 내 항생물질 내성 발생 파악 및 국가 감시체계 구축 기술 개발 | 2 | 0.7% |
살조제(algicide) 내 글루타르알데하이드 대체물질 개발 | 2 | 0.7% |
Other values (13) | 17 | 6.2% |
Length
Value | Count | Frequency (%) |
개발 | 256 | 9.3% |
및 | 253 | 9.2% |
의한 | 168 | 6.1% |
담수미생물의 | 168 | 6.1% |
천연색소 | 168 | 6.1% |
화장품용 | 168 | 6.1% |
토착 | 168 | 6.1% |
편집기술에 | 168 | 6.1% |
유전자 | 168 | 6.1% |
screening | 168 | 6.1% |
Other values (126) | 903 |
연구기관
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 16 |
---|---|
Distinct (%) | 5.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
한국생명공학연구원 | |
---|---|
상명대학교 산학협력단 | |
전북대학교 산학협력단 | |
국립낙동강생물자원관 | 10 |
강원대학교 산학협력단 | 5 |
Other values (11) |
Length
Max length | 13 |
---|---|
Median length | 9 |
Mean length | 9.5912409 |
Min length | 7 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 1.8% |
Sample
1st row | 국립낙동강생물자원관 |
---|---|
2nd row | 국립낙동강생물자원관 |
3rd row | 국립낙동강생물자원관 |
4th row | 국립낙동강생물자원관 |
5th row | 국립낙동강생물자원관 |
Common Values
Value | Count | Frequency (%) |
한국생명공학연구원 | 177 | |
상명대학교 산학협력단 | 37 | 13.5% |
전북대학교 산학협력단 | 23 | 8.4% |
국립낙동강생물자원관 | 10 | 3.6% |
강원대학교 산학협력단 | 5 | 1.8% |
한국원자력연구원 | 4 | 1.5% |
한국지질자원연구원 | 4 | 1.5% |
경상국립대학교 산학협력단 | 3 | 1.1% |
중앙대학교 산학협력단 | 2 | 0.7% |
주식회사 큐얼스 | 2 | 0.7% |
Other values (6) | 7 | 2.6% |
Length
Value | Count | Frequency (%) |
한국생명공학연구원 | 177 | |
산학협력단 | 73 | |
상명대학교 | 37 | 10.6% |
전북대학교 | 23 | 6.6% |
국립낙동강생물자원관 | 10 | 2.9% |
강원대학교 | 5 | 1.4% |
한국원자력연구원 | 4 | 1.1% |
한국지질자원연구원 | 4 | 1.1% |
경상국립대학교 | 3 | 0.9% |
주식회사 | 3 | 0.9% |
Other values (8) | 11 | 3.1% |
연구기관유형
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
정부출연연구기관 | |
---|---|
대학 | |
기타공공기관 | 10 |
중소기업 | 3 |
벤처기업 | 2 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 6.2554745 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기타공공기관 |
---|---|
2nd row | 기타공공기관 |
3rd row | 기타공공기관 |
4th row | 기타공공기관 |
5th row | 기타공공기관 |
Common Values
Value | Count | Frequency (%) |
정부출연연구기관 | 186 | |
대학 | 73 | 26.6% |
기타공공기관 | 10 | 3.6% |
중소기업 | 3 | 1.1% |
벤처기업 | 2 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정부출연연구기관 | 186 | |
대학 | 73 | 26.6% |
기타공공기관 | 10 | 3.6% |
중소기업 | 3 | 1.1% |
벤처기업 | 2 | 0.7% |
연구책임자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 23 |
---|---|
Distinct (%) | 8.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
이형관 | |
---|---|
김창배 | |
김대근 | |
안치용 | 8 |
유정남 | 6 |
Other values (18) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.9927007 |
Min length | 2 |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 3.3% |
Sample
1st row | 이창수 |
---|---|
2nd row | 이창수 |
3rd row | 유정남 |
4th row | 유정남 |
5th row | 유정남 |
Common Values
Value | Count | Frequency (%) |
이형관 | 168 | |
김창배 | 36 | 13.1% |
김대근 | 23 | 8.4% |
안치용 | 8 | 2.9% |
유정남 | 6 | 2.2% |
김우진 | 5 | 1.8% |
정일래 | 4 | 1.5% |
신승구 | 3 | 1.1% |
차창준 | 2 | 0.7% |
조훈 | 2 | 0.7% |
Other values (13) | 17 | 6.2% |
Length
Value | Count | Frequency (%) |
이형관 | 168 | |
김창배 | 36 | 13.1% |
김대근 | 23 | 8.4% |
안치용 | 8 | 2.9% |
유정남 | 6 | 2.2% |
김우진 | 5 | 1.8% |
정일래 | 4 | 1.5% |
신승구 | 3 | 1.1% |
김민석 | 2 | 0.7% |
조명현 | 2 | 0.7% |
Other values (13) | 17 | 6.2% |
과제시작일
Date
Distinct | 8 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Minimum | 2016-05-27 00:00:00 |
---|---|
Maximum | 2022-04-01 00:00:00 |
과제종료일
Date
Distinct | 7 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Minimum | 2018-12-31 00:00:00 |
---|---|
Maximum | 2027-12-31 00:00:00 |
성과년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2021.6058 |
Minimum | 2018 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.5 KiB |
Quantile statistics
Minimum | 2018 |
---|---|
5-th percentile | 2019 |
Q1 | 2022 |
median | 2022 |
Q3 | 2022 |
95-th percentile | 2022 |
Maximum | 2023 |
Range | 5 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.9404049 |
---|---|
Coefficient of variation (CV) | 0.00046517718 |
Kurtosis | 3.0630367 |
Mean | 2021.6058 |
Median Absolute Deviation (MAD) | 0 |
Skewness | -1.9332824 |
Sum | 553920 |
Variance | 0.88436138 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2022 | 202 | |
2021 | 33 | 12.0% |
2019 | 22 | 8.0% |
2023 | 9 | 3.3% |
2020 | 7 | 2.6% |
2018 | 1 | 0.4% |
Value | Count | Frequency (%) |
2018 | 1 | 0.4% |
2019 | 22 | 8.0% |
2020 | 7 | 2.6% |
2021 | 33 | 12.0% |
2022 | 202 | |
2023 | 9 | 3.3% |
Value | Count | Frequency (%) |
2023 | 9 | 3.3% |
2022 | 202 | |
2021 | 33 | 12.0% |
2020 | 7 | 2.6% |
2019 | 22 | 8.0% |
2018 | 1 | 0.4% |
성과구분
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
생물자원 | |
---|---|
생명정보 | |
화합물 | 3 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9890511 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 생명정보 |
---|---|
2nd row | 생명정보 |
3rd row | 생명정보 |
4th row | 생명정보 |
5th row | 생명정보 |
Common Values
Value | Count | Frequency (%) |
생물자원 | 213 | |
생명정보 | 58 | 21.2% |
화합물 | 3 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
생물자원 | 213 | |
생명정보 | 58 | 21.2% |
화합물 | 3 | 1.1% |
명칭
Text
Distinct | 272 |
---|---|
Distinct (%) | 99.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Length
Max length | 94 |
---|---|
Median length | 78 |
Mean length | 33.79927 |
Min length | 3 |
Characters and Unicode
Total characters | 9261 |
---|---|
Distinct characters | 149 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 271 ? |
---|---|
Unique (%) | 98.9% |
Sample
1st row | 담수 미세조류 유용생명정보 생산 데이터 |
---|---|
2nd row | 담수 미세조류의 기초 유용성 정보 |
3rd row | 전사체 |
4th row | 대사체 |
5th row | 전장유전체 |
Value | Count | Frequency (%) |
flavobacterium | 27 | 2.6% |
gene | 23 | 2.2% |
cds | 22 | 2.1% |
partial | 22 | 2.1% |
mitochondrial | 22 | 2.1% |
sp | 22 | 2.1% |
cytochrome | 19 | 1.8% |
mucilaginibacter | 18 | 1.7% |
b | 15 | 1.4% |
cytb | 15 | 1.4% |
Other values (528) | 834 |
Most occurring characters
Value | Count | Frequency (%) |
766 | 8.3% | |
a | 687 | 7.4% |
i | 633 | 6.8% |
o | 562 | 6.1% |
e | 530 | 5.7% |
c | 477 | 5.2% |
r | 452 | 4.9% |
s | 434 | 4.7% |
t | 378 | 4.1% |
n | 351 | 3.8% |
Other values (139) | 3991 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 6547 | |
Uppercase Letter | 935 | 10.1% |
Space Separator | 766 | 8.3% |
Decimal Number | 617 | 6.7% |
Other Letter | 199 | 2.1% |
Other Punctuation | 96 | 1.0% |
Dash Punctuation | 41 | 0.4% |
Close Punctuation | 26 | 0.3% |
Open Punctuation | 25 | 0.3% |
Control | 8 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
유 | 11 | 5.5% |
이 | 10 | 5.0% |
전 | 9 | 4.5% |
체 | 7 | 3.5% |
데 | 7 | 3.5% |
터 | 7 | 3.5% |
성 | 6 | 3.0% |
보 | 6 | 3.0% |
물 | 5 | 2.5% |
자 | 5 | 2.5% |
Other values (71) | 126 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 687 | |
i | 633 | 9.7% |
o | 562 | 8.6% |
e | 530 | 8.1% |
c | 477 | 7.3% |
r | 452 | 6.9% |
s | 434 | 6.6% |
t | 378 | 5.8% |
n | 351 | 5.4% |
u | 346 | 5.3% |
Other values (16) | 1697 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 212 | |
U | 180 | |
N | 179 | |
C | 59 | 6.3% |
M | 48 | 5.1% |
F | 33 | 3.5% |
P | 30 | 3.2% |
B | 30 | 3.2% |
T | 29 | 3.1% |
J | 20 | 2.1% |
Other values (13) | 115 |
Decimal Number
Value | Count | Frequency (%) |
1 | 136 | |
0 | 136 | |
2 | 92 | |
3 | 48 | 7.8% |
9 | 39 | 6.3% |
4 | 38 | 6.2% |
6 | 36 | 5.8% |
7 | 34 | 5.5% |
5 | 30 | 4.9% |
8 | 28 | 4.5% |
Other Punctuation
Value | Count | Frequency (%) |
. | 44 | |
, | 30 | |
; | 22 |
Space Separator
Value | Count | Frequency (%) |
766 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 41 |
Close Punctuation
Value | Count | Frequency (%) |
) | 26 |
Open Punctuation
Value | Count | Frequency (%) |
( | 25 |
Control
Value | Count | Frequency (%) |
8 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 7482 | |
Common | 1580 | 17.1% |
Hangul | 199 | 2.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
유 | 11 | 5.5% |
이 | 10 | 5.0% |
전 | 9 | 4.5% |
체 | 7 | 3.5% |
데 | 7 | 3.5% |
터 | 7 | 3.5% |
성 | 6 | 3.0% |
보 | 6 | 3.0% |
물 | 5 | 2.5% |
자 | 5 | 2.5% |
Other values (71) | 126 |
Latin
Value | Count | Frequency (%) |
a | 687 | 9.2% |
i | 633 | 8.5% |
o | 562 | 7.5% |
e | 530 | 7.1% |
c | 477 | 6.4% |
r | 452 | 6.0% |
s | 434 | 5.8% |
t | 378 | 5.1% |
n | 351 | 4.7% |
u | 346 | 4.6% |
Other values (39) | 2632 |
Common
Value | Count | Frequency (%) |
766 | ||
1 | 136 | 8.6% |
0 | 136 | 8.6% |
2 | 92 | 5.8% |
3 | 48 | 3.0% |
. | 44 | 2.8% |
- | 41 | 2.6% |
9 | 39 | 2.5% |
4 | 38 | 2.4% |
6 | 36 | 2.3% |
Other values (9) | 204 | 12.9% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 9062 | |
Hangul | 199 | 2.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
766 | 8.5% | |
a | 687 | 7.6% |
i | 633 | 7.0% |
o | 562 | 6.2% |
e | 530 | 5.8% |
c | 477 | 5.3% |
r | 452 | 5.0% |
s | 434 | 4.8% |
t | 378 | 4.2% |
n | 351 | 3.9% |
Other values (58) | 3792 |
Hangul
Value | Count | Frequency (%) |
유 | 11 | 5.5% |
이 | 10 | 5.0% |
전 | 9 | 4.5% |
체 | 7 | 3.5% |
데 | 7 | 3.5% |
터 | 7 | 3.5% |
성 | 6 | 3.0% |
보 | 6 | 3.0% |
물 | 5 | 2.5% |
자 | 5 | 2.5% |
Other values (71) | 126 |
등록(기탁)번호
Text
UNIQUE
 
Distinct | 274 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Length
Max length | 41 |
---|---|
Median length | 11 |
Mean length | 11.062044 |
Min length | 3 |
Characters and Unicode
Total characters | 3031 |
---|---|
Distinct characters | 34 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 274 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | FBCC-AU73 등 76건 |
---|---|
2nd row | FBCC-AU1 ~ FBCC-AU72 |
3rd row | FBCC-BT7 등 7건 |
4th row | FBCC-PM11 등 11건 |
5th row | FBCC-BG16 등 16건 |
Value | Count | Frequency (%) |
등 | 9 | 3.0% |
kctc | 3 | 1.0% |
kacc | 2 | 0.7% |
fbcc-b11767 | 1 | 0.3% |
fbcc-b11788 | 1 | 0.3% |
fbcc-b11787 | 1 | 0.3% |
fbcc-b11664 | 1 | 0.3% |
fbcc-b11786 | 1 | 0.3% |
fbcc-b11769 | 1 | 0.3% |
fbcc-b11757 | 1 | 0.3% |
Other values (278) | 278 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 458 | |
B | 398 | |
C | 394 | |
- | 186 | 6.1% |
0 | 182 | 6.0% |
F | 180 | 5.9% |
6 | 165 | 5.4% |
8 | 162 | 5.3% |
7 | 152 | 5.0% |
2 | 133 | 4.4% |
Other values (24) | 621 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1593 | |
Uppercase Letter | 1192 | |
Dash Punctuation | 186 | 6.1% |
Space Separator | 26 | 0.9% |
Other Letter | 18 | 0.6% |
Connector Punctuation | 10 | 0.3% |
Math Symbol | 6 | 0.2% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
B | 398 | |
C | 394 | |
F | 180 | |
M | 41 | 3.4% |
P | 40 | 3.4% |
T | 29 | 2.4% |
K | 27 | 2.3% |
N | 23 | 1.9% |
R | 14 | 1.2% |
S | 13 | 1.1% |
Other values (8) | 33 | 2.8% |
Decimal Number
Value | Count | Frequency (%) |
1 | 458 | |
0 | 182 | 11.4% |
6 | 165 | 10.4% |
8 | 162 | 10.2% |
7 | 152 | 9.5% |
2 | 133 | 8.3% |
5 | 110 | 6.9% |
9 | 102 | 6.4% |
4 | 69 | 4.3% |
3 | 60 | 3.8% |
Other Letter
Value | Count | Frequency (%) |
건 | 9 | |
등 | 9 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 186 |
Space Separator
Value | Count | Frequency (%) |
26 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 10 |
Math Symbol
Value | Count | Frequency (%) |
~ | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1821 | |
Latin | 1192 | |
Hangul | 18 | 0.6% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
B | 398 | |
C | 394 | |
F | 180 | |
M | 41 | 3.4% |
P | 40 | 3.4% |
T | 29 | 2.4% |
K | 27 | 2.3% |
N | 23 | 1.9% |
R | 14 | 1.2% |
S | 13 | 1.1% |
Other values (8) | 33 | 2.8% |
Common
Value | Count | Frequency (%) |
1 | 458 | |
- | 186 | |
0 | 182 | 10.0% |
6 | 165 | 9.1% |
8 | 162 | 8.9% |
7 | 152 | 8.3% |
2 | 133 | 7.3% |
5 | 110 | 6.0% |
9 | 102 | 5.6% |
4 | 69 | 3.8% |
Other values (4) | 102 | 5.6% |
Hangul
Value | Count | Frequency (%) |
건 | 9 | |
등 | 9 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 3013 | |
Hangul | 18 | 0.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 458 | |
B | 398 | |
C | 394 | |
- | 186 | 6.2% |
0 | 182 | 6.0% |
F | 180 | 6.0% |
6 | 165 | 5.5% |
8 | 162 | 5.4% |
7 | 152 | 5.0% |
2 | 133 | 4.4% |
Other values (22) | 603 |
Hangul
Value | Count | Frequency (%) |
건 | 9 | |
등 | 9 |
등록(기탁)기관
Categorical
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
국립낙동강생물자원관 | |
---|---|
미국 국립생물공학정보센터 | |
한국생명공학연구원 | |
전북대학교 산학협력단 | |
Belgian Co-ordinated Collections of Micro-organism | 4 |
Other values (4) | 9 |
Length
Max length | 50 |
---|---|
Median length | 10 |
Mean length | 11.273723 |
Min length | 5 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | 국립낙동강생물자원관 |
---|---|
2nd row | 국립낙동강생물자원관 |
3rd row | 국립낙동강생물자원관 |
4th row | 국립낙동강생물자원관 |
5th row | 국립낙동강생물자원관 |
Common Values
Value | Count | Frequency (%) |
국립낙동강생물자원관 | 179 | |
미국 국립생물공학정보센터 | 36 | 13.1% |
한국생명공학연구원 | 23 | 8.4% |
전북대학교 산학협력단 | 23 | 8.4% |
Belgian Co-ordinated Collections of Micro-organism | 4 | 1.5% |
한국화학연구원 | 3 | 1.1% |
National Center for Biotechnology Information | 3 | 1.1% |
농촌진흥청 | 2 | 0.7% |
대구대학교 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국립낙동강생물자원관 | 179 | |
국립생물공학정보센터 | 36 | 10.0% |
미국 | 36 | 10.0% |
한국생명공학연구원 | 23 | 6.4% |
전북대학교 | 23 | 6.4% |
산학협력단 | 23 | 6.4% |
collections | 4 | 1.1% |
micro-organism | 4 | 1.1% |
of | 4 | 1.1% |
co-ordinated | 4 | 1.1% |
Other values (9) | 25 | 6.9% |
순번 | 사업명 | 연구과제명 | 연구기관 | 연구기관유형 | 연구책임자 | 과제시작일 | 과제종료일 | 성과년도 | 성과구분 | 등록(기탁)기관 | |
---|---|---|---|---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.810 | 0.831 | 0.801 | 0.845 | 0.831 | 0.760 | 0.686 | 0.890 | 0.721 | 0.745 |
사업명 | 0.810 | 1.000 | 1.000 | 0.984 | 0.949 | 1.000 | 0.993 | 0.951 | 0.810 | 1.000 | 0.958 |
연구과제명 | 0.831 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.883 | 0.992 | 0.985 |
연구기관 | 0.801 | 0.984 | 1.000 | 1.000 | 1.000 | 1.000 | 0.996 | 0.967 | 0.917 | 0.979 | 0.963 |
연구기관유형 | 0.845 | 0.949 | 1.000 | 1.000 | 1.000 | 1.000 | 0.847 | 0.714 | 0.788 | 0.699 | 0.766 |
연구책임자 | 0.831 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.883 | 0.992 | 0.985 |
과제시작일 | 0.760 | 0.993 | 1.000 | 0.996 | 0.847 | 1.000 | 1.000 | 0.898 | 0.727 | 0.719 | 0.898 |
과제종료일 | 0.686 | 0.951 | 1.000 | 0.967 | 0.714 | 1.000 | 0.898 | 1.000 | 0.590 | 0.805 | 0.798 |
성과년도 | 0.890 | 0.810 | 0.883 | 0.917 | 0.788 | 0.883 | 0.727 | 0.590 | 1.000 | 0.527 | 0.778 |
성과구분 | 0.721 | 1.000 | 0.992 | 0.979 | 0.699 | 0.992 | 0.719 | 0.805 | 0.527 | 1.000 | 0.995 |
등록(기탁)기관 | 0.745 | 0.958 | 0.985 | 0.963 | 0.766 | 0.985 | 0.898 | 0.798 | 0.778 | 0.995 | 1.000 |
연구기관 | 성과구분 | 연구책임자 | 사업명 | 연구과제명 | 등록(기탁)기관 | 연구기관유형 | |
---|---|---|---|---|---|---|---|
연구기관 | 1.000 | 0.943 | 0.986 | 0.881 | 0.986 | 0.837 | 0.979 |
성과구분 | 0.943 | 1.000 | 0.947 | 0.963 | 0.947 | 0.902 | 0.679 |
연구책임자 | 0.986 | 0.947 | 1.000 | 0.979 | 1.000 | 0.893 | 0.966 |
사업명 | 0.881 | 0.963 | 0.979 | 1.000 | 0.979 | 0.820 | 0.876 |
연구과제명 | 0.986 | 0.947 | 1.000 | 0.979 | 1.000 | 0.893 | 0.966 |
등록(기탁)기관 | 0.837 | 0.902 | 0.893 | 0.820 | 0.893 | 1.000 | 0.575 |
연구기관유형 | 0.979 | 0.679 | 0.966 | 0.876 | 0.966 | 0.575 | 1.000 |
순번 | 성과년도 | 사업명 | 연구과제명 | 연구기관 | 연구기관유형 | 연구책임자 | 성과구분 | 등록(기탁)기관 | |
---|---|---|---|---|---|---|---|---|---|
순번 | 1.000 | -0.221 | 0.512 | 0.481 | 0.469 | 0.505 | 0.481 | 0.576 | 0.459 |
성과년도 | -0.221 | 1.000 | 0.701 | 0.733 | 0.713 | 0.498 | 0.733 | 0.460 | 0.530 |
사업명 | 0.512 | 0.701 | 1.000 | 0.979 | 0.881 | 0.876 | 0.979 | 0.963 | 0.820 |
연구과제명 | 0.481 | 0.733 | 0.979 | 1.000 | 0.986 | 0.966 | 1.000 | 0.947 | 0.893 |
연구기관 | 0.469 | 0.713 | 0.881 | 0.986 | 1.000 | 0.979 | 0.986 | 0.943 | 0.837 |
연구기관유형 | 0.505 | 0.498 | 0.876 | 0.966 | 0.979 | 1.000 | 0.966 | 0.679 | 0.575 |
연구책임자 | 0.481 | 0.733 | 0.979 | 1.000 | 0.986 | 0.966 | 1.000 | 0.947 | 0.893 |
성과구분 | 0.576 | 0.460 | 0.963 | 0.947 | 0.943 | 0.679 | 0.947 | 1.000 | 0.902 |
등록(기탁)기관 | 0.459 | 0.530 | 0.820 | 0.893 | 0.837 | 0.575 | 0.893 | 0.902 | 1.000 |
순번 | 사업명 | 연구과제명 | 연구기관 | 연구기관유형 | 연구책임자 | 과제시작일 | 과제종료일 | 성과년도 | 성과구분 | 명칭 | 등록(기탁)번호 | 등록(기탁)기관 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 다부처 국가생명연구자원 선진화 사업 | 담수 미세조류 계통분류 및 유용정보 확보 | 국립낙동강생물자원관 | 기타공공기관 | 이창수 | 2021-04-01 | 2026-12-31 | 2022 | 생명정보 | 담수 미세조류 유용생명정보 생산 데이터 | FBCC-AU73 등 76건 | 국립낙동강생물자원관 |
1 | 2 | 다부처 국가생명연구자원 선진화 사업 | 담수 미세조류 계통분류 및 유용정보 확보 | 국립낙동강생물자원관 | 기타공공기관 | 이창수 | 2021-04-01 | 2026-12-31 | 2021 | 생명정보 | 담수 미세조류의 기초 유용성 정보 | FBCC-AU1 ~ FBCC-AU72 | 국립낙동강생물자원관 |
2 | 3 | 다부처 국가생명연구자원 선진화 사업 | 담수 생물소재의 오믹스 빅데이터 확보 | 국립낙동강생물자원관 | 기타공공기관 | 유정남 | 2021-04-01 | 2026-12-31 | 2022 | 생명정보 | 전사체 | FBCC-BT7 등 7건 | 국립낙동강생물자원관 |
3 | 4 | 다부처 국가생명연구자원 선진화 사업 | 담수 생물소재의 오믹스 빅데이터 확보 | 국립낙동강생물자원관 | 기타공공기관 | 유정남 | 2021-04-01 | 2026-12-31 | 2022 | 생명정보 | 대사체 | FBCC-PM11 등 11건 | 국립낙동강생물자원관 |
4 | 5 | 다부처 국가생명연구자원 선진화 사업 | 담수 생물소재의 오믹스 빅데이터 확보 | 국립낙동강생물자원관 | 기타공공기관 | 유정남 | 2021-04-01 | 2026-12-31 | 2022 | 생명정보 | 전장유전체 | FBCC-BG16 등 16건 | 국립낙동강생물자원관 |
5 | 6 | 다부처 국가생명연구자원 선진화 사업 | 담수 생물소재 기능성 정보 구축 | 국립낙동강생물자원관 | 기타공공기관 | 이미화 | 2021-04-01 | 2026-12-31 | 2021 | 생명정보 | 담수 생물소재 기능성 정보 9000건 기탁 | FBCC-BU1 등 9000건 | 국립낙동강생물자원관 |
6 | 7 | 다부처 국가생명연구자원 선진화 사업 | 담수생물자원은행 활용기반 구축 | 국립낙동강생물자원관 | 기타공공기관 | 류시현 | 2021-04-01 | 2026-12-31 | 2022 | 생명정보 | 유전자원 | FBCC-GR1 등 500건 | 국립낙동강생물자원관 |
7 | 8 | 다부처 국가생명연구자원 선진화 사업 | 담수 생물소재의 오믹스 빅데이터 확보 | 국립낙동강생물자원관 | 기타공공기관 | 유정남 | 2021-04-01 | 2026-12-31 | 2021 | 생명정보 | 담수생물자원은행 | FBCC-BG1 등 72건 | 국립낙동강생물자원관 |
8 | 9 | 다부처 국가생명연구자원 선진화 사업 | 담수 생물소재의 오믹스 빅데이터 확보 | 국립낙동강생물자원관 | 기타공공기관 | 유정남 | 2021-04-01 | 2026-12-31 | 2022 | 생명정보 | 유전자마커 | FBCC-PS2 등 2건 | 국립낙동강생물자원관 |
9 | 10 | 다부처 국가생명연구자원 선진화 사업 | 담수 생물소재의 오믹스 빅데이터 확보 | 국립낙동강생물자원관 | 기타공공기관 | 유정남 | 2021-04-01 | 2026-12-31 | 2022 | 생명정보 | 유용유전자 및 유전자바코드 | FBCC-BN41 등 55건 | 국립낙동강생물자원관 |
순번 | 사업명 | 연구과제명 | 연구기관 | 연구기관유형 | 연구책임자 | 과제시작일 | 과제종료일 | 성과년도 | 성과구분 | 명칭 | 등록(기탁)번호 | 등록(기탁)기관 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
264 | 265 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2019 | 생명정보 | Cacatua ducorpsii cytochorome b (CYTB) gene, partial cds; mitochondrial. | MN736980 | 미국 국립생물공학정보센터 |
265 | 266 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2019 | 생명정보 | Cacatua alba cytochrome oxidase subunit 1 (COI) gene, partial cds; mitochondrial. | MN736985 | 미국 국립생물공학정보센터 |
266 | 267 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2019 | 생명정보 | Trichoglossus haematodus microsatellite sequence TH-10 | MN685681 | 미국 국립생물공학정보센터 |
267 | 268 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2019 | 생명정보 | Trichoglossus haematodus microsatellite sequence TH-08 | MN685679 | 미국 국립생물공학정보센터 |
268 | 269 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2019 | 생명정보 | Trichoglossus haematodus microsatellite sequence TH-03 | MN685674 | 미국 국립생물공학정보센터 |
269 | 270 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2019 | 생명정보 | Trichoglossus haematodus microsatellite sequence TH-02 | MN685673 | 미국 국립생물공학정보센터 |
270 | 271 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2021 | 생명정보 | Cacatua galerita mitochondrion, complete genome. | MT920476 | 미국 국립생물공학정보센터 |
271 | 272 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2021 | 생명정보 | Cacatia goffiniana mitochondrion, complete genome. | MT920477 | 미국 국립생물공학정보센터 |
272 | 273 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2021 | 생명정보 | Ara macao voucher SMUp016 cytochrome b (cytb) gene, partial cds; mitochondrial | MT275992 | 미국 국립생물공학정보센터 |
273 | 274 | 환경정책기반공공기술개발사업 | 멸종위기종 모니터링 및 지능형 객체 인식 기술 개발 | 상명대학교 산학협력단 | 대학 | 김창배 | 2018-07-06 | 2020-12-31 | 2021 | 생명정보 | Ara chloropterus voucher SMUp014 cytochrome b (cytb) gene, partial cds; mitochondrial | MT275990 | 미국 국립생물공학정보센터 |