Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 1025 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 36 |
Duplicate rows (%) | 3.5% |
Total size in memory | 32.2 KiB |
Average record size in memory | 32.1 B |
Variable types
Text | 2 |
---|---|
DateTime | 1 |
Categorical | 1 |
Dataset
Description | 농림식품기술기획평가원_농림수산식품 바이오 R&D 출원특허 정보 특허명, 출원/등록인, 출원/등록일, 출원/등록국가 등 관련 항목 포함 |
---|---|
Author | 농림식품기술기획평가원 |
URL | https://www.data.go.kr/data/15053203/fileData.do |
Dataset has 36 (3.5%) duplicate rows | Duplicates |
출원등록국가 is highly imbalanced (84.0%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 02:21:38.760222 |
---|---|
Analysis finished | 2023-12-12 02:21:39.411800 |
Duration | 0.65 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
특허명
Text
Distinct | 912 |
---|---|
Distinct (%) | 89.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.1 KiB |
Length
Max length | 253 |
---|---|
Median length | 101 |
Mean length | 41.021463 |
Min length | 3 |
Characters and Unicode
Total characters | 42047 |
---|---|
Distinct characters | 719 |
Distinct categories | 11 ? |
Distinct scripts | 5 ? |
Distinct blocks | 5 ? |
Unique
Unique | 829 ? |
---|---|
Unique (%) | 80.9% |
Sample
1st row | 섬기린초에서 분리된 화합물을 유효성분으로 함유하는 천연 항균제 |
---|---|
2nd row | 신규한 돼지 인플루엔자 바이러스 A H1N1 및 그의 용도 |
3rd row | 울금 추출물, 및 스테비아 추출물 또는 스테비오사이드의 혼합물을 유효성분으로 포함하는 흰점 증후군 바이러스에 대한 내성 증강용 사료 첨가제 조성물 및 이를 포함하는 사료 조성물 |
4th row | 트라우스토키트리드 미세조류의 형질전환체 |
5th row | 어성초 추출물을 유효성분으로 포함하는 지방간 예방 또는 치료용 조성물 |
Value | Count | Frequency (%) |
및 | 619 | 6.5% |
조성물 | 290 | 3.0% |
이용한 | 193 | 2.0% |
포함하는 | 174 | 1.8% |
방법 | 142 | 1.5% |
제조방법 | 142 | 1.5% |
이의 | 141 | 1.5% |
이를 | 137 | 1.4% |
함유하는 | 130 | 1.4% |
또는 | 124 | 1.3% |
Other values (2859) | 7425 |
Most occurring characters
Value | Count | Frequency (%) |
8496 | 20.2% | |
이 | 1043 | 2.5% |
물 | 821 | 2.0% |
성 | 778 | 1.9% |
용 | 711 | 1.7% |
의 | 683 | 1.6% |
유 | 652 | 1.6% |
는 | 651 | 1.5% |
및 | 630 | 1.5% |
조 | 621 | 1.5% |
Other values (709) | 26961 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 27780 | |
Space Separator | 8496 | 20.2% |
Lowercase Letter | 2654 | 6.3% |
Uppercase Letter | 2331 | 5.5% |
Decimal Number | 373 | 0.9% |
Dash Punctuation | 198 | 0.5% |
Other Punctuation | 171 | 0.4% |
Open Punctuation | 21 | < 0.1% |
Close Punctuation | 21 | < 0.1% |
Connector Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 1043 | 3.8% |
물 | 821 | 3.0% |
성 | 778 | 2.8% |
용 | 711 | 2.6% |
의 | 683 | 2.5% |
유 | 652 | 2.3% |
는 | 651 | 2.3% |
및 | 630 | 2.3% |
조 | 621 | 2.2% |
방 | 572 | 2.1% |
Other values (573) | 20618 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 185 | 7.9% |
O | 177 | 7.6% |
A | 162 | 6.9% |
N | 157 | 6.7% |
I | 139 | 6.0% |
C | 136 | 5.8% |
T | 135 | 5.8% |
R | 125 | 5.4% |
P | 119 | 5.1% |
S | 110 | 4.7% |
Other values (41) | 886 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 281 | 10.6% |
n | 216 | 8.1% |
i | 215 | 8.1% |
o | 214 | 8.1% |
t | 210 | 7.9% |
a | 188 | 7.1% |
r | 183 | 6.9% |
s | 168 | 6.3% |
c | 115 | 4.3% |
p | 102 | 3.8% |
Other values (38) | 762 |
Decimal Number
Value | Count | Frequency (%) |
1 | 65 | |
2 | 50 | |
3 | 48 | |
0 | 40 | |
4 | 35 | |
7 | 34 | |
5 | 28 | |
6 | 21 | 5.6% |
9 | 16 | 4.3% |
1 | 8 | 2.1% |
Other values (8) | 28 |
Other Punctuation
Value | Count | Frequency (%) |
, | 145 | |
' | 8 | 4.7% |
. | 7 | 4.1% |
/ | 7 | 4.1% |
: | 2 | 1.2% |
; | 1 | 0.6% |
· | 1 | 0.6% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 170 | |
― | 17 | 8.6% |
- | 11 | 5.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 19 | |
( | 1 | 4.8% |
{ | 1 | 4.8% |
Close Punctuation
Value | Count | Frequency (%) |
) | 19 | |
) | 1 | 4.8% |
} | 1 | 4.8% |
Space Separator
Value | Count | Frequency (%) |
8496 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Format
Value | Count | Frequency (%) |
| 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 27780 | |
Common | 9282 | 22.1% |
Latin | 4981 | 11.8% |
Greek | 3 | < 0.1% |
Cyrillic | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 1043 | 3.8% |
물 | 821 | 3.0% |
성 | 778 | 2.8% |
용 | 711 | 2.6% |
의 | 683 | 2.5% |
유 | 652 | 2.3% |
는 | 651 | 2.3% |
및 | 630 | 2.3% |
조 | 621 | 2.2% |
방 | 572 | 2.1% |
Other values (573) | 20618 |
Latin
Value | Count | Frequency (%) |
e | 281 | 5.6% |
n | 216 | 4.3% |
i | 215 | 4.3% |
o | 214 | 4.3% |
t | 210 | 4.2% |
a | 188 | 3.8% |
E | 185 | 3.7% |
r | 183 | 3.7% |
O | 177 | 3.6% |
s | 168 | 3.4% |
Other values (85) | 2944 |
Common
Value | Count | Frequency (%) |
8496 | ||
- | 170 | 1.8% |
, | 145 | 1.6% |
1 | 65 | 0.7% |
2 | 50 | 0.5% |
3 | 48 | 0.5% |
0 | 40 | 0.4% |
4 | 35 | 0.4% |
7 | 34 | 0.4% |
5 | 28 | 0.3% |
Other values (27) | 171 | 1.8% |
Greek
Value | Count | Frequency (%) |
β | 1 | |
γ | 1 | |
ε | 1 |
Cyrillic
Value | Count | Frequency (%) |
А | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 27780 | |
ASCII | 13836 | |
None | 413 | 1.0% |
Punctuation | 17 | < 0.1% |
Cyrillic | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
8496 | ||
e | 281 | 2.0% |
n | 216 | 1.6% |
i | 215 | 1.6% |
o | 214 | 1.5% |
t | 210 | 1.5% |
a | 188 | 1.4% |
E | 185 | 1.3% |
r | 183 | 1.3% |
O | 177 | 1.3% |
Other values (64) | 3471 |
Hangul
Value | Count | Frequency (%) |
이 | 1043 | 3.8% |
물 | 821 | 3.0% |
성 | 778 | 2.8% |
용 | 711 | 2.6% |
의 | 683 | 2.5% |
유 | 652 | 2.3% |
는 | 651 | 2.3% |
및 | 630 | 2.3% |
조 | 621 | 2.2% |
방 | 572 | 2.1% |
Other values (573) | 20618 |
None
Value | Count | Frequency (%) |
A | 28 | 6.8% |
P | 24 | 5.8% |
H | 19 | 4.6% |
C | 18 | 4.4% |
r | 17 | 4.1% |
s | 16 | 3.9% |
D | 14 | 3.4% |
a | 14 | 3.4% |
S | 13 | 3.1% |
n | 13 | 3.1% |
Other values (50) | 237 |
Punctuation
Value | Count | Frequency (%) |
― | 17 |
Cyrillic
Value | Count | Frequency (%) |
А | 1 |
출원등록인
Text
Distinct | 260 |
---|---|
Distinct (%) | 25.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.1 KiB |
Length
Max length | 51 |
---|---|
Median length | 48 |
Mean length | 10.32878 |
Min length | 3 |
Characters and Unicode
Total characters | 10587 |
---|---|
Distinct characters | 286 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 136 ? |
---|---|
Unique (%) | 13.3% |
Sample
1st row | 에스앤텍 |
---|---|
2nd row | 녹십자수의약품(주) |
3rd row | 한국생명공학연구원 |
4th row | 한국생명공학연구원 |
5th row | 건국대학교(충주) |
Value | Count | Frequency (%) |
산학협력단 | 117 | 9.7% |
농촌진흥청 | 79 | 6.6% |
대한민국(농촌진흥청장 | 62 | 5.2% |
건국대학교산학협력단 | 53 | 4.4% |
한국생명공학연구원 | 44 | 3.7% |
건국대학교 | 42 | 3.5% |
전남대학교산학협력단 | 30 | 2.5% |
대한민국 | 27 | 2.2% |
서울대학교산학협력단 | 25 | 2.1% |
한국식품연구원 | 23 | 1.9% |
Other values (273) | 700 |
Most occurring characters
Value | Count | Frequency (%) |
학 | 1170 | 11.1% |
대 | 685 | 6.5% |
산 | 583 | 5.5% |
단 | 557 | 5.3% |
교 | 540 | 5.1% |
력 | 527 | 5.0% |
협 | 526 | 5.0% |
국 | 375 | 3.5% |
한 | 250 | 2.4% |
농 | 214 | 2.0% |
Other values (276) | 5160 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9799 | |
Close Punctuation | 189 | 1.8% |
Open Punctuation | 189 | 1.8% |
Space Separator | 177 | 1.7% |
Math Symbol | 63 | 0.6% |
Lowercase Letter | 57 | 0.5% |
Other Punctuation | 49 | 0.5% |
Decimal Number | 26 | 0.2% |
Uppercase Letter | 21 | 0.2% |
Other Symbol | 11 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 1170 | 11.9% |
대 | 685 | 7.0% |
산 | 583 | 5.9% |
단 | 557 | 5.7% |
교 | 540 | 5.5% |
력 | 527 | 5.4% |
협 | 526 | 5.4% |
국 | 375 | 3.8% |
한 | 250 | 2.6% |
농 | 214 | 2.2% |
Other values (227) | 4372 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 9 | |
o | 8 | |
i | 5 | |
s | 4 | |
c | 4 | |
n | 4 | |
t | 4 | |
a | 4 | |
r | 4 | |
h | 2 | 3.5% |
Other values (7) | 9 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 3 | |
C | 2 | |
I | 2 | |
K | 2 | |
T | 2 | |
S | 2 | |
M | 2 | |
F | 2 | |
N | 1 | 4.8% |
U | 1 | 4.8% |
Other values (2) | 2 |
Decimal Number
Value | Count | Frequency (%) |
0 | 6 | |
1 | 5 | |
2 | 4 | |
3 | 3 | |
9 | 3 | |
4 | 2 | 7.7% |
7 | 1 | 3.8% |
8 | 1 | 3.8% |
5 | 1 | 3.8% |
Other Punctuation
Value | Count | Frequency (%) |
; | 28 | |
, | 15 | |
: | 3 | 6.1% |
& | 2 | 4.1% |
. | 1 | 2.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 189 |
Open Punctuation
Value | Count | Frequency (%) |
( | 189 |
Space Separator
Value | Count | Frequency (%) |
177 |
Math Symbol
Value | Count | Frequency (%) |
| | 63 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 11 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9810 | |
Common | 699 | 6.6% |
Latin | 78 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 1170 | 11.9% |
대 | 685 | 7.0% |
산 | 583 | 5.9% |
단 | 557 | 5.7% |
교 | 540 | 5.5% |
력 | 527 | 5.4% |
협 | 526 | 5.4% |
국 | 375 | 3.8% |
한 | 250 | 2.5% |
농 | 214 | 2.2% |
Other values (228) | 4383 |
Latin
Value | Count | Frequency (%) |
e | 9 | 11.5% |
o | 8 | 10.3% |
i | 5 | 6.4% |
s | 4 | 5.1% |
c | 4 | 5.1% |
n | 4 | 5.1% |
t | 4 | 5.1% |
a | 4 | 5.1% |
r | 4 | 5.1% |
B | 3 | 3.8% |
Other values (19) | 29 |
Common
Value | Count | Frequency (%) |
) | 189 | |
( | 189 | |
177 | ||
| | 63 | 9.0% |
; | 28 | 4.0% |
, | 15 | 2.1% |
0 | 6 | 0.9% |
- | 6 | 0.9% |
1 | 5 | 0.7% |
2 | 4 | 0.6% |
Other values (9) | 17 | 2.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9798 | |
ASCII | 777 | 7.3% |
None | 11 | 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
학 | 1170 | 11.9% |
대 | 685 | 7.0% |
산 | 583 | 6.0% |
단 | 557 | 5.7% |
교 | 540 | 5.5% |
력 | 527 | 5.4% |
협 | 526 | 5.4% |
국 | 375 | 3.8% |
한 | 250 | 2.6% |
농 | 214 | 2.2% |
Other values (226) | 4371 |
ASCII
Value | Count | Frequency (%) |
) | 189 | |
( | 189 | |
177 | ||
| | 63 | 8.1% |
; | 28 | 3.6% |
, | 15 | 1.9% |
e | 9 | 1.2% |
o | 8 | 1.0% |
0 | 6 | 0.8% |
- | 6 | 0.8% |
Other values (38) | 87 |
None
Value | Count | Frequency (%) |
㈜ | 11 |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 1 |
출원등록일
Date
Distinct | 509 |
---|---|
Distinct (%) | 49.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.1 KiB |
Minimum | 2009-03-13 00:00:00 |
---|---|
Maximum | 2013-12-23 00:00:00 |
출원등록국가
Categorical
IMBALANCE
 
Distinct | 10 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.1 KiB |
대한민국 | |
---|---|
국제 | 39 |
미국 | 16 |
중국 | 9 |
오스트레일리아 | 3 |
Other values (5) | 8 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.875122 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 대한민국 |
---|---|
2nd row | 대한민국 |
3rd row | 대한민국 |
4th row | 대한민국 |
5th row | 대한민국 |
Common Values
Value | Count | Frequency (%) |
대한민국 | 950 | |
국제 | 39 | 3.8% |
미국 | 16 | 1.6% |
중국 | 9 | 0.9% |
오스트레일리아 | 3 | 0.3% |
일본 | 3 | 0.3% |
유럽연합 | 2 | 0.2% |
캐나다 | 1 | 0.1% |
러시아 | 1 | 0.1% |
베트남 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대한민국 | 950 | |
국제 | 39 | 3.8% |
미국 | 16 | 1.6% |
중국 | 9 | 0.9% |
오스트레일리아 | 3 | 0.3% |
일본 | 3 | 0.3% |
유럽연합 | 2 | 0.2% |
캐나다 | 1 | 0.1% |
러시아 | 1 | 0.1% |
베트남 | 1 | 0.1% |
특허명 | 출원등록인 | 출원등록일 | 출원등록국가 | |
---|---|---|---|---|
0 | 섬기린초에서 분리된 화합물을 유효성분으로 함유하는 천연 항균제 | 에스앤텍 | 2013-12-23 | 대한민국 |
1 | 신규한 돼지 인플루엔자 바이러스 A H1N1 및 그의 용도 | 녹십자수의약품(주) | 2013-12-20 | 대한민국 |
2 | 울금 추출물, 및 스테비아 추출물 또는 스테비오사이드의 혼합물을 유효성분으로 포함하는 흰점 증후군 바이러스에 대한 내성 증강용 사료 첨가제 조성물 및 이를 포함하는 사료 조성물 | 한국생명공학연구원 | 2013-12-19 | 대한민국 |
3 | 트라우스토키트리드 미세조류의 형질전환체 | 한국생명공학연구원 | 2013-12-10 | 대한민국 |
4 | 어성초 추출물을 유효성분으로 포함하는 지방간 예방 또는 치료용 조성물 | 건국대학교(충주) | 2013-12-09 | 대한민국 |
5 | 돼지 인플루엔자 바이러스 감염의 예방 또는 치료방법 | 녹십자수의약품(주) | 2013-12-03 | 대한민국 |
6 | 큰 느타리버섯을 재배한 배지에서 추출한 추출물을 유효성분으로 포함하는 염료 탈색제 | 한경대학교산학협력단 | 2013-11-22 | 대한민국 |
7 | 진세노사이드 F2의 함량이 증가된 발효 홍삼의 제조방법 및 상기 방법으로 제조된 발효 홍삼 추출물 | 경희대학교산학협력단 | 2013-11-22 | 대한민국 |
8 | 신종균 크리세오박테리움 THG-C4-1 및 이를 이용한 지페노사이드 17 생산 방법 | 경희대학교산학협력단 | 2013-11-20 | 대한민국 |
9 | 사철쑥 유래 스코파론 함유 추출물을 유효성분으로 포함하는 골다공증 예방 또는 치료용 조성물 | 주식회사케이스템셀 | 2013-11-13 | 대한민국 |
특허명 | 출원등록인 | 출원등록일 | 출원등록국가 | |
---|---|---|---|---|
1015 | 식물 스트레스 저항성을 증가시키는 OsRDCP1유전자및 상기 유전자가 도입된 형질전환 식물체 | 연세대학교산학협력단 | 2009-04-29 | 대한민국 |
1016 | 산삼에서 발현된 특이 유전자 p-rpoC1 및 이를 이용한 산삼의 감별방법 | 상지대학교산학협력단 | 2009-04-24 | 대한민국 |
1017 | 산삼에서 발현된 특이 유전자 pGAPDH-w 및 이를 이용한 산삼의 감별방법 | 상지대학교산학협력단 | 2009-04-24 | 대한민국 |
1018 | 압출성형 및 초고압처리에 의한 고품질의 옥수수겨 추출물 제조방법 | 학교법인선목학원,(주)사임당화장품 | 2009-04-23 | 대한민국 |
1019 | 배양액 및 동물 복제를 위한 체외 배양 방법 | (주)미래생명공학연구소 | 2009-04-22 | 대한민국 |
1020 | 소 수정란의 성 감별 방법 | (주)미래생명공학연구소 | 2009-04-22 | 대한민국 |
1021 | 동물 배아의 보존 방법 | (주)미래생명공학연구소 | 2009-04-22 | 대한민국 |
1022 | 안정화된 옥수수겨 추출물의 나노리포좀을 함유하는 화장료조성물 | (주)사임당화장품 | 2009-03-27 | 대한민국 |
1023 | 압출성형 및 초고압처리에 의한 옥수수겨로부터 폴리아민컨쥬케이트의 추출 및 고품질의 정제분말 제조방법 | 학교법인선목학원,(주)사임당화장품 | 2009-03-19 | 대한민국 |
1024 | 식물의 안토시아닌 합성 증대조절제 | 고려대학교산학협력단 | 2009-03-13 | 대한민국 |
Most frequently occurring
특허명 | 출원등록인 | 출원등록일 | 출원등록국가 | # duplicates | |
---|---|---|---|---|---|
25 | 유채 품종 특이적 마커, 프라이머 및 이의 용도 | 강원대학교산학협력단 | 2012-10-23 | 대한민국 | 5 |
18 | 식물의 콜드 또는 프리징 저항성을 증가시키는 유전자 및 형질전환 식물체 | 이화여자대학교산학협력단 | 2012-07-02 | 대한민국 | 4 |
22 | 신규한 항생활성 화합물 및 그 화합물을 포함하는 항생 조성물 | 대한민국(농촌진흥청장)|건국대학교산학협력단 | 2012-03-13 | 대한민국 | 4 |
13 | 방선균 추출물을 포함하는 잔토모나스속 병원균에 대한 억제용 조성물 | 건국대학교산학협력단|대한민국(농촌진흥청장)|명지대학교산학협력단 | 2012-11-20 | 대한민국 | 3 |
20 | 신규한 항생활성 화합물 및 그 화합물을 포함하는 항생 조성물 | 건국대학교산학협력단|대한민국(농촌진흥청장) | 2012-03-13 | 대한민국 | 3 |
0 | Bglap 유전자를 이용한 지방유래 중간엽 줄기세포를 골아세포로 분화시키는 방법 | 강원대학교산학협력단 | 2012-10-11 | 대한민국 | 2 |
1 | PPAR 활성을 지닌 자생 불레기말 추출물을 함유하는 조성물 | 고려대학교산학협력단 | 2010-03-30 | 대한민국 | 2 |
2 | PPAR 활성을 지닌 자생 청각 추출물을 함유하는 조성물 | 고려대학교산학협력단 | 2010-03-30 | 대한민국 | 2 |
3 | SDS용액을 이용한 바이오 스캐폴드의 제조방법 | 강원대학교산학협력단 | 2012-10-11 | 대한민국 | 2 |
4 | 공기전파가 가능한 신규한 H9N2형 저병원성 조류인플루엔자 바이러스 균주 및 그로부터 유래된 백신 | 건국대학교 산학협력단 | 2011-05-30 | 대한민국 | 2 |