Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 866 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 34 |
Duplicate rows (%) | 3.9% |
Total size in memory | 28.0 KiB |
Average record size in memory | 33.2 B |
Variable types
Text | 2 |
---|---|
Categorical | 2 |
Dataset
Description | 농림식품 연구개발 과제를 통해 창출된 성과 정보를 공공데이터로 제공 특허명,출원/등록인,출원등록년도,출원/등록국가 등 항목으로 구성 |
---|---|
Author | 농림식품기술기획평가원 |
URL | https://www.data.go.kr/data/15053187/fileData.do |
Dataset has 34 (3.9%) duplicate rows | Duplicates |
출원등록국가 is highly imbalanced (84.0%) | Imbalance |
Reproduction
Analysis started | 2023-12-11 22:53:59.779302 |
---|---|
Analysis finished | 2023-12-11 22:54:00.480282 |
Duration | 0.7 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
특허명
Text
Distinct | 761 |
---|---|
Distinct (%) | 87.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.9 KiB |
Length
Max length | 150 |
---|---|
Median length | 65 |
Mean length | 31.836028 |
Min length | 3 |
Characters and Unicode
Total characters | 27570 |
---|---|
Distinct characters | 711 |
Distinct categories | 12 ? |
Distinct scripts | 6 ? |
Distinct blocks | 7 ? |
Unique
Unique | 682 ? |
---|---|
Unique (%) | 78.8% |
Sample
1st row | 땅콩수확기의 선별체 수평유지장치 |
---|---|
2nd row | 무인항공 방제용 멀티콥터 시스템 |
3rd row | 캡시컴 안늄의 종내집단을 이용한 SSR마커 및 유전자 연관지도 |
4th row | 고추의 고밀도 유전자 연관지도 |
5th row | 밀 신품종 '트랜스' 품종보호권 등록 |
Value | Count | Frequency (%) |
및 | 456 | 6.9% |
이용한 | 178 | 2.7% |
용도 | 132 | 2.0% |
방법 | 125 | 1.9% |
이의 | 125 | 1.9% |
이를 | 114 | 1.7% |
유전자 | 99 | 1.5% |
조성물 | 91 | 1.4% |
위한 | 67 | 1.0% |
제조방법 | 63 | 0.9% |
Other values (2294) | 5182 |
Most occurring characters
Value | Count | Frequency (%) |
5768 | 20.9% | |
이 | 762 | 2.8% |
용 | 579 | 2.1% |
의 | 526 | 1.9% |
및 | 460 | 1.7% |
성 | 421 | 1.5% |
유 | 420 | 1.5% |
방 | 415 | 1.5% |
물 | 389 | 1.4% |
제 | 360 | 1.3% |
Other values (701) | 17470 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 18991 | |
Space Separator | 5768 | 20.9% |
Uppercase Letter | 1363 | 4.9% |
Lowercase Letter | 973 | 3.5% |
Decimal Number | 236 | 0.9% |
Other Punctuation | 92 | 0.3% |
Dash Punctuation | 61 | 0.2% |
Close Punctuation | 41 | 0.1% |
Open Punctuation | 41 | 0.1% |
Format | 2 | < 0.1% |
Other values (2) | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 762 | 4.0% |
용 | 579 | 3.0% |
의 | 526 | 2.8% |
및 | 460 | 2.4% |
성 | 421 | 2.2% |
유 | 420 | 2.2% |
방 | 415 | 2.2% |
물 | 389 | 2.0% |
제 | 360 | 1.9% |
한 | 356 | 1.9% |
Other values (580) | 14303 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 98 | 7.2% |
A | 91 | 6.7% |
S | 82 | 6.0% |
O | 79 | 5.8% |
E | 68 | 5.0% |
T | 61 | 4.5% |
R | 59 | 4.3% |
P | 59 | 4.3% |
L | 54 | 4.0% |
I | 53 | 3.9% |
Other values (40) | 659 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 96 | 9.9% |
i | 95 | 9.8% |
a | 74 | 7.6% |
n | 70 | 7.2% |
o | 69 | 7.1% |
s | 68 | 7.0% |
t | 68 | 7.0% |
r | 65 | 6.7% |
u | 43 | 4.4% |
c | 42 | 4.3% |
Other values (29) | 283 |
Decimal Number
Value | Count | Frequency (%) |
1 | 62 | |
0 | 26 | |
2 | 23 | 9.7% |
3 | 23 | 9.7% |
5 | 17 | 7.2% |
6 | 15 | 6.4% |
7 | 13 | 5.5% |
4 | 13 | 5.5% |
9 | 12 | 5.1% |
8 | 8 | 3.4% |
Other values (7) | 24 | 10.2% |
Other Punctuation
Value | Count | Frequency (%) |
, | 66 | |
. | 14 | 15.2% |
' | 6 | 6.5% |
/ | 3 | 3.3% |
: | 2 | 2.2% |
· | 1 | 1.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 57 | |
- | 2 | 3.3% |
― | 2 | 3.3% |
Space Separator
Value | Count | Frequency (%) |
5768 |
Close Punctuation
Value | Count | Frequency (%) |
) | 41 |
Open Punctuation
Value | Count | Frequency (%) |
( | 41 |
Format
Value | Count | Frequency (%) |
| 2 |
Letter Number
Value | Count | Frequency (%) |
Ⅲ | 1 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 18967 | |
Common | 6242 | 22.6% |
Latin | 2333 | 8.5% |
Han | 16 | 0.1% |
Katakana | 8 | < 0.1% |
Greek | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 762 | 4.0% |
용 | 579 | 3.1% |
의 | 526 | 2.8% |
및 | 460 | 2.4% |
성 | 421 | 2.2% |
유 | 420 | 2.2% |
방 | 415 | 2.2% |
물 | 389 | 2.1% |
제 | 360 | 1.9% |
한 | 356 | 1.9% |
Other values (568) | 14279 |
Latin
Value | Count | Frequency (%) |
N | 98 | 4.2% |
e | 96 | 4.1% |
i | 95 | 4.1% |
A | 91 | 3.9% |
S | 82 | 3.5% |
O | 79 | 3.4% |
a | 74 | 3.2% |
n | 70 | 3.0% |
o | 69 | 3.0% |
E | 68 | 2.9% |
Other values (78) | 1511 |
Common
Value | Count | Frequency (%) |
5768 | ||
, | 66 | 1.1% |
1 | 62 | 1.0% |
- | 57 | 0.9% |
) | 41 | 0.7% |
( | 41 | 0.7% |
0 | 26 | 0.4% |
2 | 23 | 0.4% |
3 | 23 | 0.4% |
5 | 17 | 0.3% |
Other values (21) | 118 | 1.9% |
Han
Value | Count | Frequency (%) |
浮 | 2 | |
自 | 2 | |
動 | 2 | |
沈 | 2 | |
式 | 2 | |
生 | 2 | |
殖 | 2 | |
養 | 2 |
Katakana
Value | Count | Frequency (%) |
ム | 2 | |
テ | 2 | |
ス | 2 | |
シ | 2 |
Greek
Value | Count | Frequency (%) |
Ν | 2 | |
Ο | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 18967 | |
ASCII | 8211 | |
None | 365 | 1.3% |
CJK | 16 | 0.1% |
Katakana | 8 | < 0.1% |
Punctuation | 2 | < 0.1% |
Number Forms | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
5768 | ||
N | 98 | 1.2% |
e | 96 | 1.2% |
i | 95 | 1.2% |
A | 91 | 1.1% |
S | 82 | 1.0% |
O | 79 | 1.0% |
a | 74 | 0.9% |
n | 70 | 0.9% |
o | 69 | 0.8% |
Other values (60) | 1689 | 20.6% |
Hangul
Value | Count | Frequency (%) |
이 | 762 | 4.0% |
용 | 579 | 3.1% |
의 | 526 | 2.8% |
및 | 460 | 2.4% |
성 | 421 | 2.2% |
유 | 420 | 2.2% |
방 | 415 | 2.2% |
물 | 389 | 2.1% |
제 | 360 | 1.9% |
한 | 356 | 1.9% |
Other values (568) | 14279 |
None
Value | Count | Frequency (%) |
P | 41 | 11.2% |
S | 37 | 10.1% |
V | 27 | 7.4% |
M | 26 | 7.1% |
A | 25 | 6.8% |
R | 21 | 5.8% |
B | 20 | 5.5% |
C | 20 | 5.5% |
T | 20 | 5.5% |
G | 18 | 4.9% |
Other values (39) | 110 |
Punctuation
Value | Count | Frequency (%) |
― | 2 |
Katakana
Value | Count | Frequency (%) |
ム | 2 | |
テ | 2 | |
ス | 2 | |
シ | 2 |
CJK
Value | Count | Frequency (%) |
浮 | 2 | |
自 | 2 | |
動 | 2 | |
沈 | 2 | |
式 | 2 | |
生 | 2 | |
殖 | 2 | |
養 | 2 |
Number Forms
Value | Count | Frequency (%) |
Ⅲ | 1 |
출원등록인
Text
Distinct | 209 |
---|---|
Distinct (%) | 24.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.9 KiB |
Length
Max length | 33 |
---|---|
Median length | 27 |
Mean length | 9.1212471 |
Min length | 3 |
Characters and Unicode
Total characters | 7899 |
---|---|
Distinct characters | 235 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 97 ? |
---|---|
Unique (%) | 11.2% |
Sample
1st row | 동양물산기업 |
---|---|
2nd row | 한국항공대학교산학협력단 |
3rd row | (주)에프앤피 |
4th row | (주)에프앤피 |
5th row | 고려대학교산학협력단 |
Value | Count | Frequency (%) |
농촌진흥청 | 116 | 12.1% |
산학협력단 | 55 | 5.7% |
한국생명공학연구원 | 54 | 5.6% |
대한민국(농촌진흥청장 | 49 | 5.1% |
대한민국 | 28 | 2.9% |
서울대학교산학협력단 | 24 | 2.5% |
한국생명공학연구원;농촌진흥청 | 24 | 2.5% |
국립수산과학원 | 23 | 2.4% |
대한민국(국립수산과학원 | 21 | 2.2% |
제노마인(주 | 17 | 1.8% |
Other values (210) | 548 |
Most occurring characters
Value | Count | Frequency (%) |
학 | 696 | 8.8% |
대 | 407 | 5.2% |
산 | 361 | 4.6% |
국 | 338 | 4.3% |
한 | 281 | 3.6% |
력 | 271 | 3.4% |
단 | 267 | 3.4% |
교 | 264 | 3.3% |
협 | 262 | 3.3% |
농 | 234 | 3.0% |
Other values (225) | 4518 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 7264 | |
Close Punctuation | 204 | 2.6% |
Open Punctuation | 203 | 2.6% |
Space Separator | 93 | 1.2% |
Other Punctuation | 62 | 0.8% |
Lowercase Letter | 29 | 0.4% |
Uppercase Letter | 16 | 0.2% |
Math Symbol | 14 | 0.2% |
Other Symbol | 8 | 0.1% |
Decimal Number | 6 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 696 | 9.6% |
대 | 407 | 5.6% |
산 | 361 | 5.0% |
국 | 338 | 4.7% |
한 | 281 | 3.9% |
력 | 271 | 3.7% |
단 | 267 | 3.7% |
교 | 264 | 3.6% |
협 | 262 | 3.6% |
농 | 234 | 3.2% |
Other values (192) | 3883 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 4 | |
o | 3 | |
c | 3 | |
e | 3 | |
d | 2 | |
r | 2 | |
u | 2 | |
l | 2 | |
t | 2 | |
i | 2 | |
Other values (3) | 4 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 3 | |
D | 2 | |
E | 2 | |
A | 2 | |
C | 2 | |
H | 1 | 6.2% |
G | 1 | 6.2% |
I | 1 | 6.2% |
J | 1 | 6.2% |
Y | 1 | 6.2% |
Other Punctuation
Value | Count | Frequency (%) |
; | 50 | |
: | 5 | 8.1% |
, | 4 | 6.5% |
. | 3 | 4.8% |
Close Punctuation
Value | Count | Frequency (%) |
) | 204 |
Open Punctuation
Value | Count | Frequency (%) |
( | 203 |
Space Separator
Value | Count | Frequency (%) |
93 |
Math Symbol
Value | Count | Frequency (%) |
| | 14 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 8 |
Decimal Number
Value | Count | Frequency (%) |
1 | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 7272 | |
Common | 582 | 7.4% |
Latin | 45 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 696 | 9.6% |
대 | 407 | 5.6% |
산 | 361 | 5.0% |
국 | 338 | 4.6% |
한 | 281 | 3.9% |
력 | 271 | 3.7% |
단 | 267 | 3.7% |
교 | 264 | 3.6% |
협 | 262 | 3.6% |
농 | 234 | 3.2% |
Other values (193) | 3891 |
Latin
Value | Count | Frequency (%) |
n | 4 | 8.9% |
L | 3 | 6.7% |
o | 3 | 6.7% |
c | 3 | 6.7% |
e | 3 | 6.7% |
d | 2 | 4.4% |
D | 2 | 4.4% |
E | 2 | 4.4% |
A | 2 | 4.4% |
C | 2 | 4.4% |
Other values (13) | 19 |
Common
Value | Count | Frequency (%) |
) | 204 | |
( | 203 | |
93 | ||
; | 50 | 8.6% |
| | 14 | 2.4% |
1 | 6 | 1.0% |
: | 5 | 0.9% |
, | 4 | 0.7% |
. | 3 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 7264 | |
ASCII | 627 | 7.9% |
None | 8 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
학 | 696 | 9.6% |
대 | 407 | 5.6% |
산 | 361 | 5.0% |
국 | 338 | 4.7% |
한 | 281 | 3.9% |
력 | 271 | 3.7% |
단 | 267 | 3.7% |
교 | 264 | 3.6% |
협 | 262 | 3.6% |
농 | 234 | 3.2% |
Other values (192) | 3883 |
ASCII
Value | Count | Frequency (%) |
) | 204 | |
( | 203 | |
93 | ||
; | 50 | 8.0% |
| | 14 | 2.2% |
1 | 6 | 1.0% |
: | 5 | 0.8% |
n | 4 | 0.6% |
, | 4 | 0.6% |
L | 3 | 0.5% |
Other values (22) | 41 | 6.5% |
None
Value | Count | Frequency (%) |
㈜ | 8 |
출원등록년도
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.9 KiB |
2012 | |
---|---|
2011 | |
2010 | |
2009 | |
2013 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2013 |
---|---|
2nd row | 2013 |
3rd row | 2013 |
4th row | 2013 |
5th row | 2013 |
Common Values
Value | Count | Frequency (%) |
2012 | 308 | |
2011 | 272 | |
2010 | 175 | |
2009 | 57 | 6.6% |
2013 | 54 | 6.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2012 | 308 | |
2011 | 272 | |
2010 | 175 | |
2009 | 57 | 6.6% |
2013 | 54 | 6.2% |
출원등록국가
Categorical
IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.9 KiB |
대한민국 | |
---|---|
중국 | 15 |
일본 | 13 |
미국 | 11 |
국제 | 6 |
Other values (2) | 5 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8937644 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 대한민국 |
---|---|
2nd row | 대한민국 |
3rd row | 대한민국 |
4th row | 대한민국 |
5th row | 대한민국 |
Common Values
Value | Count | Frequency (%) |
대한민국 | 816 | |
중국 | 15 | 1.7% |
일본 | 13 | 1.5% |
미국 | 11 | 1.3% |
국제 | 6 | 0.7% |
유럽연합 | 4 | 0.5% |
영국 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대한민국 | 816 | |
중국 | 15 | 1.7% |
일본 | 13 | 1.5% |
미국 | 11 | 1.3% |
국제 | 6 | 0.7% |
유럽연합 | 4 | 0.5% |
영국 | 1 | 0.1% |
출원등록년도 | 출원등록국가 | |
---|---|---|
출원등록년도 | 1.000 | 0.036 |
출원등록국가 | 0.036 | 1.000 |
출원등록년도 | 출원등록국가 | |
---|---|---|
출원등록년도 | 1.000 | 0.023 |
출원등록국가 | 0.023 | 1.000 |
출원등록년도 | 출원등록국가 | |
---|---|---|
출원등록년도 | 1.000 | 0.023 |
출원등록국가 | 0.023 | 1.000 |
특허명 | 출원등록인 | 출원등록년도 | 출원등록국가 | |
---|---|---|---|---|
0 | 땅콩수확기의 선별체 수평유지장치 | 동양물산기업 | 2013 | 대한민국 |
1 | 무인항공 방제용 멀티콥터 시스템 | 한국항공대학교산학협력단 | 2013 | 대한민국 |
2 | 캡시컴 안늄의 종내집단을 이용한 SSR마커 및 유전자 연관지도 | (주)에프앤피 | 2013 | 대한민국 |
3 | 고추의 고밀도 유전자 연관지도 | (주)에프앤피 | 2013 | 대한민국 |
4 | 밀 신품종 '트랜스' 품종보호권 등록 | 고려대학교산학협력단 | 2013 | 대한민국 |
5 | 토양 메타게놈 유래의 식물병 저항성 관련 유전자 및 이의 용도 | 한국생명공학연구원 | 2013 | 미국 |
6 | 피엔비-지1 | (주)고추와육종 | 2013 | 대한민국 |
7 | 피엔비-지3 | (주)고추와육종 | 2013 | 대한민국 |
8 | 우수한 기능성을 갖는 농업용코팅조성물, 이의 제조방법 및 이를 함유하는 농업용 코팅필름 | 미림화학공업(주) | 2013 | 대한민국 |
9 | 유산균을 이용하여 스테비오사이드로부터 루부소사이드를 생산하는 방법 | 한국생명공학연구원 | 2013 | 대한민국 |
특허명 | 출원등록인 | 출원등록년도 | 출원등록국가 | |
---|---|---|---|---|
856 | 오이 유래의 저온 스트레스 내성 유도 카이네이스 유전자의 프로모터 및 상기 프로모터를 이용한 형질전환 식물 | 전남대학교산학협력단 | 2009 | 대한민국 |
857 | 알루미늄을 이용한 다겹 차광 보온 커튼 | ㈜부전 | 2009 | 대한민국 |
858 | 아밀라아제 유전자 침묵에 의한 재조합 단백질 증산 방법 | 전북대학교산학협력단 | 2009 | 대한민국 |
859 | 시스테인 프로테이나아제 유전자 발현의 억제에 의한 재조합 단백질 증산 방법 | 전북대학교산학협력단 | 2009 | 대한민국 |
860 | 고추역병 방제 및 고추생육촉진용 길항 미생물 조합 조성물 | 영남대학교산학협력단 | 2009 | 대한민국 |
861 | 자동 해충 인지 및 방제 시스템 및 방법 | 부산대학교산학협력단 | 2009 | 대한민국 |
862 | 저층수를 이용한 적조 피해 방지 장치 | 국립수산과학원 | 2009 | 대한민국 |
863 | 반궤도식 작업차 | 경북대학교산학협력단 | 2009 | 대한민국 |
864 | 어장조성용 생분해성 로프망 및 그 제조방법 | 국립수산과학원 | 2009 | 대한민국 |
865 | 자포니카 쌀의 식미평가용 마커 및 그의 용도 | 서울대학교산학협력단 | 2009 | 대한민국 |
Most frequently occurring
특허명 | 출원등록인 | 출원등록년도 | 출원등록국가 | # duplicates | |
---|---|---|---|---|---|
0 | KingNupchi Halibut | 대한민국(국립수산과학원) | 2012 | 중국 | 4 |
1 | KingNupchi Halibut 영문표장 | 대한민국(국립수산과학원) | 2012 | 중국 | 4 |
11 | 농업용 작업차량의 배출가스 후처리장치의 취부구조 | 대동공업 | 2010 | 대한민국 | 4 |
12 | 농용 작업차량의 엔진제어유닛 취부구조 | 대동공업주식회사 | 2011 | 대한민국 | 4 |
10 | 농업용 작업차 | 대동공업주식회사 | 2011 | 대한민국 | 3 |
20 | 식물의 노화 지연 기능 및 생산성 증대 기능을 갖는 ATPG7 단백질과 그 유전자 및 이들의 용도 | 제노마인(주) | 2011 | 대한민국 | 3 |
21 | 식물의 노화 지연 기능 및 생산성 증대 기능을 갖는 ATPG8 단백질과 그 유전자 및 이들의 용도 | 제노마인(주) | 2011 | 대한민국 | 3 |
30 | 항염증 효과를 갖는 잠분 추출물 및 이를 포함하는 피부 외용제 조성물 | 경희대학교산학협력단|대한민국(관리부서:농촌진흥청장) | 2012 | 대한민국 | 3 |
33 | PMMoV 저항성 고추 품종을 선별하기 위한 프라이머 세트, 방법 및 키트 | 서울대학교산학협력단 | 2010 | 대한민국 | 3 |
2 | MYROTHECIUM SP. P10008의 배양액을 포함하는 살선충용 조성물 및 이의 이용방법 | 대한민국(농촌진흥청장) | 2012 | 대한민국 | 2 |