Overview

Dataset statistics

Number of variables4
Number of observations910
Missing cells0
Missing cells (%)0.0%
Duplicate rows24
Duplicate rows (%)2.6%
Total size in memory28.6 KiB
Average record size in memory32.1 B

Variable types

Text2
DateTime1
Categorical1

Dataset

Description농림식품기술기획평가원_농림수산식품 식품·유통 R&D 출원특허 정보(20151216) 특허명, 출원/등록인, 출원/등록일,출원/등록국가 등 관련 항목 포함
Author농림식품기술기획평가원
URLhttps://www.data.go.kr/data/15053199/fileData.do

Alerts

Dataset has 24 (2.6%) duplicate rowsDuplicates
출원등록국가 is highly imbalanced (93.7%)Imbalance

Reproduction

Analysis started2023-12-12 21:26:05.994541
Analysis finished2023-12-12 21:26:06.655770
Duration0.66 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct793
Distinct (%)87.1%
Missing0
Missing (%)0.0%
Memory size7.2 KiB
2023-12-13T06:26:06.893853image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length169
Median length65
Mean length32.908791
Min length3

Characters and Unicode

Total characters29947
Distinct characters683
Distinct categories10 ?
Distinct scripts5 ?
Distinct blocks7 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique692 ?
Unique (%)76.0%

Sample

1st row음식물 가열용 포장봉투
2nd row온실용 냉난방 시스템 및 그의 냉난방 방법
3rd row동부를 이용한 두유음료 제조방법
4th row전복분말 및 이의 제조방법
5th row감마아미노부틸산 고생산성 락토바실러스 브레비스 및 그의 용도
ValueCountFrequency (%)
534
 
7.4%
제조방법 345
 
4.8%
이용한 214
 
3.0%
조성물 193
 
2.7%
방법 168
 
2.3%
포함하는 137
 
1.9%
이를 101
 
1.4%
이의 93
 
1.3%
함유하는 85
 
1.2%
84
 
1.2%
Other values (2290) 5266
72.9%
2023-12-13T06:26:07.435530image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
6318
 
21.1%
736
 
2.5%
713
 
2.4%
669
 
2.2%
614
 
2.1%
614
 
2.1%
551
 
1.8%
542
 
1.8%
536
 
1.8%
529
 
1.8%
Other values (673) 18125
60.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 21877
73.1%
Space Separator 6318
 
21.1%
Lowercase Letter 736
 
2.5%
Uppercase Letter 621
 
2.1%
Decimal Number 225
 
0.8%
Dash Punctuation 69
 
0.2%
Other Punctuation 54
 
0.2%
Close Punctuation 23
 
0.1%
Open Punctuation 23
 
0.1%
Letter Number 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
736
 
3.4%
713
 
3.3%
669
 
3.1%
614
 
2.8%
614
 
2.8%
551
 
2.5%
542
 
2.5%
536
 
2.5%
529
 
2.4%
491
 
2.2%
Other values (551) 15882
72.6%
Uppercase Letter
ValueCountFrequency (%)
P 39
 
6.3%
A 38
 
6.1%
36
 
5.8%
N 34
 
5.5%
30
 
4.8%
E 30
 
4.8%
R 26
 
4.2%
C 23
 
3.7%
T 23
 
3.7%
M 21
 
3.4%
Other values (40) 321
51.7%
Lowercase Letter
ValueCountFrequency (%)
i 69
 
9.4%
o 65
 
8.8%
t 61
 
8.3%
e 58
 
7.9%
a 57
 
7.7%
n 52
 
7.1%
r 41
 
5.6%
s 36
 
4.9%
m 32
 
4.3%
l 31
 
4.2%
Other values (29) 234
31.8%
Decimal Number
ValueCountFrequency (%)
1 47
20.9%
2 31
13.8%
4 25
11.1%
3 20
8.9%
5 20
8.9%
0 15
 
6.7%
7 14
 
6.2%
9 9
 
4.0%
8
 
3.6%
6 7
 
3.1%
Other values (9) 29
12.9%
Dash Punctuation
ValueCountFrequency (%)
- 62
89.9%
6
 
8.7%
1
 
1.4%
Other Punctuation
ValueCountFrequency (%)
, 47
87.0%
/ 5
 
9.3%
2
 
3.7%
Close Punctuation
ValueCountFrequency (%)
) 19
82.6%
} 2
 
8.7%
2
 
8.7%
Open Punctuation
ValueCountFrequency (%)
( 19
82.6%
{ 2
 
8.7%
2
 
8.7%
Space Separator
ValueCountFrequency (%)
6318
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 21877
73.1%
Common 6712
 
22.4%
Latin 1356
 
4.5%
Cyrillic 1
 
< 0.1%
Greek 1
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
736
 
3.4%
713
 
3.3%
669
 
3.1%
614
 
2.8%
614
 
2.8%
551
 
2.5%
542
 
2.5%
536
 
2.5%
529
 
2.4%
491
 
2.2%
Other values (551) 15882
72.6%
Latin
ValueCountFrequency (%)
i 69
 
5.1%
o 65
 
4.8%
t 61
 
4.5%
e 58
 
4.3%
a 57
 
4.2%
n 52
 
3.8%
r 41
 
3.0%
P 39
 
2.9%
A 38
 
2.8%
36
 
2.7%
Other values (78) 840
61.9%
Common
ValueCountFrequency (%)
6318
94.1%
- 62
 
0.9%
, 47
 
0.7%
1 47
 
0.7%
2 31
 
0.5%
4 25
 
0.4%
3 20
 
0.3%
5 20
 
0.3%
) 19
 
0.3%
( 19
 
0.3%
Other values (22) 104
 
1.5%
Cyrillic
ValueCountFrequency (%)
Р 1
100.0%
Greek
ValueCountFrequency (%)
β 1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 21876
73.0%
ASCII 7739
 
25.8%
None 323
 
1.1%
Punctuation 6
 
< 0.1%
Cyrillic 1
 
< 0.1%
Number Forms 1
 
< 0.1%
Compat Jamo 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
6318
81.6%
i 69
 
0.9%
o 65
 
0.8%
- 62
 
0.8%
t 61
 
0.8%
e 58
 
0.7%
a 57
 
0.7%
n 52
 
0.7%
, 47
 
0.6%
1 47
 
0.6%
Other values (55) 903
 
11.7%
Hangul
ValueCountFrequency (%)
736
 
3.4%
713
 
3.3%
669
 
3.1%
614
 
2.8%
614
 
2.8%
551
 
2.5%
542
 
2.5%
536
 
2.5%
529
 
2.4%
491
 
2.2%
Other values (550) 15881
72.6%
None
ValueCountFrequency (%)
36
 
11.1%
30
 
9.3%
21
 
6.5%
19
 
5.9%
19
 
5.9%
16
 
5.0%
13
 
4.0%
11
 
3.4%
10
 
3.1%
8
 
2.5%
Other values (44) 140
43.3%
Punctuation
ValueCountFrequency (%)
6
100.0%
Cyrillic
ValueCountFrequency (%)
Р 1
100.0%
Number Forms
ValueCountFrequency (%)
1
100.0%
Compat Jamo
ValueCountFrequency (%)
1
100.0%
Distinct237
Distinct (%)26.0%
Missing0
Missing (%)0.0%
Memory size7.2 KiB
2023-12-13T06:26:07.726021image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length74
Median length69
Mean length9.2978022
Min length2

Characters and Unicode

Total characters8461
Distinct characters251
Distinct categories8 ?
Distinct scripts2 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique117 ?
Unique (%)12.9%

Sample

1st row샬롬산업(주)
2nd row서울대학교산학협력단
3rd row(농)동의나라주식회사
4th row주식회사씨푸드
5th row목포대학교산학협력단
ValueCountFrequency (%)
한국식품연구원 227
22.9%
농촌진흥청 58
 
5.9%
대한민국(농촌진흥청장 54
 
5.4%
산학협력단 39
 
3.9%
건국대학교산학협력단 20
 
2.0%
동국대학교산학협력단 18
 
1.8%
경희대학교산학협력단 15
 
1.5%
충남대학교산학협력단 15
 
1.5%
주식회사 14
 
1.4%
대한민국 14
 
1.4%
Other values (247) 517
52.2%
2023-12-13T06:26:08.188621image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
682
 
8.1%
423
 
5.0%
422
 
5.0%
374
 
4.4%
364
 
4.3%
341
 
4.0%
317
 
3.7%
317
 
3.7%
313
 
3.7%
310
 
3.7%
Other values (241) 4598
54.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 7949
93.9%
Open Punctuation 172
 
2.0%
Close Punctuation 172
 
2.0%
Space Separator 81
 
1.0%
Other Punctuation 60
 
0.7%
Math Symbol 17
 
0.2%
Other Symbol 9
 
0.1%
Decimal Number 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
682
 
8.6%
423
 
5.3%
422
 
5.3%
374
 
4.7%
364
 
4.6%
341
 
4.3%
317
 
4.0%
317
 
4.0%
313
 
3.9%
310
 
3.9%
Other values (230) 4086
51.4%
Other Punctuation
ValueCountFrequency (%)
; 34
56.7%
: 12
 
20.0%
, 7
 
11.7%
. 6
 
10.0%
/ 1
 
1.7%
Open Punctuation
ValueCountFrequency (%)
( 172
100.0%
Close Punctuation
ValueCountFrequency (%)
) 172
100.0%
Space Separator
ValueCountFrequency (%)
81
100.0%
Math Symbol
ValueCountFrequency (%)
| 17
100.0%
Other Symbol
ValueCountFrequency (%)
9
100.0%
Decimal Number
ValueCountFrequency (%)
1 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 7958
94.1%
Common 503
 
5.9%

Most frequent character per script

Hangul
ValueCountFrequency (%)
682
 
8.6%
423
 
5.3%
422
 
5.3%
374
 
4.7%
364
 
4.6%
341
 
4.3%
317
 
4.0%
317
 
4.0%
313
 
3.9%
310
 
3.9%
Other values (231) 4095
51.5%
Common
ValueCountFrequency (%)
( 172
34.2%
) 172
34.2%
81
16.1%
; 34
 
6.8%
| 17
 
3.4%
: 12
 
2.4%
, 7
 
1.4%
. 6
 
1.2%
/ 1
 
0.2%
1 1
 
0.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 7949
93.9%
ASCII 503
 
5.9%
None 9
 
0.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
682
 
8.6%
423
 
5.3%
422
 
5.3%
374
 
4.7%
364
 
4.6%
341
 
4.3%
317
 
4.0%
317
 
4.0%
313
 
3.9%
310
 
3.9%
Other values (230) 4086
51.4%
ASCII
ValueCountFrequency (%)
( 172
34.2%
) 172
34.2%
81
16.1%
; 34
 
6.8%
| 17
 
3.4%
: 12
 
2.4%
, 7
 
1.4%
. 6
 
1.2%
/ 1
 
0.2%
1 1
 
0.2%
None
ValueCountFrequency (%)
9
100.0%
Distinct512
Distinct (%)56.3%
Missing0
Missing (%)0.0%
Memory size7.2 KiB
Minimum2009-01-05 00:00:00
Maximum2013-12-27 00:00:00
2023-12-13T06:26:08.361413image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T06:26:08.535552image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

출원등록국가
Categorical

IMBALANCE 

Distinct5
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size7.2 KiB
대한민국
895 
국제
 
9
미국
 
4
뉴질랜드
 
1
중국
 
1

Length

Max length4
Median length4
Mean length3.9692308
Min length2

Unique

Unique2 ?
Unique (%)0.2%

Sample

1st row대한민국
2nd row대한민국
3rd row대한민국
4th row대한민국
5th row국제

Common Values

ValueCountFrequency (%)
대한민국 895
98.4%
국제 9
 
1.0%
미국 4
 
0.4%
뉴질랜드 1
 
0.1%
중국 1
 
0.1%

Length

2023-12-13T06:26:08.720522image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T06:26:08.852113image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
대한민국 895
98.4%
국제 9
 
1.0%
미국 4
 
0.4%
뉴질랜드 1
 
0.1%
중국 1
 
0.1%

Missing values

2023-12-13T06:26:06.522343image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T06:26:06.621251image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

특허명출원등록인출원등록일출원등록국가
0음식물 가열용 포장봉투샬롬산업(주)2013-12-27대한민국
1온실용 냉난방 시스템 및 그의 냉난방 방법서울대학교산학협력단2013-12-26대한민국
2동부를 이용한 두유음료 제조방법(농)동의나라주식회사2013-12-20대한민국
3전복분말 및 이의 제조방법주식회사씨푸드2013-12-19대한민국
4감마아미노부틸산 고생산성 락토바실러스 브레비스 및 그의 용도목포대학교산학협력단2013-12-18국제
5취반성 및 식미가 개선된 현미의 제조방법 및 이 방법에 의해 제조된 현미(주)바이오벤2013-12-17대한민국
6유산균 배양액과 계피추출물을 첨가한 식빵의 제조방법재단법인임실치즈과학연구소2013-11-29대한민국
7저온 공중합 기술을 이용한 키토올리고당 / 베타락토글로불린 나노 전달체 및 그의 제조방법경상대학교산학협력단2013-11-25대한민국
8계피추출물이 첨가된 김치유래유산균 발효유의 제조방법재단법인임실치즈과학연구소2013-11-15대한민국
9감소된 혈당지수를 갖는 현미의 제조방법(주)바이오벤2013-10-31대한민국
특허명출원등록인출원등록일출원등록국가
900연잎 발효추출물의 제조방법목포대학교산학협력단2009-03-13대한민국
901연근쥬스 제조방법목포대학교산학협력단2009-03-13대한민국
902동충하초 배양 용기머쉬텍2009-03-12대한민국
903Rg3 및 Rh2의 함량이 증가된 흑삼 및 그의 제조방법한국생명공학연구원2009-02-27대한민국
904Rg3 및 Rh2의 함량이 증가된 흑삼 및 그의 제조방법한국생명공학연구원2009-02-27대한민국
905미산성 차아염소산수 제조장치 및 미산성 차아염소산수제조방법한국코스믹라운드(주)2009-02-09대한민국
906COX2 인트론 Ⅱ 영역에 특이적인 고려인삼 천풍 구별용 SNP 프라이머 및 이를 이용한 고려인삼 천풍 구별방법경희대학교산학협력단2009-02-04대한민국
907MLP 유전자에 특이적인 고려인삼 천풍 구별용 SNP 프라이머와 이를 포함하는 키트 및 이를 이용한 고려인삼 천풍 구별방법경희대학교산학협력단2009-01-19대한민국
908다시마 엽체를 이용한 미용 마스크 팩의 제조방법대한민국(관리부서:국립수산과학원)2009-01-14대한민국
909NAD7 인트론4 영역에 특이적인 고려인삼 천풍종 구별용 SNP 프라이머 및 이를 이용한 고려인삼 천풍종 구별방법경희대학교산학협력단2009-01-05대한민국

Duplicate rows

Most frequently occurring

특허명출원등록인출원등록일출원등록국가# duplicates
0가스치환을 통한 생강의 보존 방법한국식품연구원2011-03-24대한민국2
1근원섬유 단백질의 가용화 방법 및 식품용 단백질의 제조방법한국식품연구원2011-01-31대한민국2
2글리세올린을 유효성분으로 함유하는 항산화 조성물경북대학교산학협력단2010-02-09대한민국2
3김치로부터 분리된 유산균 및 상기 유산균을 이용한 발효식품조선대학교산학협력단2011-04-20대한민국2
4노화방지용 화장료 조성물대한민국(농촌진흥청장)2012-12-21대한민국2
5마늘 예건 겸용 저온 저장고대한민국2012-05-30대한민국2
6미립자 밀기울-중력분 혼합체 및 이의 제조방법한국식품연구원2011-04-07대한민국2
7배추에서 분리된 신규 miRNA충남대학교산학협력단2012-08-06대한민국2
8배추에서 분리된 신규 miRNA충남대학교산학협력단2012-09-03대한민국2
9생강 절편 및 이의 제조방법한국식품연구원2011-01-31대한민국2