Overview

Dataset statistics

Number of variables6
Number of observations50
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.5 KiB
Average record size in memory51.6 B

Variable types

Numeric1
Categorical3
Text1
DateTime1

Dataset

Description국립생태원 연구과제관리정보를 나타낸 자료로써 동식물, 생태, 자연 등에 관련한 연구개발성과_ 지식재산권 데이터 입니다.
Author국립생태원
URLhttps://www.data.go.kr/data/15088008/fileData.do

Alerts

분야 has constant value ""Constant
일련번호 has unique valuesUnique

Reproduction

Analysis started2023-12-12 12:51:03.903508
Analysis finished2023-12-12 12:51:04.851631
Duration0.95 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

일련번호
Real number (ℝ)

UNIQUE 

Distinct50
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean25.5
Minimum1
Maximum50
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size582.0 B
2023-12-12T21:51:04.936191image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile3.45
Q113.25
median25.5
Q337.75
95-th percentile47.55
Maximum50
Range49
Interquartile range (IQR)24.5

Descriptive statistics

Standard deviation14.57738
Coefficient of variation (CV)0.57166195
Kurtosis-1.2
Mean25.5
Median Absolute Deviation (MAD)12.5
Skewness0
Sum1275
Variance212.5
MonotonicityStrictly increasing
2023-12-12T21:51:05.106947image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
2.0%
39 1
 
2.0%
29 1
 
2.0%
30 1
 
2.0%
31 1
 
2.0%
32 1
 
2.0%
33 1
 
2.0%
34 1
 
2.0%
35 1
 
2.0%
36 1
 
2.0%
Other values (40) 40
80.0%
ValueCountFrequency (%)
1 1
2.0%
2 1
2.0%
3 1
2.0%
4 1
2.0%
5 1
2.0%
6 1
2.0%
7 1
2.0%
8 1
2.0%
9 1
2.0%
10 1
2.0%
ValueCountFrequency (%)
50 1
2.0%
49 1
2.0%
48 1
2.0%
47 1
2.0%
46 1
2.0%
45 1
2.0%
44 1
2.0%
43 1
2.0%
42 1
2.0%
41 1
2.0%

분야
Categorical

CONSTANT 

Distinct1
Distinct (%)2.0%
Missing0
Missing (%)0.0%
Memory size532.0 B
산업재산권 출원 및 등록
50 

Length

Max length13
Median length13
Mean length13
Min length13

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row산업재산권 출원 및 등록
2nd row산업재산권 출원 및 등록
3rd row산업재산권 출원 및 등록
4th row산업재산권 출원 및 등록
5th row산업재산권 출원 및 등록

Common Values

ValueCountFrequency (%)
산업재산권 출원 및 등록 50
100.0%

Length

2023-12-12T21:51:05.266459image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T21:51:05.387746image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
산업재산권 50
25.0%
출원 50
25.0%
50
25.0%
등록 50
25.0%
Distinct3
Distinct (%)6.0%
Missing0
Missing (%)0.0%
Memory size532.0 B
특허
37 
기타 산업재산권
12 
상표
 
1

Length

Max length8
Median length2
Mean length3.44
Min length2

Unique

Unique1 ?
Unique (%)2.0%

Sample

1st row특허
2nd row특허
3rd row특허
4th row특허
5th row기타 산업재산권

Common Values

ValueCountFrequency (%)
특허 37
74.0%
기타 산업재산권 12
 
24.0%
상표 1
 
2.0%

Length

2023-12-12T21:51:05.596823image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T21:51:05.753724image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
특허 37
59.7%
기타 12
 
19.4%
산업재산권 12
 
19.4%
상표 1
 
1.6%
Distinct39
Distinct (%)78.0%
Missing0
Missing (%)0.0%
Memory size532.0 B
2023-12-12T21:51:06.069701image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length86
Median length36.5
Mean length26.16
Min length3

Characters and Unicode

Total characters1308
Distinct characters233
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique31 ?
Unique (%)62.0%

Sample

1st row동굴 환경 모니터링 시스템 및 방법 개발
2nd row캐놀라 이벤트를 선별하기 위한 프라이머 세트, 방법 및 키트
3rd row정규화 지수를 이용한 토지이용에 따른 도시 열섬 취약 특성 분석 시스템 및 방법
4th row야생동물 모니터링 시스템 및 그 방법
5th row프로그램 저작권
ValueCountFrequency (%)
22
 
7.0%
방법 16
 
5.1%
시스템 10
 
3.2%
10
 
3.2%
in 6
 
1.9%
구상나무 5
 
1.6%
모니터링 5
 
1.6%
이용한 4
 
1.3%
프로그램저작권 4
 
1.3%
복원용 4
 
1.3%
Other values (140) 227
72.5%
2023-12-12T21:51:06.524171image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
266
 
20.3%
E 28
 
2.1%
22
 
1.7%
20
 
1.5%
20
 
1.5%
20
 
1.5%
18
 
1.4%
N 17
 
1.3%
16
 
1.2%
15
 
1.1%
Other values (223) 866
66.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 805
61.5%
Space Separator 266
 
20.3%
Uppercase Letter 152
 
11.6%
Lowercase Letter 80
 
6.1%
Other Punctuation 2
 
0.2%
Open Punctuation 1
 
0.1%
Dash Punctuation 1
 
0.1%
Close Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
22
 
2.7%
20
 
2.5%
20
 
2.5%
20
 
2.5%
18
 
2.2%
16
 
2.0%
15
 
1.9%
15
 
1.9%
14
 
1.7%
13
 
1.6%
Other values (180) 632
78.5%
Uppercase Letter
ValueCountFrequency (%)
E 28
18.4%
N 17
11.2%
A 14
9.2%
S 14
9.2%
R 12
7.9%
T 12
7.9%
I 10
 
6.6%
O 10
 
6.6%
P 6
 
3.9%
G 4
 
2.6%
Other values (10) 25
16.4%
Lowercase Letter
ValueCountFrequency (%)
e 14
17.5%
r 8
10.0%
n 8
10.0%
t 8
10.0%
s 7
8.8%
i 6
7.5%
a 6
7.5%
o 6
7.5%
p 3
 
3.8%
f 3
 
3.8%
Other values (8) 11
13.8%
Space Separator
ValueCountFrequency (%)
266
100.0%
Other Punctuation
ValueCountFrequency (%)
, 2
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 805
61.5%
Common 271
 
20.7%
Latin 232
 
17.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
22
 
2.7%
20
 
2.5%
20
 
2.5%
20
 
2.5%
18
 
2.2%
16
 
2.0%
15
 
1.9%
15
 
1.9%
14
 
1.7%
13
 
1.6%
Other values (180) 632
78.5%
Latin
ValueCountFrequency (%)
E 28
 
12.1%
N 17
 
7.3%
e 14
 
6.0%
A 14
 
6.0%
S 14
 
6.0%
R 12
 
5.2%
T 12
 
5.2%
I 10
 
4.3%
O 10
 
4.3%
r 8
 
3.4%
Other values (28) 93
40.1%
Common
ValueCountFrequency (%)
266
98.2%
, 2
 
0.7%
( 1
 
0.4%
- 1
 
0.4%
) 1
 
0.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 805
61.5%
ASCII 503
38.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
266
52.9%
E 28
 
5.6%
N 17
 
3.4%
e 14
 
2.8%
A 14
 
2.8%
S 14
 
2.8%
R 12
 
2.4%
T 12
 
2.4%
I 10
 
2.0%
O 10
 
2.0%
Other values (33) 106
 
21.1%
Hangul
ValueCountFrequency (%)
22
 
2.7%
20
 
2.5%
20
 
2.5%
20
 
2.5%
18
 
2.2%
16
 
2.0%
15
 
1.9%
15
 
1.9%
14
 
1.7%
13
 
1.6%
Other values (180) 632
78.5%
Distinct6
Distinct (%)12.0%
Missing0
Missing (%)0.0%
Memory size532.0 B
국립생태원
23 
<NA>
16 
한국저작권위원회
특허청
 
2
서울대학교산학협력단
 
1

Length

Max length13
Median length10
Mean length5.28
Min length3

Unique

Unique2 ?
Unique (%)4.0%

Sample

1st row<NA>
2nd row<NA>
3rd row서울대학교산학협력단
4th row국립생태원
5th row한국저작권위원회

Common Values

ValueCountFrequency (%)
국립생태원 23
46.0%
<NA> 16
32.0%
한국저작권위원회 7
 
14.0%
특허청 2
 
4.0%
서울대학교산학협력단 1
 
2.0%
한국기계연구원 국립생태원 1
 
2.0%

Length

2023-12-12T21:51:06.656300image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T21:51:06.758887image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
국립생태원 24
47.1%
na 16
31.4%
한국저작권위원회 7
 
13.7%
특허청 2
 
3.9%
서울대학교산학협력단 1
 
2.0%
한국기계연구원 1
 
2.0%
Distinct41
Distinct (%)82.0%
Missing0
Missing (%)0.0%
Memory size532.0 B
Minimum2017-05-18 00:00:00
Maximum2021-08-18 00:00:00
2023-12-12T21:51:06.879390image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T21:51:07.016916image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=41)

Interactions

2023-12-12T21:51:04.234900image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T21:51:07.110202image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
일련번호산업재산권종류발명명칭출원등록기관명출원등록
일련번호1.0000.2680.7490.0000.896
산업재산권종류0.2681.0001.0000.5381.000
발명명칭0.7491.0001.0001.0000.971
출원등록기관명0.0000.5381.0001.0000.000
출원등록0.8961.0000.9710.0001.000
2023-12-12T21:51:07.228323image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
산업재산권종류출원등록기관명
산업재산권종류1.0000.459
출원등록기관명0.4591.000
2023-12-12T21:51:07.312596image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
일련번호산업재산권종류출원등록기관명
일련번호1.0000.1410.000
산업재산권종류0.1411.0000.459
출원등록기관명0.0000.4591.000

Missing values

2023-12-12T21:51:04.644609image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T21:51:04.800354image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

일련번호분야산업재산권종류발명명칭출원등록기관명출원등록
01산업재산권 출원 및 등록특허동굴 환경 모니터링 시스템 및 방법 개발<NA>2017-05-30
12산업재산권 출원 및 등록특허캐놀라 이벤트를 선별하기 위한 프라이머 세트, 방법 및 키트<NA>2017-05-18
23산업재산권 출원 및 등록특허정규화 지수를 이용한 토지이용에 따른 도시 열섬 취약 특성 분석 시스템 및 방법서울대학교산학협력단2017-11-24
34산업재산권 출원 및 등록특허야생동물 모니터링 시스템 및 그 방법국립생태원2017-09-22
45산업재산권 출원 및 등록기타 산업재산권프로그램 저작권한국저작권위원회2018-03-22
56산업재산권 출원 및 등록특허생태환경 연구 시스템 및 그 방법국립생태원2017-09-06
67산업재산권 출원 및 등록기타 산업재산권컴퓨터프로그램저작물한국저작권위원회2017-09-18
78산업재산권 출원 및 등록특허확공용 절삭날을 구비한 드릴 장한국기계연구원 국립생태원2017-11-06
89산업재산권 출원 및 등록특허확공용 절삭날을 구비한 드릴 장치국립생태원2017-11-06
910산업재산권 출원 및 등록특허An isolated gene expressed in response to heat treatment in Korean fir of Abies genus국립생태원2017-06-16
일련번호분야산업재산권종류발명명칭출원등록기관명출원등록
4041산업재산권 출원 및 등록특허무압밀 피스톤 주상코어시료 수동채취기 및 그 방법국립생태원2020-01-20
4142산업재산권 출원 및 등록기타 산업재산권저작권한국저작권위원회2021-01-26
4243산업재산권 출원 및 등록기타 산업재산권프로그램저작권<NA>2020-12-17
4344산업재산권 출원 및 등록특허조류 번식생태 모니터링 시스템 및 그 방법국립생태원2018-10-04
4445산업재산권 출원 및 등록기타 산업재산권프로그램저작권한국저작권위원회2019-08-21
4546산업재산권 출원 및 등록기타 산업재산권프로그램저작권한국저작권위원회2019-08-21
4647산업재산권 출원 및 등록특허생태환경 연구 시스템 및 그 방법<NA>2019-06-28
4748산업재산권 출원 및 등록특허유전자변형 옥수수의 동시 검출 방법국립생태원2020-10-16
4849산업재산권 출원 및 등록기타 산업재산권기온도산승에 따른 생물종의 위험성 평가 프로그램국립생태원2020-12-03
4950산업재산권 출원 및 등록특허뉴트리아 포획장치(trap for Nutria)국립생태원2020-06-17