Overview

Dataset statistics

Number of variables7
Number of observations1143
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory64.9 KiB
Average record size in memory58.1 B

Variable types

Numeric2
Categorical5

Dataset

Description농림수산식품 식품·유통R&D 과제 정보
Author농림식품기술기획평가원
URLhttps://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220211000000001846

Alerts

과제명 has a high cardinality: 951 distinct values High cardinality
주관기관명 has a high cardinality: 349 distinct values High cardinality
총연구기간_시작일 has a high cardinality: 81 distinct values High cardinality
총연구기간_종료일 has a high cardinality: 81 distinct values High cardinality
순번 has unique values Unique

Reproduction

Analysis started2022-08-12 14:43:37.587940
Analysis finished2022-08-12 14:43:39.995637
Duration2.41 seconds
Software versionpandas-profiling v3.2.0
Download configurationconfig.json

Variables

순번
Real number (ℝ≥0)

UNIQUE

Distinct1143
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean572
Minimum1
Maximum1143
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size10.2 KiB
2022-08-12T23:43:40.083578image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile58.1
Q1286.5
median572
Q3857.5
95-th percentile1085.9
Maximum1143
Range1142
Interquartile range (IQR)571

Descriptive statistics

Standard deviation330.0999849
Coefficient of variation (CV)0.5770978756
Kurtosis-1.2
Mean572
Median Absolute Deviation (MAD)286
Skewness0
Sum653796
Variance108966
MonotonicityStrictly increasing
2022-08-12T23:43:40.277913image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
11
 
0.1%
181
 
0.1%
31
 
0.1%
41
 
0.1%
51
 
0.1%
61
 
0.1%
71
 
0.1%
81
 
0.1%
91
 
0.1%
191
 
0.1%
Other values (1133)1133
99.1%
ValueCountFrequency (%)
11
0.1%
21
0.1%
31
0.1%
41
0.1%
51
0.1%
61
0.1%
71
0.1%
81
0.1%
91
0.1%
101
0.1%
ValueCountFrequency (%)
11431
0.1%
11421
0.1%
11411
0.1%
11401
0.1%
11391
0.1%
11381
0.1%
11371
0.1%
11361
0.1%
11351
0.1%
11341
0.1%

과제명
Categorical

HIGH CARDINALITY

Distinct951
Distinct (%)83.2%
Missing0
Missing (%)0.0%
Memory size9.1 KiB
고품질의 발효차 생산을 위한 산업화 공정 및 제품 개발
 
3
장류를 이용한 소스류 산업화 기술 개발
 
3
맥문동의 가공기술개발을 통한 홍문동의 제조와 이를 이용한 기능성 제품 개발
 
3
곤충자원의 식ㆍ약용 소재화를 위한 약리성 검정 및 독성평가
 
3
액상 식품의 미생물 안전성 확보를 위한 자외선-광촉매 비열처리 시스템 개발과 적용
 
3
Other values (946)
1128 

Length

Max length77
Median length59
Mean length32.09536308
Min length7

Unique

Unique804 ?
Unique (%)70.3%

Sample

1st row다양한 식품제조공정에서의 PAH제거용 흡착제의 효능 평가 및 적용
2nd row임업기술연구개발사업의 효율적 성과평가 및 연구관리 전략연구
3rd rowFood color therapy 및 초고압 공정을 적용한 이유식 개발 및 상품화
4th row고체발효기술을 활용한 발효콩 분말 및 발효콩유지 개발 및 생산
5th row고품질 안전한 과실 증류주 제조 및 각 공정의 산업화 기술 개발

Common Values

ValueCountFrequency (%)
고품질의 발효차 생산을 위한 산업화 공정 및 제품 개발3
 
0.3%
장류를 이용한 소스류 산업화 기술 개발3
 
0.3%
맥문동의 가공기술개발을 통한 홍문동의 제조와 이를 이용한 기능성 제품 개발3
 
0.3%
곤충자원의 식ㆍ약용 소재화를 위한 약리성 검정 및 독성평가3
 
0.3%
액상 식품의 미생물 안전성 확보를 위한 자외선-광촉매 비열처리 시스템 개발과 적용3
 
0.3%
양파껍질로부터 체지방저하효과를 가지는 건강기능성식품의 개발3
 
0.3%
보리 및 콩을 활용한 피부미용개선 기능성식품 개발3
 
0.3%
나노구조 제어 및 신공정 복합기술에 의한 방충기능 다층필름 개발3
 
0.3%
신가공기술을 이용한 수출용 간편편이 한식류 육가공품 개발3
 
0.3%
신선 식품의 품질 보존을 위한 비관류순환 냉각시스템 개발3
 
0.3%
Other values (941)1113
97.4%

Length

2022-08-12T23:43:40.542745image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
615
 
7.0%
개발544
 
6.2%
이용한233
 
2.7%
위한152
 
1.7%
기능성147
 
1.7%
연구142
 
1.6%
기술104
 
1.2%
활용한61
 
0.7%
분석49
 
0.6%
제품47
 
0.5%
Other values (2900)6670
76.1%

주관기관명
Categorical

HIGH CARDINALITY

Distinct349
Distinct (%)30.5%
Missing0
Missing (%)0.0%
Memory size9.1 KiB
농촌진흥청 본청
217 
농촌진흥청
93 
한국식품연구원
80 
국립수산과학원
 
17
서울대학교
 
16
Other values (344)
720 

Length

Max length66
Median length22
Mean length8.097112861
Min length2

Unique

Unique173 ?
Unique (%)15.1%

Sample

1st row동국대학교(서울)
2nd row큐앤에이경영컨설팅(주)
3rd row차바이오에프앤씨
4th row(주)농심
5th row(주)배혜정도가

Common Values

ValueCountFrequency (%)
농촌진흥청 본청217
 
19.0%
농촌진흥청93
 
8.1%
한국식품연구원80
 
7.0%
국립수산과학원17
 
1.5%
서울대학교16
 
1.4%
충남대학교13
 
1.1%
충북대학교10
 
0.9%
전북대학교9
 
0.8%
전남대학교9
 
0.8%
고려대학교(서울)8
 
0.7%
Other values (339)671
58.7%

Length

2022-08-12T23:43:40.790665image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
농촌진흥청310
19.9%
본청217
 
13.9%
산학협력단95
 
6.1%
한국식품연구원86
 
5.5%
주식회사20
 
1.3%
서울대학교20
 
1.3%
국립수산과학원17
 
1.1%
충남대학교13
 
0.8%
충북대학교12
 
0.8%
전남대학교12
 
0.8%
Other values (344)757
48.6%

총연구기간_시작일
Categorical

HIGH CARDINALITY

Distinct81
Distinct (%)7.1%
Missing0
Missing (%)0.0%
Memory size9.1 KiB
2010-01-01
104 
2010-07-01
86 
2009-04-10
82 
2009-01-01
78 
2012-02-01
75 
Other values (76)
718 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique25 ?
Unique (%)2.2%

Sample

1st row2012-12-21
2nd row2012-12-20
3rd row2012-12-18
4th row2012-12-18
5th row2012-12-18

Common Values

ValueCountFrequency (%)
2010-01-01104
 
9.1%
2010-07-0186
 
7.5%
2009-04-1082
 
7.2%
2009-01-0178
 
6.8%
2012-02-0175
 
6.6%
2011-12-2670
 
6.1%
2012-01-0160
 
5.2%
2011-03-0158
 
5.1%
2011-08-1952
 
4.5%
2012-08-0847
 
4.1%
Other values (71)431
37.7%

Length

2022-08-12T23:43:41.112944image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
2010-01-01104
 
9.1%
2010-07-0186
 
7.5%
2009-04-1082
 
7.2%
2009-01-0178
 
6.8%
2012-02-0175
 
6.6%
2011-12-2670
 
6.1%
2012-01-0160
 
5.2%
2011-03-0158
 
5.1%
2011-08-1952
 
4.5%
2012-08-0847
 
4.1%
Other values (71)431
37.7%

총연구기간_종료일
Categorical

HIGH CARDINALITY

Distinct81
Distinct (%)7.1%
Missing0
Missing (%)0.0%
Memory size9.1 KiB
2012-12-31
240 
2013-12-31
138 
2014-12-31
102 
2013-06-30
73 
2012-04-09
69 
Other values (76)
521 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique26 ?
Unique (%)2.3%

Sample

1st row2015-12-20
2nd row2013-06-20
3rd row2014-12-17
4th row2014-12-17
5th row2015-12-17

Common Values

ValueCountFrequency (%)
2012-12-31240
21.0%
2013-12-31138
12.1%
2014-12-31102
 
8.9%
2013-06-3073
 
6.4%
2012-04-0969
 
6.0%
2011-12-3161
 
5.3%
2014-12-2549
 
4.3%
2014-08-1843
 
3.8%
2014-09-2831
 
2.7%
2015-08-0729
 
2.5%
Other values (71)308
26.9%

Length

2022-08-12T23:43:41.256281image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
2012-12-31240
21.0%
2013-12-31138
12.1%
2014-12-31102
 
8.9%
2013-06-3073
 
6.4%
2012-04-0969
 
6.0%
2011-12-3161
 
5.3%
2014-12-2549
 
4.3%
2014-08-1843
 
3.8%
2014-09-2831
 
2.7%
2015-08-0729
 
2.5%
Other values (71)308
26.9%

총연구비(백만원)
Real number (ℝ≥0)

Distinct192
Distinct (%)16.8%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean137.4094864
Minimum5
Maximum1500
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size10.2 KiB
2022-08-12T23:43:41.438133image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum5
5-th percentile30
Q159.3675
median100
Q3160
95-th percentile349.24
Maximum1500
Range1495
Interquartile range (IQR)100.6325

Descriptive statistics

Standard deviation143.3351107
Coefficient of variation (CV)1.043123837
Kurtosis25.8913499
Mean137.4094864
Median Absolute Deviation (MAD)50
Skewness4.151203748
Sum157059.043
Variance20544.95397
MonotonicityNot monotonic
2022-08-12T23:43:41.675006image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
10080
 
7.0%
5070
 
6.1%
8056
 
4.9%
7054
 
4.7%
3051
 
4.5%
4050
 
4.4%
6045
 
3.9%
15044
 
3.8%
12041
 
3.6%
13038
 
3.3%
Other values (182)614
53.7%
ValueCountFrequency (%)
51
 
0.1%
104
 
0.3%
154
 
0.3%
173
 
0.3%
17.51
 
0.1%
192
 
0.2%
2010
0.9%
221
 
0.1%
22.21
 
0.1%
232
 
0.2%
ValueCountFrequency (%)
15002
0.2%
12501
 
0.1%
10801
 
0.1%
10551
 
0.1%
10004
0.3%
8001
 
0.1%
794.0551
 
0.1%
7701
 
0.1%
7003
0.3%
6851
 
0.1%

사업명
Categorical

Distinct42
Distinct (%)3.7%
Missing0
Missing (%)0.0%
Memory size9.1 KiB
고부가가치식품기술개발
322 
농업현장실용화기술개발
154 
고부가가치식품기술개발['10신규]
129 
농업기술경영연구
70 
국책기술개발
67 
Other values (37)
401 

Length

Max length25
Median length22
Mean length11.0183727
Min length6

Unique

Unique7 ?
Unique (%)0.6%

Sample

1st row수출전략기술개발사업
2nd row임업기술연구개발사업
3rd row고부가가치식품기술개발
4th row고부가가치식품기술개발
5th row고부가가치식품기술개발

Common Values

ValueCountFrequency (%)
고부가가치식품기술개발322
28.2%
농업현장실용화기술개발154
13.5%
고부가가치식품기술개발['10신규]129
11.3%
농업기술경영연구70
 
6.1%
국책기술개발67
 
5.9%
농식품자원연구50
 
4.4%
농산물안전성연구44
 
3.8%
농식품위해요소안전관리기반 및 평가체계구축39
 
3.4%
차세대바이오그린2132
 
2.8%
생명산업기술개발21
 
1.8%
Other values (32)215
18.8%

Length

2022-08-12T23:43:41.869888image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
고부가가치식품기술개발322
26.1%
농업현장실용화기술개발154
12.5%
고부가가치식품기술개발['10신규129
10.5%
농업기술경영연구70
 
5.7%
국책기술개발67
 
5.4%
농식품자원연구50
 
4.1%
농산물안전성연구44
 
3.6%
농식품위해요소안전관리기반39
 
3.2%
39
 
3.2%
평가체계구축39
 
3.2%
Other values (36)280
22.7%

Interactions

2022-08-12T23:43:38.917060image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-08-12T23:43:38.471206image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-08-12T23:43:39.128181image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-08-12T23:43:38.724531image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Correlations

2022-08-12T23:43:42.003308image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
2022-08-12T23:43:42.168714image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
2022-08-12T23:43:42.313349image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.
2022-08-12T23:43:42.489724image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Phik (φk)

Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.
2022-08-12T23:43:42.681567image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Cramér's V (φc)

Cramér's V is an association measure for nominal random variables. The coefficient ranges from 0 to 1, with 0 indicating independence and 1 indicating perfect association. The empirical estimators used for Cramér's V have been proved to be biased, even for large samples. We use a bias-corrected measure that has been proposed by Bergsma in 2013 that can be found here.

Missing values

2022-08-12T23:43:39.553663image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
A simple visualization of nullity by column.
2022-08-12T23:43:39.890791image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

First rows

순번과제명주관기관명총연구기간_시작일총연구기간_종료일총연구비(백만원)사업명
01다양한 식품제조공정에서의 PAH제거용 흡착제의 효능 평가 및 적용동국대학교(서울)2012-12-212015-12-20130.0수출전략기술개발사업
12임업기술연구개발사업의 효율적 성과평가 및 연구관리 전략연구큐앤에이경영컨설팅(주)2012-12-202013-06-2080.0임업기술연구개발사업
23Food color therapy 및 초고압 공정을 적용한 이유식 개발 및 상품화차바이오에프앤씨2012-12-182014-12-17130.0고부가가치식품기술개발
34고체발효기술을 활용한 발효콩 분말 및 발효콩유지 개발 및 생산(주)농심2012-12-182014-12-17150.0고부가가치식품기술개발
45고품질 안전한 과실 증류주 제조 및 각 공정의 산업화 기술 개발(주)배혜정도가2012-12-182015-12-17280.0고부가가치식품기술개발
56농산물 안전성 제고를 위한 휴대용 잔류농약 검출기 개발중앙대학교(서울)2012-12-182015-12-17400.0첨단기술개발사업
67농수축산물 V-Store 기반기술 개발동국대학교 산학협력단2012-12-182015-12-17500.0첨단기술개발사업
78농식품 이동형 방사능 측정 장비 및 신속분석법 개발한국원자력연구원2012-12-182015-12-17500.0첨단기술개발사업
89닭고기 자동조합개량, 포장장치개발오성시스템2012-12-182014-12-17330.0고부가가치식품기술개발
910레몬, 황칠나무의 체내 중금속 배출, 항산화기능 연구 및 제품개발(주)이푸른2012-12-182014-12-17170.0고부가가치식품기술개발

Last rows

순번과제명주관기관명총연구기간_시작일총연구기간_종료일총연구비(백만원)사업명
11331134모유에서 분리한 Lactobacillus gasseri BNR17의 면역 증강 및 혈당 저하능을 이용한 기능성원료 인정 및 제품화(주)바이오니아2011-08-192014-08-18100.0고부가가치식품기술개발
11341135제주산 농산가공부산물로부터 bioconversion을 통한 체지방 감소 및 면역증강 기능의 고부가 기능성 식품소재 개발과 산업화(주)비케이바이오2011-08-192014-08-18130.0고부가가치식품기술개발
11351136저온 가공 기술의 적용을 통한 국내 농산물 기반 생식 제품의 고부가가치화(주)이롬2011-08-192014-08-18100.0고부가가치식품기술개발
11361137곤충자원의 식ㆍ약용 소재화를 위한 약리성 검정 및 독성평가국립농업과학원2011-08-192014-08-18400.0생명산업기술개발
11371138첨단 소재와 기술을 이용한 건강기능성 향상 치즈의 개발(세부1. 기능성 치즈 제조를 위한 건강 기능성 소재의 개발)(주)동원 F&B2011-08-192014-08-1885.0고부가가치식품기술개발
11381139기능성 들깻잎 추출물을 이용한 간보호 건강기능식품 소재 등록 및 제품화 기술개발바이오버드2011-08-192014-08-18100.0고부가가치식품기술개발
11391140향미가 증진된 고기능성 현미발효물과 응용제품 개발샘표식품(주)2011-08-192014-08-18120.0고부가가치식품기술개발
11401141발효에 의한 희귀 진세노사이드 생산과 이들 성분이 증강된 기능성 홍삼제품 개발한방바이오(주)2011-08-192014-08-18100.0고부가가치식품기술개발
11411142저알레르기 대두 발효기술개발 및 제품화양지푸드2011-08-192014-08-1880.0고부가가치식품기술개발
11421143유전체 분석을 활용한 전통 발효식품의 기능성 표준화 연구중앙대학교 산학협력단2009-04-102014-04-09500.0고부가가치식품기술개발