Overview

Dataset statistics

Number of variables8
Number of observations117
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory7.7 KiB
Average record size in memory67.1 B

Variable types

Numeric1
Categorical4
Text1
DateTime2

Dataset

Description산림과학기술정보서비스(FTIS) 시스템의 과제공고에 대한 데이터로 공고명, 사업명, 공고 내용 등의 정보를 제공함
Author산림청
URLhttps://www.data.go.kr/data/15091874/fileData.do

Alerts

세부사업명 is highly overall correlated with 기준년도 and 2 other fieldsHigh correlation
사업명 is highly overall correlated with 기준년도 and 2 other fieldsHigh correlation
공고번호 is highly overall correlated with 기준년도High correlation
기준년도 is highly overall correlated with 공고번호 and 2 other fieldsHigh correlation
전문기관명 is highly overall correlated with 사업명 and 1 other fieldsHigh correlation
전문기관명 is highly imbalanced (92.9%)Imbalance
공고번호 has unique valuesUnique

Reproduction

Analysis started2023-12-12 01:33:56.824031
Analysis finished2023-12-12 01:33:57.895153
Duration1.07 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

공고번호
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct117
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2019136.9
Minimum2017001
Maximum2021027
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.2 KiB
2023-12-12T10:33:58.012397image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2017001
5-th percentile2017017.8
Q12018008
median2019019
Q32020031
95-th percentile2021020.4
Maximum2021027
Range4026
Interquartile range (IQR)2023

Descriptive statistics

Standard deviation1407.7666
Coefficient of variation (CV)0.00069721206
Kurtosis-1.3083492
Mean2019136.9
Median Absolute Deviation (MAD)1012
Skewness-0.21134696
Sum2.3623901 × 108
Variance1981806.7
MonotonicityNot monotonic
2023-12-12T10:33:58.252182image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
2017006 1
 
0.9%
2017041 1
 
0.9%
2020029 1
 
0.9%
2020028 1
 
0.9%
2021027 1
 
0.9%
2021026 1
 
0.9%
2020043 1
 
0.9%
2020035 1
 
0.9%
2018005 1
 
0.9%
2018004 1
 
0.9%
Other values (107) 107
91.5%
ValueCountFrequency (%)
2017001 1
0.9%
2017006 1
0.9%
2017007 1
0.9%
2017009 1
0.9%
2017010 1
0.9%
2017013 1
0.9%
2017019 1
0.9%
2017021 1
0.9%
2017022 1
0.9%
2017023 1
0.9%
ValueCountFrequency (%)
2021027 1
0.9%
2021026 1
0.9%
2021025 1
0.9%
2021024 1
0.9%
2021023 1
0.9%
2021022 1
0.9%
2021020 1
0.9%
2021019 1
0.9%
2021017 1
0.9%
2021016 1
0.9%

기준년도
Categorical

HIGH CORRELATION 

Distinct5
Distinct (%)4.3%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
2020
35 
2017
22 
2021
22 
2018
21 
2019
17 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2017
2nd row2017
3rd row2017
4th row2017
5th row2017

Common Values

ValueCountFrequency (%)
2020 35
29.9%
2017 22
18.8%
2021 22
18.8%
2018 21
17.9%
2019 17
14.5%

Length

2023-12-12T10:33:58.453187image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:33:58.588042image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2020 35
29.9%
2017 22
18.8%
2021 22
18.8%
2018 21
17.9%
2019 17
14.5%
Distinct105
Distinct (%)89.7%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
2023-12-12T10:33:58.898876image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length71
Median length54
Mean length43.538462
Min length20

Characters and Unicode

Total characters5094
Distinct characters168
Distinct categories11 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique99 ?
Unique (%)84.6%

Sample

1st row2017년도 "신기후체제 대응 연구"사업 시행계획 공고
2nd row2017년도 "산림생명자원 소재발굴 연구" 시행계획 공고
3rd row2017년도 "생물다양성 위협외래생물관리 기술개발사업" 시행계획 공고
4th row2017년도 "융복합기반 임산업의 신산업화 기술개발(RnD)"사업 시행계획 재공고
5th row2017년도 '신기후체제 대응 연구(RnD)"사업 시행계획 재공고
ValueCountFrequency (%)
공고 66
 
7.1%
2020년도 38
 
4.1%
중간평가 35
 
3.8%
신규과제 34
 
3.7%
산림과학기술 33
 
3.5%
선정계획 32
 
3.4%
최종평가 30
 
3.2%
실시 30
 
3.2%
통합 30
 
3.2%
계획 29
 
3.1%
Other values (158) 574
61.7%
2023-12-12T10:33:59.403031image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
850
 
16.7%
2 183
 
3.6%
180
 
3.5%
0 152
 
3.0%
132
 
2.6%
127
 
2.5%
119
 
2.3%
115
 
2.3%
115
 
2.3%
97
 
1.9%
Other values (158) 3024
59.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 3354
65.8%
Space Separator 850
 
16.7%
Decimal Number 496
 
9.7%
Uppercase Letter 92
 
1.8%
Open Punctuation 87
 
1.7%
Close Punctuation 87
 
1.7%
Other Punctuation 58
 
1.1%
Lowercase Letter 35
 
0.7%
Final Punctuation 18
 
0.4%
Initial Punctuation 13
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
180
 
5.4%
132
 
3.9%
127
 
3.8%
119
 
3.5%
115
 
3.4%
115
 
3.4%
97
 
2.9%
94
 
2.8%
91
 
2.7%
91
 
2.7%
Other values (131) 2193
65.4%
Decimal Number
ValueCountFrequency (%)
2 183
36.9%
0 152
30.6%
1 88
17.7%
8 23
 
4.6%
9 20
 
4.0%
7 18
 
3.6%
3 9
 
1.8%
5 2
 
0.4%
4 1
 
0.2%
Other Punctuation
ValueCountFrequency (%)
" 17
29.3%
& 15
25.9%
' 14
24.1%
# 4
 
6.9%
; 4
 
6.9%
, 3
 
5.2%
: 1
 
1.7%
Open Punctuation
ValueCountFrequency (%)
( 76
87.4%
[ 11
 
12.6%
Close Punctuation
ValueCountFrequency (%)
) 76
87.4%
] 11
 
12.6%
Uppercase Letter
ValueCountFrequency (%)
R 46
50.0%
D 46
50.0%
Space Separator
ValueCountFrequency (%)
850
100.0%
Lowercase Letter
ValueCountFrequency (%)
n 35
100.0%
Final Punctuation
ValueCountFrequency (%)
18
100.0%
Initial Punctuation
ValueCountFrequency (%)
13
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 4
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 3354
65.8%
Common 1613
31.7%
Latin 127
 
2.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
180
 
5.4%
132
 
3.9%
127
 
3.8%
119
 
3.5%
115
 
3.4%
115
 
3.4%
97
 
2.9%
94
 
2.8%
91
 
2.7%
91
 
2.7%
Other values (131) 2193
65.4%
Common
ValueCountFrequency (%)
850
52.7%
2 183
 
11.3%
0 152
 
9.4%
1 88
 
5.5%
( 76
 
4.7%
) 76
 
4.7%
8 23
 
1.4%
9 20
 
1.2%
18
 
1.1%
7 18
 
1.1%
Other values (14) 109
 
6.8%
Latin
ValueCountFrequency (%)
R 46
36.2%
D 46
36.2%
n 35
27.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 3354
65.8%
ASCII 1709
33.5%
Punctuation 31
 
0.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
850
49.7%
2 183
 
10.7%
0 152
 
8.9%
1 88
 
5.1%
( 76
 
4.4%
) 76
 
4.4%
R 46
 
2.7%
D 46
 
2.7%
n 35
 
2.0%
8 23
 
1.3%
Other values (15) 134
 
7.8%
Hangul
ValueCountFrequency (%)
180
 
5.4%
132
 
3.9%
127
 
3.8%
119
 
3.5%
115
 
3.4%
115
 
3.4%
97
 
2.9%
94
 
2.8%
91
 
2.7%
91
 
2.7%
Other values (131) 2193
65.4%
Punctuation
ValueCountFrequency (%)
18
58.1%
13
41.9%

사업명
Categorical

HIGH CORRELATION 

Distinct26
Distinct (%)22.2%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
임업기술연구개발(R&D)
20 
신기후체제 대응 연구(R&D)
17 
융복합기반 임산업의 신산업화 기술개발(R&D)
16 
산림생명자원 소재 발굴연구(R&D)
14 
융복합기반의 임산업의 신산업화 기술개발(R&D)
Other values (21)
43 

Length

Max length37
Median length30
Mean length20.444444
Min length13

Unique

Unique11 ?
Unique (%)9.4%

Sample

1st row신기후체제 대응 연구(R&D)
2nd row산림생명자원 소재발굴 연구(산림청)
3rd row생물다양성위협 외래생물관리 기술개발사업(산림청)
4th row융복합기반 임산업의 신산업화 기술개발(R&D)
5th row신기후체제 대응 연구(R&D)

Common Values

ValueCountFrequency (%)
임업기술연구개발(R&D) 20
17.1%
신기후체제 대응 연구(R&D) 17
14.5%
융복합기반 임산업의 신산업화 기술개발(R&D) 16
13.7%
산림생명자원 소재 발굴연구(R&D) 14
12.0%
융복합기반의 임산업의 신산업화 기술개발(R&D) 7
 
6.0%
산림과학기술 실용화 지원사업(R&D) 6
 
5.1%
산림융복합 전문인력 양성사업_RnD 4
 
3.4%
융복합기반의 임산업의 신산업화 기술개발(R&D) 4
 
3.4%
산림융복합 전문인력 양성(대학(원)생 창의도전 아이디어 연구지원) 4
 
3.4%
대학원생 창의도전 아이디어 지원 연구 3
 
2.6%
Other values (16) 22
18.8%

Length

2023-12-12T10:33:59.574354image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
기술개발(r&d 32
 
8.6%
임산업의 27
 
7.2%
신산업화 27
 
7.2%
임업기술연구개발(r&d 20
 
5.3%
대응 18
 
4.8%
연구(r&d 18
 
4.8%
신기후체제 17
 
4.5%
융복합기반 16
 
4.3%
산림생명자원 15
 
4.0%
발굴연구(r&d 14
 
3.7%
Other values (48) 170
45.5%

전문기관명
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)1.7%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
한국임업진흥원
116 
산림청
 
1

Length

Max length7
Median length7
Mean length6.965812
Min length3

Unique

Unique1 ?
Unique (%)0.9%

Sample

1st row한국임업진흥원
2nd row산림청
3rd row한국임업진흥원
4th row한국임업진흥원
5th row한국임업진흥원

Common Values

ValueCountFrequency (%)
한국임업진흥원 116
99.1%
산림청 1
 
0.9%

Length

2023-12-12T10:33:59.717361image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:33:59.854195image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
한국임업진흥원 116
99.1%
산림청 1
 
0.9%
Distinct56
Distinct (%)47.9%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
Minimum2017-01-23 00:00:00
Maximum2021-03-26 00:00:00
2023-12-12T10:33:59.982402image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T10:34:00.208849image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
Distinct62
Distinct (%)53.0%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
Minimum2017-02-03 00:00:00
Maximum2021-06-02 00:00:00
2023-12-12T10:34:00.408113image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T10:34:00.860321image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

세부사업명
Categorical

HIGH CORRELATION 

Distinct26
Distinct (%)22.2%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
임업기술연구개발(R&D)
20 
신기후체제 대응 연구(R&D)
17 
융복합기반 임산업의 신산업화 기술개발(R&D)
16 
산림생명자원 소재 발굴연구(R&D)
14 
융복합기반의 임산업의 신산업화 기술개발(R&D)
Other values (21)
43 

Length

Max length37
Median length30
Mean length20.444444
Min length13

Unique

Unique11 ?
Unique (%)9.4%

Sample

1st row신기후체제 대응 연구(R&D)
2nd row산림생명자원 소재발굴 연구(산림청)
3rd row생물다양성위협 외래생물관리 기술개발사업(산림청)
4th row융복합기반 임산업의 신산업화 기술개발(R&D)
5th row신기후체제 대응 연구(R&D)

Common Values

ValueCountFrequency (%)
임업기술연구개발(R&D) 20
17.1%
신기후체제 대응 연구(R&D) 17
14.5%
융복합기반 임산업의 신산업화 기술개발(R&D) 16
13.7%
산림생명자원 소재 발굴연구(R&D) 14
12.0%
융복합기반의 임산업의 신산업화 기술개발(R&D) 7
 
6.0%
산림과학기술 실용화 지원사업(R&D) 6
 
5.1%
산림융복합 전문인력 양성사업_RnD 4
 
3.4%
융복합기반의 임산업의 신산업화 기술개발(R&D) 4
 
3.4%
산림융복합 전문인력 양성(대학(원)생 창의도전 아이디어 연구지원) 4
 
3.4%
대학원생 창의도전 아이디어 지원 연구 3
 
2.6%
Other values (16) 22
18.8%

Length

2023-12-12T10:34:01.032151image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
기술개발(r&d 32
 
8.6%
임산업의 27
 
7.2%
신산업화 27
 
7.2%
임업기술연구개발(r&d 20
 
5.3%
대응 18
 
4.8%
연구(r&d 18
 
4.8%
신기후체제 17
 
4.5%
융복합기반 16
 
4.3%
산림생명자원 15
 
4.0%
발굴연구(r&d 14
 
3.7%
Other values (48) 170
45.5%

Interactions

2023-12-12T10:33:57.442527image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T10:34:01.142977image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
공고번호기준년도사업명전문기관명접수시작일접수마감일세부사업명
공고번호1.0001.0000.800NaN0.9950.9900.800
기준년도1.0001.0000.8270.0460.9930.9890.827
사업명0.8000.8271.0001.0000.0000.6381.000
전문기관명NaN0.0461.0001.0000.0000.0001.000
접수시작일0.9950.9930.0000.0001.0000.9990.000
접수마감일0.9900.9890.6380.0000.9991.0000.638
세부사업명0.8000.8271.0001.0000.0000.6381.000
2023-12-12T10:34:01.279839image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
전문기관명기준년도세부사업명사업명
전문기관명1.0000.0530.8900.890
기준년도0.0531.0000.5170.517
세부사업명0.8900.5171.0001.000
사업명0.8900.5171.0001.000
2023-12-12T10:34:01.382652image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
공고번호기준년도사업명전문기관명세부사업명
공고번호1.0000.9960.4660.0000.466
기준년도0.9961.0000.5170.0530.517
사업명0.4660.5171.0000.8901.000
전문기관명0.0000.0530.8901.0000.890
세부사업명0.4660.5171.0000.8901.000

Missing values

2023-12-12T10:33:57.644347image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T10:33:57.822078image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

공고번호기준년도공고명사업명전문기관명접수시작일접수마감일세부사업명
0201700620172017년도 "신기후체제 대응 연구"사업 시행계획 공고신기후체제 대응 연구(R&D)한국임업진흥원2017-01-232017-02-03신기후체제 대응 연구(R&D)
1201700120172017년도 "산림생명자원 소재발굴 연구" 시행계획 공고산림생명자원 소재발굴 연구(산림청)산림청2017-01-232017-02-03산림생명자원 소재발굴 연구(산림청)
2201700720172017년도 "생물다양성 위협외래생물관리 기술개발사업" 시행계획 공고생물다양성위협 외래생물관리 기술개발사업(산림청)한국임업진흥원2017-01-232017-02-03생물다양성위협 외래생물관리 기술개발사업(산림청)
3201702120172017년도 "융복합기반 임산업의 신산업화 기술개발(RnD)"사업 시행계획 재공고융복합기반 임산업의 신산업화 기술개발(R&D)한국임업진흥원2017-04-142017-05-15융복합기반 임산업의 신산업화 기술개발(R&D)
4201702220172017년도 '신기후체제 대응 연구(RnD)"사업 시행계획 재공고신기후체제 대응 연구(R&D)한국임업진흥원2017-04-142017-05-15신기후체제 대응 연구(R&D)
5201702620172017년도 임업기술연구개발(RnD)사업 제2차 중간평가 실시 계획 공고임업기술연구개발(R&D)한국임업진흥원2017-04-282017-05-05임업기술연구개발(R&D)
6201700920172017년도 "융복합기반 임산업의 신산업화 기술개발"사업 신규과제 추가접수 공고융복합기반 임산업의 신산업화 기술개발(R&D)한국임업진흥원2017-02-062017-02-13융복합기반 임산업의 신산업화 기술개발(R&D)
7201701020172017년도 "신기후체제 대응 연구"사업 신규 자유공모 과제 추가접수 공고신기후체제 대응 연구(R&D)한국임업진흥원2017-02-062017-02-13신기후체제 대응 연구(R&D)
8201701320172017년도 융복합기반 임산업의 신산업화 기술개발(RnD)사업 제1차 계속과제 중간평가 계획 공고융복합기반 임산업의 신산업화 기술개발(R&D)한국임업진흥원2017-03-012017-03-03융복합기반 임산업의 신산업화 기술개발(R&D)
9201701920172017년도 임업기술연구개발(RnD)사업 제1차 중간평가 실시 계획 공고임업기술연구개발(R&D)한국임업진흥원2017-03-302017-03-30임업기술연구개발(R&D)
공고번호기준년도공고명사업명전문기관명접수시작일접수마감일세부사업명
107202002720202020년도 산림과학기술 실용화 과제 컨설팅 지원사업 공고산림과학기술 실용화 지원사업(R&D)한국임업진흥원2020-02-182020-02-27산림과학기술 실용화 지원사업(R&D)
108202101020212020년도 산림과학기술 연구개발사업(산림융복합 전문인력 양성-산림연구인력 교육훈련, 산림산업특화 연구지원) 통합 중간평가 실시산림융복합 전문인력 양성사업_RnD한국임업진흥원2020-10-212020-11-11산림융복합 전문인력 양성사업_RnD
109202101120212020년도 산림과학기술 연구개발사업(산림생명자원 소재 발굴 연구(RnD)사업) 통합 중간평가 실시산림생명자원 소재 발굴연구(R&D)한국임업진흥원2020-10-212020-11-11산림생명자원 소재 발굴연구(R&D)
110202101220212020년도 산림과학기술 연구개발사업(신기후체제 대응 연구(RnD)사업) 통합 중간평가 실시신기후체제 대응 연구(R&D)한국임업진흥원2020-10-212020-11-11신기후체제 대응 연구(R&D)
11120210132021‘20년도 산림과학기술 연구개발사업(임업기술연구개발) 중간평가임업기술연구개발(R&D)한국임업진흥원2020-10-212020-11-13임업기술연구개발(R&D)
11220210142021‘20년도 산림과학기술 연구개발사업(융복합기반의 임산업의 신산업화 기술개발) 중간평가융복합기반의 임산업의 신산업화 기술개발(R&D)한국임업진흥원2020-10-212020-11-13융복합기반의 임산업의 신산업화 기술개발(R&D)
11320210152021‘20년도 산림과학기술 연구개발사업(목재자원의 고부가가치 첨단화 기술 개발) 중간평가목재자원의 고부가가치 첨단화 기술개발(R&D)한국임업진흥원2020-10-212020-11-13목재자원의 고부가가치 첨단화 기술개발(R&D)
114202003920202020년도 대학(원)생 창의도전 아이디어(R&D)사업 최종평가산림융복합 전문인력 양성사업(R&D)한국임업진흥원2020-12-172020-12-20산림융복합 전문인력 양성사업(R&D)
115201901920192020년도 산림과학기술 연구개발사업[대학원생 창의도전 아이디어 지원] 최종평가대학원생 창의도전 아이디어 지원 연구한국임업진흥원2020-04-012020-04-27대학원생 창의도전 아이디어 지원 연구
116201902020192020년도 산림과학기술 연구개발사업[대학원생 창의도전 아이디어 지원] 최종평가대학원생 창의도전 아이디어 지원 연구한국임업진흥원2020-04-212020-04-27대학원생 창의도전 아이디어 지원 연구