Overview

Dataset statistics

Number of variables5
Number of observations80
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory3.4 KiB
Average record size in memory43.6 B

Variable types

Numeric2
Categorical2
Text1

Dataset

Description북한 산림과학에 대한 산림경영, 산림보호, 산림조성 대분류별 연구자료 중 간행물(단행본, 잡지, 교과서)에 대한 발행연도, 제목, 저자, 키워드 등 정보를 제공합니다.
Author산림청 국립산림과학원
URLhttps://www.data.go.kr/data/15098902/fileData.do

Alerts

종류 has constant value ""Constant
번호 is highly overall correlated with 발행연도High correlation
발행연도 is highly overall correlated with 번호 and 1 other fieldsHigh correlation
저자 is highly overall correlated with 발행연도High correlation
번호 has unique valuesUnique
제목 has unique valuesUnique

Reproduction

Analysis started2024-04-18 07:04:41.327329
Analysis finished2024-04-18 07:04:42.053332
Duration0.73 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

번호
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct80
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean40.5
Minimum1
Maximum80
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size852.0 B
2024-04-18T16:04:42.119229image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile4.95
Q120.75
median40.5
Q360.25
95-th percentile76.05
Maximum80
Range79
Interquartile range (IQR)39.5

Descriptive statistics

Standard deviation23.2379
Coefficient of variation (CV)0.57377531
Kurtosis-1.2
Mean40.5
Median Absolute Deviation (MAD)20
Skewness0
Sum3240
Variance540
MonotonicityStrictly increasing
2024-04-18T16:04:42.249032image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
1.2%
42 1
 
1.2%
60 1
 
1.2%
59 1
 
1.2%
58 1
 
1.2%
57 1
 
1.2%
56 1
 
1.2%
55 1
 
1.2%
54 1
 
1.2%
53 1
 
1.2%
Other values (70) 70
87.5%
ValueCountFrequency (%)
1 1
1.2%
2 1
1.2%
3 1
1.2%
4 1
1.2%
5 1
1.2%
6 1
1.2%
7 1
1.2%
8 1
1.2%
9 1
1.2%
10 1
1.2%
ValueCountFrequency (%)
80 1
1.2%
79 1
1.2%
78 1
1.2%
77 1
1.2%
76 1
1.2%
75 1
1.2%
74 1
1.2%
73 1
1.2%
72 1
1.2%
71 1
1.2%

종류
Categorical

CONSTANT 

Distinct1
Distinct (%)1.2%
Missing0
Missing (%)0.0%
Memory size772.0 B
단행본
80 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row단행본
2nd row단행본
3rd row단행본
4th row단행본
5th row단행본

Common Values

ValueCountFrequency (%)
단행본 80
100.0%

Length

2024-04-18T16:04:42.384118image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-18T16:04:42.473567image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
단행본 80
100.0%

발행연도
Real number (ℝ)

HIGH CORRELATION 

Distinct16
Distinct (%)20.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2018.175
Minimum2005
Maximum2021
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size852.0 B
2024-04-18T16:04:42.556362image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2005
5-th percentile2008.95
Q12018
median2019.5
Q32020
95-th percentile2021
Maximum2021
Range16
Interquartile range (IQR)2

Descriptive statistics

Standard deviation3.6794847
Coefficient of variation (CV)0.0018231742
Kurtosis4.046587
Mean2018.175
Median Absolute Deviation (MAD)0.5
Skewness-2.150619
Sum161454
Variance13.538608
MonotonicityNot monotonic
2024-04-18T16:04:42.659347image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=16)
ValueCountFrequency (%)
2020 27
33.8%
2019 18
22.5%
2021 13
16.2%
2018 6
 
7.5%
2015 3
 
3.8%
2014 2
 
2.5%
2017 2
 
2.5%
2011 1
 
1.2%
2016 1
 
1.2%
2012 1
 
1.2%
Other values (6) 6
 
7.5%
ValueCountFrequency (%)
2005 1
 
1.2%
2006 1
 
1.2%
2007 1
 
1.2%
2008 1
 
1.2%
2009 1
 
1.2%
2010 1
 
1.2%
2011 1
 
1.2%
2012 1
 
1.2%
2014 2
2.5%
2015 3
3.8%
ValueCountFrequency (%)
2021 13
16.2%
2020 27
33.8%
2019 18
22.5%
2018 6
 
7.5%
2017 2
 
2.5%
2016 1
 
1.2%
2015 3
 
3.8%
2014 2
 
2.5%
2012 1
 
1.2%
2011 1
 
1.2%

제목
Text

UNIQUE 

Distinct80
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size772.0 B
2024-04-18T16:04:42.927825image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length79
Median length62
Mean length25.125
Min length9

Characters and Unicode

Total characters2010
Distinct characters203
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique80 ?
Unique (%)100.0%

Sample

1st row북한 산림 동향 분석(2019 상반기)
2nd row북한 산림복구 관련 시나리오 구상 및 모니터링 지표개발
3rd row북한 산림복구지원을 위한 거버넌스 구축 및 운영 방안
4th row북한 시장화 확산에 대응한 대북 산림복구 지원전략
5th row북한의 산림·임업 동향 및 임업기술(Ⅰ)
ValueCountFrequency (%)
월간 40
 
9.4%
북한산림 40
 
9.4%
22
 
5.2%
톺아보기_2020 22
 
5.2%
동향 19
 
4.5%
북한의 16
 
3.8%
북한 13
 
3.1%
산림·임업 13
 
3.1%
톺아보기_2019 12
 
2.8%
nifos 8
 
1.9%
Other values (166) 219
51.7%
2024-04-18T16:04:43.346331image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
344
 
17.1%
86
 
4.3%
85
 
4.2%
2 79
 
3.9%
78
 
3.9%
78
 
3.9%
0 73
 
3.6%
69
 
3.4%
50
 
2.5%
48
 
2.4%
Other values (193) 1020
50.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1242
61.8%
Space Separator 344
 
17.1%
Decimal Number 243
 
12.1%
Connector Punctuation 41
 
2.0%
Uppercase Letter 39
 
1.9%
Other Punctuation 33
 
1.6%
Close Punctuation 18
 
0.9%
Open Punctuation 18
 
0.9%
Lowercase Letter 18
 
0.9%
Letter Number 14
 
0.7%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
86
 
6.9%
85
 
6.8%
78
 
6.3%
78
 
6.3%
69
 
5.6%
50
 
4.0%
48
 
3.9%
43
 
3.5%
41
 
3.3%
40
 
3.2%
Other values (152) 624
50.2%
Decimal Number
ValueCountFrequency (%)
2 79
32.5%
0 73
30.0%
1 40
16.5%
9 17
 
7.0%
8 8
 
3.3%
4 6
 
2.5%
3 6
 
2.5%
5 5
 
2.1%
6 5
 
2.1%
7 4
 
1.6%
Letter Number
ValueCountFrequency (%)
2
14.3%
2
14.3%
2
14.3%
2
14.3%
1
7.1%
1
7.1%
1
7.1%
1
7.1%
1
7.1%
1
7.1%
Uppercase Letter
ValueCountFrequency (%)
S 9
23.1%
I 9
23.1%
F 9
23.1%
N 8
20.5%
A 2
 
5.1%
G 1
 
2.6%
D 1
 
2.6%
Lowercase Letter
ValueCountFrequency (%)
o 9
50.0%
s 3
 
16.7%
t 2
 
11.1%
a 1
 
5.6%
l 1
 
5.6%
e 1
 
5.6%
r 1
 
5.6%
Other Punctuation
ValueCountFrequency (%)
· 13
39.4%
, 11
33.3%
: 9
27.3%
Space Separator
ValueCountFrequency (%)
344
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 41
100.0%
Close Punctuation
ValueCountFrequency (%)
) 18
100.0%
Open Punctuation
ValueCountFrequency (%)
( 18
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1242
61.8%
Common 697
34.7%
Latin 71
 
3.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
86
 
6.9%
85
 
6.8%
78
 
6.3%
78
 
6.3%
69
 
5.6%
50
 
4.0%
48
 
3.9%
43
 
3.5%
41
 
3.3%
40
 
3.2%
Other values (152) 624
50.2%
Latin
ValueCountFrequency (%)
S 9
12.7%
I 9
12.7%
o 9
12.7%
F 9
12.7%
N 8
11.3%
s 3
 
4.2%
2
 
2.8%
2
 
2.8%
t 2
 
2.8%
A 2
 
2.8%
Other values (14) 16
22.5%
Common
ValueCountFrequency (%)
344
49.4%
2 79
 
11.3%
0 73
 
10.5%
_ 41
 
5.9%
1 40
 
5.7%
) 18
 
2.6%
( 18
 
2.6%
9 17
 
2.4%
· 13
 
1.9%
, 11
 
1.6%
Other values (7) 43
 
6.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1242
61.8%
ASCII 741
36.9%
Number Forms 14
 
0.7%
None 13
 
0.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
344
46.4%
2 79
 
10.7%
0 73
 
9.9%
_ 41
 
5.5%
1 40
 
5.4%
) 18
 
2.4%
( 18
 
2.4%
9 17
 
2.3%
, 11
 
1.5%
S 9
 
1.2%
Other values (20) 91
 
12.3%
Hangul
ValueCountFrequency (%)
86
 
6.9%
85
 
6.8%
78
 
6.3%
78
 
6.3%
69
 
5.6%
50
 
4.0%
48
 
3.9%
43
 
3.5%
41
 
3.3%
40
 
3.2%
Other values (152) 624
50.2%
None
ValueCountFrequency (%)
· 13
100.0%
Number Forms
ValueCountFrequency (%)
2
14.3%
2
14.3%
2
14.3%
2
14.3%
1
7.1%
1
7.1%
1
7.1%
1
7.1%
1
7.1%
1
7.1%

저자
Categorical

HIGH CORRELATION 

Distinct35
Distinct (%)43.8%
Missing0
Missing (%)0.0%
Memory size772.0 B
산림청
40 
박경석, 이성연, 박소영
김은희, 김경민, 김명길, 오삼언, 김서린
 
2
김은희, 이정민
 
2
박경석, 이성연, 김종호, 박소영
 
1
Other values (30)
30 

Length

Max length38
Median length3
Mean length10.0125
Min length3

Unique

Unique31 ?
Unique (%)38.8%

Sample

1st row김은희, 양아람, 오삼언, 김서린, 김경민
2nd row박경석, 이성연, 박소영
3rd row박소영, 박경석
4th row박경석, 송민경
5th row박경석, 이성연, 박소영

Common Values

ValueCountFrequency (%)
산림청 40
50.0%
박경석, 이성연, 박소영 5
 
6.2%
김은희, 김경민, 김명길, 오삼언, 김서린 2
 
2.5%
김은희, 이정민 2
 
2.5%
박경석, 이성연, 김종호, 박소영 1
 
1.2%
김경민, 김서린, 김은희 1
 
1.2%
김서린, 김경민, 김은희 1
 
1.2%
<NA> 1
 
1.2%
박경석, 송민경, 박기형 1
 
1.2%
박경석, 이성연, 유병일, 박소영 1
 
1.2%
Other values (25) 25
31.2%

Length

2024-04-18T16:04:43.470875image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
산림청 40
20.8%
김은희 22
11.5%
박경석 16
 
8.3%
김경민 15
 
7.8%
박소영 12
 
6.2%
이성연 10
 
5.2%
오삼언 10
 
5.2%
양아람 10
 
5.2%
임중빈 7
 
3.6%
김명길 6
 
3.1%
Other values (31) 44
22.9%

Interactions

2024-04-18T16:04:41.721085image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-04-18T16:04:41.533566image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-04-18T16:04:41.812135image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-04-18T16:04:41.625750image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-04-18T16:04:43.546066image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
번호발행연도제목저자
번호1.0000.7511.0000.685
발행연도0.7511.0001.0000.953
제목1.0001.0001.0001.000
저자0.6850.9531.0001.000
2024-04-18T16:04:43.633224image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
번호발행연도저자
번호1.0000.5440.246
발행연도0.5441.0000.599
저자0.2460.5991.000

Missing values

2024-04-18T16:04:41.921208image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-04-18T16:04:42.014247image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

번호종류발행연도제목저자
01단행본2019북한 산림 동향 분석(2019 상반기)김은희, 양아람, 오삼언, 김서린, 김경민
12단행본2015북한 산림복구 관련 시나리오 구상 및 모니터링 지표개발박경석, 이성연, 박소영
23단행본2014북한 산림복구지원을 위한 거버넌스 구축 및 운영 방안박소영, 박경석
34단행본2017북한 시장화 확산에 대응한 대북 산림복구 지원전략박경석, 송민경
45단행본2015북한의 산림·임업 동향 및 임업기술(Ⅰ)박경석, 이성연, 박소영
56단행본2018북한의 산림·임업 동향 및 임업기술(Ⅳ)박경석, 김경민, 김은희, 이종민, 오삼언
67단행본2019북한의 산림·임업 동향 및 임업기술(Ⅴ)김은희, 김경민, 김명길, 오삼언, 김서린
78단행본2019북한의 산림·임업 동향 및 임업기술(Ⅵ)김은희, 김경민, 김명길, 오삼언, 김서린
89단행본2005북한의 산림·임업 동향 및 주요수종(Ⅱ)박경석, 오정수
910단행본2006북한의 산림·임업 동향 및 주요수종(Ⅲ)박경석, 이성연, 박상미
번호종류발행연도제목저자
7071단행본2018NIFoS 국제산림정책토픽 제73호: 중국 임산물 수출지원정책 현황과 시사점이호상, 김은희
7172단행본2019NIFoS 국제산림정책토픽 제81호: 북한 임농복합경영 추진 현황 및 동향김경민, 김은희, 임중빈, 김문섭, 김명길
7273단행본2017NIFoS 산림정책이슈 제84호: 중국 소비자의 임산제품에 대한 인식조사 결과 및 시사점김은희, 이정민
7374단행본2019NIFoS 산림정책토픽 제85호: 베트남 개혁개방정책 분석을 통한 북한 변화 전망김은희, 김동현
7475단행본2021숲속의 한반도 실현을 위한 남북한 통합 산림관리방안 연구김은희, 양아람, 임중빈, 김경민, 오삼언, 박소희, 김명길
7576단행본2020위성영상과 AI를 활용한 북한산림정보 구축 방법 개발김경민, 임중빈, 김은희, 양아람, 김서린, 박진우, 박주원
7677단행본2020북한의 임농복합경영 알아보기양아람, 김은희, 임중빈, 김경민
7778단행본2018NIFoS 산림정책이슈 제113호: 한국전쟁 이후 남북한 산림변화 비교 및 김정은 집권 이후 북한의 산림복구전략김경민
7879단행본2019북한 산림복구를 위한 적정기술 발굴 및 실행모델 구상박경석, 김경민, 송민경, 조민석, 김동엽, 고상현, 김용석, 권진오
7980단행본2015북한 상시모니터링 지역의 산림황폐지 분류도: 평양시, 개성시, 안주시, 신의주시, 혜산시, 고성군, 수안군, 북청군, 위원군, 삼수군, 무산군김경민, 유재심, 김철민, 문건수, 김은숙, 김소라