Overview

Dataset statistics

Number of variables3
Number of observations108
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.7 KiB
Average record size in memory25.2 B

Variable types

Categorical2
Text1

Dataset

Description산림에 나무를 심는 데에 있어 권장하는 수종에 대한 데이터로 경제림 조성용 집중 조림수종, 조림 가능수종(바이오매스용 조림수종, 용재수종, 경관수종, 특용수종, 유실수종, 내공해수종, 내음수종, 내화수종)에 대한 설명
Author산림청
URLhttps://www.data.go.kr/data/15040593/fileData.do

Alerts

지역 및 조림구분 is highly overall correlated with 분류High correlation
분류 is highly overall correlated with 지역 및 조림구분High correlation

Reproduction

Analysis started2023-12-12 15:40:01.719406
Analysis finished2023-12-12 15:40:02.052822
Duration0.33 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

분류
Categorical

HIGH CORRELATION 

Distinct3
Distinct (%)2.8%
Missing0
Missing (%)0.0%
Memory size996.0 B
조림 가능수종
87 
경제림 조성용 집중 조림수종
15 
바이오매스용 조림수종
 
6

Length

Max length15
Median length7
Mean length8.3333333
Min length7

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경제림 조성용 집중 조림수종
2nd row경제림 조성용 집중 조림수종
3rd row경제림 조성용 집중 조림수종
4th row경제림 조성용 집중 조림수종
5th row경제림 조성용 집중 조림수종

Common Values

ValueCountFrequency (%)
조림 가능수종 87
80.6%
경제림 조성용 집중 조림수종 15
 
13.9%
바이오매스용 조림수종 6
 
5.6%

Length

2023-12-13T00:40:02.151409image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T00:40:02.294589image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
조림 87
35.4%
가능수종 87
35.4%
조림수종 21
 
8.5%
경제림 15
 
6.1%
조성용 15
 
6.1%
집중 15
 
6.1%
바이오매스용 6
 
2.4%

지역 및 조림구분
Categorical

HIGH CORRELATION 

Distinct12
Distinct (%)11.1%
Missing0
Missing (%)0.0%
Memory size996.0 B
용재수종
27 
경관수종
21 
특용수종
13 
내공해수종
12 
바이오매스용 조림수종
Other values (7)
29 

Length

Max length11
Median length4
Mean length4.9722222
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row강원·경북
2nd row강원·경북
3rd row강원·경북
4th row강원·경북
5th row경기, 충남·북

Common Values

ValueCountFrequency (%)
용재수종 27
25.0%
경관수종 21
19.4%
특용수종 13
12.0%
내공해수종 12
11.1%
바이오매스용 조림수종 6
 
5.6%
내음수종 6
 
5.6%
강원·경북 4
 
3.7%
경기, 충남·북 4
 
3.7%
전남·북, 경남 4
 
3.7%
유실수종 4
 
3.7%
Other values (2) 7
 
6.5%

Length

2023-12-13T00:40:02.465919image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
용재수종 27
21.1%
경관수종 21
16.4%
특용수종 13
10.2%
내공해수종 12
9.4%
바이오매스용 6
 
4.7%
조림수종 6
 
4.7%
내음수종 6
 
4.7%
경남 4
 
3.1%
내화수종 4
 
3.1%
유실수종 4
 
3.1%
Other values (7) 25
19.5%
Distinct82
Distinct (%)75.9%
Missing0
Missing (%)0.0%
Memory size996.0 B
2023-12-13T00:40:02.849619image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length7
Median length4
Mean length3.8703704
Min length2

Characters and Unicode

Total characters418
Distinct characters114
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique66 ?
Unique (%)61.1%

Sample

1st row소나무
2nd row낙엽송
3rd row잣나무
4th row참나무류
5th row소나무
ValueCountFrequency (%)
백합나무 5
 
4.6%
소나무 4
 
3.7%
참나무류 4
 
3.7%
편백 3
 
2.8%
음나무 3
 
2.8%
낙엽송 3
 
2.8%
상수리나무 2
 
1.9%
삼나무 2
 
1.9%
서어나무 2
 
1.9%
때죽나무 2
 
1.9%
Other values (72) 78
72.2%
2023-12-13T00:40:03.465869image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
89
21.3%
89
21.3%
11
 
2.6%
7
 
1.7%
7
 
1.7%
6
 
1.4%
6
 
1.4%
6
 
1.4%
5
 
1.2%
5
 
1.2%
Other values (104) 187
44.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 416
99.5%
Space Separator 2
 
0.5%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
89
21.4%
89
21.4%
11
 
2.6%
7
 
1.7%
7
 
1.7%
6
 
1.4%
6
 
1.4%
6
 
1.4%
5
 
1.2%
5
 
1.2%
Other values (103) 185
44.5%
Space Separator
ValueCountFrequency (%)
2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 416
99.5%
Common 2
 
0.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
89
21.4%
89
21.4%
11
 
2.6%
7
 
1.7%
7
 
1.7%
6
 
1.4%
6
 
1.4%
6
 
1.4%
5
 
1.2%
5
 
1.2%
Other values (103) 185
44.5%
Common
ValueCountFrequency (%)
2
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 416
99.5%
ASCII 2
 
0.5%

Most frequent character per block

Hangul
ValueCountFrequency (%)
89
21.4%
89
21.4%
11
 
2.6%
7
 
1.7%
7
 
1.7%
6
 
1.4%
6
 
1.4%
6
 
1.4%
5
 
1.2%
5
 
1.2%
Other values (103) 185
44.5%
ASCII
ValueCountFrequency (%)
2
100.0%

Correlations

2023-12-13T00:40:03.604812image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분류지역 및 조림구분조림수종
분류1.0001.0000.000
지역 및 조림구분1.0001.0000.000
조림수종0.0000.0001.000
2023-12-13T00:40:03.732939image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
지역 및 조림구분분류
지역 및 조림구분1.0000.956
분류0.9561.000
2023-12-13T00:40:03.853577image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
분류지역 및 조림구분
분류1.0000.956
지역 및 조림구분0.9561.000

Missing values

2023-12-13T00:40:01.929007image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T00:40:02.014391image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

분류지역 및 조림구분조림수종
0경제림 조성용 집중 조림수종강원·경북소나무
1경제림 조성용 집중 조림수종강원·경북낙엽송
2경제림 조성용 집중 조림수종강원·경북잣나무
3경제림 조성용 집중 조림수종강원·경북참나무류
4경제림 조성용 집중 조림수종경기, 충남·북소나무
5경제림 조성용 집중 조림수종경기, 충남·북낙엽송
6경제림 조성용 집중 조림수종경기, 충남·북백합나무
7경제림 조성용 집중 조림수종경기, 충남·북참나무류
8경제림 조성용 집중 조림수종전남·북, 경남소나무
9경제림 조성용 집중 조림수종전남·북, 경남편백
분류지역 및 조림구분조림수종
98조림 가능수종내음수종주목
99조림 가능수종내음수종녹나무
100조림 가능수종내음수종전나무
101조림 가능수종내음수종비자나무
102조림 가능수종내음수종서어나무
103조림 가능수종내음수종음나무
104조림 가능수종내화수종황벽나무
105조림 가능수종내화수종굴참나무
106조림 가능수종내화수종아왜나무
107조림 가능수종내화수종동백나무