Overview

Dataset statistics

Number of variables4
Number of observations131
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory4.2 KiB
Average record size in memory33.0 B

Variable types

Categorical3
Unsupported1

Dataset

Description면세유의 지역별 공급현황 자료
Author농림축산식품부
URLhttps://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220217000000002053

Alerts

연도 is highly overall correlated with 지역명 and 1 other fieldsHigh correlation
유종 is highly overall correlated with 연도High correlation
지역명 is highly overall correlated with 연도High correlation
연도 is highly imbalanced (93.5%)Imbalance
공급량(농업인 등의 사용량) is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2023-12-11 03:41:25.319348
Analysis finished2023-12-11 03:41:25.748048
Duration0.43 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연도
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)1.5%
Missing0
Missing (%)0.0%
Memory size1.2 KiB
2022년
130 
* 공급량(농업인 등 사용량)은 농업인 등이 면세유류구입카드로 결재한 물량임
 
1

Length

Max length42
Median length5
Mean length5.2824427
Min length5

Unique

Unique1 ?
Unique (%)0.8%

Sample

1st row2022년
2nd row2022년
3rd row2022년
4th row2022년
5th row2022년

Common Values

ValueCountFrequency (%)
2022년 130
99.2%
* 공급량(농업인 등 사용량)은 농업인 등이 면세유류구입카드로 결재한 물량임 1
 
0.8%

Length

2023-12-11T12:41:25.871307image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T12:41:26.059183image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2022년 130
93.5%
1
 
0.7%
공급량(농업인 1
 
0.7%
1
 
0.7%
사용량)은 1
 
0.7%
농업인 1
 
0.7%
등이 1
 
0.7%
면세유류구입카드로 1
 
0.7%
결재한 1
 
0.7%
물량임 1
 
0.7%

지역명
Categorical

HIGH CORRELATION 

Distinct18
Distinct (%)13.7%
Missing0
Missing (%)0.0%
Memory size1.2 KiB
전남
경기
경남
경북
충북
Other values (13)
86 

Length

Max length4
Median length2
Mean length2.0152672
Min length2

Unique

Unique1 ?
Unique (%)0.8%

Sample

1st row세종
2nd row세종
3rd row세종
4th row세종
5th row세종

Common Values

ValueCountFrequency (%)
전남 9
 
6.9%
경기 9
 
6.9%
경남 9
 
6.9%
경북 9
 
6.9%
충북 9
 
6.9%
제주 9
 
6.9%
전북 9
 
6.9%
충남 9
 
6.9%
강원 9
 
6.9%
대전 7
 
5.3%
Other values (8) 43
32.8%

Length

2023-12-11T12:41:26.286943image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
전남 9
 
6.9%
경남 9
 
6.9%
경북 9
 
6.9%
충북 9
 
6.9%
제주 9
 
6.9%
전북 9
 
6.9%
충남 9
 
6.9%
강원 9
 
6.9%
경기 9
 
6.9%
부산 7
 
5.3%
Other values (8) 43
32.8%

유종
Categorical

HIGH CORRELATION 

Distinct10
Distinct (%)7.6%
Missing0
Missing (%)0.0%
Memory size1.2 KiB
경유
17 
등유
17 
휘발유
17 
가스(차량)
16 
윤활유
16 
Other values (5)
48 

Length

Max length7
Median length6
Mean length4.0458015
Min length2

Unique

Unique1 ?
Unique (%)0.8%

Sample

1st row가스(차량)
2nd row경유
3rd row등유
4th row부생연료유1호
5th row부생연료유2호

Common Values

ValueCountFrequency (%)
경유 17
13.0%
등유 17
13.0%
휘발유 17
13.0%
가스(차량) 16
12.2%
윤활유 16
12.2%
부생연료유2호 13
9.9%
부생연료유1호 12
9.2%
가스(난방) 11
8.4%
중유 11
8.4%
<NA> 1
 
0.8%

Length

2023-12-11T12:41:26.478018image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T12:41:26.710367image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
경유 17
13.0%
등유 17
13.0%
휘발유 17
13.0%
가스(차량 16
12.2%
윤활유 16
12.2%
부생연료유2호 13
9.9%
부생연료유1호 12
9.2%
가스(난방 11
8.4%
중유 11
8.4%
na 1
 
0.8%

공급량(농업인 등의 사용량)
Unsupported

REJECTED  UNSUPPORTED 

Missing0
Missing (%)0.0%
Memory size1.2 KiB

Correlations

2023-12-11T12:41:26.864709image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연도지역명유종
연도1.000NaNNaN
지역명NaN1.0000.000
유종NaN0.0001.000
2023-12-11T12:41:27.010700image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연도유종지역명
연도1.0001.0001.000
유종1.0001.0000.000
지역명1.0000.0001.000
2023-12-11T12:41:27.118334image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연도지역명유종
연도1.0001.0001.000
지역명1.0001.0000.000
유종1.0000.0001.000

Missing values

2023-12-11T12:41:25.543776image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-11T12:41:25.684002image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연도지역명유종공급량(농업인 등의 사용량)
02022년세종가스(차량)6702
12022년세종경유4039693
22022년세종등유1279081
32022년세종부생연료유1호126828
42022년세종부생연료유2호241772
52022년세종윤활유4431
62022년세종휘발유491308
72022년충남가스(난방)1465375
82022년충남가스(차량)151779
92022년충남경유123183717
연도지역명유종공급량(농업인 등의 사용량)
1212022년충북가스(난방)528787
1222022년충북가스(차량)99314
1232022년충북경유50036569
1242022년충북등유23887841
1252022년충북부생연료유1호391487
1262022년충북부생연료유2호63400
1272022년충북윤활유5989
1282022년충북중유24000
1292022년충북휘발유7024076
130* 공급량(농업인 등 사용량)은 농업인 등이 면세유류구입카드로 결재한 물량임<NA><NA>(단위: 리터)