Overview

Dataset statistics

Number of variables5
Number of observations89
Missing cells124
Missing cells (%)27.9%
Duplicate rows17
Duplicate rows (%)19.1%
Total size in memory3.6 KiB
Average record size in memory41.5 B

Variable types

Unsupported2
Text1
Categorical2

Dataset

Description환경, 폐기물에 관한 공공데이터로서 관내 사업장폐기물 배출사업자 현황 정보를 제공합니다.(상호, 폐기물종류, 배출량, 처리방법 등)
Author충청남도
URLhttps://alldam.chungnam.go.kr/index.chungnam?menuCd=DOM_000000201001001001&st=&cds=&orgCd=&apiType=&isOpen=Y&pageIndex=343&beforeMenuCd=DOM_000000201001001000&publicdatapk=15081059

Alerts

Dataset has 17 (19.1%) duplicate rowsDuplicates
Unnamed: 2 is highly overall correlated with Unnamed: 4High correlation
Unnamed: 4 is highly overall correlated with Unnamed: 2High correlation
※사업장일반폐기물 has 62 (69.7%) missing valuesMissing
Unnamed: 1 has 62 (69.7%) missing valuesMissing
※사업장일반폐기물 is an unsupported type, check if it needs cleaning or further analysisUnsupported
Unnamed: 3 is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2024-01-09 21:35:41.980283
Analysis finished2024-01-09 21:35:42.337462
Duration0.36 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

※사업장일반폐기물
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing62
Missing (%)69.7%
Memory size844.0 B

Unnamed: 1
Text

MISSING 

Distinct27
Distinct (%)100.0%
Missing62
Missing (%)69.7%
Memory size844.0 B
2024-01-10T06:35:42.450221image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length16
Median length12
Mean length9.2962963
Min length2

Characters and Unicode

Total characters251
Distinct characters107
Distinct categories5 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique27 ?
Unique (%)100.0%

Sample

1st row상호
2nd row보성롤테크
3rd row한서소방119
4th row농업회사법인 유선식품 주식회사
5th row중부권광역우편물류센터
ValueCountFrequency (%)
주식회사 5
 
13.2%
농업회사법인 3
 
7.9%
상호 1
 
2.6%
금강자원 1
 
2.6%
퍼스프 1
 
2.6%
주)내담에프앤비 1
 
2.6%
주안레미콘 1
 
2.6%
홈플러스(주 1
 
2.6%
계룡점 1
 
2.6%
주)아워홈 1
 
2.6%
Other values (22) 22
57.9%
2024-01-10T06:35:42.726386image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
19
 
7.6%
) 12
 
4.8%
( 12
 
4.8%
11
 
4.4%
10
 
4.0%
10
 
4.0%
8
 
3.2%
6
 
2.4%
5
 
2.0%
5
 
2.0%
Other values (97) 153
61.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 213
84.9%
Close Punctuation 12
 
4.8%
Open Punctuation 12
 
4.8%
Space Separator 11
 
4.4%
Decimal Number 3
 
1.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
19
 
8.9%
10
 
4.7%
10
 
4.7%
8
 
3.8%
6
 
2.8%
5
 
2.3%
5
 
2.3%
5
 
2.3%
4
 
1.9%
4
 
1.9%
Other values (92) 137
64.3%
Decimal Number
ValueCountFrequency (%)
1 2
66.7%
9 1
33.3%
Close Punctuation
ValueCountFrequency (%)
) 12
100.0%
Open Punctuation
ValueCountFrequency (%)
( 12
100.0%
Space Separator
ValueCountFrequency (%)
11
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 213
84.9%
Common 38
 
15.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
19
 
8.9%
10
 
4.7%
10
 
4.7%
8
 
3.8%
6
 
2.8%
5
 
2.3%
5
 
2.3%
5
 
2.3%
4
 
1.9%
4
 
1.9%
Other values (92) 137
64.3%
Common
ValueCountFrequency (%)
) 12
31.6%
( 12
31.6%
11
28.9%
1 2
 
5.3%
9 1
 
2.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 213
84.9%
ASCII 38
 
15.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
19
 
8.9%
10
 
4.7%
10
 
4.7%
8
 
3.8%
6
 
2.8%
5
 
2.3%
5
 
2.3%
5
 
2.3%
4
 
1.9%
4
 
1.9%
Other values (92) 137
64.3%
ASCII
ValueCountFrequency (%)
) 12
31.6%
( 12
31.6%
11
28.9%
1 2
 
5.3%
9 1
 
2.6%

Unnamed: 2
Categorical

HIGH CORRELATION 

Distinct24
Distinct (%)27.0%
Missing0
Missing (%)0.0%
Memory size844.0 B
폐합성수지류(폐염화비닐수지류는 제외한다)
19 
그 밖의 식물성잔재물
11 
음식물류폐기물
그 밖의 폐합성고분자화합물(합성수지류로 피복된 폐전선을 포함한다)
하수처리오니
Other values (19)
36 

Length

Max length84
Median length54
Mean length19.786517
Min length4

Unique

Unique9 ?
Unique (%)10.1%

Sample

1st row폐기물 종류
2nd row폐합성고무류
3rd row폐합성수지류(폐염화비닐수지류는 제외한다)
4th row음식물류폐기물
5th row폐합성수지류(폐염화비닐수지류는 제외한다)

Common Values

ValueCountFrequency (%)
폐합성수지류(폐염화비닐수지류는 제외한다) 19
21.3%
그 밖의 식물성잔재물 11
12.4%
음식물류폐기물 9
10.1%
그 밖의 폐합성고분자화합물(합성수지류로 피복된 폐전선을 포함한다) 9
10.1%
하수처리오니 5
 
5.6%
그 밖의 폐수처리오니 5
 
5.6%
그 밖의 폐기물 3
 
3.4%
축산물가공잔재물(동물성 유지류는 제외한다) 3
 
3.4%
폐식용유(식용을 목적으로 식품 재료와 원료를 제조ㆍ조리ㆍ가공하거나 식용유를 유통ㆍ사용 또는 음식물류 폐기물을 처리하는 과정에서 발생하는 기름을 말한다) 3
 
3.4%
산업용폐전기전자제품 3
 
3.4%
Other values (14) 19
21.3%

Length

2024-01-10T06:35:42.857051image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
30
 
10.0%
밖의 30
 
10.0%
제외한다 22
 
7.4%
폐합성수지류(폐염화비닐수지류는 19
 
6.4%
식물성잔재물 11
 
3.7%
음식물류폐기물 9
 
3.0%
폐합성고분자화합물(합성수지류로 9
 
3.0%
피복된 9
 
3.0%
폐전선을 9
 
3.0%
포함한다 9
 
3.0%
Other values (58) 142
47.5%

Unnamed: 3
Unsupported

REJECTED  UNSUPPORTED 

Missing0
Missing (%)0.0%
Memory size844.0 B

Unnamed: 4
Categorical

HIGH CORRELATION 

Distinct13
Distinct (%)14.6%
Missing0
Missing (%)0.0%
Memory size844.0 B
재활용(농업생산활동에 사용)
16 
재활용(중간가공폐기물 제조)
13 
재활용(원료 제조)
12 
재활용(연료·고형연료제품 제조)
11 
재활용(직접 제품제조)
Other values (8)
29 

Length

Max length17
Median length15
Mean length12.955056
Min length1

Unique

Unique2 ?
Unique (%)2.2%

Sample

1st row처리방법
2nd row재활용(중간가공폐기물 제조)
3rd row중간처분(일반소각)
4th row재활용(농업생산활동에 사용)
5th row중간처분(일반소각)

Common Values

ValueCountFrequency (%)
재활용(농업생산활동에 사용) 16
18.0%
재활용(중간가공폐기물 제조) 13
14.6%
재활용(원료 제조) 12
13.5%
재활용(연료·고형연료제품 제조) 11
12.4%
재활용(직접 제품제조) 8
9.0%
중간처분(일반소각) 7
7.9%
재활용(토질개선에 사용) 7
7.9%
중간처분(파쇄.분쇄) 6
 
6.7%
매립(민간관리형매립시설) 3
 
3.4%
재활용(수리·수선 재사용) 2
 
2.2%
Other values (3) 4
 
4.5%

Length

2024-01-10T06:35:42.977404image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
제조 36
22.9%
사용 23
14.6%
재활용(농업생산활동에 16
10.2%
재활용(중간가공폐기물 13
 
8.3%
재활용(원료 12
 
7.6%
재활용(연료·고형연료제품 11
 
7.0%
재활용(직접 8
 
5.1%
제품제조 8
 
5.1%
중간처분(일반소각 7
 
4.5%
재활용(토질개선에 7
 
4.5%
Other values (6) 16
10.2%

Correlations

2024-01-10T06:35:43.041988image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Unnamed: 1Unnamed: 2Unnamed: 4
Unnamed: 11.0001.0001.000
Unnamed: 21.0001.0000.909
Unnamed: 41.0000.9091.000
2024-01-10T06:35:43.111517image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Unnamed: 2Unnamed: 4
Unnamed: 21.0000.547
Unnamed: 40.5471.000
2024-01-10T06:35:43.403306image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Unnamed: 2Unnamed: 4
Unnamed: 21.0000.547
Unnamed: 40.5471.000

Missing values

2024-01-10T06:35:42.142821image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-01-10T06:35:42.225000image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2024-01-10T06:35:42.295232image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

※사업장일반폐기물Unnamed: 1Unnamed: 2Unnamed: 3Unnamed: 4
0연번상호폐기물 종류배출량(톤)처리방법
11보성롤테크폐합성고무류16재활용(중간가공폐기물 제조)
22한서소방119폐합성수지류(폐염화비닐수지류는 제외한다)24중간처분(일반소각)
33농업회사법인 유선식품 주식회사음식물류폐기물108재활용(농업생산활동에 사용)
44중부권광역우편물류센터폐합성수지류(폐염화비닐수지류는 제외한다)10중간처분(일반소각)
55주식회사 메덱스그 밖의 폐기물120중간처분(일반소각)
66(주)프로팜포크동물성유지류480재활용(직접 제품제조)
7NaN<NA>축산물가공잔재물(동물성 유지류는 제외한다)72재활용(직접 제품제조)
87농업회사법인 (주)훼미리푸드폐합성수지류(폐염화비닐수지류는 제외한다)60재활용(중간가공폐기물 제조)
9NaN<NA>음식물류폐기물648재활용(농업생산활동에 사용)
※사업장일반폐기물Unnamed: 1Unnamed: 2Unnamed: 3Unnamed: 4
79NaN<NA>폐합성수지류(폐염화비닐수지류는 제외한다)15재활용(연료·고형연료제품 제조)
80NaN<NA>폐활성탄2재활용(직접 제품제조)
81NaN<NA>그 밖의 식물성잔재물50재활용(토질개선에 사용)
82NaN<NA>그 밖의 식물성잔재물54재활용(토질개선에 사용)
83NaN<NA>임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)150재활용(연료·고형연료제품 제조)
84NaN<NA>폐가구류_ 폐도장목_ 폐목재포장재_ 폐전선드럼(접착제_ 페인트_ 기름_ 콘크리트 등의 물질이 사용된 목재를 말한다)84재활용(연료·고형연료제품 제조)
85NaN<NA>음식물류폐기물50.4재활용(농업생산활동에 사용)
86NaN<NA>그 밖의 폐합성고분자화합물(합성수지류로 피복된 폐전선을 포함한다)6재활용(수리·수선 재사용)
87NaN<NA>폐식용유(식용을 목적으로 식품 재료와 원료를 제조ㆍ조리ㆍ가공하거나 식용유를 유통ㆍ사용 또는 음식물류 폐기물을 처리하는 과정에서 발생하는 기름을 말한다)0.48재활용(원료 제조)
88NaN<NA>폐합성수지류(폐염화비닐수지류는 제외한다)15중간처분(파쇄.분쇄)

Duplicate rows

Most frequently occurring

Unnamed: 1Unnamed: 2Unnamed: 4# duplicates
7<NA>음식물류폐기물재활용(농업생산활동에 사용)6
5<NA>그 밖의 폐합성고분자화합물(합성수지류로 피복된 폐전선을 포함한다)재활용(원료 제조)5
0<NA>그 밖의 식물성잔재물재활용(농업생산활동에 사용)4
13<NA>폐합성수지류(폐염화비닐수지류는 제외한다)중간처분(파쇄.분쇄)4
1<NA>그 밖의 식물성잔재물재활용(토질개선에 사용)3
11<NA>폐합성수지류(폐염화비닐수지류는 제외한다)재활용(연료·고형연료제품 제조)3
12<NA>폐합성수지류(폐염화비닐수지류는 제외한다)재활용(중간가공폐기물 제조)3
2<NA>그 밖의 폐수처리오니재활용(농업생산활동에 사용)2
3<NA>그 밖의 폐수처리오니재활용(토질개선에 사용)2
4<NA>그 밖의 폐합성고분자화합물(합성수지류로 피복된 폐전선을 포함한다)재활용(수리·수선 재사용)2