Overview

Dataset statistics

Number of variables4
Number of observations10000
Missing cells0
Missing cells (%)0.0%
Duplicate rows2602
Duplicate rows (%)26.0%
Total size in memory390.6 KiB
Average record size in memory40.0 B

Variable types

Text2
Categorical2

Dataset

Description환경정보공개시스템의 현장검증대상 업체의 온실가스 관리수준, 대기오염물질 배출량 등 적부판정 여부(업체명, 검증위원명, 항목명, 적부판정 여부) 정보 제공
Author한국환경산업기술원
URLhttps://www.data.go.kr/data/15072175/fileData.do

Alerts

Dataset has 2602 (26.0%) duplicate rowsDuplicates

Reproduction

Analysis started2023-12-12 21:12:01.670799
Analysis finished2023-12-12 21:12:02.148199
Duration0.48 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct190
Distinct (%)1.9%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-13T06:12:02.356993image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length18
Median length15
Mean length8.6837
Min length2

Characters and Unicode

Total characters86837
Distinct characters273
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row달성군청
2nd row현대자동차(주) 본사
3rd row(주)더블유티씨서울
4th row무림P&P(주)
5th row(주)삼원강재
ValueCountFrequency (%)
본사 271
 
2.1%
부산광역시 252
 
2.0%
주식회사 202
 
1.6%
서울특별시 80
 
0.6%
주)카펙발레오 74
 
0.6%
일신방직(주)반월공장 74
 
0.6%
금호타이어(주 73
 
0.6%
에너원(주 72
 
0.6%
stx조선해양(주 72
 
0.6%
평택사업장 71
 
0.6%
Other values (217) 11428
90.2%
2023-12-13T06:12:02.780505image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
5448
 
6.3%
) 4268
 
4.9%
( 4223
 
4.9%
2729
 
3.1%
2210
 
2.5%
2176
 
2.5%
2145
 
2.5%
2088
 
2.4%
1844
 
2.1%
1663
 
1.9%
Other values (263) 58043
66.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 74162
85.4%
Close Punctuation 4268
 
4.9%
Open Punctuation 4223
 
4.9%
Space Separator 2729
 
3.1%
Uppercase Letter 1158
 
1.3%
Connector Punctuation 129
 
0.1%
Decimal Number 116
 
0.1%
Other Punctuation 52
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
5448
 
7.3%
2210
 
3.0%
2176
 
2.9%
2145
 
2.9%
2088
 
2.8%
1844
 
2.5%
1663
 
2.2%
1456
 
2.0%
1345
 
1.8%
1290
 
1.7%
Other values (247) 52497
70.8%
Uppercase Letter
ValueCountFrequency (%)
S 350
30.2%
K 224
19.3%
P 152
13.1%
G 125
 
10.8%
T 72
 
6.2%
X 72
 
6.2%
L 71
 
6.1%
C 46
 
4.0%
J 46
 
4.0%
Decimal Number
ValueCountFrequency (%)
2 64
55.2%
3 52
44.8%
Close Punctuation
ValueCountFrequency (%)
) 4268
100.0%
Open Punctuation
ValueCountFrequency (%)
( 4223
100.0%
Space Separator
ValueCountFrequency (%)
2729
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 129
100.0%
Other Punctuation
ValueCountFrequency (%)
& 52
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 74162
85.4%
Common 11517
 
13.3%
Latin 1158
 
1.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
5448
 
7.3%
2210
 
3.0%
2176
 
2.9%
2145
 
2.9%
2088
 
2.8%
1844
 
2.5%
1663
 
2.2%
1456
 
2.0%
1345
 
1.8%
1290
 
1.7%
Other values (247) 52497
70.8%
Latin
ValueCountFrequency (%)
S 350
30.2%
K 224
19.3%
P 152
13.1%
G 125
 
10.8%
T 72
 
6.2%
X 72
 
6.2%
L 71
 
6.1%
C 46
 
4.0%
J 46
 
4.0%
Common
ValueCountFrequency (%)
) 4268
37.1%
( 4223
36.7%
2729
23.7%
_ 129
 
1.1%
2 64
 
0.6%
3 52
 
0.5%
& 52
 
0.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 74162
85.4%
ASCII 12675
 
14.6%

Most frequent character per block

Hangul
ValueCountFrequency (%)
5448
 
7.3%
2210
 
3.0%
2176
 
2.9%
2145
 
2.9%
2088
 
2.8%
1844
 
2.5%
1663
 
2.2%
1456
 
2.0%
1345
 
1.8%
1290
 
1.7%
Other values (247) 52497
70.8%
ASCII
ValueCountFrequency (%)
) 4268
33.7%
( 4223
33.3%
2729
21.5%
S 350
 
2.8%
K 224
 
1.8%
P 152
 
1.2%
_ 129
 
1.0%
G 125
 
1.0%
T 72
 
0.6%
X 72
 
0.6%
Other values (6) 331
 
2.6%
Distinct66
Distinct (%)0.7%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-13T06:12:03.038270image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length9
Median length3
Mean length3.176
Min length2

Characters and Unicode

Total characters31760
Distinct characters89
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row박기학
2nd row김진용
3rd row박경배
4th row임철우
5th row김정호
ValueCountFrequency (%)
김진용 470
 
4.7%
정용하 443
 
4.4%
최정현 426
 
4.3%
정진석 413
 
4.1%
김대현 368
 
3.7%
임철우 361
 
3.6%
박기학 344
 
3.4%
송길종 342
 
3.4%
최문선 309
 
3.1%
김정호 288
 
2.9%
Other values (56) 6236
62.4%
2023-12-13T06:12:03.426940image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2291
 
7.2%
2074
 
6.5%
1504
 
4.7%
1334
 
4.2%
1183
 
3.7%
1052
 
3.3%
938
 
3.0%
802
 
2.5%
735
 
2.3%
723
 
2.3%
Other values (79) 19124
60.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 31080
97.9%
Close Punctuation 340
 
1.1%
Open Punctuation 340
 
1.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2291
 
7.4%
2074
 
6.7%
1504
 
4.8%
1334
 
4.3%
1183
 
3.8%
1052
 
3.4%
938
 
3.0%
802
 
2.6%
735
 
2.4%
723
 
2.3%
Other values (77) 18444
59.3%
Close Punctuation
ValueCountFrequency (%)
) 340
100.0%
Open Punctuation
ValueCountFrequency (%)
( 340
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 31080
97.9%
Common 680
 
2.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2291
 
7.4%
2074
 
6.7%
1504
 
4.8%
1334
 
4.3%
1183
 
3.8%
1052
 
3.4%
938
 
3.0%
802
 
2.6%
735
 
2.4%
723
 
2.3%
Other values (77) 18444
59.3%
Common
ValueCountFrequency (%)
) 340
50.0%
( 340
50.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 31080
97.9%
ASCII 680
 
2.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
2291
 
7.4%
2074
 
6.7%
1504
 
4.8%
1334
 
4.3%
1183
 
3.8%
1052
 
3.4%
938
 
3.0%
802
 
2.6%
735
 
2.4%
723
 
2.3%
Other values (77) 18444
59.3%
ASCII
ValueCountFrequency (%)
) 340
50.0%
( 340
50.0%

항목명
Categorical

Distinct31
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
녹색경영 전담조직 및 업무 · 역할 · 권한 교육훈련, 환경 · 안전사고 대응체계, 내부심사 실시 및 조치
795 
온실가스 관리수준(인벤토리, 목표-계획-실적 관리 등) 및 배출량
 
612
녹색경영 추진을 위한 비전, 전략, 방침, 목표
 
493
환경오염물질저감 투자 및 기술도입
 
474
화학물질 배출량
 
467
Other values (26)
7159 

Length

Max length59
Median length34
Mean length23.7784
Min length7

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row환경오염물질 · 제품 · 서비스와 관련된 환경법규 위반 현황
2nd row녹색구매 지침 운영 현황
3rd row수질오염 · 화학물질관리시설 및 모니터링 시스템 현황
4th row녹색기업, 환경경영대상, 폐기물감축 자발적 협약, 녹색구매 자발적협약 등
5th row토양 · 소음진동 · 악취 관리 현황

Common Values

ValueCountFrequency (%)
녹색경영 전담조직 및 업무 · 역할 · 권한 교육훈련, 환경 · 안전사고 대응체계, 내부심사 실시 및 조치 795
 
8.0%
온실가스 관리수준(인벤토리, 목표-계획-실적 관리 등) 및 배출량 612
 
6.1%
녹색경영 추진을 위한 비전, 전략, 방침, 목표 493
 
4.9%
환경오염물질저감 투자 및 기술도입 474
 
4.7%
화학물질 배출량 467
 
4.7%
녹색구매 지침 운영 현황 461
 
4.6%
폐기물 발생량 · 재활용량 460
 
4.6%
신재생 에너지 투자 및 기술도입 456
 
4.6%
용수 사용량 · 재활용량 445
 
4.5%
수질오염물질 배출량 445
 
4.5%
Other values (21) 4892
48.9%

Length

2023-12-13T06:12:03.589242image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
· 5761
 
9.4%
4922
 
8.0%
현황 2155
 
3.5%
투자 1966
 
3.2%
배출량 1737
 
2.8%
기술도입 1494
 
2.4%
에너지 1365
 
2.2%
녹색경영 1288
 
2.1%
1177
 
1.9%
사용량 1114
 
1.8%
Other values (92) 38220
62.5%
Distinct2
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
적합
7356 
부적합
2644 

Length

Max length3
Median length2
Mean length2.2644
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row적합
2nd row적합
3rd row적합
4th row적합
5th row부적합

Common Values

ValueCountFrequency (%)
적합 7356
73.6%
부적합 2644
 
26.4%

Length

2023-12-13T06:12:03.712555image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T06:12:03.846140image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
적합 7356
73.6%
부적합 2644
 
26.4%

Correlations

2023-12-13T06:12:03.923152image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
검증위원명항목명적부판정여부
검증위원명1.0000.0000.260
항목명0.0001.0000.449
적부판정여부0.2600.4491.000
2023-12-13T06:12:04.035057image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
적부판정여부항목명
적부판정여부1.0000.383
항목명0.3831.000
2023-12-13T06:12:04.118487image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
항목명적부판정여부
항목명1.0000.383
적부판정여부0.3831.000

Missing values

2023-12-13T06:12:02.022306image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T06:12:02.110340image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

업체명검증위원명항목명적부판정여부
2423달성군청박기학환경오염물질 · 제품 · 서비스와 관련된 환경법규 위반 현황적합
8078현대자동차(주) 본사김진용녹색구매 지침 운영 현황적합
4746(주)더블유티씨서울박경배수질오염 · 화학물질관리시설 및 모니터링 시스템 현황적합
2933무림P&P(주)임철우녹색기업, 환경경영대상, 폐기물감축 자발적 협약, 녹색구매 자발적협약 등적합
6375(주)삼원강재김정호토양 · 소음진동 · 악취 관리 현황부적합
18550주식회사 에쓰큐씨양광섭업종, 생산제품, 매출액, 생산량, 종업원수부적합
4297GS파워(주)부천열병합발전처박경배녹색구매 지침 운영 현황적합
22681금호타이어(주)정진석폐기물 발생량 · 재활용량적합
20710(주)코리아와이드경북고속전진영온실가스 저감 투자 및 기술도입적합
23844신한은행 본점박수정화학물질 배출량적합
업체명검증위원명항목명적부판정여부
9087의정부시시설관리공단박기학수질오염물질 배출량적합
2086(주)더블유티씨서울송길종용수 · 에너지 절감 투자 및 기술 도입적합
21651(주)아이유제지유준TypeI인증 및 Type Ⅱ 인증 제품 현황(건수, 매출액 등)적합
8168핸즈식스(주)손민정원부자재 · 용수 · 에너지 절감 투자 및 기술 도입적합
11952(주)효성 안양공장박기학녹색경영 전담조직 및 업무 · 역할 · 권한 교육훈련, 환경 · 안전사고 대응체계, 내부심사 실시 및 조치부적합
16555아반스트레이트코리아조영권녹색기업, 환경경영대상, 폐기물감축 자발적 협약, 녹색구매 자발적협약 등적합
17936르노삼성자동차 주식회사(부산공장)김대현화학물질 배출량적합
15203영등포구청송길종녹색경영 추진을 위한 비전, 전략, 방침, 목표부적합
6496연수구청옥해명용수 · 에너지 절감 투자 및 기술 도입적합
23512한국기초소재(주)송성호에너지 사용량적합

Duplicate rows

Most frequently occurring

업체명검증위원명항목명적부판정여부# duplicates
743당진시청박수정녹색경영 전담조직 및 업무 · 역할 · 권한 교육훈련, 환경 · 안전사고 대응체계, 내부심사 실시 및 조치부적합5
1504영월군청정용하녹색경영 전담조직 및 업무 · 역할 · 권한 교육훈련, 환경 · 안전사고 대응체계, 내부심사 실시 및 조치부적합5
1693전남도립대학교임종현녹색경영 전담조직 및 업무 · 역할 · 권한 교육훈련, 환경 · 안전사고 대응체계, 내부심사 실시 및 조치적합5
21(주)대원운수김성천업종, 매출액, (학생/환자)수, 구성원수, 소속기관 현황, 환경정보공개 담당 부서적합4
126(주)삼원강재설석진녹색경영 전담조직 및 업무 · 역할 · 권한 교육훈련, 환경 · 안전사고 대응체계, 내부심사 실시 및 조치부적합4
189(주)엘지화학 브이시엠공장옥해명녹색경영 전담조직 및 업무 · 역할 · 권한 교육훈련, 환경 · 안전사고 대응체계, 내부심사 실시 및 조치부적합4
411SK하이닉스(주) 이천본사김진용온실가스 관리수준(인벤토리, 목표-계획-실적 관리 등) 및 배출량부적합4
507경상남도 하동군청심형록온실가스 관리수준(인벤토리, 목표-계획-실적 관리 등) 및 배출량적합4
594구례군청정원용업종, 예산규모, 구성원수, 소속기관 현황, 환경정보공개 담당 부서적합4
729달성군청문장수온실가스 관리수준(인벤토리, 목표-계획-실적 관리 등) 및 배출량적합4