Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 1020 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 12 |
Duplicate rows (%) | 1.2% |
Total size in memory | 32.0 KiB |
Average record size in memory | 32.1 B |
Variable types
Text | 3 |
---|---|
Boolean | 1 |
Dataset
Description | 2023년 8월 기준 환경통계포털에서 제공 중인 국가승인통계와 행정기초통계의 현황 목록(환경분야명, 통계명, 통계표명, 국가승인통계 여부 등)을 제공 |
---|---|
URL | https://www.data.go.kr/data/15105566/fileData.do |
Dataset has 12 (1.2%) duplicate rows | Duplicates |
승인통계 여부 is highly imbalanced (58.6%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 07:38:09.810078 |
---|---|
Analysis finished | 2023-12-12 07:38:10.628776 |
Duration | 0.82 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
분야명
Text
Distinct | 72 |
---|---|
Distinct (%) | 7.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.1 KiB |
Value | Count | Frequency (%) |
생활폐기물 | 166 | 10.4% |
부문 | 83 | 5.2% |
국민환경보건 | 74 | 4.6% |
기초조사 | 74 | 4.6% |
환경기초시설 | 64 | 4.0% |
발생현황 | 63 | 4.0% |
환경산업통계조사 | 63 | 4.0% |
현황 | 53 | 3.3% |
생활,사업장,일반,건설 | 51 | 3.2% |
사업장폐기물 | 40 | 2.5% |
Other values (102) | 863 |
Most occurring characters
Value | Count | Frequency (%) |
574 | 6.5% | |
기 | 502 | 5.7% |
물 | 396 | 4.5% |
사 | 378 | 4.3% |
생 | 343 | 3.9% |
조 | 274 | 3.1% |
폐 | 268 | 3.0% |
경 | 265 | 3.0% |
환 | 264 | 3.0% |
계 | 236 | 2.7% |
Other values (152) | 5348 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8063 | |
Space Separator | 574 | 6.5% |
Other Punctuation | 166 | 1.9% |
Decimal Number | 24 | 0.3% |
Uppercase Letter | 9 | 0.1% |
Close Punctuation | 6 | 0.1% |
Open Punctuation | 6 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 502 | 6.2% |
물 | 396 | 4.9% |
사 | 378 | 4.7% |
생 | 343 | 4.3% |
조 | 274 | 3.4% |
폐 | 268 | 3.3% |
경 | 265 | 3.3% |
환 | 264 | 3.3% |
계 | 236 | 2.9% |
활 | 234 | 2.9% |
Other values (141) | 4903 |
Decimal Number
Value | Count | Frequency (%) |
0 | 12 | |
8 | 6 | |
2 | 6 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 3 | |
M | 3 | |
T | 3 |
Other Punctuation
Value | Count | Frequency (%) |
, | 160 | |
/ | 6 | 3.6% |
Space Separator
Value | Count | Frequency (%) |
574 |
Close Punctuation
Value | Count | Frequency (%) |
) | 6 |
Open Punctuation
Value | Count | Frequency (%) |
( | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8063 | |
Common | 776 | 8.8% |
Latin | 9 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 502 | 6.2% |
물 | 396 | 4.9% |
사 | 378 | 4.7% |
생 | 343 | 4.3% |
조 | 274 | 3.4% |
폐 | 268 | 3.3% |
경 | 265 | 3.3% |
환 | 264 | 3.3% |
계 | 236 | 2.9% |
활 | 234 | 2.9% |
Other values (141) | 4903 |
Common
Value | Count | Frequency (%) |
574 | ||
, | 160 | 20.6% |
0 | 12 | 1.5% |
) | 6 | 0.8% |
8 | 6 | 0.8% |
/ | 6 | 0.8% |
( | 6 | 0.8% |
2 | 6 | 0.8% |
Latin
Value | Count | Frequency (%) |
S | 3 | |
M | 3 | |
T | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8063 | |
ASCII | 785 | 8.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
574 | ||
, | 160 | 20.4% |
0 | 12 | 1.5% |
) | 6 | 0.8% |
8 | 6 | 0.8% |
/ | 6 | 0.8% |
( | 6 | 0.8% |
2 | 6 | 0.8% |
S | 3 | 0.4% |
M | 3 | 0.4% |
Hangul
Value | Count | Frequency (%) |
기 | 502 | 6.2% |
물 | 396 | 4.9% |
사 | 378 | 4.7% |
생 | 343 | 4.3% |
조 | 274 | 3.4% |
폐 | 268 | 3.3% |
경 | 265 | 3.3% |
환 | 264 | 3.3% |
계 | 236 | 2.9% |
활 | 234 | 2.9% |
Other values (141) | 4903 |
통계명
Text
Distinct | 52 |
---|---|
Distinct (%) | 5.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.1 KiB |
Value | Count | Frequency (%) |
전국 | 310 | 13.4% |
통계조사 | 310 | 13.4% |
폐기물 | 310 | 13.4% |
및 | 94 | 4.0% |
발생 | 89 | 3.8% |
처리현황 | 81 | 3.5% |
국민환경보건 | 80 | 3.4% |
기초조사 | 80 | 3.4% |
전국폐기물 | 71 | 3.1% |
환경산업통계조사 | 63 | 2.7% |
Other values (77) | 833 |
Most occurring characters
Value | Count | Frequency (%) |
1301 | 12.3% | |
기 | 608 | 5.8% |
조 | 596 | 5.7% |
사 | 593 | 5.6% |
국 | 551 | 5.2% |
계 | 546 | 5.2% |
통 | 540 | 5.1% |
물 | 530 | 5.0% |
전 | 414 | 3.9% |
폐 | 408 | 3.9% |
Other values (133) | 4451 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9214 | |
Space Separator | 1301 | 12.3% |
Other Punctuation | 14 | 0.1% |
Uppercase Letter | 9 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 608 | 6.6% |
조 | 596 | 6.5% |
사 | 593 | 6.4% |
국 | 551 | 6.0% |
계 | 546 | 5.9% |
통 | 540 | 5.9% |
물 | 530 | 5.8% |
전 | 414 | 4.5% |
폐 | 408 | 4.4% |
황 | 250 | 2.7% |
Other values (126) | 4178 |
Other Punctuation
Value | Count | Frequency (%) |
· | 7 | |
/ | 6 | |
. | 1 | 7.1% |
Uppercase Letter
Value | Count | Frequency (%) |
M | 3 | |
S | 3 | |
T | 3 |
Space Separator
Value | Count | Frequency (%) |
1301 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9214 | |
Common | 1315 | 12.5% |
Latin | 9 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 608 | 6.6% |
조 | 596 | 6.5% |
사 | 593 | 6.4% |
국 | 551 | 6.0% |
계 | 546 | 5.9% |
통 | 540 | 5.9% |
물 | 530 | 5.8% |
전 | 414 | 4.5% |
폐 | 408 | 4.4% |
황 | 250 | 2.7% |
Other values (126) | 4178 |
Common
Value | Count | Frequency (%) |
1301 | ||
· | 7 | 0.5% |
/ | 6 | 0.5% |
. | 1 | 0.1% |
Latin
Value | Count | Frequency (%) |
M | 3 | |
S | 3 | |
T | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9214 | |
ASCII | 1317 | 12.5% |
None | 7 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1301 | ||
/ | 6 | 0.5% |
M | 3 | 0.2% |
S | 3 | 0.2% |
T | 3 | 0.2% |
. | 1 | 0.1% |
Hangul
Value | Count | Frequency (%) |
기 | 608 | 6.6% |
조 | 596 | 6.5% |
사 | 593 | 6.4% |
국 | 551 | 6.0% |
계 | 546 | 5.9% |
통 | 540 | 5.9% |
물 | 530 | 5.8% |
전 | 414 | 4.5% |
폐 | 408 | 4.4% |
황 | 250 | 2.7% |
Other values (126) | 4178 |
None
Value | Count | Frequency (%) |
· | 7 |
통계표명
Text
Distinct | 991 |
---|---|
Distinct (%) | 97.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.1 KiB |
Length
Max length | 66 |
---|---|
Median length | 42 |
Mean length | 21.409804 |
Min length | 2 |
Characters and Unicode
Total characters | 21838 |
---|---|
Distinct characters | 410 |
Distinct categories | 14 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 965 ? |
---|---|
Unique (%) | 94.6% |
Sample
1st row | 환경보호활동별 매출액(조사업체)(2004~2010) |
---|---|
2nd row | 환경산업분류별(보호활동) 매출액 |
3rd row | 환경산업분류별(매체별) 매출액 |
4th row | 환경산업분류별(업종별) 매출액 |
5th row | 산업분류별/환경산업분류별 환경부문 매출액(서비스) |
Value | Count | Frequency (%) |
및 | 153 | 3.9% |
폐기물 | 127 | 3.2% |
중 | 79 | 2.0% |
발생량 | 67 | 1.7% |
요 | 66 | 1.7% |
원단위 | 58 | 1.5% |
현황 | 55 | 1.4% |
처리현황 | 50 | 1.3% |
발생원별 | 50 | 1.3% |
발생 | 47 | 1.2% |
Other values (1167) | 3185 |
Most occurring characters
Value | Count | Frequency (%) |
2920 | 13.4% | |
별 | 697 | 3.2% |
물 | 565 | 2.6% |
) | 540 | 2.5% |
( | 540 | 2.5% |
0 | 521 | 2.4% |
기 | 473 | 2.2% |
황 | 418 | 1.9% |
현 | 409 | 1.9% |
2 | 381 | 1.7% |
Other values (400) | 14374 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15366 | |
Space Separator | 2920 | 13.4% |
Decimal Number | 1691 | 7.7% |
Close Punctuation | 540 | 2.5% |
Open Punctuation | 540 | 2.5% |
Other Punctuation | 232 | 1.1% |
Uppercase Letter | 200 | 0.9% |
Math Symbol | 159 | 0.7% |
Connector Punctuation | 86 | 0.4% |
Dash Punctuation | 80 | 0.4% |
Other values (4) | 24 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
별 | 697 | 4.5% |
물 | 565 | 3.7% |
기 | 473 | 3.1% |
황 | 418 | 2.7% |
현 | 409 | 2.7% |
생 | 370 | 2.4% |
도 | 368 | 2.4% |
폐 | 367 | 2.4% |
시 | 338 | 2.2% |
발 | 303 | 2.0% |
Other values (347) | 11058 |
Uppercase Letter
Value | Count | Frequency (%) |
P | 52 | |
M | 37 | |
E | 19 | 9.5% |
H | 13 | 6.5% |
C | 12 | 6.0% |
O | 11 | 5.5% |
R | 11 | 5.5% |
A | 8 | 4.0% |
B | 8 | 4.0% |
S | 7 | 3.5% |
Other values (5) | 22 |
Decimal Number
Value | Count | Frequency (%) |
0 | 521 | |
2 | 381 | |
1 | 285 | |
9 | 201 | 11.9% |
6 | 71 | 4.2% |
8 | 70 | 4.1% |
4 | 62 | 3.7% |
5 | 40 | 2.4% |
7 | 33 | 2.0% |
3 | 27 | 1.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 120 | |
· | 50 | |
/ | 29 | 12.5% |
: | 9 | 3.9% |
. | 9 | 3.9% |
& | 6 | 2.6% |
# | 4 | 1.7% |
; | 4 | 1.7% |
% | 1 | 0.4% |
Lowercase Letter
Value | Count | Frequency (%) |
p | 4 | |
t | 4 | |
x | 3 | |
n | 2 | |
c | 2 | |
z | 2 | |
o | 2 | |
e | 1 | 4.8% |
s | 1 | 4.8% |
Math Symbol
Value | Count | Frequency (%) |
~ | 158 | |
∙ | 1 | 0.6% |
Space Separator
Value | Count | Frequency (%) |
2920 |
Close Punctuation
Value | Count | Frequency (%) |
) | 540 |
Open Punctuation
Value | Count | Frequency (%) |
( | 540 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 86 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 80 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 |
Other Number
Value | Count | Frequency (%) |
₃ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15366 | |
Common | 6251 | |
Latin | 221 | 1.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
별 | 697 | 4.5% |
물 | 565 | 3.7% |
기 | 473 | 3.1% |
황 | 418 | 2.7% |
현 | 409 | 2.7% |
생 | 370 | 2.4% |
도 | 368 | 2.4% |
폐 | 367 | 2.4% |
시 | 338 | 2.2% |
발 | 303 | 2.0% |
Other values (347) | 11058 |
Common
Value | Count | Frequency (%) |
2920 | ||
) | 540 | 8.6% |
( | 540 | 8.6% |
0 | 521 | 8.3% |
2 | 381 | 6.1% |
1 | 285 | 4.6% |
9 | 201 | 3.2% |
~ | 158 | 2.5% |
, | 120 | 1.9% |
_ | 86 | 1.4% |
Other values (19) | 499 | 8.0% |
Latin
Value | Count | Frequency (%) |
P | 52 | |
M | 37 | |
E | 19 | 8.6% |
H | 13 | 5.9% |
C | 12 | 5.4% |
O | 11 | 5.0% |
R | 11 | 5.0% |
A | 8 | 3.6% |
B | 8 | 3.6% |
S | 7 | 3.2% |
Other values (14) | 43 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 15366 | |
ASCII | 6418 | |
None | 51 | 0.2% |
Punctuation | 2 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2920 | ||
) | 540 | 8.4% |
( | 540 | 8.4% |
0 | 521 | 8.1% |
2 | 381 | 5.9% |
1 | 285 | 4.4% |
9 | 201 | 3.1% |
~ | 158 | 2.5% |
, | 120 | 1.9% |
_ | 86 | 1.3% |
Other values (38) | 666 | 10.4% |
Hangul
Value | Count | Frequency (%) |
별 | 697 | 4.5% |
물 | 565 | 3.7% |
기 | 473 | 3.1% |
황 | 418 | 2.7% |
현 | 409 | 2.7% |
생 | 370 | 2.4% |
도 | 368 | 2.4% |
폐 | 367 | 2.4% |
시 | 338 | 2.2% |
발 | 303 | 2.0% |
Other values (347) | 11058 |
None
Value | Count | Frequency (%) |
· | 50 | |
₃ | 1 | 2.0% |
Punctuation
Value | Count | Frequency (%) |
‘ | 1 | |
’ | 1 |
Math Operators
Value | Count | Frequency (%) |
∙ | 1 |
승인통계 여부
Boolean
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
True | |
---|---|
False | 85 |
Value | Count | Frequency (%) |
True | 935 | |
False | 85 | 8.3% |
분야명 | 통계명 | 승인통계 여부 | |
---|---|---|---|
분야명 | 1.000 | 1.000 | 0.999 |
통계명 | 1.000 | 1.000 | 0.999 |
승인통계 여부 | 0.999 | 0.999 | 1.000 |
분야명 | 통계명 | 통계표명 | 승인통계 여부 | |
---|---|---|---|---|
0 | 환경산업통계조사 | 환경산업통계조사 | 환경보호활동별 매출액(조사업체)(2004~2010) | Y |
1 | 환경산업통계조사 | 환경산업통계조사 | 환경산업분류별(보호활동) 매출액 | Y |
2 | 환경산업통계조사 | 환경산업통계조사 | 환경산업분류별(매체별) 매출액 | Y |
3 | 환경산업통계조사 | 환경산업통계조사 | 환경산업분류별(업종별) 매출액 | Y |
4 | 환경산업통계조사 | 환경산업통계조사 | 산업분류별/환경산업분류별 환경부문 매출액(서비스) | Y |
5 | 환경산업통계조사 | 환경산업통계조사 | 산업분류별/환경산업분류별 환경부문 매출액(환경제품생산) | Y |
6 | 환경산업통계조사 | 환경산업통계조사 | 산업분류별 조사업체수(조사업체)(2009~2010) | Y |
7 | 환경산업통계조사 | 환경산업통계조사 | 환경산업분류별(업종별) 투자액(2009~2012) | Y |
8 | 환경산업통계조사 | 환경산업통계조사 | 환경산업분류별(업종별) 유형고정자산(2009~2012) | Y |
9 | 환경산업통계조사 | 환경산업통계조사 | 산업분류별 매출액(조사업체)(2009~2010) | Y |
분야명 | 통계명 | 통계표명 | 승인통계 여부 | |
---|---|---|---|---|
1010 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노(2-에틸-5-옥소헥실)프탈레이트(MEOHP) 농도(크레아티닌 보정) | Y |
1011 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노(2-에틸-5-카르복시펜틸)프탈레이트(MECPP) 농도 | Y |
1012 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노(2-에틸-5-카르복시펜틸)프탈레이트(MECPP) 농도(크레아티닌 보정) | Y |
1013 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노벤질프탈레이트(MBzP) 농도 | Y |
1014 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노벤질프탈레이트(MBzP) 농도(크레아티닌 보정) | Y |
1015 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노카르복시옥틸 프탈레이트(MCOP) 농도 | Y |
1016 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노카르복시옥틸 프탈레이트(MCOP) 농도(크레아티닌 보정) | Y |
1017 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노(3-카르복시프로필)프탈레이트(MCPP) 농도 | Y |
1018 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 모노(3-카르복시프로필)프탈레이트(MCPP) 농도(크레아티닌 보정) | Y |
1019 | 국민환경보건 기초조사 | 국민환경보건 기초조사 | 요 중 비스페놀 A 농도(크레아티닌 보정) | Y |
Most frequently occurring
분야명 | 통계명 | 통계표명 | 승인통계 여부 | # duplicates | |
---|---|---|---|---|---|
8 | 생활폐기물 발생현황 | 전국 폐기물 통계조사 | 생활폐기물 삼성분 분석 연평균 | Y | 3 |
0 | 기타폐기물 | 전국 폐기물 통계조사 | 다중이용시설 폐기물 발생현황 | Y | 2 |
1 | 기타폐기물 | 전국 폐기물 통계조사 | 수해폐기물 발생현황 | Y | 2 |
2 | 기타폐기물 | 전국 폐기물 통계조사 | 스포츠·레저시설 폐기물 발생현황 | Y | 2 |
3 | 사업장폐기물 | 전국 폐기물 통계조사 | 사업장폐기물 발생 및 처리현황(총괄) | Y | 2 |
4 | 사업장폐기물발생현황 | 전국 폐기물 통계조사 | 사업장폐기물 발생 및 처리현황(총괄) | Y | 2 |
5 | 생활폐기물 | 전국 폐기물 통계조사 | 도시규모별 재활용가능자원 분리배출현황 | Y | 2 |
6 | 생활폐기물 | 전국 폐기물 통계조사 | 도시규모별 재활용가능자원 종류에 따른 원단위 발생량 | Y | 2 |
7 | 생활폐기물 발생현황 | 전국 폐기물 통계조사 | 생활폐기물 발열량분석 연평균 | Y | 2 |
9 | 생활폐기물 발생현황 | 전국 폐기물 통계조사 | 생활폐기물 원소분석 연평균 | Y | 2 |