Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 72 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.9 KiB |
Average record size in memory | 41.8 B |
Variable types
Text | 2 |
---|---|
Categorical | 3 |
Dataset
Description | 국가 온실가스 인벤토리에서 사용하는 배출 활동별(에너지, 산업공정, 농업, LULUCF, 폐기물 등) 배출량 산정식 등 산정 방법에 대한 정보를 제공합니다. |
---|---|
Author | 환경부 온실가스종합정보센터 |
URL | https://www.data.go.kr/data/15039852/fileData.do |
산정식방법론 is highly imbalanced (61.9%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 10:31:43.803954 |
---|---|
Analysis finished | 2023-12-12 10:31:44.469904 |
Duration | 0.67 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
산정식명
Text
Distinct | 70 |
---|---|
Distinct (%) | 97.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 708.0 B |
Length
Max length | 20 |
---|---|
Median length | 14 |
Mean length | 10.972222 |
Min length | 4 |
Characters and Unicode
Total characters | 790 |
---|---|
Distinct characters | 160 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 68 ? |
---|---|
Unique (%) | 94.4% |
Sample
1st row | 에너지 N2O 산정식 |
---|---|
2nd row | 천연가스 탈루 산정식 |
3rd row | 석유 탈루 산정식 |
4th row | 에너지 CH4 산정식 |
5th row | 에너지 CO2 산정식 |
Value | Count | Frequency (%) |
산정식 | 37 | |
n2o | 12 | 6.7% |
생산 | 10 | 5.6% |
ch4 | 7 | 3.9% |
농경지토양 | 5 | 2.8% |
co2 | 4 | 2.2% |
소각 | 4 | 2.2% |
벼재배 | 3 | 1.7% |
사용 | 3 | 1.7% |
에너지 | 3 | 1.7% |
Other values (75) | 90 |
Most occurring characters
Value | Count | Frequency (%) |
109 | 13.8% | |
산 | 58 | 7.3% |
정 | 40 | 5.1% |
식 | 39 | 4.9% |
지 | 25 | 3.2% |
O | 19 | 2.4% |
2 | 19 | 2.4% |
생 | 16 | 2.0% |
용 | 15 | 1.9% |
C | 14 | 1.8% |
Other values (150) | 436 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 542 | |
Space Separator | 109 | 13.8% |
Uppercase Letter | 69 | 8.7% |
Lowercase Letter | 34 | 4.3% |
Decimal Number | 28 | 3.5% |
Dash Punctuation | 5 | 0.6% |
Other Punctuation | 2 | 0.3% |
Connector Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 58 | 10.7% |
정 | 40 | 7.4% |
식 | 39 | 7.2% |
지 | 25 | 4.6% |
생 | 16 | 3.0% |
용 | 15 | 2.8% |
기 | 11 | 2.0% |
토 | 10 | 1.8% |
리 | 10 | 1.8% |
소 | 9 | 1.7% |
Other values (128) | 309 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 19 | |
C | 14 | |
N | 14 | |
H | 10 | |
B | 4 | 5.8% |
I | 3 | 4.3% |
T | 2 | 2.9% |
P | 1 | 1.4% |
W | 1 | 1.4% |
F | 1 | 1.4% |
Lowercase Letter
Value | Count | Frequency (%) |
n | 10 | |
o | 7 | |
i | 5 | |
g | 4 | 11.8% |
e | 4 | 11.8% |
c | 4 | 11.8% |
Decimal Number
Value | Count | Frequency (%) |
2 | 19 | |
4 | 9 |
Space Separator
Value | Count | Frequency (%) |
109 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 2 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 542 | |
Common | 145 | 18.4% |
Latin | 103 | 13.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 58 | 10.7% |
정 | 40 | 7.4% |
식 | 39 | 7.2% |
지 | 25 | 4.6% |
생 | 16 | 3.0% |
용 | 15 | 2.8% |
기 | 11 | 2.0% |
토 | 10 | 1.8% |
리 | 10 | 1.8% |
소 | 9 | 1.7% |
Other values (128) | 309 |
Latin
Value | Count | Frequency (%) |
O | 19 | |
C | 14 | |
N | 14 | |
n | 10 | |
H | 10 | |
o | 7 | 6.8% |
i | 5 | 4.9% |
B | 4 | 3.9% |
g | 4 | 3.9% |
e | 4 | 3.9% |
Other values (6) | 12 |
Common
Value | Count | Frequency (%) |
109 | ||
2 | 19 | 13.1% |
4 | 9 | 6.2% |
- | 5 | 3.4% |
/ | 2 | 1.4% |
_ | 1 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 542 | |
ASCII | 248 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
109 | ||
O | 19 | 7.7% |
2 | 19 | 7.7% |
C | 14 | 5.6% |
N | 14 | 5.6% |
n | 10 | 4.0% |
H | 10 | 4.0% |
4 | 9 | 3.6% |
o | 7 | 2.8% |
- | 5 | 2.0% |
Other values (12) | 32 | 12.9% |
Hangul
Value | Count | Frequency (%) |
산 | 58 | 10.7% |
정 | 40 | 7.4% |
식 | 39 | 7.2% |
지 | 25 | 4.6% |
생 | 16 | 3.0% |
용 | 15 | 2.8% |
기 | 11 | 2.0% |
토 | 10 | 1.8% |
리 | 10 | 1.8% |
소 | 9 | 1.7% |
Other values (128) | 309 |
분야별
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 9.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 708.0 B |
산업공정 | |
---|---|
농업 | |
폐기물 | |
LULUCF | |
에너지 | |
Other values (2) | 2 |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 3.5694444 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 2.8% |
Sample
1st row | 에너지 |
---|---|
2nd row | 에너지 |
3rd row | 에너지 |
4th row | 에너지 |
5th row | 에너지 |
Common Values
Value | Count | Frequency (%) |
산업공정 | 26 | |
농업 | 15 | |
폐기물 | 12 | |
LULUCF | 9 | 12.5% |
에너지 | 8 | 11.1% |
에너지 | 1 | 1.4% |
산업공정 | 1 | 1.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
산업공정 | 27 | |
농업 | 15 | |
폐기물 | 12 | |
lulucf | 9 | 12.5% |
에너지 | 9 | 12.5% |
배출가스
Categorical
Distinct | 6 |
---|---|
Distinct (%) | 8.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 708.0 B |
CO2 | |
---|---|
N2O | |
CH4 | |
HFCs | |
PFCs |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.1388889 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | N2O |
---|---|
2nd row | CH4 |
3rd row | CH4 |
4th row | CH4 |
5th row | CO2 |
Common Values
Value | Count | Frequency (%) |
CO2 | 25 | |
N2O | 18 | |
CH4 | 17 | |
HFCs | 5 | 6.9% |
PFCs | 5 | 6.9% |
SF6 | 2 | 2.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
co2 | 25 | |
n2o | 18 | |
ch4 | 17 | |
hfcs | 5 | 6.9% |
pfcs | 5 | 6.9% |
sf6 | 2 | 2.8% |
산정식방법론
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 5.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 708.0 B |
IPCC Default | |
---|---|
Reference Approach | 6 |
IPCC Tier 2 | 3 |
IPCC Default | 1 |
Length
Max length | 18 |
---|---|
Median length | 12 |
Mean length | 12.472222 |
Min length | 11 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.4% |
Sample
1st row | IPCC Default |
---|---|
2nd row | IPCC Default |
3rd row | IPCC Default |
4th row | IPCC Default |
5th row | IPCC Default |
Common Values
Value | Count | Frequency (%) |
IPCC Default | 62 | |
Reference Approach | 6 | 8.3% |
IPCC Tier 2 | 3 | 4.2% |
IPCC Default | 1 | 1.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
ipcc | 66 | |
default | 63 | |
reference | 6 | 4.1% |
approach | 6 | 4.1% |
tier | 3 | 2.0% |
2 | 3 | 2.0% |
산정식
Text
Distinct | 65 |
---|---|
Distinct (%) | 90.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 708.0 B |
Length
Max length | 170 |
---|---|
Median length | 44 |
Mean length | 30.708333 |
Min length | 4 |
Characters and Unicode
Total characters | 2211 |
---|---|
Distinct characters | 185 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 61 ? |
---|---|
Unique (%) | 84.7% |
Sample
1st row | 활동자료*순발열량/총발열량*N2O EF*산화계수/1000000*41.868 |
---|---|
2nd row | 활동자료*NG단위환산계수*천연가스탈루배출계수 |
3rd row | 활동자료*석유탈루배출계수*0.158987 |
4th row | 활동자료*순발열량/총발열량*CH4 EF*산화계수/1000000*41.868 |
5th row | 활동자료*순발열량/총발열량*CO2 EF*산화계수/1000*41.868 |
Value | Count | Frequency (%) |
배출계수*부생가스 | 7 | 6.0% |
gwp+활동자료*부생가스 | 7 | 6.0% |
c3f8 | 4 | 3.4% |
c2f6 | 4 | 3.4% |
cf4 | 4 | 3.4% |
활동자료*연간배출률 | 4 | 3.4% |
gwp)/1000 | 3 | 2.6% |
활동자료*벼재배배출계수*물관리보정계수*볏짚시용보정계수*작기전물관리보정계수*벼재배일수/1000 | 3 | 2.6% |
chf3 | 2 | 1.7% |
활동자료 | 2 | 1.7% |
Other values (74) | 77 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 195 | 8.8% |
* | 164 | 7.4% |
1 | 82 | 3.7% |
/ | 74 | 3.3% |
수 | 74 | 3.3% |
4 | 66 | 3.0% |
료 | 63 | 2.8% |
계 | 60 | 2.7% |
활 | 56 | 2.5% |
동 | 56 | 2.5% |
Other values (175) | 1321 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1161 | |
Decimal Number | 429 | 19.4% |
Other Punctuation | 244 | 11.0% |
Uppercase Letter | 177 | 8.0% |
Space Separator | 46 | 2.1% |
Connector Punctuation | 41 | 1.9% |
Lowercase Letter | 33 | 1.5% |
Dash Punctuation | 23 | 1.0% |
Close Punctuation | 22 | 1.0% |
Open Punctuation | 21 | 0.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
수 | 74 | 6.4% |
료 | 63 | 5.4% |
계 | 60 | 5.2% |
활 | 56 | 4.8% |
동 | 56 | 4.8% |
자 | 56 | 4.8% |
배 | 56 | 4.8% |
출 | 53 | 4.6% |
량 | 47 | 4.0% |
소 | 32 | 2.8% |
Other values (125) | 608 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 36 | |
F | 30 | |
O | 16 | |
H | 15 | |
P | 13 | 7.3% |
G | 13 | 7.3% |
W | 13 | 7.3% |
N | 12 | 6.8% |
E | 9 | 5.1% |
S | 4 | 2.3% |
Other values (7) | 16 |
Lowercase Letter
Value | Count | Frequency (%) |
c | 6 | |
i | 4 | |
f | 4 | |
e | 3 | |
u | 3 | |
r | 3 | |
s | 3 | |
m | 2 | 6.1% |
d | 2 | 6.1% |
a | 1 | 3.0% |
Other values (2) | 2 | 6.1% |
Decimal Number
Value | Count | Frequency (%) |
0 | 195 | |
1 | 82 | |
4 | 66 | 15.4% |
2 | 43 | 10.0% |
8 | 22 | 5.1% |
6 | 10 | 2.3% |
3 | 7 | 1.6% |
5 | 2 | 0.5% |
9 | 1 | 0.2% |
7 | 1 | 0.2% |
Other Punctuation
Value | Count | Frequency (%) |
* | 164 | |
/ | 74 | |
. | 5 | 2.0% |
: | 1 | 0.4% |
Math Symbol
Value | Count | Frequency (%) |
+ | 12 | |
~ | 2 | 14.3% |
Space Separator
Value | Count | Frequency (%) |
46 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 41 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 23 |
Close Punctuation
Value | Count | Frequency (%) |
) | 22 |
Open Punctuation
Value | Count | Frequency (%) |
( | 21 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1161 | |
Common | 840 | |
Latin | 210 | 9.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
수 | 74 | 6.4% |
료 | 63 | 5.4% |
계 | 60 | 5.2% |
활 | 56 | 4.8% |
동 | 56 | 4.8% |
자 | 56 | 4.8% |
배 | 56 | 4.8% |
출 | 53 | 4.6% |
량 | 47 | 4.0% |
소 | 32 | 2.8% |
Other values (125) | 608 |
Latin
Value | Count | Frequency (%) |
C | 36 | |
F | 30 | |
O | 16 | 7.6% |
H | 15 | 7.1% |
P | 13 | 6.2% |
G | 13 | 6.2% |
W | 13 | 6.2% |
N | 12 | 5.7% |
E | 9 | 4.3% |
c | 6 | 2.9% |
Other values (19) | 47 |
Common
Value | Count | Frequency (%) |
0 | 195 | |
* | 164 | |
1 | 82 | |
/ | 74 | 8.8% |
4 | 66 | 7.9% |
46 | 5.5% | |
2 | 43 | 5.1% |
_ | 41 | 4.9% |
- | 23 | 2.7% |
8 | 22 | 2.6% |
Other values (11) | 84 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1161 | |
ASCII | 1050 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 195 | |
* | 164 | |
1 | 82 | 7.8% |
/ | 74 | 7.0% |
4 | 66 | 6.3% |
46 | 4.4% | |
2 | 43 | 4.1% |
_ | 41 | 3.9% |
C | 36 | 3.4% |
F | 30 | 2.9% |
Other values (40) | 273 |
Hangul
Value | Count | Frequency (%) |
수 | 74 | 6.4% |
료 | 63 | 5.4% |
계 | 60 | 5.2% |
활 | 56 | 4.8% |
동 | 56 | 4.8% |
자 | 56 | 4.8% |
배 | 56 | 4.8% |
출 | 53 | 4.6% |
량 | 47 | 4.0% |
소 | 32 | 2.8% |
Other values (125) | 608 |
산정식명 | 분야별 | 배출가스 | 산정식방법론 | 산정식 | |
---|---|---|---|---|---|
산정식명 | 1.000 | 1.000 | 0.977 | 1.000 | 0.978 |
분야별 | 1.000 | 1.000 | 0.470 | 0.527 | 0.993 |
배출가스 | 0.977 | 0.470 | 1.000 | 0.000 | 0.805 |
산정식방법론 | 1.000 | 0.527 | 0.000 | 1.000 | 0.000 |
산정식 | 0.978 | 0.993 | 0.805 | 0.000 | 1.000 |
산정식방법론 | 분야별 | 배출가스 | |
---|---|---|---|
산정식방법론 | 1.000 | 0.381 | 0.000 |
분야별 | 0.381 | 1.000 | 0.299 |
배출가스 | 0.000 | 0.299 | 1.000 |
분야별 | 배출가스 | 산정식방법론 | |
---|---|---|---|
분야별 | 1.000 | 0.299 | 0.381 |
배출가스 | 0.299 | 1.000 | 0.000 |
산정식방법론 | 0.381 | 0.000 | 1.000 |
산정식명 | 분야별 | 배출가스 | 산정식방법론 | 산정식 | |
---|---|---|---|---|---|
0 | 에너지 N2O 산정식 | 에너지 | N2O | IPCC Default | 활동자료*순발열량/총발열량*N2O EF*산화계수/1000000*41.868 |
1 | 천연가스 탈루 산정식 | 에너지 | CH4 | IPCC Default | 활동자료*NG단위환산계수*천연가스탈루배출계수 |
2 | 석유 탈루 산정식 | 에너지 | CH4 | IPCC Default | 활동자료*석유탈루배출계수*0.158987 |
3 | 에너지 CH4 산정식 | 에너지 | CH4 | IPCC Default | 활동자료*순발열량/총발열량*CH4 EF*산화계수/1000000*41.868 |
4 | 에너지 CO2 산정식 | 에너지 | CO2 | IPCC Default | 활동자료*순발열량/총발열량*CO2 EF*산화계수/1000*41.868 |
5 | 탈루 촉매재생 산정식 | 에너지 | CO2 | IPCC Default | 활동자료 |
6 | 민간항공기 CO2 산정식 | 에너지 | CO2 | IPCC Tier 2 | 항공_LTO_CO2배출량+항공_cruise_CO2배출량 |
7 | 민간항공기 CH4 산정식 | 에너지 | CH4 | IPCC Tier 2 | 항공_LTO_CH4배출량+항공_cruise_CH4배출량 |
8 | 민간항공기 N2O 산정식 | 에너지 | N2O | IPCC Tier 2 | 항공_LTO_N2O배출량+항공_cruise_N2O배출량 |
9 | 시멘트 생산 | 산업공정 | CO2 | Reference Approach | 활동자료*클링커배출계수*CKD보정계수/1000 |
산정식명 | 분야별 | 배출가스 | 산정식방법론 | 산정식 | |
---|---|---|---|---|---|
62 | 소각 non-BIogenic CO2 | 폐기물 | CO2 | IPCC Default | 활동자료*소각_dm*소각_cf*소각_fcf*소각_OF*년일수*44/12/1000 |
63 | 소각 non-BIogenic CH4 | 폐기물 | CH4 | IPCC Default | 활동자료*CH4배출계수*년일수/1000000000 |
64 | 소각 non-BIogenic N2O | 폐기물 | N2O | IPCC Default | 활동자료*N20배출계수*년일수/1000000000 |
65 | 소각 Biogenic CO2 | 폐기물 | CO2 | IPCC Default | 활동자료*소각_dm*소각_cf*소각_OF*소각_바이오함량*년일수*44/12/1000 |
66 | 고형폐기물 생물학적처리 | 폐기물 | N2O | IPCC Default | 활동자료*N20배출계수/1000 |
67 | 폐수처리 CH4 산정식 | 폐기물 | CH4 | IPCC Default | BOD부하량/1000 |
68 | 공공하수처리 CH4산정식 | 폐기물 | CH4 | IPCC Default | (활동자료*CH4배출계수*인구율)-공공하수회수량 |
69 | 미처리/미차집 CH4산정식 | 폐기물 | CH4 | IPCC Default | 활동자료*CH4배출계수 |
70 | 고도처리 N2O 산정식 | 폐기물 | N2O | IPCC Default | (활동자료*N20배출계수*단백질비율/1000000) |
71 | 분뇨 N2O 산정식 | 폐기물 | N2O | IPCC Default | (분뇨질소부하량)*N20배출계수*44/28 |