Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 100 |
Missing cells | 96 |
Missing cells (%) | 16.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.8 KiB |
Average record size in memory | 49.3 B |
Variable types
Text | 3 |
---|---|
Categorical | 3 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 그린에코스 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=c84ca0b0-c1c3-11ea-bda1-7db893c1a189 |
비고 has constant value "" | Constant |
플래그 is highly overall correlated with 출처 | High correlation |
출처 is highly overall correlated with 플래그 | High correlation |
플래그 is highly imbalanced (67.3%) | Imbalance |
출처 is highly imbalanced (67.3%) | Imbalance |
CAS등록번호 has 96 (96.0%) missing values | Missing |
기존물질번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 10:46:49.146857 |
---|---|
Analysis finished | 2023-12-10 10:46:49.820488 |
Duration | 0.67 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기존물질번호
Text
UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
ke-04602 | 1 | 1.0% |
ke-07049 | 1 | 1.0% |
ke-07214 | 1 | 1.0% |
ke-07183 | 1 | 1.0% |
ke-07182 | 1 | 1.0% |
ke-07181 | 1 | 1.0% |
ke-07180 | 1 | 1.0% |
ke-07085 | 1 | 1.0% |
ke-07084 | 1 | 1.0% |
ke-07052 | 1 | 1.0% |
Other values (90) | 90 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 139 | |
- | 106 | |
K | 94 | |
E | 94 | |
6 | 63 | |
2 | 49 | 6.0% |
7 | 49 | 6.0% |
5 | 48 | 5.9% |
1 | 40 | 4.9% |
8 | 37 | 4.5% |
Other values (3) | 96 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 521 | |
Uppercase Letter | 188 | 23.1% |
Dash Punctuation | 106 | 13.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 139 | |
6 | 63 | |
2 | 49 | 9.4% |
7 | 49 | 9.4% |
5 | 48 | 9.2% |
1 | 40 | 7.7% |
8 | 37 | 7.1% |
9 | 35 | 6.7% |
3 | 33 | 6.3% |
4 | 28 | 5.4% |
Uppercase Letter
Value | Count | Frequency (%) |
K | 94 | |
E | 94 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 106 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 627 | |
Latin | 188 | 23.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 139 | |
- | 106 | |
6 | 63 | |
2 | 49 | 7.8% |
7 | 49 | 7.8% |
5 | 48 | 7.7% |
1 | 40 | 6.4% |
8 | 37 | 5.9% |
9 | 35 | 5.6% |
3 | 33 | 5.3% |
Latin
Value | Count | Frequency (%) |
K | 94 | |
E | 94 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 815 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 139 | |
- | 106 | |
K | 94 | |
E | 94 | |
6 | 63 | |
2 | 49 | 6.0% |
7 | 49 | 6.0% |
5 | 48 | 5.9% |
1 | 40 | 4.9% |
8 | 37 | 4.5% |
Other values (3) | 96 |
CAS등록번호
Text
MISSING
 
Distinct | 4 |
---|---|
Distinct (%) | 100.0% |
Missing | 96 |
Missing (%) | 96.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
1333-89-7 | 1 | |
97765-54-3 | 1 | |
75-07-0 | 1 | |
60-35-5 | 1 |
Most occurring characters
Value | Count | Frequency (%) |
- | 8 | |
3 | 5 | |
7 | 5 | |
5 | 5 | |
0 | 3 | 9.1% |
9 | 2 | 6.1% |
6 | 2 | 6.1% |
1 | 1 | 3.0% |
8 | 1 | 3.0% |
4 | 1 | 3.0% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 25 | |
Dash Punctuation | 8 | 24.2% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
3 | 5 | |
7 | 5 | |
5 | 5 | |
0 | 3 | |
9 | 2 | 8.0% |
6 | 2 | 8.0% |
1 | 1 | 4.0% |
8 | 1 | 4.0% |
4 | 1 | 4.0% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 33 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 8 | |
3 | 5 | |
7 | 5 | |
5 | 5 | |
0 | 3 | 9.1% |
9 | 2 | 6.1% |
6 | 2 | 6.1% |
1 | 1 | 3.0% |
8 | 1 | 3.0% |
4 | 1 | 3.0% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 33 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 8 | |
3 | 5 | |
7 | 5 | |
5 | 5 | |
0 | 3 | 9.1% |
9 | 2 | 6.1% |
6 | 2 | 6.1% |
1 | 1 | 3.0% |
8 | 1 | 3.0% |
4 | 1 | 3.0% |
화학물질영문
Text
Distinct | 95 |
---|---|
Distinct (%) | 95.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Length
Max length | 49 |
---|---|
Median length | 41 |
Mean length | 21.48 |
Min length | 2 |
Characters and Unicode
Total characters | 2148 |
---|---|
Distinct characters | 56 |
Distinct categories | 10 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 94 ? |
---|---|
Unique (%) | 94.0% |
Sample
1st row | Calcium polyisobutenylsuccinate |
---|---|
2nd row | C.I. natural red 009 |
3rd row | Cresyl alkyl(C=3-10)carboxylate |
4th row | 3-Decyloxythiolane dioxide |
5th row | Acrylic acid alkenyl(C=4-22)ester |
Value | Count | Frequency (%) |
c.i | 73 | |
acid | 41 | 11.6% |
brown | 27 | 7.7% |
direct | 18 | 5.1% |
blue | 17 | 4.8% |
yellow | 14 | 4.0% |
disperse | 11 | 3.1% |
삭제 | 6 | 1.7% |
red | 6 | 1.7% |
green | 5 | 1.4% |
Other values (115) | 134 |
Most occurring characters
Value | Count | Frequency (%) |
340 | 15.8% | |
. | 152 | 7.1% |
e | 133 | 6.2% |
i | 98 | 4.6% |
l | 97 | 4.5% |
a | 90 | 4.2% |
d | 88 | 4.1% |
C | 87 | 4.1% |
r | 84 | 3.9% |
c | 82 | 3.8% |
Other values (46) | 897 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 1127 | |
Space Separator | 340 | 15.8% |
Decimal Number | 269 | 12.5% |
Uppercase Letter | 192 | 8.9% |
Other Punctuation | 160 | 7.4% |
Dash Punctuation | 19 | 0.9% |
Other Letter | 12 | 0.6% |
Open Punctuation | 11 | 0.5% |
Close Punctuation | 11 | 0.5% |
Math Symbol | 7 | 0.3% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
e | 133 | |
i | 98 | 8.7% |
l | 97 | 8.6% |
a | 90 | 8.0% |
d | 88 | 7.8% |
r | 84 | 7.5% |
c | 82 | 7.3% |
o | 70 | 6.2% |
b | 58 | 5.1% |
n | 55 | 4.9% |
Other values (14) | 272 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 87 | |
I | 73 | |
A | 14 | 7.3% |
S | 4 | 2.1% |
N | 4 | 2.1% |
M | 3 | 1.6% |
H | 2 | 1.0% |
T | 2 | 1.0% |
D | 1 | 0.5% |
P | 1 | 0.5% |
Decimal Number
Value | Count | Frequency (%) |
1 | 55 | |
0 | 36 | |
4 | 31 | |
2 | 30 | |
3 | 27 | |
5 | 24 | |
7 | 21 | 7.8% |
6 | 19 | 7.1% |
9 | 13 | 4.8% |
8 | 13 | 4.8% |
Other Punctuation
Value | Count | Frequency (%) |
. | 152 | |
, | 3 | 1.9% |
: | 3 | 1.9% |
; | 2 | 1.2% |
Other Letter
Value | Count | Frequency (%) |
삭 | 6 | |
제 | 6 |
Space Separator
Value | Count | Frequency (%) |
340 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 19 |
Open Punctuation
Value | Count | Frequency (%) |
( | 11 |
Close Punctuation
Value | Count | Frequency (%) |
) | 11 |
Math Symbol
Value | Count | Frequency (%) |
= | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 1318 | |
Common | 817 | |
Hangul | 12 | 0.6% |
Greek | 1 | < 0.1% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
e | 133 | 10.1% |
i | 98 | 7.4% |
l | 97 | 7.4% |
a | 90 | 6.8% |
d | 88 | 6.7% |
C | 87 | 6.6% |
r | 84 | 6.4% |
c | 82 | 6.2% |
I | 73 | 5.5% |
o | 70 | 5.3% |
Other values (24) | 416 |
Common
Value | Count | Frequency (%) |
340 | ||
. | 152 | |
1 | 55 | 6.7% |
0 | 36 | 4.4% |
4 | 31 | 3.8% |
2 | 30 | 3.7% |
3 | 27 | 3.3% |
5 | 24 | 2.9% |
7 | 21 | 2.6% |
6 | 19 | 2.3% |
Other values (9) | 82 | 10.0% |
Hangul
Value | Count | Frequency (%) |
삭 | 6 | |
제 | 6 |
Greek
Value | Count | Frequency (%) |
γ | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2135 | |
Hangul | 12 | 0.6% |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
340 | 15.9% | |
. | 152 | 7.1% |
e | 133 | 6.2% |
i | 98 | 4.6% |
l | 97 | 4.5% |
a | 90 | 4.2% |
d | 88 | 4.1% |
C | 87 | 4.1% |
r | 84 | 3.9% |
c | 82 | 3.8% |
Other values (43) | 884 |
Hangul
Value | Count | Frequency (%) |
삭 | 6 | |
제 | 6 |
None
Value | Count | Frequency (%) |
γ | 1 |
플래그
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
화평법 제2조제3호 가목에 따른 기존화학물질 | |
---|---|
화평법 제2조제3호 나목에 따른 기존화학물질 | 6 |
Length
Max length | 24 |
---|---|
Median length | 24 |
Mean length | 24 |
Min length | 24 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 화평법 제2조제3호 가목에 따른 기존화학물질 |
---|---|
2nd row | 화평법 제2조제3호 가목에 따른 기존화학물질 |
3rd row | 화평법 제2조제3호 가목에 따른 기존화학물질 |
4th row | 화평법 제2조제3호 가목에 따른 기존화학물질 |
5th row | 화평법 제2조제3호 가목에 따른 기존화학물질 |
Common Values
Value | Count | Frequency (%) |
화평법 제2조제3호 가목에 따른 기존화학물질 | 94 | |
화평법 제2조제3호 나목에 따른 기존화학물질 | 6 | 6.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
화평법 | 100 | |
제2조제3호 | 100 | |
따른 | 100 | |
기존화학물질 | 100 | |
가목에 | 94 | |
나목에 | 6 | 1.2% |
비고
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 |
---|
Length
Max length | 31 |
---|---|
Median length | 31 |
Mean length | 31 |
Min length | 31 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 |
---|---|
2nd row | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 |
3rd row | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 |
4th row | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 |
5th row | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 |
Common Values
Value | Count | Frequency (%) |
해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
해당 | 100 | |
화학물질의 | 100 | |
수화물 | 100 | |
또는 | 100 | |
무수물도 | 100 | |
기존화학물질에 | 100 | |
포함 | 100 |
출처
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
환경부고시 제2019-82호 별표1 | |
---|---|
환경부고시 제2019-82호 별표2 | 6 |
Length
Max length | 19 |
---|---|
Median length | 19 |
Mean length | 19 |
Min length | 19 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 환경부고시 제2019-82호 별표1 |
---|---|
2nd row | 환경부고시 제2019-82호 별표1 |
3rd row | 환경부고시 제2019-82호 별표1 |
4th row | 환경부고시 제2019-82호 별표1 |
5th row | 환경부고시 제2019-82호 별표1 |
Common Values
Value | Count | Frequency (%) |
환경부고시 제2019-82호 별표1 | 94 | |
환경부고시 제2019-82호 별표2 | 6 | 6.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
환경부고시 | 100 | |
제2019-82호 | 100 | |
별표1 | 94 | |
별표2 | 6 | 2.0% |
기존물질번호 | CAS등록번호 | 화학물질영문 | 플래그 | 출처 | |
---|---|---|---|---|---|
기존물질번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
CAS등록번호 | 1.000 | 1.000 | 1.000 | NaN | NaN |
화학물질영문 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
플래그 | 1.000 | NaN | 1.000 | 1.000 | 0.990 |
출처 | 1.000 | NaN | 1.000 | 0.990 | 1.000 |
플래그 | 출처 | |
---|---|---|
플래그 | 1.000 | 0.910 |
출처 | 0.910 | 1.000 |
플래그 | 출처 | |
---|---|---|
플래그 | 1.000 | 0.910 |
출처 | 0.910 | 1.000 |
기존물질번호 | CAS등록번호 | 화학물질영문 | 플래그 | 비고 | 출처 | |
---|---|---|---|---|---|---|
0 | KE-04602 | <NA> | Calcium polyisobutenylsuccinate | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
1 | KE-07824 | <NA> | C.I. natural red 009 | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
2 | KE-09016 | <NA> | Cresyl alkyl(C=3-10)carboxylate | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
3 | KE-09564 | <NA> | 3-Decyloxythiolane dioxide | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
4 | KE-00195 | <NA> | Acrylic acid alkenyl(C=4-22)ester | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
5 | KE-00711 | <NA> | Alkoxyalkyl(C=2-6)acrylate | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
6 | KE-00712 | <NA> | Alkoxyalkyl(C=2-4)methacrylate | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
7 | KE-00713 | <NA> | Alkoxy(C=3-10)diphenyl | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
8 | KE-00776 | <NA> | Alkylbenzylphthalate | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
9 | KE-00808 | <NA> | γ-Alkyllactone(C=5-16) | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
기존물질번호 | CAS등록번호 | 화학물질영문 | 플래그 | 비고 | 출처 | |
---|---|---|---|---|---|---|
90 | 2013-3-5717 | <NA> | 삭제 | 화평법 제2조제3호 나목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표2 |
91 | 2015-3-6253 | <NA> | 삭제 | 화평법 제2조제3호 나목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표2 |
92 | KE-07293 | <NA> | C.I. disperse blue 163 | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
93 | 2015-3-6460 | <NA> | 삭제 | 화평법 제2조제3호 나목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표2 |
94 | KE-07294 | <NA> | C.I. disperse blue 165:1 | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
95 | KE-07295 | <NA> | C.I. disperse blue 165:3 | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
96 | KE-00001 | 1333-89-7 | Abitol ; Hydroabietyl alcohol (CAS No. 1333-89-7) | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
97 | KE-00002 | 97765-54-3 | Acacia vestita, ext. (CAS No. 97765-54-3) | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
98 | KE-00003 | 75-07-0 | Acetaldehyde ; Ethanal (CAS No. 75-07-0) | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |
99 | KE-00004 | 60-35-5 | Acetamide (CAS No. 60-35-5) | 화평법 제2조제3호 가목에 따른 기존화학물질 | 해당 화학물질의 수화물 또는 무수물도 기존화학물질에 포함 | 환경부고시 제2019-82호 별표1 |