Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 24808 |
Missing cells (%) | 24.8% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 878.9 KiB |
Average record size in memory | 90.0 B |
Variable types
Text | 6 |
---|---|
Categorical | 2 |
Unsupported | 2 |
Dataset
GHS코드 is highly overall correlated with 유해위험세부분류 | High correlation |
유해위험세부분류 is highly overall correlated with GHS코드 | High correlation |
국문 has 4808 (48.1%) missing values | Missing |
Unnamed: 8 has 10000 (100.0%) missing values | Missing |
Unnamed: 9 has 10000 (100.0%) missing values | Missing |
Unnamed: 8 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-01-09 21:51:10.987825 |
---|---|
Analysis finished | 2024-01-09 21:51:11.973581 |
Duration | 0.99 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
고유(CAS)번호
Text
Distinct | 6781 |
---|---|
Distinct (%) | 67.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 12 |
---|---|
Median length | 11 |
Mean length | 9.0037 |
Min length | 7 |
Characters and Unicode
Total characters | 90037 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 4499 ? |
---|---|
Unique (%) | 45.0% |
Sample
1st row | 50-84-0 |
---|---|
2nd row | 625-43-4 |
3rd row | 1310-73-2 |
4th row | 461-58-5 |
5th row | 157299-02-0 |
Value | Count | Frequency (%) |
16337-84-1 | 8 | 0.1% |
96-29-7 | 7 | 0.1% |
822-36-6 | 7 | 0.1% |
3121-61-7 | 7 | 0.1% |
15571-58-1 | 7 | 0.1% |
593-74-8 | 7 | 0.1% |
584-79-2 | 7 | 0.1% |
108-90-7 | 6 | 0.1% |
7785-87-7 | 6 | 0.1% |
7446-14-2 | 6 | 0.1% |
Other values (6771) | 9932 |
Most occurring characters
Value | Count | Frequency (%) |
- | 20000 | |
1 | 9149 | |
0 | 7156 | 7.9% |
5 | 7017 | 7.8% |
6 | 7000 | 7.8% |
2 | 6996 | 7.8% |
3 | 6889 | 7.7% |
8 | 6592 | 7.3% |
7 | 6541 | 7.3% |
4 | 6428 | 7.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 70037 | |
Dash Punctuation | 20000 | 22.2% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 9149 | |
0 | 7156 | |
5 | 7017 | |
6 | 7000 | |
2 | 6996 | |
3 | 6889 | |
8 | 6592 | |
7 | 6541 | |
4 | 6428 | |
9 | 6269 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 20000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 90037 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 20000 | |
1 | 9149 | |
0 | 7156 | 7.9% |
5 | 7017 | 7.8% |
6 | 7000 | 7.8% |
2 | 6996 | 7.8% |
3 | 6889 | 7.7% |
8 | 6592 | 7.3% |
7 | 6541 | 7.3% |
4 | 6428 | 7.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 90037 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 20000 | |
1 | 9149 | |
0 | 7156 | 7.9% |
5 | 7017 | 7.8% |
6 | 7000 | 7.8% |
2 | 6996 | 7.8% |
3 | 6889 | 7.7% |
8 | 6592 | 7.3% |
7 | 6541 | 7.3% |
4 | 6428 | 7.1% |
영문
Text
Distinct | 6764 |
---|---|
Distinct (%) | 67.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 285 |
---|---|
Median length | 191 |
Mean length | 34.3778 |
Min length | 3 |
Characters and Unicode
Total characters | 343778 |
---|---|
Distinct characters | 105 |
Distinct categories | 13 ? |
Distinct scripts | 3 ? |
Distinct blocks | 6 ? |
Unique
Unique | 4475 ? |
---|---|
Unique (%) | 44.8% |
Sample
1st row | 2,4-Dichlorobenzoic acid |
---|---|
2nd row | N-Methylisobutylamine |
3rd row | Sodium,hydroxide |
4th row | Cyanoguanidine |
5th row | 1,3-Bis(1-isocyanato-1-methylethyl)benzene homopolymer |
Value | Count | Frequency (%) |
acid | 1098 | 5.7% |
salt | 393 | 2.0% |
ester | 330 | 1.7% |
with | 294 | 1.5% |
sodium | 252 | 1.3% |
homopolymer | 187 | 1.0% |
polymer | 175 | 0.9% |
and | 134 | 0.7% |
chloride | 128 | 0.7% |
hydrochloride | 96 | 0.5% |
Other values (7794) | 16087 |
Most occurring characters
Value | Count | Frequency (%) |
e | 29692 | 8.6% |
o | 23342 | 6.8% |
i | 21866 | 6.4% |
l | 19980 | 5.8% |
- | 19605 | 5.7% |
t | 17982 | 5.2% |
n | 17831 | 5.2% |
a | 17559 | 5.1% |
y | 15595 | 4.5% |
h | 14669 | 4.3% |
Other values (95) | 145657 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 256169 | |
Decimal Number | 19828 | 5.8% |
Dash Punctuation | 19605 | 5.7% |
Uppercase Letter | 15122 | 4.4% |
Other Punctuation | 13685 | 4.0% |
Space Separator | 9176 | 2.7% |
Open Punctuation | 4889 | 1.4% |
Close Punctuation | 4871 | 1.4% |
Math Symbol | 400 | 0.1% |
Modifier Symbol | 22 | < 0.1% |
Other values (3) | 11 | < 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
e | 29692 | |
o | 23342 | 9.1% |
i | 21866 | 8.5% |
l | 19980 | 7.8% |
t | 17982 | 7.0% |
n | 17831 | 7.0% |
a | 17559 | 6.9% |
y | 15595 | 6.1% |
h | 14669 | 5.7% |
r | 13676 | 5.3% |
Other values (25) | 63977 |
Uppercase Letter
Value | Count | Frequency (%) |
D | 1760 | |
C | 1518 | |
N | 1383 | |
T | 1162 | 7.7% |
H | 1159 | 7.7% |
M | 1144 | 7.6% |
P | 1030 | 6.8% |
B | 996 | 6.6% |
A | 933 | 6.2% |
E | 717 | 4.7% |
Other values (16) | 3320 |
Other Punctuation
Value | Count | Frequency (%) |
, | 11193 | |
; | 991 | 7.2% |
' | 710 | 5.2% |
. | 556 | 4.1% |
: | 159 | 1.2% |
* | 33 | 0.2% |
′ | 16 | 0.1% |
/ | 13 | 0.1% |
% | 4 | < 0.1% |
" | 4 | < 0.1% |
Other values (3) | 6 | < 0.1% |
Decimal Number
Value | Count | Frequency (%) |
2 | 5286 | |
1 | 4942 | |
3 | 2855 | |
4 | 2771 | |
5 | 1267 | 6.4% |
6 | 1038 | 5.2% |
7 | 532 | 2.7% |
0 | 428 | 2.2% |
8 | 395 | 2.0% |
9 | 314 | 1.6% |
Math Symbol
Value | Count | Frequency (%) |
= | 256 | |
+ | 89 | 22.2% |
± | 26 | 6.5% |
→ | 14 | 3.5% |
~ | 6 | 1.5% |
∼ | 4 | 1.0% |
< | 4 | 1.0% |
> | 1 | 0.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 3561 | |
] | 1308 | 26.9% |
} | 2 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 3560 | |
[ | 1328 | 27.2% |
{ | 1 | < 0.1% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 1 | |
“ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 19605 |
Space Separator
Value | Count | Frequency (%) |
9176 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 22 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 6 |
Letter Number
Value | Count | Frequency (%) |
Ⅲ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 270740 | |
Common | 72484 | 21.1% |
Greek | 554 | 0.2% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
e | 29692 | 11.0% |
o | 23342 | 8.6% |
i | 21866 | 8.1% |
l | 19980 | 7.4% |
t | 17982 | 6.6% |
n | 17831 | 6.6% |
a | 17559 | 6.5% |
y | 15595 | 5.8% |
h | 14669 | 5.4% |
r | 13676 | 5.1% |
Other values (43) | 78548 |
Common
Value | Count | Frequency (%) |
- | 19605 | |
, | 11193 | |
9176 | ||
2 | 5286 | 7.3% |
1 | 4942 | 6.8% |
) | 3561 | 4.9% |
( | 3560 | 4.9% |
3 | 2855 | 3.9% |
4 | 2771 | 3.8% |
[ | 1328 | 1.8% |
Other values (33) | 8207 |
Greek
Value | Count | Frequency (%) |
α | 319 | |
ω | 101 | 18.2% |
β | 90 | 16.2% |
γ | 15 | 2.7% |
κ | 11 | 2.0% |
μ | 7 | 1.3% |
η | 5 | 0.9% |
δ | 3 | 0.5% |
λ | 3 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 343153 | |
None | 580 | 0.2% |
Punctuation | 24 | < 0.1% |
Arrows | 14 | < 0.1% |
Math Operators | 4 | < 0.1% |
Number Forms | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
e | 29692 | 8.7% |
o | 23342 | 6.8% |
i | 21866 | 6.4% |
l | 19980 | 5.8% |
- | 19605 | 5.7% |
t | 17982 | 5.2% |
n | 17831 | 5.2% |
a | 17559 | 5.1% |
y | 15595 | 4.5% |
h | 14669 | 4.3% |
Other values (78) | 145032 |
None
Value | Count | Frequency (%) |
α | 319 | |
ω | 101 | 17.4% |
β | 90 | 15.5% |
± | 26 | 4.5% |
γ | 15 | 2.6% |
κ | 11 | 1.9% |
μ | 7 | 1.2% |
η | 5 | 0.9% |
δ | 3 | 0.5% |
λ | 3 | 0.5% |
Punctuation
Value | Count | Frequency (%) |
′ | 16 | |
’ | 6 | 25.0% |
‘ | 1 | 4.2% |
“ | 1 | 4.2% |
Arrows
Value | Count | Frequency (%) |
→ | 14 |
Math Operators
Value | Count | Frequency (%) |
∼ | 4 |
Number Forms
Value | Count | Frequency (%) |
Ⅲ | 3 |
국문
Text
MISSING
 
Distinct | 3424 |
---|---|
Distinct (%) | 65.9% |
Missing | 4808 |
Missing (%) | 48.1% |
Memory size | 156.2 KiB |
Length
Max length | 159 |
---|---|
Median length | 82 |
Mean length | 12.843413 |
Min length | 1 |
Characters and Unicode
Total characters | 66683 |
---|---|
Distinct characters | 452 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 2172 ? |
---|---|
Unique (%) | 41.8% |
Sample
1st row | 수산화나트륨 |
---|---|
2nd row | 사이아노구아니딘 |
3rd row | 2,4-다이나이트로페놀 |
4th row | 3,4-다이클로로톨루엔 |
5th row | 스칸듐과,결합한,안티모니,화합물(1,:,1) |
Value | Count | Frequency (%) |
1:1 | 16 | 0.3% |
염 | 15 | 0.3% |
니켈 | 12 | 0.2% |
메틸 | 11 | 0.2% |
에스터 | 8 | 0.1% |
리튬 | 8 | 0.1% |
에틸렌,글라이콜,메틸,에테르,아크릴레이트 | 7 | 0.1% |
황산 | 7 | 0.1% |
소듐 | 7 | 0.1% |
다이메틸수은 | 7 | 0.1% |
Other values (3565) | 5455 |
Most occurring characters
Value | Count | Frequency (%) |
- | 4935 | 7.4% |
이 | 4640 | 7.0% |
, | 4487 | 6.7% |
로 | 2689 | 4.0% |
트 | 2098 | 3.1% |
틸 | 1851 | 2.8% |
아 | 1798 | 2.7% |
2 | 1378 | 2.1% |
메 | 1327 | 2.0% |
다 | 1276 | 1.9% |
Other values (442) | 40204 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 48196 | |
Decimal Number | 4974 | 7.5% |
Dash Punctuation | 4935 | 7.4% |
Other Punctuation | 4854 | 7.3% |
Uppercase Letter | 1033 | 1.5% |
Open Punctuation | 956 | 1.4% |
Close Punctuation | 953 | 1.4% |
Lowercase Letter | 364 | 0.5% |
Space Separator | 361 | 0.5% |
Math Symbol | 54 | 0.1% |
Other values (2) | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 4640 | 9.6% |
로 | 2689 | 5.6% |
트 | 2098 | 4.4% |
틸 | 1851 | 3.8% |
아 | 1798 | 3.7% |
메 | 1327 | 2.8% |
다 | 1276 | 2.6% |
드 | 1257 | 2.6% |
라 | 1144 | 2.4% |
산 | 988 | 2.0% |
Other values (354) | 29128 |
Lowercase Letter
Value | Count | Frequency (%) |
t | 51 | |
e | 40 | |
a | 39 | |
r | 32 | 8.8% |
o | 21 | 5.8% |
n | 20 | 5.5% |
k | 20 | 5.5% |
α | 19 | 5.2% |
p | 17 | 4.7% |
c | 12 | 3.3% |
Other values (20) | 93 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 313 | |
I | 193 | |
O | 92 | 8.9% |
C | 76 | 7.4% |
H | 58 | 5.6% |
S | 57 | 5.5% |
T | 47 | 4.5% |
R | 44 | 4.3% |
E | 29 | 2.8% |
P | 28 | 2.7% |
Other values (10) | 96 | 9.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 4487 | |
' | 160 | 3.3% |
. | 82 | 1.7% |
: | 64 | 1.3% |
* | 13 | 0.3% |
/ | 13 | 0.3% |
′ | 10 | 0.2% |
· | 9 | 0.2% |
; | 7 | 0.1% |
% | 4 | 0.1% |
Other values (3) | 5 | 0.1% |
Decimal Number
Value | Count | Frequency (%) |
2 | 1378 | |
1 | 1194 | |
3 | 809 | |
4 | 789 | |
5 | 346 | 7.0% |
6 | 223 | 4.5% |
7 | 71 | 1.4% |
9 | 62 | 1.2% |
8 | 56 | 1.1% |
0 | 46 | 0.9% |
Math Symbol
Value | Count | Frequency (%) |
+ | 34 | |
= | 10 | 18.5% |
~ | 7 | 13.0% |
± | 2 | 3.7% |
< | 1 | 1.9% |
Close Punctuation
Value | Count | Frequency (%) |
) | 793 | |
] | 158 | 16.6% |
} | 2 | 0.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 790 | |
[ | 165 | 17.3% |
{ | 1 | 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4935 |
Space Separator
Value | Count | Frequency (%) |
361 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 2 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 48196 | |
Common | 17090 | 25.6% |
Latin | 1352 | 2.0% |
Greek | 45 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 4640 | 9.6% |
로 | 2689 | 5.6% |
트 | 2098 | 4.4% |
틸 | 1851 | 3.8% |
아 | 1798 | 3.7% |
메 | 1327 | 2.8% |
다 | 1276 | 2.6% |
드 | 1257 | 2.6% |
라 | 1144 | 2.4% |
산 | 988 | 2.0% |
Other values (354) | 29128 |
Latin
Value | Count | Frequency (%) |
N | 313 | |
I | 193 | |
O | 92 | 6.8% |
C | 76 | 5.6% |
H | 58 | 4.3% |
S | 57 | 4.2% |
t | 51 | 3.8% |
T | 47 | 3.5% |
R | 44 | 3.3% |
e | 40 | 3.0% |
Other values (33) | 381 |
Common
Value | Count | Frequency (%) |
- | 4935 | |
, | 4487 | |
2 | 1378 | 8.1% |
1 | 1194 | 7.0% |
3 | 809 | 4.7% |
) | 793 | 4.6% |
( | 790 | 4.6% |
4 | 789 | 4.6% |
361 | 2.1% | |
5 | 346 | 2.0% |
Other values (28) | 1208 | 7.1% |
Greek
Value | Count | Frequency (%) |
α | 19 | |
κ | 9 | |
μ | 5 | 11.1% |
η | 4 | 8.9% |
λ | 3 | 6.7% |
β | 3 | 6.7% |
ω | 2 | 4.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 48196 | |
ASCII | 18418 | 27.6% |
None | 56 | 0.1% |
Punctuation | 13 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 4935 | |
, | 4487 | |
2 | 1378 | 7.5% |
1 | 1194 | 6.5% |
3 | 809 | 4.4% |
) | 793 | 4.3% |
( | 790 | 4.3% |
4 | 789 | 4.3% |
361 | 2.0% | |
5 | 346 | 1.9% |
Other values (66) | 2536 |
Hangul
Value | Count | Frequency (%) |
이 | 4640 | 9.6% |
로 | 2689 | 5.6% |
트 | 2098 | 4.4% |
틸 | 1851 | 3.8% |
아 | 1798 | 3.7% |
메 | 1327 | 2.8% |
다 | 1276 | 2.6% |
드 | 1257 | 2.6% |
라 | 1144 | 2.4% |
산 | 988 | 2.0% |
Other values (354) | 29128 |
None
Value | Count | Frequency (%) |
α | 19 | |
· | 9 | |
κ | 9 | |
μ | 5 | 8.9% |
η | 4 | 7.1% |
λ | 3 | 5.4% |
β | 3 | 5.4% |
± | 2 | 3.6% |
ω | 2 | 3.6% |
Punctuation
Value | Count | Frequency (%) |
′ | 10 | |
‘ | 2 | 15.4% |
’ | 1 | 7.7% |
유해위험코드
Text
Distinct | 65 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
h319 | 1155 | 11.6% |
h315 | 1094 | 10.9% |
h335 | 814 | 8.1% |
h302 | 751 | 7.5% |
h400 | 471 | 4.7% |
h317 | 435 | 4.3% |
h410 | 395 | 4.0% |
h314 | 381 | 3.8% |
h318 | 359 | 3.6% |
h332 | 309 | 3.1% |
Other values (55) | 3836 |
Most occurring characters
Value | Count | Frequency (%) |
H | 10000 | |
3 | 9891 | |
1 | 6079 | |
0 | 3376 | 8.4% |
2 | 2883 | 7.2% |
5 | 2299 | 5.7% |
4 | 2185 | 5.5% |
9 | 1179 | 2.9% |
7 | 1044 | 2.6% |
6 | 625 | 1.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 30000 | |
Uppercase Letter | 10000 | 25.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
3 | 9891 | |
1 | 6079 | |
0 | 3376 | 11.3% |
2 | 2883 | 9.6% |
5 | 2299 | 7.7% |
4 | 2185 | 7.3% |
9 | 1179 | 3.9% |
7 | 1044 | 3.5% |
6 | 625 | 2.1% |
8 | 439 | 1.5% |
Uppercase Letter
Value | Count | Frequency (%) |
H | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 30000 | |
Latin | 10000 | 25.0% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
3 | 9891 | |
1 | 6079 | |
0 | 3376 | 11.3% |
2 | 2883 | 9.6% |
5 | 2299 | 7.7% |
4 | 2185 | 7.3% |
9 | 1179 | 3.9% |
7 | 1044 | 3.5% |
6 | 625 | 2.1% |
8 | 439 | 1.5% |
Latin
Value | Count | Frequency (%) |
H | 10000 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 40000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
H | 10000 | |
3 | 9891 | |
1 | 6079 | |
0 | 3376 | 8.4% |
2 | 2883 | 7.2% |
5 | 2299 | 5.7% |
4 | 2185 | 5.5% |
9 | 1179 | 2.9% |
7 | 1044 | 2.6% |
6 | 625 | 1.6% |
GHS코드
Categorical
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
GHS07 | |
---|---|
GHS08 | |
GHS09 | |
GHS06 | |
GHS05 | |
Other values (5) |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9454 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | GHS07 |
---|---|
2nd row | GHS02 |
3rd row | GHS05 |
4th row | GHS07 |
5th row | GHS08 |
Common Values
Value | Count | Frequency (%) |
GHS07 | 4926 | |
GHS08 | 1278 | 12.8% |
GHS09 | 1118 | 11.2% |
GHS06 | 815 | 8.2% |
GHS05 | 764 | 7.6% |
<NA> | 546 | 5.5% |
GHS02 | 463 | 4.6% |
GHS03 | 41 | 0.4% |
GHS04 | 37 | 0.4% |
GHS01 | 12 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
ghs07 | 4926 | |
ghs08 | 1278 | 12.8% |
ghs09 | 1118 | 11.2% |
ghs06 | 815 | 8.2% |
ghs05 | 764 | 7.6% |
na | 546 | 5.5% |
ghs02 | 463 | 4.6% |
ghs03 | 41 | 0.4% |
ghs04 | 37 | 0.4% |
ghs01 | 12 | 0.1% |
유해위험세부분류
Categorical
HIGH CORRELATION
 
Distinct | 28 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
심한 눈 손상 또는 눈 자극성 | |
---|---|
피부 부식성 또는 자극성 | |
급성독성-경구 | |
특정 표적장기 독성-1회 노출 | |
수생환경 유해성-만성 | |
Other values (23) |
Length
Max length | 22 |
---|---|
Median length | 18 |
Mean length | 11.05 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 심한 눈 손상 또는 눈 자극성 |
---|---|
2nd row | 인화성 액체 |
3rd row | 금속부식성 물질 |
4th row | 급성독성-경피 |
5th row | 호흡기 과민성 |
Common Values
Value | Count | Frequency (%) |
심한 눈 손상 또는 눈 자극성 | 1572 | |
피부 부식성 또는 자극성 | 1495 | |
급성독성-경구 | 1090 | |
특정 표적장기 독성-1회 노출 | 1070 | |
수생환경 유해성-만성 | 959 | |
급성독성-흡입 | 617 | 6.2% |
수생환경 유해성-급성 | 533 | 5.3% |
급성독성-경피 | 440 | 4.4% |
피부 과민성 | 435 | 4.3% |
인화성 액체 | 396 | 4.0% |
Other values (18) | 1393 |
Length
Value | Count | Frequency (%) |
눈 | 3144 | 10.6% |
또는 | 3067 | 10.3% |
자극성 | 3067 | 10.3% |
피부 | 1930 | 6.5% |
심한 | 1572 | 5.3% |
손상 | 1572 | 5.3% |
부식성 | 1495 | 5.0% |
수생환경 | 1492 | 5.0% |
특정 | 1463 | 4.9% |
표적장기 | 1463 | 4.9% |
Other values (33) | 9473 |
유해성 항목
Text
Distinct | 65 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 63 |
---|---|
Median length | 41 |
Mean length | 23.5113 |
Min length | 14 |
Characters and Unicode
Total characters | 235113 |
---|---|
Distinct characters | 94 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 심한 눈 손상/눈 자극성(3.3)의 구분 2(2A) |
---|---|
2nd row | 인화성 액체(2.6)의 구분 1 |
3rd row | 금속부식성 물질(2.16)의 구분 1 |
4th row | 급성독성-경피(3.1)의 구분 4 |
5th row | 호흡기 과민성(3.4)의 구분 1(1A, 1B) |
Value | Count | Frequency (%) |
구분 | 10041 | |
2 | 2581 | 5.4% |
3 | 2032 | 4.3% |
1 | 1985 | 4.2% |
심한 | 1572 | 3.3% |
손상/눈 | 1572 | 3.3% |
자극성(3.3)의 | 1572 | 3.3% |
눈 | 1572 | 3.3% |
4 | 1506 | 3.2% |
피부부식성/자극성(3.2)의 | 1495 | 3.1% |
Other values (62) | 21712 |
Most occurring characters
Value | Count | Frequency (%) |
37640 | ||
성 | 15139 | 6.4% |
) | 12374 | 5.3% |
( | 12374 | 5.3% |
3 | 11523 | 4.9% |
구 | 11148 | 4.7% |
1 | 10825 | 4.6% |
. | 10058 | 4.3% |
분 | 10058 | 4.3% |
의 | 10040 | 4.3% |
Other values (84) | 93934 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 113156 | |
Space Separator | 37640 | 16.0% |
Decimal Number | 35858 | 15.3% |
Other Punctuation | 16185 | 6.9% |
Close Punctuation | 12374 | 5.3% |
Open Punctuation | 12374 | 5.3% |
Uppercase Letter | 3916 | 1.7% |
Dash Punctuation | 3610 | 1.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
성 | 15139 | 13.4% |
구 | 11148 | 9.9% |
분 | 10058 | 8.9% |
의 | 10040 | 8.9% |
자 | 3915 | 3.5% |
극 | 3881 | 3.4% |
독 | 3871 | 3.4% |
부 | 3449 | 3.0% |
눈 | 3144 | 2.8% |
경 | 3022 | 2.7% |
Other values (64) | 45489 |
Decimal Number
Value | Count | Frequency (%) |
3 | 11523 | |
1 | 10825 | |
2 | 7170 | |
4 | 3549 | 9.9% |
8 | 1086 | 3.0% |
6 | 667 | 1.9% |
9 | 399 | 1.1% |
7 | 304 | 0.8% |
5 | 229 | 0.6% |
0 | 106 | 0.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 10058 | |
/ | 3067 | 18.9% |
, | 3060 | 18.9% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 2316 | |
B | 1219 | |
C | 381 | 9.7% |
Space Separator
Value | Count | Frequency (%) |
37640 |
Close Punctuation
Value | Count | Frequency (%) |
) | 12374 |
Open Punctuation
Value | Count | Frequency (%) |
( | 12374 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3610 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 118041 | |
Hangul | 113156 | |
Latin | 3916 | 1.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
성 | 15139 | 13.4% |
구 | 11148 | 9.9% |
분 | 10058 | 8.9% |
의 | 10040 | 8.9% |
자 | 3915 | 3.5% |
극 | 3881 | 3.4% |
독 | 3871 | 3.4% |
부 | 3449 | 3.0% |
눈 | 3144 | 2.8% |
경 | 3022 | 2.7% |
Other values (64) | 45489 |
Common
Value | Count | Frequency (%) |
37640 | ||
) | 12374 | 10.5% |
( | 12374 | 10.5% |
3 | 11523 | 9.8% |
1 | 10825 | 9.2% |
. | 10058 | 8.5% |
2 | 7170 | 6.1% |
- | 3610 | 3.1% |
4 | 3549 | 3.0% |
/ | 3067 | 2.6% |
Other values (7) | 5851 | 5.0% |
Latin
Value | Count | Frequency (%) |
A | 2316 | |
B | 1219 | |
C | 381 | 9.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 121957 | |
Hangul | 113156 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
37640 | ||
) | 12374 | 10.1% |
( | 12374 | 10.1% |
3 | 11523 | 9.4% |
1 | 10825 | 8.9% |
. | 10058 | 8.2% |
2 | 7170 | 5.9% |
- | 3610 | 3.0% |
4 | 3549 | 2.9% |
/ | 3067 | 2.5% |
Other values (10) | 9767 | 8.0% |
Hangul
Value | Count | Frequency (%) |
성 | 15139 | 13.4% |
구 | 11148 | 9.9% |
분 | 10058 | 8.9% |
의 | 10040 | 8.9% |
자 | 3915 | 3.5% |
극 | 3881 | 3.4% |
독 | 3871 | 3.4% |
부 | 3449 | 3.0% |
눈 | 3144 | 2.8% |
경 | 3022 | 2.7% |
Other values (64) | 45489 |
유해위험문구
Text
Distinct | 65 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 162 |
---|---|
Median length | 125 |
Mean length | 26.6686 |
Min length | 6 |
Characters and Unicode
Total characters | 266686 |
---|---|
Distinct characters | 151 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 눈에 심한 자극을 일으킴 |
---|---|
2nd row | 극인화성 액체 및 증기 |
3rd row | 금속을 부식시킬 수 있음 |
4th row | 피부와 접촉하면 유해함 |
5th row | 흡입 시 알레르기성 반응, 천식 또는 호흡 곤란 등을 일으킬 수 있음 |
Value | Count | Frequency (%) |
일으킴 | 3288 | 4.8% |
자극을 | 3141 | 4.6% |
있음 | 2366 | 3.5% |
일으킬 | 2360 | 3.5% |
수 | 2262 | 3.3% |
의해 | 2066 | 3.0% |
눈에 | 1953 | 2.9% |
심한 | 1895 | 2.8% |
유독함 | 1703 | 2.5% |
유해함 | 1538 | 2.2% |
Other values (128) | 45801 |
Most occurring characters
Value | Count | Frequency (%) |
58373 | 21.9% | |
에 | 8909 | 3.3% |
으 | 8705 | 3.3% |
을 | 8639 | 3.2% |
일 | 7959 | 3.0% |
기 | 6472 | 2.4% |
는 | 5833 | 2.2% |
한 | 5705 | 2.1% |
다 | 4671 | 1.8% |
유 | 3875 | 1.5% |
Other values (141) | 147545 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 197949 | |
Space Separator | 58373 | 21.9% |
Other Punctuation | 4250 | 1.6% |
Close Punctuation | 2925 | 1.1% |
Open Punctuation | 2925 | 1.1% |
Decimal Number | 264 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
에 | 8909 | 4.5% |
으 | 8705 | 4.4% |
을 | 8639 | 4.4% |
일 | 7959 | 4.0% |
기 | 6472 | 3.3% |
는 | 5833 | 2.9% |
한 | 5705 | 2.9% |
다 | 4671 | 2.4% |
유 | 3875 | 2.0% |
적 | 3828 | 1.9% |
Other values (134) | 133353 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2982 | |
, | 1178 | 27.7% |
; | 90 | 2.1% |
Space Separator
Value | Count | Frequency (%) |
58373 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2925 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2925 |
Decimal Number
Value | Count | Frequency (%) |
1 | 264 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 197949 | |
Common | 68737 | 25.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
에 | 8909 | 4.5% |
으 | 8705 | 4.4% |
을 | 8639 | 4.4% |
일 | 7959 | 4.0% |
기 | 6472 | 3.3% |
는 | 5833 | 2.9% |
한 | 5705 | 2.9% |
다 | 4671 | 2.4% |
유 | 3875 | 2.0% |
적 | 3828 | 1.9% |
Other values (134) | 133353 |
Common
Value | Count | Frequency (%) |
58373 | ||
. | 2982 | 4.3% |
) | 2925 | 4.3% |
( | 2925 | 4.3% |
, | 1178 | 1.7% |
1 | 264 | 0.4% |
; | 90 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 197949 | |
ASCII | 68737 | 25.8% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
58373 | ||
. | 2982 | 4.3% |
) | 2925 | 4.3% |
( | 2925 | 4.3% |
, | 1178 | 1.7% |
1 | 264 | 0.4% |
; | 90 | 0.1% |
Hangul
Value | Count | Frequency (%) |
에 | 8909 | 4.5% |
으 | 8705 | 4.4% |
을 | 8639 | 4.4% |
일 | 7959 | 4.0% |
기 | 6472 | 3.3% |
는 | 5833 | 2.9% |
한 | 5705 | 2.9% |
다 | 4671 | 2.4% |
유 | 3875 | 2.0% |
적 | 3828 | 1.9% |
Other values (134) | 133353 |
Unnamed: 8
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 10000 |
---|---|
Missing (%) | 100.0% |
Memory size | 166.0 KiB |
Unnamed: 9
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 10000 |
---|---|
Missing (%) | 100.0% |
Memory size | 166.0 KiB |
유해위험코드 | GHS코드 | 유해위험세부분류 | 유해성 항목 | 유해위험문구 | |
---|---|---|---|---|---|
유해위험코드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
GHS코드 | 1.000 | 1.000 | 0.980 | 1.000 | 1.000 |
유해위험세부분류 | 1.000 | 0.980 | 1.000 | 1.000 | 1.000 |
유해성 항목 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
유해위험문구 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
유해위험세부분류 | GHS코드 | |
---|---|---|
유해위험세부분류 | 1.000 | 0.875 |
GHS코드 | 0.875 | 1.000 |
GHS코드 | 유해위험세부분류 | |
---|---|---|
GHS코드 | 1.000 | 0.875 |
유해위험세부분류 | 0.875 | 1.000 |
고유(CAS)번호 | 영문 | 국문 | 유해위험코드 | GHS코드 | 유해위험세부분류 | 유해성 항목 | 유해위험문구 | Unnamed: 8 | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
43476 | 50-84-0 | 2,4-Dichlorobenzoic acid | <NA> | H319 | GHS07 | 심한 눈 손상 또는 눈 자극성 | 심한 눈 손상/눈 자극성(3.3)의 구분 2(2A) | 눈에 심한 자극을 일으킴 | <NA> | <NA> |
39194 | 625-43-4 | N-Methylisobutylamine | <NA> | H224 | GHS02 | 인화성 액체 | 인화성 액체(2.6)의 구분 1 | 극인화성 액체 및 증기 | <NA> | <NA> |
6836 | 1310-73-2 | Sodium,hydroxide | 수산화나트륨 | H290 | GHS05 | 금속부식성 물질 | 금속부식성 물질(2.16)의 구분 1 | 금속을 부식시킬 수 있음 | <NA> | <NA> |
43961 | 461-58-5 | Cyanoguanidine | 사이아노구아니딘 | H312 | GHS07 | 급성독성-경피 | 급성독성-경피(3.1)의 구분 4 | 피부와 접촉하면 유해함 | <NA> | <NA> |
53051 | 157299-02-0 | 1,3-Bis(1-isocyanato-1-methylethyl)benzene homopolymer | <NA> | H334 | GHS08 | 호흡기 과민성 | 호흡기 과민성(3.4)의 구분 1(1A, 1B) | 흡입 시 알레르기성 반응, 천식 또는 호흡 곤란 등을 일으킬 수 있음 | <NA> | <NA> |
3538 | 51-28-5 | 2,4-Dinitrophenol | 2,4-다이나이트로페놀 | H331 | GHS06 | 급성독성-흡입 | 급성독성-흡입(3.1)의 구분 3 | 흡입하면 유독함 | <NA> | <NA> |
18397 | 95-75-0 | 3,4-Dichlorotoluene | 3,4-다이클로로톨루엔 | H227 | <NA> | 인화성 액체 | 인화성 액체(2.6)의 구분 4 | 가연성 액체 | <NA> | <NA> |
30977 | 9003-09-02 | Methoxyethene homopolymer | <NA> | H280 | GHS04 | 고압가스 | 고압가스(2.5)의 구분 1, 2, 4 | 고압가스 포함; 가열하면 폭발할 수 있음 | <NA> | <NA> |
7396 | 12166-36-8 | Antimony,,compound,with,scandium,(1,:,1) | 스칸듐과,결합한,안티모니,화합물(1,:,1) | H302 | GHS07 | 급성독성-경구 | 급성독성-경구(3.1)의 구분 4 | 삼키면 유해함 | <NA> | <NA> |
9075 | 10025-87-3 | Phosphorus,oxychloride | 산화염화,인 | H302 | GHS07 | 급성독성-경구 | 급성독성-경구(3.1)의 구분 4 | 삼키면 유해함 | <NA> | <NA> |
고유(CAS)번호 | 영문 | 국문 | 유해위험코드 | GHS코드 | 유해위험세부분류 | 유해성 항목 | 유해위험문구 | Unnamed: 8 | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
8867 | 10101-96-9 | Nickel,selenite | 니켈,셀레나이트 | H331 | GHS06 | 급성독성-흡입 | 급성독성-흡입(3.1)의 구분 3 | 흡입하면 유독함 | <NA> | <NA> |
36049 | 68855-54-9 | Kieselguhr, soda ash flux-calcined | <NA> | H332 | GHS07 | 급성독성-흡입 | 급성독성-흡입(3.1)의 구분 4 | 흡입하면 유해함 | <NA> | <NA> |
25115 | 7252-83-7 | Bromoacetaldehyde,dimethyl,acetal | 브로모아세트알데하이드,다이메틸,아세탈 | H319 | GHS07 | 심한 눈 손상 또는 눈 자극성 | 심한 눈 손상/눈 자극성(3.3)의 구분 2(2A) | 눈에 심한 자극을 일으킴 | <NA> | <NA> |
21622 | 123-42-2 | 4-Hydroxy-4-methyl-2-pentanone | 4-하이드록시-4-메틸-2-펜타논 | H319 | GHS07 | 심한 눈 손상 또는 눈 자극성 | 심한 눈 손상/눈 자극성(3.3)의 구분 2(2A) | 눈에 심한 자극을 일으킴 | <NA> | <NA> |
4051 | 3349-06-02 | Nickel diformate | 니켈 디포메이트 | H341 | GHS08 | 생식세포 변이원성 | 생식세포 변이원성(3.5)의 구분 2 | 유전적인 결함을 일으킬 것으로 의심됨 (유전적인 결함을 일으키는 노출 경로를 기재한다. 단, 다른 노출경로에 의해 유전적인 결함을 일으키지 않는다는 결정적인 증거가 있는 경우에 한한다.) | <NA> | <NA> |
15226 | 74-97-5 | Chlorobromomethane | 클로로브로모메테인 | H336 | GHS07 | 특정 표적장기 독성-1회 노출 | 특정 표적장기 독성-1회 노출(3.8)의 구분 3, 마취 영향 | 졸음 또는 현기증을 일으킬 수 있음 | <NA> | <NA> |
25762 | 10034-81-8 | Magnesium,perchlorate | 과염소산,마그네슘 | H302 | GHS07 | 급성독성-경구 | 급성독성-경구(3.1)의 구분 4 | 삼키면 유해함 | <NA> | <NA> |
47187 | 302-17-0 | 2,2,2-Trichloro-1,1-ethanediol; Tosyl, chloral hydrate | <NA> | H370 | GHS08 | 특정 표적장기 독성-1회 노출 | 특정 표적장기 독성-1회 노출(3.8)의 구분 1 | 장기(영향을 받는 것으로 알려진 모든 장기를 명시한다.)에 손상을 일으킴 (특정 표적장기 독성(1회 노출)을 일으키는 노출 경로를 기재. 단, 다른 노출경로에 의해 특정 표적장기 독성(1회 노출)을 일으키지 않는다는 결정적인 증거가 있는 경우에 한한다.) | <NA> | <NA> |
200 | 951627-45-5 | O-Methylhydroxylamine, methanesulfonate (1:1) | 메탄술폰산 O-메틸하이드록실아민 (1:1) | H410 | GHS09 | 수생환경 유해성-만성 | 수생환경 유해성(4.1)의 만성 구분 1 | 장기적 영향에 의해 수생생물에 매우 유독함 | <NA> | <NA> |
9597 | 16529-66-1 | trans-3-Pentenenitrile | 트렌스-3-펜텐니트릴 | H335 | GHS07 | 특정 표적장기 독성-1회 노출 | 특정 표적장기 독성-1회 노출(3.8)의 구분 3, 호흡기 자극 | 호흡기 자극을 일으킬 수 있음 | <NA> | <NA> |