Dataset statistics
Number of variables | 31 |
---|---|
Number of observations | 5083 |
Missing cells | 17651 |
Missing cells (%) | 11.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.2 MiB |
Average record size in memory | 249.0 B |
Variable types
Text | 11 |
---|---|
Categorical | 19 |
Unsupported | 1 |
Dataset
Description | 종코드,국명,학명,계명(영문),계명(국문),문명(영문),문명(국문),강명(영문),강명(국문),목명(영문),목명(국문),과명(영문),과명(국문),국명_이명,형태특성,생태특성,서울시보호종여부,고유종 여부,멸종위기야생동식물 여부,먹는자 처벌대상 야생동식물 여부,포획금지 야생동식물 여부,인공증식을 위한 포획허가대상 야생동물 여부,유해야생동물 여부,수렵동물 여부,생태계교란 야생동식물 여부,야생화된 동물 여부,수출입 허가대상 야생동물 여부,국외반출승인대상생물자원 여부,국제적멸종위기종 여부,외래식물 여부,천연기념물 지정정보 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-2199/S/1/datasetView.do |
문명(영문) is highly imbalanced (51.9%) | Imbalance |
문명(국문) is highly imbalanced (51.9%) | Imbalance |
강명(영문) is highly imbalanced (53.8%) | Imbalance |
강명(국문) is highly imbalanced (53.4%) | Imbalance |
서울시보호종여부 is highly imbalanced (92.2%) | Imbalance |
고유종 여부 is highly imbalanced (74.3%) | Imbalance |
멸종위기야생동식물 여부 is highly imbalanced (93.0%) | Imbalance |
먹는자 처벌대상 야생동식물 여부 is highly imbalanced (96.0%) | Imbalance |
포획금지 야생동식물 여부 is highly imbalanced (73.6%) | Imbalance |
인공증식을 위한 포획허가대상 야생동물 여부 is highly imbalanced (97.6%) | Imbalance |
유해야생동물 여부 is highly imbalanced (97.6%) | Imbalance |
수렵동물 여부 is highly imbalanced (97.1%) | Imbalance |
생태계교란 야생동식물 여부 is highly imbalanced (98.7%) | Imbalance |
수출입 허가대상 야생동물 여부 is highly imbalanced (71.9%) | Imbalance |
국외반출승인대상생물자원 여부 is highly imbalanced (87.1%) | Imbalance |
국제적멸종위기종 여부 is highly imbalanced (97.4%) | Imbalance |
외래식물 여부 is highly imbalanced (77.9%) | Imbalance |
국명_이명 has 4961 (97.6%) missing values | Missing |
형태특성 has 1234 (24.3%) missing values | Missing |
생태특성 has 1286 (25.3%) missing values | Missing |
야생화된 동물 여부 has 5083 (100.0%) missing values | Missing |
천연기념물 지정정보 has 5067 (99.7%) missing values | Missing |
종코드 has unique values | Unique |
야생화된 동물 여부 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-05-18 07:09:53.726349 |
---|---|
Analysis finished | 2024-05-18 07:09:59.352290 |
Duration | 5.63 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
종코드
Text
UNIQUE
 
Distinct | 5083 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
Value | Count | Frequency (%) |
s0001 | 1 | < 0.1% |
s3573 | 1 | < 0.1% |
s3582 | 1 | < 0.1% |
s3581 | 1 | < 0.1% |
s3580 | 1 | < 0.1% |
s3579 | 1 | < 0.1% |
s3577 | 1 | < 0.1% |
s3576 | 1 | < 0.1% |
s3586 | 1 | < 0.1% |
s3572 | 1 | < 0.1% |
Other values (5073) | 5073 |
Most occurring characters
Value | Count | Frequency (%) |
s | 5083 | |
2 | 2578 | |
1 | 2539 | |
0 | 2503 | |
3 | 2480 | |
4 | 2455 | |
5 | 1834 | 7.2% |
7 | 1497 | 5.9% |
6 | 1483 | 5.8% |
8 | 1482 | 5.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 20332 | |
Lowercase Letter | 5083 | 20.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
2 | 2578 | |
1 | 2539 | |
0 | 2503 | |
3 | 2480 | |
4 | 2455 | |
5 | 1834 | |
7 | 1497 | |
6 | 1483 | |
8 | 1482 | |
9 | 1481 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 5083 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 20332 | |
Latin | 5083 | 20.0% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
2 | 2578 | |
1 | 2539 | |
0 | 2503 | |
3 | 2480 | |
4 | 2455 | |
5 | 1834 | |
7 | 1497 | |
6 | 1483 | |
8 | 1482 | |
9 | 1481 |
Latin
Value | Count | Frequency (%) |
s | 5083 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 25415 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
s | 5083 | |
2 | 2578 | |
1 | 2539 | |
0 | 2503 | |
3 | 2480 | |
4 | 2455 | |
5 | 1834 | 7.2% |
7 | 1497 | 5.9% |
6 | 1483 | 5.8% |
8 | 1482 | 5.8% |
국명
Text
Distinct | 5068 |
---|---|
Distinct (%) | 99.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
Value | Count | Frequency (%) |
모기류 | 4 | 0.1% |
소금쟁이류 | 3 | 0.1% |
잎벌레류 | 3 | 0.1% |
구주개밀 | 2 | < 0.1% |
병아리꽃나무 | 2 | < 0.1% |
꽃등에과류 | 2 | < 0.1% |
주엽나무 | 2 | < 0.1% |
플라나리아류 | 2 | < 0.1% |
실잠자리류 | 2 | < 0.1% |
애날도래류 | 2 | < 0.1% |
Other values (5056) | 5060 |
Most occurring characters
Value | Count | Frequency (%) |
나 | 1399 | 5.2% |
방 | 871 | 3.2% |
리 | 817 | 3.0% |
이 | 670 | 2.5% |
무 | 652 | 2.4% |
벌 | 484 | 1.8% |
버 | 400 | 1.5% |
미 | 384 | 1.4% |
기 | 363 | 1.3% |
레 | 362 | 1.3% |
Other values (698) | 20692 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 27049 | |
Space Separator | 17 | 0.1% |
Other Punctuation | 11 | < 0.1% |
Close Punctuation | 7 | < 0.1% |
Open Punctuation | 7 | < 0.1% |
Lowercase Letter | 1 | < 0.1% |
Decimal Number | 1 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
나 | 1399 | 5.2% |
방 | 871 | 3.2% |
리 | 817 | 3.0% |
이 | 670 | 2.5% |
무 | 652 | 2.4% |
벌 | 484 | 1.8% |
버 | 400 | 1.5% |
미 | 384 | 1.4% |
기 | 363 | 1.3% |
레 | 362 | 1.3% |
Other values (691) | 20647 |
Space Separator
Value | Count | Frequency (%) |
17 |
Other Punctuation
Value | Count | Frequency (%) |
? | 11 |
Close Punctuation
Value | Count | Frequency (%) |
) | 7 |
Open Punctuation
Value | Count | Frequency (%) |
( | 7 |
Lowercase Letter
Value | Count | Frequency (%) |
f | 1 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 27049 | |
Common | 44 | 0.2% |
Latin | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
나 | 1399 | 5.2% |
방 | 871 | 3.2% |
리 | 817 | 3.0% |
이 | 670 | 2.5% |
무 | 652 | 2.4% |
벌 | 484 | 1.8% |
버 | 400 | 1.5% |
미 | 384 | 1.4% |
기 | 363 | 1.3% |
레 | 362 | 1.3% |
Other values (691) | 20647 |
Common
Value | Count | Frequency (%) |
17 | ||
? | 11 | |
) | 7 | |
( | 7 | |
2 | 1 | 2.3% |
- | 1 | 2.3% |
Latin
Value | Count | Frequency (%) |
f | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 27049 | |
ASCII | 45 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
나 | 1399 | 5.2% |
방 | 871 | 3.2% |
리 | 817 | 3.0% |
이 | 670 | 2.5% |
무 | 652 | 2.4% |
벌 | 484 | 1.8% |
버 | 400 | 1.5% |
미 | 384 | 1.4% |
기 | 363 | 1.3% |
레 | 362 | 1.3% |
Other values (691) | 20647 |
ASCII
Value | Count | Frequency (%) |
17 | ||
? | 11 | |
) | 7 | |
( | 7 | |
f | 1 | 2.2% |
2 | 1 | 2.2% |
- | 1 | 2.2% |
학명
Text
Distinct | 5057 |
---|---|
Distinct (%) | 99.8% |
Missing | 14 |
Missing (%) | 0.3% |
Memory size | 39.8 KiB |
Length
Max length | 77 |
---|---|
Median length | 62 |
Mean length | 28.124088 |
Min length | 5 |
Characters and Unicode
Total characters | 142561 |
---|---|
Distinct characters | 75 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 5045 ? |
---|---|
Unique (%) | 99.5% |
Sample
1st row | Potamogeton cristatus Regel 4984 |
---|---|
2nd row | Vicia angustifolia L. var. minor (Bertol.) Ohwi |
3rd row | Persicaria trigonocarpa (Makino) Nakai |
4th row | Corydalis ochotensis Turcz. var. raddeana Nakai |
5th row | Setaria pallidefusca (Schumach.) Stapfe |
Value | Count | Frequency (%) |
l | 408 | 2.4% |
var | 302 | 1.8% |
fr | 226 | 1.3% |
nakai | 187 | 1.1% |
1 | 153 | 0.9% |
sp | 145 | 0.9% |
japonica | 138 | 0.8% |
butler | 131 | 0.8% |
maxim | 116 | 0.7% |
thunb | 109 | 0.6% |
Other values (7589) | 15133 |
Most occurring characters
Value | Count | Frequency (%) |
a | 14372 | 10.1% |
12055 | 8.5% | |
i | 11280 | 7.9% |
e | 9396 | 6.6% |
s | 8594 | 6.0% |
r | 8562 | 6.0% |
o | 7348 | 5.2% |
n | 6636 | 4.7% |
u | 6632 | 4.7% |
l | 6466 | 4.5% |
Other values (65) | 51220 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 112135 | |
Space Separator | 12055 | 8.5% |
Uppercase Letter | 10973 | 7.7% |
Other Punctuation | 2922 | 2.0% |
Close Punctuation | 2082 | 1.5% |
Open Punctuation | 2080 | 1.5% |
Decimal Number | 252 | 0.2% |
Dash Punctuation | 61 | < 0.1% |
Other Letter | 1 | < 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
a | 14372 | |
i | 11280 | |
e | 9396 | 8.4% |
s | 8594 | 7.7% |
r | 8562 | 7.6% |
o | 7348 | 6.6% |
n | 6636 | 5.9% |
u | 6632 | 5.9% |
l | 6466 | 5.8% |
t | 5756 | 5.1% |
Other values (16) | 27093 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 1062 | 9.7% |
S | 978 | 8.9% |
M | 974 | 8.9% |
C | 959 | 8.7% |
P | 858 | 7.8% |
B | 741 | 6.8% |
A | 736 | 6.7% |
H | 503 | 4.6% |
F | 503 | 4.6% |
T | 488 | 4.4% |
Other values (16) | 3171 |
Decimal Number
Value | Count | Frequency (%) |
1 | 180 | |
8 | 19 | 7.5% |
9 | 14 | 5.6% |
7 | 11 | 4.4% |
4 | 8 | 3.2% |
5 | 5 | 2.0% |
6 | 5 | 2.0% |
2 | 5 | 2.0% |
0 | 4 | 1.6% |
3 | 1 | 0.4% |
Other Punctuation
Value | Count | Frequency (%) |
. | 2802 | |
: | 92 | 3.1% |
, | 21 | 0.7% |
? | 5 | 0.2% |
; | 1 | < 0.1% |
& | 1 | < 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 2077 | |
] | 5 | 0.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 2075 | |
[ | 5 | 0.2% |
Space Separator
Value | Count | Frequency (%) |
12055 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 61 |
Other Letter
Value | Count | Frequency (%) |
ㅍ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 123108 | |
Common | 19452 | 13.6% |
Hangul | 1 | < 0.1% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
a | 14372 | 11.7% |
i | 11280 | 9.2% |
e | 9396 | 7.6% |
s | 8594 | 7.0% |
r | 8562 | 7.0% |
o | 7348 | 6.0% |
n | 6636 | 5.4% |
u | 6632 | 5.4% |
l | 6466 | 5.3% |
t | 5756 | 4.7% |
Other values (42) | 38066 |
Common
Value | Count | Frequency (%) |
12055 | ||
. | 2802 | 14.4% |
) | 2077 | 10.7% |
( | 2075 | 10.7% |
1 | 180 | 0.9% |
: | 92 | 0.5% |
- | 61 | 0.3% |
, | 21 | 0.1% |
8 | 19 | 0.1% |
9 | 14 | 0.1% |
Other values (12) | 56 | 0.3% |
Hangul
Value | Count | Frequency (%) |
ㅍ | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 142560 | |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
a | 14372 | 10.1% |
12055 | 8.5% | |
i | 11280 | 7.9% |
e | 9396 | 6.6% |
s | 8594 | 6.0% |
r | 8562 | 6.0% |
o | 7348 | 5.2% |
n | 6636 | 4.7% |
u | 6632 | 4.7% |
l | 6466 | 4.5% |
Other values (64) | 51219 |
Compat Jamo
Value | Count | Frequency (%) |
ㅍ | 1 |
계명(영문)
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
Animalia | |
---|---|
Plantae | |
Fungi |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.3924848 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | Plantae |
---|---|
2nd row | Plantae |
3rd row | Plantae |
4th row | Plantae |
5th row | Plantae |
Common Values
Value | Count | Frequency (%) |
Animalia | 2723 | |
Plantae | 1996 | |
Fungi | 364 | 7.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
animalia | 2723 | |
plantae | 1996 | |
fungi | 364 | 7.2% |
계명(국문)
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
동물계 | |
---|---|
식물계 | |
균계 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.9283887 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 식물계 |
---|---|
2nd row | 식물계 |
3rd row | 식물계 |
4th row | 식물계 |
5th row | 식물계 |
Common Values
Value | Count | Frequency (%) |
동물계 | 2723 | |
식물계 | 1996 | |
균계 | 364 | 7.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
동물계 | 2723 | |
식물계 | 1996 | |
균계 | 364 | 7.2% |
문명(영문)
Categorical
IMBALANCE
 
Distinct | 14 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
Arthropoda | |
---|---|
Magnoliophyta | |
Chordata | |
Basidiomycota | |
Filicophyta | 58 |
Other values (9) | 114 |
Length
Max length | 15 |
---|---|
Median length | 14 |
Mean length | 11.166634 |
Min length | 8 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | Magnoliophyta |
---|---|
2nd row | Magnoliophyta |
3rd row | Magnoliophyta |
4th row | Magnoliophyta |
5th row | Magnoliophyta |
Common Values
Value | Count | Frequency (%) |
Arthropoda | 2324 | |
Magnoliophyta | 1880 | |
Chordata | 361 | 7.1% |
Basidiomycota | 346 | 6.8% |
Filicophyta | 58 | 1.1% |
Pinophyta | 52 | 1.0% |
Ascomycota | 17 | 0.3% |
Mollusca | 17 | 0.3% |
Annelida | 16 | 0.3% |
Sphenophyta | 4 | 0.1% |
Other values (4) | 8 | 0.2% |
Length
Value | Count | Frequency (%) |
arthropoda | 2324 | |
magnoliophyta | 1880 | |
chordata | 361 | 7.1% |
basidiomycota | 346 | 6.8% |
filicophyta | 58 | 1.1% |
pinophyta | 52 | 1.0% |
ascomycota | 17 | 0.3% |
mollusca | 17 | 0.3% |
annelida | 16 | 0.3% |
sphenophyta | 4 | 0.1% |
Other values (4) | 8 | 0.2% |
문명(국문)
Categorical
IMBALANCE
 
Distinct | 14 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
절지동물문 | |
---|---|
목련문 | |
척색동물문 | |
담자균문 | |
고사리문 | 58 |
Other values (9) | 114 |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 4.1544364 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 목련문 |
---|---|
2nd row | 목련문 |
3rd row | 목련문 |
4th row | 목련문 |
5th row | 목련문 |
Common Values
Value | Count | Frequency (%) |
절지동물문 | 2324 | |
목련문 | 1880 | |
척색동물문 | 361 | 7.1% |
담자균문 | 346 | 6.8% |
고사리문 | 58 | 1.1% |
구과문 | 52 | 1.0% |
자낭균문 | 17 | 0.3% |
연체동물문 | 17 | 0.3% |
환형동물문 | 16 | 0.3% |
속새문 | 4 | 0.1% |
Other values (4) | 8 | 0.2% |
Length
Value | Count | Frequency (%) |
절지동물문 | 2324 | |
목련문 | 1880 | |
척색동물문 | 361 | 7.1% |
담자균문 | 346 | 6.8% |
고사리문 | 58 | 1.1% |
구과문 | 52 | 1.0% |
자낭균문 | 17 | 0.3% |
연체동물문 | 17 | 0.3% |
환형동물문 | 16 | 0.3% |
속새문 | 4 | 0.1% |
Other values (4) | 8 | 0.2% |
강명(영문)
Categorical
IMBALANCE
 
Distinct | 34 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
Insecta | |
---|---|
Magnoliopsida | |
Eubasidiomycetes | |
Liliopsida | |
Aves | |
Other values (29) |
Length
Max length | 20 |
---|---|
Median length | 16 |
Mean length | 9.8589416 |
Min length | 4 |
Unique
Unique | 7 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | Liliopsida |
---|---|
2nd row | Magnoliopsida |
3rd row | Magnoliopsida |
4th row | Magnoliopsida |
5th row | Magnoliopsida |
Common Values
Value | Count | Frequency (%) |
Insecta | 2204 | |
Magnoliopsida | 1604 | |
Eubasidiomycetes | 329 | 6.5% |
Liliopsida | 276 | 5.4% |
Aves | 224 | 4.4% |
Arachnida | 110 | 2.2% |
Actinopterygii | 75 | 1.5% |
Filicopsida | 56 | 1.1% |
Coniferopsida | 50 | 1.0% |
Mammalia | 30 | 0.6% |
Other values (24) | 125 | 2.5% |
Length
Value | Count | Frequency (%) |
insecta | 2204 | |
magnoliopsida | 1604 | |
eubasidiomycetes | 329 | 6.5% |
liliopsida | 276 | 5.4% |
aves | 224 | 4.4% |
arachnida | 110 | 2.2% |
actinopterygii | 75 | 1.5% |
filicopsida | 56 | 1.1% |
coniferopsida | 50 | 1.0% |
mammalia | 30 | 0.6% |
Other values (24) | 125 | 2.5% |
강명(국문)
Categorical
IMBALANCE
 
Distinct | 33 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
곤충강 | |
---|---|
목련강 | |
진정담자균강 | |
백합강 | |
조류강 | |
Other values (28) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.2130632 |
Min length | 3 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 백합강 |
---|---|
2nd row | 목련강 |
3rd row | 목련강 |
4th row | 목련강 |
5th row | 목련강 |
Common Values
Value | Count | Frequency (%) |
곤충강 | 2204 | |
목련강 | 1604 | |
진정담자균강 | 329 | 6.5% |
백합강 | 276 | 5.4% |
조류강 | 224 | 4.4% |
거미강 | 110 | 2.2% |
조기강 | 75 | 1.5% |
고사리강 | 56 | 1.1% |
구과강 | 50 | 1.0% |
포유강 | 30 | 0.6% |
Other values (23) | 125 | 2.5% |
Length
Value | Count | Frequency (%) |
곤충강 | 2204 | |
목련강 | 1604 | |
진정담자균강 | 329 | 6.5% |
백합강 | 276 | 5.4% |
조류강 | 224 | 4.4% |
거미강 | 110 | 2.2% |
조기강 | 75 | 1.5% |
고사리강 | 56 | 1.1% |
구과강 | 50 | 1.0% |
포유강 | 30 | 0.6% |
Other values (23) | 125 | 2.5% |
목명(영문)
Text
Distinct | 152 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
Length
Max length | 17 |
---|---|
Median length | 15 |
Mean length | 10.036396 |
Min length | 5 |
Characters and Unicode
Total characters | 51015 |
---|---|
Distinct characters | 47 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 20 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | Najadales |
---|---|
2nd row | Fabales |
3rd row | Polygonales |
4th row | Nepenthales |
5th row | Asterales |
Value | Count | Frequency (%) |
lepidoptera | 857 | 16.9% |
coleoptera | 537 | 10.6% |
asterales | 432 | 8.5% |
diptera | 159 | 3.1% |
hemiptera | 155 | 3.0% |
hymenoptera | 152 | 3.0% |
agaricales | 140 | 2.8% |
aphyllophorales | 128 | 2.5% |
araneae | 105 | 2.1% |
passeriformes | 103 | 2.0% |
Other values (142) | 2315 |
Most occurring characters
Value | Count | Frequency (%) |
e | 7856 | |
a | 6186 | |
r | 4472 | |
l | 4037 | 7.9% |
p | 3905 | 7.7% |
o | 3700 | 7.3% |
s | 3569 | 7.0% |
t | 2970 | 5.8% |
i | 2900 | 5.7% |
d | 1113 | 2.2% |
Other values (37) | 10307 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 45932 | |
Uppercase Letter | 5083 | 10.0% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
e | 7856 | |
a | 6186 | |
r | 4472 | |
l | 4037 | |
p | 3905 | |
o | 3700 | |
s | 3569 | |
t | 2970 | 6.5% |
i | 2900 | 6.3% |
d | 1113 | 2.4% |
Other values (16) | 5224 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 1045 | |
A | 965 | |
C | 911 | |
H | 401 | 7.9% |
P | 349 | 6.9% |
R | 213 | 4.2% |
D | 210 | 4.1% |
F | 204 | 4.0% |
S | 196 | 3.9% |
O | 149 | 2.9% |
Other values (11) | 440 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 51015 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
e | 7856 | |
a | 6186 | |
r | 4472 | |
l | 4037 | 7.9% |
p | 3905 | 7.7% |
o | 3700 | 7.3% |
s | 3569 | 7.0% |
t | 2970 | 5.8% |
i | 2900 | 5.7% |
d | 1113 | 2.2% |
Other values (37) | 10307 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 51015 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
e | 7856 | |
a | 6186 | |
r | 4472 | |
l | 4037 | 7.9% |
p | 3905 | 7.7% |
o | 3700 | 7.3% |
s | 3569 | 7.0% |
t | 2970 | 5.8% |
i | 2900 | 5.7% |
d | 1113 | 2.2% |
Other values (37) | 10307 |
목명(국문)
Text
Distinct | 156 |
---|---|
Distinct (%) | 3.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
Value | Count | Frequency (%) |
나비목 | 857 | 16.9% |
딱정벌레목 | 537 | 10.6% |
국화목 | 432 | 8.5% |
파리목 | 159 | 3.1% |
노린재목 | 155 | 3.0% |
벌목 | 152 | 3.0% |
주름버섯목 | 140 | 2.8% |
민주름버섯목 | 128 | 2.5% |
거미목 | 105 | 2.1% |
참새목 | 103 | 2.0% |
Other values (146) | 2315 |
Most occurring characters
Value | Count | Frequency (%) |
목 | 5103 | |
나 | 1067 | 5.8% |
비 | 922 | 5.0% |
벌 | 710 | 3.8% |
레 | 558 | 3.0% |
딱 | 543 | 2.9% |
정 | 543 | 2.9% |
국 | 432 | 2.3% |
화 | 432 | 2.3% |
버 | 377 | 2.0% |
Other values (204) | 7863 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 18540 | |
Lowercase Letter | 5 | < 0.1% |
Decimal Number | 4 | < 0.1% |
Uppercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
목 | 5103 | |
나 | 1067 | 5.8% |
비 | 922 | 5.0% |
벌 | 710 | 3.8% |
레 | 558 | 3.0% |
딱 | 543 | 2.9% |
정 | 543 | 2.9% |
국 | 432 | 2.3% |
화 | 432 | 2.3% |
버 | 377 | 2.0% |
Other values (197) | 7853 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 2 | |
k | 1 | |
o | 1 | |
w | 1 |
Decimal Number
Value | Count | Frequency (%) |
0 | 3 | |
1 | 1 | 25.0% |
Uppercase Letter
Value | Count | Frequency (%) |
U | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 18540 | |
Latin | 6 | < 0.1% |
Common | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
목 | 5103 | |
나 | 1067 | 5.8% |
비 | 922 | 5.0% |
벌 | 710 | 3.8% |
레 | 558 | 3.0% |
딱 | 543 | 2.9% |
정 | 543 | 2.9% |
국 | 432 | 2.3% |
화 | 432 | 2.3% |
버 | 377 | 2.0% |
Other values (197) | 7853 |
Latin
Value | Count | Frequency (%) |
n | 2 | |
k | 1 | |
U | 1 | |
o | 1 | |
w | 1 |
Common
Value | Count | Frequency (%) |
0 | 3 | |
1 | 1 | 25.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 18540 | |
ASCII | 10 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
목 | 5103 | |
나 | 1067 | 5.8% |
비 | 922 | 5.0% |
벌 | 710 | 3.8% |
레 | 558 | 3.0% |
딱 | 543 | 2.9% |
정 | 543 | 2.9% |
국 | 432 | 2.3% |
화 | 432 | 2.3% |
버 | 377 | 2.0% |
Other values (197) | 7853 |
ASCII
Value | Count | Frequency (%) |
0 | 3 | |
n | 2 | |
k | 1 | 10.0% |
U | 1 | 10.0% |
o | 1 | 10.0% |
w | 1 | 10.0% |
1 | 1 | 10.0% |
과명(영문)
Text
Distinct | 612 |
---|---|
Distinct (%) | 12.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
Length
Max length | 18 |
---|---|
Median length | 16 |
Mean length | 10.674602 |
Min length | 6 |
Characters and Unicode
Total characters | 54259 |
---|---|
Distinct characters | 50 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 187 ? |
---|---|
Unique (%) | 3.7% |
Sample
1st row | Potamogetonaceae |
---|---|
2nd row | Leguminosae |
3rd row | Polygonaceae |
4th row | Papaveraceae |
5th row | Gramineae |
Value | Count | Frequency (%) |
noctuidae | 203 | 4.0% |
asteraceae | 202 | 4.0% |
gramineae | 184 | 3.6% |
pyralidae | 145 | 2.9% |
geometridae | 120 | 2.4% |
tortricidae | 104 | 2.0% |
cyperaceae | 97 | 1.9% |
rosaceae | 95 | 1.9% |
chrysomelidae | 93 | 1.8% |
leguminosae | 92 | 1.8% |
Other values (598) | 3748 |
Most occurring characters
Value | Count | Frequency (%) |
e | 9442 | |
a | 9175 | |
i | 5402 | |
c | 3427 | 6.3% |
d | 3198 | 5.9% |
r | 3050 | 5.6% |
o | 2500 | 4.6% |
l | 2208 | 4.1% |
t | 1787 | 3.3% |
n | 1577 | 2.9% |
Other values (40) | 12493 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 49177 | |
Uppercase Letter | 5076 | 9.4% |
Space Separator | 6 | < 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
e | 9442 | |
a | 9175 | |
i | 5402 | |
c | 3427 | 7.0% |
d | 3198 | 6.5% |
r | 3050 | 6.2% |
o | 2500 | 5.1% |
l | 2208 | 4.5% |
t | 1787 | 3.6% |
n | 1577 | 3.2% |
Other values (16) | 7411 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 881 | |
A | 574 | |
P | 505 | |
G | 418 | |
L | 408 | |
T | 354 | |
S | 344 | 6.8% |
N | 308 | 6.1% |
R | 284 | 5.6% |
H | 137 | 2.7% |
Other values (13) | 863 |
Space Separator
Value | Count | Frequency (%) |
6 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 54253 | |
Common | 6 | < 0.1% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
e | 9442 | |
a | 9175 | |
i | 5402 | |
c | 3427 | 6.3% |
d | 3198 | 5.9% |
r | 3050 | 5.6% |
o | 2500 | 4.6% |
l | 2208 | 4.1% |
t | 1787 | 3.3% |
n | 1577 | 2.9% |
Other values (39) | 12487 |
Common
Value | Count | Frequency (%) |
6 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 54259 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
e | 9442 | |
a | 9175 | |
i | 5402 | |
c | 3427 | 6.3% |
d | 3198 | 5.9% |
r | 3050 | 5.6% |
o | 2500 | 4.6% |
l | 2208 | 4.1% |
t | 1787 | 3.3% |
n | 1577 | 2.9% |
Other values (40) | 12493 |
과명(국문)
Text
Distinct | 609 |
---|---|
Distinct (%) | 12.0% |
Missing | 6 |
Missing (%) | 0.1% |
Memory size | 39.8 KiB |
Value | Count | Frequency (%) |
밤나방과 | 203 | 4.0% |
국화과 | 203 | 4.0% |
벼과 | 184 | 3.6% |
명나방과 | 145 | 2.9% |
자나방과 | 120 | 2.4% |
잎말이나방과 | 104 | 2.0% |
사초과 | 97 | 1.9% |
장미과 | 95 | 1.9% |
잎벌레과 | 93 | 1.8% |
콩과 | 92 | 1.8% |
Other values (594) | 3741 |
Most occurring characters
Value | Count | Frequency (%) |
과 | 5079 | |
나 | 1204 | 5.7% |
방 | 798 | 3.8% |
벌 | 464 | 2.2% |
미 | 433 | 2.1% |
리 | 423 | 2.0% |
이 | 414 | 2.0% |
버 | 375 | 1.8% |
레 | 350 | 1.7% |
무 | 349 | 1.7% |
Other values (407) | 11113 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 20984 | |
Lowercase Letter | 10 | < 0.1% |
Space Separator | 6 | < 0.1% |
Uppercase Letter | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
과 | 5079 | |
나 | 1204 | 5.7% |
방 | 798 | 3.8% |
벌 | 464 | 2.2% |
미 | 433 | 2.1% |
리 | 423 | 2.0% |
이 | 414 | 2.0% |
버 | 375 | 1.8% |
레 | 350 | 1.7% |
무 | 349 | 1.7% |
Other values (401) | 11095 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 4 | |
k | 2 | |
w | 2 | |
o | 2 |
Space Separator
Value | Count | Frequency (%) |
6 |
Uppercase Letter
Value | Count | Frequency (%) |
U | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 20983 | |
Latin | 12 | 0.1% |
Common | 6 | < 0.1% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
과 | 5079 | |
나 | 1204 | 5.7% |
방 | 798 | 3.8% |
벌 | 464 | 2.2% |
미 | 433 | 2.1% |
리 | 423 | 2.0% |
이 | 414 | 2.0% |
버 | 375 | 1.8% |
레 | 350 | 1.7% |
무 | 349 | 1.7% |
Other values (400) | 11094 |
Latin
Value | Count | Frequency (%) |
n | 4 | |
U | 2 | |
k | 2 | |
w | 2 | |
o | 2 |
Common
Value | Count | Frequency (%) |
6 |
Han
Value | Count | Frequency (%) |
科 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 20983 | |
ASCII | 18 | 0.1% |
CJK | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
과 | 5079 | |
나 | 1204 | 5.7% |
방 | 798 | 3.8% |
벌 | 464 | 2.2% |
미 | 433 | 2.1% |
리 | 423 | 2.0% |
이 | 414 | 2.0% |
버 | 375 | 1.8% |
레 | 350 | 1.7% |
무 | 349 | 1.7% |
Other values (400) | 11094 |
ASCII
Value | Count | Frequency (%) |
6 | ||
n | 4 | |
U | 2 | 11.1% |
k | 2 | 11.1% |
w | 2 | 11.1% |
o | 2 | 11.1% |
CJK
Value | Count | Frequency (%) |
科 | 1 |
국명_이명
Text
MISSING
 
Distinct | 122 |
---|---|
Distinct (%) | 100.0% |
Missing | 4961 |
Missing (%) | 97.6% |
Memory size | 39.8 KiB |
Value | Count | Frequency (%) |
노랑검정바구미 | 1 | 0.8% |
아카시재목버섯 | 1 | 0.8% |
불로초 | 1 | 0.8% |
외날개하루살이 | 1 | 0.8% |
작은고추잠자리 | 1 | 0.8% |
장수측범잠자리 | 1 | 0.8% |
어리나나니벌 | 1 | 0.8% |
종이꽃낙엽버섯 | 1 | 0.8% |
이끼패랭이버섯 | 1 | 0.8% |
애딱부리긴노린재 | 1 | 0.8% |
Other values (123) | 123 |
Most occurring characters
Value | Count | Frequency (%) |
리 | 35 | 5.1% |
나 | 27 | 3.9% |
자 | 18 | 2.6% |
이 | 18 | 2.6% |
잠 | 16 | 2.3% |
사 | 15 | 2.2% |
꽃 | 14 | 2.0% |
방 | 14 | 2.0% |
고 | 12 | 1.7% |
무 | 11 | 1.6% |
Other values (221) | 511 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 668 | |
Other Punctuation | 11 | 1.6% |
Space Separator | 11 | 1.6% |
Modifier Symbol | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 35 | 5.2% |
나 | 27 | 4.0% |
자 | 18 | 2.7% |
이 | 18 | 2.7% |
잠 | 16 | 2.4% |
사 | 15 | 2.2% |
꽃 | 14 | 2.1% |
방 | 14 | 2.1% |
고 | 12 | 1.8% |
무 | 11 | 1.6% |
Other values (218) | 488 |
Other Punctuation
Value | Count | Frequency (%) |
, | 11 |
Space Separator
Value | Count | Frequency (%) |
11 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 668 | |
Common | 23 | 3.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 35 | 5.2% |
나 | 27 | 4.0% |
자 | 18 | 2.7% |
이 | 18 | 2.7% |
잠 | 16 | 2.4% |
사 | 15 | 2.2% |
꽃 | 14 | 2.1% |
방 | 14 | 2.1% |
고 | 12 | 1.8% |
무 | 11 | 1.6% |
Other values (218) | 488 |
Common
Value | Count | Frequency (%) |
, | 11 | |
11 | ||
` | 1 | 4.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 668 | |
ASCII | 23 | 3.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
리 | 35 | 5.2% |
나 | 27 | 4.0% |
자 | 18 | 2.7% |
이 | 18 | 2.7% |
잠 | 16 | 2.4% |
사 | 15 | 2.2% |
꽃 | 14 | 2.1% |
방 | 14 | 2.1% |
고 | 12 | 1.8% |
무 | 11 | 1.6% |
Other values (218) | 488 |
ASCII
Value | Count | Frequency (%) |
, | 11 | |
11 | ||
` | 1 | 4.3% |
형태특성
Text
MISSING
 
Distinct | 3849 |
---|---|
Distinct (%) | 100.0% |
Missing | 1234 |
Missing (%) | 24.3% |
Memory size | 39.8 KiB |
Length
Max length | 599 |
---|---|
Median length | 303 |
Mean length | 138.95609 |
Min length | 12 |
Characters and Unicode
Total characters | 534842 |
---|---|
Distinct characters | 998 |
Distinct categories | 14 ? |
Distinct scripts | 5 ? |
Distinct blocks | 9 ? |
Unique
Unique | 3849 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 뿌리는 지하경이 옆으로 길게 뻗는다. 잎은 길이 4~6cm, 나비 0.7mm 정도이며 물 위에 뜬다. 열매는 둥글고 대가 있으며 단단한 살에 싸여 있고 뒷면에 돌기가 있다. 꽃은 5-9월에 피며 황록색이다. |
---|---|
2nd row | 높이 90cm 가량으로 잎은 어긋나며 잎자루가 짧으며 끝은 덩굴손이다. 4월에 잎 겨드랑이에 홍자색의 꽃이 핀다. |
3rd row | 잎은 길이 3-7cm, 폭 4-8mm의 선상 피침형으로 수분이 없으면 갈색을 띤다. 어긋나기이고 엽병은 거의 없다. 가장자리 부근의 맥 위에 잔 복모가 난다. 꽃은 길이 2-2.2mm의 홍색꽃으로 가지의 끝에 수상화서로 달리고 길이는 2-3cm 정도 된다. 개화시기는 8-10월에 개화한다. 열매는 세모진 난형의 수과로 적갈색이고 길이는 2mm 정도이다. |
4th row | 높이 1m 이상이다. 잎은 어긋나고 잎자루가 길며 3장의 작은 잎이 나온 모양이다. 꽃은 7~8월에 황색으로 피는데 총상화서를 이룬다. 열매는 삭과이고 검은 씨앗이 2줄로 들어 있다. |
5th row | 줄기는 높이 30-70cm이고 곧게 선다. 뿌리는 뿌리줄기가 옆으로 뻗어 자라 군집을 이룬다. 근생엽과 밑부분의 잎은 꽃이 피면 스러지고 중앙부의 잎은 길이 4-9cm, 폭 6-10mm의 선상 피침형 또는 선형으로 끝이 뾰족하다. 꽃은 지름 18-25mm로 가지와 원줄기 끝에 하나씩 6-8월에 핀다. 설상화는 황색으로 길이는 10mm 정도이다. 열매는 원주형의 길이 1mm 정도의 수과로 8-9월에 익으며 관모는 길이 3mm 정도이다. |
Value | Count | Frequency (%) |
있다 | 3390 | 2.8% |
길이 | 1639 | 1.4% |
잎은 | 1529 | 1.3% |
꽃은 | 1482 | 1.2% |
열매는 | 1283 | 1.1% |
털이 | 1054 | 0.9% |
몸길이는 | 910 | 0.8% |
있으며 | 823 | 0.7% |
띤다 | 809 | 0.7% |
있고 | 782 | 0.7% |
Other values (17715) | 106356 |
Most occurring characters
Value | Count | Frequency (%) |
116538 | 21.8% | |
이 | 24912 | 4.7% |
. | 17285 | 3.2% |
다 | 17051 | 3.2% |
는 | 12545 | 2.3% |
색 | 12424 | 2.3% |
은 | 12072 | 2.3% |
m | 9265 | 1.7% |
가 | 9023 | 1.7% |
고 | 8017 | 1.5% |
Other values (988) | 295710 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 350820 | |
Space Separator | 116540 | 21.8% |
Decimal Number | 25558 | 4.8% |
Other Punctuation | 22115 | 4.1% |
Lowercase Letter | 12678 | 2.4% |
Dash Punctuation | 3800 | 0.7% |
Math Symbol | 2914 | 0.5% |
Other Symbol | 230 | < 0.1% |
Open Punctuation | 62 | < 0.1% |
Close Punctuation | 61 | < 0.1% |
Other values (4) | 64 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 24912 | 7.1% |
다 | 17051 | 4.9% |
는 | 12545 | 3.6% |
색 | 12424 | 3.5% |
은 | 12072 | 3.4% |
가 | 9023 | 2.6% |
고 | 8017 | 2.3% |
에 | 7825 | 2.2% |
의 | 7736 | 2.2% |
로 | 7421 | 2.1% |
Other values (910) | 231794 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 9265 | |
c | 3062 | 24.2% |
x | 73 | 0.6% |
a | 35 | 0.3% |
l | 27 | 0.2% |
e | 24 | 0.2% |
g | 21 | 0.2% |
r | 20 | 0.2% |
i | 20 | 0.2% |
k | 17 | 0.1% |
Other values (14) | 114 | 0.9% |
Uppercase Letter
Value | Count | Frequency (%) |
V | 9 | |
U | 8 | |
T | 7 | |
P | 6 | |
K | 3 | 5.6% |
M | 3 | 5.6% |
X | 3 | 5.6% |
W | 2 | 3.7% |
Y | 2 | 3.7% |
I | 2 | 3.7% |
Other values (8) | 9 |
Decimal Number
Value | Count | Frequency (%) |
1 | 4726 | |
5 | 3974 | |
0 | 3398 | |
2 | 3274 | |
3 | 2682 | |
4 | 1787 | 7.0% |
8 | 1648 | 6.4% |
6 | 1631 | 6.4% |
7 | 1472 | 5.8% |
9 | 966 | 3.8% |
Other Punctuation
Value | Count | Frequency (%) |
. | 17285 | |
, | 4472 | 20.2% |
? | 281 | 1.3% |
/ | 52 | 0.2% |
? | 17 | 0.1% |
: | 4 | < 0.1% |
! | 2 | < 0.1% |
. | 2 | < 0.1% |
Math Symbol
Value | Count | Frequency (%) |
~ | 2891 | |
× | 19 | 0.7% |
∧ | 2 | 0.1% |
< | 1 | < 0.1% |
> | 1 | < 0.1% |
Other Symbol
Value | Count | Frequency (%) |
㎛ | 87 | |
㎝ | 85 | |
㎜ | 58 |
Space Separator
Value | Count | Frequency (%) |
116538 | ||
2 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 60 | |
[ | 2 | 3.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 60 | |
] | 1 | 1.6% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3800 |
Letter Number
Value | Count | Frequency (%) |
ⅹ | 6 |
Other Number
Value | Count | Frequency (%) |
⅓ | 2 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 350714 | |
Common | 171284 | |
Latin | 12731 | 2.4% |
Han | 106 | < 0.1% |
Greek | 7 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 24912 | 7.1% |
다 | 17051 | 4.9% |
는 | 12545 | 3.6% |
색 | 12424 | 3.5% |
은 | 12072 | 3.4% |
가 | 9023 | 2.6% |
고 | 8017 | 2.3% |
에 | 7825 | 2.2% |
의 | 7736 | 2.2% |
로 | 7421 | 2.1% |
Other values (853) | 231688 |
Han
Value | Count | Frequency (%) |
花 | 12 | 11.3% |
狀 | 8 | 7.5% |
毛 | 7 | 6.6% |
八 | 7 | 6.6% |
莖 | 5 | 4.7% |
線 | 4 | 3.8% |
穗 | 3 | 2.8% |
部 | 3 | 2.8% |
形 | 2 | 1.9% |
基 | 2 | 1.9% |
Other values (47) | 53 |
Latin
Value | Count | Frequency (%) |
m | 9265 | |
c | 3062 | 24.1% |
x | 73 | 0.6% |
a | 35 | 0.3% |
l | 27 | 0.2% |
e | 24 | 0.2% |
g | 21 | 0.2% |
r | 20 | 0.2% |
i | 20 | 0.2% |
k | 17 | 0.1% |
Other values (32) | 167 | 1.3% |
Common
Value | Count | Frequency (%) |
116538 | ||
. | 17285 | 10.1% |
1 | 4726 | 2.8% |
, | 4472 | 2.6% |
5 | 3974 | 2.3% |
- | 3800 | 2.2% |
0 | 3398 | 2.0% |
2 | 3274 | 1.9% |
~ | 2891 | 1.7% |
3 | 2682 | 1.6% |
Other values (25) | 8244 | 4.8% |
Greek
Value | Count | Frequency (%) |
μ | 7 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 350710 | |
ASCII | 183735 | |
CJK Compat | 230 | < 0.1% |
CJK | 104 | < 0.1% |
None | 47 | < 0.1% |
Number Forms | 8 | < 0.1% |
Compat Jamo | 4 | < 0.1% |
Math Operators | 2 | < 0.1% |
CJK Compat Ideographs | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
116538 | ||
. | 17285 | 9.4% |
m | 9265 | 5.0% |
1 | 4726 | 2.6% |
, | 4472 | 2.4% |
5 | 3974 | 2.2% |
- | 3800 | 2.1% |
0 | 3398 | 1.8% |
2 | 3274 | 1.8% |
c | 3062 | 1.7% |
Other values (57) | 13941 | 7.6% |
Hangul
Value | Count | Frequency (%) |
이 | 24912 | 7.1% |
다 | 17051 | 4.9% |
는 | 12545 | 3.6% |
색 | 12424 | 3.5% |
은 | 12072 | 3.4% |
가 | 9023 | 2.6% |
고 | 8017 | 2.3% |
에 | 7825 | 2.2% |
의 | 7736 | 2.2% |
로 | 7421 | 2.1% |
Other values (849) | 231684 |
CJK Compat
Value | Count | Frequency (%) |
㎛ | 87 | |
㎝ | 85 | |
㎜ | 58 |
None
Value | Count | Frequency (%) |
× | 19 | |
? | 17 | |
μ | 7 | 14.9% |
2 | 4.3% | |
. | 2 | 4.3% |
CJK
Value | Count | Frequency (%) |
花 | 12 | 11.5% |
狀 | 8 | 7.7% |
毛 | 7 | 6.7% |
八 | 7 | 6.7% |
莖 | 5 | 4.8% |
線 | 4 | 3.8% |
穗 | 3 | 2.9% |
部 | 3 | 2.9% |
形 | 2 | 1.9% |
基 | 2 | 1.9% |
Other values (45) | 51 |
Number Forms
Value | Count | Frequency (%) |
ⅹ | 6 | |
⅓ | 2 | 25.0% |
Math Operators
Value | Count | Frequency (%) |
∧ | 2 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
龍 | 1 | |
隆 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㅅ | 1 | |
ㄱ | 1 | |
ㄹ | 1 | |
ㄴ | 1 |
생태특성
Text
MISSING
 
Distinct | 3493 |
---|---|
Distinct (%) | 92.0% |
Missing | 1286 |
Missing (%) | 25.3% |
Memory size | 39.8 KiB |
Length
Max length | 355 |
---|---|
Median length | 185 |
Mean length | 48.75981 |
Min length | 6 |
Characters and Unicode
Total characters | 185141 |
---|---|
Distinct characters | 820 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 3383 ? |
---|---|
Unique (%) | 89.1% |
Sample
1st row | 우리나라가 원산지이며 다년생 수초이다. |
---|---|
2nd row | 제주도, 울릉도 등지에 분포하며 어린 순을 나물로 한다. |
3rd row | 일년생 초본식물로 우리나라 곳곳에 분포한다. |
4th row | 우리나라, 일본, 만주 등지에 분포하는 이년생 식물이다. |
5th row | 다년생 초본식물로 우리나라와 일본, 중국, 러시아에 분포한다. |
Value | Count | Frequency (%) |
분포한다 | 1675 | 4.1% |
일본 | 1422 | 3.5% |
중국 | 1140 | 2.8% |
한국 | 1134 | 2.8% |
등지에 | 1064 | 2.6% |
우리나라 | 727 | 1.8% |
성충은 | 690 | 1.7% |
다년생 | 553 | 1.3% |
주로 | 511 | 1.2% |
자란다 | 474 | 1.2% |
Other values (7531) | 31787 |
Most occurring characters
Value | Count | Frequency (%) |
37501 | 20.3% | |
, | 7078 | 3.8% |
다 | 6428 | 3.5% |
에 | 6155 | 3.3% |
. | 5490 | 3.0% |
한 | 4900 | 2.6% |
지 | 3901 | 2.1% |
나 | 3469 | 1.9% |
국 | 3399 | 1.8% |
이 | 3160 | 1.7% |
Other values (810) | 103660 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 130197 | |
Space Separator | 37501 | 20.3% |
Other Punctuation | 12693 | 6.9% |
Decimal Number | 3610 | 1.9% |
Math Symbol | 712 | 0.4% |
Lowercase Letter | 179 | 0.1% |
Dash Punctuation | 146 | 0.1% |
Uppercase Letter | 52 | < 0.1% |
Open Punctuation | 25 | < 0.1% |
Close Punctuation | 25 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
다 | 6428 | 4.9% |
에 | 6155 | 4.7% |
한 | 4900 | 3.8% |
지 | 3901 | 3.0% |
나 | 3469 | 2.7% |
국 | 3399 | 2.6% |
이 | 3160 | 2.4% |
서 | 2920 | 2.2% |
로 | 2733 | 2.1% |
본 | 2311 | 1.8% |
Other values (770) | 90821 |
Decimal Number
Value | Count | Frequency (%) |
0 | 642 | |
1 | 572 | |
6 | 476 | |
8 | 431 | |
5 | 409 | |
7 | 348 | |
9 | 233 | 6.5% |
4 | 202 | 5.6% |
2 | 183 | 5.1% |
3 | 108 | 3.0% |
Other values (3) | 6 | 0.2% |
Lowercase Letter
Value | Count | Frequency (%) |
m | 161 | |
c | 5 | 2.8% |
l | 4 | 2.2% |
e | 2 | 1.1% |
u | 2 | 1.1% |
h | 1 | 0.6% |
i | 1 | 0.6% |
o | 1 | 0.6% |
t | 1 | 0.6% |
s | 1 | 0.6% |
Uppercase Letter
Value | Count | Frequency (%) |
I | 46 | |
Q | 1 | 1.9% |
C | 1 | 1.9% |
B | 1 | 1.9% |
D | 1 | 1.9% |
O | 1 | 1.9% |
A | 1 | 1.9% |
Other Punctuation
Value | Count | Frequency (%) |
, | 7078 | |
. | 5490 | |
? | 122 | 1.0% |
? | 3 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
37501 |
Math Symbol
Value | Count | Frequency (%) |
~ | 712 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 146 |
Open Punctuation
Value | Count | Frequency (%) |
( | 25 |
Close Punctuation
Value | Count | Frequency (%) |
) | 25 |
Other Symbol
Value | Count | Frequency (%) |
° | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 130187 | |
Common | 54713 | |
Latin | 231 | 0.1% |
Han | 10 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
다 | 6428 | 4.9% |
에 | 6155 | 4.7% |
한 | 4900 | 3.8% |
지 | 3901 | 3.0% |
나 | 3469 | 2.7% |
국 | 3399 | 2.6% |
이 | 3160 | 2.4% |
서 | 2920 | 2.2% |
로 | 2733 | 2.1% |
본 | 2311 | 1.8% |
Other values (762) | 90811 |
Common
Value | Count | Frequency (%) |
37501 | ||
, | 7078 | 12.9% |
. | 5490 | 10.0% |
~ | 712 | 1.3% |
0 | 642 | 1.2% |
1 | 572 | 1.0% |
6 | 476 | 0.9% |
8 | 431 | 0.8% |
5 | 409 | 0.7% |
7 | 348 | 0.6% |
Other values (13) | 1054 | 1.9% |
Latin
Value | Count | Frequency (%) |
m | 161 | |
I | 46 | 19.9% |
c | 5 | 2.2% |
l | 4 | 1.7% |
e | 2 | 0.9% |
u | 2 | 0.9% |
Q | 1 | 0.4% |
C | 1 | 0.4% |
h | 1 | 0.4% |
i | 1 | 0.4% |
Other values (7) | 7 | 3.0% |
Han
Value | Count | Frequency (%) |
新 | 2 | |
梢 | 2 | |
肉 | 1 | |
葉 | 1 | |
毬 | 1 | |
果 | 1 | |
羽 | 1 | |
化 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 130180 | |
ASCII | 54934 | |
None | 10 | < 0.1% |
CJK | 10 | < 0.1% |
Compat Jamo | 7 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
37501 | ||
, | 7078 | 12.9% |
. | 5490 | 10.0% |
~ | 712 | 1.3% |
0 | 642 | 1.2% |
1 | 572 | 1.0% |
6 | 476 | 0.9% |
8 | 431 | 0.8% |
5 | 409 | 0.7% |
7 | 348 | 0.6% |
Other values (25) | 1275 | 2.3% |
Hangul
Value | Count | Frequency (%) |
다 | 6428 | 4.9% |
에 | 6155 | 4.7% |
한 | 4900 | 3.8% |
지 | 3901 | 3.0% |
나 | 3469 | 2.7% |
국 | 3399 | 2.6% |
이 | 3160 | 2.4% |
서 | 2920 | 2.2% |
로 | 2733 | 2.1% |
본 | 2311 | 1.8% |
Other values (759) | 90804 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 5 | |
ㅇ | 1 | 14.3% |
ㅆ | 1 | 14.3% |
None
Value | Count | Frequency (%) |
6 | 3 | |
? | 3 | |
7 | 2 | |
° | 1 | 10.0% |
8 | 1 | 10.0% |
CJK
Value | Count | Frequency (%) |
新 | 2 | |
梢 | 2 | |
肉 | 1 | |
葉 | 1 | |
毬 | 1 | |
果 | 1 | |
羽 | 1 | |
化 | 1 |
서울시보호종여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
서울시 보호종 | 49 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 4.0289199 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5034 | |
서울시 보호종 | 49 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5034 | |
서울시 | 49 | 1.0% |
보호종 | 49 | 1.0% |
고유종 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
고유종 | 220 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9567185 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 4863 | |
고유종 | 220 | 4.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 4863 | |
고유종 | 220 | 4.3% |
멸종위기야생동식물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
멸종위기 야생 동식물 | 43 |
Length
Max length | 11 |
---|---|
Median length | 4 |
Mean length | 4.059217 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5040 | |
멸종위기 야생 동식물 | 43 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5040 | |
멸종위기 | 43 | 0.8% |
야생 | 43 | 0.8% |
동식물 | 43 | 0.8% |
먹는자 처벌대상 야생동식물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
먹는자 처벌대상 야생 동식물 | 22 |
Length
Max length | 15 |
---|---|
Median length | 4 |
Mean length | 4.0476097 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5061 | |
먹는자 처벌대상 야생 동식물 | 22 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5061 | |
먹는자 | 22 | 0.4% |
처벌대상 | 22 | 0.4% |
야생 | 22 | 0.4% |
동식물 | 22 | 0.4% |
포획금지 야생동식물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
포획금지 야생 동식물 | 228 |
Length
Max length | 11 |
---|---|
Median length | 4 |
Mean length | 4.3139878 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 4855 | |
포획금지 야생 동식물 | 228 | 4.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 4855 | |
포획금지 | 228 | 4.1% |
야생 | 228 | 4.1% |
동식물 | 228 | 4.1% |
인공증식을 위한 포획허가대상 야생동물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
인공증식을 위한 포획허가대상 야생동물 | 12 |
Length
Max length | 20 |
---|---|
Median length | 4 |
Mean length | 4.037773 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5071 | |
인공증식을 위한 포획허가대상 야생동물 | 12 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5071 | |
인공증식을 | 12 | 0.2% |
위한 | 12 | 0.2% |
포획허가대상 | 12 | 0.2% |
야생동물 | 12 | 0.2% |
유해야생동물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
유해 야생 동물 | 12 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.0094432 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5071 | |
유해 야생 동물 | 12 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5071 | |
유해 | 12 | 0.2% |
야생 | 12 | 0.2% |
동물 | 12 | 0.2% |
수렵동물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
수렵 동물 | 15 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.002951 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5068 | |
수렵 동물 | 15 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5068 | |
수렵 | 15 | 0.3% |
동물 | 15 | 0.3% |
생태계교란 야생동식물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
생태계 교란 야생 동식물 | 6 |
Length
Max length | 13 |
---|---|
Median length | 4 |
Mean length | 4.0106236 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5077 | |
생태계 교란 야생 동식물 | 6 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5077 | |
생태계 | 6 | 0.1% |
교란 | 6 | 0.1% |
야생 | 6 | 0.1% |
동식물 | 6 | 0.1% |
야생화된 동물 여부
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 5083 |
---|---|
Missing (%) | 100.0% |
Memory size | 44.8 KiB |
수출입 허가대상 야생동물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
수출입 허가대상 야생동물 | 248 |
Length
Max length | 13 |
---|---|
Median length | 4 |
Mean length | 4.4391108 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 4835 | |
수출입 허가대상 야생동물 | 248 | 4.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 4835 | |
수출입 | 248 | 4.4% |
허가대상 | 248 | 4.4% |
야생동물 | 248 | 4.4% |
국외반출승인대상생물자원 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
국외반출 승인대상 생물자원 | 91 |
Length
Max length | 14 |
---|---|
Median length | 4 |
Mean length | 4.1790281 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 4992 | |
국외반출 승인대상 생물자원 | 91 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 4992 | |
국외반출 | 91 | 1.7% |
승인대상 | 91 | 1.7% |
생물자원 | 91 | 1.7% |
국제적멸종위기종 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
국제적 멸종위기종 | 13 |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 4.0127877 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5070 | |
국제적 멸종위기종 | 13 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5070 | |
국제적 | 13 | 0.3% |
멸종위기종 | 13 | 0.3% |
외래식물 여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 39.8 KiB |
<NA> | |
---|---|
외래식물 | 180 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 4903 | |
외래식물 | 180 | 3.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 4903 | |
외래식물 | 180 | 3.5% |
천연기념물 지정정보
Text
MISSING
 
Distinct | 8 |
---|---|
Distinct (%) | 50.0% |
Missing | 5067 |
Missing (%) | 99.7% |
Memory size | 39.8 KiB |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.4375 |
Min length | 1 |
Characters and Unicode
Total characters | 151 |
---|---|
Distinct characters | 14 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 25.0% |
Sample
1st row | 천연기념물 323호 |
---|---|
2nd row | 천연기념물 325호 |
3rd row | 천연기념물 201호 |
4th row | 천연기념물 453호 |
5th row | 천연기념물 243호 |
Value | Count | Frequency (%) |
천연기념물 | 15 | |
323호 | 4 | 12.9% |
324호 | 4 | 12.9% |
201호 | 2 | 6.5% |
243호 | 2 | 6.5% |
325호 | 1 | 3.2% |
453호 | 1 | 3.2% |
327호 | 1 | 3.2% |
1 | 1 | 3.2% |
Most occurring characters
Value | Count | Frequency (%) |
3 | 17 | |
천 | 15 | |
연 | 15 | |
기 | 15 | |
념 | 15 | |
물 | 15 | |
15 | ||
호 | 15 | |
2 | 14 | |
4 | 7 | |
Other values (4) | 8 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 90 | |
Decimal Number | 46 | |
Space Separator | 15 | 9.9% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
3 | 17 | |
2 | 14 | |
4 | 7 | |
1 | 3 | 6.5% |
0 | 2 | 4.3% |
5 | 2 | 4.3% |
7 | 1 | 2.2% |
Other Letter
Value | Count | Frequency (%) |
천 | 15 | |
연 | 15 | |
기 | 15 | |
념 | 15 | |
물 | 15 | |
호 | 15 |
Space Separator
Value | Count | Frequency (%) |
15 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 90 | |
Common | 61 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
3 | 17 | |
15 | ||
2 | 14 | |
4 | 7 | |
1 | 3 | 4.9% |
0 | 2 | 3.3% |
5 | 2 | 3.3% |
7 | 1 | 1.6% |
Hangul
Value | Count | Frequency (%) |
천 | 15 | |
연 | 15 | |
기 | 15 | |
념 | 15 | |
물 | 15 | |
호 | 15 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 90 | |
ASCII | 61 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3 | 17 | |
15 | ||
2 | 14 | |
4 | 7 | |
1 | 3 | 4.9% |
0 | 2 | 3.3% |
5 | 2 | 3.3% |
7 | 1 | 1.6% |
Hangul
Value | Count | Frequency (%) |
천 | 15 | |
연 | 15 | |
기 | 15 | |
념 | 15 | |
물 | 15 | |
호 | 15 |
종코드 | 국명 | 학명 | 계명(영문) | 계명(국문) | 문명(영문) | 문명(국문) | 강명(영문) | 강명(국문) | 목명(영문) | 목명(국문) | 과명(영문) | 과명(국문) | 국명_이명 | 형태특성 | 생태특성 | 서울시보호종여부 | 고유종 여부 | 멸종위기야생동식물 여부 | 먹는자 처벌대상 야생동식물 여부 | 포획금지 야생동식물 여부 | 인공증식을 위한 포획허가대상 야생동물 여부 | 유해야생동물 여부 | 수렵동물 여부 | 생태계교란 야생동식물 여부 | 야생화된 동물 여부 | 수출입 허가대상 야생동물 여부 | 국외반출승인대상생물자원 여부 | 국제적멸종위기종 여부 | 외래식물 여부 | 천연기념물 지정정보 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | s0001 | 가는가래 | Potamogeton cristatus Regel 4984 | Plantae | 식물계 | Magnoliophyta | 목련문 | Liliopsida | 백합강 | Najadales | 나자스말목 | Potamogetonaceae | 가래과 | <NA> | 뿌리는 지하경이 옆으로 길게 뻗는다. 잎은 길이 4~6cm, 나비 0.7mm 정도이며 물 위에 뜬다. 열매는 둥글고 대가 있으며 단단한 살에 싸여 있고 뒷면에 돌기가 있다. 꽃은 5-9월에 피며 황록색이다. | 우리나라가 원산지이며 다년생 수초이다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | s0002 | 가는갈퀴 | Vicia angustifolia L. var. minor (Bertol.) Ohwi | Plantae | 식물계 | Magnoliophyta | 목련문 | Magnoliopsida | 목련강 | Fabales | 콩목 | Leguminosae | 콩과 | <NA> | 높이 90cm 가량으로 잎은 어긋나며 잎자루가 짧으며 끝은 덩굴손이다. 4월에 잎 겨드랑이에 홍자색의 꽃이 핀다. | 제주도, 울릉도 등지에 분포하며 어린 순을 나물로 한다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
2 | s0003 | 가는개여뀌 | Persicaria trigonocarpa (Makino) Nakai | Plantae | 식물계 | Magnoliophyta | 목련문 | Magnoliopsida | 목련강 | Polygonales | 마디풀목 | Polygonaceae | 마디풀과 | <NA> | 잎은 길이 3-7cm, 폭 4-8mm의 선상 피침형으로 수분이 없으면 갈색을 띤다. 어긋나기이고 엽병은 거의 없다. 가장자리 부근의 맥 위에 잔 복모가 난다. 꽃은 길이 2-2.2mm의 홍색꽃으로 가지의 끝에 수상화서로 달리고 길이는 2-3cm 정도 된다. 개화시기는 8-10월에 개화한다. 열매는 세모진 난형의 수과로 적갈색이고 길이는 2mm 정도이다. | 일년생 초본식물로 우리나라 곳곳에 분포한다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | s0004 | 가는괴불주머니 | Corydalis ochotensis Turcz. var. raddeana Nakai | Plantae | 식물계 | Magnoliophyta | 목련문 | Magnoliopsida | 목련강 | Nepenthales | 벌레잡이풀목 | Papaveraceae | 양귀비과 | <NA> | 높이 1m 이상이다. 잎은 어긋나고 잎자루가 길며 3장의 작은 잎이 나온 모양이다. 꽃은 7~8월에 황색으로 피는데 총상화서를 이룬다. 열매는 삭과이고 검은 씨앗이 2줄로 들어 있다. | 우리나라, 일본, 만주 등지에 분포하는 이년생 식물이다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | s0005 | 가는금강아지 | Setaria pallidefusca (Schumach.) Stapfe | Plantae | 식물계 | Magnoliophyta | 목련문 | Magnoliopsida | 목련강 | Asterales | 국화목 | Gramineae | 벼과 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | s0006 | 가는금불초 | Inula britannica L. var. linariaefolia Regel | Plantae | 식물계 | Magnoliophyta | 목련문 | Magnoliopsida | 목련강 | Asterales | 국화목 | Asteraceae | 국화과 | 가는잎금불초 | 줄기는 높이 30-70cm이고 곧게 선다. 뿌리는 뿌리줄기가 옆으로 뻗어 자라 군집을 이룬다. 근생엽과 밑부분의 잎은 꽃이 피면 스러지고 중앙부의 잎은 길이 4-9cm, 폭 6-10mm의 선상 피침형 또는 선형으로 끝이 뾰족하다. 꽃은 지름 18-25mm로 가지와 원줄기 끝에 하나씩 6-8월에 핀다. 설상화는 황색으로 길이는 10mm 정도이다. 열매는 원주형의 길이 1mm 정도의 수과로 8-9월에 익으며 관모는 길이 3mm 정도이다. | 다년생 초본식물로 우리나라와 일본, 중국, 러시아에 분포한다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | s0007 | 가는기름나물 | Peucedanum elegans Kom. | Plantae | 식물계 | Magnoliophyta | 목련문 | Magnoliopsida | 목련강 | Apiales | 산형목 | Umbelliferae | 산형과 | <NA> | 줄기 표면이 밋밋하며 높이가 90cm에 달한다. 뿌리잎은 밑부분이 넓어 본 줄기를 감싸안은 모양이다. 타원형의 열매는 분과이다. 흰색 꽃은 복산형화서로서 7~8월에 개화한다. 총포가 없다. | 다년초이고 우리나라 북부, 압록강 연안, 백두산 지역에서 자란다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | s0008 | 가는기린초 | Sedum aizoon L. | Plantae | 식물계 | Magnoliophyta | 목련문 | Magnoliopsida | 목련강 | Rosales | 장미목 | Crassulaceae | 돌나물과 | <NA> | 줄기는 높이 20~50cm이다. 잎은 피침형이거나 타원형이고 길이 3~6cm, 폭 7~15mm이며 털이 없다. 꽃은 7~8월에 피고 지름 10~13mm이며 취산화서에 많은 꽃이 달린다. | 우리나라 전국 각처의 산지에서 자라는 다년생 초본식물이다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | s0009 | 가는꽃녹슬은방아벌레 | Agrypnus fuliginosus (Candeze) | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Coleoptera | 딱정벌레목 | Elateridae | 방아벌레과 | <NA> | 몸의 길이는 13~20mm정도이고 몸 색깔은 적갈색이다. 겉날개 옆부분에 연한 갈색 점이 있다. | 한국, 일본 등지에 분포한다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | s0010 | 가는무늬밑빠진벌레 | Cryptarcha strigata (Fabricius) | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Coleoptera | 딱정벌레목 | Nitidulidae | 밑빠진벌레과 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
종코드 | 국명 | 학명 | 계명(영문) | 계명(국문) | 문명(영문) | 문명(국문) | 강명(영문) | 강명(국문) | 목명(영문) | 목명(국문) | 과명(영문) | 과명(국문) | 국명_이명 | 형태특성 | 생태특성 | 서울시보호종여부 | 고유종 여부 | 멸종위기야생동식물 여부 | 먹는자 처벌대상 야생동식물 여부 | 포획금지 야생동식물 여부 | 인공증식을 위한 포획허가대상 야생동물 여부 | 유해야생동물 여부 | 수렵동물 여부 | 생태계교란 야생동식물 여부 | 야생화된 동물 여부 | 수출입 허가대상 야생동물 여부 | 국외반출승인대상생물자원 여부 | 국제적멸종위기종 여부 | 외래식물 여부 | 천연기념물 지정정보 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
5073 | s5324 | 파리매류 | Asilidae sp. | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Diptera | 파리목 | Asilidae | 파리매과 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5074 | s5325 | 팔랑나비류 | Hesperiidae sp. | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Lepidoptera | 나비목 | Hesperiidae | 팔랑나비과 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5075 | s5326 | 한라푸른부전나비 | Udara dilecta | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Lepidoptera | 나비목 | Lycaenidae | 부전나비과 | <NA> | 수컷은 날개 윗면이 밝은 남색이며, 뒷날개 제5~6실 부근에 백색 무늬가 있다. 암컷은 날개 외연이 흑갈색이며 기부(基部)에 청백색의 무늬가 나타난다. | 해발고도 1700m 이상인 한라산의 풀밭에서 산다. 한국,중국 서남부,일본,타이완,네팔,필리핀 등에 분포한다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5076 | s5327 | 햇사초 | Carex pseudo-chinensis | Plantae | 식물계 | Magnoliophyta | 목련문 | Liliopsida | 백합강 | Cyperales | 사초목 | Cyperaceae | 사초과 | <NA> | <NA> | <NA> | <NA> | 고유종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5077 | s5328 | 허리노린재류 | Coreidae sp. | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Hemiptera | 노린재목 | Coreidae | 허리노린재과 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5078 | s5329 | 호랑무늬파리매 | Astochia virgatipes Coquillett | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Diptera | 파리목 | Asilidae | 파리매과 | <NA> | 몸길이가 약 19~24mm이고 바탕색은 대체로 황갈색이다. 더듬이는 검고 가늘며 끝으로 갈수록 가늘어지며 털이 없습니다. 6개의 배마디 마디 검은색 바탕에 노란색 가로띠가 뚜렷하게 나타나 호랑무늬처럼 보이며 회백색 가루가 많다. | 한국,일본,대만에 분포한다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5079 | s5330 | 호박벌류 | Bombus sp. | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Hymenoptera | 벌목 | Unknow | 꿀벌과 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5080 | s5331 | 혹가슴검정쇠똥풍뎅이 | Onthophagus atripennis | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Coleoptera | 딱정벌레목 | Scarabaeidae | 소똥구리과 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5081 | s5332 | 혹집게벌레 | Anechura harmandi | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Dermaptera | 집게벌레목 | Forficulidae | 집게벌레과 | <NA> | <NA> | <NA> | <NA> | 고유종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5082 | s5333 | 흰줄바구미 | Cleonus japonicus Faust | Animalia | 동물계 | Arthropoda | 절지동물문 | Insecta | 곤충강 | Coleoptera | 딱정벌레목 | Curculionidae | 바구미과 | <NA> | 몸빛깔은 전체적으로 검은색을 나타내며, 더듬이와 다리의 발목마디 부분은 붉은색이다. 앞가슴등판 양 옆쪽으로 흰색의 아주 짧은 털이 있다. 몸길이 12mm이다. 몸은 긴 타원형을 취하고 있으며, 주둥이는 굵으면서 약간 길다. | 한국,일본에 분포하며 들판에 주로 서식한다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |