Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 7700 |
Missing cells (%) | 7.7% |
Duplicate rows | 129 |
Duplicate rows (%) | 1.3% |
Total size in memory | 869.1 KiB |
Average record size in memory | 89.0 B |
Variable types
DateTime | 2 |
---|---|
Text | 5 |
Categorical | 2 |
Numeric | 1 |
Dataset
Description | 식물 신품종 보호권이 부여되어 조사기준일에 품종보호권이 유효한 품종에 대하여 특성조사기준의 조사형질별 특성에 대한 정보(주요작물: 벼, 보리, 콩, 고추, 국화, 장미, 사과) |
---|---|
URL | https://www.data.go.kr/data/15012059/fileData.do |
Dataset has 129 (1.3%) duplicate rows | Duplicates |
계측값 has 6284 (62.8%) missing values | Missing |
계급값 has 1416 (14.2%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 07:52:48.070643 |
---|---|
Analysis finished | 2023-12-12 07:52:49.676689 |
Duration | 1.61 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
출원일
Date
Distinct | 489 |
---|---|
Distinct (%) | 4.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 1998-11-10 00:00:00 |
---|---|
Maximum | 2016-03-28 00:00:00 |
출원인
Text
Distinct | 104 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
농촌진흥청 | 3743 | |
경상남도 | 1034 | 8.1% |
경상북도 | 761 | 6.0% |
산학협력단 | 648 | 5.1% |
충청남도 | 645 | 5.1% |
경기도 | 550 | 4.3% |
농업회사법인 | 353 | 2.8% |
서울대학교 | 204 | 1.6% |
전라북도 | 203 | 1.6% |
사카타코리아(주 | 138 | 1.1% |
Other values (146) | 4487 |
Most occurring characters
Value | Count | Frequency (%) |
청 | 4516 | 7.3% |
농 | 4250 | 6.8% |
진 | 3785 | 6.1% |
흥 | 3768 | 6.1% |
촌 | 3743 | 6.0% |
도 | 3582 | 5.8% |
2812 | 4.5% | |
경 | 2528 | 4.1% |
남 | 2013 | 3.2% |
상 | 1848 | 3.0% |
Other values (216) | 29269 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 57274 | |
Space Separator | 2812 | 4.5% |
Open Punctuation | 708 | 1.1% |
Close Punctuation | 708 | 1.1% |
Other Punctuation | 262 | 0.4% |
Uppercase Letter | 186 | 0.3% |
Lowercase Letter | 144 | 0.2% |
Dash Punctuation | 20 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
청 | 4516 | 7.9% |
농 | 4250 | 7.4% |
진 | 3785 | 6.6% |
흥 | 3768 | 6.6% |
촌 | 3743 | 6.5% |
도 | 3582 | 6.3% |
경 | 2528 | 4.4% |
남 | 2013 | 3.5% |
상 | 1848 | 3.2% |
학 | 1479 | 2.6% |
Other values (191) | 25762 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 40 | |
T | 22 | |
G | 20 | |
U | 20 | |
I | 20 | |
H | 20 | |
C | 11 | 5.9% |
O | 11 | 5.9% |
L | 11 | 5.9% |
D | 11 | 5.9% |
Lowercase Letter
Value | Count | Frequency (%) |
i | 22 | |
m | 20 | |
l | 20 | |
r | 20 | |
b | 20 | |
s | 20 | |
a | 11 | |
k | 11 |
Other Punctuation
Value | Count | Frequency (%) |
, | 127 | |
. | 115 | |
& | 20 | 7.6% |
Space Separator
Value | Count | Frequency (%) |
2812 |
Open Punctuation
Value | Count | Frequency (%) |
( | 708 |
Close Punctuation
Value | Count | Frequency (%) |
) | 708 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 20 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 57274 | |
Common | 4510 | 7.3% |
Latin | 330 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
청 | 4516 | 7.9% |
농 | 4250 | 7.4% |
진 | 3785 | 6.6% |
흥 | 3768 | 6.6% |
촌 | 3743 | 6.5% |
도 | 3582 | 6.3% |
경 | 2528 | 4.4% |
남 | 2013 | 3.5% |
상 | 1848 | 3.2% |
학 | 1479 | 2.6% |
Other values (191) | 25762 |
Latin
Value | Count | Frequency (%) |
K | 40 | 12.1% |
i | 22 | 6.7% |
T | 22 | 6.7% |
G | 20 | 6.1% |
m | 20 | 6.1% |
U | 20 | 6.1% |
I | 20 | 6.1% |
l | 20 | 6.1% |
r | 20 | 6.1% |
b | 20 | 6.1% |
Other values (8) | 106 |
Common
Value | Count | Frequency (%) |
2812 | ||
( | 708 | 15.7% |
) | 708 | 15.7% |
, | 127 | 2.8% |
. | 115 | 2.5% |
& | 20 | 0.4% |
- | 20 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 57274 | |
ASCII | 4840 | 7.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
청 | 4516 | 7.9% |
농 | 4250 | 7.4% |
진 | 3785 | 6.6% |
흥 | 3768 | 6.6% |
촌 | 3743 | 6.5% |
도 | 3582 | 6.3% |
경 | 2528 | 4.4% |
남 | 2013 | 3.5% |
상 | 1848 | 3.2% |
학 | 1479 | 2.6% |
Other values (191) | 25762 |
ASCII
Value | Count | Frequency (%) |
2812 | ||
( | 708 | 14.6% |
) | 708 | 14.6% |
, | 127 | 2.6% |
. | 115 | 2.4% |
K | 40 | 0.8% |
i | 22 | 0.5% |
T | 22 | 0.5% |
& | 20 | 0.4% |
G | 20 | 0.4% |
Other values (15) | 246 | 5.1% |
출원국
Categorical
Distinct | 22 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대한민국 | |
---|---|
경상남도 | |
경상북도 | |
경기도 | |
서울특별시 | 489 |
Other values (17) |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 3.9381 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경상남도 |
---|---|
2nd row | 대한민국 |
3rd row | 대한민국 |
4th row | 경상남도 |
5th row | 대한민국 |
Common Values
Value | Count | Frequency (%) |
대한민국 | 5371 | |
경상남도 | 1077 | 10.8% |
경상북도 | 879 | 8.8% |
경기도 | 784 | 7.8% |
서울특별시 | 489 | 4.9% |
전라남도 | 254 | 2.5% |
네덜란드 | 227 | 2.3% |
대구광역시 | 154 | 1.5% |
영국 | 137 | 1.4% |
광주광역시 | 107 | 1.1% |
Other values (12) | 521 | 5.2% |
Length
Value | Count | Frequency (%) |
대한민국 | 5371 | |
경상남도 | 1077 | 10.8% |
경상북도 | 879 | 8.8% |
경기도 | 784 | 7.8% |
서울특별시 | 489 | 4.9% |
전라남도 | 254 | 2.5% |
네덜란드 | 227 | 2.3% |
대구광역시 | 154 | 1.5% |
영국 | 137 | 1.4% |
광주광역시 | 107 | 1.1% |
Other values (12) | 521 | 5.2% |
품종보호권 등록일
Date
Distinct | 292 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2000-03-28 00:00:00 |
---|---|
Maximum | 2020-07-08 00:00:00 |
등록번호
Real number (ℝ)
Distinct | 1359 |
---|---|
Distinct (%) | 13.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4212.9105 |
Minimum | 10 |
---|---|
Maximum | 8241 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 10 |
---|---|
5-th percentile | 1230.95 |
Q1 | 3018 |
median | 4208 |
Q3 | 5578 |
95-th percentile | 6696 |
Maximum | 8241 |
Range | 8231 |
Interquartile range (IQR) | 2560 |
Descriptive statistics
Standard deviation | 1657.5173 |
---|---|
Coefficient of variation (CV) | 0.39343757 |
Kurtosis | -0.79738118 |
Mean | 4212.9105 |
Median Absolute Deviation (MAD) | 1349 |
Skewness | -0.21484972 |
Sum | 42129105 |
Variance | 2747363.5 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3018 | 33 | 0.3% |
5548 | 27 | 0.3% |
3300 | 26 | 0.3% |
3540 | 25 | 0.2% |
5537 | 25 | 0.2% |
5696 | 25 | 0.2% |
5467 | 24 | 0.2% |
6197 | 24 | 0.2% |
3864 | 24 | 0.2% |
6811 | 24 | 0.2% |
Other values (1349) | 9743 |
Value | Count | Frequency (%) |
10 | 5 | |
514 | 3 | |
515 | 6 | |
516 | 6 | |
517 | 7 | |
534 | 6 | |
562 | 4 | |
563 | 4 | |
564 | 6 | |
581 | 2 | < 0.1% |
Value | Count | Frequency (%) |
8241 | 4 | < 0.1% |
8240 | 5 | 0.1% |
8239 | 9 | |
8150 | 1 | < 0.1% |
7556 | 4 | < 0.1% |
7513 | 4 | < 0.1% |
7473 | 1 | < 0.1% |
7362 | 5 | 0.1% |
7343 | 1 | < 0.1% |
7342 | 13 |
작물명
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
국화 | |
---|---|
벼 | |
장미 | |
고추 | |
보리 | |
Other values (2) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 1.7188 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 국화 |
---|---|
2nd row | 국화 |
3rd row | 보리 |
4th row | 국화 |
5th row | 국화 |
Common Values
Value | Count | Frequency (%) |
국화 | 3279 | |
벼 | 2409 | |
장미 | 1675 | |
고추 | 1256 | 12.6% |
보리 | 492 | 4.9% |
사과 | 486 | 4.9% |
콩 | 403 | 4.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국화 | 3279 | |
벼 | 2409 | |
장미 | 1675 | |
고추 | 1256 | 12.6% |
보리 | 492 | 4.9% |
사과 | 486 | 4.9% |
콩 | 403 | 4.0% |
품종명
Text
Distinct | 1329 |
---|---|
Distinct (%) | 13.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
롱그린맛 | 33 | 0.3% |
드림리버 | 27 | 0.3% |
주남조생 | 26 | 0.3% |
썸머골드 | 25 | 0.2% |
골드리치 | 25 | 0.2% |
불세출 | 25 | 0.2% |
슈퍼자미 | 25 | 0.2% |
캔디볼 | 24 | 0.2% |
평원 | 24 | 0.2% |
호반 | 24 | 0.2% |
Other values (1327) | 9843 |
Most occurring characters
Value | Count | Frequency (%) |
스 | 1494 | 3.8% |
호 | 1395 | 3.5% |
이 | 1193 | 3.0% |
1 | 969 | 2.5% |
드 | 855 | 2.2% |
리 | 801 | 2.0% |
0 | 779 | 2.0% |
미 | 770 | 1.9% |
크 | 583 | 1.5% |
아 | 566 | 1.4% |
Other values (416) | 30110 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 35509 | |
Decimal Number | 3567 | 9.0% |
Uppercase Letter | 218 | 0.6% |
Dash Punctuation | 120 | 0.3% |
Space Separator | 101 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 1494 | 4.2% |
호 | 1395 | 3.9% |
이 | 1193 | 3.4% |
드 | 855 | 2.4% |
리 | 801 | 2.3% |
미 | 770 | 2.2% |
크 | 583 | 1.6% |
아 | 566 | 1.6% |
레 | 487 | 1.4% |
모 | 482 | 1.4% |
Other values (395) | 26883 |
Decimal Number
Value | Count | Frequency (%) |
1 | 969 | |
0 | 779 | |
2 | 533 | |
3 | 381 | 10.7% |
4 | 249 | 7.0% |
5 | 205 | 5.7% |
7 | 129 | 3.6% |
8 | 109 | 3.1% |
9 | 107 | 3.0% |
6 | 106 | 3.0% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 51 | |
L | 39 | |
I | 39 | |
A | 23 | |
R | 21 | |
N | 12 | 5.5% |
E | 11 | 5.0% |
P | 11 | 5.0% |
T | 11 | 5.0% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 120 |
Space Separator
Value | Count | Frequency (%) |
101 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 35509 | |
Common | 3788 | 9.6% |
Latin | 218 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 1494 | 4.2% |
호 | 1395 | 3.9% |
이 | 1193 | 3.4% |
드 | 855 | 2.4% |
리 | 801 | 2.3% |
미 | 770 | 2.2% |
크 | 583 | 1.6% |
아 | 566 | 1.6% |
레 | 487 | 1.4% |
모 | 482 | 1.4% |
Other values (395) | 26883 |
Common
Value | Count | Frequency (%) |
1 | 969 | |
0 | 779 | |
2 | 533 | |
3 | 381 | 10.1% |
4 | 249 | 6.6% |
5 | 205 | 5.4% |
7 | 129 | 3.4% |
- | 120 | 3.2% |
8 | 109 | 2.9% |
9 | 107 | 2.8% |
Other values (2) | 207 | 5.5% |
Latin
Value | Count | Frequency (%) |
B | 51 | |
L | 39 | |
I | 39 | |
A | 23 | |
R | 21 | |
N | 12 | 5.5% |
E | 11 | 5.0% |
P | 11 | 5.0% |
T | 11 | 5.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 35509 | |
ASCII | 4006 | 10.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
스 | 1494 | 4.2% |
호 | 1395 | 3.9% |
이 | 1193 | 3.4% |
드 | 855 | 2.4% |
리 | 801 | 2.3% |
미 | 770 | 2.2% |
크 | 583 | 1.6% |
아 | 566 | 1.6% |
레 | 487 | 1.4% |
모 | 482 | 1.4% |
Other values (395) | 26883 |
ASCII
Value | Count | Frequency (%) |
1 | 969 | |
0 | 779 | |
2 | 533 | |
3 | 381 | 9.5% |
4 | 249 | 6.2% |
5 | 205 | 5.1% |
7 | 129 | 3.2% |
- | 120 | 3.0% |
8 | 109 | 2.7% |
9 | 107 | 2.7% |
Other values (11) | 425 |
특성명칭
Text
Distinct | 770 |
---|---|
Distinct (%) | 7.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 77 |
---|---|
Median length | 56 |
Mean length | 17.1206 |
Min length | 2 |
Characters and Unicode
Total characters | 171206 |
---|---|
Distinct characters | 410 |
Distinct categories | 11 ? |
Distinct scripts | 5 ? |
Distinct blocks | 6 ? |
Unique
Unique | 82 ? |
---|---|
Unique (%) | 0.8% |
Sample
1st row | 설상화: 표면 |
---|---|
2nd row | 설상화: 표면 2차색의 무늬 |
3rd row | 까락 : 까락끝의 안토시아닌 색의 농도 |
4th row | 설상화: 표면 색의 수 |
5th row | 홑꽃, 반겹꽃 품종(특성30): 꽃: 설상화의 수(개) |
Value | Count | Frequency (%) |
3055 | 7.6% | |
설상화 | 1374 | 3.4% |
잎 | 1124 | 2.8% |
과실 | 799 | 2.0% |
색 | 787 | 2.0% |
꽃 | 751 | 1.9% |
모양 | 662 | 1.6% |
꽃잎 | 653 | 1.6% |
안토시아닌 | 589 | 1.5% |
제외 | 566 | 1.4% |
Other values (940) | 29854 |
Most occurring characters
Value | Count | Frequency (%) |
30277 | 17.7% | |
: | 10836 | 6.3% |
( | 5333 | 3.1% |
) | 5333 | 3.1% |
의 | 5045 | 2.9% |
색 | 3199 | 1.9% |
화 | 3181 | 1.9% |
이 | 3130 | 1.8% |
꽃 | 2990 | 1.7% |
잎 | 2726 | 1.6% |
Other values (400) | 99156 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 100853 | |
Space Separator | 30277 | 17.7% |
Lowercase Letter | 13417 | 7.8% |
Other Punctuation | 11870 | 6.9% |
Open Punctuation | 5333 | 3.1% |
Close Punctuation | 5333 | 3.1% |
Decimal Number | 2673 | 1.6% |
Other Symbol | 1154 | 0.7% |
Uppercase Letter | 231 | 0.1% |
Dash Punctuation | 41 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
의 | 5045 | 5.0% |
색 | 3199 | 3.2% |
화 | 3181 | 3.2% |
이 | 3130 | 3.1% |
꽃 | 2990 | 3.0% |
잎 | 2726 | 2.7% |
기 | 2438 | 2.4% |
상 | 2148 | 2.1% |
종 | 1917 | 1.9% |
설 | 1663 | 1.6% |
Other values (339) | 72416 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1444 | |
i | 1248 | 9.3% |
o | 1190 | 8.9% |
n | 1031 | 7.7% |
t | 996 | 7.4% |
a | 990 | 7.4% |
l | 896 | 6.7% |
s | 766 | 5.7% |
r | 756 | 5.6% |
f | 552 | 4.1% |
Other values (14) | 3548 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 60 | |
P | 49 | |
S | 44 | |
D | 17 | 7.4% |
G | 15 | 6.5% |
T | 11 | 4.8% |
R | 9 | 3.9% |
E | 8 | 3.5% |
C | 6 | 2.6% |
A | 4 | 1.7% |
Other values (3) | 8 | 3.5% |
Decimal Number
Value | Count | Frequency (%) |
3 | 950 | |
2 | 626 | |
1 | 532 | |
0 | 425 | |
5 | 66 | 2.5% |
6 | 53 | 2.0% |
4 | 11 | 0.4% |
7 | 5 | 0.2% |
8 | 5 | 0.2% |
Other Punctuation
Value | Count | Frequency (%) |
: | 10836 | |
, | 729 | 6.1% |
/ | 132 | 1.1% |
% | 86 | 0.7% |
. | 81 | 0.7% |
; | 6 | 0.1% |
Other Symbol
Value | Count | Frequency (%) |
㎝ | 690 | |
㎜ | 460 | |
° | 4 | 0.3% |
Math Symbol
Value | Count | Frequency (%) |
+ | 15 | |
⊙ | 9 |
Space Separator
Value | Count | Frequency (%) |
30277 |
Open Punctuation
Value | Count | Frequency (%) |
( | 5333 |
Close Punctuation
Value | Count | Frequency (%) |
) | 5333 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 41 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 100559 | |
Common | 56705 | |
Latin | 13645 | 8.0% |
Han | 294 | 0.2% |
Greek | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
의 | 5045 | 5.0% |
색 | 3199 | 3.2% |
화 | 3181 | 3.2% |
이 | 3130 | 3.1% |
꽃 | 2990 | 3.0% |
잎 | 2726 | 2.7% |
기 | 2438 | 2.4% |
상 | 2148 | 2.1% |
종 | 1917 | 1.9% |
설 | 1663 | 1.7% |
Other values (304) | 72122 |
Latin
Value | Count | Frequency (%) |
e | 1444 | 10.6% |
i | 1248 | 9.1% |
o | 1190 | 8.7% |
n | 1031 | 7.6% |
t | 996 | 7.3% |
a | 990 | 7.3% |
l | 896 | 6.6% |
s | 766 | 5.6% |
r | 756 | 5.5% |
f | 552 | 4.0% |
Other values (26) | 3776 |
Han
Value | Count | Frequency (%) |
長 | 29 | 9.9% |
葉 | 22 | 7.5% |
幅 | 21 | 7.1% |
芒 | 21 | 7.1% |
米 | 15 | 5.1% |
粒 | 15 | 5.1% |
玄 | 15 | 5.1% |
底 | 15 | 5.1% |
刺 | 15 | 5.1% |
性 | 10 | 3.4% |
Other values (25) | 116 |
Common
Value | Count | Frequency (%) |
30277 | ||
: | 10836 | 19.1% |
( | 5333 | 9.4% |
) | 5333 | 9.4% |
3 | 950 | 1.7% |
, | 729 | 1.3% |
㎝ | 690 | 1.2% |
2 | 626 | 1.1% |
1 | 532 | 0.9% |
㎜ | 460 | 0.8% |
Other values (14) | 939 | 1.7% |
Greek
Value | Count | Frequency (%) |
Φ | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 100559 | |
ASCII | 69187 | |
CJK Compat | 1150 | 0.7% |
CJK | 294 | 0.2% |
Math Operators | 9 | < 0.1% |
None | 7 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
30277 | ||
: | 10836 | 15.7% |
( | 5333 | 7.7% |
) | 5333 | 7.7% |
e | 1444 | 2.1% |
i | 1248 | 1.8% |
o | 1190 | 1.7% |
n | 1031 | 1.5% |
t | 996 | 1.4% |
a | 990 | 1.4% |
Other values (46) | 10509 | 15.2% |
Hangul
Value | Count | Frequency (%) |
의 | 5045 | 5.0% |
색 | 3199 | 3.2% |
화 | 3181 | 3.2% |
이 | 3130 | 3.1% |
꽃 | 2990 | 3.0% |
잎 | 2726 | 2.7% |
기 | 2438 | 2.4% |
상 | 2148 | 2.1% |
종 | 1917 | 1.9% |
설 | 1663 | 1.7% |
Other values (304) | 72122 |
CJK Compat
Value | Count | Frequency (%) |
㎝ | 690 | |
㎜ | 460 |
CJK
Value | Count | Frequency (%) |
長 | 29 | 9.9% |
葉 | 22 | 7.5% |
幅 | 21 | 7.1% |
芒 | 21 | 7.1% |
米 | 15 | 5.1% |
粒 | 15 | 5.1% |
玄 | 15 | 5.1% |
底 | 15 | 5.1% |
刺 | 15 | 5.1% |
性 | 10 | 3.4% |
Other values (25) | 116 |
Math Operators
Value | Count | Frequency (%) |
⊙ | 9 |
None
Value | Count | Frequency (%) |
° | 4 | |
Φ | 3 |
계측값
Text
MISSING
 
Distinct | 1536 |
---|---|
Distinct (%) | 41.3% |
Missing | 6284 |
Missing (%) | 62.8% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
887 | 27.6% | |
10월 | 17 | 0.5% |
08월 | 15 | 0.5% |
09월 | 12 | 0.4% |
2.1 | 11 | 0.3% |
5 | 11 | 0.3% |
nn155c | 9 | 0.3% |
4 | 9 | 0.3% |
4.7 | 9 | 0.3% |
5.4 | 7 | 0.2% |
Other values (1517) | 2232 |
Most occurring characters
Value | Count | Frequency (%) |
. | 1806 | |
1 | 1274 | |
- | 990 | |
2 | 896 | |
4 | 734 | 6.7% |
5 | 701 | 6.4% |
3 | 686 | 6.3% |
634 | 5.8% | |
7 | 601 | 5.5% |
6 | 585 | 5.3% |
Other values (55) | 2048 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 6998 | |
Other Punctuation | 1835 | 16.8% |
Dash Punctuation | 990 | 9.0% |
Space Separator | 634 | 5.8% |
Uppercase Letter | 254 | 2.3% |
Other Letter | 190 | 1.7% |
Lowercase Letter | 19 | 0.2% |
Open Punctuation | 15 | 0.1% |
Close Punctuation | 15 | 0.1% |
Math Symbol | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
월 | 80 | |
일 | 78 | |
개 | 3 | 1.6% |
로 | 2 | 1.1% |
리 | 2 | 1.1% |
두 | 2 | 1.1% |
테 | 2 | 1.1% |
중 | 2 | 1.1% |
가 | 1 | 0.5% |
세 | 1 | 0.5% |
Other values (17) | 17 | 8.9% |
Lowercase Letter
Value | Count | Frequency (%) |
l | 3 | |
m | 3 | |
c | 2 | |
w | 2 | |
a | 1 | 5.3% |
k | 1 | 5.3% |
y | 1 | 5.3% |
e | 1 | 5.3% |
o | 1 | 5.3% |
i | 1 | 5.3% |
Other values (3) | 3 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1274 | |
2 | 896 | |
4 | 734 | |
5 | 701 | |
3 | 686 | |
7 | 601 | |
6 | 585 | |
0 | 518 | |
8 | 513 | |
9 | 490 | 7.0% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 74 | |
C | 65 | |
B | 50 | |
N | 43 | |
D | 22 | 8.7% |
Other Punctuation
Value | Count | Frequency (%) |
. | 1806 | |
* | 18 | 1.0% |
/ | 10 | 0.5% |
, | 1 | 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 990 |
Space Separator
Value | Count | Frequency (%) |
634 |
Open Punctuation
Value | Count | Frequency (%) |
( | 15 |
Close Punctuation
Value | Count | Frequency (%) |
) | 15 |
Math Symbol
Value | Count | Frequency (%) |
+ | 4 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 10492 | |
Latin | 273 | 2.5% |
Hangul | 190 | 1.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
월 | 80 | |
일 | 78 | |
개 | 3 | 1.6% |
로 | 2 | 1.1% |
리 | 2 | 1.1% |
두 | 2 | 1.1% |
테 | 2 | 1.1% |
중 | 2 | 1.1% |
가 | 1 | 0.5% |
세 | 1 | 0.5% |
Other values (17) | 17 | 8.9% |
Common
Value | Count | Frequency (%) |
. | 1806 | |
1 | 1274 | |
- | 990 | |
2 | 896 | |
4 | 734 | |
5 | 701 | 6.7% |
3 | 686 | 6.5% |
634 | 6.0% | |
7 | 601 | 5.7% |
6 | 585 | 5.6% |
Other values (10) | 1585 |
Latin
Value | Count | Frequency (%) |
A | 74 | |
C | 65 | |
B | 50 | |
N | 43 | |
D | 22 | 8.1% |
l | 3 | 1.1% |
m | 3 | 1.1% |
c | 2 | 0.7% |
w | 2 | 0.7% |
a | 1 | 0.4% |
Other values (8) | 8 | 2.9% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 10765 | |
Hangul | 190 | 1.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
. | 1806 | |
1 | 1274 | |
- | 990 | |
2 | 896 | |
4 | 734 | 6.8% |
5 | 701 | 6.5% |
3 | 686 | 6.4% |
634 | 5.9% | |
7 | 601 | 5.6% |
6 | 585 | 5.4% |
Other values (28) | 1858 |
Hangul
Value | Count | Frequency (%) |
월 | 80 | |
일 | 78 | |
개 | 3 | 1.6% |
로 | 2 | 1.1% |
리 | 2 | 1.1% |
두 | 2 | 1.1% |
테 | 2 | 1.1% |
중 | 2 | 1.1% |
가 | 1 | 0.5% |
세 | 1 | 0.5% |
Other values (17) | 17 | 8.9% |
계급값
Text
MISSING
 
Distinct | 96 |
---|---|
Distinct (%) | 1.1% |
Missing | 1416 |
Missing (%) | 14.2% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
1 | 1877 | |
1449 | ||
3 | 1315 | |
5 | 1123 | |
2 | 953 | |
4 | 598 | 7.0% |
7 | 330 | 3.9% |
6 | 327 | 3.9% |
9 | 325 | 3.8% |
8 | 71 | 0.8% |
Other values (82) | 116 | 1.4% |
Most occurring characters
Value | Count | Frequency (%) |
1 | 1927 | |
- | 1455 | |
3 | 1336 | |
5 | 1154 | |
2 | 970 | |
4 | 621 | 6.8% |
369 | 4.0% | |
7 | 346 | 3.8% |
6 | 343 | 3.8% |
9 | 335 | 3.7% |
Other values (26) | 275 | 3.0% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 7165 | |
Dash Punctuation | 1455 | 15.9% |
Space Separator | 369 | 4.0% |
Uppercase Letter | 64 | 0.7% |
Other Letter | 47 | 0.5% |
Open Punctuation | 11 | 0.1% |
Close Punctuation | 11 | 0.1% |
Connector Punctuation | 5 | 0.1% |
Math Symbol | 2 | < 0.1% |
Other Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
월 | 15 | |
일 | 15 | |
투 | 3 | 6.4% |
불 | 3 | 6.4% |
명 | 3 | 6.4% |
색 | 2 | 4.3% |
흰 | 2 | 4.3% |
초 | 1 | 2.1% |
기 | 1 | 2.1% |
혼 | 1 | 2.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 1927 | |
3 | 1336 | |
5 | 1154 | |
2 | 970 | |
4 | 621 | 8.7% |
7 | 346 | 4.8% |
6 | 343 | 4.8% |
9 | 335 | 4.7% |
8 | 92 | 1.3% |
0 | 41 | 0.6% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 20 | |
C | 13 | |
N | 11 | |
D | 9 | |
B | 9 | |
M | 1 | 1.6% |
E | 1 | 1.6% |
Other Punctuation
Value | Count | Frequency (%) |
# | 1 | |
? | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1455 |
Space Separator
Value | Count | Frequency (%) |
369 |
Open Punctuation
Value | Count | Frequency (%) |
( | 11 |
Close Punctuation
Value | Count | Frequency (%) |
) | 11 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 5 |
Math Symbol
Value | Count | Frequency (%) |
+ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 9020 | |
Latin | 64 | 0.7% |
Hangul | 47 | 0.5% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 1927 | |
- | 1455 | |
3 | 1336 | |
5 | 1154 | |
2 | 970 | |
4 | 621 | 6.9% |
369 | 4.1% | |
7 | 346 | 3.8% |
6 | 343 | 3.8% |
9 | 335 | 3.7% |
Other values (8) | 164 | 1.8% |
Hangul
Value | Count | Frequency (%) |
월 | 15 | |
일 | 15 | |
투 | 3 | 6.4% |
불 | 3 | 6.4% |
명 | 3 | 6.4% |
색 | 2 | 4.3% |
흰 | 2 | 4.3% |
초 | 1 | 2.1% |
기 | 1 | 2.1% |
혼 | 1 | 2.1% |
Latin
Value | Count | Frequency (%) |
A | 20 | |
C | 13 | |
N | 11 | |
D | 9 | |
B | 9 | |
M | 1 | 1.6% |
E | 1 | 1.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 9084 | |
Hangul | 47 | 0.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 1927 | |
- | 1455 | |
3 | 1336 | |
5 | 1154 | |
2 | 970 | |
4 | 621 | 6.8% |
369 | 4.1% | |
7 | 346 | 3.8% |
6 | 343 | 3.8% |
9 | 335 | 3.7% |
Other values (15) | 228 | 2.5% |
Hangul
Value | Count | Frequency (%) |
월 | 15 | |
일 | 15 | |
투 | 3 | 6.4% |
불 | 3 | 6.4% |
명 | 3 | 6.4% |
색 | 2 | 4.3% |
흰 | 2 | 4.3% |
초 | 1 | 2.1% |
기 | 1 | 2.1% |
혼 | 1 | 2.1% |
출원국 | 등록번호 | 작물명 | 계급값 | |
---|---|---|---|---|
출원국 | 1.000 | 0.528 | 0.696 | 0.170 |
등록번호 | 0.528 | 1.000 | 0.344 | 0.235 |
작물명 | 0.696 | 0.344 | 1.000 | 0.485 |
계급값 | 0.170 | 0.235 | 0.485 | 1.000 |
작물명 | 출원국 | |
---|---|---|
작물명 | 1.000 | 0.386 |
출원국 | 0.386 | 1.000 |
등록번호 | 출원국 | 작물명 | |
---|---|---|---|
등록번호 | 1.000 | 0.226 | 0.182 |
출원국 | 0.226 | 1.000 | 0.386 |
작물명 | 0.182 | 0.386 | 1.000 |
출원일 | 출원인 | 출원국 | 품종보호권 등록일 | 등록번호 | 작물명 | 품종명 | 특성명칭 | 계측값 | 계급값 | |
---|---|---|---|---|---|---|---|---|---|---|
65641 | 2013-02-21 | 경상남도 | 경상남도 | 2014-04-03 | 4946 | 국화 | 키즈오렌지 | 설상화: 표면 | <NA> | 3 |
32503 | 2009-02-18 | 농촌진흥청 | 대한민국 | 2010-08-03 | 3240 | 국화 | 바닐라크림 | 설상화: 표면 2차색의 무늬 | <NA> | - |
67752 | 2012-05-11 | 농촌진흥청 | 대한민국 | 2015-08-06 | 5678 | 보리 | 중모2007 | 까락 : 까락끝의 안토시아닌 색의 농도 | <NA> | 5 |
21622 | 2007-12-24 | 경상남도 | 경상남도 | 2009-06-10 | 2708 | 국화 | 핑크아이 | 설상화: 표면 색의 수 | <NA> | 1 |
48813 | 2011-02-21 | 충청남도 | 대한민국 | 2012-10-18 | 4155 | 국화 | 예스코러스 | 홑꽃, 반겹꽃 품종(특성30): 꽃: 설상화의 수(개) | 42.9 | <NA> |
80391 | 2015-02-04 | 전라북도 | 대한민국 | 2016-04-14 | 6037 | 장미 | 슈크림 | 꽃잎표면이 2색 이상인 품종: 꽃잎: 2차색(기부반점 제외) | <NA> | - |
39274 | 2010-03-05 | 농촌진흥청 | 대한민국 | 2011-08-02 | 3634 | 국화 | 오렌지마블 | 턱잎: 크기 | <NA> | 4 |
1099 | 2003-04-07 | 충청남도 | 대한민국 | 2004-04-16 | 847 | 국화 | 도화볼 | 잎:하부 열편의 길이 | 9.78 | <NA> |
59887 | 2007-06-14 | 농업회사법인 (주)농우바이오 | 대한민국 | 2010-04-26 | 3018 | 고추 | 롱그린맛 | 과실: 속살의 두께 | <NA> | 7 |
1260 | 2003-01-10 | 농촌진흥청 | 대한민국 | 2004-07-19 | 1029 | 국화 | 도봉 | 탁엽 : 크기 | <NA> | 3 |
출원일 | 출원인 | 출원국 | 품종보호권 등록일 | 등록번호 | 작물명 | 품종명 | 특성명칭 | 계측값 | 계급값 | |
---|---|---|---|---|---|---|---|---|---|---|
73132 | 2014-02-21 | 충청남도 | 대한민국 | 2015-04-28 | 5469 | 국화 | 마당볼 | 잎: 최하단 열편의 깊이 | <NA> | 3 |
2310 | 2002-03-06 | 농촌진흥청 | 대한민국 | 2006-04-18 | 1526 | 고추 | 생력214호 | 식물체:단축절간(shortened internode in upper part) | <NA> | 1 |
2611 | 2001-10-04 | 경상북도 | 경상북도 | 2004-03-16 | 790 | 고추 | 영고2호 | 과실:성숙기의 색 | <NA> | 3 |
62032 | 2013-03-26 | 농촌진흥청 | 대한민국 | 2014-07-31 | 5114 | 벼 | 청운 | 이삭 : 까락의 분포 | <NA> | - |
11009 | 2005-11-16 | 충청북도 | 대한민국 | 2007-05-25 | 1944 | 장미 | 바래미 | 꽃 : 아랫부분의 옆에서 본 모양(완전히 개화되었을 때) | <NA> | 2 |
44089 | 2011-02-28 | 전라남도 | 전라남도 | 2012-03-09 | 3867 | 장미 | 하트온 | 신초: 안토시아닌 색의 강도 | - | 4 |
90172 | 2015-01-02 | 경상북도 | 경상북도 | 2017-04-10 | 6612 | 고추 | 고은빛 | 성숙기(50%의 식물체에서 과실의 착색변화) | <NA> | 4 |
59741 | 2011-10-13 | 사카타코리아(주) | 서울특별시 | 2014-03-24 | 4911 | 고추 | 신초롱 | 과실: 꼭지의 함몰(stalk cavity) | <NA> | 1 |
21104 | 2007-03-29 | 농촌진흥청 | 대한민국 | 2010-06-11 | 3082 | 사과 | 홍안 | 잎: 자세 | <NA> | 4 |
79885 | 2014-11-10 | 로젠탄타우 케이지 | 독일 | 2016-05-10 | 6084 | 장미 | 탄09112 | 잎: 크기: 길이(㎝) | 11.1 | <NA> |
Most frequently occurring
출원일 | 출원인 | 출원국 | 품종보호권 등록일 | 등록번호 | 작물명 | 품종명 | 특성명칭 | 계측값 | 계급값 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|
28 | 2007-06-14 | 농업회사법인 (주)농우바이오 | 대한민국 | 2010-04-26 | 3018 | 고추 | 롱그린맛 | 잎: 가장자리의 물결모양 | <NA> | 5 | 3 |
53 | 2008-12-03 | 오스템바이오 주식회사 농업회사법인 | 대한민국 | 2011-04-25 | 3510 | 고추 | 당조마일드 | 단축절간만 있는 품종:식물체:제1번화와 단축절간사이의 절간수 | <NA> | - | 3 |
0 | 2001-12-24 | 한국원자력연구원 | 대한민국 | 2004-08-17 | 1078 | 벼 | 원추 | 현미폭(玄米幅)(Decorticated grain : width)(㎝) | 2.96 | 5 | 2 |
1 | 2001-12-24 | 한국원자력연구원 | 대한민국 | 2004-08-17 | 1080 | 벼 | 녹원찰 | 분얼개도(分蘖開度)(Culm : angle)(°) | <NA> | 3 | 2 |
2 | 2002-02-28 | 농촌진흥청 | 대한민국 | 2005-06-20 | 1315 | 벼 | 동진1호 | 줄기 : 마디의 안토시아닌 색소의 강도(Stem : intensity of anthocyanin coloration of nodes) | <NA> | - | 2 |
3 | 2002-06-04 | 농촌진흥청 | 대한민국 | 2005-06-20 | 1311 | 벼 | 안성BIL-1 | 외영 안토시아닌 색소분포(Lemman : anthocyanin coloration of keel) | <NA> | 1 | 2 |
4 | 2002-06-04 | 농촌진흥청 | 대한민국 | 2005-06-20 | 1311 | 벼 | 안성BIL-1 | 줄기안토시아닌 색소분포(Stem : intensity of anthocyanin of internodes) | <NA> | 1 | 2 |
5 | 2003-03-06 | 재단법인 서울대학교 산학협력재단 | 대한민국 | 2005-06-20 | 1307 | 벼 | 서농10호 | 부선 안토시아닌 색소 농도(Lemma : anthocyanin coloration of apex) | <NA> | 1 | 2 |
6 | 2003-12-01 | 박준원 | 경상북도 | 2007-01-25 | 1706 | 사과 | 소백2호 | 과실 : 꽃받침자리 구멍 | <NA> | 3 | 2 |
7 | 2004-03-08 | 재단법인 서울대학교 산학협력재단 | 대한민국 | 2006-07-12 | 1626 | 벼 | 서농9호 | 백미심백정도(Polished grain : size of white core) | <NA> | 불투명 | 2 |