Dataset statistics
Number of variables | 15 |
---|---|
Number of observations | 65 |
Missing cells | 167 |
Missing cells (%) | 17.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.9 KiB |
Average record size in memory | 125.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 5 |
Categorical | 9 |
Dataset
Description | 한국원자력연구원_첨단방사선연구소에서 육성한 벼(골드아미2호)의 품종특성 데이터 입니다. 데이터 칼럼 리스트는 번호, 형질, 표현형태-1, 표현형태-2, 표현형태-3, 표현형태-4, 표현형태-5, 표현형태-6, 표현형태-7, 표현형태-8, 표현형태-9, 출원품종 표현형태, 출원품종 실측치, 대조품종 표현형태, 대조품종 실측치 입니다. |
---|---|
Author | 한국원자력연구원 |
URL | https://www.data.go.kr/data/15046071/fileData.do |
표현형태-5 is highly overall correlated with 표현형태-7 and 6 other fields | High correlation |
표현형태-8 is highly overall correlated with 번호 and 4 other fields | High correlation |
표현형태-7 is highly overall correlated with 표현형태-1 and 7 other fields | High correlation |
대조품종 실측치 is highly overall correlated with 표현형태-1 and 6 other fields | High correlation |
대조품종 표현형태 is highly overall correlated with 표현형태-1 and 6 other fields | High correlation |
표현형태-9 is highly overall correlated with 표현형태-1 and 7 other fields | High correlation |
표현형태-1 is highly overall correlated with 표현형태-7 and 6 other fields | High correlation |
출원품종 표현형태 is highly overall correlated with 표현형태-1 and 6 other fields | High correlation |
출원품종 실측치 is highly overall correlated with 표현형태-1 and 6 other fields | High correlation |
번호 is highly overall correlated with 표현형태-8 | High correlation |
표현형태-8 is highly imbalanced (73.0%) | Imbalance |
표현형태-2 has 46 (70.8%) missing values | Missing |
표현형태-3 has 10 (15.4%) missing values | Missing |
표현형태-4 has 52 (80.0%) missing values | Missing |
표현형태-6 has 59 (90.8%) missing values | Missing |
번호 has unique values | Unique |
형질 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 21:54:52.463954 |
---|---|
Analysis finished | 2023-12-12 21:54:54.135391 |
Duration | 1.67 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 65 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 33 |
Minimum | 1 |
---|---|
Maximum | 65 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 717.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 4.2 |
Q1 | 17 |
median | 33 |
Q3 | 49 |
95-th percentile | 61.8 |
Maximum | 65 |
Range | 64 |
Interquartile range (IQR) | 32 |
Descriptive statistics
Standard deviation | 18.90767 |
---|---|
Coefficient of variation (CV) | 0.57295971 |
Kurtosis | -1.2 |
Mean | 33 |
Median Absolute Deviation (MAD) | 16 |
Skewness | 0 |
Sum | 2145 |
Variance | 357.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 1.5% |
50 | 1 | 1.5% |
36 | 1 | 1.5% |
37 | 1 | 1.5% |
38 | 1 | 1.5% |
39 | 1 | 1.5% |
40 | 1 | 1.5% |
41 | 1 | 1.5% |
42 | 1 | 1.5% |
43 | 1 | 1.5% |
Other values (55) | 55 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
65 | 1 | |
64 | 1 | |
63 | 1 | |
62 | 1 | |
61 | 1 | |
60 | 1 | |
59 | 1 | |
58 | 1 | |
57 | 1 | |
56 | 1 |
형질
Text
UNIQUE
 
Distinct | 65 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
Length
Max length | 35 |
---|---|
Median length | 17 |
Mean length | 12.353846 |
Min length | 3 |
Characters and Unicode
Total characters | 803 |
---|---|
Distinct characters | 121 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 65 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 초엽 : 안토시아닌 색소 |
---|---|
2nd row | 제1엽 : 엽초색 |
3rd row | 잎 : 녹색정도 (잎색농도) |
4th row | 잎 : 안토시아닌 색소 |
5th row | 잎 : 안토시아닌 색소분포 |
Value | Count | Frequency (%) |
58 | ||
안토시아닌 | 16 | 6.3% |
이삭 | 13 | 5.1% |
색소 | 11 | 4.3% |
외영 | 11 | 4.3% |
잎 | 8 | 3.1% |
줄기 | 7 | 2.8% |
길이 | 7 | 2.8% |
색 | 7 | 2.8% |
출수기 | 5 | 2.0% |
Other values (71) | 111 |
Most occurring characters
Value | Count | Frequency (%) |
194 | ||
: | 58 | 7.2% |
색 | 28 | 3.5% |
이 | 22 | 2.7% |
기 | 22 | 2.7% |
잎 | 18 | 2.2% |
) | 17 | 2.1% |
아 | 17 | 2.1% |
( | 17 | 2.1% |
소 | 16 | 2.0% |
Other values (111) | 394 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 509 | |
Space Separator | 194 | 24.2% |
Other Punctuation | 60 | 7.5% |
Close Punctuation | 17 | 2.1% |
Open Punctuation | 17 | 2.1% |
Decimal Number | 5 | 0.6% |
Dash Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
색 | 28 | 5.5% |
이 | 22 | 4.3% |
기 | 22 | 4.3% |
잎 | 18 | 3.5% |
아 | 17 | 3.3% |
소 | 16 | 3.1% |
의 | 16 | 3.1% |
닌 | 16 | 3.1% |
시 | 16 | 3.1% |
토 | 16 | 3.1% |
Other values (100) | 322 |
Decimal Number
Value | Count | Frequency (%) |
2 | 2 | |
1 | 1 | |
0 | 1 | |
5 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
: | 58 | |
, | 1 | 1.7% |
% | 1 | 1.7% |
Space Separator
Value | Count | Frequency (%) |
194 |
Close Punctuation
Value | Count | Frequency (%) |
) | 17 |
Open Punctuation
Value | Count | Frequency (%) |
( | 17 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 509 | |
Common | 294 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
색 | 28 | 5.5% |
이 | 22 | 4.3% |
기 | 22 | 4.3% |
잎 | 18 | 3.5% |
아 | 17 | 3.3% |
소 | 16 | 3.1% |
의 | 16 | 3.1% |
닌 | 16 | 3.1% |
시 | 16 | 3.1% |
토 | 16 | 3.1% |
Other values (100) | 322 |
Common
Value | Count | Frequency (%) |
194 | ||
: | 58 | 19.7% |
) | 17 | 5.8% |
( | 17 | 5.8% |
2 | 2 | 0.7% |
1 | 1 | 0.3% |
, | 1 | 0.3% |
- | 1 | 0.3% |
% | 1 | 0.3% |
0 | 1 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 509 | |
ASCII | 294 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
194 | ||
: | 58 | 19.7% |
) | 17 | 5.8% |
( | 17 | 5.8% |
2 | 2 | 0.7% |
1 | 1 | 0.3% |
, | 1 | 0.3% |
- | 1 | 0.3% |
% | 1 | 0.3% |
0 | 1 | 0.3% |
Hangul
Value | Count | Frequency (%) |
색 | 28 | 5.5% |
이 | 22 | 4.3% |
기 | 22 | 4.3% |
잎 | 18 | 3.5% |
아 | 17 | 3.3% |
소 | 16 | 3.1% |
의 | 16 | 3.1% |
닌 | 16 | 3.1% |
시 | 16 | 3.1% |
토 | 16 | 3.1% |
Other values (100) | 322 |
표현형태-1
Categorical
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 36.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
<NA> | |
---|---|
없다 | |
없거나매우연하다 | |
직립 | |
없거나매우약하다 | |
Other values (19) |
Length
Max length | 8 |
---|---|
Median length | 7 |
Mean length | 3.7230769 |
Min length | 1 |
Unique
Unique | 16 ? |
---|---|
Unique (%) | 24.6% |
Sample
1st row | 없거나매우약하다 |
---|---|
2nd row | 녹색 |
3rd row | <NA> |
4th row | 없다 |
5th row | 끝 |
Common Values
Value | Count | Frequency (%) |
<NA> | 15 | |
없다 | 11 | |
없거나매우연하다 | 6 | 9.2% |
직립 | 5 | 7.7% |
없거나매우약하다 | 4 | 6.2% |
황백색 | 3 | 4.6% |
백색 | 3 | 4.6% |
매우빠르다 | 2 | 3.1% |
선단 | 1 | 1.5% |
없다 | 1 | 1.5% |
Other values (14) | 14 |
Length
Value | Count | Frequency (%) |
na | 15 | |
없다 | 12 | |
없거나매우연하다 | 6 | 9.1% |
직립 | 5 | 7.6% |
없거나매우약하다 | 4 | 6.1% |
황백색 | 3 | 4.5% |
백색 | 3 | 4.5% |
매우빠르다 | 2 | 3.0% |
추출불량 | 1 | 1.5% |
평범하다 | 1 | 1.5% |
Other values (14) | 14 |
표현형태-2
Text
MISSING
 
Distinct | 16 |
---|---|
Distinct (%) | 84.2% |
Missing | 46 |
Missing (%) | 70.8% |
Memory size | 652.0 B |
Value | Count | Frequency (%) |
황갈색 | 4 | |
2 | 9.1% | |
옅다 | 1 | 4.5% |
연노랑색 | 1 | 4.5% |
10 | 1 | 4.5% |
5 | 1 | 4.5% |
중간 | 1 | 4.5% |
담갈색 | 1 | 4.5% |
단원형 | 1 | 4.5% |
황갈색골 | 1 | 4.5% |
Other values (8) | 8 |
Most occurring characters
Value | Count | Frequency (%) |
색 | 10 | 15.2% |
갈 | 6 | 9.1% |
황 | 5 | 7.6% |
다 | 3 | 4.5% |
3 | 4.5% | |
자 | 2 | 3.0% |
녹 | 2 | 3.0% |
하 | 2 | 3.0% |
옅 | 2 | 3.0% |
형 | 2 | 3.0% |
Other values (29) | 29 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 57 | |
Decimal Number | 4 | 6.1% |
Space Separator | 3 | 4.5% |
Other Punctuation | 1 | 1.5% |
Math Symbol | 1 | 1.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
색 | 10 | |
갈 | 6 | 10.5% |
황 | 5 | 8.8% |
다 | 3 | 5.3% |
자 | 2 | 3.5% |
녹 | 2 | 3.5% |
하 | 2 | 3.5% |
옅 | 2 | 3.5% |
형 | 2 | 3.5% |
연 | 1 | 1.8% |
Other values (22) | 22 |
Decimal Number
Value | Count | Frequency (%) |
0 | 1 | |
1 | 1 | |
5 | 1 | |
2 | 1 |
Space Separator
Value | Count | Frequency (%) |
3 |
Other Punctuation
Value | Count | Frequency (%) |
% | 1 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 57 | |
Common | 9 | 13.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
색 | 10 | |
갈 | 6 | 10.5% |
황 | 5 | 8.8% |
다 | 3 | 5.3% |
자 | 2 | 3.5% |
녹 | 2 | 3.5% |
하 | 2 | 3.5% |
옅 | 2 | 3.5% |
형 | 2 | 3.5% |
연 | 1 | 1.8% |
Other values (22) | 22 |
Common
Value | Count | Frequency (%) |
3 | ||
% | 1 | 11.1% |
0 | 1 | 11.1% |
1 | 1 | 11.1% |
~ | 1 | 11.1% |
5 | 1 | 11.1% |
2 | 1 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 57 | |
ASCII | 9 | 13.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
색 | 10 | |
갈 | 6 | 10.5% |
황 | 5 | 8.8% |
다 | 3 | 5.3% |
자 | 2 | 3.5% |
녹 | 2 | 3.5% |
하 | 2 | 3.5% |
옅 | 2 | 3.5% |
형 | 2 | 3.5% |
연 | 1 | 1.8% |
Other values (22) | 22 |
ASCII
Value | Count | Frequency (%) |
3 | ||
% | 1 | 11.1% |
0 | 1 | 11.1% |
1 | 1 | 11.1% |
~ | 1 | 11.1% |
5 | 1 | 11.1% |
2 | 1 | 11.1% |
표현형태-3
Text
MISSING
 
Distinct | 30 |
---|---|
Distinct (%) | 54.5% |
Missing | 10 |
Missing (%) | 15.4% |
Memory size | 652.0 B |
Value | Count | Frequency (%) |
연하다 | 10 | 16.1% |
짧다 | 6 | 9.7% |
반직립 | 5 | 8.1% |
갈색 | 4 | 6.5% |
빠르다 | 3 | 4.8% |
좁다 | 3 | 4.8% |
약하다 | 2 | 3.2% |
2 | 3.2% | |
중원형 | 1 | 1.6% |
부분추출 | 1 | 1.6% |
Other values (25) | 25 |
Most occurring characters
Value | Count | Frequency (%) |
다 | 30 | |
하 | 14 | 8.2% |
색 | 10 | 5.8% |
연 | 10 | 5.8% |
8 | 4.7% | |
갈 | 7 | 4.1% |
짧 | 6 | 3.5% |
립 | 5 | 2.9% |
직 | 5 | 2.9% |
반 | 5 | 2.9% |
Other values (53) | 71 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 156 | |
Space Separator | 8 | 4.7% |
Decimal Number | 5 | 2.9% |
Math Symbol | 1 | 0.6% |
Other Punctuation | 1 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
다 | 30 | |
하 | 14 | 9.0% |
색 | 10 | 6.4% |
연 | 10 | 6.4% |
갈 | 7 | 4.5% |
짧 | 6 | 3.8% |
립 | 5 | 3.2% |
직 | 5 | 3.2% |
반 | 5 | 3.2% |
빠 | 3 | 1.9% |
Other values (47) | 61 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
5 | 1 | 20.0% |
3 | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
8 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Other Punctuation
Value | Count | Frequency (%) |
% | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 156 | |
Common | 15 | 8.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
다 | 30 | |
하 | 14 | 9.0% |
색 | 10 | 6.4% |
연 | 10 | 6.4% |
갈 | 7 | 4.5% |
짧 | 6 | 3.8% |
립 | 5 | 3.2% |
직 | 5 | 3.2% |
반 | 5 | 3.2% |
빠 | 3 | 1.9% |
Other values (47) | 61 |
Common
Value | Count | Frequency (%) |
8 | ||
1 | 3 | 20.0% |
5 | 1 | 6.7% |
~ | 1 | 6.7% |
% | 1 | 6.7% |
3 | 1 | 6.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 156 | |
ASCII | 15 | 8.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
다 | 30 | |
하 | 14 | 9.0% |
색 | 10 | 6.4% |
연 | 10 | 6.4% |
갈 | 7 | 4.5% |
짧 | 6 | 3.8% |
립 | 5 | 3.2% |
직 | 5 | 3.2% |
반 | 5 | 3.2% |
빠 | 3 | 1.9% |
Other values (47) | 61 |
ASCII
Value | Count | Frequency (%) |
8 | ||
1 | 3 | 20.0% |
5 | 1 | 6.7% |
~ | 1 | 6.7% |
% | 1 | 6.7% |
3 | 1 | 6.7% |
표현형태-4
Text
MISSING
 
Distinct | 11 |
---|---|
Distinct (%) | 84.6% |
Missing | 52 |
Missing (%) | 80.0% |
Memory size | 652.0 B |
Value | Count | Frequency (%) |
적갈색 | 3 | |
3 | ||
자색 | 2 | |
균등 | 1 | 5.6% |
옅은자주색 | 1 | 5.6% |
옅은자색 | 1 | 5.6% |
적색 | 1 | 5.6% |
담자색 | 1 | 5.6% |
자색점 | 1 | 5.6% |
장원형 | 1 | 5.6% |
Other values (3) | 3 |
Most occurring characters
Value | Count | Frequency (%) |
색 | 11 | |
자 | 6 | |
5 | ||
적 | 4 | 7.8% |
갈 | 4 | 7.8% |
은 | 3 | 5.9% |
옅 | 2 | 3.9% |
~ | 2 | 3.9% |
형 | 1 | 2.0% |
0 | 1 | 2.0% |
Other values (12) | 12 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 39 | |
Space Separator | 5 | 9.8% |
Decimal Number | 4 | 7.8% |
Math Symbol | 2 | 3.9% |
Other Punctuation | 1 | 2.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
색 | 11 | |
자 | 6 | |
적 | 4 | 10.3% |
갈 | 4 | 10.3% |
은 | 3 | 7.7% |
옅 | 2 | 5.1% |
형 | 1 | 2.6% |
짙 | 1 | 2.6% |
담 | 1 | 2.6% |
원 | 1 | 2.6% |
Other values (5) | 5 |
Decimal Number
Value | Count | Frequency (%) |
0 | 1 | |
2 | 1 | |
6 | 1 | |
1 | 1 |
Space Separator
Value | Count | Frequency (%) |
5 |
Math Symbol
Value | Count | Frequency (%) |
~ | 2 |
Other Punctuation
Value | Count | Frequency (%) |
% | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 39 | |
Common | 12 | 23.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
색 | 11 | |
자 | 6 | |
적 | 4 | 10.3% |
갈 | 4 | 10.3% |
은 | 3 | 7.7% |
옅 | 2 | 5.1% |
형 | 1 | 2.6% |
짙 | 1 | 2.6% |
담 | 1 | 2.6% |
원 | 1 | 2.6% |
Other values (5) | 5 |
Common
Value | Count | Frequency (%) |
5 | ||
~ | 2 | 16.7% |
0 | 1 | 8.3% |
2 | 1 | 8.3% |
6 | 1 | 8.3% |
1 | 1 | 8.3% |
% | 1 | 8.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 39 | |
ASCII | 12 | 23.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
색 | 11 | |
자 | 6 | |
적 | 4 | 10.3% |
갈 | 4 | 10.3% |
은 | 3 | 7.7% |
옅 | 2 | 5.1% |
형 | 1 | 2.6% |
짙 | 1 | 2.6% |
담 | 1 | 2.6% |
원 | 1 | 2.6% |
Other values (5) | 5 |
ASCII
Value | Count | Frequency (%) |
5 | ||
~ | 2 | 16.7% |
0 | 1 | 8.3% |
2 | 1 | 8.3% |
6 | 1 | 8.3% |
1 | 1 | 8.3% |
% | 1 | 8.3% |
표현형태-5
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 20.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
중간 | |
---|---|
<NA> | |
자색 | 3 |
담적색 | 3 |
수평 | 2 |
Other values (8) |
Length
Max length | 9 |
---|---|
Median length | 2 |
Mean length | 2.8153846 |
Min length | 2 |
Unique
Unique | 8 ? |
---|---|
Unique (%) | 12.3% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 중간 |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
중간 | 30 | |
<NA> | 19 | |
자색 | 3 | 4.6% |
담적색 | 3 | 4.6% |
수평 | 2 | 3.1% |
자주색 | 1 | 1.5% |
보통개형 | 1 | 1.5% |
전체 | 1 | 1.5% |
굽음 | 1 | 1.5% |
개형 | 1 | 1.5% |
Other values (3) | 3 | 4.6% |
Length
Value | Count | Frequency (%) |
중간 | 30 | |
na | 19 | |
자색 | 3 | 4.4% |
담적색 | 3 | 4.4% |
수평 | 2 | 2.9% |
2 | 2.9% | |
자주색 | 1 | 1.5% |
보통개형 | 1 | 1.5% |
전체 | 1 | 1.5% |
굽음 | 1 | 1.5% |
Other values (5) | 5 | 7.4% |
표현형태-6
Text
MISSING
 
Distinct | 3 |
---|---|
Distinct (%) | 50.0% |
Missing | 59 |
Missing (%) | 90.8% |
Memory size | 652.0 B |
Value | Count | Frequency (%) |
적색 | 3 | |
흑색 | 2 | |
2 | ||
25 | 1 | 11.1% |
30 | 1 | 11.1% |
Most occurring characters
Value | Count | Frequency (%) |
색 | 5 | |
적 | 3 | |
3 | ||
흑 | 2 | 10.5% |
2 | 1 | 5.3% |
5 | 1 | 5.3% |
~ | 1 | 5.3% |
3 | 1 | 5.3% |
0 | 1 | 5.3% |
% | 1 | 5.3% |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 10 | |
Decimal Number | 4 | 21.1% |
Space Separator | 3 | 15.8% |
Math Symbol | 1 | 5.3% |
Other Punctuation | 1 | 5.3% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
2 | 1 | |
5 | 1 | |
3 | 1 | |
0 | 1 |
Other Letter
Value | Count | Frequency (%) |
색 | 5 | |
적 | 3 | |
흑 | 2 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
3 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Other Punctuation
Value | Count | Frequency (%) |
% | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 10 | |
Common | 9 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
3 | ||
2 | 1 | 11.1% |
5 | 1 | 11.1% |
~ | 1 | 11.1% |
3 | 1 | 11.1% |
0 | 1 | 11.1% |
% | 1 | 11.1% |
Hangul
Value | Count | Frequency (%) |
색 | 5 | |
적 | 3 | |
흑 | 2 | 20.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 10 | |
ASCII | 9 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
색 | 5 | |
적 | 3 | |
흑 | 2 | 20.0% |
ASCII
Value | Count | Frequency (%) |
3 | ||
2 | 1 | 11.1% |
5 | 1 | 11.1% |
~ | 1 | 11.1% |
3 | 1 | 11.1% |
0 | 1 | 11.1% |
% | 1 | 11.1% |
표현형태-7
Categorical
HIGH CORRELATION
 
Distinct | 18 |
---|---|
Distinct (%) | 27.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
<NA> | |
---|---|
진하다 | |
길다 | |
강하다 | |
넓다 | |
Other values (13) |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 3.4 |
Min length | 2 |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 15.4% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 진하다 |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 27 | |
진하다 | 9 | 13.8% |
길다 | 6 | 9.2% |
강하다 | 3 | 4.6% |
넓다 | 3 | 4.6% |
늦다 | 3 | 4.6% |
뒤로휨 | 2 | 3.1% |
담자색 | 2 | 3.1% |
심하게 굽음 | 1 | 1.5% |
완전개형 | 1 | 1.5% |
Other values (8) | 8 | 12.3% |
Length
Value | Count | Frequency (%) |
na | 27 | |
진하다 | 9 | 13.2% |
길다 | 6 | 8.8% |
강하다 | 3 | 4.4% |
넓다 | 3 | 4.4% |
늦다 | 3 | 4.4% |
뒤로휨 | 2 | 2.9% |
담자색 | 2 | 2.9% |
2 | 2.9% | |
30 | 1 | 1.5% |
Other values (10) | 10 | 14.7% |
표현형태-8
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
<NA> | |
---|---|
자색 | 3 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9076923 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 62 | |
자색 | 3 | 4.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 62 | |
자색 | 3 | 4.6% |
표현형태-9
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 16.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
<NA> | |
---|---|
있다 | |
매우진하다 | 3 |
흑색 | 2 |
포복 | 1 |
Other values (6) |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 3.7230769 |
Min length | 2 |
Unique
Unique | 7 ? |
---|---|
Unique (%) | 10.8% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 있다 |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 43 | |
있다 | 10 | 15.4% |
매우진하다 | 3 | 4.6% |
흑색 | 2 | 3.1% |
포복 | 1 | 1.5% |
장간 | 1 | 1.5% |
매우길다 | 1 | 1.5% |
매우강하다 | 1 | 1.5% |
추출매우양호 | 1 | 1.5% |
매우늦다 | 1 | 1.5% |
Length
Value | Count | Frequency (%) |
na | 43 | |
있다 | 10 | 14.9% |
매우진하다 | 3 | 4.5% |
흑색 | 3 | 4.5% |
포복 | 1 | 1.5% |
장간 | 1 | 1.5% |
매우길다 | 1 | 1.5% |
매우강하다 | 1 | 1.5% |
추출매우양호 | 1 | 1.5% |
매우늦다 | 1 | 1.5% |
Other values (2) | 2 | 3.0% |
출원품종 표현형태
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 9.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
1 | |
---|---|
5 | |
<NA> | |
2 | |
3 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.4615385 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.5% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 5 |
4th row | 1 |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
1 | 28 | |
5 | 17 | |
<NA> | 10 | 15.4% |
2 | 5 | 7.7% |
3 | 4 | 6.2% |
4 | 1 | 1.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 28 | |
5 | 17 | |
na | 10 | 15.4% |
2 | 5 | 7.7% |
3 | 4 | 6.2% |
4 | 1 | 1.5% |
출원품종 실측치
Categorical
HIGH CORRELATION
 
Distinct | 27 |
---|---|
Distinct (%) | 41.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
없다 | |
---|---|
없거나 매우 약하다 | |
중간 | |
<NA> | |
반직립 | |
Other values (22) |
Length
Max length | 10 |
---|---|
Median length | 5 |
Mean length | 4.0307692 |
Min length | 2 |
Unique
Unique | 22 ? |
---|---|
Unique (%) | 33.8% |
Sample
1st row | 없거나 매우 약하다 |
---|---|
2nd row | 녹색 |
3rd row | 중간 |
4th row | 없다 |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
없다 | 12 | |
없거나 매우 약하다 | 10 | |
중간 | 9 | |
<NA> | 9 | |
반직립 | 3 | 4.6% |
황백색 | 1 | 1.5% |
뾰족하다 | 1 | 1.5% |
무색 | 1 | 1.5% |
직립 | 1 | 1.5% |
8. 11 | 1 | 1.5% |
Other values (17) | 17 |
Length
Value | Count | Frequency (%) |
없다 | 12 | |
매우 | 10 | |
약하다 | 10 | |
없거나 | 10 | |
중간 | 9 | |
na | 9 | |
반직립 | 3 | 3.5% |
2.74 | 1 | 1.2% |
26.2 | 1 | 1.2% |
3.21 | 1 | 1.2% |
Other values (20) | 20 |
대조품종 표현형태
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 9.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
1 | |
---|---|
5 | |
<NA> | |
2 | |
3 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.4153846 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.5% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 5 |
4th row | 1 |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
1 | 28 | |
5 | 19 | |
<NA> | 9 | 13.8% |
2 | 4 | 6.2% |
3 | 4 | 6.2% |
4 | 1 | 1.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 28 | |
5 | 19 | |
na | 9 | 13.8% |
2 | 4 | 6.2% |
3 | 4 | 6.2% |
4 | 1 | 1.5% |
대조품종 실측치
Categorical
HIGH CORRELATION
 
Distinct | 27 |
---|---|
Distinct (%) | 41.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 652.0 B |
없다 | |
---|---|
중간 | |
없거나 매우 약하다 | |
<NA> | |
반직립 | |
Other values (22) |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 3.8461538 |
Min length | 2 |
Unique
Unique | 22 ? |
---|---|
Unique (%) | 33.8% |
Sample
1st row | 없거나 매우 약하다 |
---|---|
2nd row | 녹색 |
3rd row | 중간 |
4th row | 없다 |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
없다 | 12 | |
중간 | 10 | |
없거나 매우 약하다 | 9 | |
<NA> | 9 | |
반직립 | 3 | 4.6% |
황백색 | 1 | 1.5% |
뾰족하다 | 1 | 1.5% |
무색 | 1 | 1.5% |
직립 | 1 | 1.5% |
8. 8 | 1 | 1.5% |
Other values (17) | 17 |
Length
Value | Count | Frequency (%) |
없다 | 12 | |
중간 | 10 | |
없거나 | 9 | |
매우 | 9 | |
약하다 | 9 | |
na | 9 | |
반직립 | 3 | 3.6% |
8 | 2 | 2.4% |
단원형 | 1 | 1.2% |
3.41 | 1 | 1.2% |
Other values (19) | 19 |
번호 | 형질 | 표현형태-1 | 표현형태-2 | 표현형태-3 | 표현형태-4 | 표현형태-5 | 표현형태-6 | 표현형태-7 | 표현형태-9 | 출원품종 표현형태 | 출원품종 실측치 | 대조품종 표현형태 | 대조품종 실측치 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
번호 | 1.000 | 1.000 | 0.201 | 0.685 | 0.729 | 0.654 | 0.168 | 0.000 | 0.524 | 0.764 | 0.200 | 0.527 | 0.281 | 0.558 |
형질 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
표현형태-1 | 0.201 | 1.000 | 1.000 | 0.956 | 0.993 | 0.886 | 0.880 | 0.842 | 0.982 | 1.000 | 0.964 | 0.982 | 0.936 | 0.980 |
표현형태-2 | 0.685 | 1.000 | 0.956 | 1.000 | 0.995 | 0.959 | 0.932 | 0.643 | 1.000 | 0.000 | 1.000 | 0.900 | 1.000 | 0.900 |
표현형태-3 | 0.729 | 1.000 | 0.993 | 0.995 | 1.000 | 0.919 | 0.920 | 0.898 | 0.990 | 1.000 | 0.948 | 0.953 | 0.934 | 0.951 |
표현형태-4 | 0.654 | 1.000 | 0.886 | 0.959 | 0.919 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 |
표현형태-5 | 0.168 | 1.000 | 0.880 | 0.932 | 0.920 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.921 | 0.996 | 0.923 | 0.996 |
표현형태-6 | 0.000 | 1.000 | 0.842 | 0.643 | 0.898 | 1.000 | 1.000 | 1.000 | 1.000 | NaN | 0.827 | 1.000 | 0.827 | 1.000 |
표현형태-7 | 0.524 | 1.000 | 0.982 | 1.000 | 0.990 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.981 | 0.982 | 0.979 |
표현형태-9 | 0.764 | 1.000 | 1.000 | 0.000 | 1.000 | 0.000 | 1.000 | NaN | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
출원품종 표현형태 | 0.200 | 1.000 | 0.964 | 1.000 | 0.948 | 1.000 | 0.921 | 0.827 | 1.000 | 1.000 | 1.000 | 1.000 | 0.999 | 1.000 |
출원품종 실측치 | 0.527 | 1.000 | 0.982 | 0.900 | 0.953 | 1.000 | 0.996 | 1.000 | 0.981 | 1.000 | 1.000 | 1.000 | 0.996 | 1.000 |
대조품종 표현형태 | 0.281 | 1.000 | 0.936 | 1.000 | 0.934 | 1.000 | 0.923 | 0.827 | 0.982 | 1.000 | 0.999 | 0.996 | 1.000 | 1.000 |
대조품종 실측치 | 0.558 | 1.000 | 0.980 | 0.900 | 0.951 | 1.000 | 0.996 | 1.000 | 0.979 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
표현형태-5 | 표현형태-8 | 표현형태-7 | 대조품종 실측치 | 대조품종 표현형태 | 표현형태-9 | 표현형태-1 | 출원품종 표현형태 | 출원품종 실측치 | |
---|---|---|---|---|---|---|---|---|---|
표현형태-5 | 1.000 | 1.000 | 0.810 | 0.687 | 0.739 | 0.577 | 0.481 | 0.733 | 0.687 |
표현형태-8 | 1.000 | 1.000 | 1.000 | NaN | NaN | 1.000 | 1.000 | NaN | NaN |
표현형태-7 | 0.810 | 1.000 | 1.000 | 0.678 | 0.727 | 1.000 | 0.856 | 0.759 | 0.687 |
대조품종 실측치 | 0.687 | NaN | 0.678 | 1.000 | 0.767 | 0.920 | 0.790 | 0.760 | 0.993 |
대조품종 표현형태 | 0.739 | NaN | 0.727 | 0.767 | 1.000 | 0.829 | 0.660 | 0.956 | 0.753 |
표현형태-9 | 0.577 | 1.000 | 1.000 | 0.920 | 0.829 | 1.000 | 0.957 | 0.829 | 0.920 |
표현형태-1 | 0.481 | 1.000 | 0.856 | 0.790 | 0.660 | 0.957 | 1.000 | 0.723 | 0.805 |
출원품종 표현형태 | 0.733 | NaN | 0.759 | 0.760 | 0.956 | 0.829 | 0.723 | 1.000 | 0.775 |
출원품종 실측치 | 0.687 | NaN | 0.687 | 0.993 | 0.753 | 0.920 | 0.805 | 0.775 | 1.000 |
번호 | 표현형태-1 | 표현형태-5 | 표현형태-7 | 표현형태-8 | 표현형태-9 | 출원품종 표현형태 | 출원품종 실측치 | 대조품종 표현형태 | 대조품종 실측치 | |
---|---|---|---|---|---|---|---|---|---|---|
번호 | 1.000 | 0.000 | 0.000 | 0.164 | 1.000 | 0.282 | 0.056 | 0.150 | 0.100 | 0.167 |
표현형태-1 | 0.000 | 1.000 | 0.481 | 0.856 | 1.000 | 0.957 | 0.723 | 0.805 | 0.660 | 0.790 |
표현형태-5 | 0.000 | 0.481 | 1.000 | 0.810 | 1.000 | 0.577 | 0.733 | 0.687 | 0.739 | 0.687 |
표현형태-7 | 0.164 | 0.856 | 0.810 | 1.000 | 1.000 | 1.000 | 0.759 | 0.687 | 0.727 | 0.678 |
표현형태-8 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | NaN | NaN | NaN | NaN |
표현형태-9 | 0.282 | 0.957 | 0.577 | 1.000 | 1.000 | 1.000 | 0.829 | 0.920 | 0.829 | 0.920 |
출원품종 표현형태 | 0.056 | 0.723 | 0.733 | 0.759 | NaN | 0.829 | 1.000 | 0.775 | 0.956 | 0.760 |
출원품종 실측치 | 0.150 | 0.805 | 0.687 | 0.687 | NaN | 0.920 | 0.775 | 1.000 | 0.753 | 0.993 |
대조품종 표현형태 | 0.100 | 0.660 | 0.739 | 0.727 | NaN | 0.829 | 0.956 | 0.753 | 1.000 | 0.767 |
대조품종 실측치 | 0.167 | 0.790 | 0.687 | 0.678 | NaN | 0.920 | 0.760 | 0.993 | 0.767 | 1.000 |
번호 | 형질 | 표현형태-1 | 표현형태-2 | 표현형태-3 | 표현형태-4 | 표현형태-5 | 표현형태-6 | 표현형태-7 | 표현형태-8 | 표현형태-9 | 출원품종 표현형태 | 출원품종 실측치 | 대조품종 표현형태 | 대조품종 실측치 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 초엽 : 안토시아닌 색소 | 없거나매우약하다 | 옅다 | 진하다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 1 | 없거나 매우 약하다 | 1 | 없거나 매우 약하다 |
1 | 2 | 제1엽 : 엽초색 | 녹색 | 자주색 | 옅은 자색 | 자색 | <NA> | <NA> | <NA> | <NA> | <NA> | 1 | 녹색 | 1 | 녹색 |
2 | 3 | 잎 : 녹색정도 (잎색농도) | <NA> | <NA> | 연하다 | <NA> | 중간 | <NA> | 진하다 | <NA> | <NA> | 5 | 중간 | 5 | 중간 |
3 | 4 | 잎 : 안토시아닌 색소 | 없다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 있다 | 1 | 없다 | 1 | 없다 |
4 | 5 | 잎 : 안토시아닌 색소분포 | 끝 | 가장자리 | 얼룩 | 균등 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | 6 | 잎집 : 안토시아닌 색소 | 없다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 있다 | 1 | 없다 | 1 | 없다 |
6 | 7 | 잎집 : 안토시아닌 색소농도 | 매우연하다 | <NA> | 연하다 | <NA> | 중간 | <NA> | 강하다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | 8 | 잎몸 : 모용성 | 없거나매우약하다 | <NA> | 약하다 | <NA> | 중간 | <NA> | 강하다 | <NA> | <NA> | 1 | 없거나 매우 약하다 | 5 | 중간 |
8 | 9 | 잎 : 잎귀의 안토시아닌 색소 | 없다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 있다 | 1 | 없다 | 1 | 없다 |
9 | 10 | 잎 : 잎깃의 안토시아닌 색소 | 없다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 있다 | 1 | 없다 | 1 | 없다 |
번호 | 형질 | 표현형태-1 | 표현형태-2 | 표현형태-3 | 표현형태-4 | 표현형태-5 | 표현형태-6 | 표현형태-7 | 표현형태-8 | 표현형태-9 | 출원품종 표현형태 | 출원품종 실측치 | 대조품종 표현형태 | 대조품종 실측치 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
55 | 56 | 벼알 : 외영의 페놀반응 | 없다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 있다 | 1 | 없다 | 1 | 없다 |
56 | 57 | 외영 페놀반응 정도 | <NA> | <NA> | 연하다 | <NA> | 중간 | <NA> | 진하다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
57 | 58 | 현미 : 길이 | <NA> | <NA> | 짧다 | <NA> | 중간 | <NA> | 길다 | <NA> | <NA> | 5 | 5.07 | 5 | 5.34 |
58 | 59 | 현미 : 폭 | <NA> | <NA> | 좁다 | <NA> | 중간 | <NA> | 넓다 | <NA> | <NA> | 5 | 2.74 | 5 | 2.82 |
59 | 60 | 현미 : 모양 (측면 관찰) | 원형 | 단원형 | 중원형 | 장원형 | 세장형 | <NA> | <NA> | <NA> | <NA> | 2 | 단원형 | 2 | 단원형 |
60 | 61 | 현미 : 색 | 백색 | 담갈색 | 얼룩진갈색 | 짙은갈색 | 담적색 | 적색 | 얼룩진자색 | 자색 | 암자색 / 흑색 | 2 | 담갈색 | 2 | 담갈색 |
61 | 62 | 배유 : 찰메성 | 찰 | 중간 | 메 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 3 | 메성 | 3 | 메성 |
62 | 63 | 배유 : 아밀로스함량 | < | 5 ~ 10 % | 11 ~ 15 % | 16 ~ 20 % | 21 ~ 25 % | 25 ~ 30 % | > 30 % | <NA> | <NA> | 4 | 20.25 | 4 | 18.6 |
63 | 64 | 알카리 붕괴도 | 붕괴안됨 | <NA> | 조금붕괴됨 | <NA> | 중간 | <NA> | 완전히붕괴됨 | <NA> | <NA> | 1 | 붕괴안됨 | 1 | 붕괴안됨 |
64 | 65 | 현미 : 향취성 | 없거나매우약하다 | 약하다 | 강하다 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 1 | 없거나 매우 약하다 | 1 | 없거나 매우 약하다 |