Dataset statistics
Number of variables | 11 |
---|---|
Number of observations | 7892 |
Missing cells | 103 |
Missing cells (%) | 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 701.5 KiB |
Average record size in memory | 91.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 4 |
Categorical | 4 |
Dataset
Description | 검정업무(농산물, 원산지,우수식품, LMO, 술품질인증) 통합 관리 정보(신청일자, 품목, 종류, 생산지, 검정항목, 검정기관 등) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001680 |
REQST_DE is highly overall correlated with ATHRZ_INSTT_CODE | High correlation |
PRDLC_CODE is highly overall correlated with PRDLC | High correlation |
ATHRZ_INSTT_CODE is highly overall correlated with REQST_DE and 2 other fields | High correlation |
KND is highly overall correlated with ATHRZ_IEM | High correlation |
PRDLC is highly overall correlated with PRDLC_CODE | High correlation |
ATHRZ_IEM is highly overall correlated with ATHRZ_INSTT_CODE and 2 other fields | High correlation |
ATHRZ_INSTT is highly overall correlated with ATHRZ_INSTT_CODE and 1 other fields | High correlation |
ATHRZ_IEM is highly imbalanced (50.5%) | Imbalance |
ATHRZ_INSTT is highly imbalanced (70.8%) | Imbalance |
PRDLC_CODE has 103 (1.3%) missing values | Missing |
SPLORE_NO has unique values | Unique |
Reproduction
Analysis started | 2024-03-23 07:34:43.307261 |
---|---|
Analysis finished | 2024-03-23 07:34:48.843015 |
Duration | 5.54 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
REQST_DE
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 654 |
---|---|
Distinct (%) | 8.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20134543 |
Minimum | 20100108 |
---|---|
Maximum | 20220113 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 69.5 KiB |
Quantile statistics
Minimum | 20100108 |
---|---|
5-th percentile | 20100727 |
Q1 | 20120509 |
median | 20130923 |
Q3 | 20150618 |
95-th percentile | 20170206 |
Maximum | 20220113 |
Range | 120005 |
Interquartile range (IQR) | 30109 |
Descriptive statistics
Standard deviation | 22178.256 |
---|---|
Coefficient of variation (CV) | 0.0011015028 |
Kurtosis | 0.64202738 |
Mean | 20134543 |
Median Absolute Deviation (MAD) | 19281 |
Skewness | 0.58749405 |
Sum | 1.5890181 × 1011 |
Variance | 4.9187504 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20120712 | 85 | 1.1% |
20160719 | 79 | 1.0% |
20130715 | 78 | 1.0% |
20110808 | 71 | 0.9% |
20140710 | 69 | 0.9% |
20201211 | 67 | 0.8% |
20150629 | 67 | 0.8% |
20191126 | 66 | 0.8% |
20160725 | 63 | 0.8% |
20160829 | 62 | 0.8% |
Other values (644) | 7185 |
Value | Count | Frequency (%) |
20100108 | 15 | |
20100128 | 8 | 0.1% |
20100129 | 1 | < 0.1% |
20100204 | 27 | |
20100205 | 30 | |
20100210 | 18 | |
20100219 | 9 | 0.1% |
20100224 | 6 | 0.1% |
20100303 | 1 | < 0.1% |
20100309 | 6 | 0.1% |
Value | Count | Frequency (%) |
20220113 | 19 | 0.2% |
20211220 | 22 | 0.3% |
20210422 | 1 | < 0.1% |
20210107 | 8 | 0.1% |
20201211 | 67 | |
20200214 | 2 | < 0.1% |
20200213 | 2 | < 0.1% |
20200212 | 3 | < 0.1% |
20200211 | 4 | 0.1% |
20200207 | 5 | 0.1% |
PRDLST
Text
Distinct | 73 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 61.8 KiB |
Value | Count | Frequency (%) |
호밀 | 1914 | |
라이그라스(이탈리안 | 954 | |
베치 | 701 | 8.9% |
청보리 | 660 | 8.4% |
수단그라스 | 614 | 7.8% |
콩나물콩 | 295 | 3.7% |
귀리 | 274 | 3.5% |
옥수수 | 272 | 3.4% |
페스큐(톨 | 254 | 3.2% |
금계국 | 188 | 2.4% |
Other values (63) | 1766 |
Most occurring characters
Value | Count | Frequency (%) |
라 | 3124 | 9.0% |
스 | 2500 | 7.2% |
이 | 2461 | 7.1% |
리 | 2107 | 6.1% |
그 | 1988 | 5.7% |
밀 | 1962 | 5.7% |
호 | 1914 | 5.5% |
( | 1602 | 4.6% |
) | 1602 | 4.6% |
수 | 1431 | 4.1% |
Other values (121) | 13914 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31401 | |
Open Punctuation | 1602 | 4.6% |
Close Punctuation | 1602 | 4.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
라 | 3124 | 9.9% |
스 | 2500 | 8.0% |
이 | 2461 | 7.8% |
리 | 2107 | 6.7% |
그 | 1988 | 6.3% |
밀 | 1962 | 6.2% |
호 | 1914 | 6.1% |
수 | 1431 | 4.6% |
탈 | 954 | 3.0% |
안 | 954 | 3.0% |
Other values (119) | 12006 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1602 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1602 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31401 | |
Common | 3204 | 9.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
라 | 3124 | 9.9% |
스 | 2500 | 8.0% |
이 | 2461 | 7.8% |
리 | 2107 | 6.7% |
그 | 1988 | 6.3% |
밀 | 1962 | 6.2% |
호 | 1914 | 6.1% |
수 | 1431 | 4.6% |
탈 | 954 | 3.0% |
안 | 954 | 3.0% |
Other values (119) | 12006 |
Common
Value | Count | Frequency (%) |
( | 1602 | |
) | 1602 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31401 | |
ASCII | 3204 | 9.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
라 | 3124 | 9.9% |
스 | 2500 | 8.0% |
이 | 2461 | 7.8% |
리 | 2107 | 6.7% |
그 | 1988 | 6.3% |
밀 | 1962 | 6.2% |
호 | 1914 | 6.1% |
수 | 1431 | 4.6% |
탈 | 954 | 3.0% |
안 | 954 | 3.0% |
Other values (119) | 12006 |
ASCII
Value | Count | Frequency (%) |
( | 1602 | |
) | 1602 |
KND
Categorical
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 61.8 KiB |
사료.목초종자 | |
---|---|
맥류 | |
농산물종자류 | |
조사료 | |
화훼종자류 | |
Other values (11) |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 4.5277496 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 맥류 |
---|---|
2nd row | 농산물종자류 |
3rd row | 농산물종자류 |
4th row | 농산물종자류 |
5th row | 잡곡류 |
Common Values
Value | Count | Frequency (%) |
사료.목초종자 | 2247 | |
맥류 | 1839 | |
농산물종자류 | 1203 | |
조사료 | 1190 | |
화훼종자류 | 686 | 8.7% |
두류 | 370 | 4.7% |
잡곡류 | 154 | 2.0% |
산림종묘 | 73 | 0.9% |
LMO농산물 | 60 | 0.8% |
미곡류 | 38 | 0.5% |
Other values (6) | 32 | 0.4% |
Length
Value | Count | Frequency (%) |
사료.목초종자 | 2247 | |
맥류 | 1839 | |
농산물종자류 | 1203 | |
조사료 | 1190 | |
화훼종자류 | 686 | 8.7% |
두류 | 370 | 4.7% |
잡곡류 | 154 | 2.0% |
산림종묘 | 73 | 0.9% |
lmo농산물 | 60 | 0.8% |
미곡류 | 38 | 0.5% |
Other values (6) | 32 | 0.4% |
PRDLC
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 61.8 KiB |
미국 | |
---|---|
중국 | |
대한민국(국산) | |
캐나다 | |
오스트레일리아(호주) | |
Other values (17) |
Length
Max length | 11 |
---|---|
Median length | 2 |
Mean length | 3.9071211 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 미국 |
---|---|
2nd row | 대한민국(국산) |
3rd row | 대한민국(국산) |
4th row | 대한민국(국산) |
5th row | 오스트레일리아(호주) |
Common Values
Value | Count | Frequency (%) |
미국 | 3785 | |
중국 | 1052 | 13.3% |
대한민국(국산) | 1038 | 13.2% |
캐나다 | 687 | 8.7% |
오스트레일리아(호주) | 657 | 8.3% |
남아프리카공화국 | 271 | 3.4% |
<NA> | 105 | 1.3% |
인도 | 64 | 0.8% |
오리건주 | 52 | 0.7% |
스페인 | 32 | 0.4% |
Other values (12) | 149 | 1.9% |
Length
Value | Count | Frequency (%) |
미국 | 3785 | |
중국 | 1052 | 13.3% |
대한민국(국산 | 1038 | 13.2% |
캐나다 | 687 | 8.7% |
오스트레일리아(호주 | 657 | 8.3% |
남아프리카공화국 | 271 | 3.4% |
na | 105 | 1.3% |
인도 | 64 | 0.8% |
오리건주 | 52 | 0.7% |
스페인 | 32 | 0.4% |
Other values (12) | 149 | 1.9% |
ATHRZ_IEM
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 40 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 61.8 KiB |
이종종자, 이물, 발아율 | |
---|---|
이종종자, 이물, 발아율, 수분 | |
정립, 발아율 | |
발아율 | |
정립, 발아율, 수분 | |
Other values (35) |
Length
Max length | 95 |
---|---|
Median length | 66 |
Mean length | 10.914597 |
Min length | 2 |
Unique
Unique | 11 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 이종종자, 이물, 발아율, 수분 |
---|---|
2nd row | 이종종자, 이물, 발아율, 수분 |
3rd row | 이종종자, 이물, 발아율, 수분 |
4th row | 이종종자, 이물, 발아율, 수분 |
5th row | 이종종자, 이물, 발아율 |
Common Values
Value | Count | Frequency (%) |
이종종자, 이물, 발아율 | 2225 | |
이종종자, 이물, 발아율, 수분 | 1718 | |
정립, 발아율 | 1609 | |
발아율 | 1241 | |
정립, 발아율, 수분 | 607 | 7.7% |
정립, 이물, 발아율 | 141 | 1.8% |
정립, 이종종자, 발아율 | 90 | 1.1% |
수분 | 76 | 1.0% |
이물, 발아율 | 23 | 0.3% |
이물, 싸라기, 색택, 수분 | 18 | 0.2% |
Other values (30) | 144 | 1.8% |
Length
Value | Count | Frequency (%) |
발아율 | 7710 | |
이물 | 4202 | |
이종종자 | 4037 | |
수분 | 2527 | 11.9% |
정립 | 2460 | 11.5% |
파쇄립 | 42 | 0.2% |
피해립 | 28 | 0.1% |
순도 | 26 | 0.1% |
다른종피색 | 24 | 0.1% |
변질률 | 24 | 0.1% |
Other values (21) | 233 | 1.1% |
ATHRZ_INSTT
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 61.8 KiB |
국립농산물품질관리원 시험연구소 원산지검정과 | |
---|---|
국립농산물품질관리원 시험연구소 품질조사과 | |
국립농산물품질관리원 전남지원 유통관리과 | 13 |
국립농산물품질관리원 경남지원 유통관리과 | 6 |
국립농산물품질관리원 경북지원 유통관리과 | 3 |
Other values (3) | 4 |
Length
Max length | 23 |
---|---|
Median length | 23 |
Mean length | 22.724531 |
Min length | 21 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 국립농산물품질관리원 시험연구소 원산지검정과 |
---|---|
2nd row | 국립농산물품질관리원 시험연구소 원산지검정과 |
3rd row | 국립농산물품질관리원 시험연구소 원산지검정과 |
4th row | 국립농산물품질관리원 시험연구소 원산지검정과 |
5th row | 국립농산물품질관리원 시험연구소 원산지검정과 |
Common Values
Value | Count | Frequency (%) |
국립농산물품질관리원 시험연구소 원산지검정과 | 5744 | |
국립농산물품질관리원 시험연구소 품질조사과 | 2122 | 26.9% |
국립농산물품질관리원 전남지원 유통관리과 | 13 | 0.2% |
국립농산물품질관리원 경남지원 유통관리과 | 6 | 0.1% |
국립농산물품질관리원 경북지원 유통관리과 | 3 | < 0.1% |
국립농산물품질관리원 전남지원 품질관리과 | 2 | < 0.1% |
국립농산물품질관리원 전남지원 영광사무소 | 1 | < 0.1% |
국립농산물품질관리원 충북지원 유통관리과 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국립농산물품질관리원 | 7892 | |
시험연구소 | 7866 | |
원산지검정과 | 5744 | |
품질조사과 | 2122 | 9.0% |
유통관리과 | 23 | 0.1% |
전남지원 | 16 | 0.1% |
경남지원 | 6 | < 0.1% |
경북지원 | 3 | < 0.1% |
품질관리과 | 2 | < 0.1% |
영광사무소 | 1 | < 0.1% |
REQST_SN
Text
Distinct | 2525 |
---|---|
Distinct (%) | 32.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 61.8 KiB |
Length
Max length | 20 |
---|---|
Median length | 20 |
Mean length | 20 |
Min length | 20 |
Characters and Unicode
Total characters | 157840 |
---|---|
Distinct characters | 15 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 1479 ? |
---|---|
Unique (%) | 18.7% |
Sample
1st row | UCI00000000001252958 |
---|---|
2nd row | UCI00000000001253043 |
3rd row | UCI00000000001253044 |
4th row | UCI00000000001253047 |
5th row | UCI00000000001262573 |
Value | Count | Frequency (%) |
uci00000000001376618 | 66 | 0.8% |
uci00000000000004303 | 40 | 0.5% |
uci00000000001397303 | 40 | 0.5% |
uci00000000001267776 | 37 | 0.5% |
uci00000000001263118 | 30 | 0.4% |
uci00000000001278952 | 29 | 0.4% |
uci00000000001279005 | 29 | 0.4% |
uci00000000001392271 | 27 | 0.3% |
uci00000000000005008 | 26 | 0.3% |
uci00000000000005812 | 24 | 0.3% |
Other values (2515) | 7544 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 85323 | |
1 | 10068 | 6.4% |
2 | 9417 | 6.0% |
C | 7892 | 5.0% |
U | 7816 | 5.0% |
I | 7816 | 5.0% |
5 | 5468 | 3.5% |
4 | 5376 | 3.4% |
6 | 4213 | 2.7% |
7 | 3968 | 2.5% |
Other values (5) | 10483 | 6.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 134164 | |
Uppercase Letter | 23676 | 15.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 85323 | |
1 | 10068 | 7.5% |
2 | 9417 | 7.0% |
5 | 5468 | 4.1% |
4 | 5376 | 4.0% |
6 | 4213 | 3.1% |
7 | 3968 | 3.0% |
8 | 3835 | 2.9% |
9 | 3494 | 2.6% |
3 | 3002 | 2.2% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 7892 | |
U | 7816 | |
I | 7816 | |
A | 76 | 0.3% |
P | 76 | 0.3% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 134164 | |
Latin | 23676 | 15.0% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 85323 | |
1 | 10068 | 7.5% |
2 | 9417 | 7.0% |
5 | 5468 | 4.1% |
4 | 5376 | 4.0% |
6 | 4213 | 3.1% |
7 | 3968 | 3.0% |
8 | 3835 | 2.9% |
9 | 3494 | 2.6% |
3 | 3002 | 2.2% |
Latin
Value | Count | Frequency (%) |
C | 7892 | |
U | 7816 | |
I | 7816 | |
A | 76 | 0.3% |
P | 76 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 157840 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 85323 | |
1 | 10068 | 6.4% |
2 | 9417 | 6.0% |
C | 7892 | 5.0% |
U | 7816 | 5.0% |
I | 7816 | 5.0% |
5 | 5468 | 3.5% |
4 | 5376 | 3.4% |
6 | 4213 | 2.7% |
7 | 3968 | 2.5% |
Other values (5) | 10483 | 6.6% |
SPLORE_NO
Text
UNIQUE
 
Distinct | 7892 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 61.8 KiB |
Length
Max length | 20 |
---|---|
Median length | 20 |
Mean length | 20 |
Min length | 20 |
Characters and Unicode
Total characters | 157840 |
---|---|
Distinct characters | 13 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 7892 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | SMP00000000000056366 |
---|---|
2nd row | SMP00000000000056553 |
3rd row | SMP00000000000056554 |
4th row | SMP00000000000056557 |
5th row | SMP00000000000080191 |
Value | Count | Frequency (%) |
smp00000000000056366 | 1 | < 0.1% |
smp00000000000084335 | 1 | < 0.1% |
smp00000000000100925 | 1 | < 0.1% |
smp00000000000100924 | 1 | < 0.1% |
smp00000000000111899 | 1 | < 0.1% |
smp00000000000111898 | 1 | < 0.1% |
smp00000000000111897 | 1 | < 0.1% |
smp00000000000111896 | 1 | < 0.1% |
smp00000000000111785 | 1 | < 0.1% |
smp00000000000111784 | 1 | < 0.1% |
Other values (7882) | 7882 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 98107 | |
S | 7892 | 5.0% |
M | 7892 | 5.0% |
P | 7892 | 5.0% |
1 | 4431 | 2.8% |
7 | 4300 | 2.7% |
9 | 4193 | 2.7% |
4 | 4113 | 2.6% |
5 | 4071 | 2.6% |
2 | 4008 | 2.5% |
Other values (3) | 10941 | 6.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 134164 | |
Uppercase Letter | 23676 | 15.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 98107 | |
1 | 4431 | 3.3% |
7 | 4300 | 3.2% |
9 | 4193 | 3.1% |
4 | 4113 | 3.1% |
5 | 4071 | 3.0% |
2 | 4008 | 3.0% |
3 | 3751 | 2.8% |
8 | 3639 | 2.7% |
6 | 3551 | 2.6% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 7892 | |
M | 7892 | |
P | 7892 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 134164 | |
Latin | 23676 | 15.0% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 98107 | |
1 | 4431 | 3.3% |
7 | 4300 | 3.2% |
9 | 4193 | 3.1% |
4 | 4113 | 3.1% |
5 | 4071 | 3.0% |
2 | 4008 | 3.0% |
3 | 3751 | 2.8% |
8 | 3639 | 2.7% |
6 | 3551 | 2.6% |
Latin
Value | Count | Frequency (%) |
S | 7892 | |
M | 7892 | |
P | 7892 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 157840 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 98107 | |
S | 7892 | 5.0% |
M | 7892 | 5.0% |
P | 7892 | 5.0% |
1 | 4431 | 2.8% |
7 | 4300 | 2.7% |
9 | 4193 | 2.7% |
4 | 4113 | 2.6% |
5 | 4071 | 2.6% |
2 | 4008 | 2.5% |
Other values (3) | 10941 | 6.9% |
PRDLST_CODE
Text
Distinct | 81 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 61.8 KiB |
Value | Count | Frequency (%) |
020500 | 1616 | |
582024 | 954 | |
5602aa | 701 | 8.9% |
153500 | 660 | 8.4% |
582035 | 614 | 7.8% |
153600 | 298 | 3.8% |
030109 | 295 | 3.7% |
560222 | 254 | 3.2% |
272401 | 188 | 2.4% |
582025 | 179 | 2.3% |
Other values (71) | 2133 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 16305 | |
2 | 8493 | |
5 | 8012 | |
1 | 3148 | 6.6% |
3 | 2687 | 5.7% |
8 | 2499 | 5.3% |
6 | 1815 | 3.8% |
A | 1426 | 3.0% |
4 | 1353 | 2.9% |
7 | 944 | 2.0% |
Other values (4) | 670 | 1.4% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 45902 | |
Uppercase Letter | 1450 | 3.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 16305 | |
2 | 8493 | |
5 | 8012 | |
1 | 3148 | 6.9% |
3 | 2687 | 5.9% |
8 | 2499 | 5.4% |
6 | 1815 | 4.0% |
4 | 1353 | 2.9% |
7 | 944 | 2.1% |
9 | 646 | 1.4% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 1426 | |
F | 16 | 1.1% |
B | 7 | 0.5% |
G | 1 | 0.1% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 45902 | |
Latin | 1450 | 3.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 16305 | |
2 | 8493 | |
5 | 8012 | |
1 | 3148 | 6.9% |
3 | 2687 | 5.9% |
8 | 2499 | 5.4% |
6 | 1815 | 4.0% |
4 | 1353 | 2.9% |
7 | 944 | 2.1% |
9 | 646 | 1.4% |
Latin
Value | Count | Frequency (%) |
A | 1426 | |
F | 16 | 1.1% |
B | 7 | 0.5% |
G | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 47352 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 16305 | |
2 | 8493 | |
5 | 8012 | |
1 | 3148 | 6.6% |
3 | 2687 | 5.7% |
8 | 2499 | 5.3% |
6 | 1815 | 3.8% |
A | 1426 | 3.0% |
4 | 1353 | 2.9% |
7 | 944 | 2.0% |
Other values (4) | 670 | 1.4% |
PRDLC_CODE
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 22 |
---|---|
Distinct (%) | 0.3% |
Missing | 103 |
Missing (%) | 1.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9296.6989 |
Minimum | 0 |
---|---|
Maximum | 22700 |
Zeros | 26 |
Zeros (%) | 0.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 69.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 3000 |
Q1 | 6800 |
median | 6800 |
Q3 | 14700 |
95-th percentile | 18300 |
Maximum | 22700 |
Range | 22700 |
Interquartile range (IQR) | 7900 |
Descriptive statistics
Standard deviation | 5415.8009 |
---|---|
Coefficient of variation (CV) | 0.58255096 |
Kurtosis | -1.1761567 |
Mean | 9296.6989 |
Median Absolute Deviation (MAD) | 3800 |
Skewness | 0.53949041 |
Sum | 72411988 |
Variance | 29330899 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
6800 | 3785 | |
16900 | 1052 | 13.3% |
3000 | 1038 | 13.2% |
18300 | 687 | 8.7% |
14700 | 657 | 8.3% |
1800 | 271 | 3.4% |
16200 | 64 | 0.8% |
6807 | 52 | 0.7% |
11800 | 32 | 0.4% |
3100 | 27 | 0.3% |
Other values (12) | 124 | 1.6% |
(Missing) | 103 | 1.3% |
Value | Count | Frequency (%) |
0 | 26 | 0.3% |
36 | 2 | < 0.1% |
1800 | 271 | 3.4% |
2000 | 17 | 0.2% |
2400 | 3 | < 0.1% |
3000 | 1038 | 13.2% |
3100 | 27 | 0.3% |
6800 | 3785 | |
6804 | 13 | 0.2% |
6807 | 52 | 0.7% |
Value | Count | Frequency (%) |
22700 | 11 | 0.1% |
22200 | 1 | < 0.1% |
18300 | 687 | |
18200 | 19 | 0.2% |
16900 | 1052 | |
16400 | 5 | 0.1% |
16200 | 64 | 0.8% |
16100 | 10 | 0.1% |
15200 | 2 | < 0.1% |
14700 | 657 |
ATHRZ_INSTT_CODE
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1541213.5 |
Minimum | 1541211 |
---|---|
Maximum | 1541353 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 69.5 KiB |
Quantile statistics
Minimum | 1541211 |
---|---|
5-th percentile | 1541211 |
Q1 | 1541211 |
median | 1541214 |
Q3 | 1541214 |
95-th percentile | 1541214 |
Maximum | 1541353 |
Range | 142 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 5.5589683 |
---|---|
Coefficient of variation (CV) | 3.6068775 × 10-6 |
Kurtosis | 322.16417 |
Mean | 1541213.5 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 17.048393 |
Sum | 1.2163257 × 1010 |
Variance | 30.902128 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1541214 | 5744 | |
1541211 | 2122 | 26.9% |
1541290 | 13 | 0.2% |
1541333 | 6 | 0.1% |
1541311 | 3 | < 0.1% |
1541289 | 2 | < 0.1% |
1541303 | 1 | < 0.1% |
1541353 | 1 | < 0.1% |
Value | Count | Frequency (%) |
1541211 | 2122 | 26.9% |
1541214 | 5744 | |
1541289 | 2 | < 0.1% |
1541290 | 13 | 0.2% |
1541303 | 1 | < 0.1% |
1541311 | 3 | < 0.1% |
1541333 | 6 | 0.1% |
1541353 | 1 | < 0.1% |
Value | Count | Frequency (%) |
1541353 | 1 | < 0.1% |
1541333 | 6 | 0.1% |
1541311 | 3 | < 0.1% |
1541303 | 1 | < 0.1% |
1541290 | 13 | 0.2% |
1541289 | 2 | < 0.1% |
1541214 | 5744 | |
1541211 | 2122 | 26.9% |
REQST_DE | PRDLST | KND | PRDLC | ATHRZ_IEM | ATHRZ_INSTT | PRDLST_CODE | PRDLC_CODE | ATHRZ_INSTT_CODE | |
---|---|---|---|---|---|---|---|---|---|
REQST_DE | 1.000 | 0.758 | 0.653 | 0.530 | 0.676 | 0.604 | 0.786 | 0.444 | 0.075 |
PRDLST | 0.758 | 1.000 | 0.995 | 0.943 | 0.955 | 0.838 | 1.000 | 0.898 | 0.887 |
KND | 0.653 | 0.995 | 1.000 | 0.823 | 0.920 | 0.794 | 1.000 | 0.831 | 0.761 |
PRDLC | 0.530 | 0.943 | 0.823 | 1.000 | 0.790 | 0.244 | 0.943 | 1.000 | 0.115 |
ATHRZ_IEM | 0.676 | 0.955 | 0.920 | 0.790 | 1.000 | 0.989 | 0.960 | 0.661 | 0.977 |
ATHRZ_INSTT | 0.604 | 0.838 | 0.794 | 0.244 | 0.989 | 1.000 | 0.841 | 0.282 | 1.000 |
PRDLST_CODE | 0.786 | 1.000 | 1.000 | 0.943 | 0.960 | 0.841 | 1.000 | 0.900 | 0.900 |
PRDLC_CODE | 0.444 | 0.898 | 0.831 | 1.000 | 0.661 | 0.282 | 0.900 | 1.000 | 0.123 |
ATHRZ_INSTT_CODE | 0.075 | 0.887 | 0.761 | 0.115 | 0.977 | 1.000 | 0.900 | 0.123 | 1.000 |
ATHRZ_INSTT | ATHRZ_IEM | PRDLC | KND | |
---|---|---|---|---|
ATHRZ_INSTT | 1.000 | 0.854 | 0.103 | 0.408 |
ATHRZ_IEM | 0.854 | 1.000 | 0.310 | 0.540 |
PRDLC | 0.103 | 0.310 | 1.000 | 0.418 |
KND | 0.408 | 0.540 | 0.418 | 1.000 |
REQST_DE | PRDLC_CODE | ATHRZ_INSTT_CODE | KND | PRDLC | ATHRZ_IEM | ATHRZ_INSTT | |
---|---|---|---|---|---|---|---|
REQST_DE | 1.000 | -0.117 | -0.738 | 0.332 | 0.235 | 0.318 | 0.351 |
PRDLC_CODE | -0.117 | 1.000 | 0.173 | 0.452 | 0.999 | 0.326 | 0.097 |
ATHRZ_INSTT_CODE | -0.738 | 0.173 | 1.000 | 0.419 | 0.042 | 0.892 | 1.000 |
KND | 0.332 | 0.452 | 0.419 | 1.000 | 0.418 | 0.540 | 0.408 |
PRDLC | 0.235 | 0.999 | 0.042 | 0.418 | 1.000 | 0.310 | 0.103 |
ATHRZ_IEM | 0.318 | 0.326 | 0.892 | 0.540 | 0.310 | 1.000 | 0.854 |
ATHRZ_INSTT | 0.351 | 0.097 | 1.000 | 0.408 | 0.103 | 0.854 | 1.000 |
REQST_DE | PRDLST | KND | PRDLC | ATHRZ_IEM | ATHRZ_INSTT | REQST_SN | SPLORE_NO | PRDLST_CODE | PRDLC_CODE | ATHRZ_INSTT_CODE | |
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 20130624 | 호밀 | 맥류 | 미국 | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001252958 | SMP00000000000056366 | 020500 | 6800 | 1541214 |
1 | 20130626 | 청보리 | 농산물종자류 | 대한민국(국산) | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001253043 | SMP00000000000056553 | 153500 | 3000 | 1541214 |
2 | 20130626 | 청보리 | 농산물종자류 | 대한민국(국산) | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001253044 | SMP00000000000056554 | 153500 | 3000 | 1541214 |
3 | 20130626 | 청보리 | 농산물종자류 | 대한민국(국산) | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001253047 | SMP00000000000056557 | 153500 | 3000 | 1541214 |
4 | 20150224 | 수수 | 잡곡류 | 오스트레일리아(호주) | 이종종자, 이물, 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001262573 | SMP00000000000080191 | 040300 | 14700 | 1541214 |
5 | 20130717 | 라이그라스(페레니얼) | 사료.목초종자 | 미국 | 정립, 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001253189 | SMP00000000000056931 | 582025 | 6800 | 1541214 |
6 | 20130703 | 호밀 | 맥류 | 캐나다 | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001253191 | SMP00000000000056945 | 020500 | 18300 | 1541214 |
7 | 20130703 | 호밀 | 맥류 | 캐나다 | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001253191 | SMP00000000000056944 | 020500 | 18300 | 1541214 |
8 | 20120705 | 베치 | 조사료 | 중국 | 이종종자, 이물, 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001247104 | SMP00000000000040543 | 5602AA | 16900 | 1541214 |
9 | 20120705 | 베치 | 조사료 | 중국 | 이종종자, 이물, 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 | UCI00000000001247104 | SMP00000000000040544 | 5602AA | 16900 | 1541214 |
REQST_DE | PRDLST | KND | PRDLC | ATHRZ_IEM | ATHRZ_INSTT | REQST_SN | SPLORE_NO | PRDLST_CODE | PRDLC_CODE | ATHRZ_INSTT_CODE | |
---|---|---|---|---|---|---|---|---|---|---|---|
7882 | 20150930 | 호밀 | 맥류 | 미국 | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001265672 | SMP00000000000087918 | 020500 | 6800 | 1541211 |
7883 | 20150930 | 호밀 | 맥류 | 미국 | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001265672 | SMP00000000000087919 | 020500 | 6800 | 1541211 |
7884 | 20150930 | 호밀 | 맥류 | 미국 | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001265672 | SMP00000000000087920 | 020500 | 6800 | 1541211 |
7885 | 20150930 | 호밀 | 맥류 | 미국 | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001265672 | SMP00000000000087921 | 020500 | 6800 | 1541211 |
7886 | 20150818 | 라이그라스(이탈리안) | 사료.목초종자 | 미국 | 이종종자, 이물, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001264785 | SMP00000000000085984 | 582024 | 6800 | 1541211 |
7887 | 20160617 | 옥수수 | 잡곡류 | 대한민국(국산) | 정립, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001275992 | SMP00000000000096947 | 040100 | 3000 | 1541211 |
7888 | 20160920 | 페스큐(톨) | 조사료 | 미국 | 정립, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001290818 | SMP00000000000099995 | 560222 | 6800 | 1541211 |
7889 | 20160920 | 라이그라스(페레니얼) | 사료.목초종자 | 미국 | 정립, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001290818 | SMP00000000000099996 | 582025 | 6800 | 1541211 |
7890 | 20160920 | 페스큐(크리핑레드) | 사료.목초종자 | 미국 | 정립, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001290818 | SMP00000000000099997 | 582039 | 6800 | 1541211 |
7891 | 20160517 | 패랭이 | 화훼종자류 | 중국 | 정립, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | UCI00000000001275266 | SMP00000000000095716 | 273601 | 16900 | 1541211 |