Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 7942 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 937 |
Duplicate rows (%) | 11.8% |
Total size in memory | 380.2 KiB |
Average record size in memory | 49.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 1 |
Categorical | 4 |
Dataset
Description | 검정업무(농산물, 원산지,우수식품, LMO, 술품질인증) 통합 관리 정보(신청일자, 품목, 종류, 생산지, 검정항목, 검정기관 등) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001680 |
Dataset has 937 (11.8%) duplicate rows | Duplicates |
종류 is highly overall correlated with 검정항목 | High correlation |
검정항목 is highly overall correlated with 종류 and 1 other fields | High correlation |
검정기관 is highly overall correlated with 검정항목 | High correlation |
검정항목 is highly imbalanced (50.5%) | Imbalance |
검정기관 is highly imbalanced (70.6%) | Imbalance |
Reproduction
Analysis started | 2024-03-23 07:35:18.731482 |
---|---|
Analysis finished | 2024-03-23 07:35:20.879757 |
Duration | 2.15 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
신청일자
Real number (ℝ)
Distinct | 657 |
---|---|
Distinct (%) | 8.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20135102 |
Minimum | 20100108 |
---|---|
Maximum | 20230208 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 69.9 KiB |
Quantile statistics
Minimum | 20100108 |
---|---|
5-th percentile | 20100727 |
Q1 | 20120510 |
median | 20131007 |
Q3 | 20150624 |
95-th percentile | 20170213 |
Maximum | 20230208 |
Range | 130100 |
Interquartile range (IQR) | 30114 |
Descriptive statistics
Standard deviation | 23199.515 |
---|---|
Coefficient of variation (CV) | 0.0011521926 |
Kurtosis | 1.3110942 |
Mean | 20135102 |
Median Absolute Deviation (MAD) | 19202 |
Skewness | 0.79298963 |
Sum | 1.5991298 × 1011 |
Variance | 5.3821748 × 108 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
20120712 | 85 | 1.1% |
20160719 | 79 | 1.0% |
20130715 | 78 | 1.0% |
20110808 | 71 | 0.9% |
20140710 | 69 | 0.9% |
20201211 | 67 | 0.8% |
20150629 | 67 | 0.8% |
20191126 | 66 | 0.8% |
20160725 | 63 | 0.8% |
20160829 | 62 | 0.8% |
Other values (647) | 7235 |
Value | Count | Frequency (%) |
20100108 | 15 | |
20100128 | 8 | 0.1% |
20100129 | 1 | < 0.1% |
20100204 | 27 | |
20100205 | 30 | |
20100210 | 18 | |
20100219 | 9 | 0.1% |
20100224 | 6 | 0.1% |
20100303 | 1 | < 0.1% |
20100309 | 6 | 0.1% |
Value | Count | Frequency (%) |
20230208 | 1 | < 0.1% |
20230110 | 11 | 0.1% |
20221216 | 38 | |
20220113 | 19 | 0.2% |
20211220 | 22 | 0.3% |
20210422 | 1 | < 0.1% |
20210107 | 8 | 0.1% |
20201211 | 67 | |
20200214 | 2 | < 0.1% |
20200213 | 2 | < 0.1% |
품목
Text
Distinct | 74 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 62.2 KiB |
Value | Count | Frequency (%) |
호밀 | 1914 | |
라이그라스(이탈리안 | 954 | |
베치 | 701 | 8.8% |
청보리 | 660 | 8.3% |
수단그라스 | 614 | 7.7% |
콩나물콩 | 344 | 4.3% |
귀리 | 274 | 3.5% |
옥수수 | 272 | 3.4% |
페스큐(톨 | 254 | 3.2% |
금계국 | 188 | 2.4% |
Other values (64) | 1767 |
Most occurring characters
Value | Count | Frequency (%) |
라 | 3124 | 9.0% |
스 | 2500 | 7.2% |
이 | 2461 | 7.1% |
리 | 2107 | 6.0% |
그 | 1988 | 5.7% |
밀 | 1962 | 5.6% |
호 | 1914 | 5.5% |
( | 1620 | 4.6% |
) | 1620 | 4.6% |
수 | 1431 | 4.1% |
Other values (124) | 14166 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31653 | |
Open Punctuation | 1620 | 4.6% |
Close Punctuation | 1620 | 4.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
라 | 3124 | 9.9% |
스 | 2500 | 7.9% |
이 | 2461 | 7.8% |
리 | 2107 | 6.7% |
그 | 1988 | 6.3% |
밀 | 1962 | 6.2% |
호 | 1914 | 6.0% |
수 | 1431 | 4.5% |
탈 | 954 | 3.0% |
안 | 954 | 3.0% |
Other values (122) | 12258 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1620 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1620 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31653 | |
Common | 3240 | 9.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
라 | 3124 | 9.9% |
스 | 2500 | 7.9% |
이 | 2461 | 7.8% |
리 | 2107 | 6.7% |
그 | 1988 | 6.3% |
밀 | 1962 | 6.2% |
호 | 1914 | 6.0% |
수 | 1431 | 4.5% |
탈 | 954 | 3.0% |
안 | 954 | 3.0% |
Other values (122) | 12258 |
Common
Value | Count | Frequency (%) |
( | 1620 | |
) | 1620 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31653 | |
ASCII | 3240 | 9.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
라 | 3124 | 9.9% |
스 | 2500 | 7.9% |
이 | 2461 | 7.8% |
리 | 2107 | 6.7% |
그 | 1988 | 6.3% |
밀 | 1962 | 6.2% |
호 | 1914 | 6.0% |
수 | 1431 | 4.5% |
탈 | 954 | 3.0% |
안 | 954 | 3.0% |
Other values (122) | 12258 |
ASCII
Value | Count | Frequency (%) |
( | 1620 | |
) | 1620 |
종류
Categorical
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 62.2 KiB |
사료.목초종자 | |
---|---|
맥류 | |
농산물종자류 | |
조사료 | |
화훼종자류 | |
Other values (11) |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 4.5119617 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 두류 |
---|---|
2nd row | 두류 |
3rd row | 두류 |
4th row | 두류 |
5th row | 두류 |
Common Values
Value | Count | Frequency (%) |
사료.목초종자 | 2247 | |
맥류 | 1839 | |
농산물종자류 | 1203 | |
조사료 | 1190 | |
화훼종자류 | 686 | 8.6% |
두류 | 419 | 5.3% |
잡곡류 | 154 | 1.9% |
산림종묘 | 73 | 0.9% |
LMO농산물 | 60 | 0.8% |
미곡류 | 39 | 0.5% |
Other values (6) | 32 | 0.4% |
Length
Value | Count | Frequency (%) |
사료.목초종자 | 2247 | |
맥류 | 1839 | |
농산물종자류 | 1203 | |
조사료 | 1190 | |
화훼종자류 | 686 | 8.6% |
두류 | 419 | 5.3% |
잡곡류 | 154 | 1.9% |
산림종묘 | 73 | 0.9% |
lmo농산물 | 60 | 0.8% |
미곡류 | 39 | 0.5% |
Other values (6) | 32 | 0.4% |
생산지
Categorical
Distinct | 22 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 62.2 KiB |
미국 | |
---|---|
대한민국(국산) | |
중국 | |
캐나다 | |
오스트레일리아(호주) | |
Other values (17) |
Length
Max length | 11 |
---|---|
Median length | 2 |
Mean length | 3.9328884 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 중국 |
---|---|
2nd row | 중국 |
3rd row | 중국 |
4th row | 중국 |
5th row | 중국 |
Common Values
Value | Count | Frequency (%) |
미국 | 3785 | |
대한민국(국산) | 1088 | 13.7% |
중국 | 1052 | 13.2% |
캐나다 | 687 | 8.7% |
오스트레일리아(호주) | 657 | 8.3% |
남아프리카공화국 | 271 | 3.4% |
<NA> | 105 | 1.3% |
인도 | 64 | 0.8% |
오리건주 | 52 | 0.7% |
스페인 | 32 | 0.4% |
Other values (12) | 149 | 1.9% |
Length
Value | Count | Frequency (%) |
미국 | 3785 | |
대한민국(국산 | 1088 | 13.7% |
중국 | 1052 | 13.2% |
캐나다 | 687 | 8.7% |
오스트레일리아(호주 | 657 | 8.3% |
남아프리카공화국 | 271 | 3.4% |
na | 105 | 1.3% |
인도 | 64 | 0.8% |
오리건주 | 52 | 0.7% |
스페인 | 32 | 0.4% |
Other values (12) | 149 | 1.9% |
검정항목
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 40 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 62.2 KiB |
이종종자, 이물, 발아율 | |
---|---|
이종종자, 이물, 발아율, 수분 | |
정립, 발아율 | |
발아율 | |
정립, 발아율, 수분 | |
Other values (35) |
Length
Max length | 95 |
---|---|
Median length | 66 |
Mean length | 10.864644 |
Min length | 2 |
Unique
Unique | 11 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 발아율 |
---|---|
2nd row | 발아율 |
3rd row | 발아율 |
4th row | 발아율 |
5th row | 발아율 |
Common Values
Value | Count | Frequency (%) |
이종종자, 이물, 발아율 | 2225 | |
이종종자, 이물, 발아율, 수분 | 1718 | |
정립, 발아율 | 1609 | |
발아율 | 1290 | |
정립, 발아율, 수분 | 607 | 7.6% |
정립, 이물, 발아율 | 141 | 1.8% |
정립, 이종종자, 발아율 | 90 | 1.1% |
수분 | 77 | 1.0% |
이물, 발아율 | 23 | 0.3% |
이물, 싸라기, 색택, 수분 | 18 | 0.2% |
Other values (30) | 144 | 1.8% |
Length
Value | Count | Frequency (%) |
발아율 | 7759 | |
이물 | 4202 | |
이종종자 | 4037 | |
수분 | 2528 | 11.8% |
정립 | 2460 | 11.5% |
파쇄립 | 42 | 0.2% |
피해립 | 28 | 0.1% |
순도 | 26 | 0.1% |
다른종피색 | 24 | 0.1% |
변질률 | 24 | 0.1% |
Other values (21) | 233 | 1.1% |
검정기관
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 62.2 KiB |
국립농산물품질관리원 시험연구소 원산지검정과 | |
---|---|
국립농산물품질관리원 시험연구소 품질조사과 | |
국립농산물품질관리원 전남지원 유통관리과 | 13 |
국립농산물품질관리원 경남지원 유통관리과 | 6 |
국립농산물품질관리원 경북지원 유통관리과 | 3 |
Other values (3) | 4 |
Length
Max length | 23 |
---|---|
Median length | 23 |
Mean length | 22.71997 |
Min length | 21 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 국립농산물품질관리원 시험연구소 원산지검정과 |
---|---|
2nd row | 국립농산물품질관리원 시험연구소 원산지검정과 |
3rd row | 국립농산물품질관리원 시험연구소 원산지검정과 |
4th row | 국립농산물품질관리원 시험연구소 원산지검정과 |
5th row | 국립농산물품질관리원 시험연구소 원산지검정과 |
Common Values
Value | Count | Frequency (%) |
국립농산물품질관리원 시험연구소 원산지검정과 | 5744 | |
국립농산물품질관리원 시험연구소 품질조사과 | 2172 | 27.3% |
국립농산물품질관리원 전남지원 유통관리과 | 13 | 0.2% |
국립농산물품질관리원 경남지원 유통관리과 | 6 | 0.1% |
국립농산물품질관리원 경북지원 유통관리과 | 3 | < 0.1% |
국립농산물품질관리원 전남지원 품질관리과 | 2 | < 0.1% |
국립농산물품질관리원 충북지원 유통관리과 | 1 | < 0.1% |
국립농산물품질관리원 전남지원 영광사무소 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국립농산물품질관리원 | 7942 | |
시험연구소 | 7916 | |
원산지검정과 | 5744 | |
품질조사과 | 2172 | 9.1% |
유통관리과 | 23 | 0.1% |
전남지원 | 16 | 0.1% |
경남지원 | 6 | < 0.1% |
경북지원 | 3 | < 0.1% |
품질관리과 | 2 | < 0.1% |
충북지원 | 1 | < 0.1% |
신청일자 | 품목 | 종류 | 생산지 | 검정항목 | 검정기관 | |
---|---|---|---|---|---|---|
신청일자 | 1.000 | 0.761 | 0.659 | 0.531 | 0.712 | 0.551 |
품목 | 0.761 | 1.000 | 0.995 | 0.942 | 0.955 | 0.839 |
종류 | 0.659 | 0.995 | 1.000 | 0.824 | 0.920 | 0.795 |
생산지 | 0.531 | 0.942 | 0.824 | 1.000 | 0.790 | 0.243 |
검정항목 | 0.712 | 0.955 | 0.920 | 0.790 | 1.000 | 0.990 |
검정기관 | 0.551 | 0.839 | 0.795 | 0.243 | 0.990 | 1.000 |
검정항목 | 종류 | 생산지 | 검정기관 | |
---|---|---|---|---|
검정항목 | 1.000 | 0.538 | 0.310 | 0.855 |
종류 | 0.538 | 1.000 | 0.418 | 0.410 |
생산지 | 0.310 | 0.418 | 1.000 | 0.102 |
검정기관 | 0.855 | 0.410 | 0.102 | 1.000 |
신청일자 | 종류 | 생산지 | 검정항목 | 검정기관 | |
---|---|---|---|---|---|
신청일자 | 1.000 | 0.324 | 0.226 | 0.309 | 0.302 |
종류 | 0.324 | 1.000 | 0.418 | 0.538 | 0.410 |
생산지 | 0.226 | 0.418 | 1.000 | 0.310 | 0.102 |
검정항목 | 0.309 | 0.538 | 0.310 | 1.000 | 0.855 |
검정기관 | 0.302 | 0.410 | 0.102 | 0.855 | 1.000 |
신청일자 | 품목 | 종류 | 생산지 | 검정항목 | 검정기관 | |
---|---|---|---|---|---|---|
0 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
1 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
2 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
3 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
4 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
5 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
6 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
7 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
8 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
9 | 20100108 | 콩나물콩 | 두류 | 중국 | 발아율 | 국립농산물품질관리원 시험연구소 원산지검정과 |
신청일자 | 품목 | 종류 | 생산지 | 검정항목 | 검정기관 | |
---|---|---|---|---|---|---|
7932 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7933 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7934 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7935 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7936 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7937 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7938 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7939 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7940 | 20230110 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 |
7941 | 20230208 | 현미 | 미곡류 | 대한민국(국산) | 수분 | 국립농산물품질관리원 시험연구소 품질조사과 |
Most frequently occurring
신청일자 | 품목 | 종류 | 생산지 | 검정항목 | 검정기관 | # duplicates | |
---|---|---|---|---|---|---|---|
931 | 20201211 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | 67 |
922 | 20191126 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | 66 |
874 | 20160829 | 라이그라스(이탈리안) | 사료.목초종자 | 미국 | 이종종자, 이물, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | 60 |
313 | 20120712 | 청보리 | 농산물종자류 | 대한민국(국산) | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | 47 |
840 | 20160713 | 호밀 | 맥류 | 미국 | 이종종자, 이물, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | 45 |
36 | 20100709 | 청보리 | 농산물종자류 | 대한민국(국산) | 정립, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | 44 |
50 | 20100726 | 청보리 | 농산물종자류 | 대한민국(국산) | 정립, 발아율, 수분 | 국립농산물품질관리원 시험연구소 원산지검정과 | 44 |
851 | 20160725 | 호밀 | 맥류 | 미국 | 이종종자, 이물, 발아율, 수분 | 국립농산물품질관리원 시험연구소 품질조사과 | 43 |
935 | 20221216 | 콩나물콩 | 두류 | 대한민국(국산) | 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | 38 |
810 | 20160128 | 옥수수 | 잡곡류 | 미국 | 이종종자, 이물, 발아율 | 국립농산물품질관리원 시험연구소 품질조사과 | 37 |