Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 8449 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 420.9 KiB |
Average record size in memory | 51.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 1 |
Categorical | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 쌀 등 정곡에 대한 검사 실적 정보(신청년도, 시군, 연산, 용도, 원산지, 검사수량 등) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001690 |
Reproduction
Analysis started | 2024-03-23 07:42:57.737038 |
---|---|
Analysis finished | 2024-03-23 07:43:01.611474 |
Duration | 3.87 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
신청년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2015.8919 |
Minimum | 2009 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 74.4 KiB |
Quantile statistics
Minimum | 2009 |
---|---|
5-th percentile | 2010 |
Q1 | 2013 |
median | 2016 |
Q3 | 2019 |
95-th percentile | 2022 |
Maximum | 2022 |
Range | 13 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 3.7548633 |
---|---|
Coefficient of variation (CV) | 0.0018626313 |
Kurtosis | -1.164884 |
Mean | 2015.8919 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.023858296 |
Sum | 17032271 |
Variance | 14.098999 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
2019 | 737 | 8.7% |
2015 | 720 | 8.5% |
2014 | 720 | 8.5% |
2018 | 669 | 7.9% |
2010 | 648 | 7.7% |
2011 | 628 | 7.4% |
2016 | 627 | 7.4% |
2021 | 626 | 7.4% |
2020 | 603 | 7.1% |
2017 | 598 | 7.1% |
Other values (4) | 1873 |
Value | Count | Frequency (%) |
2009 | 116 | 1.4% |
2010 | 648 | |
2011 | 628 | |
2012 | 587 | |
2013 | 586 | |
2014 | 720 | |
2015 | 720 | |
2016 | 627 | |
2017 | 598 | |
2018 | 669 |
Value | Count | Frequency (%) |
2022 | 584 | |
2021 | 626 | |
2020 | 603 | |
2019 | 737 | |
2018 | 669 | |
2017 | 598 | |
2016 | 627 | |
2015 | 720 | |
2014 | 720 | |
2013 | 586 |
시군
Text
Distinct | 100 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 66.1 KiB |
Value | Count | Frequency (%) |
전라남도 | 1641 | 9.4% |
경상북도 | 1540 | 8.8% |
전라북도 | 967 | 5.5% |
경기도 | 894 | 5.1% |
경상남도 | 883 | 5.1% |
충청남도 | 808 | 4.6% |
충청북도 | 725 | 4.2% |
강원도 | 624 | 3.6% |
북구 | 152 | 0.9% |
논산시 | 142 | 0.8% |
Other values (108) | 9063 |
Most occurring characters
Value | Count | Frequency (%) |
8995 | 13.1% | |
도 | 8138 | 11.9% |
시 | 4381 | 6.4% |
군 | 4190 | 6.1% |
남 | 3655 | 5.3% |
경 | 3564 | 5.2% |
북 | 3384 | 4.9% |
전 | 2761 | 4.0% |
라 | 2608 | 3.8% |
상 | 2535 | 3.7% |
Other values (84) | 24318 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 59534 | |
Space Separator | 8995 | 13.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 8138 | 13.7% |
시 | 4381 | 7.4% |
군 | 4190 | 7.0% |
남 | 3655 | 6.1% |
경 | 3564 | 6.0% |
북 | 3384 | 5.7% |
전 | 2761 | 4.6% |
라 | 2608 | 4.4% |
상 | 2535 | 4.3% |
청 | 1840 | 3.1% |
Other values (83) | 22478 |
Space Separator
Value | Count | Frequency (%) |
8995 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 59534 | |
Common | 8995 | 13.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 8138 | 13.7% |
시 | 4381 | 7.4% |
군 | 4190 | 7.0% |
남 | 3655 | 6.1% |
경 | 3564 | 6.0% |
북 | 3384 | 5.7% |
전 | 2761 | 4.6% |
라 | 2608 | 4.4% |
상 | 2535 | 4.3% |
청 | 1840 | 3.1% |
Other values (83) | 22478 |
Common
Value | Count | Frequency (%) |
8995 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 59534 | |
ASCII | 8995 | 13.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
8995 |
Hangul
Value | Count | Frequency (%) |
도 | 8138 | 13.7% |
시 | 4381 | 7.4% |
군 | 4190 | 7.0% |
남 | 3655 | 6.1% |
경 | 3564 | 6.0% |
북 | 3384 | 5.7% |
전 | 2761 | 4.6% |
라 | 2608 | 4.4% |
상 | 2535 | 4.3% |
청 | 1840 | 3.1% |
Other values (83) | 22478 |
연산
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2013.7492 |
Minimum | 2005 |
---|---|
Maximum | 2021 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 74.4 KiB |
Quantile statistics
Minimum | 2005 |
---|---|
5-th percentile | 2007 |
Q1 | 2011 |
median | 2014 |
Q3 | 2017 |
95-th percentile | 2020 |
Maximum | 2021 |
Range | 16 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 4.0218031 |
---|---|
Coefficient of variation (CV) | 0.0019971718 |
Kurtosis | -0.9284781 |
Mean | 2013.7492 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.10491945 |
Sum | 17014167 |
Variance | 16.1749 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2016 | 722 | 8.5% |
2018 | 710 | 8.4% |
2014 | 682 | 8.1% |
2012 | 680 | 8.0% |
2011 | 651 | 7.7% |
2013 | 640 | 7.6% |
2009 | 617 | 7.3% |
2015 | 585 | 6.9% |
2010 | 534 | 6.3% |
2017 | 532 | 6.3% |
Other values (7) | 2096 |
Value | Count | Frequency (%) |
2005 | 145 | 1.7% |
2006 | 118 | 1.4% |
2007 | 178 | 2.1% |
2008 | 460 | |
2009 | 617 | |
2010 | 534 | |
2011 | 651 | |
2012 | 680 | |
2013 | 640 | |
2014 | 682 |
Value | Count | Frequency (%) |
2021 | 172 | 2.0% |
2020 | 526 | |
2019 | 497 | |
2018 | 710 | |
2017 | 532 | |
2016 | 722 | |
2015 | 585 | |
2014 | 682 | |
2013 | 640 | |
2012 | 680 |
용도
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 66.1 KiB |
정곡 | |
---|---|
<NA> | 31 |
대북 | 29 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0073381 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 정곡 |
---|---|
2nd row | 정곡 |
3rd row | 정곡 |
4th row | 정곡 |
5th row | 정곡 |
Common Values
Value | Count | Frequency (%) |
정곡 | 8389 | |
<NA> | 31 | 0.4% |
대북 | 29 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정곡 | 8389 | |
na | 31 | 0.4% |
대북 | 29 | 0.3% |
원산지
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 66.1 KiB |
국산 | |
---|---|
중국 | |
미국 | |
태국 | |
베트남 | 336 |
Other values (12) |
Length
Max length | 8 |
---|---|
Median length | 2 |
Mean length | 2.1767073 |
Min length | 2 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 국산 |
---|---|
2nd row | 미국 |
3rd row | 중국 |
4th row | 국산 |
5th row | 중국 |
Common Values
Value | Count | Frequency (%) |
국산 | 3940 | |
중국 | 1573 | 18.6% |
미국 | 1468 | 17.4% |
태국 | 667 | 7.9% |
베트남 | 336 | 4.0% |
중국(미국) | 262 | 3.1% |
호주 | 142 | 1.7% |
인도 | 34 | 0.4% |
중국(태국) | 14 | 0.2% |
중국(호주) | 4 | < 0.1% |
Other values (7) | 9 | 0.1% |
Length
Value | Count | Frequency (%) |
국산 | 3940 | |
중국 | 1573 | 18.6% |
미국 | 1468 | 17.4% |
태국 | 667 | 7.9% |
베트남 | 336 | 4.0% |
중국(미국 | 262 | 3.1% |
호주 | 142 | 1.7% |
인도 | 34 | 0.4% |
중국(태국 | 14 | 0.2% |
중국(호주 | 4 | < 0.1% |
Other values (7) | 9 | 0.1% |
검사수량
Real number (ℝ)
Distinct | 5748 |
---|---|
Distinct (%) | 68.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 927355.47 |
Minimum | 0 |
---|---|
Maximum | 20756080 |
Zeros | 1 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 74.4 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 10320 |
Q1 | 110000 |
median | 358080 |
Q3 | 1083600 |
95-th percentile | 3620876 |
Maximum | 20756080 |
Range | 20756080 |
Interquartile range (IQR) | 973600 |
Descriptive statistics
Standard deviation | 1563524.3 |
---|---|
Coefficient of variation (CV) | 1.6860032 |
Kurtosis | 30.14651 |
Mean | 927355.47 |
Median Absolute Deviation (MAD) | 308680 |
Skewness | 4.4371391 |
Sum | 7.8352263 × 109 |
Variance | 2.4446083 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100000.0 | 113 | 1.3% |
200000.0 | 73 | 0.9% |
50000.0 | 73 | 0.9% |
150000.0 | 47 | 0.6% |
30000.0 | 44 | 0.5% |
10000.0 | 43 | 0.5% |
20000.0 | 39 | 0.5% |
40000.0 | 38 | 0.4% |
60000.0 | 34 | 0.4% |
300000.0 | 34 | 0.4% |
Other values (5738) | 7911 |
Value | Count | Frequency (%) |
0.0 | 1 | < 0.1% |
20.0 | 1 | < 0.1% |
40.0 | 4 | |
80.0 | 3 | |
120.0 | 1 | < 0.1% |
200.0 | 1 | < 0.1% |
320.0 | 3 | |
360.0 | 4 | |
400.0 | 4 | |
420.0 | 1 | < 0.1% |
Value | Count | Frequency (%) |
20756080.0 | 1 | |
20377000.0 | 1 | |
19925000.0 | 1 | |
18091280.0 | 1 | |
17080400.0 | 1 | |
16155000.0 | 1 | |
15599360.0 | 1 | |
15247240.0 | 1 | |
15087600.0 | 1 | |
15001000.0 | 1 |
신청년도 | 시군 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|
신청년도 | 1.000 | 0.093 | 0.918 | 0.218 | 0.366 | 0.243 |
시군 | 0.093 | 1.000 | 0.150 | 0.000 | 0.349 | 0.193 |
연산 | 0.918 | 0.150 | 1.000 | 0.215 | 0.421 | 0.219 |
용도 | 0.218 | 0.000 | 0.215 | 1.000 | 0.038 | 0.000 |
원산지 | 0.366 | 0.349 | 0.421 | 0.038 | 1.000 | 0.202 |
검사수량 | 0.243 | 0.193 | 0.219 | 0.000 | 0.202 | 1.000 |
용도 | 원산지 | |
---|---|---|
용도 | 1.000 | 0.034 |
원산지 | 0.034 | 1.000 |
신청년도 | 연산 | 검사수량 | 용도 | 원산지 | |
---|---|---|---|---|---|
신청년도 | 1.000 | 0.959 | 0.124 | 0.151 | 0.153 |
연산 | 0.959 | 1.000 | 0.132 | 0.165 | 0.183 |
검사수량 | 0.124 | 0.132 | 1.000 | 0.000 | 0.080 |
용도 | 0.151 | 0.165 | 0.000 | 1.000 | 0.034 |
원산지 | 0.153 | 0.183 | 0.080 | 0.034 | 1.000 |
신청년도 | 시군 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|
0 | 2022 | 강원도 강릉시 | 2021 | 정곡 | 국산 | 607500.0 |
1 | 2022 | 강원도 강릉시 | 2020 | 정곡 | 미국 | 888680.0 |
2 | 2022 | 강원도 강릉시 | 2020 | 정곡 | 중국 | 601000.0 |
3 | 2022 | 강원도 고성군 | 2021 | 정곡 | 국산 | 997720.0 |
4 | 2022 | 강원도 고성군 | 2020 | 정곡 | 중국 | 140000.0 |
5 | 2022 | 강원도 고성군 | 2019 | 정곡 | 국산 | 51000.0 |
6 | 2022 | 강원도 고성군 | 2020 | 정곡 | 미국 | 593000.0 |
7 | 2022 | 강원도 삼척시 | 2021 | 정곡 | 국산 | 124440.0 |
8 | 2022 | 강원도 삼척시 | 2020 | 정곡 | 중국 | 447000.0 |
9 | 2022 | 강원도 삼척시 | 2020 | 정곡 | 미국 | 1065000.0 |
신청년도 | 시군 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|
8439 | 2009 | 충청북도 제천시 | 2008 | 정곡 | 국산 | 173240.0 |
8440 | 2009 | 충청북도 진천군 | 2008 | 정곡 | 중국(미국) | 393360.0 |
8441 | 2009 | 충청북도 진천군 | 2008 | 정곡 | 중국(태국) | 396280.0 |
8442 | 2009 | 충청북도 진천군 | 2006 | 정곡 | 국산 | 45560.0 |
8443 | 2009 | 충청북도 진천군 | 2008 | 정곡 | 미국 | 100080.0 |
8444 | 2009 | 충청북도 진천군 | 2008 | 정곡 | 중국 | 40000.0 |
8445 | 2009 | 충청북도 진천군 | 2008 | 정곡 | 태국 | 428960.0 |
8446 | 2009 | 충청북도 진천군 | 2005 | 정곡 | 국산 | 120320.0 |
8447 | 2009 | 충청북도 진천군 | 2008 | 정곡 | 국산 | 720020.0 |
8448 | 2009 | 충청북도 충주시 | 2008 | 정곡 | 국산 | 5120.0 |