Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 8831 |
Missing cells | 120 |
Missing cells (%) | 0.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 517.6 KiB |
Average record size in memory | 60.0 B |
Variable types
Numeric | 4 |
---|---|
Text | 1 |
Categorical | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 쌀 등 정곡에 대한 검사 실적 정보(신청년도, 시군, 연산, 용도, 원산지, 검사수량 등) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001690 |
Reproduction
Analysis started | 2024-03-23 07:43:39.420861 |
---|---|
Analysis finished | 2024-03-23 07:43:45.241771 |
Duration | 5.82 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
신청년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2015.718 |
Minimum | 2009 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 77.7 KiB |
Quantile statistics
Minimum | 2009 |
---|---|
5-th percentile | 2009 |
Q1 | 2012 |
median | 2016 |
Q3 | 2019 |
95-th percentile | 2022 |
Maximum | 2022 |
Range | 13 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 3.9734954 |
---|---|
Coefficient of variation (CV) | 0.0019712556 |
Kurtosis | -1.1671541 |
Mean | 2015.718 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.058006551 |
Sum | 17800806 |
Variance | 15.788666 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
2019 | 737 | 8.3% |
2015 | 716 | 8.1% |
2014 | 705 | 8.0% |
2022 | 694 | 7.9% |
2018 | 670 | 7.6% |
2016 | 627 | 7.1% |
2021 | 625 | 7.1% |
2020 | 603 | 6.8% |
2017 | 600 | 6.8% |
2011 | 599 | 6.8% |
Other values (4) | 2255 |
Value | Count | Frequency (%) |
2009 | 535 | |
2010 | 588 | |
2011 | 599 | |
2012 | 552 | |
2013 | 580 | |
2014 | 705 | |
2015 | 716 | |
2016 | 627 | |
2017 | 600 | |
2018 | 670 |
Value | Count | Frequency (%) |
2022 | 694 | |
2021 | 625 | |
2020 | 603 | |
2019 | 737 | |
2018 | 670 | |
2017 | 600 | |
2016 | 627 | |
2015 | 716 | |
2014 | 705 | |
2013 | 580 |
시군
Text
Distinct | 100 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 69.1 KiB |
Value | Count | Frequency (%) |
전라남도 | 1689 | 9.3% |
경상북도 | 1611 | 8.8% |
전라북도 | 1019 | 5.6% |
경상남도 | 935 | 5.1% |
경기도 | 921 | 5.1% |
충청남도 | 849 | 4.7% |
충청북도 | 758 | 4.2% |
강원도 | 644 | 3.5% |
북구 | 160 | 0.9% |
논산시 | 151 | 0.8% |
Other values (108) | 9495 |
Most occurring characters
Value | Count | Frequency (%) |
9406 | 13.1% | |
도 | 8483 | 11.8% |
시 | 4595 | 6.4% |
군 | 4356 | 6.1% |
남 | 3808 | 5.3% |
경 | 3722 | 5.2% |
북 | 3548 | 4.9% |
전 | 2874 | 4.0% |
라 | 2708 | 3.8% |
상 | 2666 | 3.7% |
Other values (84) | 25519 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 62279 | |
Space Separator | 9406 | 13.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 8483 | 13.6% |
시 | 4595 | 7.4% |
군 | 4356 | 7.0% |
남 | 3808 | 6.1% |
경 | 3722 | 6.0% |
북 | 3548 | 5.7% |
전 | 2874 | 4.6% |
라 | 2708 | 4.3% |
상 | 2666 | 4.3% |
청 | 1930 | 3.1% |
Other values (83) | 23589 |
Space Separator
Value | Count | Frequency (%) |
9406 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 62279 | |
Common | 9406 | 13.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 8483 | 13.6% |
시 | 4595 | 7.4% |
군 | 4356 | 7.0% |
남 | 3808 | 6.1% |
경 | 3722 | 6.0% |
북 | 3548 | 5.7% |
전 | 2874 | 4.6% |
라 | 2708 | 4.3% |
상 | 2666 | 4.3% |
청 | 1930 | 3.1% |
Other values (83) | 23589 |
Common
Value | Count | Frequency (%) |
9406 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 62279 | |
ASCII | 9406 | 13.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
9406 |
Hangul
Value | Count | Frequency (%) |
도 | 8483 | 13.6% |
시 | 4595 | 7.4% |
군 | 4356 | 7.0% |
남 | 3808 | 6.1% |
경 | 3722 | 6.0% |
북 | 3548 | 5.7% |
전 | 2874 | 4.6% |
라 | 2708 | 4.3% |
상 | 2666 | 4.3% |
청 | 1930 | 3.1% |
Other values (83) | 23589 |
시군구코드
Real number (ℝ)
Distinct | 46 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 502.24018 |
Minimum | 110 |
---|---|
Maximum | 900 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 77.7 KiB |
Quantile statistics
Minimum | 110 |
---|---|
5-th percentile | 113 |
Q1 | 170 |
median | 610 |
Q3 | 790 |
95-th percentile | 870 |
Maximum | 900 |
Range | 790 |
Interquartile range (IQR) | 620 |
Descriptive statistics
Standard deviation | 302.20918 |
---|---|
Coefficient of variation (CV) | 0.60172244 |
Kurtosis | -1.8130431 |
Mean | 502.24018 |
Median Absolute Deviation (MAD) | 260 |
Skewness | -0.12875996 |
Sum | 4435283 |
Variance | 91330.391 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
150 | 531 | 6.0% |
720 | 439 | 5.0% |
230 | 423 | 4.8% |
130 | 420 | 4.8% |
770 | 412 | 4.7% |
170 | 366 | 4.1% |
820 | 360 | 4.1% |
113 | 319 | 3.6% |
210 | 292 | 3.3% |
730 | 281 | 3.2% |
Other values (36) | 4988 |
Value | Count | Frequency (%) |
110 | 157 | 1.8% |
113 | 319 | |
121 | 132 | 1.5% |
130 | 420 | |
131 | 123 | 1.4% |
140 | 176 | 2.0% |
150 | 531 | |
170 | 366 | |
171 | 1 | < 0.1% |
180 | 86 | 1.0% |
Value | Count | Frequency (%) |
900 | 134 | 1.5% |
890 | 74 | 0.8% |
880 | 98 | 1.1% |
870 | 214 | |
860 | 147 | |
850 | 69 | 0.8% |
840 | 226 | |
830 | 203 | |
820 | 360 | |
810 | 235 |
연산
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 19 |
---|---|
Distinct (%) | 0.2% |
Missing | 120 |
Missing (%) | 1.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2013.6799 |
Minimum | 2004 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 77.7 KiB |
Quantile statistics
Minimum | 2004 |
---|---|
5-th percentile | 2007 |
Q1 | 2010 |
median | 2014 |
Q3 | 2017 |
95-th percentile | 2020 |
Maximum | 2022 |
Range | 18 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 4.1684905 |
---|---|
Coefficient of variation (CV) | 0.0020700859 |
Kurtosis | -0.96991186 |
Mean | 2013.6799 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.11124217 |
Sum | 17541166 |
Variance | 17.376313 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2016 | 725 | 8.2% |
2018 | 711 | 8.1% |
2014 | 680 | 7.7% |
2012 | 673 | 7.6% |
2011 | 635 | 7.2% |
2013 | 634 | 7.2% |
2008 | 611 | 6.9% |
2015 | 586 | 6.6% |
2009 | 585 | 6.6% |
2020 | 539 | 6.1% |
Other values (9) | 2332 |
Value | Count | Frequency (%) |
2004 | 3 | < 0.1% |
2005 | 189 | 2.1% |
2006 | 132 | 1.5% |
2007 | 224 | 2.5% |
2008 | 611 | |
2009 | 585 | |
2010 | 488 | |
2011 | 635 | |
2012 | 673 | |
2013 | 634 |
Value | Count | Frequency (%) |
2022 | 1 | < 0.1% |
2021 | 231 | 2.6% |
2020 | 539 | |
2019 | 532 | |
2018 | 711 | |
2017 | 532 | |
2016 | 725 | |
2015 | 586 | |
2014 | 680 | |
2013 | 634 |
용도
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 69.1 KiB |
정곡 | |
---|---|
<NA> | 31 |
대북 | 29 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0070207 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 정곡 |
---|---|
2nd row | 정곡 |
3rd row | 정곡 |
4th row | 정곡 |
5th row | 정곡 |
Common Values
Value | Count | Frequency (%) |
정곡 | 8771 | |
<NA> | 31 | 0.4% |
대북 | 29 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정곡 | 8771 | |
na | 31 | 0.4% |
대북 | 29 | 0.3% |
원산지
Categorical
Distinct | 9 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 69.1 KiB |
국산 | |
---|---|
중국 | |
미국 | |
태국 | |
베트남 | 343 |
Other values (4) | 229 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0483524 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 중국 |
---|---|
2nd row | 미국 |
3rd row | 중국 |
4th row | 국산 |
5th row | 국산 |
Common Values
Value | Count | Frequency (%) |
국산 | 4102 | |
중국 | 1831 | |
미국 | 1592 | 18.0% |
태국 | 734 | 8.3% |
베트남 | 343 | 3.9% |
호주 | 152 | 1.7% |
<NA> | 41 | 0.5% |
인도 | 35 | 0.4% |
파키스탄 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국산 | 4102 | |
중국 | 1831 | |
미국 | 1592 | 18.0% |
태국 | 734 | 8.3% |
베트남 | 343 | 3.9% |
호주 | 152 | 1.7% |
na | 41 | 0.5% |
인도 | 35 | 0.4% |
파키스탄 | 1 | < 0.1% |
검사수량
Real number (ℝ)
Distinct | 6065 |
---|---|
Distinct (%) | 68.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 946793.4 |
Minimum | 0 |
---|---|
Maximum | 20756080 |
Zeros | 2 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 77.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 11060 |
Q1 | 115160 |
median | 375600 |
Q3 | 1120235 |
95-th percentile | 3649675 |
Maximum | 20756080 |
Range | 20756080 |
Interquartile range (IQR) | 1005075 |
Descriptive statistics
Standard deviation | 1560749 |
---|---|
Coefficient of variation (CV) | 1.6484579 |
Kurtosis | 29.379719 |
Mean | 946793.4 |
Median Absolute Deviation (MAD) | 324720 |
Skewness | 4.349752 |
Sum | 8.3611325 × 109 |
Variance | 2.4359376 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100000.0 | 116 | 1.3% |
200000.0 | 79 | 0.9% |
50000.0 | 65 | 0.7% |
150000.0 | 48 | 0.5% |
10000.0 | 44 | 0.5% |
30000.0 | 42 | 0.5% |
20000.0 | 37 | 0.4% |
60000.0 | 37 | 0.4% |
80000.0 | 36 | 0.4% |
40000.0 | 35 | 0.4% |
Other values (6055) | 8292 |
Value | Count | Frequency (%) |
0.0 | 2 | |
20.0 | 1 | < 0.1% |
40.0 | 4 | |
80.0 | 3 | |
120.0 | 1 | < 0.1% |
160.0 | 1 | < 0.1% |
200.0 | 1 | < 0.1% |
320.0 | 3 | |
360.0 | 4 | |
400.0 | 4 |
Value | Count | Frequency (%) |
20756080.0 | 1 | |
20447000.0 | 1 | |
20075000.0 | 1 | |
18161280.0 | 1 | |
17180400.0 | 1 | |
16235000.0 | 1 | |
15599360.0 | 1 | |
15247240.0 | 1 | |
15087600.0 | 1 | |
15001000.0 | 1 |
신청년도 | 시군 | 시군구코드 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|---|
신청년도 | 1.000 | 0.060 | 0.000 | 0.917 | 0.231 | 0.248 | 0.242 |
시군 | 0.060 | 1.000 | 1.000 | 0.162 | 0.000 | 0.313 | 0.210 |
시군구코드 | 0.000 | 1.000 | 1.000 | 0.023 | 0.000 | 0.120 | 0.039 |
연산 | 0.917 | 0.162 | 0.023 | 1.000 | 0.301 | 0.336 | 0.214 |
용도 | 0.231 | 0.000 | 0.000 | 0.301 | 1.000 | 0.061 | 0.000 |
원산지 | 0.248 | 0.313 | 0.120 | 0.336 | 0.061 | 1.000 | 0.203 |
검사수량 | 0.242 | 0.210 | 0.039 | 0.214 | 0.000 | 0.203 | 1.000 |
용도 | 원산지 | |
---|---|---|
용도 | 1.000 | 0.046 |
원산지 | 0.046 | 1.000 |
신청년도 | 시군구코드 | 연산 | 검사수량 | 용도 | 원산지 | |
---|---|---|---|---|---|---|
신청년도 | 1.000 | 0.038 | 0.961 | 0.107 | 0.119 | 0.122 |
시군구코드 | 0.038 | 1.000 | 0.025 | 0.007 | 0.000 | 0.059 |
연산 | 0.961 | 0.025 | 1.000 | 0.105 | 0.231 | 0.167 |
검사수량 | 0.107 | 0.007 | 0.105 | 1.000 | 0.000 | 0.098 |
용도 | 0.119 | 0.000 | 0.231 | 0.000 | 1.000 | 0.046 |
원산지 | 0.122 | 0.059 | 0.167 | 0.098 | 0.046 | 1.000 |
신청년도 | 시군 | 시군구코드 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|---|
0 | 2022 | 강원도 강릉시 | 150 | 2019 | 정곡 | 중국 | 148000.0 |
1 | 2022 | 강원도 강릉시 | 150 | 2020 | 정곡 | 미국 | 1089680.0 |
2 | 2022 | 강원도 강릉시 | 150 | 2020 | 정곡 | 중국 | 1174000.0 |
3 | 2022 | 강원도 강릉시 | 150 | 2021 | 정곡 | 국산 | 774580.0 |
4 | 2022 | 강원도 고성군 | 820 | 2019 | 정곡 | 국산 | 51000.0 |
5 | 2022 | 강원도 고성군 | 820 | 2020 | 정곡 | 미국 | 593000.0 |
6 | 2022 | 강원도 고성군 | 820 | 2020 | 정곡 | 중국 | 1135000.0 |
7 | 2022 | 강원도 고성군 | 820 | 2021 | 정곡 | 국산 | 1211820.0 |
8 | 2022 | 강원도 삼척시 | 230 | 2019 | 정곡 | 중국 | 81600.0 |
9 | 2022 | 강원도 삼척시 | 230 | 2020 | 정곡 | 미국 | 1292000.0 |
신청년도 | 시군 | 시군구코드 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|---|
8821 | 2009 | 충청북도 청주시 흥덕구 | 113 | <NA> | 정곡 | 중국 | 32000.0 |
8822 | 2009 | 충청북도 청주시 흥덕구 | 113 | <NA> | 정곡 | 태국 | 7920.0 |
8823 | 2009 | 충청북도 청주시 흥덕구 | 113 | <NA> | 정곡 | <NA> | 247760.0 |
8824 | 2009 | 충청북도 충주시 | 130 | 2005 | 정곡 | 국산 | 72440.0 |
8825 | 2009 | 충청북도 충주시 | 130 | 2007 | 정곡 | 국산 | 32000.0 |
8826 | 2009 | 충청북도 충주시 | 130 | 2008 | 정곡 | 국산 | 1401240.0 |
8827 | 2009 | 충청북도 충주시 | 130 | 2008 | 정곡 | 미국 | 440280.0 |
8828 | 2009 | 충청북도 충주시 | 130 | 2008 | 정곡 | 중국 | 388920.0 |
8829 | 2009 | 충청북도 충주시 | 130 | 2008 | 정곡 | 태국 | 51040.0 |
8830 | 2009 | 충청북도 충주시 | 130 | <NA> | 정곡 | <NA> | 26440.0 |