Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 120 |
Missing cells (%) | 0.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 576.2 KiB |
Average record size in memory | 59.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 1 |
Categorical | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 쌀 등 정곡에 대한 검사 실적 정보(신청년도, 시군, 연산, 용도, 원산지, 검사수량 등) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001690 |
Reproduction
Analysis started | 2024-03-23 07:44:35.153273 |
---|---|
Analysis finished | 2024-03-23 07:44:39.392293 |
Duration | 4.24 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
신청년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.6471 |
Minimum | 2009 |
---|---|
Maximum | 2024 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2009 |
---|---|
5-th percentile | 2009 |
Q1 | 2013 |
median | 2017 |
Q3 | 2021 |
95-th percentile | 2023 |
Maximum | 2024 |
Range | 15 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 4.4754402 |
---|---|
Coefficient of variation (CV) | 0.0022192481 |
Kurtosis | -1.1808102 |
Mean | 2016.6471 |
Median Absolute Deviation (MAD) | 4 |
Skewness | -0.070336722 |
Sum | 20166471 |
Variance | 20.029565 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2023 | 787 | 7.9% |
2022 | 765 | 7.6% |
2019 | 732 | 7.3% |
2015 | 711 | 7.1% |
2014 | 699 | 7.0% |
2018 | 666 | 6.7% |
2016 | 621 | 6.2% |
2021 | 618 | 6.2% |
2020 | 596 | 6.0% |
2011 | 595 | 5.9% |
Other values (6) | 3210 |
Value | Count | Frequency (%) |
2009 | 534 | |
2010 | 583 | |
2011 | 595 | |
2012 | 547 | |
2013 | 575 | |
2014 | 699 | |
2015 | 711 | |
2016 | 621 | |
2017 | 595 | |
2018 | 666 |
Value | Count | Frequency (%) |
2024 | 376 | |
2023 | 787 | |
2022 | 765 | |
2021 | 618 | |
2020 | 596 | |
2019 | 732 | |
2018 | 666 | |
2017 | 595 | |
2016 | 621 | |
2015 | 711 |
시군
Text
Distinct | 100 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 15 |
---|---|
Median length | 8 |
Mean length | 8.7572 |
Min length | 7 |
Characters and Unicode
Total characters | 87572 |
---|---|
Distinct characters | 94 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 경상남도 합천군 |
---|---|
2nd row | 전북특별자치도 군산시 |
3rd row | 전라남도 담양군 |
4th row | 전라남도 화순군 |
5th row | 전북특별자치도 김제시 |
Value | Count | Frequency (%) |
전라남도 | 1928 | 9.3% |
경상북도 | 1819 | 8.8% |
전북특별자치도 | 1184 | 5.7% |
경상남도 | 1094 | 5.3% |
경기도 | 1030 | 5.0% |
충청남도 | 957 | 4.6% |
충청북도 | 834 | 4.0% |
강원특별자치도 | 712 | 3.5% |
북구 | 175 | 0.8% |
논산시 | 172 | 0.8% |
Other values (108) | 10730 |
Most occurring characters
Value | Count | Frequency (%) |
10646 | 12.2% | |
도 | 9638 | 11.0% |
시 | 5155 | 5.9% |
군 | 4984 | 5.7% |
남 | 4350 | 5.0% |
경 | 4221 | 4.8% |
북 | 4012 | 4.6% |
전 | 3295 | 3.8% |
상 | 3048 | 3.5% |
청 | 2168 | 2.5% |
Other values (84) | 36055 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 76926 | |
Space Separator | 10646 | 12.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 9638 | 12.5% |
시 | 5155 | 6.7% |
군 | 4984 | 6.5% |
남 | 4350 | 5.7% |
경 | 4221 | 5.5% |
북 | 4012 | 5.2% |
전 | 3295 | 4.3% |
상 | 3048 | 4.0% |
청 | 2168 | 2.8% |
별 | 1940 | 2.5% |
Other values (83) | 34115 |
Space Separator
Value | Count | Frequency (%) |
10646 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 76926 | |
Common | 10646 | 12.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 9638 | 12.5% |
시 | 5155 | 6.7% |
군 | 4984 | 6.5% |
남 | 4350 | 5.7% |
경 | 4221 | 5.5% |
북 | 4012 | 5.2% |
전 | 3295 | 4.3% |
상 | 3048 | 4.0% |
청 | 2168 | 2.8% |
별 | 1940 | 2.5% |
Other values (83) | 34115 |
Common
Value | Count | Frequency (%) |
10646 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 76926 | |
ASCII | 10646 | 12.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10646 |
Hangul
Value | Count | Frequency (%) |
도 | 9638 | 12.5% |
시 | 5155 | 6.7% |
군 | 4984 | 6.5% |
남 | 4350 | 5.7% |
경 | 4221 | 5.5% |
북 | 4012 | 5.2% |
전 | 3295 | 4.3% |
상 | 3048 | 4.0% |
청 | 2168 | 2.8% |
별 | 1940 | 2.5% |
Other values (83) | 34115 |
연산
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 20 |
---|---|
Distinct (%) | 0.2% |
Missing | 120 |
Missing (%) | 1.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2014.6002 |
Minimum | 2004 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2004 |
---|---|
5-th percentile | 2007 |
Q1 | 2011 |
median | 2015 |
Q3 | 2018 |
95-th percentile | 2022 |
Maximum | 2023 |
Range | 19 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 4.6213086 |
---|---|
Coefficient of variation (CV) | 0.0022939086 |
Kurtosis | -1.0150978 |
Mean | 2014.6002 |
Median Absolute Deviation (MAD) | 4 |
Skewness | -0.12617413 |
Sum | 19904250 |
Variance | 21.356494 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2018 | 749 | 7.5% |
2016 | 721 | 7.2% |
2020 | 697 | 7.0% |
2014 | 675 | 6.8% |
2012 | 668 | 6.7% |
2011 | 632 | 6.3% |
2021 | 628 | 6.3% |
2019 | 628 | 6.3% |
2013 | 627 | 6.3% |
2008 | 605 | 6.0% |
Other values (10) | 3250 |
Value | Count | Frequency (%) |
2004 | 3 | < 0.1% |
2005 | 189 | 1.9% |
2006 | 132 | 1.3% |
2007 | 221 | 2.2% |
2008 | 605 | |
2009 | 580 | |
2010 | 484 | |
2011 | 632 | |
2012 | 668 | |
2013 | 627 |
Value | Count | Frequency (%) |
2023 | 114 | 1.1% |
2022 | 398 | |
2021 | 628 | |
2020 | 697 | |
2019 | 628 | |
2018 | 749 | |
2017 | 547 | |
2016 | 721 | |
2015 | 582 | |
2014 | 675 |
용도
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
정곡 | |
---|---|
<NA> | 30 |
대북 | 29 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.006 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 정곡 |
---|---|
2nd row | 정곡 |
3rd row | 정곡 |
4th row | 정곡 |
5th row | 정곡 |
Common Values
Value | Count | Frequency (%) |
정곡 | 9941 | |
<NA> | 30 | 0.3% |
대북 | 29 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정곡 | 9941 | |
na | 30 | 0.3% |
대북 | 29 | 0.3% |
원산지
Categorical
Distinct | 9 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
국산 | |
---|---|
중국 | |
미국 | |
태국 | |
베트남 | 413 |
Other values (4) | 287 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0497 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 국산 |
---|---|
2nd row | 국산 |
3rd row | 국산 |
4th row | 중국 |
5th row | 미국 |
Common Values
Value | Count | Frequency (%) |
국산 | 4663 | |
중국 | 2187 | |
미국 | 1644 | 16.4% |
태국 | 806 | 8.1% |
베트남 | 413 | 4.1% |
호주 | 209 | 2.1% |
<NA> | 41 | 0.4% |
인도 | 36 | 0.4% |
파키스탄 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국산 | 4663 | |
중국 | 2187 | |
미국 | 1644 | 16.4% |
태국 | 806 | 8.1% |
베트남 | 413 | 4.1% |
호주 | 209 | 2.1% |
na | 41 | 0.4% |
인도 | 36 | 0.4% |
파키스탄 | 1 | < 0.1% |
검사수량
Real number (ℝ)
Distinct | 6604 |
---|---|
Distinct (%) | 66.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 938211.23 |
Minimum | 0 |
---|---|
Maximum | 20756080 |
Zeros | 44 |
Zeros (%) | 0.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 9560 |
Q1 | 111990 |
median | 375620 |
Q3 | 1118462.5 |
95-th percentile | 3613973 |
Maximum | 20756080 |
Range | 20756080 |
Interquartile range (IQR) | 1006472.5 |
Descriptive statistics
Standard deviation | 1530953.1 |
---|---|
Coefficient of variation (CV) | 1.6317787 |
Kurtosis | 28.856746 |
Mean | 938211.23 |
Median Absolute Deviation (MAD) | 325620 |
Skewness | 4.276798 |
Sum | 9.3821123 × 109 |
Variance | 2.3438174 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100000.0 | 129 | 1.3% |
200000.0 | 83 | 0.8% |
50000.0 | 70 | 0.7% |
60000.0 | 49 | 0.5% |
10000.0 | 49 | 0.5% |
150000.0 | 48 | 0.5% |
0.0 | 44 | 0.4% |
30000.0 | 44 | 0.4% |
40000.0 | 40 | 0.4% |
80000.0 | 40 | 0.4% |
Other values (6594) | 9404 |
Value | Count | Frequency (%) |
0.0 | 44 | |
20.0 | 1 | < 0.1% |
40.0 | 4 | < 0.1% |
80.0 | 4 | < 0.1% |
120.0 | 1 | < 0.1% |
160.0 | 1 | < 0.1% |
200.0 | 2 | < 0.1% |
269.0 | 1 | < 0.1% |
296.0 | 1 | < 0.1% |
320.0 | 3 | < 0.1% |
Value | Count | Frequency (%) |
20756080.0 | 1 | |
20447000.0 | 1 | |
20075000.0 | 1 | |
18161280.0 | 1 | |
17180400.0 | 1 | |
16235000.0 | 1 | |
15599360.0 | 1 | |
15247240.0 | 1 | |
15087600.0 | 1 | |
15001000.0 | 1 |
신청년도 | 시군 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|
신청년도 | 1.000 | 0.159 | 0.927 | 0.235 | 0.244 | 0.236 |
시군 | 0.159 | 1.000 | 0.197 | 0.000 | 0.316 | 0.221 |
연산 | 0.927 | 0.197 | 1.000 | 0.304 | 0.308 | 0.217 |
용도 | 0.235 | 0.000 | 0.304 | 1.000 | 0.057 | 0.000 |
원산지 | 0.244 | 0.316 | 0.308 | 0.057 | 1.000 | 0.199 |
검사수량 | 0.236 | 0.221 | 0.217 | 0.000 | 0.199 | 1.000 |
용도 | 원산지 | |
---|---|---|
용도 | 1.000 | 0.043 |
원산지 | 0.043 | 1.000 |
신청년도 | 연산 | 검사수량 | 용도 | 원산지 | |
---|---|---|---|---|---|
신청년도 | 1.000 | 0.968 | 0.065 | 0.122 | 0.120 |
연산 | 0.968 | 1.000 | 0.076 | 0.233 | 0.152 |
검사수량 | 0.065 | 0.076 | 1.000 | 0.000 | 0.096 |
용도 | 0.122 | 0.233 | 0.000 | 1.000 | 0.043 |
원산지 | 0.120 | 0.152 | 0.096 | 0.043 | 1.000 |
신청년도 | 시군 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|
2126 | 2021 | 경상남도 합천군 | 2019 | 정곡 | 국산 | 33000.0 |
275 | 2024 | 전북특별자치도 군산시 | 2022 | 정곡 | 국산 | 1078400.0 |
6195 | 2015 | 전라남도 담양군 | 2013 | 정곡 | 국산 | 121000.0 |
9357 | 2010 | 전라남도 화순군 | 2008 | 정곡 | 중국 | 106000.0 |
3007 | 2020 | 전북특별자치도 김제시 | 2018 | 정곡 | 미국 | 9000.0 |
6215 | 2015 | 전라남도 목포시 | 2014 | 정곡 | 중국 | 62920.0 |
6627 | 2014 | 경기도 평택시 | 2013 | 정곡 | 미국 | 147000.0 |
9919 | 2009 | 전북특별자치도 군산시 | 2007 | 정곡 | 미국 | 4000.0 |
9838 | 2009 | 전라남도 곡성군 | 2008 | 정곡 | 미국 | 156520.0 |
10070 | 2009 | 충청북도 청주시 흥덕구 | <NA> | 정곡 | 태국 | 7920.0 |
신청년도 | 시군 | 연산 | 용도 | 원산지 | 검사수량 | |
---|---|---|---|---|---|---|
3142 | 2020 | 충청북도 옥천군 | 2019 | 정곡 | 국산 | 2625190.0 |
9179 | 2010 | 경상북도 영천시 | 2007 | <NA> | 국산 | 93240.0 |
4692 | 2017 | 경상남도 고성군 | 2013 | 정곡 | 국산 | 3397000.0 |
2061 | 2021 | 경상남도 산청군 | 2017 | 정곡 | 국산 | 479000.0 |
4561 | 2018 | 충청북도 청주시 흥덕구 | 2015 | 정곡 | 미국 | 140000.0 |
4639 | 2017 | 경기도 안성시 | 2016 | 정곡 | 미국 | 775000.0 |
5907 | 2015 | 경기도 평택시 | 2013 | 정곡 | 중국 | 1928240.0 |
3652 | 2019 | 전라남도 영암군 | 2017 | 정곡 | 미국 | 36000.0 |
7729 | 2013 | 충청남도 서산시 | 2010 | 정곡 | 국산 | 230000.0 |
5128 | 2017 | 충청남도 홍성군 | 2015 | 정곡 | 태국 | 2000.0 |