Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 15 |
Missing cells (%) | < 0.1% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
Categorical | 3 |
---|---|
Numeric | 2 |
Text | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 하추곡검사사실적 정보(구분명, 년도, 품목, 행정구역, 업무구분, 수량단위, 수량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001693 |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
JOB_SE_NM is highly overall correlated with QY_UNIT | High correlation |
QY_UNIT is highly overall correlated with JOB_SE_NM | High correlation |
QY_UNIT is highly imbalanced (69.6%) | Imbalance |
Reproduction
Analysis started | 2023-12-11 03:47:41.362131 |
---|---|
Analysis finished | 2023-12-11 03:47:42.412641 |
Duration | 1.05 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
PLAN_ACMSLT_SE_NM
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
실적 | |
---|---|
계획 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 실적 |
---|---|
2nd row | 실적 |
3rd row | 계획 |
4th row | 실적 |
5th row | 실적 |
Common Values
Value | Count | Frequency (%) |
실적 | 6461 | |
계획 | 3539 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
실적 | 6461 | |
계획 | 3539 |
YEAR
Real number (ℝ)
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2006.5755 |
Minimum | 1998 |
---|---|
Maximum | 2015 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1998 |
---|---|
5-th percentile | 1999 |
Q1 | 2003 |
median | 2007 |
Q3 | 2010 |
95-th percentile | 2015 |
Maximum | 2015 |
Range | 17 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 4.8207493 |
---|---|
Coefficient of variation (CV) | 0.0024024759 |
Kurtosis | -0.96690945 |
Mean | 2006.5755 |
Median Absolute Deviation (MAD) | 4 |
Skewness | -0.0038027532 |
Sum | 20065755 |
Variance | 23.239624 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2006 | 812 | 8.1% |
2004 | 767 | 7.7% |
2008 | 735 | 7.3% |
2009 | 720 | 7.2% |
2007 | 685 | 6.9% |
2005 | 643 | 6.4% |
2000 | 532 | 5.3% |
1999 | 530 | 5.3% |
2013 | 526 | 5.3% |
2010 | 516 | 5.2% |
Other values (8) | 3534 |
Value | Count | Frequency (%) |
1998 | 379 | |
1999 | 530 | |
2000 | 532 | |
2001 | 412 | |
2002 | 480 | |
2003 | 415 | |
2004 | 767 | |
2005 | 643 | |
2006 | 812 | |
2007 | 685 |
Value | Count | Frequency (%) |
2015 | 516 | |
2014 | 444 | |
2013 | 526 | |
2012 | 394 | |
2011 | 494 | |
2010 | 516 | |
2009 | 720 | |
2008 | 735 | |
2007 | 685 | |
2006 | 812 |
PRDLST_NM
Text
Distinct | 63 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
벼 | 1947 | |
겉보리 | 736 | 7.4% |
쌀보리 | 709 | 7.1% |
옥수수 | 645 | 6.5% |
동진1호벼 | 425 | 4.2% |
일미벼 | 371 | 3.7% |
추청벼 | 353 | 3.5% |
남평벼 | 345 | 3.5% |
기타(2군 | 344 | 3.4% |
일품벼 | 332 | 3.3% |
Other values (53) | 3793 |
Most occurring characters
Value | Count | Frequency (%) |
벼 | 5912 | 18.2% |
리 | 2193 | 6.7% |
보 | 1836 | 5.6% |
수 | 1360 | 4.2% |
) | 1330 | 4.1% |
( | 1330 | 4.1% |
콩 | 1002 | 3.1% |
일 | 899 | 2.8% |
종 | 819 | 2.5% |
립 | 805 | 2.5% |
Other values (76) | 15035 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29081 | |
Close Punctuation | 1330 | 4.1% |
Open Punctuation | 1330 | 4.1% |
Decimal Number | 780 | 2.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
벼 | 5912 | |
리 | 2193 | 7.5% |
보 | 1836 | 6.3% |
수 | 1360 | 4.7% |
콩 | 1002 | 3.4% |
일 | 899 | 3.1% |
종 | 819 | 2.8% |
립 | 805 | 2.8% |
대 | 760 | 2.6% |
겉 | 736 | 2.5% |
Other values (72) | 12759 |
Decimal Number
Value | Count | Frequency (%) |
1 | 429 | |
2 | 351 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1330 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1330 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29081 | |
Common | 3440 | 10.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
벼 | 5912 | |
리 | 2193 | 7.5% |
보 | 1836 | 6.3% |
수 | 1360 | 4.7% |
콩 | 1002 | 3.4% |
일 | 899 | 3.1% |
종 | 819 | 2.8% |
립 | 805 | 2.8% |
대 | 760 | 2.6% |
겉 | 736 | 2.5% |
Other values (72) | 12759 |
Common
Value | Count | Frequency (%) |
) | 1330 | |
( | 1330 | |
1 | 429 | 12.5% |
2 | 351 | 10.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29081 | |
ASCII | 3440 | 10.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
벼 | 5912 | |
리 | 2193 | 7.5% |
보 | 1836 | 6.3% |
수 | 1360 | 4.7% |
콩 | 1002 | 3.4% |
일 | 899 | 3.1% |
종 | 819 | 2.8% |
립 | 805 | 2.8% |
대 | 760 | 2.6% |
겉 | 736 | 2.5% |
Other values (72) | 12759 |
ASCII
Value | Count | Frequency (%) |
) | 1330 | |
( | 1330 | |
1 | 429 | 12.5% |
2 | 351 | 10.2% |
ADMINIST_ZONE_NM
Text
Distinct | 239 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
전라남도 | 1814 | 9.0% |
경상남도 | 1430 | 7.1% |
경상북도 | 1429 | 7.1% |
전라북도 | 1036 | 5.1% |
충청남도 | 1033 | 5.1% |
강원도 | 823 | 4.1% |
경기도 | 816 | 4.0% |
충청북도 | 636 | 3.1% |
광주광역시 | 203 | 1.0% |
인천광역시 | 160 | 0.8% |
Other values (228) | 10820 |
Most occurring characters
Value | Count | Frequency (%) |
10249 | 12.8% | |
도 | 9312 | 11.6% |
군 | 5673 | 7.1% |
시 | 4703 | 5.9% |
남 | 4692 | 5.9% |
경 | 3853 | 4.8% |
북 | 3247 | 4.1% |
전 | 3055 | 3.8% |
상 | 2946 | 3.7% |
라 | 2850 | 3.6% |
Other values (126) | 29395 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 69726 | |
Space Separator | 10249 | 12.8% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 9312 | 13.4% |
군 | 5673 | 8.1% |
시 | 4703 | 6.7% |
남 | 4692 | 6.7% |
경 | 3853 | 5.5% |
북 | 3247 | 4.7% |
전 | 3055 | 4.4% |
상 | 2946 | 4.2% |
라 | 2850 | 4.1% |
청 | 2001 | 2.9% |
Other values (125) | 27394 |
Space Separator
Value | Count | Frequency (%) |
10249 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 69726 | |
Common | 10249 | 12.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 9312 | 13.4% |
군 | 5673 | 8.1% |
시 | 4703 | 6.7% |
남 | 4692 | 6.7% |
경 | 3853 | 5.5% |
북 | 3247 | 4.7% |
전 | 3055 | 4.4% |
상 | 2946 | 4.2% |
라 | 2850 | 4.1% |
청 | 2001 | 2.9% |
Other values (125) | 27394 |
Common
Value | Count | Frequency (%) |
10249 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 69726 | |
ASCII | 10249 | 12.8% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10249 |
Hangul
Value | Count | Frequency (%) |
도 | 9312 | 13.4% |
군 | 5673 | 8.1% |
시 | 4703 | 6.7% |
남 | 4692 | 6.7% |
경 | 3853 | 5.5% |
북 | 3247 | 4.7% |
전 | 3055 | 4.4% |
상 | 2946 | 4.2% |
라 | 2850 | 4.1% |
청 | 2001 | 2.9% |
Other values (125) | 27394 |
JOB_SE_NM
Categorical
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
공공비축벼 포대벼검사(40kg) | |
---|---|
공공비축벼 검사(산물) | |
하곡검사 포대벼검사(40kg) | |
잡곡검사(콩, 옥수수) | |
공공비축벼 포대벼검사(800kg) | |
Other values (4) |
Length
Max length | 25 |
---|---|
Median length | 18 |
Mean length | 15.335 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 하곡검사 포대벼검사(40kg) |
---|---|
2nd row | 잡곡검사(콩, 옥수수) |
3rd row | 공공비축벼 포대벼검사(40kg),(800kg) |
4th row | 하곡검사 포대벼검사(40kg) |
5th row | 공공비축벼 포대벼검사(40kg) |
Common Values
Value | Count | Frequency (%) |
공공비축벼 포대벼검사(40kg) | 3275 | |
공공비축벼 검사(산물) | 1987 | |
하곡검사 포대벼검사(40kg) | 1889 | |
잡곡검사(콩, 옥수수) | 1520 | |
공공비축벼 포대벼검사(800kg) | 758 | 7.6% |
공공비축벼 포대벼검사(40kg),(800kg) | 413 | 4.1% |
하곡검사 (산물) | 99 | 1.0% |
농협시가매입 | 42 | 0.4% |
애프터매입벼검사(800kg) | 17 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
공공비축벼 | 6433 | |
포대벼검사(40kg | 5164 | |
하곡검사 | 1988 | 10.0% |
검사(산물 | 1987 | 10.0% |
잡곡검사(콩 | 1520 | 7.6% |
옥수수 | 1520 | 7.6% |
포대벼검사(800kg | 758 | 3.8% |
포대벼검사(40kg),(800kg | 413 | 2.1% |
산물 | 99 | 0.5% |
농협시가매입 | 42 | 0.2% |
QY_UNIT
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
40kg/대 | |
---|---|
800kg/대 | 698 |
Kg | 627 |
800kg/톤백 | 65 |
<NA> | 28 |
Length
Max length | 8 |
---|---|
Median length | 6 |
Mean length | 5.8243 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 40kg/대 |
---|---|
2nd row | 40kg/대 |
3rd row | Kg |
4th row | 40kg/대 |
5th row | 40kg/대 |
Common Values
Value | Count | Frequency (%) |
40kg/대 | 8575 | |
800kg/대 | 698 | 7.0% |
Kg | 627 | 6.3% |
800kg/톤백 | 65 | 0.7% |
<NA> | 28 | 0.3% |
Ton | 7 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
40kg/대 | 8575 | |
800kg/대 | 698 | 7.0% |
kg | 627 | 6.3% |
800kg/톤백 | 65 | 0.7% |
na | 28 | 0.3% |
ton | 7 | 0.1% |
QY
Real number (ℝ)
Distinct | 6887 |
---|---|
Distinct (%) | 69.0% |
Missing | 15 |
Missing (%) | 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 242273.56 |
Minimum | 0 |
---|---|
Maximum | 18049800 |
Zeros | 36 |
Zeros (%) | 0.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 31 |
Q1 | 532 |
median | 5690 |
Q3 | 57244 |
95-th percentile | 1200000 |
Maximum | 18049800 |
Range | 18049800 |
Interquartile range (IQR) | 56712 |
Descriptive statistics
Standard deviation | 1003600.6 |
---|---|
Coefficient of variation (CV) | 4.1424272 |
Kurtosis | 75.675664 |
Mean | 242273.56 |
Median Absolute Deviation (MAD) | 5641 |
Skewness | 7.6266833 |
Sum | 2.4191015 × 109 |
Variance | 1.0072141 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 36 | 0.4% |
10 | 26 | 0.3% |
50 | 26 | 0.3% |
5 | 24 | 0.2% |
20 | 23 | 0.2% |
2 | 20 | 0.2% |
25 | 20 | 0.2% |
30 | 19 | 0.2% |
13 | 19 | 0.2% |
3 | 19 | 0.2% |
Other values (6877) | 9753 |
Value | Count | Frequency (%) |
0 | 36 | |
1 | 17 | |
2 | 20 | |
3 | 19 | |
4 | 16 | |
5 | 24 | |
6 | 16 | |
7 | 19 | |
8 | 19 | |
9 | 16 |
Value | Count | Frequency (%) |
18049800 | 1 | |
16398720 | 1 | |
15554560 | 1 | |
15230640 | 1 | |
15024840 | 1 | |
12771080 | 1 | |
12643870 | 1 | |
12594440 | 1 | |
12338880 | 1 | |
12200680 | 1 |
PLAN_ACMSLT_SE_NM | YEAR | PRDLST_NM | JOB_SE_NM | QY_UNIT | QY | |
---|---|---|---|---|---|---|
PLAN_ACMSLT_SE_NM | 1.000 | 0.212 | 0.938 | 0.374 | 0.337 | 0.197 |
YEAR | 0.212 | 1.000 | 0.702 | 0.466 | 0.425 | 0.209 |
PRDLST_NM | 0.938 | 0.702 | 1.000 | 0.880 | 0.588 | 0.223 |
JOB_SE_NM | 0.374 | 0.466 | 0.880 | 1.000 | 0.793 | 0.285 |
QY_UNIT | 0.337 | 0.425 | 0.588 | 0.793 | 1.000 | 0.562 |
QY | 0.197 | 0.209 | 0.223 | 0.285 | 0.562 | 1.000 |
PLAN_ACMSLT_SE_NM | QY_UNIT | JOB_SE_NM | |
---|---|---|---|
PLAN_ACMSLT_SE_NM | 1.000 | 0.411 | 0.374 |
QY_UNIT | 0.411 | 1.000 | 0.617 |
JOB_SE_NM | 0.374 | 0.617 | 1.000 |
YEAR | QY | PLAN_ACMSLT_SE_NM | JOB_SE_NM | QY_UNIT | |
---|---|---|---|---|---|
YEAR | 1.000 | -0.117 | 0.159 | 0.237 | 0.192 |
QY | -0.117 | 1.000 | 0.151 | 0.133 | 0.267 |
PLAN_ACMSLT_SE_NM | 0.159 | 0.151 | 1.000 | 0.374 | 0.411 |
JOB_SE_NM | 0.237 | 0.133 | 0.374 | 1.000 | 0.617 |
QY_UNIT | 0.192 | 0.267 | 0.411 | 0.617 | 1.000 |
PLAN_ACMSLT_SE_NM | YEAR | PRDLST_NM | ADMINIST_ZONE_NM | JOB_SE_NM | QY_UNIT | QY | |
---|---|---|---|---|---|---|---|
12190 | 실적 | 2004 | 밀 | 전라북도 김제시 | 하곡검사 포대벼검사(40kg) | 40kg/대 | 2100 |
10205 | 실적 | 2001 | 밭콩(소립종) | 전라남도 영광군 | 잡곡검사(콩, 옥수수) | 40kg/대 | 8 |
24544 | 계획 | 2013 | 벼 | 광주광역시 동구 | 공공비축벼 포대벼검사(40kg),(800kg) | Kg | 4000 |
19577 | 실적 | 2008 | 겉보리 | 전라북도 김제시 | 하곡검사 포대벼검사(40kg) | 40kg/대 | 33274 |
6282 | 실적 | 2013 | 황금누리벼 | 전라북도 순창군 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 16897 |
12003 | 실적 | 2002 | 논콩(대립종) | 충청북도 괴산군 | 잡곡검사(콩, 옥수수) | 40kg/대 | 7672 |
6960 | 계획 | 2001 | 옥수수 | 강원도 횡성군 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 638 |
1567 | 실적 | 2012 | 삼광벼 | 충청남도 서산시 | 공공비축벼 검사(산물) | 40kg/대 | 1878 |
4685 | 실적 | 2012 | 호품벼 | 충청북도 음성군 | 공공비축벼 검사(산물) | 40kg/대 | 21272 |
1867 | 계획 | 2003 | 벼 | 충청남도 서천군 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 177790 |
PLAN_ACMSLT_SE_NM | YEAR | PRDLST_NM | ADMINIST_ZONE_NM | JOB_SE_NM | QY_UNIT | QY | |
---|---|---|---|---|---|---|---|
13018 | 실적 | 2000 | 기타(2군) | 전라남도 보성군 | 공공비축벼 검사(산물) | 40kg/대 | 6108918 |
21795 | 계획 | 2011 | 벼 | 전라북도 남원시 | 공공비축벼 포대벼검사(40kg),(800kg) | 40kg/대 | 144141 |
23457 | 계획 | 2006 | 옥수수 | 경상북도 문경시 | 잡곡검사(콩, 옥수수) | 40kg/대 | 16755 |
22415 | 계획 | 2008 | 옥수수 | 충청북도 제천시 | 잡곡검사(콩, 옥수수) | 40kg/대 | 5 |
15874 | 실적 | 2007 | 동진1호벼 | 경상남도 고성군 | 공공비축벼 검사(산물) | 40kg/대 | 762240 |
24371 | 계획 | 2009 | 벼 | 경상북도 칠곡군 | 공공비축벼 포대벼검사(800kg) | 800kg/톤백 | 500 |
19545 | 실적 | 2006 | 화영벼 | 경상북도 울진군 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 3640 |
19412 | 실적 | 2005 | 추청벼 | 경기도 남양주시 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 3046 |
14764 | 실적 | 1999 | 기타(2군) | 제주도 남제주군 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 546 |
2515 | 계획 | 2002 | 벼 | 전라남도 장흥군 | 공공비축벼 검사(산물) | Kg | 4853000 |
Most frequently occurring
PLAN_ACMSLT_SE_NM | YEAR | PRDLST_NM | ADMINIST_ZONE_NM | JOB_SE_NM | QY_UNIT | QY | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 계획 | 2013 | 콩(일반) | 충청남도 홍성군 | 잡곡검사(콩, 옥수수) | <NA> | <NA> | 2 |