Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 1268 |
Missing cells (%) | 1.8% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
Categorical | 3 |
---|---|
Numeric | 2 |
Text | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 하추곡검사사실적 정보(구분명, 년도, 품목, 행정구역, 업무구분, 수량단위, 수량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001693 |
실적구분명 has constant value "" | Constant |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
업무구분명 is highly overall correlated with 수량단위 | High correlation |
수량단위 is highly overall correlated with 업무구분명 | High correlation |
수량 has 1208 (12.1%) missing values | Missing |
Reproduction
Analysis started | 2023-12-11 03:47:47.449169 |
---|---|
Analysis finished | 2023-12-11 03:47:48.509570 |
Duration | 1.06 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
실적구분명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
실적 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 실적 |
---|---|
2nd row | 실적 |
3rd row | 실적 |
4th row | 실적 |
5th row | 실적 |
Common Values
Value | Count | Frequency (%) |
실적 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
실적 | 10000 |
년도
Real number (ℝ)
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2009.3197 |
Minimum | 1998 |
---|---|
Maximum | 2021 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1998 |
---|---|
5-th percentile | 1999 |
Q1 | 2004 |
median | 2009 |
Q3 | 2015 |
95-th percentile | 2019 |
Maximum | 2021 |
Range | 23 |
Interquartile range (IQR) | 11 |
Descriptive statistics
Standard deviation | 6.3726096 |
---|---|
Coefficient of variation (CV) | 0.003171526 |
Kurtosis | -1.0864441 |
Mean | 2009.3197 |
Median Absolute Deviation (MAD) | 5 |
Skewness | -0.0055113874 |
Sum | 20093197 |
Variance | 40.610153 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2006 | 586 | 5.9% |
2009 | 577 | 5.8% |
2004 | 571 | 5.7% |
2008 | 534 | 5.3% |
2007 | 532 | 5.3% |
2019 | 495 | 5.0% |
2013 | 487 | 4.9% |
2016 | 485 | 4.9% |
2005 | 436 | 4.4% |
2015 | 432 | 4.3% |
Other values (14) | 4865 |
Value | Count | Frequency (%) |
1998 | 332 | |
1999 | 372 | |
2000 | 367 | |
2001 | 295 | |
2002 | 366 | |
2003 | 328 | |
2004 | 571 | |
2005 | 436 | |
2006 | 586 | |
2007 | 532 |
Value | Count | Frequency (%) |
2021 | 27 | 0.3% |
2020 | 401 | |
2019 | 495 | |
2018 | 382 | |
2017 | 425 | |
2016 | 485 | |
2015 | 432 | |
2014 | 388 | |
2013 | 487 | |
2012 | 361 |
품목명
Text
Distinct | 83 |
---|---|
Distinct (%) | 0.8% |
Missing | 60 |
Missing (%) | 0.6% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
삼광벼 | 625 | 6.3% |
동진1호벼 | 510 | 5.1% |
새누리벼 | 490 | 4.9% |
일품벼 | 482 | 4.8% |
추청벼 | 464 | 4.7% |
일미벼 | 456 | 4.6% |
겉보리종자 | 438 | 4.4% |
쌀보리종자 | 400 | 4.0% |
남평벼 | 383 | 3.9% |
기타(2군 | 382 | 3.8% |
Other values (73) | 5310 |
Most occurring characters
Value | Count | Frequency (%) |
벼 | 6262 | 15.8% |
종 | 2265 | 5.7% |
리 | 1858 | 4.7% |
보 | 1479 | 3.7% |
( | 1335 | 3.4% |
) | 1335 | 3.4% |
대 | 1332 | 3.4% |
자 | 1312 | 3.3% |
일 | 1236 | 3.1% |
콩 | 1204 | 3.0% |
Other values (83) | 19996 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 36036 | |
Open Punctuation | 1335 | 3.4% |
Close Punctuation | 1335 | 3.4% |
Decimal Number | 908 | 2.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
벼 | 6262 | 17.4% |
종 | 2265 | 6.3% |
리 | 1858 | 5.2% |
보 | 1479 | 4.1% |
대 | 1332 | 3.7% |
자 | 1312 | 3.6% |
일 | 1236 | 3.4% |
콩 | 1204 | 3.3% |
미 | 1079 | 3.0% |
광 | 965 | 2.7% |
Other values (79) | 17044 |
Decimal Number
Value | Count | Frequency (%) |
1 | 519 | |
2 | 389 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1335 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1335 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 36036 | |
Common | 3578 | 9.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
벼 | 6262 | 17.4% |
종 | 2265 | 6.3% |
리 | 1858 | 5.2% |
보 | 1479 | 4.1% |
대 | 1332 | 3.7% |
자 | 1312 | 3.6% |
일 | 1236 | 3.4% |
콩 | 1204 | 3.3% |
미 | 1079 | 3.0% |
광 | 965 | 2.7% |
Other values (79) | 17044 |
Common
Value | Count | Frequency (%) |
( | 1335 | |
) | 1335 | |
1 | 519 | 14.5% |
2 | 389 | 10.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 36036 | |
ASCII | 3578 | 9.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
벼 | 6262 | 17.4% |
종 | 2265 | 6.3% |
리 | 1858 | 5.2% |
보 | 1479 | 4.1% |
대 | 1332 | 3.7% |
자 | 1312 | 3.6% |
일 | 1236 | 3.4% |
콩 | 1204 | 3.3% |
미 | 1079 | 3.0% |
광 | 965 | 2.7% |
Other values (79) | 17044 |
ASCII
Value | Count | Frequency (%) |
( | 1335 | |
) | 1335 | |
1 | 519 | 14.5% |
2 | 389 | 10.9% |
행정구역명
Text
Distinct | 184 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
전라남도 | 1885 | 9.5% |
경상북도 | 1460 | 7.3% |
경상남도 | 1337 | 6.7% |
충청남도 | 1071 | 5.4% |
전라북도 | 1035 | 5.2% |
강원도 | 923 | 4.6% |
충청북도 | 688 | 3.5% |
경기도 | 664 | 3.3% |
광주광역시 | 168 | 0.8% |
인천광역시 | 160 | 0.8% |
Other values (178) | 10521 |
Most occurring characters
Value | Count | Frequency (%) |
10000 | 12.7% | |
도 | 9324 | 11.8% |
군 | 5734 | 7.3% |
남 | 4663 | 5.9% |
시 | 4657 | 5.9% |
경 | 3634 | 4.6% |
북 | 3272 | 4.1% |
전 | 3119 | 3.9% |
라 | 2920 | 3.7% |
상 | 2885 | 3.7% |
Other values (117) | 28811 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 69019 | |
Space Separator | 10000 | 12.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 9324 | 13.5% |
군 | 5734 | 8.3% |
남 | 4663 | 6.8% |
시 | 4657 | 6.7% |
경 | 3634 | 5.3% |
북 | 3272 | 4.7% |
전 | 3119 | 4.5% |
라 | 2920 | 4.2% |
상 | 2885 | 4.2% |
청 | 2085 | 3.0% |
Other values (116) | 26726 |
Space Separator
Value | Count | Frequency (%) |
10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 69019 | |
Common | 10000 | 12.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 9324 | 13.5% |
군 | 5734 | 8.3% |
남 | 4663 | 6.8% |
시 | 4657 | 6.7% |
경 | 3634 | 5.3% |
북 | 3272 | 4.7% |
전 | 3119 | 4.5% |
라 | 2920 | 4.2% |
상 | 2885 | 4.2% |
청 | 2085 | 3.0% |
Other values (116) | 26726 |
Common
Value | Count | Frequency (%) |
10000 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 69019 | |
ASCII | 10000 | 12.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10000 |
Hangul
Value | Count | Frequency (%) |
도 | 9324 | 13.5% |
군 | 5734 | 8.3% |
남 | 4663 | 6.8% |
시 | 4657 | 6.7% |
경 | 3634 | 5.3% |
북 | 3272 | 4.7% |
전 | 3119 | 4.5% |
라 | 2920 | 4.2% |
상 | 2885 | 4.2% |
청 | 2085 | 3.0% |
Other values (116) | 26726 |
업무구분명
Categorical
HIGH CORRELATION
 
Distinct | 15 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
공공비축벼 포대벼검사(40kg) | |
---|---|
공공비축벼 검사(산물) | |
공공비축벼 포대벼검사(800kg) | |
잡곡검사(콩 | |
하곡검사 포대벼검사(40kg) | |
Other values (10) | 327 |
Length
Max length | 20 |
---|---|
Median length | 19 |
Mean length | 14.5001 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 잡곡검사(콩 |
---|---|
2nd row | 공공비축벼 검사(산물) |
3rd row | 공공비축벼 포대벼검사(800kg) |
4th row | 잡곡검사(콩 |
5th row | 공공비축벼 포대벼검사(40kg) |
Common Values
Value | Count | Frequency (%) |
공공비축벼 포대벼검사(40kg) | 3650 | |
공공비축벼 검사(산물) | 2090 | |
공공비축벼 포대벼검사(800kg) | 1619 | |
잡곡검사(콩 | 1201 | 12.0% |
하곡검사 포대벼검사(40kg) | 1113 | 11.1% |
농협시가매입(시장격리곡)(800kg) | 80 | 0.8% |
비축농산물 | 60 | 0.6% |
하곡검사 (산물) | 50 | 0.5% |
콩(40kg) | 42 | 0.4% |
농협시가매입(시장격리곡) | 33 | 0.3% |
Other values (5) | 62 | 0.6% |
Length
Value | Count | Frequency (%) |
공공비축벼 | 7359 | |
포대벼검사(40kg | 4763 | |
검사(산물 | 2090 | 11.3% |
포대벼검사(800kg | 1619 | 8.7% |
잡곡검사(콩 | 1201 | 6.5% |
하곡검사 | 1163 | 6.3% |
농협시가매입(시장격리곡)(800kg | 80 | 0.4% |
비축농산물 | 60 | 0.3% |
산물 | 50 | 0.3% |
콩(40kg | 42 | 0.2% |
Other values (6) | 95 | 0.5% |
수량단위
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
40kg/대 | |
---|---|
800kg/대 | |
<NA> | |
20Kg/대 | 57 |
10Kg/대 | 3 |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 5.9283 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | 40kg/대 |
3rd row | 800kg/대 |
4th row | <NA> |
5th row | 40kg/대 |
Common Values
Value | Count | Frequency (%) |
40kg/대 | 7033 | |
800kg/대 | 1699 | 17.0% |
<NA> | 1208 | 12.1% |
20Kg/대 | 57 | 0.6% |
10Kg/대 | 3 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
40kg/대 | 7033 | |
800kg/대 | 1699 | 17.0% |
na | 1208 | 12.1% |
20kg/대 | 57 | 0.6% |
10kg/대 | 3 | < 0.1% |
수량
Real number (ℝ)
MISSING
 
Distinct | 6526 |
---|---|
Distinct (%) | 74.2% |
Missing | 1208 |
Missing (%) | 12.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 121388 |
Minimum | 1 |
---|---|
Maximum | 10544000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 46 |
Q1 | 766 |
median | 4971 |
Q3 | 30790.5 |
95-th percentile | 565556 |
Maximum | 10544000 |
Range | 10543999 |
Interquartile range (IQR) | 30024.5 |
Descriptive statistics
Standard deviation | 530025.22 |
---|---|
Coefficient of variation (CV) | 4.3663725 |
Kurtosis | 99.514056 |
Mean | 121388 |
Median Absolute Deviation (MAD) | 4857 |
Skewness | 8.7271766 |
Sum | 1.0672433 × 109 |
Variance | 2.8092673 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10.0 | 21 | 0.2% |
20.0 | 18 | 0.2% |
16.0 | 15 | 0.1% |
100.0 | 15 | 0.1% |
30.0 | 15 | 0.1% |
35.0 | 14 | 0.1% |
5.0 | 14 | 0.1% |
8.0 | 14 | 0.1% |
50.0 | 13 | 0.1% |
26.0 | 13 | 0.1% |
Other values (6516) | 8640 | |
(Missing) | 1208 | 12.1% |
Value | Count | Frequency (%) |
1.0 | 12 | |
2.0 | 9 | |
3.0 | 8 | 0.1% |
4.0 | 7 | 0.1% |
5.0 | 14 | |
6.0 | 10 | |
7.0 | 10 | |
8.0 | 14 | |
9.0 | 12 | |
10.0 | 21 |
Value | Count | Frequency (%) |
10544000.0 | 1 | |
8813640.0 | 1 | |
8745280.0 | 1 | |
8146880.0 | 1 | |
7620520.0 | 1 | |
7564800.0 | 1 | |
7338040.0 | 1 | |
7292520.0 | 1 | |
7179160.0 | 1 | |
7098800.0 | 1 |
년도 | 품목명 | 업무구분명 | 수량단위 | 수량 | |
---|---|---|---|---|---|
년도 | 1.000 | 0.828 | 0.581 | 0.414 | 0.289 |
품목명 | 0.828 | 1.000 | 0.925 | 0.435 | 0.284 |
업무구분명 | 0.581 | 0.925 | 1.000 | 0.929 | 0.235 |
수량단위 | 0.414 | 0.435 | 0.929 | 1.000 | 0.066 |
수량 | 0.289 | 0.284 | 0.235 | 0.066 | 1.000 |
업무구분명 | 수량단위 | |
---|---|---|
업무구분명 | 1.000 | 0.816 |
수량단위 | 0.816 | 1.000 |
년도 | 수량 | 업무구분명 | 수량단위 | |
---|---|---|---|---|
년도 | 1.000 | -0.361 | 0.260 | 0.264 |
수량 | -0.361 | 1.000 | 0.097 | 0.039 |
업무구분명 | 0.260 | 0.097 | 1.000 | 0.816 |
수량단위 | 0.264 | 0.039 | 0.816 | 1.000 |
실적구분명 | 년도 | 품목명 | 행정구역명 | 업무구분명 | 수량단위 | 수량 | |
---|---|---|---|---|---|---|---|
17404 | 실적 | 2002 | 논콩(대립종) | 경상북도 영주시 | 잡곡검사(콩 | <NA> | <NA> |
7538 | 실적 | 2012 | 삼광벼 | 충청남도 예산군 | 공공비축벼 검사(산물) | 40kg/대 | 3157.0 |
2355 | 실적 | 2018 | 오대벼 | 강원도 삼척시 | 공공비축벼 포대벼검사(800kg) | 800kg/대 | 80.0 |
13840 | 실적 | 2006 | 밭콩(대립종) | 전라남도 무안군 | 잡곡검사(콩 | <NA> | <NA> |
14407 | 실적 | 2006 | 화영벼 | 경상북도 포항시 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 3898.0 |
1066 | 실적 | 2019 | 삼광벼 | 충청북도 괴산군 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 6392.0 |
12686 | 실적 | 2007 | 밭콩(대립종) | 충청북도 괴산군 | 잡곡검사(콩 | <NA> | <NA> |
1767 | 실적 | 2019 | 해담쌀벼 | 전라북도 진안군 | 공공비축벼 포대벼검사(800kg) | 800kg/대 | 864.0 |
10181 | 실적 | 2009 | 동진1호벼 | 충청남도 청양군 | 공공비축벼 포대벼검사(800kg) | 800kg/대 | 101.0 |
16433 | 실적 | 2004 | 주남벼 | 경상북도 칠곡군 | 공공비축벼 검사(산물) | 40kg/대 | 597640.0 |
실적구분명 | 년도 | 품목명 | 행정구역명 | 업무구분명 | 수량단위 | 수량 | |
---|---|---|---|---|---|---|---|
12365 | 실적 | 2007 | 논콩(소립종) | 전라남도 신안군 | 잡곡검사(콩 | <NA> | <NA> |
5200 | 실적 | 2015 | 운광벼 | 경상북도 의성군 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 73236.0 |
17166 | 실적 | 2003 | 밭콩(소립종) | 전라남도 완도군 | 잡곡검사(콩 | <NA> | <NA> |
10285 | 실적 | 2009 | 삼광벼 | 세종특별자치시 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 35348.0 |
2745 | 실적 | 2017 | 삼광벼 | 경상북도 경산시 | 공공비축벼 포대벼검사(800kg) | 800kg/대 | 101.0 |
18618 | 실적 | 2000 | 겉보리종자 | 경상북도 고령군 | 하곡검사 포대벼검사(40kg) | 40kg/대 | 6086.0 |
17982 | 실적 | 2002 | 쌀보리종자 | 전라북도 김제시 | 하곡검사 (산물) | 40kg/대 | 840760.0 |
361 | 실적 | 2020 | 새일미벼 | 전라북도 익산시 | 공공비축벼 포대벼검사(800kg) | 800kg/대 | 2707.0 |
17430 | 실적 | 2002 | 논콩(대립종) | 전라남도 장흥군 | 잡곡검사(콩 | <NA> | <NA> |
978 | 실적 | 2019 | 삼광벼 | 경상북도 성주군 | 공공비축벼 포대벼검사(40kg) | 40kg/대 | 5467.0 |
Most frequently occurring
실적구분명 | 년도 | 품목명 | 행정구역명 | 업무구분명 | 수량단위 | 수량 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 실적 | 2017 | 콩 | 전라북도 익산시 | 잡곡검사(콩 | <NA> | <NA> | 2 |