Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 328 |
Duplicate rows (%) | 3.3% |
Total size in memory | 498.0 KiB |
Average record size in memory | 51.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 농산물우수관리(GAP) 인증농가 현황 정보(인증번호, 소재지, 품목, 재배면적, 생산계획량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20181019000000000974 |
Dataset has 328 (3.3%) duplicate rows | Duplicates |
재배면적(제곱미터) is highly overall correlated with 생산계획량(톤) | High correlation |
생산계획량(톤) is highly overall correlated with 재배면적(제곱미터) | High correlation |
생산계획량(톤) is highly skewed (γ1 = 33.87299154) | Skewed |
Reproduction
Analysis started | 2024-03-23 07:53:26.591335 |
---|---|
Analysis finished | 2024-03-23 07:53:31.782322 |
Duration | 5.19 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
인증번호
Real number (ℝ)
Distinct | 379 |
---|---|
Distinct (%) | 3.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1001367.6 |
Minimum | 1000003 |
---|---|
Maximum | 1002374 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1000003 |
---|---|
5-th percentile | 1000113 |
Q1 | 1000334 |
median | 1001573 |
Q3 | 1002348 |
95-th percentile | 1002371 |
Maximum | 1002374 |
Range | 2371 |
Interquartile range (IQR) | 2014 |
Descriptive statistics
Standard deviation | 941.6101 |
---|---|
Coefficient of variation (CV) | 0.00094032409 |
Kurtosis | -1.7581977 |
Mean | 1001367.6 |
Median Absolute Deviation (MAD) | 797 |
Skewness | -0.17114195 |
Sum | 1.0013676 × 1010 |
Variance | 886629.57 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1002352 | 986 | 9.9% |
1002370 | 429 | 4.3% |
1000471 | 346 | 3.5% |
1000058 | 283 | 2.8% |
1002344 | 253 | 2.5% |
1001688 | 249 | 2.5% |
1002372 | 231 | 2.3% |
1002335 | 207 | 2.1% |
1000113 | 195 | 1.9% |
1002232 | 193 | 1.9% |
Other values (369) | 6628 |
Value | Count | Frequency (%) |
1000003 | 4 | < 0.1% |
1000014 | 2 | < 0.1% |
1000029 | 8 | 0.1% |
1000031 | 2 | < 0.1% |
1000032 | 12 | 0.1% |
1000033 | 3 | < 0.1% |
1000034 | 5 | 0.1% |
1000035 | 6 | 0.1% |
1000041 | 19 | 0.2% |
1000058 | 283 |
Value | Count | Frequency (%) |
1002374 | 152 | 1.5% |
1002373 | 116 | 1.2% |
1002372 | 231 | |
1002371 | 97 | 1.0% |
1002370 | 429 | |
1002366 | 22 | 0.2% |
1002365 | 18 | 0.2% |
1002363 | 2 | < 0.1% |
1002359 | 6 | 0.1% |
1002357 | 4 | < 0.1% |
소재지
Text
Distinct | 94 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
강원도 | 2603 | 12.6% |
철원군 | 2527 | 12.3% |
경기도 | 2407 | 11.7% |
경상북도 | 1855 | 9.0% |
전라북도 | 1235 | 6.0% |
평택시 | 1234 | 6.0% |
전라남도 | 736 | 3.6% |
충청북도 | 592 | 2.9% |
김제시 | 512 | 2.5% |
화성시 | 374 | 1.8% |
Other values (103) | 6542 |
Most occurring characters
Value | Count | Frequency (%) |
10617 | ||
도 | 9953 | 12.8% |
원 | 5359 | 6.9% |
시 | 5295 | 6.8% |
경 | 4930 | 6.4% |
군 | 4724 | 6.1% |
북 | 3841 | 5.0% |
강 | 2622 | 3.4% |
철 | 2527 | 3.3% |
상 | 2427 | 3.1% |
Other values (85) | 25203 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 66881 | |
Space Separator | 10617 | 13.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 9953 | |
원 | 5359 | 8.0% |
시 | 5295 | 7.9% |
경 | 4930 | 7.4% |
군 | 4724 | 7.1% |
북 | 3841 | 5.7% |
강 | 2622 | 3.9% |
철 | 2527 | 3.8% |
상 | 2427 | 3.6% |
기 | 2408 | 3.6% |
Other values (84) | 22795 |
Space Separator
Value | Count | Frequency (%) |
10617 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 66881 | |
Common | 10617 | 13.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 9953 | |
원 | 5359 | 8.0% |
시 | 5295 | 7.9% |
경 | 4930 | 7.4% |
군 | 4724 | 7.1% |
북 | 3841 | 5.7% |
강 | 2622 | 3.9% |
철 | 2527 | 3.8% |
상 | 2427 | 3.6% |
기 | 2408 | 3.6% |
Other values (84) | 22795 |
Common
Value | Count | Frequency (%) |
10617 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 66881 | |
ASCII | 10617 | 13.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10617 |
Hangul
Value | Count | Frequency (%) |
도 | 9953 | |
원 | 5359 | 8.0% |
시 | 5295 | 7.9% |
경 | 4930 | 7.4% |
군 | 4724 | 7.1% |
북 | 3841 | 5.7% |
강 | 2622 | 3.9% |
철 | 2527 | 3.8% |
상 | 2427 | 3.6% |
기 | 2408 | 3.6% |
Other values (84) | 22795 |
품목
Text
Distinct | 61 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
쌀 | 4072 | |
벼 | 2121 | |
사과 | 1075 | 10.8% |
복숭아 | 672 | 6.7% |
포도 | 348 | 3.5% |
배 | 234 | 2.3% |
수박 | 208 | 2.1% |
딸기 | 112 | 1.1% |
단감 | 105 | 1.1% |
찰벼 | 95 | 0.9% |
Other values (51) | 958 | 9.6% |
Most occurring characters
Value | Count | Frequency (%) |
쌀 | 4189 | |
벼 | 2234 | |
과 | 1164 | 7.1% |
사 | 1152 | 7.1% |
복 | 672 | 4.1% |
숭 | 672 | 4.1% |
아 | 672 | 4.1% |
포 | 350 | 2.1% |
도 | 350 | 2.1% |
배 | 331 | 2.0% |
Other values (92) | 4546 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15800 | |
Close Punctuation | 266 | 1.6% |
Open Punctuation | 266 | 1.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
쌀 | 4189 | |
벼 | 2234 | |
과 | 1164 | 7.4% |
사 | 1152 | 7.3% |
복 | 672 | 4.3% |
숭 | 672 | 4.3% |
아 | 672 | 4.3% |
포 | 350 | 2.2% |
도 | 350 | 2.2% |
배 | 331 | 2.1% |
Other values (90) | 4014 |
Close Punctuation
Value | Count | Frequency (%) |
) | 266 |
Open Punctuation
Value | Count | Frequency (%) |
( | 266 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15800 | |
Common | 532 | 3.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
쌀 | 4189 | |
벼 | 2234 | |
과 | 1164 | 7.4% |
사 | 1152 | 7.3% |
복 | 672 | 4.3% |
숭 | 672 | 4.3% |
아 | 672 | 4.3% |
포 | 350 | 2.2% |
도 | 350 | 2.2% |
배 | 331 | 2.1% |
Other values (90) | 4014 |
Common
Value | Count | Frequency (%) |
) | 266 | |
( | 266 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 15800 | |
ASCII | 532 | 3.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
쌀 | 4189 | |
벼 | 2234 | |
과 | 1164 | 7.4% |
사 | 1152 | 7.3% |
복 | 672 | 4.3% |
숭 | 672 | 4.3% |
아 | 672 | 4.3% |
포 | 350 | 2.2% |
도 | 350 | 2.2% |
배 | 331 | 2.1% |
Other values (90) | 4014 |
ASCII
Value | Count | Frequency (%) |
) | 266 | |
( | 266 |
재배면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 4550 |
---|---|
Distinct (%) | 45.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2450.3831 |
Minimum | 3 |
---|---|
Maximum | 42651 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 225 |
Q1 | 1022 |
median | 2002 |
Q3 | 3401.25 |
95-th percentile | 5802.95 |
Maximum | 42651 |
Range | 42648 |
Interquartile range (IQR) | 2379.25 |
Descriptive statistics
Standard deviation | 2118.4791 |
---|---|
Coefficient of variation (CV) | 0.86455014 |
Kurtosis | 31.987938 |
Mean | 2450.3831 |
Median Absolute Deviation (MAD) | 1102 |
Skewness | 3.4943091 |
Sum | 24503831 |
Variance | 4487953.5 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4000.0 | 60 | 0.6% |
2000.0 | 34 | 0.3% |
3967.0 | 33 | 0.3% |
1000.0 | 27 | 0.3% |
3000.0 | 20 | 0.2% |
992.0 | 18 | 0.2% |
400.0 | 17 | 0.2% |
595.0 | 17 | 0.2% |
3002.0 | 16 | 0.2% |
800.0 | 16 | 0.2% |
Other values (4540) | 9742 |
Value | Count | Frequency (%) |
3.0 | 2 | |
4.0 | 1 | < 0.1% |
5.0 | 2 | |
6.0 | 1 | < 0.1% |
7.0 | 2 | |
8.0 | 1 | < 0.1% |
9.0 | 1 | < 0.1% |
10.0 | 3 | |
11.0 | 3 | |
12.0 | 3 |
Value | Count | Frequency (%) |
42651.0 | 1 | |
32545.0 | 1 | |
28321.0 | 1 | |
28133.0 | 1 | |
25418.0 | 1 | |
25346.0 | 1 | |
20069.0 | 1 | |
20000.0 | 2 | |
19786.0 | 1 | |
19543.0 | 1 |
생산계획량(톤)
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 1729 |
---|---|
Distinct (%) | 17.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.6249611 |
Minimum | 0 |
---|---|
Maximum | 591.92 |
Zeros | 23 |
Zeros (%) | 0.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0.21 |
Q1 | 1 |
median | 2.07 |
Q3 | 3.7 |
95-th percentile | 11.7335 |
Maximum | 591.92 |
Range | 591.92 |
Interquartile range (IQR) | 2.7 |
Descriptive statistics
Standard deviation | 9.4730635 |
---|---|
Coefficient of variation (CV) | 2.6132869 |
Kurtosis | 1756.2154 |
Mean | 3.6249611 |
Median Absolute Deviation (MAD) | 1.17 |
Skewness | 33.872992 |
Sum | 36249.611 |
Variance | 89.738931 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1.0 | 144 | 1.4% |
3.0 | 124 | 1.2% |
2.8 | 115 | 1.1% |
2.0 | 114 | 1.1% |
4.0 | 91 | 0.9% |
1.2 | 85 | 0.9% |
3.1 | 83 | 0.8% |
4.1 | 72 | 0.7% |
0.5 | 71 | 0.7% |
0.9 | 71 | 0.7% |
Other values (1719) | 9030 |
Value | Count | Frequency (%) |
0.0 | 23 | |
0.01 | 27 | |
0.02 | 24 | |
0.03 | 27 | |
0.04 | 19 | |
0.04989 | 1 | < 0.1% |
0.05 | 21 | |
0.06 | 21 | |
0.06435 | 1 | < 0.1% |
0.07 | 23 |
Value | Count | Frequency (%) |
591.92 | 1 | |
300.0 | 2 | |
273.93 | 1 | |
135.63 | 1 | |
130.12 | 1 | |
105.0 | 1 | |
100.0 | 1 | |
82.0 | 1 | |
75.0 | 1 | |
73.86 | 1 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
인증번호 | 1.000 | 0.958 | 0.910 | 0.065 | 0.106 |
소재지 | 0.958 | 1.000 | 0.992 | 0.162 | 0.480 |
품목 | 0.910 | 0.992 | 1.000 | 0.000 | 0.847 |
재배면적(제곱미터) | 0.065 | 0.162 | 0.000 | 1.000 | 0.464 |
생산계획량(톤) | 0.106 | 0.480 | 0.847 | 0.464 | 1.000 |
인증번호 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|
인증번호 | 1.000 | -0.012 | 0.021 |
재배면적(제곱미터) | -0.012 | 1.000 | 0.781 |
생산계획량(톤) | 0.021 | 0.781 | 1.000 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
72754 | 1002344 | 전라남도 고흥군 | 쌀 | 3826.0 | 2.77 |
72437 | 1002344 | 전라남도 고흥군 | 쌀 | 1540.0 | 1.11 |
81182 | 1002352 | 강원도 철원군 | 쌀 | 143.0 | 0.1 |
96659 | 1002372 | 강원도 철원군 | 벼 | 9541.0 | 9.8 |
93287 | 1002370 | 강원도 철원군 | 벼 | 1468.0 | 1.5 |
11224 | 1000185 | 전라북도 김제시 | 벼 | 3716.0 | 3.0 |
57678 | 1002139 | 강원도 횡성군 | 브로코리(녹색꽃양배추) | 5170.48 | 14.0 |
47291 | 1001379 | 경기도 평택시 | 대추방울 | 1057.0 | 4.8 |
75131 | 1002348 | 강원도 철원군 | 쌀 | 8258.0 | 5.97 |
5912 | 1000113 | 경기도 파주시 | 쌀 | 3883.0 | 2.81 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
65180 | 1002295 | 충청북도 음성군 | 복숭아 | 1103.0 | 1.57 |
76055 | 1002349 | 강원도 철원군 | 쌀 | 397.0 | 0.29 |
12108 | 1000190 | 전라북도 김제시 | 벼 | 4071.0 | 3.3 |
70981 | 1002344 | 전라남도 고흥군 | 쌀 | 4011.0 | 2.9 |
7935 | 1000125 | 전라북도 전주시 덕진구 | 벼 | 3422.0 | 2.6 |
81686 | 1002352 | 강원도 철원군 | 쌀 | 4684.0 | 3.39 |
5501 | 1000113 | 경기도 파주시 | 쌀 | 1558.0 | 1.13 |
40362 | 1000874 | 충청남도 논산시 | 딸기 | 3030.0 | 9.26 |
78609 | 1002351 | 강원도 철원군 | 쌀 | 4975.3 | 3.6 |
53179 | 1001688 | 경기도 연천군 | 쌀 | 1250.0 | 0.9 |
Most frequently occurring
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | # duplicates | |
---|---|---|---|---|---|---|
146 | 1002340 | 전라북도 정읍시 | 쌀 | 4000.0 | 2.8 | 26 |
42 | 1000208 | 전라북도 부안군 | 벼 | 4000.0 | 2.8 | 9 |
39 | 1000186 | 전라북도 김제시 | 벼 | 3967.0 | 3.2 | 7 |
30 | 1000125 | 전라북도 전주시 덕진구 | 벼 | 3967.0 | 2.77 | 6 |
38 | 1000186 | 전라북도 김제시 | 벼 | 3002.0 | 2.4 | 5 |
96 | 1000938 | 전라남도 담양군 | 딸기(기타) | 2280.0 | 6.97 | 5 |
147 | 1002342 | 전라북도 정읍시 | 쌀 | 3675.0 | 2.56 | 5 |
148 | 1002343 | 전라북도 정읍시 | 쌀 | 4000.0 | 2.8 | 5 |
154 | 1002344 | 전라남도 고흥군 | 쌀 | 2000.0 | 1.45 | 5 |
28 | 1000121 | 전라남도 나주시 | 벼 | 3000.0 | 2.17 | 4 |