Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 323 |
Duplicate rows (%) | 3.2% |
Total size in memory | 498.0 KiB |
Average record size in memory | 51.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 농산물우수관리(GAP) 인증농가 현황 정보(인증번호, 소재지, 품목, 재배면적, 생산계획량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20181019000000000974 |
Dataset has 323 (3.2%) duplicate rows | Duplicates |
재배면적(제곱미터) is highly overall correlated with 생산계획량(톤) | High correlation |
생산계획량(톤) is highly overall correlated with 재배면적(제곱미터) | High correlation |
생산계획량(톤) is highly skewed (γ1 = 58.83960284) | Skewed |
Reproduction
Analysis started | 2024-03-23 07:53:41.374114 |
---|---|
Analysis finished | 2024-03-23 07:53:45.758655 |
Duration | 4.38 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
인증번호
Real number (ℝ)
Distinct | 368 |
---|---|
Distinct (%) | 3.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1001365.9 |
Minimum | 1000003 |
---|---|
Maximum | 1002374 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1000003 |
---|---|
5-th percentile | 1000112 |
Q1 | 1000334 |
median | 1001573 |
Q3 | 1002348 |
95-th percentile | 1002371 |
Maximum | 1002374 |
Range | 2371 |
Interquartile range (IQR) | 2014 |
Descriptive statistics
Standard deviation | 949.61578 |
---|---|
Coefficient of variation (CV) | 0.00094832045 |
Kurtosis | -1.7721735 |
Mean | 1001365.9 |
Median Absolute Deviation (MAD) | 797 |
Skewness | -0.16836117 |
Sum | 1.0013659 × 1010 |
Variance | 901770.12 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1002352 | 901 | 9.0% |
1002370 | 462 | 4.6% |
1000471 | 355 | 3.5% |
1002344 | 326 | 3.3% |
1000058 | 302 | 3.0% |
1002372 | 274 | 2.7% |
1001688 | 252 | 2.5% |
1002335 | 219 | 2.2% |
1002232 | 215 | 2.1% |
1000377 | 196 | 2.0% |
Other values (358) | 6498 |
Value | Count | Frequency (%) |
1000003 | 4 | < 0.1% |
1000014 | 4 | < 0.1% |
1000029 | 9 | 0.1% |
1000031 | 8 | 0.1% |
1000032 | 8 | 0.1% |
1000033 | 2 | < 0.1% |
1000034 | 5 | 0.1% |
1000035 | 4 | < 0.1% |
1000041 | 14 | 0.1% |
1000058 | 302 |
Value | Count | Frequency (%) |
1002374 | 97 | 1.0% |
1002373 | 94 | 0.9% |
1002372 | 274 | |
1002371 | 103 | 1.0% |
1002370 | 462 | |
1002366 | 32 | 0.3% |
1002365 | 19 | 0.2% |
1002363 | 4 | < 0.1% |
1002355 | 30 | 0.3% |
1002353 | 2 | < 0.1% |
소재지
Text
Distinct | 94 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
강원도 | 2568 | 12.4% |
철원군 | 2504 | 12.1% |
경기도 | 2420 | 11.7% |
경상북도 | 1878 | 9.1% |
평택시 | 1206 | 5.8% |
전라북도 | 1128 | 5.5% |
전라남도 | 810 | 3.9% |
충청북도 | 577 | 2.8% |
김제시 | 432 | 2.1% |
상주시 | 398 | 1.9% |
Other values (103) | 6735 |
Most occurring characters
Value | Count | Frequency (%) |
10656 | ||
도 | 9957 | 12.8% |
시 | 5378 | 6.9% |
원 | 5307 | 6.8% |
경 | 5004 | 6.4% |
군 | 4635 | 6.0% |
북 | 3762 | 4.8% |
강 | 2586 | 3.3% |
철 | 2504 | 3.2% |
상 | 2485 | 3.2% |
Other values (84) | 25391 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 67009 | |
Space Separator | 10656 | 13.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 9957 | |
시 | 5378 | 8.0% |
원 | 5307 | 7.9% |
경 | 5004 | 7.5% |
군 | 4635 | 6.9% |
북 | 3762 | 5.6% |
강 | 2586 | 3.9% |
철 | 2504 | 3.7% |
상 | 2485 | 3.7% |
기 | 2422 | 3.6% |
Other values (83) | 22969 |
Space Separator
Value | Count | Frequency (%) |
10656 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 67009 | |
Common | 10656 | 13.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 9957 | |
시 | 5378 | 8.0% |
원 | 5307 | 7.9% |
경 | 5004 | 7.5% |
군 | 4635 | 6.9% |
북 | 3762 | 5.6% |
강 | 2586 | 3.9% |
철 | 2504 | 3.7% |
상 | 2485 | 3.7% |
기 | 2422 | 3.6% |
Other values (83) | 22969 |
Common
Value | Count | Frequency (%) |
10656 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 67009 | |
ASCII | 10656 | 13.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10656 |
Hangul
Value | Count | Frequency (%) |
도 | 9957 | |
시 | 5378 | 8.0% |
원 | 5307 | 7.9% |
경 | 5004 | 7.5% |
군 | 4635 | 6.9% |
북 | 3762 | 5.6% |
강 | 2586 | 3.9% |
철 | 2504 | 3.7% |
상 | 2485 | 3.7% |
기 | 2422 | 3.6% |
Other values (83) | 22969 |
품목
Text
Distinct | 58 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
쌀 | 4139 | |
벼 | 2152 | |
사과 | 1042 | 10.4% |
포도 | 546 | 5.5% |
복숭아 | 466 | 4.7% |
배 | 349 | 3.5% |
수박 | 177 | 1.8% |
단감 | 124 | 1.2% |
찰벼 | 99 | 1.0% |
딸기 | 95 | 0.9% |
Other values (48) | 811 | 8.1% |
Most occurring characters
Value | Count | Frequency (%) |
쌀 | 4139 | |
벼 | 2267 | |
과 | 1129 | 7.4% |
사 | 1122 | 7.3% |
포 | 548 | 3.6% |
도 | 548 | 3.6% |
복 | 466 | 3.0% |
숭 | 466 | 3.0% |
아 | 466 | 3.0% |
배 | 349 | 2.3% |
Other values (86) | 3803 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14981 | |
Open Punctuation | 161 | 1.1% |
Close Punctuation | 161 | 1.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
쌀 | 4139 | |
벼 | 2267 | |
과 | 1129 | 7.5% |
사 | 1122 | 7.5% |
포 | 548 | 3.7% |
도 | 548 | 3.7% |
복 | 466 | 3.1% |
숭 | 466 | 3.1% |
아 | 466 | 3.1% |
배 | 349 | 2.3% |
Other values (84) | 3481 |
Open Punctuation
Value | Count | Frequency (%) |
( | 161 |
Close Punctuation
Value | Count | Frequency (%) |
) | 161 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14981 | |
Common | 322 | 2.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
쌀 | 4139 | |
벼 | 2267 | |
과 | 1129 | 7.5% |
사 | 1122 | 7.5% |
포 | 548 | 3.7% |
도 | 548 | 3.7% |
복 | 466 | 3.1% |
숭 | 466 | 3.1% |
아 | 466 | 3.1% |
배 | 349 | 2.3% |
Other values (84) | 3481 |
Common
Value | Count | Frequency (%) |
( | 161 | |
) | 161 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14981 | |
ASCII | 322 | 2.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
쌀 | 4139 | |
벼 | 2267 | |
과 | 1129 | 7.5% |
사 | 1122 | 7.5% |
포 | 548 | 3.7% |
도 | 548 | 3.7% |
복 | 466 | 3.1% |
숭 | 466 | 3.1% |
아 | 466 | 3.1% |
배 | 349 | 2.3% |
Other values (84) | 3481 |
ASCII
Value | Count | Frequency (%) |
( | 161 | |
) | 161 |
재배면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 4645 |
---|---|
Distinct (%) | 46.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2449.8015 |
Minimum | 1 |
---|---|
Maximum | 86836 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 221 |
Q1 | 1030.75 |
median | 1998 |
Q3 | 3324 |
95-th percentile | 5795.63 |
Maximum | 86836 |
Range | 86835 |
Interquartile range (IQR) | 2293.25 |
Descriptive statistics
Standard deviation | 2361.7744 |
---|---|
Coefficient of variation (CV) | 0.96406767 |
Kurtosis | 205.73658 |
Mean | 2449.8015 |
Median Absolute Deviation (MAD) | 1069 |
Skewness | 8.3575996 |
Sum | 24498015 |
Variance | 5577978.5 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4000.0 | 58 | 0.6% |
2000.0 | 35 | 0.4% |
3967.0 | 29 | 0.3% |
3000.0 | 27 | 0.3% |
1000.0 | 26 | 0.3% |
992.0 | 16 | 0.2% |
1600.0 | 16 | 0.2% |
1322.0 | 15 | 0.1% |
2975.0 | 14 | 0.1% |
660.0 | 13 | 0.1% |
Other values (4635) | 9751 |
Value | Count | Frequency (%) |
1.0 | 1 | < 0.1% |
2.0 | 1 | < 0.1% |
3.0 | 2 | < 0.1% |
5.0 | 2 | < 0.1% |
6.0 | 1 | < 0.1% |
7.0 | 2 | < 0.1% |
8.0 | 1 | < 0.1% |
9.0 | 3 | |
10.0 | 2 | < 0.1% |
11.0 | 5 |
Value | Count | Frequency (%) |
86836.0 | 1 | |
50000.0 | 1 | |
43800.0 | 1 | |
38059.0 | 1 | |
32802.0 | 1 | |
27986.0 | 1 | |
26384.0 | 1 | |
25000.0 | 1 | |
23322.0 | 1 | |
23100.0 | 1 |
생산계획량(톤)
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 2598 |
---|---|
Distinct (%) | 26.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.9162399 |
Minimum | 0 |
---|---|
Maximum | 7605 |
Zeros | 18 |
Zeros (%) | 0.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0.221924 |
Q1 | 1.05 |
median | 2.14 |
Q3 | 4 |
95-th percentile | 12.321 |
Maximum | 7605 |
Range | 7605 |
Interquartile range (IQR) | 2.95 |
Descriptive statistics
Standard deviation | 101.25861 |
---|---|
Coefficient of variation (CV) | 17.115366 |
Kurtosis | 3856.174 |
Mean | 5.9162399 |
Median Absolute Deviation (MAD) | 1.270115 |
Skewness | 58.839603 |
Sum | 59162.399 |
Variance | 10253.306 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1.0 | 97 | 1.0% |
3.0 | 79 | 0.8% |
2.0 | 77 | 0.8% |
1.3 | 73 | 0.7% |
4.0 | 73 | 0.7% |
2.8 | 67 | 0.7% |
1.5 | 62 | 0.6% |
0.5 | 59 | 0.6% |
1.6 | 57 | 0.6% |
8.0 | 56 | 0.6% |
Other values (2588) | 9300 |
Value | Count | Frequency (%) |
0.0 | 18 | |
0.00506 | 1 | < 0.1% |
0.00795 | 1 | < 0.1% |
0.0094 | 1 | < 0.1% |
0.01 | 23 | |
0.01663 | 1 | < 0.1% |
0.02 | 18 | |
0.02024 | 1 | < 0.1% |
0.02386 | 1 | < 0.1% |
0.02603 | 1 | < 0.1% |
Value | Count | Frequency (%) |
7605.0 | 1 | |
4736.0 | 1 | |
3697.0 | 1 | |
2361.0 | 1 | |
1167.0 | 1 | |
939.0 | 1 | |
591.92 | 1 | |
494.0 | 1 | |
187.03 | 1 | |
135.98 | 2 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
인증번호 | 1.000 | 0.961 | 0.884 | 0.068 | 0.000 |
소재지 | 0.961 | 1.000 | 0.992 | 0.758 | 0.589 |
품목 | 0.884 | 0.992 | 1.000 | 0.349 | 0.726 |
재배면적(제곱미터) | 0.068 | 0.758 | 0.349 | 1.000 | 0.000 |
생산계획량(톤) | 0.000 | 0.589 | 0.726 | 0.000 | 1.000 |
인증번호 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|
인증번호 | 1.000 | -0.008 | 0.131 |
재배면적(제곱미터) | -0.008 | 1.000 | 0.774 |
생산계획량(톤) | 0.131 | 0.774 | 1.000 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
35394 | 1000471 | 경기도 평택시 | 쌀 | 1658.0 | 1.3 |
1078 | 1000058 | 경기도 화성시 | 벼 | 215.0 | 0.15544 |
3491 | 1000058 | 경기도 화성시 | 벼 | 1508.0 | 1.09028 |
91765 | 1002370 | 강원도 철원군 | 벼 | 2970.0 | 5.9 |
96409 | 1002372 | 강원도 철원군 | 벼 | 1277.0 | 2.6 |
72309 | 1002344 | 전라남도 고흥군 | 쌀 | 3826.0 | 2.7662 |
79136 | 1002351 | 강원도 철원군 | 쌀 | 1150.0 | 0.83145 |
67708 | 1002335 | 경상북도 상주시 | 포도 | 324.0 | 0.46 |
96347 | 1002372 | 강원도 철원군 | 벼 | 3990.0 | 8.0 |
60088 | 1002207 | 경상북도 상주시 | 포도 | 2866.0 | 4.82 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
17412 | 1000277 | 경상북도 문경시 | 사과(후지) | 109.0 | 0.2 |
9480 | 1000166 | 경기도 용인시 처인구 | 쌀 | 1759.0 | 1.06 |
67463 | 1002335 | 경상북도 상주시 | 포도 | 1325.0 | 2.23 |
20358 | 1000330 | 경기도 평택시 | 쌀 | 7921.0 | 5.07 |
9917 | 1000166 | 경기도 용인시 처인구 | 쌀 | 1233.0 | 0.75 |
24897 | 1000334 | 경기도 평택시 | 쌀 | 2551.0 | 1.63 |
67158 | 1002335 | 경상북도 상주시 | 포도 | 269.0 | 0.45 |
98461 | 1002373 | 강원도 철원군 | 벼 | 1704.0 | 3.4 |
74504 | 1002347 | 충청북도 진천군 | 쌀 | 1868.0 | 1.7 |
55904 | 1002025 | 인천광역시 옹진군 | 포도 | 1311.0 | 1.78 |
Most frequently occurring
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | # duplicates | |
---|---|---|---|---|---|---|
162 | 1002340 | 전라북도 정읍시 | 쌀 | 4000.0 | 2.89 | 15 |
50 | 1000208 | 전라북도 부안군 | 벼 | 4000.0 | 2.8 | 12 |
32 | 1000125 | 전라북도 전주시 덕진구 | 벼 | 3967.0 | 2.77 | 7 |
197 | 1002352 | 강원도 철원군 | 쌀 | 42.0 | 0.03 | 7 |
165 | 1002343 | 전라북도 정읍시 | 쌀 | 4000.0 | 2.89 | 6 |
167 | 1002344 | 전라남도 고흥군 | 쌀 | 2000.0 | 1.446 | 6 |
47 | 1000186 | 전라북도 김제시 | 벼 | 3967.0 | 3.2 | 5 |
29 | 1000113 | 경기도 파주시 | 쌀 | 3031.0 | 2.19 | 4 |
31 | 1000121 | 전라남도 나주시 | 벼 | 3000.0 | 2.17 | 4 |
69 | 1000360 | 경상북도 경주시 | 쌀 | 2000.0 | 1.45 | 4 |