Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 319 |
Duplicate rows (%) | 3.2% |
Total size in memory | 498.0 KiB |
Average record size in memory | 51.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 농산물우수관리(GAP) 인증농가 현황 정보(인증번호, 소재지, 품목, 재배면적, 생산계획량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20181019000000000974 |
Dataset has 319 (3.2%) duplicate rows | Duplicates |
재배면적(제곱미터) is highly overall correlated with 생산계획량(톤) | High correlation |
생산계획량(톤) is highly overall correlated with 재배면적(제곱미터) | High correlation |
생산계획량(톤) is highly skewed (γ1 = 53.34502798) | Skewed |
Reproduction
Analysis started | 2024-03-23 07:53:55.932612 |
---|---|
Analysis finished | 2024-03-23 07:53:59.951097 |
Duration | 4.02 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
인증번호
Real number (ℝ)
Distinct | 354 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1001451.2 |
Minimum | 1000003 |
---|---|
Maximum | 1002376 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1000003 |
---|---|
5-th percentile | 1000113 |
Q1 | 1000364 |
median | 1001705.5 |
Q3 | 1002351 |
95-th percentile | 1002374 |
Maximum | 1002376 |
Range | 2373 |
Interquartile range (IQR) | 1987 |
Descriptive statistics
Standard deviation | 939.35231 |
---|---|
Coefficient of variation (CV) | 0.00093799112 |
Kurtosis | -1.6918355 |
Mean | 1001451.2 |
Median Absolute Deviation (MAD) | 664.5 |
Skewness | -0.31966203 |
Sum | 1.0014512 × 1010 |
Variance | 882382.76 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1002352 | 898 | 9.0% |
1002370 | 464 | 4.6% |
1002374 | 413 | 4.1% |
1002344 | 350 | 3.5% |
1000471 | 326 | 3.3% |
1001688 | 256 | 2.6% |
1002372 | 248 | 2.5% |
1000058 | 222 | 2.2% |
1002335 | 219 | 2.2% |
1002232 | 210 | 2.1% |
Other values (344) | 6394 |
Value | Count | Frequency (%) |
1000003 | 3 | < 0.1% |
1000014 | 2 | < 0.1% |
1000029 | 7 | 0.1% |
1000031 | 7 | 0.1% |
1000032 | 10 | 0.1% |
1000033 | 3 | < 0.1% |
1000034 | 6 | 0.1% |
1000035 | 6 | 0.1% |
1000041 | 21 | 0.2% |
1000058 | 222 |
Value | Count | Frequency (%) |
1002376 | 195 | |
1002374 | 413 | |
1002373 | 91 | 0.9% |
1002372 | 248 | |
1002371 | 103 | 1.0% |
1002370 | 464 | |
1002366 | 23 | 0.2% |
1002363 | 5 | 0.1% |
1002355 | 32 | 0.3% |
1002353 | 1 | < 0.1% |
소재지
Text
Distinct | 86 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
강원도 | 3060 | |
철원군 | 2994 | |
경기도 | 2271 | 11.0% |
경상북도 | 1713 | 8.3% |
평택시 | 1216 | 5.9% |
전라북도 | 1037 | 5.0% |
전라남도 | 767 | 3.7% |
충청북도 | 595 | 2.9% |
김제시 | 388 | 1.9% |
상주시 | 366 | 1.8% |
Other values (95) | 6160 |
Most occurring characters
Value | Count | Frequency (%) |
10567 | ||
도 | 9955 | |
원 | 6285 | 8.2% |
군 | 5055 | 6.6% |
시 | 4955 | 6.4% |
경 | 4633 | 6.0% |
북 | 3509 | 4.6% |
강 | 3082 | 4.0% |
철 | 2994 | 3.9% |
기 | 2271 | 3.0% |
Other values (82) | 23660 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 66399 | |
Space Separator | 10567 | 13.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 9955 | |
원 | 6285 | 9.5% |
군 | 5055 | 7.6% |
시 | 4955 | 7.5% |
경 | 4633 | 7.0% |
북 | 3509 | 5.3% |
강 | 3082 | 4.6% |
철 | 2994 | 4.5% |
기 | 2271 | 3.4% |
상 | 2268 | 3.4% |
Other values (81) | 21392 |
Space Separator
Value | Count | Frequency (%) |
10567 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 66399 | |
Common | 10567 | 13.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 9955 | |
원 | 6285 | 9.5% |
군 | 5055 | 7.6% |
시 | 4955 | 7.5% |
경 | 4633 | 7.0% |
북 | 3509 | 5.3% |
강 | 3082 | 4.6% |
철 | 2994 | 4.5% |
기 | 2271 | 3.4% |
상 | 2268 | 3.4% |
Other values (81) | 21392 |
Common
Value | Count | Frequency (%) |
10567 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 66399 | |
ASCII | 10567 | 13.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10567 |
Hangul
Value | Count | Frequency (%) |
도 | 9955 | |
원 | 6285 | 9.5% |
군 | 5055 | 7.6% |
시 | 4955 | 7.5% |
경 | 4633 | 7.0% |
북 | 3509 | 5.3% |
강 | 3082 | 4.6% |
철 | 2994 | 4.5% |
기 | 2271 | 3.4% |
상 | 2268 | 3.4% |
Other values (81) | 21392 |
품목
Text
Distinct | 53 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
쌀 | 4911 | |
벼 | 1686 | 16.9% |
사과 | 926 | 9.3% |
포도 | 487 | 4.9% |
복숭아 | 470 | 4.7% |
배 | 352 | 3.5% |
수박 | 196 | 2.0% |
딸기 | 106 | 1.1% |
메론 | 98 | 1.0% |
사과(후지 | 77 | 0.8% |
Other values (43) | 691 | 6.9% |
Most occurring characters
Value | Count | Frequency (%) |
쌀 | 4911 | |
벼 | 1712 | 11.7% |
과 | 1016 | 6.9% |
사 | 1003 | 6.9% |
포 | 487 | 3.3% |
도 | 487 | 3.3% |
복 | 470 | 3.2% |
숭 | 470 | 3.2% |
아 | 470 | 3.2% |
배 | 352 | 2.4% |
Other values (80) | 3251 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14429 | |
Open Punctuation | 100 | 0.7% |
Close Punctuation | 100 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
쌀 | 4911 | |
벼 | 1712 | 11.9% |
과 | 1016 | 7.0% |
사 | 1003 | 7.0% |
포 | 487 | 3.4% |
도 | 487 | 3.4% |
복 | 470 | 3.3% |
숭 | 470 | 3.3% |
아 | 470 | 3.3% |
배 | 352 | 2.4% |
Other values (78) | 3051 |
Open Punctuation
Value | Count | Frequency (%) |
( | 100 |
Close Punctuation
Value | Count | Frequency (%) |
) | 100 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14429 | |
Common | 200 | 1.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
쌀 | 4911 | |
벼 | 1712 | 11.9% |
과 | 1016 | 7.0% |
사 | 1003 | 7.0% |
포 | 487 | 3.4% |
도 | 487 | 3.4% |
복 | 470 | 3.3% |
숭 | 470 | 3.3% |
아 | 470 | 3.3% |
배 | 352 | 2.4% |
Other values (78) | 3051 |
Common
Value | Count | Frequency (%) |
( | 100 | |
) | 100 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14429 | |
ASCII | 200 | 1.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
쌀 | 4911 | |
벼 | 1712 | 11.9% |
과 | 1016 | 7.0% |
사 | 1003 | 7.0% |
포 | 487 | 3.4% |
도 | 487 | 3.4% |
복 | 470 | 3.3% |
숭 | 470 | 3.3% |
아 | 470 | 3.3% |
배 | 352 | 2.4% |
Other values (78) | 3051 |
ASCII
Value | Count | Frequency (%) |
( | 100 | |
) | 100 |
재배면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 4804 |
---|---|
Distinct (%) | 48.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2479.8595 |
Minimum | 2 |
---|---|
Maximum | 49625 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 218 |
Q1 | 1002 |
median | 1990 |
Q3 | 3402 |
95-th percentile | 5929.05 |
Maximum | 49625 |
Range | 49623 |
Interquartile range (IQR) | 2400 |
Descriptive statistics
Standard deviation | 2279.9193 |
---|---|
Coefficient of variation (CV) | 0.91937439 |
Kurtosis | 44.282686 |
Mean | 2479.8595 |
Median Absolute Deviation (MAD) | 1100 |
Skewness | 4.1634201 |
Sum | 24798595 |
Variance | 5198032.1 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4000.0 | 62 | 0.6% |
3000.0 | 37 | 0.4% |
2000.0 | 36 | 0.4% |
1000.0 | 28 | 0.3% |
1653.0 | 18 | 0.2% |
1200.0 | 17 | 0.2% |
3967.0 | 17 | 0.2% |
500.0 | 16 | 0.2% |
800.0 | 15 | 0.1% |
1256.0 | 14 | 0.1% |
Other values (4794) | 9740 |
Value | Count | Frequency (%) |
2.0 | 2 | |
4.0 | 2 | |
5.0 | 2 | |
6.0 | 2 | |
7.0 | 1 | < 0.1% |
8.0 | 2 | |
9.0 | 2 | |
10.0 | 3 | |
11.0 | 1 | < 0.1% |
12.0 | 1 | < 0.1% |
Value | Count | Frequency (%) |
49625.0 | 1 | |
39600.0 | 1 | |
38059.0 | 1 | |
30000.0 | 1 | |
26446.0 | 1 | |
24300.0 | 1 | |
22059.0 | 1 | |
21976.0 | 1 | |
21717.0 | 1 | |
20723.1 | 1 |
생산계획량(톤)
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 2802 |
---|---|
Distinct (%) | 28.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 7.3786989 |
Minimum | 0 |
---|---|
Maximum | 9614 |
Zeros | 14 |
Zeros (%) | 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0.219881 |
Q1 | 1.027105 |
median | 2.173315 |
Q3 | 4.2 |
95-th percentile | 12.5 |
Maximum | 9614 |
Range | 9614 |
Interquartile range (IQR) | 3.172895 |
Descriptive statistics
Standard deviation | 127.84293 |
---|---|
Coefficient of variation (CV) | 17.325945 |
Kurtosis | 3487.8114 |
Mean | 7.3786989 |
Median Absolute Deviation (MAD) | 1.333315 |
Skewness | 53.345028 |
Sum | 73786.989 |
Variance | 16343.815 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1.0 | 92 | 0.9% |
2.0 | 87 | 0.9% |
3.0 | 77 | 0.8% |
4.0 | 74 | 0.7% |
6.0 | 60 | 0.6% |
0.8 | 59 | 0.6% |
8.0 | 56 | 0.6% |
1.5 | 54 | 0.5% |
0.5 | 53 | 0.5% |
0.3 | 53 | 0.5% |
Other values (2792) | 9335 |
Value | Count | Frequency (%) |
0.0 | 14 | |
0.00289 | 1 | < 0.1% |
0.00434 | 1 | < 0.1% |
0.00651 | 1 | < 0.1% |
0.00868 | 1 | < 0.1% |
0.01 | 23 | |
0.01084 | 1 | < 0.1% |
0.01301 | 1 | < 0.1% |
0.01446 | 1 | < 0.1% |
0.016 | 1 | < 0.1% |
Value | Count | Frequency (%) |
9614.0 | 1 | |
4394.0 | 1 | |
3573.0 | 1 | |
3441.0 | 1 | |
2576.0 | 1 | |
2435.0 | 1 | |
2324.0 | 1 | |
2000.0 | 1 | |
1442.0 | 1 | |
1288.0 | 1 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
인증번호 | 1.000 | 0.961 | 0.873 | 0.051 | 0.000 |
소재지 | 0.961 | 1.000 | 0.990 | 0.314 | 0.565 |
품목 | 0.873 | 0.990 | 1.000 | 0.171 | 0.733 |
재배면적(제곱미터) | 0.051 | 0.314 | 0.171 | 1.000 | 0.000 |
생산계획량(톤) | 0.000 | 0.565 | 0.733 | 0.000 | 1.000 |
인증번호 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|
인증번호 | 1.000 | 0.026 | 0.138 |
재배면적(제곱미터) | 0.026 | 1.000 | 0.778 |
생산계획량(톤) | 0.138 | 0.778 | 1.000 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
11218 | 1000193 | 전라북도 김제시 | 쌀 | 2817.0 | 2.25 |
19816 | 1000332 | 경기도 평택시 | 쌀 | 2542.0 | 1.69 |
32259 | 1000471 | 경기도 평택시 | 쌀 | 5527.0 | 3.53 |
1675 | 1000058 | 경기도 화성시 | 쌀 | 2334.0 | 1.69 |
51421 | 1002039 | 경상북도 칠곡군 | 포도 | 5930.0 | 16.0 |
4419 | 1000113 | 경기도 파주시 | 쌀 | 2118.0 | 1.5313 |
25217 | 1000366 | 경상북도 경주시 | 쌀 | 4290.0 | 7.91 |
58656 | 1002244 | 강원도 원주시 | 복숭아 | 1546.0 | 2.2 |
72429 | 1002350 | 강원도 철원군 | 쌀 | 2476.9 | 1.7908 |
99771 | 1002376 | 강원도 철원군 | 쌀 | 935.0 | 0.676 |
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | |
---|---|---|---|---|---|
55821 | 1002219 | 전라북도 남원시 | 복숭아 | 401.0 | 0.57 |
99445 | 1002376 | 강원도 철원군 | 쌀 | 7230.0 | 5.22729 |
73925 | 1002351 | 강원도 철원군 | 쌀 | 1593.0 | 1.15174 |
79578 | 1002352 | 강원도 철원군 | 쌀 | 4304.0 | 3.11 |
90794 | 1002372 | 강원도 철원군 | 벼 | 3741.0 | 7.5 |
24033 | 1000362 | 경상북도 경주시 | 쌀 | 2832.0 | 2.05 |
10815 | 1000191 | 전라북도 김제시 | 쌀 | 3796.0 | 2.94 |
96264 | 1002374 | 강원도 철원군 | 벼 | 5918.0 | 11.8 |
71382 | 1002348 | 강원도 철원군 | 쌀 | 281.0 | 0.20316 |
826 | 1000058 | 경기도 화성시 | 쌀 | 625.0 | 0.45 |
Most frequently occurring
인증번호 | 소재지 | 품목 | 재배면적(제곱미터) | 생산계획량(톤) | # duplicates | |
---|---|---|---|---|---|---|
142 | 1002340 | 전라북도 정읍시 | 쌀 | 4000.0 | 2.89 | 12 |
144 | 1002343 | 전라북도 정읍시 | 쌀 | 4000.0 | 2.89 | 8 |
33 | 1000208 | 전라북도 부안군 | 벼 | 4000.0 | 2.8 | 7 |
93 | 1001096 | 부산광역시 강서구 | 토마토 | 2975.0 | 19.3375 | 6 |
23 | 1000125 | 전라북도 전주시 덕진구 | 벼 | 3967.0 | 2.98 | 5 |
71 | 1000377 | 경기도 평택시 | 쌀 | 4000.0 | 2.66 | 5 |
108 | 1001570 | 전라북도 전주시 덕진구 | 쌀 | 4000.0 | 2.25 | 5 |
141 | 1002340 | 전라북도 정읍시 | 쌀 | 2000.0 | 1.45 | 5 |
147 | 1002344 | 전라남도 고흥군 | 쌀 | 2000.0 | 1.446 | 5 |
28 | 1000186 | 전라북도 김제시 | 쌀 | 3967.0 | 2.73 | 4 |