Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 284 |
Duplicate rows (%) | 2.8% |
Total size in memory | 498.0 KiB |
Average record size in memory | 51.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 1 |
Categorical | 1 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 농산물우수관리(GAP) 인증농가 현황 정보(인증번호, 소재지, 품목, 재배면적, 생산계획량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20181019000000000974 |
Dataset has 284 (2.8%) duplicate rows | Duplicates |
인증번호 is highly overall correlated with 품목 | High correlation |
재배면적(㎡) is highly overall correlated with 생산계획량(톤) | High correlation |
생산계획량(톤) is highly overall correlated with 재배면적(㎡) | High correlation |
품목 is highly overall correlated with 인증번호 | High correlation |
품목 is highly imbalanced (50.3%) | Imbalance |
생산계획량(톤) is highly skewed (γ1 = 71.39895588) | Skewed |
Reproduction
Analysis started | 2024-03-23 07:54:25.080658 |
---|---|
Analysis finished | 2024-03-23 07:54:29.317634 |
Duration | 4.24 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
인증번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 355 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1001458.1 |
Minimum | 1000003 |
---|---|
Maximum | 1002376 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1000003 |
---|---|
5-th percentile | 1000113 |
Q1 | 1000364 |
median | 1001734 |
Q3 | 1002351 |
95-th percentile | 1002374 |
Maximum | 1002376 |
Range | 2373 |
Interquartile range (IQR) | 1987 |
Descriptive statistics
Standard deviation | 939.95995 |
---|---|
Coefficient of variation (CV) | 0.00093859143 |
Kurtosis | -1.68047 |
Mean | 1001458.1 |
Median Absolute Deviation (MAD) | 636 |
Skewness | -0.33890806 |
Sum | 1.0014581 × 1010 |
Variance | 883524.71 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1002352 | 843 | 8.4% |
1002370 | 464 | 4.6% |
1002374 | 430 | 4.3% |
1002344 | 325 | 3.2% |
1000471 | 306 | 3.1% |
1002372 | 276 | 2.8% |
1002335 | 265 | 2.6% |
1002232 | 225 | 2.2% |
1001688 | 221 | 2.2% |
1000058 | 220 | 2.2% |
Other values (345) | 6425 |
Value | Count | Frequency (%) |
1000003 | 3 | < 0.1% |
1000029 | 11 | 0.1% |
1000031 | 8 | 0.1% |
1000032 | 11 | 0.1% |
1000033 | 3 | < 0.1% |
1000034 | 8 | 0.1% |
1000035 | 4 | < 0.1% |
1000041 | 14 | 0.1% |
1000058 | 220 | |
1000061 | 4 | < 0.1% |
Value | Count | Frequency (%) |
1002376 | 160 | 1.6% |
1002374 | 430 | |
1002373 | 99 | 1.0% |
1002372 | 276 | |
1002371 | 102 | 1.0% |
1002370 | 464 | |
1002366 | 32 | 0.3% |
1002363 | 2 | < 0.1% |
1002355 | 38 | 0.4% |
1002353 | 1 | < 0.1% |
소재지
Text
Distinct | 88 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
강원특별자치도 | 2985 | |
철원군 | 2921 | |
경기도 | 2196 | 10.6% |
경상북도 | 1783 | 8.6% |
평택시 | 1106 | 5.3% |
전북특별자치도 | 1085 | 5.2% |
전라남도 | 770 | 3.7% |
충청북도 | 601 | 2.9% |
상주시 | 442 | 2.1% |
김제시 | 396 | 1.9% |
Other values (97) | 6405 |
Most occurring characters
Value | Count | Frequency (%) |
10690 | 11.5% | |
도 | 9960 | 10.7% |
원 | 6127 | 6.6% |
시 | 5029 | 5.4% |
군 | 4984 | 5.4% |
경 | 4633 | 5.0% |
특 | 4076 | 4.4% |
별 | 4076 | 4.4% |
자 | 4076 | 4.4% |
치 | 4076 | 4.4% |
Other values (85) | 35077 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 82114 | |
Space Separator | 10690 | 11.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 9960 | 12.1% |
원 | 6127 | 7.5% |
시 | 5029 | 6.1% |
군 | 4984 | 6.1% |
경 | 4633 | 5.6% |
특 | 4076 | 5.0% |
별 | 4076 | 5.0% |
자 | 4076 | 5.0% |
치 | 4076 | 5.0% |
북 | 3656 | 4.5% |
Other values (84) | 31421 |
Space Separator
Value | Count | Frequency (%) |
10690 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 82114 | |
Common | 10690 | 11.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 9960 | 12.1% |
원 | 6127 | 7.5% |
시 | 5029 | 6.1% |
군 | 4984 | 6.1% |
경 | 4633 | 5.6% |
특 | 4076 | 5.0% |
별 | 4076 | 5.0% |
자 | 4076 | 5.0% |
치 | 4076 | 5.0% |
북 | 3656 | 4.5% |
Other values (84) | 31421 |
Common
Value | Count | Frequency (%) |
10690 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 82114 | |
ASCII | 10690 | 11.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10690 |
Hangul
Value | Count | Frequency (%) |
도 | 9960 | 12.1% |
원 | 6127 | 7.5% |
시 | 5029 | 6.1% |
군 | 4984 | 6.1% |
경 | 4633 | 5.6% |
특 | 4076 | 5.0% |
별 | 4076 | 5.0% |
자 | 4076 | 5.0% |
치 | 4076 | 5.0% |
북 | 3656 | 4.5% |
Other values (84) | 31421 |
품목
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 50 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
쌀 | |
---|---|
벼 | |
사과 | |
포도 | |
복숭아 | |
Other values (45) |
Length
Max length | 7 |
---|---|
Median length | 1 |
Mean length | 1.48 |
Min length | 1 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 배 |
---|---|
2nd row | 방울토마토 |
3rd row | 복숭아 |
4th row | 쌀 |
5th row | 배 |
Common Values
Value | Count | Frequency (%) |
쌀 | 4686 | |
벼 | 1730 | 17.3% |
사과 | 934 | 9.3% |
포도 | 574 | 5.7% |
복숭아 | 471 | 4.7% |
배 | 382 | 3.8% |
수박 | 191 | 1.9% |
메론 | 127 | 1.3% |
딸기 | 108 | 1.1% |
방울토마토 | 85 | 0.9% |
Other values (40) | 712 | 7.1% |
Length
Value | Count | Frequency (%) |
쌀 | 4686 | |
벼 | 1730 | 17.3% |
사과 | 934 | 9.3% |
포도 | 574 | 5.7% |
복숭아 | 471 | 4.7% |
배 | 382 | 3.8% |
수박 | 191 | 1.9% |
메론 | 127 | 1.3% |
딸기 | 108 | 1.1% |
방울토마토 | 85 | 0.9% |
Other values (40) | 712 | 7.1% |
재배면적(㎡)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 4742 |
---|---|
Distinct (%) | 47.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2461.1668 |
Minimum | 2 |
---|---|
Maximum | 47504 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 198 |
Q1 | 1010 |
median | 2000 |
Q3 | 3400 |
95-th percentile | 5738.2 |
Maximum | 47504 |
Range | 47502 |
Interquartile range (IQR) | 2390 |
Descriptive statistics
Standard deviation | 2250.4882 |
---|---|
Coefficient of variation (CV) | 0.91439891 |
Kurtosis | 43.592005 |
Mean | 2461.1668 |
Median Absolute Deviation (MAD) | 1100 |
Skewness | 4.2968847 |
Sum | 24611668 |
Variance | 5064697.1 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4000.0 | 68 | 0.7% |
2000.0 | 29 | 0.3% |
3000.0 | 28 | 0.3% |
1000.0 | 23 | 0.2% |
3967.0 | 22 | 0.2% |
500.0 | 17 | 0.2% |
2975.0 | 14 | 0.1% |
3002.0 | 14 | 0.1% |
1600.0 | 13 | 0.1% |
1500.0 | 13 | 0.1% |
Other values (4732) | 9759 |
Value | Count | Frequency (%) |
2.0 | 1 | < 0.1% |
3.0 | 1 | < 0.1% |
4.0 | 1 | < 0.1% |
5.0 | 1 | < 0.1% |
6.0 | 2 | < 0.1% |
7.0 | 5 | |
9.0 | 3 | |
10.0 | 2 | < 0.1% |
11.0 | 1 | < 0.1% |
12.0 | 3 |
Value | Count | Frequency (%) |
47504.0 | 1 | |
38072.0 | 1 | |
29972.0 | 1 | |
28879.0 | 1 | |
27582.0 | 1 | |
27156.0 | 1 | |
26235.0 | 1 | |
25657.0 | 1 | |
24099.0 | 1 | |
23810.0 | 1 |
생산계획량(톤)
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 2703 |
---|---|
Distinct (%) | 27.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.6313898 |
Minimum | 0 |
---|---|
Maximum | 7605 |
Zeros | 20 |
Zeros (%) | 0.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0.2 |
Q1 | 1.0592025 |
median | 2.22 |
Q3 | 4.34 |
95-th percentile | 12.802525 |
Maximum | 7605 |
Range | 7605 |
Interquartile range (IQR) | 3.2807975 |
Descriptive statistics
Standard deviation | 90.487557 |
---|---|
Coefficient of variation (CV) | 16.068424 |
Kurtosis | 5540.3017 |
Mean | 5.6313898 |
Median Absolute Deviation (MAD) | 1.36 |
Skewness | 71.398956 |
Sum | 56313.898 |
Variance | 8187.9981 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1.0 | 105 | 1.1% |
2.0 | 97 | 1.0% |
3.0 | 88 | 0.9% |
4.0 | 71 | 0.7% |
0.5 | 68 | 0.7% |
0.1 | 62 | 0.6% |
6.0 | 61 | 0.6% |
2.8 | 61 | 0.6% |
8.0 | 61 | 0.6% |
1.2 | 56 | 0.6% |
Other values (2693) | 9270 |
Value | Count | Frequency (%) |
0.0 | 20 | |
0.00362 | 1 | < 0.1% |
0.00506 | 1 | < 0.1% |
0.00723 | 1 | < 0.1% |
0.0094 | 1 | < 0.1% |
0.01 | 14 | |
0.01808 | 1 | < 0.1% |
0.01923 | 1 | < 0.1% |
0.02 | 21 | |
0.02024 | 1 | < 0.1% |
Value | Count | Frequency (%) |
7605.0 | 1 | |
4394.0 | 1 | |
1632.0 | 1 | |
894.0 | 1 | |
606.0 | 1 | |
506.64 | 1 | |
300.0 | 1 | |
273.94 | 1 | |
270.0 | 1 | |
250.0 | 2 |
인증번호 | 소재지 | 품목 | 재배면적(㎡) | 생산계획량(톤) | |
---|---|---|---|---|---|
인증번호 | 1.000 | 0.962 | 0.869 | 0.050 | 0.000 |
소재지 | 0.962 | 1.000 | 0.989 | 0.463 | 0.434 |
품목 | 0.869 | 0.989 | 1.000 | 0.721 | 0.719 |
재배면적(㎡) | 0.050 | 0.463 | 0.721 | 1.000 | 0.000 |
생산계획량(톤) | 0.000 | 0.434 | 0.719 | 0.000 | 1.000 |
인증번호 | 재배면적(㎡) | 생산계획량(톤) | 품목 | |
---|---|---|---|---|
인증번호 | 1.000 | 0.018 | 0.143 | 0.519 |
재배면적(㎡) | 0.018 | 1.000 | 0.778 | 0.353 |
생산계획량(톤) | 0.143 | 0.778 | 1.000 | 0.402 |
품목 | 0.519 | 0.353 | 0.402 | 1.000 |
인증번호 | 소재지 | 품목 | 재배면적(㎡) | 생산계획량(톤) | |
---|---|---|---|---|---|
59520 | 1002262 | 전라남도 순천시 | 배 | 235.0 | 0.4843 |
41797 | 1001339 | 충청북도 음성군 | 방울토마토 | 1498.0 | 7.93 |
56289 | 1002219 | 전북특별자치도 남원시 | 복숭아 | 826.0 | 1.18 |
5174 | 1000113 | 경기도 파주시 | 쌀 | 211.0 | 0.1526 |
50163 | 1001733 | 충청남도 아산시 | 배 | 1452.0 | 2.99 |
90120 | 1002371 | 강원특별자치도 철원군 | 벼 | 2193.0 | 4.4 |
57109 | 1002232 | 경상북도 영주시 | 사과 | 813.0 | 1.6 |
8982 | 1000166 | 경기도 용인시 처인구 | 쌀 | 1398.0 | 0.97 |
99525 | 1002376 | 강원특별자치도 철원군 | 쌀 | 2489.0 | 1.79955 |
53556 | 1002148 | 전북특별자치도 장수군 | 사과 | 192.0 | 0.35 |
인증번호 | 소재지 | 품목 | 재배면적(㎡) | 생산계획량(톤) | |
---|---|---|---|---|---|
10270 | 1000185 | 전북특별자치도 김제시 | 쌀 | 2499.0 | 1.81 |
98318 | 1002374 | 강원특별자치도 철원군 | 벼 | 2942.0 | 5.9 |
95466 | 1002374 | 강원특별자치도 철원군 | 벼 | 2800.0 | 5.6 |
88939 | 1002370 | 강원특별자치도 철원군 | 벼 | 5432.0 | 10.9 |
70385 | 1002347 | 충청북도 진천군 | 쌀 | 483.0 | 0.4 |
31908 | 1000471 | 경기도 평택시 | 쌀 | 4049.0 | 2.59 |
56772 | 1002226 | 충청북도 충주시 | 복숭아 | 5561.0 | 7.9133 |
18212 | 1000330 | 경기도 평택시 | 쌀 | 1962.0 | 1.3 |
90 | 1000031 | 경기도 안성시 | 배 | 1849.0 | 4.0 |
16876 | 1000292 | 전라남도 나주시 | 배 | 301.0 | 0.6 |
Most frequently occurring
인증번호 | 소재지 | 품목 | 재배면적(㎡) | 생산계획량(톤) | # duplicates | |
---|---|---|---|---|---|---|
132 | 1002340 | 전북특별자치도 정읍시 | 쌀 | 4000.0 | 2.89 | 21 |
42 | 1000208 | 전북특별자치도 부안군 | 벼 | 4000.0 | 2.8 | 18 |
135 | 1002343 | 전북특별자치도 정읍시 | 쌀 | 4000.0 | 2.89 | 7 |
167 | 1002352 | 강원특별자치도 철원군 | 쌀 | 42.0 | 0.03 | 6 |
60 | 1000360 | 경상북도 경주시 | 쌀 | 2000.0 | 1.45 | 5 |
91 | 1001096 | 부산광역시 강서구 | 토마토 | 2975.0 | 19.3375 | 5 |
143 | 1002344 | 전라남도 고흥군 | 쌀 | 2000.0 | 1.446 | 5 |
17 | 1000121 | 전라남도 나주시 | 쌀 | 3000.0 | 1.82 | 4 |
18 | 1000125 | 전북특별자치도 전주시 덕진구 | 벼 | 3967.0 | 2.98 | 4 |
31 | 1000186 | 전북특별자치도 김제시 | 쌀 | 3002.0 | 2.07 | 4 |