Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 287 |
Duplicate rows (%) | 2.9% |
Total size in memory | 498.0 KiB |
Average record size in memory | 51.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 농산물우수관리(GAP) 인증농가 현황 정보(인증번호, 소재지, 품목, 재배면적, 생산계획량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20181019000000000974 |
Dataset has 287 (2.9%) duplicate rows | Duplicates |
재배면적(㎡) is highly overall correlated with 생산계획량(톤) | High correlation |
생산계획량(톤) is highly overall correlated with 재배면적(㎡) | High correlation |
생산계획량(톤) is highly skewed (γ1 = 42.34022058) | Skewed |
Reproduction
Analysis started | 2024-03-23 07:54:10.732617 |
---|---|
Analysis finished | 2024-03-23 07:54:15.192864 |
Duration | 4.46 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
인증번호
Real number (ℝ)
Distinct | 356 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1001448.7 |
Minimum | 1000003 |
---|---|
Maximum | 1002376 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1000003 |
---|---|
5-th percentile | 1000113 |
Q1 | 1000364 |
median | 1001688 |
Q3 | 1002351 |
95-th percentile | 1002374 |
Maximum | 1002376 |
Range | 2373 |
Interquartile range (IQR) | 1987 |
Descriptive statistics
Standard deviation | 936.47249 |
---|---|
Coefficient of variation (CV) | 0.00093511777 |
Kurtosis | -1.686248 |
Mean | 1001448.7 |
Median Absolute Deviation (MAD) | 682 |
Skewness | -0.31746768 |
Sum | 1.0014487 × 1010 |
Variance | 876980.73 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1002352 | 899 | 9.0% |
1002370 | 423 | 4.2% |
1002374 | 398 | 4.0% |
1002344 | 340 | 3.4% |
1000471 | 306 | 3.1% |
1002372 | 241 | 2.4% |
1001688 | 232 | 2.3% |
1000113 | 210 | 2.1% |
1002335 | 210 | 2.1% |
1000058 | 208 | 2.1% |
Other values (346) | 6533 |
Value | Count | Frequency (%) |
1000003 | 1 | < 0.1% |
1000029 | 9 | 0.1% |
1000031 | 4 | < 0.1% |
1000032 | 5 | 0.1% |
1000033 | 4 | < 0.1% |
1000034 | 4 | < 0.1% |
1000035 | 6 | 0.1% |
1000041 | 15 | 0.1% |
1000058 | 208 | |
1000061 | 3 | < 0.1% |
Value | Count | Frequency (%) |
1002376 | 182 | 1.8% |
1002374 | 398 | |
1002373 | 116 | 1.2% |
1002372 | 241 | 2.4% |
1002371 | 107 | 1.1% |
1002370 | 423 | |
1002366 | 20 | 0.2% |
1002363 | 3 | < 0.1% |
1002355 | 34 | 0.3% |
1002352 | 899 |
소재지
Text
Distinct | 90 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
강원특별자치도 | 2998 | |
철원군 | 2926 | |
경기도 | 2248 | 10.9% |
경상북도 | 1733 | 8.4% |
평택시 | 1197 | 5.8% |
전라북도 | 1056 | 5.1% |
전라남도 | 797 | 3.9% |
충청북도 | 584 | 2.8% |
김제시 | 403 | 2.0% |
상주시 | 372 | 1.8% |
Other values (99) | 6304 |
Most occurring characters
Value | Count | Frequency (%) |
10618 | 11.9% | |
도 | 9948 | 11.1% |
원 | 6170 | 6.9% |
시 | 5058 | 5.7% |
군 | 4958 | 5.6% |
경 | 4671 | 5.2% |
북 | 3544 | 4.0% |
강 | 3016 | 3.4% |
특 | 3005 | 3.4% |
별 | 3005 | 3.4% |
Other values (87) | 35278 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 78653 | |
Space Separator | 10618 | 11.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 9948 | 12.6% |
원 | 6170 | 7.8% |
시 | 5058 | 6.4% |
군 | 4958 | 6.3% |
경 | 4671 | 5.9% |
북 | 3544 | 4.5% |
강 | 3016 | 3.8% |
특 | 3005 | 3.8% |
별 | 3005 | 3.8% |
자 | 3005 | 3.8% |
Other values (86) | 32273 |
Space Separator
Value | Count | Frequency (%) |
10618 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 78653 | |
Common | 10618 | 11.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 9948 | 12.6% |
원 | 6170 | 7.8% |
시 | 5058 | 6.4% |
군 | 4958 | 6.3% |
경 | 4671 | 5.9% |
북 | 3544 | 4.5% |
강 | 3016 | 3.8% |
특 | 3005 | 3.8% |
별 | 3005 | 3.8% |
자 | 3005 | 3.8% |
Other values (86) | 32273 |
Common
Value | Count | Frequency (%) |
10618 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 78653 | |
ASCII | 10618 | 11.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10618 |
Hangul
Value | Count | Frequency (%) |
도 | 9948 | 12.6% |
원 | 6170 | 7.8% |
시 | 5058 | 6.4% |
군 | 4958 | 6.3% |
경 | 4671 | 5.9% |
북 | 3544 | 4.5% |
강 | 3016 | 3.8% |
특 | 3005 | 3.8% |
별 | 3005 | 3.8% |
자 | 3005 | 3.8% |
Other values (86) | 32273 |
품목
Text
Distinct | 51 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
쌀 | 4853 | |
벼 | 1633 | 16.3% |
사과 | 933 | 9.3% |
복숭아 | 512 | 5.1% |
포도 | 507 | 5.1% |
배 | 338 | 3.4% |
수박 | 168 | 1.7% |
메론 | 127 | 1.3% |
딸기 | 112 | 1.1% |
대추방울 | 81 | 0.8% |
Other values (41) | 736 | 7.4% |
Most occurring characters
Value | Count | Frequency (%) |
쌀 | 4853 | |
벼 | 1662 | 11.2% |
과 | 1013 | 6.8% |
사 | 1003 | 6.8% |
복 | 512 | 3.4% |
숭 | 512 | 3.4% |
아 | 512 | 3.4% |
포 | 507 | 3.4% |
도 | 507 | 3.4% |
배 | 338 | 2.3% |
Other values (77) | 3434 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14673 | |
Open Punctuation | 90 | 0.6% |
Close Punctuation | 90 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
쌀 | 4853 | |
벼 | 1662 | 11.3% |
과 | 1013 | 6.9% |
사 | 1003 | 6.8% |
복 | 512 | 3.5% |
숭 | 512 | 3.5% |
아 | 512 | 3.5% |
포 | 507 | 3.5% |
도 | 507 | 3.5% |
배 | 338 | 2.3% |
Other values (75) | 3254 |
Open Punctuation
Value | Count | Frequency (%) |
( | 90 |
Close Punctuation
Value | Count | Frequency (%) |
) | 90 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14673 | |
Common | 180 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
쌀 | 4853 | |
벼 | 1662 | 11.3% |
과 | 1013 | 6.9% |
사 | 1003 | 6.8% |
복 | 512 | 3.5% |
숭 | 512 | 3.5% |
아 | 512 | 3.5% |
포 | 507 | 3.5% |
도 | 507 | 3.5% |
배 | 338 | 2.3% |
Other values (75) | 3254 |
Common
Value | Count | Frequency (%) |
( | 90 | |
) | 90 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14673 | |
ASCII | 180 | 1.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
쌀 | 4853 | |
벼 | 1662 | 11.3% |
과 | 1013 | 6.9% |
사 | 1003 | 6.8% |
복 | 512 | 3.5% |
숭 | 512 | 3.5% |
아 | 512 | 3.5% |
포 | 507 | 3.5% |
도 | 507 | 3.5% |
배 | 338 | 2.3% |
Other values (75) | 3254 |
ASCII
Value | Count | Frequency (%) |
( | 90 | |
) | 90 |
재배면적(㎡)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 4776 |
---|---|
Distinct (%) | 47.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2463.5928 |
Minimum | 1 |
---|---|
Maximum | 49625 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 208.95 |
Q1 | 1015 |
median | 2010 |
Q3 | 3381.025 |
95-th percentile | 5907.05 |
Maximum | 49625 |
Range | 49624 |
Interquartile range (IQR) | 2366.025 |
Descriptive statistics
Standard deviation | 2204.998 |
---|---|
Coefficient of variation (CV) | 0.89503347 |
Kurtosis | 41.763733 |
Mean | 2463.5928 |
Median Absolute Deviation (MAD) | 1098 |
Skewness | 3.9726599 |
Sum | 24635928 |
Variance | 4862016.4 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4000.0 | 52 | 0.5% |
2000.0 | 50 | 0.5% |
3967.0 | 23 | 0.2% |
1000.0 | 23 | 0.2% |
3000.0 | 22 | 0.2% |
1500.0 | 17 | 0.2% |
992.0 | 15 | 0.1% |
1600.0 | 15 | 0.1% |
2975.0 | 15 | 0.1% |
1322.0 | 15 | 0.1% |
Other values (4766) | 9753 |
Value | Count | Frequency (%) |
1.0 | 2 | |
2.0 | 2 | |
3.0 | 1 | < 0.1% |
4.0 | 3 | |
5.0 | 2 | |
6.0 | 1 | < 0.1% |
7.0 | 3 | |
9.0 | 4 | |
10.0 | 1 | < 0.1% |
11.0 | 1 | < 0.1% |
Value | Count | Frequency (%) |
49625.0 | 1 | |
33627.0 | 1 | |
31000.0 | 1 | |
28800.0 | 1 | |
27156.0 | 1 | |
25657.0 | 1 | |
23703.0 | 1 | |
23632.0 | 1 | |
22391.0 | 1 | |
20915.0 | 1 |
생산계획량(톤)
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 2799 |
---|---|
Distinct (%) | 28.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.3493725 |
Minimum | 0 |
---|---|
Maximum | 3135 |
Zeros | 25 |
Zeros (%) | 0.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0.219881 |
Q1 | 1.03 |
median | 2.18 |
Q3 | 4.27 |
95-th percentile | 12.762 |
Maximum | 3135 |
Range | 3135 |
Interquartile range (IQR) | 3.24 |
Descriptive statistics
Standard deviation | 51.938198 |
---|---|
Coefficient of variation (CV) | 9.7092132 |
Kurtosis | 2049.6668 |
Mean | 5.3493725 |
Median Absolute Deviation (MAD) | 1.34 |
Skewness | 42.340221 |
Sum | 53493.725 |
Variance | 2697.5764 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1.0 | 94 | 0.9% |
2.0 | 79 | 0.8% |
3.0 | 74 | 0.7% |
8.0 | 71 | 0.7% |
4.0 | 66 | 0.7% |
6.0 | 64 | 0.6% |
0.5 | 60 | 0.6% |
1.8 | 59 | 0.6% |
1.5 | 59 | 0.6% |
0.3 | 57 | 0.6% |
Other values (2789) | 9317 |
Value | Count | Frequency (%) |
0.0 | 25 | |
0.00362 | 1 | < 0.1% |
0.00651 | 1 | < 0.1% |
0.01 | 11 | |
0.01518 | 1 | < 0.1% |
0.01663 | 1 | < 0.1% |
0.01952 | 1 | < 0.1% |
0.02 | 16 | |
0.026 | 1 | < 0.1% |
0.02784 | 1 | < 0.1% |
Value | Count | Frequency (%) |
3135.0 | 1 | |
2218.0 | 1 | |
1945.0 | 1 | |
1797.0 | 1 | |
1200.0 | 1 | |
1120.0 | 1 | |
900.0 | 1 | |
818.0 | 1 | |
682.0 | 1 | |
400.0 | 1 |
인증번호 | 소재지 | 품목 | 재배면적(㎡) | 생산계획량(톤) | |
---|---|---|---|---|---|
인증번호 | 1.000 | 0.969 | 0.892 | 0.056 | 0.036 |
소재지 | 0.969 | 1.000 | 0.991 | 0.402 | 0.705 |
품목 | 0.892 | 0.991 | 1.000 | 0.425 | 0.756 |
재배면적(㎡) | 0.056 | 0.402 | 0.425 | 1.000 | 0.000 |
생산계획량(톤) | 0.036 | 0.705 | 0.756 | 0.000 | 1.000 |
인증번호 | 재배면적(㎡) | 생산계획량(톤) | |
---|---|---|---|
인증번호 | 1.000 | 0.024 | 0.140 |
재배면적(㎡) | 0.024 | 1.000 | 0.771 |
생산계획량(톤) | 0.140 | 0.771 | 1.000 |
인증번호 | 소재지 | 품목 | 재배면적(㎡) | 생산계획량(톤) | |
---|---|---|---|---|---|
19128 | 1000331 | 경기도 평택시 | 쌀 | 4886.0 | 3.25 |
52635 | 1002143 | 경기도 이천시 | 복숭아 | 992.0 | 1.41 |
44439 | 1001420 | 경상북도 영주시 | 복숭아 | 2135.0 | 4.3 |
34918 | 1000612 | 전라북도 장수군 | 사과 | 11400.0 | 21.01 |
68654 | 1002344 | 전라남도 고흥군 | 쌀 | 3951.2 | 2.85672 |
77975 | 1002352 | 강원특별자치도 철원군 | 쌀 | 4836.0 | 3.5 |
41534 | 1001348 | 경상북도 김천시 | 자두 | 1482.0 | 1.5 |
4995 | 1000113 | 경기도 파주시 | 쌀 | 231.0 | 0.167 |
20051 | 1000332 | 경기도 평택시 | 쌀 | 5051.0 | 3.36 |
71801 | 1002348 | 강원특별자치도 철원군 | 쌀 | 3925.0 | 2.83778 |
인증번호 | 소재지 | 품목 | 재배면적(㎡) | 생산계획량(톤) | |
---|---|---|---|---|---|
17228 | 1000330 | 경기도 평택시 | 쌀 | 1937.0 | 1.29 |
95780 | 1002374 | 강원특별자치도 철원군 | 벼 | 2152.0 | 4.3 |
8519 | 1000166 | 경기도 용인시 처인구 | 쌀 | 2866.0 | 1.73 |
25179 | 1000366 | 경상북도 경주시 | 쌀 | 2392.0 | 4.41 |
77225 | 1002352 | 강원특별자치도 철원군 | 쌀 | 1498.0 | 1.08 |
86423 | 1002370 | 강원특별자치도 철원군 | 벼 | 3135.0 | 6.3 |
33459 | 1000471 | 경기도 평택시 | 쌀 | 2490.0 | 1.59 |
64602 | 1002335 | 경상북도 상주시 | 포도 | 324.0 | 0.46 |
69857 | 1002347 | 충청북도 진천군 | 쌀 | 965.0 | 0.9 |
67388 | 1002344 | 전라남도 고흥군 | 쌀 | 4019.5 | 2.9061 |
Most frequently occurring
인증번호 | 소재지 | 품목 | 재배면적(㎡) | 생산계획량(톤) | # duplicates | |
---|---|---|---|---|---|---|
128 | 1002340 | 전라북도 정읍시 | 쌀 | 4000.0 | 2.89 | 14 |
130 | 1002343 | 전라북도 정읍시 | 쌀 | 4000.0 | 2.89 | 10 |
133 | 1002344 | 전라남도 고흥군 | 쌀 | 2000.0 | 1.446 | 8 |
24 | 1000186 | 전라북도 김제시 | 쌀 | 3967.0 | 2.73 | 7 |
42 | 1000360 | 경상북도 경주시 | 쌀 | 2000.0 | 1.45 | 6 |
134 | 1002344 | 전라남도 고흥군 | 쌀 | 3000.0 | 2.169 | 6 |
76 | 1001096 | 부산광역시 강서구 | 토마토 | 2975.0 | 19.3375 | 5 |
8 | 1000113 | 경기도 파주시 | 쌀 | 1329.0 | 0.9609 | 4 |
16 | 1000131 | 전라북도 전주시 덕진구 | 벼 | 3967.0 | 2.98 | 4 |
81 | 1001248 | 전라북도 남원시 | 파프리카 | 2310.0 | 11.43912 | 4 |