Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2896 |
Missing cells | 3275 |
Missing cells (%) | 16.2% |
Duplicate rows | 113 |
Duplicate rows (%) | 3.9% |
Total size in memory | 169.8 KiB |
Average record size in memory | 60.0 B |
Variable types
Numeric | 4 |
---|---|
Categorical | 2 |
Text | 1 |
Dataset
Description | 시군별 기능성 양잠 산물(누에고치, 수번데기, 생누에, 동충하초, 잠분, 오디, 건조누에, 기타)에 대한 농가수, 사육량, 생산량 통계 |
---|---|
Author | 농림축산식품부 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20181023000000001004 |
Dataset has 113 (3.9%) duplicate rows | Duplicates |
농가수(호) is highly overall correlated with 사육량(상자) and 1 other fields | High correlation |
사육량(상자) is highly overall correlated with 농가수(호) and 1 other fields | High correlation |
생산 량(kg) is highly overall correlated with 농가수(호) and 1 other fields | High correlation |
시군 has 776 (26.8%) missing values | Missing |
농가수(호) has 783 (27.0%) missing values | Missing |
사육량(상자) has 932 (32.2%) missing values | Missing |
생산 량(kg) has 784 (27.1%) missing values | Missing |
농가수(호) has 1239 (42.8%) zeros | Zeros |
사육량(상자) has 1516 (52.3%) zeros | Zeros |
생산 량(kg) has 1240 (42.8%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-11 03:25:51.038026 |
---|---|
Analysis finished | 2023-12-11 03:25:53.842995 |
Duration | 2.8 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
Distinct | 7 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2012.5815 |
Minimum | 2008 |
---|---|
Maximum | 2014 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.6 KiB |
Quantile statistics
Minimum | 2008 |
---|---|
5-th percentile | 2008 |
Q1 | 2012 |
median | 2013 |
Q3 | 2014 |
95-th percentile | 2014 |
Maximum | 2014 |
Range | 6 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.7622767 |
---|---|
Coefficient of variation (CV) | 0.00087563001 |
Kurtosis | 0.7568985 |
Mean | 2012.5815 |
Median Absolute Deviation (MAD) | 1 |
Skewness | -1.3794733 |
Sum | 5828436 |
Variance | 3.1056193 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
2014 | 1083 | |
2013 | 1048 | |
2012 | 153 | 5.3% |
2011 | 153 | 5.3% |
2010 | 153 | 5.3% |
2009 | 153 | 5.3% |
2008 | 153 | 5.3% |
Value | Count | Frequency (%) |
2008 | 153 | 5.3% |
2009 | 153 | 5.3% |
2010 | 153 | 5.3% |
2011 | 153 | 5.3% |
2012 | 153 | 5.3% |
2013 | 1048 | |
2014 | 1083 |
Value | Count | Frequency (%) |
2014 | 1083 | |
2013 | 1048 | |
2012 | 153 | 5.3% |
2011 | 153 | 5.3% |
2010 | 153 | 5.3% |
2009 | 153 | 5.3% |
2008 | 153 | 5.3% |
시도
Categorical
Distinct | 20 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.8 KiB |
전라남도 | |
---|---|
경상북도 | |
경상남도 | |
충청남도 | |
전라북도 | |
Other values (15) |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 4.0901243 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경상남도 |
---|---|
2nd row | 경상남도 |
3rd row | 경상남도 |
4th row | 경상남도 |
5th row | 경상남도 |
Common Values
Value | Count | Frequency (%) |
전라남도 | 405 | |
경상북도 | 359 | |
경상남도 | 342 | |
충청남도 | 315 | |
전라북도 | 297 | |
충청북도 | 252 | |
강원도 | 225 | |
경기도 | 195 | |
광주광역시 | 81 | 2.8% |
대구광역시 | 63 | 2.2% |
Other values (10) | 362 |
Length
Value | Count | Frequency (%) |
전라남도 | 405 | |
경상북도 | 359 | |
경상남도 | 342 | |
충청남도 | 315 | |
전라북도 | 297 | |
충청북도 | 252 | |
강원도 | 225 | |
경기도 | 195 | |
광주광역시 | 81 | 2.8% |
대구광역시 | 63 | 2.2% |
Other values (10) | 362 |
시군
Text
MISSING
 
Distinct | 192 |
---|---|
Distinct (%) | 9.1% |
Missing | 776 |
Missing (%) | 26.8% |
Memory size | 22.8 KiB |
Value | Count | Frequency (%) |
고성 | 27 | 1.3% |
영동군 | 18 | 0.8% |
청주시 | 18 | 0.8% |
평창 | 18 | 0.8% |
보은군 | 18 | 0.8% |
제천시 | 18 | 0.8% |
충주시 | 18 | 0.8% |
홍성군 | 18 | 0.8% |
인제 | 18 | 0.8% |
영월 | 18 | 0.8% |
Other values (182) | 1931 |
Most occurring characters
Value | Count | Frequency (%) |
군 | 706 | 13.1% |
시 | 444 | 8.2% |
주 | 282 | 5.2% |
천 | 263 | 4.9% |
성 | 216 | 4.0% |
산 | 207 | 3.8% |
양 | 158 | 2.9% |
안 | 139 | 2.6% |
영 | 130 | 2.4% |
진 | 117 | 2.2% |
Other values (90) | 2742 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5404 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 706 | 13.1% |
시 | 444 | 8.2% |
주 | 282 | 5.2% |
천 | 263 | 4.9% |
성 | 216 | 4.0% |
산 | 207 | 3.8% |
양 | 158 | 2.9% |
안 | 139 | 2.6% |
영 | 130 | 2.4% |
진 | 117 | 2.2% |
Other values (90) | 2742 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5404 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 706 | 13.1% |
시 | 444 | 8.2% |
주 | 282 | 5.2% |
천 | 263 | 4.9% |
성 | 216 | 4.0% |
산 | 207 | 3.8% |
양 | 158 | 2.9% |
안 | 139 | 2.6% |
영 | 130 | 2.4% |
진 | 117 | 2.2% |
Other values (90) | 2742 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5404 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
군 | 706 | 13.1% |
시 | 444 | 8.2% |
주 | 282 | 5.2% |
천 | 263 | 4.9% |
성 | 216 | 4.0% |
산 | 207 | 3.8% |
양 | 158 | 2.9% |
안 | 139 | 2.6% |
영 | 130 | 2.4% |
진 | 117 | 2.2% |
Other values (90) | 2742 |
누에구분
Categorical
Distinct | 10 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.8 KiB |
잠분 | |
---|---|
수번데기 | |
생누에 | |
건조누에 | |
누에고치 | |
Other values (5) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.9872238 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 수번데기 |
---|---|
2nd row | 수번데기 |
3rd row | 수번데기 |
4th row | 수번데기 |
5th row | 수번데기 |
Common Values
Value | Count | Frequency (%) |
잠분 | 696 | |
수번데기 | 327 | |
생누에 | 315 | |
건조누에 | 315 | |
누에고치 | 315 | |
뽕잎 | 205 | 7.1% |
오디 | 204 | 7.0% |
기타 | 204 | 7.0% |
동충하초 | 202 | 7.0% |
동중하초 | 113 | 3.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
잠분 | 696 | |
수번데기 | 327 | |
생누에 | 315 | |
건조누에 | 315 | |
누에고치 | 315 | |
뽕잎 | 205 | 7.1% |
오디 | 204 | 7.0% |
기타 | 204 | 7.0% |
동충하초 | 202 | 7.0% |
동중하초 | 113 | 3.9% |
농가수(호)
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 140 |
---|---|
Distinct (%) | 6.6% |
Missing | 783 |
Missing (%) | 27.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 22.416943 |
Minimum | 0 |
---|---|
Maximum | 3431 |
Zeros | 1239 |
Zeros (%) | 42.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.6 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 3 |
95-th percentile | 68 |
Maximum | 3431 |
Range | 3431 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 168.96937 |
---|---|
Coefficient of variation (CV) | 7.5375743 |
Kurtosis | 292.02177 |
Mean | 22.416943 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 15.948923 |
Sum | 47367 |
Variance | 28550.649 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 1239 | |
1 | 219 | 7.6% |
2 | 120 | 4.1% |
3 | 61 | 2.1% |
4 | 49 | 1.7% |
5 | 42 | 1.5% |
6 | 23 | 0.8% |
10 | 21 | 0.7% |
7 | 19 | 0.7% |
8 | 17 | 0.6% |
Other values (130) | 303 | 10.5% |
(Missing) | 783 |
Value | Count | Frequency (%) |
0 | 1239 | |
1 | 219 | 7.6% |
2 | 120 | 4.1% |
3 | 61 | 2.1% |
4 | 49 | 1.7% |
5 | 42 | 1.5% |
6 | 23 | 0.8% |
7 | 19 | 0.7% |
8 | 17 | 0.6% |
9 | 10 | 0.3% |
Value | Count | Frequency (%) |
3431 | 1 | |
3424 | 1 | |
3326 | 1 | |
3102 | 1 | |
2184 | 1 | |
1006 | 2 | |
991 | 1 | |
987 | 1 | |
953 | 1 | |
939 | 1 |
사육량(상자)
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 183 |
---|---|
Distinct (%) | 9.3% |
Missing | 932 |
Missing (%) | 32.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 56.862525 |
Minimum | 0 |
---|---|
Maximum | 7093 |
Zeros | 1516 |
Zeros (%) | 52.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.6 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 131 |
Maximum | 7093 |
Range | 7093 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 382.09593 |
---|---|
Coefficient of variation (CV) | 6.719644 |
Kurtosis | 183.93365 |
Mean | 56.862525 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 12.398197 |
Sum | 111678 |
Variance | 145997.3 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 1516 | |
20 | 22 | 0.8% |
1 | 21 | 0.7% |
5 | 19 | 0.7% |
2 | 14 | 0.5% |
10 | 14 | 0.5% |
6 | 12 | 0.4% |
30 | 12 | 0.4% |
4 | 12 | 0.4% |
15 | 10 | 0.3% |
Other values (173) | 312 | 10.8% |
(Missing) | 932 |
Value | Count | Frequency (%) |
0 | 1516 | |
1 | 21 | 0.7% |
2 | 14 | 0.5% |
3 | 10 | 0.3% |
4 | 12 | 0.4% |
5 | 19 | 0.7% |
6 | 12 | 0.4% |
7 | 2 | 0.1% |
8 | 5 | 0.2% |
9 | 4 | 0.1% |
Value | Count | Frequency (%) |
7093 | 1 | |
6641 | 1 | |
6267 | 1 | |
5315 | 1 | |
5209 | 1 | |
3592 | 1 | |
3533 | 1 | |
2500 | 1 | |
2344 | 1 | |
2310 | 1 |
생산 량(kg)
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 486 |
---|---|
Distinct (%) | 23.0% |
Missing | 784 |
Missing (%) | 27.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 21559.89 |
Minimum | 0 |
---|---|
Maximum | 4789166 |
Zeros | 1240 |
Zeros (%) | 42.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.6 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 600 |
95-th percentile | 34643.5 |
Maximum | 4789166 |
Range | 4789166 |
Interquartile range (IQR) | 600 |
Descriptive statistics
Standard deviation | 216168.26 |
---|---|
Coefficient of variation (CV) | 10.026408 |
Kurtosis | 309.01814 |
Mean | 21559.89 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 16.667578 |
Sum | 45534488 |
Variance | 4.6728718 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 1240 | |
1000.0 | 20 | 0.7% |
200.0 | 19 | 0.7% |
300.0 | 18 | 0.6% |
100.0 | 17 | 0.6% |
1500.0 | 14 | 0.5% |
500.0 | 14 | 0.5% |
20.0 | 13 | 0.4% |
50.0 | 13 | 0.4% |
2000.0 | 11 | 0.4% |
Other values (476) | 733 | |
(Missing) | 784 |
Value | Count | Frequency (%) |
0.0 | 1240 | |
1.0 | 3 | 0.1% |
5.0 | 3 | 0.1% |
6.0 | 1 | < 0.1% |
8.0 | 2 | 0.1% |
9.0 | 1 | < 0.1% |
10.0 | 8 | 0.3% |
13.0 | 3 | 0.1% |
14.0 | 2 | 0.1% |
15.0 | 9 | 0.3% |
Value | Count | Frequency (%) |
4789166.0 | 1 | |
4206435.0 | 1 | |
4057359.0 | 1 | |
3970360.0 | 1 | |
2911360.0 | 1 | |
2000000.0 | 1 | |
1680000.0 | 1 | |
1184000.0 | 1 | |
1132838.0 | 1 | |
1130290.0 | 1 |
연도 | 시도 | 누에구분 | 농가수(호) | 사육량(상자) | 생산 량(kg) | |
---|---|---|---|---|---|---|
연도 | 1.000 | 0.529 | 0.456 | 0.041 | 0.109 | 0.042 |
시도 | 0.529 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
누에구분 | 0.456 | 0.000 | 1.000 | 0.246 | 0.167 | 0.123 |
농가수(호) | 0.041 | 0.000 | 0.246 | 1.000 | 0.396 | 0.901 |
사육량(상자) | 0.109 | 0.000 | 0.167 | 0.396 | 1.000 | 0.000 |
생산 량(kg) | 0.042 | 0.000 | 0.123 | 0.901 | 0.000 | 1.000 |
시도 | 누에구분 | |
---|---|---|
시도 | 1.000 | 0.000 |
누에구분 | 0.000 | 1.000 |
연도 | 농가수(호) | 사육량(상자) | 생산 량(kg) | 시도 | 누에구분 | |
---|---|---|---|---|---|---|
연도 | 1.000 | 0.201 | 0.178 | 0.233 | 0.249 | 0.235 |
농가수(호) | 0.201 | 1.000 | 0.667 | 0.965 | 0.000 | 0.104 |
사육량(상자) | 0.178 | 0.667 | 1.000 | 0.612 | 0.000 | 0.076 |
생산 량(kg) | 0.233 | 0.965 | 0.612 | 1.000 | 0.000 | 0.059 |
시도 | 0.249 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
누에구분 | 0.235 | 0.104 | 0.076 | 0.059 | 0.000 | 1.000 |
연도 | 시도 | 시군 | 누에구분 | 농가수(호) | 사육량(상자) | 생산 량(kg) | |
---|---|---|---|---|---|---|---|
0 | 2014 | 경상남도 | 함안 | 수번데기 | <NA> | <NA> | <NA> |
1 | 2014 | 경상남도 | 창녕 | 수번데기 | <NA> | <NA> | <NA> |
2 | 2014 | 경상남도 | 고성 | 수번데기 | <NA> | <NA> | <NA> |
3 | 2014 | 경상남도 | 남해 | 수번데기 | <NA> | <NA> | <NA> |
4 | 2014 | 경상남도 | 하동 | 수번데기 | <NA> | <NA> | <NA> |
5 | 2014 | 경상남도 | 산청 | 수번데기 | <NA> | <NA> | <NA> |
6 | 2014 | 경상남도 | 함양 | 수번데기 | <NA> | <NA> | <NA> |
7 | 2014 | 경상남도 | 거창 | 수번데기 | 1 | 5 | 100.0 |
8 | 2014 | 경상남도 | 합천 | 수번데기 | <NA> | <NA> | <NA> |
9 | 2014 | 제주광역시 | 제주시 | 잠분 | <NA> | <NA> | <NA> |
연도 | 시도 | 시군 | 누에구분 | 농가수(호) | 사육량(상자) | 생산 량(kg) | |
---|---|---|---|---|---|---|---|
2886 | 2008 | 강원도 | <NA> | 잠분 | 0 | 0 | 0.0 |
2887 | 2008 | 충청북도 | <NA> | 잠분 | 0 | 0 | 0.0 |
2888 | 2008 | 충청남도 | <NA> | 잠분 | 0 | 0 | 0.0 |
2889 | 2008 | 전라북도 | <NA> | 잠분 | 0 | 0 | 0.0 |
2890 | 2008 | 전라남도 | <NA> | 잠분 | 0 | 0 | 0.0 |
2891 | 2008 | 경상북도 | <NA> | 잠분 | 0 | 0 | 0.0 |
2892 | 2008 | 경상남도 | <NA> | 잠분 | 0 | 0 | 0.0 |
2893 | 2008 | 제주특별자치도 | <NA> | 잠분 | 0 | 0 | 0.0 |
2894 | 2008 | 세종특별자치시 | <NA> | 잠분 | 0 | 0 | 0.0 |
2895 | 2008 | 서울특별시 | <NA> | 뽕잎 | 0 | 0 | 0.0 |
Most frequently occurring
연도 | 시도 | 시군 | 누에구분 | 농가수(호) | 사육량(상자) | 생산 량(kg) | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 2014 | 강원도 | 고성 | 잠분 | <NA> | <NA> | <NA> | 4 |
1 | 2014 | 강원도 | 삼척 | 잠분 | <NA> | <NA> | <NA> | 4 |
9 | 2014 | 강원도 | 홍천 | 잠분 | <NA> | <NA> | <NA> | 4 |
22 | 2014 | 경상남도 | 거제 | 잠분 | <NA> | <NA> | <NA> | 4 |
26 | 2014 | 경상남도 | 남해 | 잠분 | <NA> | <NA> | <NA> | 4 |
27 | 2014 | 경상남도 | 사천 | 잠분 | <NA> | <NA> | <NA> | 4 |
28 | 2014 | 경상남도 | 양산 | 잠분 | <NA> | <NA> | <NA> | 4 |
32 | 2014 | 경상남도 | 창원 | 잠분 | <NA> | <NA> | <NA> | 4 |
35 | 2014 | 경상남도 | 함안 | 잠분 | <NA> | <NA> | <NA> | 4 |
37 | 2014 | 경상남도 | 합천 | 잠분 | <NA> | <NA> | <NA> | 4 |