Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 275 |
Missing cells | 305 |
Missing cells (%) | 15.8% |
Duplicate rows | 3 |
Duplicate rows (%) | 1.1% |
Total size in memory | 16.5 KiB |
Average record size in memory | 61.5 B |
Variable types
Numeric | 2 |
---|---|
Boolean | 1 |
Text | 1 |
Unsupported | 1 |
Categorical | 2 |
Dataset
Description | 생산농가 패널의 경영규모, 재배기술, 투입, 산출, 비용 등 경영실태 조사분석관련 내부 관리시스템으로 질문번호, 답변번호, 기타여부, 답변텍스트, 이동할페이지, 이동할시작질문번호, 이동할끝질문번호를 제공합니다. |
---|---|
Author | 충청북도 |
URL | https://www.data.go.kr/data/15050270/fileData.do |
Dataset has 3 (1.1%) duplicate rows | Duplicates |
이동할시작질문번호 is highly overall correlated with 질문번호 and 3 other fields | High correlation |
기타여부 is highly overall correlated with 이동할시작질문번호 and 1 other fields | High correlation |
이동할끝질문번호 is highly overall correlated with 기타여부 and 1 other fields | High correlation |
질문번호 is highly overall correlated with 이동할시작질문번호 | High correlation |
답변번호 is highly overall correlated with 이동할시작질문번호 | High correlation |
기타여부 is highly imbalanced (50.3%) | Imbalance |
이동할시작질문번호 is highly imbalanced (94.8%) | Imbalance |
이동할끝질문번호 is highly imbalanced (93.9%) | Imbalance |
답변텍스트 has 30 (10.9%) missing values | Missing |
이동할페이지 has 275 (100.0%) missing values | Missing |
이동할페이지 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-12 23:48:09.859151 |
---|---|
Analysis finished | 2023-12-12 23:48:10.534125 |
Duration | 0.67 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
질문번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 46 |
---|---|
Distinct (%) | 16.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 38.767273 |
Minimum | 1 |
---|---|
Maximum | 81 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1.7 |
Q1 | 26.5 |
median | 42 |
Q3 | 49.5 |
95-th percentile | 77 |
Maximum | 81 |
Range | 80 |
Interquartile range (IQR) | 23 |
Descriptive statistics
Standard deviation | 19.831692 |
---|---|
Coefficient of variation (CV) | 0.51155757 |
Kurtosis | -0.1986765 |
Mean | 38.767273 |
Median Absolute Deviation (MAD) | 10 |
Skewness | -0.050776399 |
Sum | 10661 |
Variance | 393.29601 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
45 | 15 | 5.5% |
42 | 15 | 5.5% |
1 | 14 | 5.1% |
47 | 13 | 4.7% |
23 | 12 | 4.4% |
34 | 12 | 4.4% |
32 | 10 | 3.6% |
33 | 10 | 3.6% |
46 | 10 | 3.6% |
44 | 9 | 3.3% |
Other values (36) | 155 |
Value | Count | Frequency (%) |
1 | 14 | |
2 | 5 | 1.8% |
3 | 3 | 1.1% |
4 | 5 | 1.8% |
7 | 3 | 1.1% |
9 | 4 | 1.5% |
11 | 2 | 0.7% |
17 | 2 | 0.7% |
21 | 2 | 0.7% |
22 | 5 | 1.8% |
Value | Count | Frequency (%) |
81 | 4 | |
79 | 8 | |
77 | 4 | |
74 | 3 | 1.1% |
69 | 5 | |
68 | 2 | 0.7% |
65 | 4 | |
61 | 5 | |
60 | 2 | 0.7% |
58 | 4 |
답변번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.2 |
Minimum | 1 |
---|---|
Maximum | 10 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 3 |
Q3 | 4 |
95-th percentile | 8 |
Maximum | 10 |
Range | 9 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 2.0875019 |
---|---|
Coefficient of variation (CV) | 0.65234435 |
Kurtosis | 0.93894984 |
Mean | 3.2 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.1309636 |
Sum | 880 |
Variance | 4.3576642 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 64 | |
2 | 63 | |
3 | 48 | |
4 | 38 | |
5 | 28 | |
6 | 10 | 3.6% |
7 | 9 | 3.3% |
8 | 7 | 2.5% |
9 | 5 | 1.8% |
10 | 3 | 1.1% |
Value | Count | Frequency (%) |
1 | 64 | |
2 | 63 | |
3 | 48 | |
4 | 38 | |
5 | 28 | |
6 | 10 | 3.6% |
7 | 9 | 3.3% |
8 | 7 | 2.5% |
9 | 5 | 1.8% |
10 | 3 | 1.1% |
Value | Count | Frequency (%) |
10 | 3 | 1.1% |
9 | 5 | 1.8% |
8 | 7 | 2.5% |
7 | 9 | 3.3% |
6 | 10 | 3.6% |
5 | 28 | |
4 | 38 | |
3 | 48 | |
2 | 63 | |
1 | 64 |
기타여부
Boolean
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 407.0 B |
False | |
---|---|
True |
Value | Count | Frequency (%) |
False | 245 | |
True | 30 | 10.9% |
답변텍스트
Text
MISSING
 
Distinct | 149 |
---|---|
Distinct (%) | 60.8% |
Missing | 30 |
Missing (%) | 10.9% |
Memory size | 2.3 KiB |
Length
Max length | 36 |
---|---|
Median length | 18 |
Mean length | 6.8367347 |
Min length | 1 |
Characters and Unicode
Total characters | 1675 |
---|---|
Distinct characters | 238 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 93 ? |
---|---|
Unique (%) | 38.0% |
Sample
1st row | 개별농가 |
---|---|
2nd row | 영농조합법인 |
3rd row | 농업회사법인 |
4th row | 마을기업 / 농촌공동체 회사 |
5th row | 사회적 기업 / 협동조합(농협, 원협, 능금조합은 해당되지 않음) |
Value | Count | Frequency (%) |
14 | 3.2% | |
수용한다 | 12 | 2.8% |
발생하였다 | 12 | 2.8% |
예 | 8 | 1.8% |
안한다 | 7 | 1.6% |
한다 | 7 | 1.6% |
아니오 | 7 | 1.6% |
방제 | 7 | 1.6% |
매우 | 5 | 1.1% |
않았다 | 4 | 0.9% |
Other values (197) | 353 |
Most occurring characters
Value | Count | Frequency (%) |
191 | 11.4% | |
다 | 64 | 3.8% |
농 | 48 | 2.9% |
. | 43 | 2.6% |
수 | 33 | 2.0% |
가 | 29 | 1.7% |
한 | 29 | 1.7% |
하 | 28 | 1.7% |
관 | 26 | 1.6% |
기 | 25 | 1.5% |
Other values (228) | 1159 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1317 | |
Space Separator | 191 | 11.4% |
Other Punctuation | 65 | 3.9% |
Decimal Number | 49 | 2.9% |
Open Punctuation | 15 | 0.9% |
Close Punctuation | 15 | 0.9% |
Uppercase Letter | 15 | 0.9% |
Math Symbol | 7 | 0.4% |
Dash Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
다 | 64 | 4.9% |
농 | 48 | 3.6% |
수 | 33 | 2.5% |
가 | 29 | 2.2% |
한 | 29 | 2.2% |
하 | 28 | 2.1% |
관 | 26 | 2.0% |
기 | 25 | 1.9% |
이 | 24 | 1.8% |
용 | 22 | 1.7% |
Other values (206) | 989 |
Decimal Number
Value | Count | Frequency (%) |
1 | 15 | |
5 | 14 | |
6 | 11 | |
2 | 6 | 12.2% |
3 | 2 | 4.1% |
0 | 1 | 2.0% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 5 | |
P | 3 | |
G | 3 | |
C | 2 | 13.3% |
T | 1 | 6.7% |
V | 1 | 6.7% |
Other Punctuation
Value | Count | Frequency (%) |
. | 43 | |
, | 10 | 15.4% |
/ | 8 | 12.3% |
· | 4 | 6.2% |
Math Symbol
Value | Count | Frequency (%) |
~ | 6 | |
+ | 1 | 14.3% |
Space Separator
Value | Count | Frequency (%) |
191 |
Open Punctuation
Value | Count | Frequency (%) |
( | 15 |
Close Punctuation
Value | Count | Frequency (%) |
) | 15 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1317 | |
Common | 343 | 20.5% |
Latin | 15 | 0.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
다 | 64 | 4.9% |
농 | 48 | 3.6% |
수 | 33 | 2.5% |
가 | 29 | 2.2% |
한 | 29 | 2.2% |
하 | 28 | 2.1% |
관 | 26 | 2.0% |
기 | 25 | 1.9% |
이 | 24 | 1.8% |
용 | 22 | 1.7% |
Other values (206) | 989 |
Common
Value | Count | Frequency (%) |
191 | ||
. | 43 | 12.5% |
( | 15 | 4.4% |
1 | 15 | 4.4% |
) | 15 | 4.4% |
5 | 14 | 4.1% |
6 | 11 | 3.2% |
, | 10 | 2.9% |
/ | 8 | 2.3% |
2 | 6 | 1.7% |
Other values (6) | 15 | 4.4% |
Latin
Value | Count | Frequency (%) |
A | 5 | |
P | 3 | |
G | 3 | |
C | 2 | 13.3% |
T | 1 | 6.7% |
V | 1 | 6.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1317 | |
ASCII | 354 | 21.1% |
None | 4 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
191 | ||
. | 43 | 12.1% |
( | 15 | 4.2% |
1 | 15 | 4.2% |
) | 15 | 4.2% |
5 | 14 | 4.0% |
6 | 11 | 3.1% |
, | 10 | 2.8% |
/ | 8 | 2.3% |
2 | 6 | 1.7% |
Other values (11) | 26 | 7.3% |
Hangul
Value | Count | Frequency (%) |
다 | 64 | 4.9% |
농 | 48 | 3.6% |
수 | 33 | 2.5% |
가 | 29 | 2.2% |
한 | 29 | 2.2% |
하 | 28 | 2.1% |
관 | 26 | 2.0% |
기 | 25 | 1.9% |
이 | 24 | 1.8% |
용 | 22 | 1.7% |
Other values (206) | 989 |
None
Value | Count | Frequency (%) |
· | 4 |
이동할페이지
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 275 |
---|---|
Missing (%) | 100.0% |
Memory size | 2.5 KiB |
이동할시작질문번호
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
<NA> | |
---|---|
36 | 1 |
45 | 1 |
49 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9781818 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 1.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 272 | |
36 | 1 | 0.4% |
45 | 1 | 0.4% |
49 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 272 | |
36 | 1 | 0.4% |
45 | 1 | 0.4% |
49 | 1 | 0.4% |
이동할끝질문번호
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
<NA> | |
---|---|
50 | 2 |
36 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9781818 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 272 | |
50 | 2 | 0.7% |
36 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 272 | |
50 | 2 | 0.7% |
36 | 1 | 0.4% |
질문번호 | 답변번호 | 기타여부 | 이동할시작질문번호 | 이동할끝질문번호 | |
---|---|---|---|---|---|
질문번호 | 1.000 | 0.000 | 0.000 | 1.000 | 0.000 |
답변번호 | 0.000 | 1.000 | 0.554 | 1.000 | 0.000 |
기타여부 | 0.000 | 0.554 | 1.000 | NaN | NaN |
이동할시작질문번호 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
이동할끝질문번호 | 0.000 | 0.000 | NaN | 1.000 | 1.000 |
이동할시작질문번호 | 기타여부 | 이동할끝질문번호 | |
---|---|---|---|
이동할시작질문번호 | 1.000 | 1.000 | 1.000 |
기타여부 | 1.000 | 1.000 | 1.000 |
이동할끝질문번호 | 1.000 | 1.000 | 1.000 |
질문번호 | 답변번호 | 기타여부 | 이동할시작질문번호 | 이동할끝질문번호 | |
---|---|---|---|---|---|
질문번호 | 1.000 | -0.107 | 0.000 | 1.000 | 0.000 |
답변번호 | -0.107 | 1.000 | 0.421 | 1.000 | 0.000 |
기타여부 | 0.000 | 0.421 | 1.000 | 1.000 | 1.000 |
이동할시작질문번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
이동할끝질문번호 | 0.000 | 0.000 | 1.000 | 1.000 | 1.000 |
질문번호 | 답변번호 | 기타여부 | 답변텍스트 | 이동할페이지 | 이동할시작질문번호 | 이동할끝질문번호 | |
---|---|---|---|---|---|---|---|
0 | 2 | 1 | N | 개별농가 | <NA> | <NA> | <NA> |
1 | 2 | 2 | N | 영농조합법인 | <NA> | <NA> | <NA> |
2 | 2 | 3 | N | 농업회사법인 | <NA> | <NA> | <NA> |
3 | 2 | 4 | N | 마을기업 / 농촌공동체 회사 | <NA> | <NA> | <NA> |
4 | 2 | 5 | N | 사회적 기업 / 협동조합(농협, 원협, 능금조합은 해당되지 않음) | <NA> | <NA> | <NA> |
5 | 7 | 1 | N | 손 적화 | <NA> | <NA> | <NA> |
6 | 7 | 2 | N | 약제 적화 | <NA> | <NA> | <NA> |
7 | 7 | 3 | Y | <NA> | <NA> | <NA> | <NA> |
8 | 9 | 1 | N | 꽃가루(인력) | <NA> | <NA> | <NA> |
9 | 9 | 2 | N | 꽃가루(기계) | <NA> | <NA> | <NA> |
질문번호 | 답변번호 | 기타여부 | 답변텍스트 | 이동할페이지 | 이동할시작질문번호 | 이동할끝질문번호 | |
---|---|---|---|---|---|---|---|
265 | 79 | 1 | N | 생산없음 | <NA> | <NA> | <NA> |
266 | 79 | 2 | N | 술 | <NA> | <NA> | <NA> |
267 | 79 | 3 | N | 떡 | <NA> | <NA> | <NA> |
268 | 79 | 4 | N | 한과 | <NA> | <NA> | <NA> |
269 | 79 | 5 | N | 과자 | <NA> | <NA> | <NA> |
270 | 79 | 6 | Y | <NA> | <NA> | <NA> | <NA> |
271 | 81 | 1 | N | 무농약농산물 | <NA> | <NA> | <NA> |
272 | 81 | 2 | N | 유기농산물 | <NA> | <NA> | <NA> |
273 | 81 | 3 | N | GAP | <NA> | <NA> | <NA> |
274 | 81 | 4 | Y | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
질문번호 | 답변번호 | 기타여부 | 답변텍스트 | 이동할시작질문번호 | 이동할끝질문번호 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | 31 | 1 | N | 예 | <NA> | <NA> | 2 |
1 | 31 | 2 | N | 아니오 | <NA> | <NA> | 2 |
2 | 35 | 2 | N | 안한다 | <NA> | <NA> | 2 |