Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 298 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 24.9 KiB |
Average record size in memory | 85.4 B |
Variable types
Categorical | 5 |
---|---|
Numeric | 4 |
DateTime | 1 |
Dataset
Description | 국립종자원 국가보증 포장검사 신청 정보로 작물명, 채종단계, 차수, 신청면적, 소재지수, 필지수, 품종수 등의 정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15119579/fileData.do |
데이터 추출일자 has constant value "" | Constant |
신청면적 is highly overall correlated with 필지수 | High correlation |
필지수 is highly overall correlated with 신청면적 and 1 other fields | High correlation |
품종수 is highly overall correlated with 필지수 | High correlation |
작물명 is highly overall correlated with 차수 | High correlation |
차수 is highly overall correlated with 작물명 | High correlation |
차수 is highly imbalanced (71.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 07:59:30.411209 |
---|---|
Analysis finished | 2023-12-12 07:59:33.034583 |
Duration | 2.62 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
년산
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
2021 | |
---|---|
2022 | |
2023 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2021 |
---|---|
2nd row | 2021 |
3rd row | 2021 |
4th row | 2021 |
5th row | 2021 |
Common Values
Value | Count | Frequency (%) |
2021 | 106 | |
2022 | 100 | |
2023 | 92 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2021 | 106 | |
2022 | 100 | |
2023 | 92 |
검사지원명
Categorical
Distinct | 10 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
전북지원 | |
---|---|
경북지원 | |
충남지원 | |
강원지원 | |
경남지원 | |
Other values (5) |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 4.0536913 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 충북지원 |
---|---|
2nd row | 충북지원 |
3rd row | 충북지원 |
4th row | 충북지원 |
5th row | 충북지원 |
Common Values
Value | Count | Frequency (%) |
전북지원 | 43 | |
경북지원 | 38 | |
충남지원 | 36 | |
강원지원 | 36 | |
경남지원 | 35 | |
전남지원 | 34 | |
충북지원 | 29 | |
제주지원 | 27 | |
동부지원 | 12 | 4.0% |
수도권현장팀 | 8 | 2.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
전북지원 | 43 | |
경북지원 | 38 | |
충남지원 | 36 | |
강원지원 | 36 | |
경남지원 | 35 | |
전남지원 | 34 | |
충북지원 | 29 | |
제주지원 | 27 | |
동부지원 | 12 | 4.0% |
수도권현장팀 | 8 | 2.7% |
작물명
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 4.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
콩 | |
---|---|
벼 | |
겉보리 | |
밀 | |
쌀보리 | |
Other values (8) |
Length
Max length | 8 |
---|---|
Median length | 1 |
Mean length | 2.1342282 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 벼 |
---|---|
2nd row | 벼 |
3rd row | 벼 |
4th row | 겉보리 |
5th row | 겉보리 |
Common Values
Value | Count | Frequency (%) |
콩 | 52 | |
벼 | 48 | |
겉보리 | 37 | |
밀 | 34 | |
쌀보리 | 30 | |
팥 | 24 | |
맥주보리 | 23 | |
봄감자 | 20 | 6.7% |
호밀 | 10 | 3.4% |
청보리(사료용) | 7 | 2.3% |
Other values (3) | 13 | 4.4% |
Length
Value | Count | Frequency (%) |
콩 | 52 | |
벼 | 48 | |
겉보리 | 37 | |
밀 | 34 | |
쌀보리 | 30 | |
팥 | 24 | |
맥주보리 | 23 | |
봄감자 | 20 | 6.7% |
호밀 | 10 | 3.4% |
청보리(사료용 | 7 | 2.3% |
Other values (3) | 13 | 4.4% |
채종단계
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
원원종포 | |
---|---|
원종포 | |
채종포1세대 | |
채종포2세대 | 9 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 3.7114094 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 원원종포 |
---|---|
2nd row | 원종포 |
3rd row | 채종포1세대 |
4th row | 원원종포 |
5th row | 원종포 |
Common Values
Value | Count | Frequency (%) |
원원종포 | 137 | |
원종포 | 136 | |
채종포1세대 | 16 | 5.4% |
채종포2세대 | 9 | 3.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
원원종포 | 137 | |
원종포 | 136 | |
채종포1세대 | 16 | 5.4% |
채종포2세대 | 9 | 3.0% |
차수
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
1차 | |
---|---|
2차 | 15 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1차 |
---|---|
2nd row | 1차 |
3rd row | 1차 |
4th row | 1차 |
5th row | 1차 |
Common Values
Value | Count | Frequency (%) |
1차 | 283 | |
2차 | 15 | 5.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1차 | 283 | |
2차 | 15 | 5.0% |
신청면적
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 132 |
---|---|
Distinct (%) | 44.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 430.58993 |
Minimum | 1 |
---|---|
Maximum | 4350 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 5 |
Q1 | 24.25 |
median | 85.9 |
Q3 | 570 |
95-th percentile | 1521.99 |
Maximum | 4350 |
Range | 4349 |
Interquartile range (IQR) | 545.75 |
Descriptive statistics
Standard deviation | 750.74422 |
---|---|
Coefficient of variation (CV) | 1.7435248 |
Kurtosis | 10.931064 |
Mean | 430.58993 |
Median Absolute Deviation (MAD) | 79.4 |
Skewness | 3.0519529 |
Sum | 128315.8 |
Variance | 563616.89 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
5.0 | 17 | 5.7% |
10.0 | 15 | 5.0% |
50.0 | 12 | 4.0% |
300.0 | 8 | 2.7% |
70.0 | 8 | 2.7% |
100.0 | 6 | 2.0% |
33.0 | 6 | 2.0% |
250.0 | 5 | 1.7% |
60.0 | 5 | 1.7% |
1000.0 | 5 | 1.7% |
Other values (122) | 211 |
Value | Count | Frequency (%) |
1.0 | 1 | 0.3% |
2.0 | 5 | 1.7% |
3.0 | 2 | 0.7% |
4.0 | 4 | 1.3% |
5.0 | 17 | |
6.0 | 3 | 1.0% |
7.0 | 2 | 0.7% |
8.0 | 2 | 0.7% |
9.0 | 1 | 0.3% |
10.0 | 15 |
Value | Count | Frequency (%) |
4350.0 | 2 | |
4163.0 | 2 | |
3760.0 | 2 | |
2915.4 | 1 | |
2908.0 | 1 | |
2807.3 | 1 | |
2506.5 | 1 | |
2366.5 | 1 | |
2217.0 | 1 | |
2051.0 | 1 |
소재지수
Real number (ℝ)
Distinct | 10 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.4765101 |
Minimum | 1 |
---|---|
Maximum | 19 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 19 |
Range | 18 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 1.9680406 |
---|---|
Coefficient of variation (CV) | 1.3329002 |
Kurtosis | 47.854413 |
Mean | 1.4765101 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 6.6870771 |
Sum | 440 |
Variance | 3.8731837 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 245 | |
2 | 35 | 11.7% |
3 | 8 | 2.7% |
4 | 3 | 1.0% |
14 | 2 | 0.7% |
5 | 1 | 0.3% |
6 | 1 | 0.3% |
19 | 1 | 0.3% |
16 | 1 | 0.3% |
15 | 1 | 0.3% |
Value | Count | Frequency (%) |
1 | 245 | |
2 | 35 | 11.7% |
3 | 8 | 2.7% |
4 | 3 | 1.0% |
5 | 1 | 0.3% |
6 | 1 | 0.3% |
14 | 2 | 0.7% |
15 | 1 | 0.3% |
16 | 1 | 0.3% |
19 | 1 | 0.3% |
Value | Count | Frequency (%) |
19 | 1 | 0.3% |
16 | 1 | 0.3% |
15 | 1 | 0.3% |
14 | 2 | 0.7% |
6 | 1 | 0.3% |
5 | 1 | 0.3% |
4 | 3 | 1.0% |
3 | 8 | 2.7% |
2 | 35 | 11.7% |
1 | 245 |
필지수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 43 |
---|---|
Distinct (%) | 14.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9.4060403 |
Minimum | 1 |
---|---|
Maximum | 148 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 3 |
Q3 | 9 |
95-th percentile | 47.6 |
Maximum | 148 |
Range | 147 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 16.473207 |
---|---|
Coefficient of variation (CV) | 1.7513435 |
Kurtosis | 20.743275 |
Mean | 9.4060403 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 3.8746672 |
Sum | 2803 |
Variance | 271.36656 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 89 | |
2 | 48 | |
3 | 19 | 6.4% |
4 | 19 | 6.4% |
6 | 17 | 5.7% |
9 | 15 | 5.0% |
5 | 9 | 3.0% |
12 | 6 | 2.0% |
7 | 6 | 2.0% |
8 | 6 | 2.0% |
Other values (33) | 64 |
Value | Count | Frequency (%) |
1 | 89 | |
2 | 48 | |
3 | 19 | 6.4% |
4 | 19 | 6.4% |
5 | 9 | 3.0% |
6 | 17 | 5.7% |
7 | 6 | 2.0% |
8 | 6 | 2.0% |
9 | 15 | 5.0% |
10 | 5 | 1.7% |
Value | Count | Frequency (%) |
148 | 1 | |
85 | 1 | |
75 | 1 | |
68 | 2 | |
66 | 1 | |
62 | 1 | |
61 | 1 | |
60 | 2 | |
58 | 1 | |
55 | 1 |
품종수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 5.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.2516779 |
Minimum | 1 |
---|---|
Maximum | 16 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 4 |
95-th percentile | 10.15 |
Maximum | 16 |
Range | 15 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 3.3293533 |
---|---|
Coefficient of variation (CV) | 1.0238878 |
Kurtosis | 2.446232 |
Mean | 3.2516779 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.7439552 |
Sum | 969 |
Variance | 11.084593 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 135 | |
2 | 57 | |
3 | 19 | 6.4% |
4 | 17 | 5.7% |
6 | 17 | 5.7% |
8 | 10 | 3.4% |
9 | 10 | 3.4% |
5 | 8 | 2.7% |
10 | 6 | 2.0% |
7 | 4 | 1.3% |
Other values (6) | 15 | 5.0% |
Value | Count | Frequency (%) |
1 | 135 | |
2 | 57 | |
3 | 19 | 6.4% |
4 | 17 | 5.7% |
5 | 8 | 2.7% |
6 | 17 | 5.7% |
7 | 4 | 1.3% |
8 | 10 | 3.4% |
9 | 10 | 3.4% |
10 | 6 | 2.0% |
Value | Count | Frequency (%) |
16 | 2 | 0.7% |
15 | 1 | 0.3% |
14 | 3 | 1.0% |
13 | 2 | 0.7% |
12 | 3 | 1.0% |
11 | 4 | 1.3% |
10 | 6 | |
9 | 10 | |
8 | 10 | |
7 | 4 | 1.3% |
데이터 추출일자
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
Minimum | 2023-08-22 00:00:00 |
---|---|
Maximum | 2023-08-22 00:00:00 |
년산 | 검사지원명 | 작물명 | 채종단계 | 차수 | 신청면적 | 소재지수 | 필지수 | 품종수 | |
---|---|---|---|---|---|---|---|---|---|
년산 | 1.000 | 0.108 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.072 |
검사지원명 | 0.108 | 1.000 | 0.686 | 0.301 | 0.604 | 0.527 | 0.274 | 0.532 | 0.726 |
작물명 | 0.000 | 0.686 | 1.000 | 0.375 | 0.707 | 0.500 | 0.239 | 0.563 | 0.678 |
채종단계 | 0.000 | 0.301 | 0.375 | 1.000 | 0.000 | 0.637 | 0.473 | 0.594 | 0.000 |
차수 | 0.000 | 0.604 | 0.707 | 0.000 | 1.000 | 0.264 | 0.000 | 0.254 | 0.395 |
신청면적 | 0.000 | 0.527 | 0.500 | 0.637 | 0.264 | 1.000 | 0.774 | 0.787 | 0.616 |
소재지수 | 0.000 | 0.274 | 0.239 | 0.473 | 0.000 | 0.774 | 1.000 | 0.653 | 0.243 |
필지수 | 0.000 | 0.532 | 0.563 | 0.594 | 0.254 | 0.787 | 0.653 | 1.000 | 0.632 |
품종수 | 0.072 | 0.726 | 0.678 | 0.000 | 0.395 | 0.616 | 0.243 | 0.632 | 1.000 |
채종단계 | 작물명 | 년산 | 차수 | 검사지원명 | |
---|---|---|---|---|---|
채종단계 | 1.000 | 0.223 | 0.000 | 0.000 | 0.182 |
작물명 | 0.223 | 1.000 | 0.000 | 0.659 | 0.367 |
년산 | 0.000 | 0.000 | 1.000 | 0.000 | 0.063 |
차수 | 0.000 | 0.659 | 0.000 | 1.000 | 0.461 |
검사지원명 | 0.182 | 0.367 | 0.063 | 0.461 | 1.000 |
신청면적 | 소재지수 | 필지수 | 품종수 | 년산 | 검사지원명 | 작물명 | 채종단계 | 차수 | |
---|---|---|---|---|---|---|---|---|---|
신청면적 | 1.000 | 0.321 | 0.792 | 0.435 | 0.000 | 0.271 | 0.239 | 0.463 | 0.260 |
소재지수 | 0.321 | 1.000 | 0.333 | 0.222 | 0.000 | 0.146 | 0.118 | 0.322 | 0.000 |
필지수 | 0.792 | 0.333 | 1.000 | 0.682 | 0.000 | 0.303 | 0.300 | 0.451 | 0.270 |
품종수 | 0.435 | 0.222 | 0.682 | 1.000 | 0.099 | 0.306 | 0.347 | 0.000 | 0.317 |
년산 | 0.000 | 0.000 | 0.000 | 0.099 | 1.000 | 0.063 | 0.000 | 0.000 | 0.000 |
검사지원명 | 0.271 | 0.146 | 0.303 | 0.306 | 0.063 | 1.000 | 0.367 | 0.182 | 0.461 |
작물명 | 0.239 | 0.118 | 0.300 | 0.347 | 0.000 | 0.367 | 1.000 | 0.223 | 0.659 |
채종단계 | 0.463 | 0.322 | 0.451 | 0.000 | 0.000 | 0.182 | 0.223 | 1.000 | 0.000 |
차수 | 0.260 | 0.000 | 0.270 | 0.317 | 0.000 | 0.461 | 0.659 | 0.000 | 1.000 |
년산 | 검사지원명 | 작물명 | 채종단계 | 차수 | 신청면적 | 소재지수 | 필지수 | 품종수 | 데이터 추출일자 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 2021 | 충북지원 | 벼 | 원원종포 | 1차 | 14.0 | 1 | 8 | 8 | 2023-08-22 |
1 | 2021 | 충북지원 | 벼 | 원종포 | 1차 | 300.0 | 1 | 14 | 8 | 2023-08-22 |
2 | 2021 | 충북지원 | 벼 | 채종포1세대 | 1차 | 857.0 | 1 | 19 | 4 | 2023-08-22 |
3 | 2021 | 충북지원 | 겉보리 | 원원종포 | 1차 | 5.0 | 1 | 1 | 1 | 2023-08-22 |
4 | 2021 | 충북지원 | 겉보리 | 원종포 | 1차 | 70.0 | 1 | 2 | 1 | 2023-08-22 |
5 | 2021 | 충북지원 | 콩 | 원원종포 | 1차 | 33.0 | 1 | 3 | 3 | 2023-08-22 |
6 | 2021 | 충북지원 | 콩 | 원종포 | 1차 | 694.0 | 1 | 24 | 3 | 2023-08-22 |
7 | 2021 | 충북지원 | 콩 | 채종포1세대 | 1차 | 12.0 | 1 | 1 | 1 | 2023-08-22 |
8 | 2021 | 충북지원 | 팥 | 원원종포 | 1차 | 1.0 | 1 | 1 | 1 | 2023-08-22 |
9 | 2021 | 충북지원 | 팥 | 원종포 | 1차 | 10.0 | 1 | 1 | 1 | 2023-08-22 |
년산 | 검사지원명 | 작물명 | 채종단계 | 차수 | 신청면적 | 소재지수 | 필지수 | 품종수 | 데이터 추출일자 | |
---|---|---|---|---|---|---|---|---|---|---|
288 | 2023 | 수도권현장팀 | 쌀보리 | 원원종포 | 1차 | 9.0 | 1 | 1 | 1 | 2023-08-22 |
289 | 2023 | 수도권현장팀 | 쌀보리 | 원종포 | 1차 | 100.0 | 1 | 4 | 1 | 2023-08-22 |
290 | 2023 | 수도권현장팀 | 콩 | 원원종포 | 1차 | 32.0 | 1 | 5 | 5 | 2023-08-22 |
291 | 2023 | 수도권현장팀 | 콩 | 원종포 | 1차 | 506.0 | 3 | 5 | 5 | 2023-08-22 |
292 | 2023 | 수도권현장팀 | 팥 | 원원종포 | 1차 | 4.0 | 1 | 1 | 1 | 2023-08-22 |
293 | 2023 | 수도권현장팀 | 팥 | 원종포 | 1차 | 50.0 | 1 | 1 | 1 | 2023-08-22 |
294 | 2023 | 동부지원 | 봄감자 | 원원종포 | 1차 | 520.0 | 1 | 19 | 13 | 2023-08-22 |
295 | 2023 | 동부지원 | 봄감자 | 원종포 | 1차 | 3760.0 | 1 | 61 | 11 | 2023-08-22 |
296 | 2023 | 동부지원 | 봄감자 | 원원종포 | 2차 | 520.0 | 1 | 19 | 13 | 2023-08-22 |
297 | 2023 | 동부지원 | 봄감자 | 원종포 | 2차 | 3760.0 | 1 | 62 | 11 | 2023-08-22 |