Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 2794 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 191.1 KiB |
Average record size in memory | 70.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 3 |
Numeric | 4 |
Dataset
Description | 농산물 유통 관련하여 가공용쌀 공급업에 대해 지정용도외 사용, 원산지표시, 관리대장 비치 등 단속정보(단속년월, 시도명, 조사건수, 위반업체수, 지정용도외 사용 건수, 표시위반 건수,관리대장 미비치 건수, 기타 ) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20170912000000000790 |
위반업체수 is highly overall correlated with 관리대장미비치건수 and 1 other fields | High correlation |
관리대장미비치건수 is highly overall correlated with 위반업체수 | High correlation |
기타 is highly overall correlated with 위반업체수 | High correlation |
지정용도외 사용건수 is highly imbalanced (96.3%) | Imbalance |
표시위반건수 is highly imbalanced (99.1%) | Imbalance |
위반업체수 has 2446 (87.5%) zeros | Zeros |
관리대장미비치건수 has 2615 (93.6%) zeros | Zeros |
기타 has 2600 (93.1%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-23 07:22:46.441803 |
---|---|
Analysis finished | 2024-03-23 07:22:52.236807 |
Duration | 5.8 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
단속년월
Date
Distinct | 256 |
---|---|
Distinct (%) | 9.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
Minimum | 1999-12-01 00:00:00 |
---|---|
Maximum | 2022-02-01 00:00:00 |
시도명
Categorical
Distinct | 18 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
경기도 | |
---|---|
강원도 | |
충청남도 | |
경상남도 | |
전라남도 | |
Other values (13) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.2491052 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전라남도 |
---|---|
2nd row | 충청북도 |
3rd row | 전라남도 |
4th row | 인천광역시 |
5th row | 경기도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 252 | 9.0% |
강원도 | 244 | 8.7% |
충청남도 | 238 | 8.5% |
경상남도 | 230 | 8.2% |
전라남도 | 215 | 7.7% |
경상북도 | 212 | 7.6% |
충청북도 | 205 | 7.3% |
전라북도 | 200 | 7.2% |
인천광역시 | 172 | 6.2% |
서울특별시 | 153 | 5.5% |
Other values (8) | 673 |
Length
Value | Count | Frequency (%) |
경기도 | 252 | 9.0% |
강원도 | 244 | 8.7% |
충청남도 | 238 | 8.5% |
경상남도 | 230 | 8.2% |
전라남도 | 215 | 7.7% |
경상북도 | 212 | 7.6% |
충청북도 | 205 | 7.3% |
전라북도 | 200 | 7.2% |
인천광역시 | 172 | 6.2% |
서울특별시 | 153 | 5.5% |
Other values (8) | 673 |
조사건수
Real number (ℝ)
Distinct | 116 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 18.637079 |
Minimum | 1 |
---|---|
Maximum | 229 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 5 |
median | 13 |
Q3 | 24 |
95-th percentile | 57 |
Maximum | 229 |
Range | 228 |
Interquartile range (IQR) | 19 |
Descriptive statistics
Standard deviation | 20.469726 |
---|---|
Coefficient of variation (CV) | 1.0983333 |
Kurtosis | 12.464927 |
Mean | 18.637079 |
Median Absolute Deviation (MAD) | 9 |
Skewness | 2.7943272 |
Sum | 52072 |
Variance | 419.00967 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 199 | 7.1% |
3 | 160 | 5.7% |
4 | 135 | 4.8% |
2 | 127 | 4.5% |
5 | 113 | 4.0% |
7 | 109 | 3.9% |
6 | 105 | 3.8% |
13 | 103 | 3.7% |
10 | 92 | 3.3% |
12 | 90 | 3.2% |
Other values (106) | 1561 |
Value | Count | Frequency (%) |
1 | 199 | |
2 | 127 | |
3 | 160 | |
4 | 135 | |
5 | 113 | |
6 | 105 | |
7 | 109 | |
8 | 84 | |
9 | 81 | |
10 | 92 |
Value | Count | Frequency (%) |
229 | 1 | |
178 | 1 | |
169 | 1 | |
147 | 1 | |
144 | 1 | |
141 | 2 | |
132 | 1 | |
125 | 2 | |
124 | 1 | |
122 | 2 |
위반업체수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 9 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.18396564 |
Minimum | 0 |
---|---|
Maximum | 9 |
Zeros | 2446 |
Zeros (%) | 87.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 1 |
Maximum | 9 |
Range | 9 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.60946164 |
---|---|
Coefficient of variation (CV) | 3.3129101 |
Kurtosis | 43.46241 |
Mean | 0.18396564 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 5.43509 |
Sum | 514 |
Variance | 0.37144349 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 2446 | |
1 | 256 | 9.2% |
2 | 52 | 1.9% |
3 | 24 | 0.9% |
4 | 7 | 0.3% |
5 | 5 | 0.2% |
7 | 2 | 0.1% |
9 | 1 | < 0.1% |
6 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 2446 | |
1 | 256 | 9.2% |
2 | 52 | 1.9% |
3 | 24 | 0.9% |
4 | 7 | 0.3% |
5 | 5 | 0.2% |
6 | 1 | < 0.1% |
7 | 2 | 0.1% |
9 | 1 | < 0.1% |
Value | Count | Frequency (%) |
9 | 1 | < 0.1% |
7 | 2 | 0.1% |
6 | 1 | < 0.1% |
5 | 5 | 0.2% |
4 | 7 | 0.3% |
3 | 24 | 0.9% |
2 | 52 | 1.9% |
1 | 256 | 9.2% |
0 | 2446 |
지정용도외 사용건수
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
0 | |
---|---|
1 | 21 |
3 | 1 |
2 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 2771 | |
1 | 21 | 0.8% |
3 | 1 | < 0.1% |
2 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 2771 | |
1 | 21 | 0.8% |
3 | 1 | < 0.1% |
2 | 1 | < 0.1% |
관리대장미비치건수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 8 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.10093057 |
Minimum | 0 |
---|---|
Maximum | 9 |
Zeros | 2615 |
Zeros (%) | 93.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 1 |
Maximum | 9 |
Range | 9 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.48667809 |
---|---|
Coefficient of variation (CV) | 4.8219098 |
Kurtosis | 86.570862 |
Mean | 0.10093057 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 7.8539628 |
Sum | 282 |
Variance | 0.23685556 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 2615 | |
1 | 124 | 4.4% |
2 | 33 | 1.2% |
3 | 10 | 0.4% |
4 | 5 | 0.2% |
6 | 3 | 0.1% |
5 | 3 | 0.1% |
9 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 2615 | |
1 | 124 | 4.4% |
2 | 33 | 1.2% |
3 | 10 | 0.4% |
4 | 5 | 0.2% |
5 | 3 | 0.1% |
6 | 3 | 0.1% |
9 | 1 | < 0.1% |
Value | Count | Frequency (%) |
9 | 1 | < 0.1% |
6 | 3 | 0.1% |
5 | 3 | 0.1% |
4 | 5 | 0.2% |
3 | 10 | 0.4% |
2 | 33 | 1.2% |
1 | 124 | 4.4% |
0 | 2615 |
표시위반건수
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
0 | |
---|---|
1 | 2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 2792 | |
1 | 2 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 2792 | |
1 | 2 | 0.1% |
기타
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 9 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.10665712 |
Minimum | 0 |
---|---|
Maximum | 10 |
Zeros | 2600 |
Zeros (%) | 93.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 1 |
Maximum | 10 |
Range | 10 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.5028441 |
---|---|
Coefficient of variation (CV) | 4.7145853 |
Kurtosis | 100.64506 |
Mean | 0.10665712 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 8.275435 |
Sum | 298 |
Variance | 0.25285219 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 2600 | |
1 | 141 | 5.0% |
2 | 31 | 1.1% |
3 | 9 | 0.3% |
4 | 6 | 0.2% |
5 | 3 | 0.1% |
6 | 2 | 0.1% |
10 | 1 | < 0.1% |
7 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 2600 | |
1 | 141 | 5.0% |
2 | 31 | 1.1% |
3 | 9 | 0.3% |
4 | 6 | 0.2% |
5 | 3 | 0.1% |
6 | 2 | 0.1% |
7 | 1 | < 0.1% |
10 | 1 | < 0.1% |
Value | Count | Frequency (%) |
10 | 1 | < 0.1% |
7 | 1 | < 0.1% |
6 | 2 | 0.1% |
5 | 3 | 0.1% |
4 | 6 | 0.2% |
3 | 9 | 0.3% |
2 | 31 | 1.1% |
1 | 141 | 5.0% |
0 | 2600 |
시도명 | 조사건수 | 위반업체수 | 지정용도외 사용건수 | 관리대장미비치건수 | 표시위반건수 | 기타 | |
---|---|---|---|---|---|---|---|
시도명 | 1.000 | 0.459 | 0.206 | 0.000 | 0.163 | 0.000 | 0.164 |
조사건수 | 0.459 | 1.000 | 0.415 | 0.000 | 0.306 | 0.093 | 0.322 |
위반업체수 | 0.206 | 0.415 | 1.000 | 0.292 | 0.836 | 0.187 | 0.908 |
지정용도외 사용건수 | 0.000 | 0.000 | 0.292 | 1.000 | 0.000 | 0.000 | 0.034 |
관리대장미비치건수 | 0.163 | 0.306 | 0.836 | 0.000 | 1.000 | 0.042 | 0.296 |
표시위반건수 | 0.000 | 0.093 | 0.187 | 0.000 | 0.042 | 1.000 | 0.013 |
기타 | 0.164 | 0.322 | 0.908 | 0.034 | 0.296 | 0.013 | 1.000 |
지정용도외 사용건수 | 표시위반건수 | 시도명 | |
---|---|---|---|
지정용도외 사용건수 | 1.000 | 0.000 | 0.000 |
표시위반건수 | 0.000 | 1.000 | 0.000 |
시도명 | 0.000 | 0.000 | 1.000 |
조사건수 | 위반업체수 | 관리대장미비치건수 | 기타 | 시도명 | 지정용도외 사용건수 | 표시위반건수 | |
---|---|---|---|---|---|---|---|
조사건수 | 1.000 | 0.238 | 0.190 | 0.153 | 0.169 | 0.000 | 0.092 |
위반업체수 | 0.238 | 1.000 | 0.700 | 0.727 | 0.070 | 0.190 | 0.187 |
관리대장미비치건수 | 0.190 | 0.700 | 1.000 | 0.167 | 0.069 | 0.000 | 0.032 |
기타 | 0.153 | 0.727 | 0.167 | 1.000 | 0.031 | 0.000 | 0.000 |
시도명 | 0.169 | 0.070 | 0.069 | 0.031 | 1.000 | 0.000 | 0.000 |
지정용도외 사용건수 | 0.000 | 0.190 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
표시위반건수 | 0.092 | 0.187 | 0.032 | 0.000 | 0.000 | 0.000 | 1.000 |
단속년월 | 시도명 | 조사건수 | 위반업체수 | 지정용도외 사용건수 | 관리대장미비치건수 | 표시위반건수 | 기타 | |
---|---|---|---|---|---|---|---|---|
0 | 1999-12-01 | 전라남도 | 1 | 0 | 0 | 0 | 0 | 0 |
1 | 2000-09-01 | 충청북도 | 1 | 0 | 0 | 0 | 0 | 0 |
2 | 2000-09-01 | 전라남도 | 1 | 0 | 0 | 0 | 0 | 0 |
3 | 2001-01-01 | 인천광역시 | 1 | 0 | 0 | 0 | 0 | 0 |
4 | 2001-01-01 | 경기도 | 7 | 0 | 0 | 0 | 0 | 0 |
5 | 2001-01-01 | 강원도 | 9 | 0 | 0 | 0 | 0 | 0 |
6 | 2001-01-01 | 충청북도 | 22 | 0 | 0 | 0 | 0 | 0 |
7 | 2001-01-01 | 충청남도 | 4 | 0 | 0 | 0 | 0 | 0 |
8 | 2001-01-01 | 전라남도 | 2 | 0 | 0 | 0 | 0 | 0 |
9 | 2001-01-01 | 경상북도 | 12 | 0 | 0 | 0 | 0 | 0 |
단속년월 | 시도명 | 조사건수 | 위반업체수 | 지정용도외 사용건수 | 관리대장미비치건수 | 표시위반건수 | 기타 | |
---|---|---|---|---|---|---|---|---|
2784 | 2022-01-01 | 경상북도 | 11 | 1 | 0 | 0 | 0 | 1 |
2785 | 2022-01-01 | 경상남도 | 5 | 0 | 0 | 0 | 0 | 0 |
2786 | 2022-02-01 | 광주광역시 | 3 | 0 | 0 | 0 | 0 | 0 |
2787 | 2022-02-01 | 울산광역시 | 1 | 0 | 0 | 0 | 0 | 0 |
2788 | 2022-02-01 | 경기도 | 8 | 0 | 0 | 0 | 0 | 0 |
2789 | 2022-02-01 | 강원도 | 1 | 0 | 0 | 0 | 0 | 0 |
2790 | 2022-02-01 | 충청북도 | 1 | 0 | 0 | 0 | 0 | 0 |
2791 | 2022-02-01 | 충청남도 | 3 | 0 | 0 | 0 | 0 | 0 |
2792 | 2022-02-01 | 전라남도 | 3 | 0 | 0 | 0 | 0 | 0 |
2793 | 2022-02-01 | 경상남도 | 9 | 0 | 0 | 0 | 0 | 0 |