Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 2806 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 191.9 KiB |
Average record size in memory | 70.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 3 |
Numeric | 4 |
Dataset
Description | 농산물 유통 관련하여 가공용쌀 공급업에 대해 지정용도외 사용, 원산지표시, 관리대장 비치 등 단속정보(단속년월, 시도명, 조사건수, 위반업체수, 지정용도외 사용 건수, 표시위반 건수,관리대장 미비치 건수, 기타 ) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20170912000000000790 |
위반업체수 is highly overall correlated with 관리대장미비치 건수 and 1 other fields | High correlation |
관리대장미비치 건수 is highly overall correlated with 위반업체수 | High correlation |
기타 is highly overall correlated with 위반업체수 | High correlation |
지정용도외 사용 건수 is highly imbalanced (96.4%) | Imbalance |
표시위반 건수 is highly imbalanced (98.8%) | Imbalance |
위반업체수 has 2456 (87.5%) zeros | Zeros |
관리대장미비치 건수 has 2625 (93.5%) zeros | Zeros |
기타 has 2612 (93.1%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-23 07:23:01.515947 |
---|---|
Analysis finished | 2024-03-23 07:23:07.930844 |
Duration | 6.41 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
단속년월
Text
Distinct | 258 |
---|---|
Distinct (%) | 9.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.1 KiB |
Value | Count | Frequency (%) |
201101 | 17 | 0.6% |
201104 | 17 | 0.6% |
201301 | 17 | 0.6% |
201009 | 17 | 0.6% |
201302 | 17 | 0.6% |
200507 | 16 | 0.6% |
200602 | 16 | 0.6% |
201209 | 16 | 0.6% |
200502 | 16 | 0.6% |
201208 | 16 | 0.6% |
Other values (249) | 2642 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 6573 | |
2 | 3826 | |
1 | 2888 | |
5 | 546 | 3.2% |
6 | 541 | 3.2% |
9 | 530 | 3.1% |
8 | 521 | 3.1% |
7 | 520 | 3.1% |
4 | 453 | 2.7% |
3 | 437 | 2.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 16835 | |
Space Separator | 1 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 6573 | |
2 | 3826 | |
1 | 2888 | |
5 | 546 | 3.2% |
6 | 541 | 3.2% |
9 | 530 | 3.1% |
8 | 521 | 3.1% |
7 | 520 | 3.1% |
4 | 453 | 2.7% |
3 | 437 | 2.6% |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 16836 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 6573 | |
2 | 3826 | |
1 | 2888 | |
5 | 546 | 3.2% |
6 | 541 | 3.2% |
9 | 530 | 3.1% |
8 | 521 | 3.1% |
7 | 520 | 3.1% |
4 | 453 | 2.7% |
3 | 437 | 2.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 16836 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 6573 | |
2 | 3826 | |
1 | 2888 | |
5 | 546 | 3.2% |
6 | 541 | 3.2% |
9 | 530 | 3.1% |
8 | 521 | 3.1% |
7 | 520 | 3.1% |
4 | 453 | 2.7% |
3 | 437 | 2.6% |
시도명
Categorical
Distinct | 18 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.1 KiB |
경기도 | |
---|---|
강원도 | |
충청남도 | |
경상남도 | |
전라남도 | |
Other values (13) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.2494654 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전라남도 |
---|---|
2nd row | 충청북도 |
3rd row | 전라남도 |
4th row | 인천광역시 |
5th row | 경기도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 253 | 9.0% |
강원도 | 245 | 8.7% |
충청남도 | 239 | 8.5% |
경상남도 | 231 | 8.2% |
전라남도 | 216 | 7.7% |
경상북도 | 213 | 7.6% |
충청북도 | 206 | 7.3% |
전라북도 | 201 | 7.2% |
인천광역시 | 172 | 6.1% |
서울특별시 | 154 | 5.5% |
Other values (8) | 676 |
Length
Value | Count | Frequency (%) |
경기도 | 253 | 9.0% |
강원도 | 245 | 8.7% |
충청남도 | 239 | 8.5% |
경상남도 | 231 | 8.2% |
전라남도 | 216 | 7.7% |
경상북도 | 213 | 7.6% |
충청북도 | 206 | 7.3% |
전라북도 | 201 | 7.2% |
인천광역시 | 172 | 6.1% |
서울특별시 | 154 | 5.5% |
Other values (8) | 676 |
조사건수
Real number (ℝ)
Distinct | 116 |
---|---|
Distinct (%) | 4.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 18.635424 |
Minimum | 1 |
---|---|
Maximum | 229 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 5 |
median | 13 |
Q3 | 24 |
95-th percentile | 57 |
Maximum | 229 |
Range | 228 |
Interquartile range (IQR) | 19 |
Descriptive statistics
Standard deviation | 20.46753 |
---|---|
Coefficient of variation (CV) | 1.0983131 |
Kurtosis | 12.421564 |
Mean | 18.635424 |
Median Absolute Deviation (MAD) | 9 |
Skewness | 2.7895214 |
Sum | 52291 |
Variance | 418.9198 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 200 | 7.1% |
3 | 161 | 5.7% |
4 | 136 | 4.8% |
2 | 127 | 4.5% |
5 | 114 | 4.1% |
7 | 109 | 3.9% |
6 | 105 | 3.7% |
13 | 104 | 3.7% |
10 | 92 | 3.3% |
12 | 92 | 3.3% |
Other values (106) | 1566 |
Value | Count | Frequency (%) |
1 | 200 | |
2 | 127 | |
3 | 161 | |
4 | 136 | |
5 | 114 | |
6 | 105 | |
7 | 109 | |
8 | 84 | |
9 | 81 | |
10 | 92 |
Value | Count | Frequency (%) |
229 | 1 | |
178 | 1 | |
169 | 1 | |
147 | 1 | |
144 | 1 | |
141 | 2 | |
132 | 1 | |
125 | 2 | |
124 | 1 | |
122 | 2 |
위반업체수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 9 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.1849608 |
Minimum | 0 |
---|---|
Maximum | 9 |
Zeros | 2456 |
Zeros (%) | 87.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.8 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 1 |
Maximum | 9 |
Range | 9 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.61153655 |
---|---|
Coefficient of variation (CV) | 3.3063036 |
Kurtosis | 42.79175 |
Mean | 0.1849608 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 5.3961183 |
Sum | 519 |
Variance | 0.37397695 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 2456 | |
1 | 256 | 9.1% |
2 | 53 | 1.9% |
3 | 25 | 0.9% |
4 | 7 | 0.2% |
5 | 5 | 0.2% |
7 | 2 | 0.1% |
9 | 1 | < 0.1% |
6 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 2456 | |
1 | 256 | 9.1% |
2 | 53 | 1.9% |
3 | 25 | 0.9% |
4 | 7 | 0.2% |
5 | 5 | 0.2% |
6 | 1 | < 0.1% |
7 | 2 | 0.1% |
9 | 1 | < 0.1% |
Value | Count | Frequency (%) |
9 | 1 | < 0.1% |
7 | 2 | 0.1% |
6 | 1 | < 0.1% |
5 | 5 | 0.2% |
4 | 7 | 0.2% |
3 | 25 | 0.9% |
2 | 53 | 1.9% |
1 | 256 | 9.1% |
0 | 2456 |
지정용도외 사용 건수
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.1 KiB |
0 | |
---|---|
1 | 21 |
3 | 1 |
2 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 2783 | |
1 | 21 | 0.7% |
3 | 1 | < 0.1% |
2 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 2783 | |
1 | 21 | 0.7% |
3 | 1 | < 0.1% |
2 | 1 | < 0.1% |
관리대장미비치 건수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 8 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.10192445 |
Minimum | 0 |
---|---|
Maximum | 9 |
Zeros | 2625 |
Zeros (%) | 93.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.8 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 1 |
Maximum | 9 |
Range | 9 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.48831246 |
---|---|
Coefficient of variation (CV) | 4.7909257 |
Kurtosis | 85.098787 |
Mean | 0.10192445 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 7.7779058 |
Sum | 286 |
Variance | 0.23844906 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 2625 | |
1 | 124 | 4.4% |
2 | 35 | 1.2% |
3 | 10 | 0.4% |
4 | 5 | 0.2% |
6 | 3 | 0.1% |
5 | 3 | 0.1% |
9 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 2625 | |
1 | 124 | 4.4% |
2 | 35 | 1.2% |
3 | 10 | 0.4% |
4 | 5 | 0.2% |
5 | 3 | 0.1% |
6 | 3 | 0.1% |
9 | 1 | < 0.1% |
Value | Count | Frequency (%) |
9 | 1 | < 0.1% |
6 | 3 | 0.1% |
5 | 3 | 0.1% |
4 | 5 | 0.2% |
3 | 10 | 0.4% |
2 | 35 | 1.2% |
1 | 124 | 4.4% |
0 | 2625 |
표시위반 건수
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.1 KiB |
0 | |
---|---|
1 | 3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 2803 | |
1 | 3 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 2803 | |
1 | 3 | 0.1% |
기타
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 9 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.106201 |
Minimum | 0 |
---|---|
Maximum | 10 |
Zeros | 2612 |
Zeros (%) | 93.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.8 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 1 |
Maximum | 10 |
Range | 10 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.50181563 |
---|---|
Coefficient of variation (CV) | 4.7251499 |
Kurtosis | 101.07958 |
Mean | 0.106201 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 8.293462 |
Sum | 298 |
Variance | 0.25181893 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 2612 | |
1 | 141 | 5.0% |
2 | 31 | 1.1% |
3 | 9 | 0.3% |
4 | 6 | 0.2% |
5 | 3 | 0.1% |
6 | 2 | 0.1% |
10 | 1 | < 0.1% |
7 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 2612 | |
1 | 141 | 5.0% |
2 | 31 | 1.1% |
3 | 9 | 0.3% |
4 | 6 | 0.2% |
5 | 3 | 0.1% |
6 | 2 | 0.1% |
7 | 1 | < 0.1% |
10 | 1 | < 0.1% |
Value | Count | Frequency (%) |
10 | 1 | < 0.1% |
7 | 1 | < 0.1% |
6 | 2 | 0.1% |
5 | 3 | 0.1% |
4 | 6 | 0.2% |
3 | 9 | 0.3% |
2 | 31 | 1.1% |
1 | 141 | 5.0% |
0 | 2612 |
시도명 | 조사건수 | 위반업체수 | 지정용도외 사용 건수 | 관리대장미비치 건수 | 표시위반 건수 | 기타 | |
---|---|---|---|---|---|---|---|
시도명 | 1.000 | 0.458 | 0.207 | 0.000 | 0.164 | 0.000 | 0.163 |
조사건수 | 0.458 | 1.000 | 0.413 | 0.000 | 0.306 | 0.081 | 0.322 |
위반업체수 | 0.207 | 0.413 | 1.000 | 0.289 | 0.835 | 0.187 | 0.907 |
지정용도외 사용 건수 | 0.000 | 0.000 | 0.289 | 1.000 | 0.000 | 0.000 | 0.034 |
관리대장미비치 건수 | 0.164 | 0.306 | 0.835 | 0.000 | 1.000 | 0.125 | 0.294 |
표시위반 건수 | 0.000 | 0.081 | 0.187 | 0.000 | 0.125 | 1.000 | 0.000 |
기타 | 0.163 | 0.322 | 0.907 | 0.034 | 0.294 | 0.000 | 1.000 |
지정용도외 사용 건수 | 표시위반 건수 | 시도명 | |
---|---|---|---|
지정용도외 사용 건수 | 1.000 | 0.000 | 0.000 |
표시위반 건수 | 0.000 | 1.000 | 0.000 |
시도명 | 0.000 | 0.000 | 1.000 |
조사건수 | 위반업체수 | 관리대장미비치 건수 | 기타 | 시도명 | 지정용도외 사용 건수 | 표시위반 건수 | |
---|---|---|---|---|---|---|---|
조사건수 | 1.000 | 0.238 | 0.191 | 0.153 | 0.169 | 0.000 | 0.081 |
위반업체수 | 0.238 | 1.000 | 0.702 | 0.724 | 0.070 | 0.188 | 0.186 |
관리대장미비치 건수 | 0.191 | 0.702 | 1.000 | 0.166 | 0.069 | 0.000 | 0.094 |
기타 | 0.153 | 0.724 | 0.166 | 1.000 | 0.031 | 0.000 | 0.000 |
시도명 | 0.169 | 0.070 | 0.069 | 0.031 | 1.000 | 0.000 | 0.000 |
지정용도외 사용 건수 | 0.000 | 0.188 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
표시위반 건수 | 0.081 | 0.186 | 0.094 | 0.000 | 0.000 | 0.000 | 1.000 |
단속년월 | 시도명 | 조사건수 | 위반업체수 | 지정용도외 사용 건수 | 관리대장미비치 건수 | 표시위반 건수 | 기타 | |
---|---|---|---|---|---|---|---|---|
0 | 199912 | 전라남도 | 1 | 0 | 0 | 0 | 0 | 0 |
1 | 200009 | 충청북도 | 1 | 0 | 0 | 0 | 0 | 0 |
2 | 200009 | 전라남도 | 1 | 0 | 0 | 0 | 0 | 0 |
3 | 200101 | 인천광역시 | 1 | 0 | 0 | 0 | 0 | 0 |
4 | 200101 | 경기도 | 7 | 0 | 0 | 0 | 0 | 0 |
5 | 200101 | 강원도 | 9 | 0 | 0 | 0 | 0 | 0 |
6 | 200101 | 충청북도 | 22 | 0 | 0 | 0 | 0 | 0 |
7 | 200101 | 충청남도 | 4 | 0 | 0 | 0 | 0 | 0 |
8 | 200101 | 전라남도 | 2 | 0 | 0 | 0 | 0 | 0 |
9 | 200101 | 경상북도 | 12 | 0 | 0 | 0 | 0 | 0 |
단속년월 | 시도명 | 조사건수 | 위반업체수 | 지정용도외 사용 건수 | 관리대장미비치 건수 | 표시위반 건수 | 기타 | |
---|---|---|---|---|---|---|---|---|
2796 | 202206 | 울산광역시 | 3 | 0 | 0 | 0 | 0 | 0 |
2797 | 202206 | 부산광역시 | 12 | 0 | 0 | 0 | 0 | 0 |
2798 | 202206 | 경기도 | 53 | 3 | 0 | 2 | 1 | 0 |
2799 | 202206 | 강원도 | 4 | 0 | 0 | 0 | 0 | 0 |
2800 | 202206 | 충청북도 | 13 | 2 | 0 | 2 | 0 | 0 |
2801 | 202206 | 충청남도 | 22 | 0 | 0 | 0 | 0 | 0 |
2802 | 202206 | 전라북도 | 15 | 0 | 0 | 0 | 0 | 0 |
2803 | 202206 | 전라남도 | 68 | 0 | 0 | 0 | 0 | 0 |
2804 | 202206 | 경상북도 | 5 | 0 | 0 | 0 | 0 | 0 |
2805 | 202206 | 경상남도 | 11 | 0 | 0 | 0 | 0 | 0 |