Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 964 |
Duplicate rows (%) | 9.6% |
Total size in memory | 761.7 KiB |
Average record size in memory | 78.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 5 |
Numeric | 2 |
Dataset
Description | 농산물 유통 관련하여 가공용쌀 공급업에 대해 지정용도외 사용, 원산지표시, 관리대장 비치 등 단속정보(단속년월, 시도명, 조사건수, 위반업체수, 지정용도외 사용 건수, 표시위반 건수,관리대장 미비치 건수, 기타 ) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20170912000000000790 |
Dataset has 964 (9.6%) duplicate rows | Duplicates |
위반업체 수 is highly overall correlated with 관리대장 미비치 건수 and 1 other fields | High correlation |
관리대장 미비치 건수 is highly overall correlated with 위반업체 수 | High correlation |
기타 is highly overall correlated with 위반업체 수 | High correlation |
지정용도외 사용 건수 is highly imbalanced (98.3%) | Imbalance |
표시위반 건수 is highly imbalanced (99.6%) | Imbalance |
관리대장 미비치 건수 is highly imbalanced (93.4%) | Imbalance |
기타 is highly imbalanced (97.8%) | Imbalance |
위반업체 수 has 9643 (96.4%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-23 07:22:33.793802 |
---|---|
Analysis finished | 2024-03-23 07:22:38.156884 |
Duration | 4.36 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
단속년월
Date
Distinct | 3766 |
---|---|
Distinct (%) | 37.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 1999-12-24 00:00:00 |
---|---|
Maximum | 2022-09-08 00:00:00 |
시도별
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
경상북도 | |
강원도 | |
경상남도 | |
전라남도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.8848 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강원도 |
---|---|
2nd row | 강원도 |
3rd row | 인천광역시 |
4th row | 대전광역시 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 1993 | |
경상북도 | 1361 | |
강원도 | 972 | |
경상남도 | 939 | |
전라남도 | 904 | |
충청북도 | 763 | 7.6% |
충청남도 | 755 | 7.5% |
전라북도 | 688 | 6.9% |
서울특별시 | 439 | 4.4% |
인천광역시 | 332 | 3.3% |
Other values (7) | 854 |
Length
Value | Count | Frequency (%) |
경기도 | 1993 | |
경상북도 | 1361 | |
강원도 | 972 | |
경상남도 | 939 | |
전라남도 | 904 | |
충청북도 | 763 | 7.6% |
충청남도 | 755 | 7.5% |
전라북도 | 688 | 6.9% |
서울특별시 | 439 | 4.4% |
인천광역시 | 332 | 3.3% |
Other values (7) | 854 |
조사건수
Real number (ℝ)
Distinct | 15 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.3014 |
Minimum | 1 |
---|---|
Maximum | 26 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 26 |
Range | 25 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.95049902 |
---|---|
Coefficient of variation (CV) | 0.73036654 |
Kurtosis | 90.209978 |
Mean | 1.3014 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 6.8063058 |
Sum | 13014 |
Variance | 0.90344838 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 8348 | |
2 | 1041 | 10.4% |
3 | 310 | 3.1% |
4 | 127 | 1.3% |
5 | 72 | 0.7% |
6 | 35 | 0.4% |
7 | 32 | 0.3% |
8 | 14 | 0.1% |
9 | 8 | 0.1% |
10 | 5 | 0.1% |
Other values (5) | 8 | 0.1% |
Value | Count | Frequency (%) |
1 | 8348 | |
2 | 1041 | 10.4% |
3 | 310 | 3.1% |
4 | 127 | 1.3% |
5 | 72 | 0.7% |
6 | 35 | 0.4% |
7 | 32 | 0.3% |
8 | 14 | 0.1% |
9 | 8 | 0.1% |
10 | 5 | 0.1% |
Value | Count | Frequency (%) |
26 | 1 | < 0.1% |
21 | 1 | < 0.1% |
14 | 1 | < 0.1% |
12 | 2 | < 0.1% |
11 | 3 | < 0.1% |
10 | 5 | 0.1% |
9 | 8 | 0.1% |
8 | 14 | 0.1% |
7 | 32 | |
6 | 35 |
위반업체 수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.048 |
Minimum | 0 |
---|---|
Maximum | 12 |
Zeros | 9643 |
Zeros (%) | 96.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 0 |
Maximum | 12 |
Range | 12 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.30117282 |
---|---|
Coefficient of variation (CV) | 6.2744339 |
Kurtosis | 311.77234 |
Mean | 0.048 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 12.546058 |
Sum | 480 |
Variance | 0.090705071 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 9643 | |
1 | 276 | 2.8% |
2 | 58 | 0.6% |
3 | 16 | 0.2% |
4 | 3 | < 0.1% |
5 | 2 | < 0.1% |
12 | 1 | < 0.1% |
6 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 9643 | |
1 | 276 | 2.8% |
2 | 58 | 0.6% |
3 | 16 | 0.2% |
4 | 3 | < 0.1% |
5 | 2 | < 0.1% |
6 | 1 | < 0.1% |
12 | 1 | < 0.1% |
Value | Count | Frequency (%) |
12 | 1 | < 0.1% |
6 | 1 | < 0.1% |
5 | 2 | < 0.1% |
4 | 3 | < 0.1% |
3 | 16 | 0.2% |
2 | 58 | 0.6% |
1 | 276 | 2.8% |
0 | 9643 |
지정용도외 사용 건수
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
1 | 16 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 9984 | |
1 | 16 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 9984 | |
1 | 16 | 0.2% |
표시위반 건수
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
1 | 3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 9997 | |
1 | 3 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 9997 | |
1 | 3 | < 0.1% |
관리대장 미비치 건수
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
1 | 149 |
2 | 27 |
3 | 10 |
4 | 3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 9811 | |
1 | 149 | 1.5% |
2 | 27 | 0.3% |
3 | 10 | 0.1% |
4 | 3 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 9811 | |
1 | 149 | 1.5% |
2 | 27 | 0.3% |
3 | 10 | 0.1% |
4 | 3 | < 0.1% |
기타
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
1 | 32 |
2 | 3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 9965 | |
1 | 32 | 0.3% |
2 | 3 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 9965 | |
1 | 32 | 0.3% |
2 | 3 | < 0.1% |
시도별 | 조사건수 | 위반업체 수 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | |
---|---|---|---|---|---|---|---|
시도별 | 1.000 | 0.193 | 0.074 | 0.052 | 0.019 | 0.071 | 0.071 |
조사건수 | 0.193 | 1.000 | 0.088 | 0.020 | 0.000 | 0.072 | 0.000 |
위반업체 수 | 0.074 | 0.088 | 1.000 | 0.016 | 0.000 | 0.783 | 0.654 |
지정용도외 사용 건수 | 0.052 | 0.020 | 0.016 | 1.000 | 0.000 | 0.000 | 0.024 |
표시위반 건수 | 0.019 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 |
관리대장 미비치 건수 | 0.071 | 0.072 | 0.783 | 0.000 | 0.000 | 1.000 | 0.251 |
기타 | 0.071 | 0.000 | 0.654 | 0.024 | 0.000 | 0.251 | 1.000 |
지정용도외 사용 건수 | 관리대장 미비치 건수 | 기타 | 시도별 | 표시위반 건수 | |
---|---|---|---|---|---|
지정용도외 사용 건수 | 1.000 | 0.000 | 0.040 | 0.046 | 0.000 |
관리대장 미비치 건수 | 0.000 | 1.000 | 0.195 | 0.037 | 0.000 |
기타 | 0.040 | 0.195 | 1.000 | 0.038 | 0.000 |
시도별 | 0.046 | 0.037 | 0.038 | 1.000 | 0.017 |
표시위반 건수 | 0.000 | 0.000 | 0.000 | 0.017 | 1.000 |
조사건수 | 위반업체 수 | 시도별 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | |
---|---|---|---|---|---|---|---|
조사건수 | 1.000 | 0.038 | 0.081 | 0.006 | 0.000 | 0.024 | 0.006 |
위반업체 수 | 0.038 | 1.000 | 0.039 | 0.020 | 0.000 | 0.611 | 0.557 |
시도별 | 0.081 | 0.039 | 1.000 | 0.046 | 0.017 | 0.037 | 0.038 |
지정용도외 사용 건수 | 0.006 | 0.020 | 0.046 | 1.000 | 0.000 | 0.000 | 0.040 |
표시위반 건수 | 0.000 | 0.000 | 0.017 | 0.000 | 1.000 | 0.000 | 0.000 |
관리대장 미비치 건수 | 0.024 | 0.611 | 0.037 | 0.000 | 0.000 | 1.000 | 0.195 |
기타 | 0.006 | 0.557 | 0.038 | 0.040 | 0.000 | 0.195 | 1.000 |
단속년월 | 시도별 | 조사건수 | 위반업체 수 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | |
---|---|---|---|---|---|---|---|---|
8894 | 2021-09-16 | 강원도 | 1 | 0 | 0 | 0 | 0 | 0 |
8065 | 2010-03-25 | 강원도 | 1 | 0 | 0 | 0 | 0 | 0 |
2061 | 2010-08-03 | 인천광역시 | 1 | 0 | 0 | 0 | 0 | 0 |
2736 | 2013-01-23 | 대전광역시 | 1 | 0 | 0 | 0 | 0 | 0 |
7950 | 2009-06-09 | 강원도 | 1 | 0 | 0 | 0 | 0 | 0 |
6106 | 2015-08-04 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 |
18694 | 2012-04-27 | 경상남도 | 1 | 0 | 0 | 0 | 0 | 0 |
18634 | 2011-06-30 | 경상남도 | 1 | 0 | 0 | 0 | 0 | 0 |
11577 | 2016-01-22 | 충청남도 | 1 | 0 | 0 | 0 | 0 | 0 |
15139 | 2006-03-20 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 |
단속년월 | 시도별 | 조사건수 | 위반업체 수 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | |
---|---|---|---|---|---|---|---|---|
12260 | 2009-09-15 | 전라북도 | 1 | 0 | 0 | 0 | 0 | 0 |
7058 | 2002-07-23 | 강원도 | 3 | 0 | 0 | 0 | 0 | 0 |
15110 | 2006-01-25 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 |
5615 | 2013-01-25 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 |
12441 | 2011-12-14 | 전라북도 | 1 | 0 | 0 | 0 | 0 | 0 |
15357 | 2006-12-11 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 |
15610 | 2007-09-10 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 |
14374 | 2015-09-23 | 전라남도 | 2 | 0 | 0 | 0 | 0 | 0 |
19025 | 2016-06-21 | 경상남도 | 1 | 0 | 0 | 0 | 0 | 0 |
16348 | 2011-12-26 | 경상북도 | 2 | 0 | 0 | 0 | 0 | 0 |
Most frequently occurring
단속년월 | 시도별 | 조사건수 | 위반업체 수 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
578 | 2012-09-04 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 8 |
583 | 2012-09-05 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 6 |
61 | 2005-07-05 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 5 |
576 | 2012-09-03 | 전라남도 | 1 | 0 | 0 | 0 | 0 | 0 | 5 |
695 | 2014-01-21 | 경기도 | 1 | 1 | 0 | 0 | 1 | 0 | 5 |
843 | 2017-09-26 | 전라남도 | 1 | 0 | 0 | 0 | 0 | 0 | 5 |
913 | 2020-06-24 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 | 5 |
47 | 2005-04-18 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 4 |
123 | 2006-03-29 | 충청북도 | 1 | 0 | 0 | 0 | 0 | 0 | 4 |
153 | 2006-07-31 | 충청북도 | 1 | 0 | 0 | 0 | 0 | 0 | 4 |