Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 915 |
Duplicate rows (%) | 9.2% |
Total size in memory | 761.7 KiB |
Average record size in memory | 78.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 4 |
Numeric | 3 |
Dataset
Description | 농산물 유통 관련하여 가공용쌀 공급업에 대해 지정용도외 사용, 원산지표시, 관리대장 비치 등 단속정보(단속년월, 시도명, 조사건수, 위반업체수, 지정용도외 사용 건수, 표시위반 건수,관리대장 미비치 건수, 기타 ) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20170912000000000790 |
Dataset has 915 (9.2%) duplicate rows | Duplicates |
위반업체 수 is highly overall correlated with 관리대장 미비치 건수 and 1 other fields | High correlation |
관리대장 미비치 건수 is highly overall correlated with 위반업체 수 | High correlation |
기타 is highly overall correlated with 위반업체 수 | High correlation |
지정용도외 사용 건수 is highly imbalanced (98.4%) | Imbalance |
표시위반 건수 is highly imbalanced (99.7%) | Imbalance |
기타 is highly imbalanced (97.2%) | Imbalance |
위반업체 수 has 9640 (96.4%) zeros | Zeros |
관리대장 미비치 건수 has 9811 (98.1%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-23 07:23:17.716167 |
---|---|
Analysis finished | 2024-03-23 07:23:22.880923 |
Duration | 5.16 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
단속년월
Date
Distinct | 3856 |
---|---|
Distinct (%) | 38.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2000-03-27 00:00:00 |
---|---|
Maximum | 2023-03-16 00:00:00 |
시도별
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
경상북도 | |
강원도 | |
경상남도 | |
전라남도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.8835 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 경기도 |
---|---|
2nd row | 충청북도 |
3rd row | 울산광역시 |
4th row | 부산광역시 |
5th row | 전라남도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 1994 | |
경상북도 | 1370 | |
강원도 | 989 | |
경상남도 | 919 | |
전라남도 | 875 | |
충청북도 | 766 | 7.7% |
충청남도 | 735 | 7.3% |
전라북도 | 694 | 6.9% |
서울특별시 | 425 | 4.2% |
인천광역시 | 340 | 3.4% |
Other values (7) | 893 |
Length
Value | Count | Frequency (%) |
경기도 | 1994 | |
경상북도 | 1370 | |
강원도 | 989 | |
경상남도 | 919 | |
전라남도 | 875 | |
충청북도 | 766 | 7.7% |
충청남도 | 735 | 7.3% |
전라북도 | 694 | 6.9% |
서울특별시 | 425 | 4.2% |
인천광역시 | 340 | 3.4% |
Other values (7) | 893 |
조사건수
Real number (ℝ)
Distinct | 15 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.2914 |
Minimum | 1 |
---|---|
Maximum | 21 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 21 |
Range | 20 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.90529995 |
---|---|
Coefficient of variation (CV) | 0.70102211 |
Kurtosis | 56.912934 |
Mean | 1.2914 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 5.8043332 |
Sum | 12914 |
Variance | 0.819568 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 8389 | |
2 | 1008 | 10.1% |
3 | 310 | 3.1% |
4 | 125 | 1.2% |
5 | 71 | 0.7% |
6 | 38 | 0.4% |
7 | 29 | 0.3% |
8 | 14 | 0.1% |
9 | 5 | 0.1% |
10 | 4 | < 0.1% |
Other values (5) | 7 | 0.1% |
Value | Count | Frequency (%) |
1 | 8389 | |
2 | 1008 | 10.1% |
3 | 310 | 3.1% |
4 | 125 | 1.2% |
5 | 71 | 0.7% |
6 | 38 | 0.4% |
7 | 29 | 0.3% |
8 | 14 | 0.1% |
9 | 5 | 0.1% |
10 | 4 | < 0.1% |
Value | Count | Frequency (%) |
21 | 1 | < 0.1% |
16 | 1 | < 0.1% |
13 | 1 | < 0.1% |
12 | 2 | < 0.1% |
11 | 2 | < 0.1% |
10 | 4 | < 0.1% |
9 | 5 | 0.1% |
8 | 14 | 0.1% |
7 | 29 | |
6 | 38 |
위반업체 수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.0504 |
Minimum | 0 |
---|---|
Maximum | 12 |
Zeros | 9640 |
Zeros (%) | 96.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 0 |
Maximum | 12 |
Range | 12 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.32290907 |
---|---|
Coefficient of variation (CV) | 6.406926 |
Kurtosis | 271.67246 |
Mean | 0.0504 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 12.344368 |
Sum | 504 |
Variance | 0.10427027 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 9640 | |
1 | 275 | 2.8% |
2 | 56 | 0.6% |
3 | 17 | 0.2% |
5 | 4 | < 0.1% |
4 | 4 | < 0.1% |
6 | 3 | < 0.1% |
12 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 9640 | |
1 | 275 | 2.8% |
2 | 56 | 0.6% |
3 | 17 | 0.2% |
4 | 4 | < 0.1% |
5 | 4 | < 0.1% |
6 | 3 | < 0.1% |
12 | 1 | < 0.1% |
Value | Count | Frequency (%) |
12 | 1 | < 0.1% |
6 | 3 | < 0.1% |
5 | 4 | < 0.1% |
4 | 4 | < 0.1% |
3 | 17 | 0.2% |
2 | 56 | 0.6% |
1 | 275 | 2.8% |
0 | 9640 |
지정용도외 사용 건수
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
1 | 15 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 9985 | |
1 | 15 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 9985 | |
1 | 15 | 0.1% |
표시위반 건수
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
1 | 2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 9998 | |
1 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 9998 | |
1 | 2 | < 0.1% |
관리대장 미비치 건수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.0251 |
Minimum | 0 |
---|---|
Maximum | 5 |
Zeros | 9811 |
Zeros (%) | 98.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 0 |
Maximum | 5 |
Range | 5 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.20609279 |
---|---|
Coefficient of variation (CV) | 8.2108681 |
Kurtosis | 159.16447 |
Mean | 0.0251 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 11.139996 |
Sum | 251 |
Variance | 0.042474237 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 9811 | |
1 | 148 | 1.5% |
2 | 26 | 0.3% |
3 | 10 | 0.1% |
4 | 4 | < 0.1% |
5 | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 9811 | |
1 | 148 | 1.5% |
2 | 26 | 0.3% |
3 | 10 | 0.1% |
4 | 4 | < 0.1% |
5 | 1 | < 0.1% |
Value | Count | Frequency (%) |
5 | 1 | < 0.1% |
4 | 4 | < 0.1% |
3 | 10 | 0.1% |
2 | 26 | 0.3% |
1 | 148 | 1.5% |
0 | 9811 |
기타
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
1 | 45 |
2 | 2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 9953 | |
1 | 45 | 0.4% |
2 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 9953 | |
1 | 45 | 0.4% |
2 | 2 | < 0.1% |
시도별 | 조사건수 | 위반업체 수 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | |
---|---|---|---|---|---|---|---|
시도별 | 1.000 | 0.220 | 0.063 | 0.059 | 0.000 | 0.076 | 0.045 |
조사건수 | 0.220 | 1.000 | 0.076 | 0.000 | 0.000 | 0.140 | 0.061 |
위반업체 수 | 0.063 | 0.076 | 1.000 | 0.058 | 0.085 | 0.783 | 0.718 |
지정용도외 사용 건수 | 0.059 | 0.000 | 0.058 | 1.000 | 0.000 | 0.043 | 0.000 |
표시위반 건수 | 0.000 | 0.000 | 0.085 | 0.000 | 1.000 | 0.000 | 0.000 |
관리대장 미비치 건수 | 0.076 | 0.140 | 0.783 | 0.043 | 0.000 | 1.000 | 0.520 |
기타 | 0.045 | 0.061 | 0.718 | 0.000 | 0.000 | 0.520 | 1.000 |
지정용도외 사용 건수 | 기타 | 시도별 | 표시위반 건수 | |
---|---|---|---|---|
지정용도외 사용 건수 | 1.000 | 0.000 | 0.053 | 0.000 |
기타 | 0.000 | 1.000 | 0.024 | 0.000 |
시도별 | 0.053 | 0.024 | 1.000 | 0.000 |
표시위반 건수 | 0.000 | 0.000 | 0.000 | 1.000 |
조사건수 | 위반업체 수 | 관리대장 미비치 건수 | 시도별 | 지정용도외 사용 건수 | 표시위반 건수 | 기타 | |
---|---|---|---|---|---|---|---|
조사건수 | 1.000 | 0.039 | 0.046 | 0.082 | 0.012 | 0.000 | 0.019 |
위반업체 수 | 0.039 | 1.000 | 0.721 | 0.029 | 0.062 | 0.091 | 0.637 |
관리대장 미비치 건수 | 0.046 | 0.721 | 1.000 | 0.036 | 0.031 | 0.000 | 0.250 |
시도별 | 0.082 | 0.029 | 0.036 | 1.000 | 0.053 | 0.000 | 0.024 |
지정용도외 사용 건수 | 0.012 | 0.062 | 0.031 | 0.053 | 1.000 | 0.000 | 0.000 |
표시위반 건수 | 0.000 | 0.091 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
기타 | 0.019 | 0.637 | 0.250 | 0.024 | 0.000 | 0.000 | 1.000 |
단속년월 | 시도별 | 조사건수 | 위반업체 수 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | |
---|---|---|---|---|---|---|---|---|
4847 | 2009-01-29 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 |
10044 | 2013-01-24 | 충청북도 | 1 | 0 | 0 | 0 | 0 | 0 |
2923 | 2007-09-28 | 울산광역시 | 2 | 0 | 0 | 0 | 0 | 0 |
1336 | 2022-10-31 | 부산광역시 | 1 | 0 | 0 | 0 | 0 | 0 |
14039 | 2008-03-31 | 전라남도 | 2 | 1 | 0 | 0 | 0 | 0 |
382 | 2009-03-23 | 서울특별시 | 2 | 0 | 0 | 0 | 0 | 0 |
3525 | 2003-05-21 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 |
6298 | 2016-08-30 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 |
14 | 2004-12-08 | 서울특별시 | 3 | 0 | 0 | 0 | 0 | 0 |
15571 | 2006-07-27 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 |
단속년월 | 시도별 | 조사건수 | 위반업체 수 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | |
---|---|---|---|---|---|---|---|---|
4161 | 2006-08-24 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 |
15778 | 2007-03-21 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 |
8399 | 2011-12-06 | 강원도 | 1 | 0 | 0 | 0 | 0 | 0 |
19315 | 2015-06-23 | 경상남도 | 1 | 0 | 0 | 0 | 0 | 0 |
6166 | 2015-07-29 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 |
14813 | 2018-09-04 | 전라남도 | 1 | 0 | 0 | 0 | 0 | 0 |
19022 | 2011-09-19 | 경상남도 | 1 | 0 | 0 | 0 | 0 | 0 |
10446 | 2019-03-12 | 충청북도 | 1 | 0 | 0 | 0 | 0 | 0 |
10215 | 2015-02-06 | 충청북도 | 1 | 0 | 0 | 0 | 0 | 0 |
4719 | 2008-06-30 | 경기도 | 2 | 0 | 0 | 0 | 0 | 0 |
Most frequently occurring
단속년월 | 시도별 | 조사건수 | 위반업체 수 | 지정용도외 사용 건수 | 표시위반 건수 | 관리대장 미비치 건수 | 기타 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
511 | 2012-09-05 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 6 |
854 | 2021-04-28 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 6 |
423 | 2011-01-26 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 5 |
431 | 2011-01-28 | 전라북도 | 1 | 0 | 0 | 0 | 0 | 0 | 5 |
507 | 2012-09-04 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 5 |
523 | 2012-12-04 | 경상남도 | 1 | 0 | 0 | 0 | 0 | 0 | 5 |
58 | 2005-07-05 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 4 |
116 | 2006-03-30 | 경기도 | 1 | 0 | 0 | 0 | 0 | 0 | 4 |
151 | 2006-08-25 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 | 4 |
199 | 2007-02-22 | 경상북도 | 1 | 0 | 0 | 0 | 0 | 0 | 4 |