Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 537 |
Missing cells (%) | 0.8% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 3 |
Text | 1 |
Numeric | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 원산지표시 시도별 위반품목 및 위반물량 현황 정보(처분년월, 업무구분, 시도명, 위반품목, 위반유형, 위반건수, 위반물량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001684 |
Reproduction
Analysis started | 2024-03-23 07:48:19.776423 |
---|---|
Analysis finished | 2024-03-23 07:48:22.541805 |
Duration | 2.77 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
처분년월
Date
Distinct | 4419 |
---|---|
Distinct (%) | 44.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 1998-05-23 00:00:00 |
---|---|
Maximum | 2024-03-15 00:00:00 |
업무구분명
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
원산지단속 | |
---|---|
축산물이력 | 504 |
양곡표시 | 475 |
미검사품 | 20 |
재사용화환 | 15 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9501 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 원산지단속 |
---|---|
2nd row | 원산지단속 |
3rd row | 원산지단속 |
4th row | 원산지단속 |
5th row | 원산지단속 |
Common Values
Value | Count | Frequency (%) |
원산지단속 | 8984 | |
축산물이력 | 504 | 5.0% |
양곡표시 | 475 | 4.8% |
미검사품 | 20 | 0.2% |
재사용화환 | 15 | 0.1% |
GMO | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
원산지단속 | 8984 | |
축산물이력 | 504 | 5.0% |
양곡표시 | 475 | 4.8% |
미검사품 | 20 | 0.2% |
재사용화환 | 15 | 0.1% |
gmo | 2 | < 0.1% |
시도명
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
전라남도 | |
경상북도 | |
경상남도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.702 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경기도 |
---|---|
2nd row | 경기도 |
3rd row | 경상북도 |
4th row | 충청남도 |
5th row | 전북특별자치도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 1316 | |
서울특별시 | 930 | |
전라남도 | 868 | |
경상북도 | 801 | 8.0% |
경상남도 | 777 | 7.8% |
강원특별자치도 | 760 | 7.6% |
전북특별자치도 | 712 | 7.1% |
충청북도 | 644 | 6.4% |
충청남도 | 638 | 6.4% |
대구광역시 | 551 | 5.5% |
Other values (7) | 2003 |
Length
Value | Count | Frequency (%) |
경기도 | 1316 | |
서울특별시 | 930 | |
전라남도 | 868 | |
경상북도 | 801 | 8.0% |
경상남도 | 777 | 7.8% |
강원특별자치도 | 760 | 7.6% |
전북특별자치도 | 712 | 7.1% |
충청북도 | 644 | 6.4% |
충청남도 | 638 | 6.4% |
대구광역시 | 551 | 5.5% |
Other values (7) | 2003 |
위반품목
Text
Distinct | 618 |
---|---|
Distinct (%) | 6.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
돼지고기 | 1376 | 13.6% |
배추김치 | 907 | 9.0% |
쇠고기 | 823 | 8.1% |
쇠고기(한우 | 535 | 5.3% |
쌀 | 326 | 3.2% |
닭고기 | 259 | 2.6% |
고추가루 | 208 | 2.1% |
멥쌀 | 191 | 1.9% |
두부류 | 189 | 1.9% |
삼겹살 | 177 | 1.8% |
Other values (610) | 5120 |
Most occurring characters
Value | Count | Frequency (%) |
고 | 3877 | 10.2% |
기 | 3855 | 10.1% |
지 | 1744 | 4.6% |
돼 | 1534 | 4.0% |
쇠 | 1525 | 4.0% |
( | 1449 | 3.8% |
) | 1449 | 3.8% |
추 | 1409 | 3.7% |
배 | 1060 | 2.8% |
김 | 1022 | 2.7% |
Other values (337) | 19239 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 35141 | |
Open Punctuation | 1449 | 3.8% |
Close Punctuation | 1449 | 3.8% |
Space Separator | 111 | 0.3% |
Uppercase Letter | 6 | < 0.1% |
Decimal Number | 4 | < 0.1% |
Other Punctuation | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
고 | 3877 | 11.0% |
기 | 3855 | 11.0% |
지 | 1744 | 5.0% |
돼 | 1534 | 4.4% |
쇠 | 1525 | 4.3% |
추 | 1409 | 4.0% |
배 | 1060 | 3.0% |
김 | 1022 | 2.9% |
치 | 1020 | 2.9% |
쌀 | 673 | 1.9% |
Other values (326) | 17422 |
Uppercase Letter
Value | Count | Frequency (%) |
M | 3 | |
A | 1 | 16.7% |
O | 1 | 16.7% |
G | 1 | 16.7% |
Decimal Number
Value | Count | Frequency (%) |
1 | 2 | |
4 | 1 | |
6 | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1449 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1449 |
Space Separator
Value | Count | Frequency (%) |
111 |
Other Punctuation
Value | Count | Frequency (%) |
. | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 35141 | |
Common | 3016 | 7.9% |
Latin | 6 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
고 | 3877 | 11.0% |
기 | 3855 | 11.0% |
지 | 1744 | 5.0% |
돼 | 1534 | 4.4% |
쇠 | 1525 | 4.3% |
추 | 1409 | 4.0% |
배 | 1060 | 3.0% |
김 | 1022 | 2.9% |
치 | 1020 | 2.9% |
쌀 | 673 | 1.9% |
Other values (326) | 17422 |
Common
Value | Count | Frequency (%) |
( | 1449 | |
) | 1449 | |
111 | 3.7% | |
. | 3 | 0.1% |
1 | 2 | 0.1% |
4 | 1 | < 0.1% |
6 | 1 | < 0.1% |
Latin
Value | Count | Frequency (%) |
M | 3 | |
A | 1 | 16.7% |
O | 1 | 16.7% |
G | 1 | 16.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 35141 | |
ASCII | 3022 | 7.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
고 | 3877 | 11.0% |
기 | 3855 | 11.0% |
지 | 1744 | 5.0% |
돼 | 1534 | 4.4% |
쇠 | 1525 | 4.3% |
추 | 1409 | 4.0% |
배 | 1060 | 3.0% |
김 | 1022 | 2.9% |
치 | 1020 | 2.9% |
쌀 | 673 | 1.9% |
Other values (326) | 17422 |
ASCII
Value | Count | Frequency (%) |
( | 1449 | |
) | 1449 | |
111 | 3.7% | |
. | 3 | 0.1% |
M | 3 | 0.1% |
1 | 2 | 0.1% |
4 | 1 | < 0.1% |
A | 1 | < 0.1% |
O | 1 | < 0.1% |
G | 1 | < 0.1% |
위반유형
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
거짓표시 | |
---|---|
미표시 | |
영수증미비치 | 16 |
시정명령 위반 | 2 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.6125 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 거짓표시 |
---|---|
2nd row | 거짓표시 |
3rd row | 거짓표시 |
4th row | 미표시 |
5th row | 거짓표시 |
Common Values
Value | Count | Frequency (%) |
거짓표시 | 6069 | |
미표시 | 3913 | |
영수증미비치 | 16 | 0.2% |
시정명령 위반 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
거짓표시 | 6069 | |
미표시 | 3913 | |
영수증미비치 | 16 | 0.2% |
시정명령 | 2 | < 0.1% |
위반 | 2 | < 0.1% |
위반건수
Real number (ℝ)
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.2582 |
Minimum | 1 |
---|---|
Maximum | 35 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 2 |
Maximum | 35 |
Range | 34 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.88216245 |
---|---|
Coefficient of variation (CV) | 0.70113054 |
Kurtosis | 264.78831 |
Mean | 1.2582 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 10.851262 |
Sum | 12582 |
Variance | 0.77821058 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 8424 | |
2 | 1090 | 10.9% |
3 | 295 | 2.9% |
4 | 89 | 0.9% |
5 | 40 | 0.4% |
6 | 18 | 0.2% |
7 | 16 | 0.2% |
8 | 7 | 0.1% |
11 | 6 | 0.1% |
10 | 4 | < 0.1% |
Other values (6) | 11 | 0.1% |
Value | Count | Frequency (%) |
1 | 8424 | |
2 | 1090 | 10.9% |
3 | 295 | 2.9% |
4 | 89 | 0.9% |
5 | 40 | 0.4% |
6 | 18 | 0.2% |
7 | 16 | 0.2% |
8 | 7 | 0.1% |
9 | 4 | < 0.1% |
10 | 4 | < 0.1% |
Value | Count | Frequency (%) |
35 | 1 | < 0.1% |
16 | 2 | < 0.1% |
15 | 1 | < 0.1% |
13 | 1 | < 0.1% |
12 | 2 | < 0.1% |
11 | 6 | 0.1% |
10 | 4 | < 0.1% |
9 | 4 | < 0.1% |
8 | 7 | |
7 | 16 |
위반물량(kg)
Real number (ℝ)
MISSING
  SKEWED
 
Distinct | 2767 |
---|---|
Distinct (%) | 29.2% |
Missing | 537 |
Missing (%) | 5.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3753.5232 |
Minimum | 0 |
---|---|
Maximum | 3361639.4 |
Zeros | 8 |
Zeros (%) | 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 5 |
median | 28 |
Q3 | 212.65 |
95-th percentile | 5036 |
Maximum | 3361639.4 |
Range | 3361639.4 |
Interquartile range (IQR) | 207.65 |
Descriptive statistics
Standard deviation | 55979.186 |
---|---|
Coefficient of variation (CV) | 14.913771 |
Kurtosis | 2020.0767 |
Mean | 3753.5232 |
Median Absolute Deviation (MAD) | 26.5 |
Skewness | 40.507348 |
Sum | 35519590 |
Variance | 3.1336693 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10.0 | 402 | 4.0% |
1.0 | 391 | 3.9% |
2.0 | 295 | 2.9% |
5.0 | 264 | 2.6% |
3.0 | 253 | 2.5% |
20.0 | 250 | 2.5% |
4.0 | 191 | 1.9% |
40.0 | 168 | 1.7% |
6.0 | 150 | 1.5% |
30.0 | 126 | 1.3% |
Other values (2757) | 6973 | |
(Missing) | 537 | 5.4% |
Value | Count | Frequency (%) |
0.0 | 8 | |
0.01 | 1 | < 0.1% |
0.04 | 1 | < 0.1% |
0.05 | 1 | < 0.1% |
0.1 | 16 | |
0.15 | 5 | 0.1% |
0.16 | 1 | < 0.1% |
0.2 | 17 | |
0.215 | 1 | < 0.1% |
0.24 | 1 | < 0.1% |
Value | Count | Frequency (%) |
3361639.42 | 1 | |
2473993.0 | 1 | |
2071151.0 | 1 | |
1375548.0 | 1 | |
794015.0 | 1 | |
784682.6 | 1 | |
663755.0 | 1 | |
616562.0 | 1 | |
611231.97 | 1 | |
508440.0 | 1 |
업무구분명 | 시도명 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|
업무구분명 | 1.000 | 0.092 | 0.302 | 0.000 | 0.000 |
시도명 | 0.092 | 1.000 | 0.088 | 0.029 | 0.000 |
위반유형 | 0.302 | 0.088 | 1.000 | 0.000 | 0.000 |
위반건수 | 0.000 | 0.029 | 0.000 | 1.000 | 0.000 |
위반물량(kg) | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
위반유형 | 업무구분명 | 시도명 | |
---|---|---|---|
위반유형 | 1.000 | 0.199 | 0.049 |
업무구분명 | 0.199 | 1.000 | 0.043 |
시도명 | 0.049 | 0.043 | 1.000 |
위반건수 | 위반물량(kg) | 업무구분명 | 시도명 | 위반유형 | |
---|---|---|---|---|---|
위반건수 | 1.000 | 0.165 | 0.000 | 0.013 | 0.000 |
위반물량(kg) | 0.165 | 1.000 | 0.000 | 0.000 | 0.000 |
업무구분명 | 0.000 | 0.000 | 1.000 | 0.043 | 0.199 |
시도명 | 0.013 | 0.000 | 0.043 | 1.000 | 0.049 |
위반유형 | 0.000 | 0.000 | 0.199 | 0.049 | 1.000 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|---|---|
93425 | 2002-02-22 | 원산지단속 | 경기도 | 과실 기타 | 거짓표시 | 1 | 425.0 |
7030 | 2022-05-10 | 원산지단속 | 경기도 | 상황버섯 | 거짓표시 | 1 | 9.0 |
54151 | 2011-06-21 | 원산지단속 | 경상북도 | 쇠고기 | 거짓표시 | 1 | 77.0 |
75593 | 2007-05-01 | 원산지단속 | 충청남도 | 과채가공품 | 미표시 | 1 | 5.0 |
94566 | 2001-10-10 | 원산지단속 | 전북특별자치도 | 쇠고기부산물 | 거짓표시 | 1 | 29.8 |
59059 | 2010-08-25 | 원산지단속 | 서울특별시 | 돼지고기 | 거짓표시 | 4 | 35115.0 |
99893 | 1999-01-13 | 원산지단속 | 경상남도 | 돼지고기 | 거짓표시 | 1 | 1927.0 |
37177 | 2014-09-24 | 원산지단속 | 제주특별자치도 | 쌀 | 거짓표시 | 1 | 100.0 |
41026 | 2014-01-14 | 원산지단속 | 전라남도 | 닭고기 | 미표시 | 1 | 1.0 |
55038 | 2011-04-25 | 원산지단속 | 전라남도 | 쇠고기 | 거짓표시 | 1 | 60.0 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|---|---|
46027 | 2013-01-21 | 원산지단속 | 전라남도 | 떡류 | 미표시 | 1 | 0.6 |
42309 | 2013-09-05 | 양곡표시 | 전라남도 | 멥쌀 | 미표시 | 1 | 40.0 |
13890 | 2020-06-02 | 원산지단속 | 경기도 | 돼지고기 | 거짓표시 | 1 | 5615.2 |
36623 | 2014-12-15 | 원산지단속 | 경상남도 | 쌀 | 미표시 | 1 | <NA> |
59277 | 2010-08-10 | 원산지단속 | 대구광역시 | 고추가루 | 미표시 | 1 | 5.0 |
72057 | 2008-05-06 | 원산지단속 | 광주광역시 | 쇠고기 | 거짓표시 | 2 | 485.0 |
16386 | 2019-09-03 | 원산지단속 | 울산광역시 | 두부류 | 거짓표시 | 1 | 144.0 |
58123 | 2010-10-20 | 원산지단속 | 경상남도 | 쇠고기 | 거짓표시 | 1 | 75.0 |
84554 | 2004-09-24 | 원산지단속 | 경상남도 | 녹두 | 거짓표시 | 1 | 150.0 |
64777 | 2009-09-25 | 원산지단속 | 충청남도 | 쌀 | 미표시 | 1 | 1.0 |