Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 462 |
Missing cells (%) | 0.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 3 |
Text | 1 |
Numeric | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 원산지표시 시도별 위반품목 및 위반물량 현황 정보(처분년월, 업무구분, 시도명, 위반품목, 위반유형, 위반건수, 위반물량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001684 |
Reproduction
Analysis started | 2024-03-23 07:47:28.131676 |
---|---|
Analysis finished | 2024-03-23 07:47:30.725768 |
Duration | 2.59 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
처분년월
Date
Distinct | 279 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 1998-01-01 00:00:00 |
---|---|
Maximum | 2022-09-01 00:00:00 |
업무구분명
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
원산지단속 | |
---|---|
양곡표시 | 495 |
축산물이력 | 338 |
미검사품 | 31 |
재사용화환 | 8 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.946 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 원산지단속 |
---|---|
2nd row | 원산지단속 |
3rd row | 원산지단속 |
4th row | 원산지단속 |
5th row | 원산지단속 |
Common Values
Value | Count | Frequency (%) |
원산지단속 | 9121 | |
양곡표시 | 495 | 5.0% |
축산물이력 | 338 | 3.4% |
미검사품 | 31 | 0.3% |
재사용화환 | 8 | 0.1% |
GMO | 7 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
원산지단속 | 9121 | |
양곡표시 | 495 | 5.0% |
축산물이력 | 338 | 3.4% |
미검사품 | 31 | 0.3% |
재사용화환 | 8 | 0.1% |
gmo | 7 | 0.1% |
시도명
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
경상북도 | |
전라남도 | |
전라북도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.2132 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산광역시 |
---|---|
2nd row | 전라남도 |
3rd row | 강원도 |
4th row | 대구광역시 |
5th row | 경상북도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 1185 | |
서울특별시 | 846 | 8.5% |
경상북도 | 827 | 8.3% |
전라남도 | 825 | 8.2% |
전라북도 | 777 | 7.8% |
경상남도 | 772 | 7.7% |
강원도 | 760 | 7.6% |
충청남도 | 682 | 6.8% |
충청북도 | 627 | 6.3% |
대구광역시 | 557 | 5.6% |
Other values (7) | 2142 |
Length
Value | Count | Frequency (%) |
경기도 | 1185 | |
서울특별시 | 846 | 8.5% |
경상북도 | 827 | 8.3% |
전라남도 | 825 | 8.2% |
전라북도 | 777 | 7.8% |
경상남도 | 772 | 7.7% |
강원도 | 760 | 7.6% |
충청남도 | 682 | 6.8% |
충청북도 | 627 | 6.3% |
대구광역시 | 557 | 5.6% |
Other values (7) | 2142 |
위반품목
Text
Distinct | 683 |
---|---|
Distinct (%) | 6.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
돼지고기 | 781 | 7.7% |
쇠고기 | 559 | 5.5% |
배추김치 | 540 | 5.3% |
쇠고기(한우 | 384 | 3.8% |
쌀 | 346 | 3.4% |
닭고기 | 261 | 2.6% |
고추가루 | 235 | 2.3% |
멥쌀 | 210 | 2.1% |
떡류 | 176 | 1.7% |
두부류 | 174 | 1.7% |
Other values (674) | 6510 |
Most occurring characters
Value | Count | Frequency (%) |
기 | 3115 | 8.3% |
고 | 3095 | 8.2% |
( | 1449 | 3.9% |
) | 1449 | 3.9% |
지 | 1231 | 3.3% |
쇠 | 1153 | 3.1% |
추 | 1117 | 3.0% |
돼 | 976 | 2.6% |
쌀 | 759 | 2.0% |
류 | 758 | 2.0% |
Other values (353) | 22452 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 34456 | |
Open Punctuation | 1449 | 3.9% |
Close Punctuation | 1449 | 3.9% |
Space Separator | 176 | 0.5% |
Uppercase Letter | 12 | < 0.1% |
Other Punctuation | 8 | < 0.1% |
Decimal Number | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 3115 | 9.0% |
고 | 3095 | 9.0% |
지 | 1231 | 3.6% |
쇠 | 1153 | 3.3% |
추 | 1117 | 3.2% |
돼 | 976 | 2.8% |
쌀 | 759 | 2.2% |
류 | 758 | 2.2% |
배 | 736 | 2.1% |
치 | 679 | 2.0% |
Other values (343) | 20837 |
Decimal Number
Value | Count | Frequency (%) |
1 | 2 | |
6 | 1 | |
4 | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
M | 8 | |
A | 4 |
Other Punctuation
Value | Count | Frequency (%) |
. | 7 | |
/ | 1 | 12.5% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1449 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1449 |
Space Separator
Value | Count | Frequency (%) |
176 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 34456 | |
Common | 3086 | 8.2% |
Latin | 12 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 3115 | 9.0% |
고 | 3095 | 9.0% |
지 | 1231 | 3.6% |
쇠 | 1153 | 3.3% |
추 | 1117 | 3.2% |
돼 | 976 | 2.8% |
쌀 | 759 | 2.2% |
류 | 758 | 2.2% |
배 | 736 | 2.1% |
치 | 679 | 2.0% |
Other values (343) | 20837 |
Common
Value | Count | Frequency (%) |
( | 1449 | |
) | 1449 | |
176 | 5.7% | |
. | 7 | 0.2% |
1 | 2 | 0.1% |
/ | 1 | < 0.1% |
6 | 1 | < 0.1% |
4 | 1 | < 0.1% |
Latin
Value | Count | Frequency (%) |
M | 8 | |
A | 4 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 34456 | |
ASCII | 3098 | 8.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
기 | 3115 | 9.0% |
고 | 3095 | 9.0% |
지 | 1231 | 3.6% |
쇠 | 1153 | 3.3% |
추 | 1117 | 3.2% |
돼 | 976 | 2.8% |
쌀 | 759 | 2.2% |
류 | 758 | 2.2% |
배 | 736 | 2.1% |
치 | 679 | 2.0% |
Other values (343) | 20837 |
ASCII
Value | Count | Frequency (%) |
( | 1449 | |
) | 1449 | |
176 | 5.7% | |
M | 8 | 0.3% |
. | 7 | 0.2% |
A | 4 | 0.1% |
1 | 2 | 0.1% |
/ | 1 | < 0.1% |
6 | 1 | < 0.1% |
4 | 1 | < 0.1% |
위반유형
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
거짓표시 | |
---|---|
미표시 | |
영수증미비치 | 22 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 3.5932 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 거짓표시 |
---|---|
2nd row | 미표시 |
3rd row | 거짓표시 |
4th row | 미표시 |
5th row | 거짓표시 |
Common Values
Value | Count | Frequency (%) |
거짓표시 | 5866 | |
미표시 | 4112 | |
영수증미비치 | 22 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
거짓표시 | 5866 | |
미표시 | 4112 | |
영수증미비치 | 22 | 0.2% |
위반건수
Real number (ℝ)
Distinct | 30 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.8733 |
Minimum | 1 |
---|---|
Maximum | 114 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 6 |
Maximum | 114 |
Range | 113 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 2.507125 |
---|---|
Coefficient of variation (CV) | 1.3383468 |
Kurtosis | 451.43108 |
Mean | 1.8733 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 13.55767 |
Sum | 18733 |
Variance | 6.2856757 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 6931 | |
2 | 1452 | 14.5% |
3 | 611 | 6.1% |
4 | 322 | 3.2% |
5 | 180 | 1.8% |
6 | 135 | 1.4% |
7 | 79 | 0.8% |
8 | 69 | 0.7% |
9 | 52 | 0.5% |
10 | 38 | 0.4% |
Other values (20) | 131 | 1.3% |
Value | Count | Frequency (%) |
1 | 6931 | |
2 | 1452 | 14.5% |
3 | 611 | 6.1% |
4 | 322 | 3.2% |
5 | 180 | 1.8% |
6 | 135 | 1.4% |
7 | 79 | 0.8% |
8 | 69 | 0.7% |
9 | 52 | 0.5% |
10 | 38 | 0.4% |
Value | Count | Frequency (%) |
114 | 1 | < 0.1% |
60 | 1 | < 0.1% |
39 | 1 | < 0.1% |
31 | 1 | < 0.1% |
29 | 3 | |
28 | 2 | |
26 | 1 | < 0.1% |
23 | 2 | |
22 | 3 | |
21 | 1 | < 0.1% |
위반물량(kg)
Real number (ℝ)
MISSING
  SKEWED
 
Distinct | 3203 |
---|---|
Distinct (%) | 33.6% |
Missing | 462 |
Missing (%) | 4.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 8343.8825 |
Minimum | 0 |
---|---|
Maximum | 8105922 |
Zeros | 1 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 5.8 |
median | 30 |
Q3 | 360 |
95-th percentile | 9303 |
Maximum | 8105922 |
Range | 8105922 |
Interquartile range (IQR) | 354.2 |
Descriptive statistics
Standard deviation | 159106.44 |
---|---|
Coefficient of variation (CV) | 19.068634 |
Kurtosis | 1898.5376 |
Mean | 8343.8825 |
Median Absolute Deviation (MAD) | 28.5 |
Skewness | 41.862149 |
Sum | 79583952 |
Variance | 2.5314859 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10.0 | 345 | 3.5% |
1.0 | 329 | 3.3% |
2.0 | 287 | 2.9% |
5.0 | 252 | 2.5% |
3.0 | 244 | 2.4% |
20.0 | 222 | 2.2% |
4.0 | 198 | 2.0% |
6.0 | 162 | 1.6% |
40.0 | 124 | 1.2% |
30.0 | 118 | 1.2% |
Other values (3193) | 7257 | |
(Missing) | 462 | 4.6% |
Value | Count | Frequency (%) |
0.0 | 1 | < 0.1% |
0.05 | 2 | < 0.1% |
0.06 | 1 | < 0.1% |
0.08 | 1 | < 0.1% |
0.1 | 8 | |
0.112 | 1 | < 0.1% |
0.143 | 1 | < 0.1% |
0.144 | 1 | < 0.1% |
0.15 | 8 | |
0.17 | 2 | < 0.1% |
Value | Count | Frequency (%) |
8105922.0 | 1 | |
7818860.0 | 1 | |
6612348.0 | 1 | |
6087342.0 | 1 | |
4200000.0 | 1 | |
1790464.0 | 1 | |
1129380.0 | 1 | |
1103395.0 | 1 | |
1020367.0 | 1 | |
884830.0 | 1 |
업무구분명 | 시도명 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|
업무구분명 | 1.000 | 0.058 | 0.411 | 0.043 | 0.000 |
시도명 | 0.058 | 1.000 | 0.126 | 0.042 | 0.000 |
위반유형 | 0.411 | 0.126 | 1.000 | 0.045 | 0.000 |
위반건수 | 0.043 | 0.042 | 0.045 | 1.000 | 0.000 |
위반물량(kg) | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
위반유형 | 업무구분명 | 시도명 | |
---|---|---|---|
위반유형 | 1.000 | 0.187 | 0.067 |
업무구분명 | 0.187 | 1.000 | 0.027 |
시도명 | 0.067 | 0.027 | 1.000 |
위반건수 | 위반물량(kg) | 업무구분명 | 시도명 | 위반유형 | |
---|---|---|---|---|---|
위반건수 | 1.000 | 0.296 | 0.016 | 0.020 | 0.019 |
위반물량(kg) | 0.296 | 1.000 | 0.000 | 0.000 | 0.000 |
업무구분명 | 0.016 | 0.000 | 1.000 | 0.027 | 0.187 |
시도명 | 0.020 | 0.000 | 0.027 | 1.000 | 0.067 |
위반유형 | 0.019 | 0.000 | 0.187 | 0.067 | 1.000 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|---|---|
57841 | 2003-03-01 | 원산지단속 | 부산광역시 | 추출가공식품 | 거짓표시 | 1 | 516.0 |
26868 | 2013-03-01 | 원산지단속 | 전라남도 | 일품검정콩 | 미표시 | 1 | 6.0 |
39863 | 2009-09-01 | 원산지단속 | 강원도 | 돼지고기 | 거짓표시 | 15 | 2024.9 |
48280 | 2007-02-01 | 원산지단속 | 대구광역시 | 옥수수가루 | 미표시 | 1 | 27.0 |
36294 | 2010-08-01 | 원산지단속 | 경상북도 | 추출가공식품 | 거짓표시 | 1 | 51888.0 |
62038 | 2001-04-01 | 원산지단속 | 서울특별시 | 기타 | 거짓표시 | 1 | 40.0 |
10214 | 2019-01-01 | 원산지단속 | 전라북도 | 월동배추 | 거짓표시 | 1 | 500.0 |
20021 | 2015-06-01 | 원산지단속 | 경상북도 | 세척당근 | 거짓표시 | 1 | 10.0 |
48291 | 2007-02-01 | 원산지단속 | 부산광역시 | 호박 | 거짓표시 | 1 | 2.5 |
23222 | 2014-05-01 | 원산지단속 | 서울특별시 | 산수유 | 거짓표시 | 1 | 10.5 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|---|---|
62239 | 2001-03-01 | 원산지단속 | 전라북도 | 돼지고기 | 거짓표시 | 4 | 89.5 |
55467 | 2004-03-01 | 원산지단속 | 경기도 | 엿기름 | 거짓표시 | 1 | 540.0 |
17582 | 2016-04-01 | 양곡표시 | 충청북도 | 메현미 | 거짓표시 | 1 | 25000.0 |
21921 | 2014-10-01 | 원산지단속 | 경상북도 | 약재류 기타 | 미표시 | 1 | 5.0 |
13934 | 2017-08-01 | 원산지단속 | 전라남도 | 돼지고기 | 거짓표시 | 2 | 117.0 |
25035 | 2013-10-01 | 원산지단속 | 서울특별시 | 포기김치 | 거짓표시 | 1 | 80.0 |
39511 | 2009-11-01 | 원산지단속 | 대전광역시 | 닭고기 | 미표시 | 1 | 2.0 |
55170 | 2004-05-01 | 원산지단속 | 충청남도 | 조미 기타 | 거짓표시 | 2 | 5803.0 |
4737 | 2021-02-01 | 원산지단속 | 충청남도 | 호두 | 미표시 | 1 | 0.8 |
56498 | 2003-10-01 | 원산지단속 | 전라북도 | 돼지고기 | 거짓표시 | 4 | 208.6 |