Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 517 |
Missing cells (%) | 0.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
Text | 2 |
---|---|
Categorical | 3 |
Numeric | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 원산지표시 시도별 위반품목 및 위반물량 현황 정보(처분년월, 업무구분, 시도명, 위반품목, 위반유형, 위반건수, 위반물량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001684 |
Reproduction
Analysis started | 2024-03-23 07:47:56.110668 |
---|---|
Analysis finished | 2024-03-23 07:47:59.037847 |
Duration | 2.93 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
처분년월
Text
Distinct | 4349 |
---|---|
Distinct (%) | 43.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Characters and Unicode
Total characters | 100000 |
---|---|
Distinct characters | 12 |
Distinct categories | 3 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 1768 ? |
---|---|
Unique (%) | 17.7% |
Sample
1st row | 2005-01-30 |
---|---|
2nd row | 2012-10-05 |
3rd row | 2008-02-14 |
4th row | 2007-02-01 |
5th row | 2004-10-20 |
Value | Count | Frequency (%) |
2010-09-16 | 16 | 0.2% |
2010-02-12 | 15 | 0.1% |
2009-09-22 | 15 | 0.1% |
2009-09-30 | 14 | 0.1% |
2012-01-20 | 13 | 0.1% |
2010-02-05 | 12 | 0.1% |
2010-02-11 | 12 | 0.1% |
2009-09-24 | 11 | 0.1% |
2005-02-04 | 11 | 0.1% |
2016-02-01 | 11 | 0.1% |
Other values (4339) | 9870 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 27980 | |
- | 20000 | |
2 | 18385 | |
1 | 13836 | |
3 | 3371 | 3.4% |
9 | 3263 | 3.3% |
5 | 2689 | 2.7% |
4 | 2672 | 2.7% |
8 | 2646 | 2.6% |
7 | 2599 | 2.6% |
Other values (2) | 2559 | 2.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 79998 | |
Dash Punctuation | 20000 | 20.0% |
Space Separator | 2 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 27980 | |
2 | 18385 | |
1 | 13836 | |
3 | 3371 | 4.2% |
9 | 3263 | 4.1% |
5 | 2689 | 3.4% |
4 | 2672 | 3.3% |
8 | 2646 | 3.3% |
7 | 2599 | 3.2% |
6 | 2557 | 3.2% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 20000 |
Space Separator
Value | Count | Frequency (%) |
2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 100000 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 27980 | |
- | 20000 | |
2 | 18385 | |
1 | 13836 | |
3 | 3371 | 3.4% |
9 | 3263 | 3.3% |
5 | 2689 | 2.7% |
4 | 2672 | 2.7% |
8 | 2646 | 2.6% |
7 | 2599 | 2.6% |
Other values (2) | 2559 | 2.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 100000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 27980 | |
- | 20000 | |
2 | 18385 | |
1 | 13836 | |
3 | 3371 | 3.4% |
9 | 3263 | 3.3% |
5 | 2689 | 2.7% |
4 | 2672 | 2.7% |
8 | 2646 | 2.6% |
7 | 2599 | 2.6% |
Other values (2) | 2559 | 2.6% |
업무구분명
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
원산지단속 | |
---|---|
양곡표시 | 500 |
축산물이력 | 489 |
미검사품 | 18 |
재사용화환 | 11 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9472 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 원산지단속 |
---|---|
2nd row | 축산물이력 |
3rd row | GMO |
4th row | 원산지단속 |
5th row | 원산지단속 |
Common Values
Value | Count | Frequency (%) |
원산지단속 | 8977 | |
양곡표시 | 500 | 5.0% |
축산물이력 | 489 | 4.9% |
미검사품 | 18 | 0.2% |
재사용화환 | 11 | 0.1% |
GMO | 5 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
원산지단속 | 8977 | |
양곡표시 | 500 | 5.0% |
축산물이력 | 489 | 4.9% |
미검사품 | 18 | 0.2% |
재사용화환 | 11 | 0.1% |
gmo | 5 | < 0.1% |
시도명
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
전라남도 | |
경상북도 | |
강원도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.1663 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경상남도 |
---|---|
2nd row | 대구광역시 |
3rd row | 전라남도 |
4th row | 경상북도 |
5th row | 충청북도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 1331 | |
서울특별시 | 872 | |
전라남도 | 865 | |
경상북도 | 836 | |
강원도 | 773 | 7.7% |
경상남도 | 760 | 7.6% |
전라북도 | 750 | 7.5% |
충청남도 | 671 | 6.7% |
충청북도 | 647 | 6.5% |
대구광역시 | 548 | 5.5% |
Other values (7) | 1947 |
Length
Value | Count | Frequency (%) |
경기도 | 1331 | |
서울특별시 | 872 | |
전라남도 | 865 | |
경상북도 | 836 | |
강원도 | 773 | 7.7% |
경상남도 | 760 | 7.6% |
전라북도 | 750 | 7.5% |
충청남도 | 671 | 6.7% |
충청북도 | 647 | 6.5% |
대구광역시 | 548 | 5.5% |
Other values (7) | 1947 |
위반품목
Text
Distinct | 599 |
---|---|
Distinct (%) | 6.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
돼지고기 | 1320 | 13.0% |
배추김치 | 911 | 9.0% |
쇠고기 | 785 | 7.8% |
쇠고기(한우 | 531 | 5.2% |
쌀 | 339 | 3.3% |
닭고기 | 247 | 2.4% |
멥쌀 | 226 | 2.2% |
고추가루 | 205 | 2.0% |
삼겹살 | 181 | 1.8% |
두부류 | 181 | 1.8% |
Other values (591) | 5198 |
Most occurring characters
Value | Count | Frequency (%) |
기 | 3772 | 9.9% |
고 | 3753 | 9.9% |
지 | 1667 | 4.4% |
쇠 | 1481 | 3.9% |
돼 | 1473 | 3.9% |
( | 1401 | 3.7% |
) | 1401 | 3.7% |
추 | 1392 | 3.7% |
배 | 1081 | 2.9% |
김 | 1033 | 2.7% |
Other values (326) | 19474 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 34990 | |
Open Punctuation | 1401 | 3.7% |
Close Punctuation | 1401 | 3.7% |
Space Separator | 124 | 0.3% |
Uppercase Letter | 6 | < 0.1% |
Other Punctuation | 4 | < 0.1% |
Decimal Number | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 3772 | 10.8% |
고 | 3753 | 10.7% |
지 | 1667 | 4.8% |
쇠 | 1481 | 4.2% |
돼 | 1473 | 4.2% |
추 | 1392 | 4.0% |
배 | 1081 | 3.1% |
김 | 1033 | 3.0% |
치 | 1024 | 2.9% |
쌀 | 755 | 2.2% |
Other values (319) | 17559 |
Uppercase Letter
Value | Count | Frequency (%) |
M | 4 | |
A | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1401 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1401 |
Space Separator
Value | Count | Frequency (%) |
124 |
Other Punctuation
Value | Count | Frequency (%) |
. | 4 |
Decimal Number
Value | Count | Frequency (%) |
1 | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 34990 | |
Common | 2932 | 7.7% |
Latin | 6 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 3772 | 10.8% |
고 | 3753 | 10.7% |
지 | 1667 | 4.8% |
쇠 | 1481 | 4.2% |
돼 | 1473 | 4.2% |
추 | 1392 | 4.0% |
배 | 1081 | 3.1% |
김 | 1033 | 3.0% |
치 | 1024 | 2.9% |
쌀 | 755 | 2.2% |
Other values (319) | 17559 |
Common
Value | Count | Frequency (%) |
( | 1401 | |
) | 1401 | |
124 | 4.2% | |
. | 4 | 0.1% |
1 | 2 | 0.1% |
Latin
Value | Count | Frequency (%) |
M | 4 | |
A | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 34990 | |
ASCII | 2938 | 7.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
기 | 3772 | 10.8% |
고 | 3753 | 10.7% |
지 | 1667 | 4.8% |
쇠 | 1481 | 4.2% |
돼 | 1473 | 4.2% |
추 | 1392 | 4.0% |
배 | 1081 | 3.1% |
김 | 1033 | 3.0% |
치 | 1024 | 2.9% |
쌀 | 755 | 2.2% |
Other values (319) | 17559 |
ASCII
Value | Count | Frequency (%) |
( | 1401 | |
) | 1401 | |
124 | 4.2% | |
M | 4 | 0.1% |
. | 4 | 0.1% |
A | 2 | 0.1% |
1 | 2 | 0.1% |
위반유형
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
거짓표시 | |
---|---|
미표시 | |
영수증미비치 | 18 |
조사거부 | 1 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 3.6146 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 거짓표시 |
---|---|
2nd row | 미표시 |
3rd row | 미표시 |
4th row | 거짓표시 |
5th row | 거짓표시 |
Common Values
Value | Count | Frequency (%) |
거짓표시 | 6091 | |
미표시 | 3890 | |
영수증미비치 | 18 | 0.2% |
조사거부 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
거짓표시 | 6091 | |
미표시 | 3890 | |
영수증미비치 | 18 | 0.2% |
조사거부 | 1 | < 0.1% |
위반건수
Real number (ℝ)
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.2643 |
Minimum | 1 |
---|---|
Maximum | 18 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 18 |
Range | 17 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.84493603 |
---|---|
Coefficient of variation (CV) | 0.66830344 |
Kurtosis | 70.740413 |
Mean | 1.2643 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 6.6338464 |
Sum | 12643 |
Variance | 0.7139169 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 8410 | |
2 | 1085 | 10.8% |
3 | 282 | 2.8% |
4 | 106 | 1.1% |
5 | 52 | 0.5% |
6 | 23 | 0.2% |
7 | 12 | 0.1% |
8 | 10 | 0.1% |
10 | 5 | 0.1% |
13 | 4 | < 0.1% |
Other values (6) | 11 | 0.1% |
Value | Count | Frequency (%) |
1 | 8410 | |
2 | 1085 | 10.8% |
3 | 282 | 2.8% |
4 | 106 | 1.1% |
5 | 52 | 0.5% |
6 | 23 | 0.2% |
7 | 12 | 0.1% |
8 | 10 | 0.1% |
9 | 4 | < 0.1% |
10 | 5 | 0.1% |
Value | Count | Frequency (%) |
18 | 1 | < 0.1% |
16 | 1 | < 0.1% |
14 | 1 | < 0.1% |
13 | 4 | < 0.1% |
12 | 1 | < 0.1% |
11 | 3 | < 0.1% |
10 | 5 | |
9 | 4 | < 0.1% |
8 | 10 | |
7 | 12 |
위반물량(kg)
Real number (ℝ)
MISSING
  SKEWED
 
Distinct | 2726 |
---|---|
Distinct (%) | 28.7% |
Missing | 517 |
Missing (%) | 5.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3627.1068 |
Minimum | 0 |
---|---|
Maximum | 2666400 |
Zeros | 5 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 5 |
median | 25 |
Q3 | 216 |
95-th percentile | 4908.4 |
Maximum | 2666400 |
Range | 2666400 |
Interquartile range (IQR) | 211 |
Descriptive statistics
Standard deviation | 51081.288 |
---|---|
Coefficient of variation (CV) | 14.083205 |
Kurtosis | 1480.2057 |
Mean | 3627.1068 |
Median Absolute Deviation (MAD) | 23.6 |
Skewness | 35.059383 |
Sum | 34395854 |
Variance | 2.6092979 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10.0 | 401 | 4.0% |
1.0 | 376 | 3.8% |
2.0 | 310 | 3.1% |
20.0 | 258 | 2.6% |
3.0 | 241 | 2.4% |
5.0 | 226 | 2.3% |
4.0 | 207 | 2.1% |
6.0 | 174 | 1.7% |
40.0 | 169 | 1.7% |
8.0 | 138 | 1.4% |
Other values (2716) | 6983 | |
(Missing) | 517 | 5.2% |
Value | Count | Frequency (%) |
0.0 | 5 | 0.1% |
0.02 | 2 | < 0.1% |
0.03 | 1 | < 0.1% |
0.04 | 1 | < 0.1% |
0.043 | 1 | < 0.1% |
0.08 | 1 | < 0.1% |
0.1 | 16 | |
0.12 | 1 | < 0.1% |
0.15 | 3 | < 0.1% |
0.18 | 1 | < 0.1% |
Value | Count | Frequency (%) |
2666400.0 | 1 | |
2147482.0 | 1 | |
2000000.0 | 1 | |
1375548.0 | 1 | |
1282340.0 | 1 | |
986298.5 | 1 | |
955070.0 | 1 | |
612659.0 | 1 | |
502546.0 | 1 | |
455000.0 | 1 |
업무구분명 | 시도명 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|
업무구분명 | 1.000 | 0.097 | 0.294 | 0.065 | 0.000 |
시도명 | 0.097 | 1.000 | 0.110 | 0.000 | 0.000 |
위반유형 | 0.294 | 0.110 | 1.000 | 0.000 | 0.000 |
위반건수 | 0.065 | 0.000 | 0.000 | 1.000 | 0.000 |
위반물량(kg) | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
위반유형 | 업무구분명 | 시도명 | |
---|---|---|---|
위반유형 | 1.000 | 0.193 | 0.061 |
업무구분명 | 0.193 | 1.000 | 0.045 |
시도명 | 0.061 | 0.045 | 1.000 |
위반건수 | 위반물량(kg) | 업무구분명 | 시도명 | 위반유형 | |
---|---|---|---|---|---|
위반건수 | 1.000 | 0.167 | 0.034 | 0.000 | 0.000 |
위반물량(kg) | 0.167 | 1.000 | 0.000 | 0.000 | 0.000 |
업무구분명 | 0.034 | 0.000 | 1.000 | 0.045 | 0.193 |
시도명 | 0.000 | 0.000 | 0.045 | 1.000 | 0.061 |
위반유형 | 0.000 | 0.000 | 0.193 | 0.061 | 1.000 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|---|---|
80050 | 2005-01-30 | 원산지단속 | 경상남도 | 마늘 | 거짓표시 | 1 | 2.0 |
43240 | 2012-10-05 | 축산물이력 | 대구광역시 | 쇠고기(한우) | 미표시 | 1 | 10.0 |
69520 | 2008-02-14 | GMO | 전라남도 | 면화 | 미표시 | 1 | 2.2 |
73459 | 2007-02-01 | 원산지단속 | 경상북도 | 돼지고기 | 거짓표시 | 2 | 111.2 |
80730 | 2004-10-20 | 원산지단속 | 충청북도 | 기장(일반) | 거짓표시 | 1 | 1215.0 |
31680 | 2015-03-05 | 원산지단속 | 경상남도 | 돼지고기부산물 | 거짓표시 | 2 | 16.0 |
37646 | 2013-12-04 | 원산지단속 | 강원도 | 배추김치 | 거짓표시 | 1 | 330.0 |
39947 | 2013-05-15 | 원산지단속 | 경기도 | 더덕 | 거짓표시 | 2 | 12.0 |
84226 | 2003-09-20 | 원산지단속 | 충청북도 | 빵 | 거짓표시 | 1 | 1.2 |
39896 | 2013-05-21 | 원산지단속 | 세종특별자치시 | 쇠고기 | 거짓표시 | 1 | 8345.4 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|---|---|
82115 | 2004-05-12 | 원산지단속 | 경상북도 | 약재류 기타 | 거짓표시 | 1 | 57.6 |
20254 | 2017-10-24 | 축산물이력 | 경상북도 | 쇠고기(한우) | 미표시 | 1 | 0.5 |
3822 | 2022-03-23 | 원산지단속 | 경상남도 | 감초 | 거짓표시 | 1 | 25.0 |
61991 | 2009-09-03 | 원산지단속 | 전라남도 | 깻잎장아찌 | 미표시 | 1 | 0.5 |
53201 | 2011-01-26 | 원산지단속 | 전라남도 | 쇠고기 | 거짓표시 | 1 | 9.0 |
36631 | 2014-02-07 | 원산지단속 | 경상남도 | 물고사리 | 미표시 | 1 | 1.0 |
2383 | 2022-07-27 | 원산지단속 | 대구광역시 | 돼지고기 | 거짓표시 | 1 | 406.83 |
10207 | 2020-05-29 | 원산지단속 | 강원도 | 과자류기타 | 미표시 | 1 | 16.9 |
38760 | 2013-08-30 | 원산지단속 | 충청남도 | 배추김치 | 거짓표시 | 1 | 20.0 |
93479 | 2001-01-19 | 원산지단속 | 전라북도 | 쇠고기 | 거짓표시 | 1 | 6.0 |