Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 549 |
Missing cells (%) | 0.8% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 3 |
Text | 1 |
Numeric | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 원산지표시 시도별 위반품목 및 위반물량 현황 정보(처분년월, 업무구분, 시도명, 위반품목, 위반유형, 위반건수, 위반물량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001684 |
Reproduction
Analysis started | 2024-03-23 07:48:08.479833 |
---|---|
Analysis finished | 2024-03-23 07:48:10.892489 |
Duration | 2.41 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
처분년월
Date
Distinct | 4348 |
---|---|
Distinct (%) | 43.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 1998-02-11 00:00:00 |
---|---|
Maximum | 2023-09-15 00:00:00 |
업무구분명
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
원산지단속 | |
---|---|
축산물이력 | 501 |
양곡표시 | 438 |
미검사품 | 19 |
재사용화환 | 15 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9529 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 원산지단속 |
---|---|
2nd row | 원산지단속 |
3rd row | 원산지단속 |
4th row | 원산지단속 |
5th row | 원산지단속 |
Common Values
Value | Count | Frequency (%) |
원산지단속 | 9020 | |
축산물이력 | 501 | 5.0% |
양곡표시 | 438 | 4.4% |
미검사품 | 19 | 0.2% |
재사용화환 | 15 | 0.1% |
GMO | 7 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
원산지단속 | 9020 | |
축산물이력 | 501 | 5.0% |
양곡표시 | 438 | 4.4% |
미검사품 | 19 | 0.2% |
재사용화환 | 15 | 0.1% |
gmo | 7 | 0.1% |
시도명
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
전라남도 | |
경상북도 | |
강원특별자치도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.4904 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경상북도 |
---|---|
2nd row | 전라북도 |
3rd row | 강원특별자치도 |
4th row | 경상북도 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
경기도 | 1344 | |
서울특별시 | 943 | |
전라남도 | 848 | |
경상북도 | 814 | |
강원특별자치도 | 803 | |
전라북도 | 755 | 7.5% |
경상남도 | 742 | 7.4% |
충청남도 | 638 | 6.4% |
충청북도 | 611 | 6.1% |
대구광역시 | 532 | 5.3% |
Other values (7) | 1970 |
Length
Value | Count | Frequency (%) |
경기도 | 1344 | |
서울특별시 | 943 | |
전라남도 | 848 | |
경상북도 | 814 | |
강원특별자치도 | 803 | |
전라북도 | 755 | 7.5% |
경상남도 | 742 | 7.4% |
충청남도 | 638 | 6.4% |
충청북도 | 611 | 6.1% |
대구광역시 | 532 | 5.3% |
Other values (7) | 1970 |
위반품목
Text
Distinct | 623 |
---|---|
Distinct (%) | 6.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
돼지고기 | 1381 | 13.6% |
배추김치 | 902 | 8.9% |
쇠고기 | 778 | 7.7% |
쇠고기(한우 | 537 | 5.3% |
쌀 | 329 | 3.3% |
닭고기 | 258 | 2.5% |
멥쌀 | 198 | 2.0% |
삼겹살 | 191 | 1.9% |
고추가루 | 187 | 1.8% |
두부류 | 170 | 1.7% |
Other values (618) | 5190 |
Most occurring characters
Value | Count | Frequency (%) |
고 | 3860 | 10.1% |
기 | 3810 | 9.9% |
지 | 1769 | 4.6% |
돼 | 1559 | 4.1% |
쇠 | 1464 | 3.8% |
) | 1433 | 3.7% |
( | 1433 | 3.7% |
추 | 1427 | 3.7% |
배 | 1085 | 2.8% |
김 | 1043 | 2.7% |
Other values (337) | 19472 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 35354 | |
Close Punctuation | 1433 | 3.7% |
Open Punctuation | 1433 | 3.7% |
Space Separator | 121 | 0.3% |
Uppercase Letter | 9 | < 0.1% |
Decimal Number | 3 | < 0.1% |
Other Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
고 | 3860 | 10.9% |
기 | 3810 | 10.8% |
지 | 1769 | 5.0% |
돼 | 1559 | 4.4% |
쇠 | 1464 | 4.1% |
추 | 1427 | 4.0% |
배 | 1085 | 3.1% |
김 | 1043 | 3.0% |
치 | 1039 | 2.9% |
쌀 | 708 | 2.0% |
Other values (328) | 17590 |
Decimal Number
Value | Count | Frequency (%) |
6 | 1 | |
1 | 1 | |
4 | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
M | 6 | |
A | 3 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1433 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1433 |
Space Separator
Value | Count | Frequency (%) |
121 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 35354 | |
Common | 2992 | 7.8% |
Latin | 9 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
고 | 3860 | 10.9% |
기 | 3810 | 10.8% |
지 | 1769 | 5.0% |
돼 | 1559 | 4.4% |
쇠 | 1464 | 4.1% |
추 | 1427 | 4.0% |
배 | 1085 | 3.1% |
김 | 1043 | 3.0% |
치 | 1039 | 2.9% |
쌀 | 708 | 2.0% |
Other values (328) | 17590 |
Common
Value | Count | Frequency (%) |
) | 1433 | |
( | 1433 | |
121 | 4.0% | |
. | 2 | 0.1% |
6 | 1 | < 0.1% |
1 | 1 | < 0.1% |
4 | 1 | < 0.1% |
Latin
Value | Count | Frequency (%) |
M | 6 | |
A | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 35354 | |
ASCII | 3001 | 7.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
고 | 3860 | 10.9% |
기 | 3810 | 10.8% |
지 | 1769 | 5.0% |
돼 | 1559 | 4.4% |
쇠 | 1464 | 4.1% |
추 | 1427 | 4.0% |
배 | 1085 | 3.1% |
김 | 1043 | 3.0% |
치 | 1039 | 2.9% |
쌀 | 708 | 2.0% |
Other values (328) | 17590 |
ASCII
Value | Count | Frequency (%) |
) | 1433 | |
( | 1433 | |
121 | 4.0% | |
M | 6 | 0.2% |
A | 3 | 0.1% |
. | 2 | 0.1% |
6 | 1 | < 0.1% |
1 | 1 | < 0.1% |
4 | 1 | < 0.1% |
위반유형
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
거짓표시 | |
---|---|
미표시 | |
영수증미비치 | 17 |
조사거부 | 1 |
시정명령 위반 | 1 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.6069 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 미표시 |
---|---|
2nd row | 거짓표시 |
3rd row | 거짓표시 |
4th row | 거짓표시 |
5th row | 미표시 |
Common Values
Value | Count | Frequency (%) |
거짓표시 | 6013 | |
미표시 | 3968 | |
영수증미비치 | 17 | 0.2% |
조사거부 | 1 | < 0.1% |
시정명령 위반 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
거짓표시 | 6013 | |
미표시 | 3968 | |
영수증미비치 | 17 | 0.2% |
조사거부 | 1 | < 0.1% |
시정명령 | 1 | < 0.1% |
위반 | 1 | < 0.1% |
위반건수
Real number (ℝ)
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.268 |
Minimum | 1 |
---|---|
Maximum | 35 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 35 |
Range | 34 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.92242132 |
---|---|
Coefficient of variation (CV) | 0.72746161 |
Kurtosis | 340.62327 |
Mean | 1.268 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 12.75645 |
Sum | 12680 |
Variance | 0.85086109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 8369 | |
2 | 1122 | 11.2% |
3 | 296 | 3.0% |
4 | 107 | 1.1% |
5 | 46 | 0.5% |
6 | 22 | 0.2% |
7 | 18 | 0.2% |
8 | 5 | 0.1% |
10 | 3 | < 0.1% |
11 | 3 | < 0.1% |
Other values (8) | 9 | 0.1% |
Value | Count | Frequency (%) |
1 | 8369 | |
2 | 1122 | 11.2% |
3 | 296 | 3.0% |
4 | 107 | 1.1% |
5 | 46 | 0.5% |
6 | 22 | 0.2% |
7 | 18 | 0.2% |
8 | 5 | 0.1% |
9 | 2 | < 0.1% |
10 | 3 | < 0.1% |
Value | Count | Frequency (%) |
35 | 1 | < 0.1% |
32 | 1 | < 0.1% |
17 | 1 | < 0.1% |
16 | 1 | < 0.1% |
15 | 1 | < 0.1% |
14 | 1 | < 0.1% |
13 | 1 | < 0.1% |
11 | 3 | |
10 | 3 | |
9 | 2 |
위반물량
Real number (ℝ)
MISSING
  SKEWED
 
Distinct | 2706 |
---|---|
Distinct (%) | 28.6% |
Missing | 549 |
Missing (%) | 5.5% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4396.2262 |
Minimum | 0 |
---|---|
Maximum | 13325542 |
Zeros | 4 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 5 |
median | 27 |
Q3 | 210 |
95-th percentile | 5229.1 |
Maximum | 13325542 |
Range | 13325542 |
Interquartile range (IQR) | 205 |
Descriptive statistics
Standard deviation | 141328.09 |
---|---|
Coefficient of variation (CV) | 32.147593 |
Kurtosis | 8361.6998 |
Mean | 4396.2262 |
Median Absolute Deviation (MAD) | 25.5 |
Skewness | 89.185695 |
Sum | 41548734 |
Variance | 1.997363 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1.0 | 384 | 3.8% |
10.0 | 383 | 3.8% |
2.0 | 292 | 2.9% |
20.0 | 251 | 2.5% |
3.0 | 250 | 2.5% |
5.0 | 222 | 2.2% |
4.0 | 194 | 1.9% |
40.0 | 163 | 1.6% |
6.0 | 142 | 1.4% |
30.0 | 132 | 1.3% |
Other values (2696) | 7038 | |
(Missing) | 549 | 5.5% |
Value | Count | Frequency (%) |
0.0 | 4 | < 0.1% |
0.02 | 4 | < 0.1% |
0.03 | 1 | < 0.1% |
0.04 | 1 | < 0.1% |
0.046 | 1 | < 0.1% |
0.05 | 3 | < 0.1% |
0.08 | 2 | < 0.1% |
0.09 | 1 | < 0.1% |
0.1 | 10 | |
0.13 | 1 | < 0.1% |
Value | Count | Frequency (%) |
13325542.0 | 1 | |
2071151.0 | 1 | |
1574500.0 | 1 | |
986298.5 | 1 | |
650134.0 | 1 | |
466540.0 | 1 | |
413891.0 | 1 | |
409800.0 | 1 | |
406840.0 | 1 | |
400500.0 | 1 |
업무구분명 | 시도명 | 위반유형 | 위반건수 | 위반물량 | |
---|---|---|---|---|---|
업무구분명 | 1.000 | 0.101 | 0.240 | 0.061 | 0.000 |
시도명 | 0.101 | 1.000 | 0.078 | 0.022 | 0.050 |
위반유형 | 0.240 | 0.078 | 1.000 | 0.000 | 0.000 |
위반건수 | 0.061 | 0.022 | 0.000 | 1.000 | 0.000 |
위반물량 | 0.000 | 0.050 | 0.000 | 0.000 | 1.000 |
위반유형 | 업무구분명 | 시도명 | |
---|---|---|---|
위반유형 | 1.000 | 0.165 | 0.040 |
업무구분명 | 0.165 | 1.000 | 0.048 |
시도명 | 0.040 | 0.048 | 1.000 |
위반건수 | 위반물량 | 업무구분명 | 시도명 | 위반유형 | |
---|---|---|---|---|---|
위반건수 | 1.000 | 0.162 | 0.022 | 0.010 | 0.000 |
위반물량 | 0.162 | 1.000 | 0.000 | 0.026 | 0.000 |
업무구분명 | 0.022 | 0.000 | 1.000 | 0.048 | 0.165 |
시도명 | 0.010 | 0.026 | 0.048 | 1.000 | 0.040 |
위반유형 | 0.000 | 0.000 | 0.165 | 0.040 | 1.000 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량 | |
---|---|---|---|---|---|---|---|
56028 | 2010-11-29 | 원산지단속 | 경상북도 | 배추김치 | 미표시 | 1 | 10.0 |
27036 | 2016-08-25 | 원산지단속 | 전라북도 | 쇠고기 | 거짓표시 | 1 | 62.8 |
93089 | 2001-09-22 | 원산지단속 | 강원특별자치도 | 돼지고기 | 거짓표시 | 1 | 35.3 |
77233 | 2006-06-26 | 원산지단속 | 경상북도 | 돼지고기 | 거짓표시 | 1 | 115.9 |
33777 | 2015-02-26 | 원산지단속 | 서울특별시 | 쇠고기 | 미표시 | 2 | 9.4 |
22688 | 2017-09-15 | 원산지단속 | 강원특별자치도 | 배추김치 | 거짓표시 | 1 | 100.0 |
3057 | 2022-11-27 | 축산물이력 | 전라북도 | 닭고기 | 미표시 | 1 | 35334.0 |
17851 | 2018-12-03 | 축산물이력 | 경상남도 | 쇠고기(한우) | 미표시 | 1 | 0.1 |
82538 | 2004-11-09 | 원산지단속 | 대구광역시 | 참기름 | 거짓표시 | 1 | 30.0 |
97715 | 2000-02-18 | 원산지단속 | 부산광역시 | 맥류기타 | 거짓표시 | 1 | 30.0 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량 | |
---|---|---|---|---|---|---|---|
54802 | 2011-02-01 | 원산지단속 | 경상북도 | 배추김치 | 거짓표시 | 1 | 30.0 |
21924 | 2017-11-30 | 축산물이력 | 강원특별자치도 | 쇠고기(한우) | 미표시 | 1 | 1.0 |
41702 | 2013-05-28 | 원산지단속 | 울산광역시 | 배추김치 | 거짓표시 | 2 | 60.0 |
13241 | 2020-01-16 | 원산지단속 | 경기도 | 삼겹살 | 거짓표시 | 1 | 400.0 |
74777 | 2007-03-02 | 원산지단속 | 강원특별자치도 | 참기름 | 미표시 | 2 | 10.0 |
26623 | 2016-09-13 | 원산지단속 | 경기도 | 목삼겹 | 거짓표시 | 1 | 264.6 |
76023 | 2006-10-18 | 원산지단속 | 충청북도 | 고추가루 | 거짓표시 | 1 | 460.0 |
11457 | 2020-07-30 | 원산지단속 | 경기도 | 양념육(육지물) | 미표시 | 1 | 15045.0 |
62434 | 2009-10-17 | 원산지단속 | 경기도 | 떡류 | 미표시 | 1 | 4.5 |
70361 | 2008-05-01 | 원산지단속 | 경기도 | 쇠고기 | 거짓표시 | 1 | 3600.0 |