Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 445 |
Missing cells (%) | 0.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 3 |
Text | 1 |
Numeric | 2 |
Dataset
Description | 국립농산물품질관리원에서 관리하는 원산지표시 시도별 위반품목 및 위반물량 현황 정보(처분년월, 업무구분, 시도명, 위반품목, 위반유형, 위반건수, 위반물량) |
---|---|
Author | 국립농산물품질관리원 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220204000000001684 |
Reproduction
Analysis started | 2024-03-23 07:46:52.848135 |
---|---|
Analysis finished | 2024-03-23 07:46:55.494618 |
Duration | 2.65 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
처분년월
Date
Distinct | 270 |
---|---|
Distinct (%) | 2.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 1998-04-01 00:00:00 |
---|---|
Maximum | 2022-03-01 00:00:00 |
업무구분명
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
원산지단속 | |
---|---|
양곡표시 | 480 |
축산물이력 | 323 |
미검사품 | 27 |
재사용화환 | 10 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9481 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 양곡표시 |
---|---|
2nd row | 원산지단속 |
3rd row | 원산지단속 |
4th row | 원산지단속 |
5th row | 원산지단속 |
Common Values
Value | Count | Frequency (%) |
원산지단속 | 9154 | |
양곡표시 | 480 | 4.8% |
축산물이력 | 323 | 3.2% |
미검사품 | 27 | 0.3% |
재사용화환 | 10 | 0.1% |
GMO | 6 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
원산지단속 | 9154 | |
양곡표시 | 480 | 4.8% |
축산물이력 | 323 | 3.2% |
미검사품 | 27 | 0.3% |
재사용화환 | 10 | 0.1% |
gmo | 6 | 0.1% |
시도명
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
경상북도 | |
전라남도 | |
전라북도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.2196 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 광주광역시 |
---|---|
2nd row | 울산광역시 |
3rd row | 전라북도 |
4th row | 강원도 |
5th row | 경상북도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 1208 | |
서울특별시 | 903 | |
경상북도 | 849 | 8.5% |
전라남도 | 836 | 8.4% |
전라북도 | 771 | 7.7% |
강원도 | 731 | 7.3% |
경상남도 | 722 | 7.2% |
충청북도 | 633 | 6.3% |
충청남도 | 621 | 6.2% |
대구광역시 | 551 | 5.5% |
Other values (7) | 2175 |
Length
Value | Count | Frequency (%) |
경기도 | 1208 | |
서울특별시 | 903 | |
경상북도 | 849 | 8.5% |
전라남도 | 836 | 8.4% |
전라북도 | 771 | 7.7% |
강원도 | 731 | 7.3% |
경상남도 | 722 | 7.2% |
충청북도 | 633 | 6.3% |
충청남도 | 621 | 6.2% |
대구광역시 | 551 | 5.5% |
Other values (7) | 2175 |
위반품목
Text
Distinct | 678 |
---|---|
Distinct (%) | 6.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
돼지고기 | 822 | 8.1% |
쇠고기 | 553 | 5.4% |
배추김치 | 528 | 5.2% |
쇠고기(한우 | 384 | 3.8% |
쌀 | 349 | 3.4% |
닭고기 | 299 | 2.9% |
고추가루 | 251 | 2.5% |
멥쌀 | 228 | 2.2% |
두부류 | 166 | 1.6% |
삼겹살 | 156 | 1.5% |
Other values (668) | 6417 |
Most occurring characters
Value | Count | Frequency (%) |
고 | 3156 | 8.4% |
기 | 3139 | 8.4% |
( | 1411 | 3.8% |
) | 1411 | 3.8% |
지 | 1267 | 3.4% |
쇠 | 1133 | 3.0% |
추 | 1086 | 2.9% |
돼 | 1009 | 2.7% |
쌀 | 777 | 2.1% |
류 | 711 | 1.9% |
Other values (342) | 22388 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 34487 | |
Open Punctuation | 1411 | 3.8% |
Close Punctuation | 1411 | 3.8% |
Space Separator | 153 | 0.4% |
Uppercase Letter | 12 | < 0.1% |
Decimal Number | 9 | < 0.1% |
Other Punctuation | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
고 | 3156 | 9.2% |
기 | 3139 | 9.1% |
지 | 1267 | 3.7% |
쇠 | 1133 | 3.3% |
추 | 1086 | 3.1% |
돼 | 1009 | 2.9% |
쌀 | 777 | 2.3% |
류 | 711 | 2.1% |
배 | 694 | 2.0% |
반 | 685 | 2.0% |
Other values (333) | 20830 |
Decimal Number
Value | Count | Frequency (%) |
4 | 6 | |
1 | 2 | 22.2% |
2 | 1 | 11.1% |
Uppercase Letter
Value | Count | Frequency (%) |
M | 8 | |
A | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1411 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1411 |
Space Separator
Value | Count | Frequency (%) |
153 |
Other Punctuation
Value | Count | Frequency (%) |
. | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 34487 | |
Common | 2989 | 8.0% |
Latin | 12 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
고 | 3156 | 9.2% |
기 | 3139 | 9.1% |
지 | 1267 | 3.7% |
쇠 | 1133 | 3.3% |
추 | 1086 | 3.1% |
돼 | 1009 | 2.9% |
쌀 | 777 | 2.3% |
류 | 711 | 2.1% |
배 | 694 | 2.0% |
반 | 685 | 2.0% |
Other values (333) | 20830 |
Common
Value | Count | Frequency (%) |
( | 1411 | |
) | 1411 | |
153 | 5.1% | |
4 | 6 | 0.2% |
. | 5 | 0.2% |
1 | 2 | 0.1% |
2 | 1 | < 0.1% |
Latin
Value | Count | Frequency (%) |
M | 8 | |
A | 4 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 34487 | |
ASCII | 3001 | 8.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
고 | 3156 | 9.2% |
기 | 3139 | 9.1% |
지 | 1267 | 3.7% |
쇠 | 1133 | 3.3% |
추 | 1086 | 3.1% |
돼 | 1009 | 2.9% |
쌀 | 777 | 2.3% |
류 | 711 | 2.1% |
배 | 694 | 2.0% |
반 | 685 | 2.0% |
Other values (333) | 20830 |
ASCII
Value | Count | Frequency (%) |
( | 1411 | |
) | 1411 | |
153 | 5.1% | |
M | 8 | 0.3% |
4 | 6 | 0.2% |
. | 5 | 0.2% |
A | 4 | 0.1% |
1 | 2 | 0.1% |
2 | 1 | < 0.1% |
위반유형
Categorical
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
거짓표시 | |
---|---|
미표시 | |
영수증미비치 | 21 |
시정명령 위반 | 5 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.587 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 미표시 |
---|---|
2nd row | 거짓표시 |
3rd row | 미표시 |
4th row | 거짓표시 |
5th row | 미표시 |
Common Values
Value | Count | Frequency (%) |
거짓표시 | 5787 | |
미표시 | 4187 | |
영수증미비치 | 21 | 0.2% |
시정명령 위반 | 5 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
거짓표시 | 5787 | |
미표시 | 4187 | |
영수증미비치 | 21 | 0.2% |
시정명령 | 5 | < 0.1% |
위반 | 5 | < 0.1% |
위반건수
Real number (ℝ)
Distinct | 32 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.8724 |
Minimum | 1 |
---|---|
Maximum | 49 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 5 |
Maximum | 49 |
Range | 48 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 2.327243 |
---|---|
Coefficient of variation (CV) | 1.2429198 |
Kurtosis | 63.570753 |
Mean | 1.8724 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 6.287976 |
Sum | 18724 |
Variance | 5.4160598 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 6932 | |
2 | 1464 | 14.6% |
3 | 590 | 5.9% |
4 | 309 | 3.1% |
5 | 213 | 2.1% |
6 | 135 | 1.4% |
7 | 88 | 0.9% |
8 | 70 | 0.7% |
10 | 35 | 0.4% |
9 | 31 | 0.3% |
Other values (22) | 133 | 1.3% |
Value | Count | Frequency (%) |
1 | 6932 | |
2 | 1464 | 14.6% |
3 | 590 | 5.9% |
4 | 309 | 3.1% |
5 | 213 | 2.1% |
6 | 135 | 1.4% |
7 | 88 | 0.9% |
8 | 70 | 0.7% |
9 | 31 | 0.3% |
10 | 35 | 0.4% |
Value | Count | Frequency (%) |
49 | 1 | < 0.1% |
40 | 1 | < 0.1% |
39 | 1 | < 0.1% |
29 | 2 | < 0.1% |
28 | 6 | |
27 | 1 | < 0.1% |
26 | 2 | < 0.1% |
25 | 1 | < 0.1% |
24 | 2 | < 0.1% |
23 | 2 | < 0.1% |
위반물량(kg)
Real number (ℝ)
MISSING
  SKEWED
 
Distinct | 3140 |
---|---|
Distinct (%) | 32.9% |
Missing | 445 |
Missing (%) | 4.5% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6634.1757 |
Minimum | 0 |
---|---|
Maximum | 4916361 |
Zeros | 3 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 5.5 |
median | 28.3 |
Q3 | 324.45 |
95-th percentile | 9782.58 |
Maximum | 4916361 |
Range | 4916361 |
Interquartile range (IQR) | 318.95 |
Descriptive statistics
Standard deviation | 84499.916 |
---|---|
Coefficient of variation (CV) | 12.737063 |
Kurtosis | 1591.703 |
Mean | 6634.1757 |
Median Absolute Deviation (MAD) | 26.9 |
Skewness | 34.527317 |
Sum | 63389549 |
Variance | 7.1402358 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10.0 | 350 | 3.5% |
1.0 | 335 | 3.4% |
2.0 | 283 | 2.8% |
5.0 | 253 | 2.5% |
3.0 | 223 | 2.2% |
4.0 | 220 | 2.2% |
20.0 | 214 | 2.1% |
6.0 | 178 | 1.8% |
8.0 | 129 | 1.3% |
40.0 | 113 | 1.1% |
Other values (3130) | 7257 | |
(Missing) | 445 | 4.5% |
Value | Count | Frequency (%) |
0.0 | 3 | < 0.1% |
0.002 | 1 | < 0.1% |
0.01 | 2 | < 0.1% |
0.03 | 1 | < 0.1% |
0.042 | 1 | < 0.1% |
0.043 | 1 | < 0.1% |
0.05 | 1 | < 0.1% |
0.06 | 2 | < 0.1% |
0.08 | 1 | < 0.1% |
0.1 | 11 |
Value | Count | Frequency (%) |
4916361.0 | 1 | |
3361639.42 | 1 | |
2147482.0 | 1 | |
1790464.0 | 1 | |
1674769.0 | 1 | |
1639600.0 | 1 | |
1637134.0 | 1 | |
1540000.0 | 1 | |
1318800.0 | 1 | |
1218060.0 | 1 |
업무구분명 | 시도명 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|
업무구분명 | 1.000 | 0.095 | 0.221 | 0.061 | 0.000 |
시도명 | 0.095 | 1.000 | 0.109 | 0.087 | 0.000 |
위반유형 | 0.221 | 0.109 | 1.000 | 0.045 | 0.000 |
위반건수 | 0.061 | 0.087 | 0.045 | 1.000 | 0.000 |
위반물량(kg) | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
위반유형 | 업무구분명 | 시도명 | |
---|---|---|---|
위반유형 | 1.000 | 0.144 | 0.061 |
업무구분명 | 0.144 | 1.000 | 0.045 |
시도명 | 0.061 | 0.045 | 1.000 |
위반건수 | 위반물량(kg) | 업무구분명 | 시도명 | 위반유형 | |
---|---|---|---|---|---|
위반건수 | 1.000 | 0.323 | 0.030 | 0.033 | 0.028 |
위반물량(kg) | 0.323 | 1.000 | 0.000 | 0.000 | 0.000 |
업무구분명 | 0.030 | 0.000 | 1.000 | 0.045 | 0.144 |
시도명 | 0.033 | 0.000 | 0.045 | 1.000 | 0.061 |
위반유형 | 0.028 | 0.000 | 0.144 | 0.061 | 1.000 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|---|---|
36201 | 2010-04-01 | 양곡표시 | 광주광역시 | 흑현미 | 미표시 | 3 | 7.0 |
31551 | 2011-06-01 | 원산지단속 | 울산광역시 | 배추김치 | 거짓표시 | 5 | 780.0 |
50526 | 2005-08-01 | 원산지단속 | 전라북도 | 당근 | 미표시 | 2 | 17.0 |
56697 | 2003-01-01 | 원산지단속 | 강원도 | 쇠고기 | 거짓표시 | 1 | 14.4 |
33169 | 2011-01-01 | 원산지단속 | 경상북도 | 돈가스 | 미표시 | 2 | 13.5 |
4945 | 2020-04-01 | 원산지단속 | 경기도 | 돼지고기 | 미표시 | 2 | 20.0 |
46383 | 2007-03-01 | 원산지단속 | 인천광역시 | 보리쌀 | 미표시 | 1 | 5.0 |
14064 | 2017-01-01 | 원산지단속 | 전라남도 | 연근 | 거짓표시 | 1 | 10.0 |
50659 | 2005-06-01 | 원산지단속 | 강원도 | 땅콩 | 거짓표시 | 1 | 15.0 |
6574 | 2019-09-01 | 원산지단속 | 전라북도 | 쇠고기 | 미표시 | 1 | 2.0 |
처분년월 | 업무구분명 | 시도명 | 위반품목 | 위반유형 | 위반건수 | 위반물량(kg) | |
---|---|---|---|---|---|---|---|
58957 | 2002-01-01 | 원산지단속 | 대전광역시 | 연근 | 거짓표시 | 1 | 4.0 |
8875 | 2018-11-01 | 원산지단속 | 대전광역시 | 총각김치 | 미표시 | 1 | 625.0 |
22764 | 2014-01-01 | 원산지단속 | 광주광역시 | 돼지고기 | 거짓표시 | 2 | 43286.32 |
14055 | 2017-01-01 | 원산지단속 | 전라남도 | 거봉 | 미표시 | 3 | 6.7 |
38557 | 2009-09-01 | 원산지단속 | 대구광역시 | 쇠고기 | 거짓표시 | 17 | 5073.7 |
60980 | 2001-01-01 | 원산지단속 | 전라남도 | 엿기름 | 거짓표시 | 4 | 25.0 |
56057 | 2003-04-01 | 원산지단속 | 인천광역시 | 쇠고기 | 거짓표시 | 2 | 34.0 |
4543 | 2020-07-01 | 원산지단속 | 충청북도 | 옥수수가루 | 거짓표시 | 1 | 4640.0 |
58945 | 2002-01-01 | 원산지단속 | 대구광역시 | 돼지고기 | 거짓표시 | 3 | 190.0 |
49841 | 2006-01-01 | 원산지단속 | 충청북도 | 비지 | 미표시 | 1 | 6.5 |