Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 4416 |
Missing cells (%) | 5.5% |
Duplicate rows | 1142 |
Duplicate rows (%) | 11.4% |
Total size in memory | 703.1 KiB |
Average record size in memory | 72.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 4 |
DateTime | 1 |
Dataset
Description | KATI(https://www.kati.net/index.do)에 수집되는 농식품의 통관문제 사례(수입국, 수출국, 검역소명, 불합격구분사유, 발생년월 등) |
---|---|
URL | https://www.data.go.kr/data/15071796/fileData.do |
Dataset has 1142 (11.4%) duplicate rows | Duplicates |
수입국 is highly overall correlated with 조치사항 | High correlation |
조치사항 is highly overall correlated with 수입국 | High correlation |
구분 is highly imbalanced (82.8%) | Imbalance |
검역소 has 4416 (44.2%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 23:43:29.179033 |
---|---|
Analysis finished | 2023-12-12 23:43:30.331749 |
Duration | 1.15 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경쟁국산 | |
---|---|
한국산 | 256 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9744 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경쟁국산 |
---|---|
2nd row | 한국산 |
3rd row | 경쟁국산 |
4th row | 경쟁국산 |
5th row | 경쟁국산 |
Common Values
Value | Count | Frequency (%) |
경쟁국산 | 9744 | |
한국산 | 256 | 2.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
경쟁국산 | 9744 | |
한국산 | 256 | 2.6% |
수입국
Categorical
HIGH CORRELATION
 
Distinct | 44 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
미국 | |
---|---|
중국 | |
일본 | |
필리핀 | |
대만 | 317 |
Other values (39) |
Length
Max length | 8 |
---|---|
Median length | 2 |
Mean length | 2.4027 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 프랑스 |
---|---|
2nd row | 미국 |
3rd row | 아일랜드 |
4th row | 미국 |
5th row | 미국 |
Common Values
Value | Count | Frequency (%) |
미국 | 4363 | |
중국 | 1368 | 13.7% |
일본 | 644 | 6.4% |
필리핀 | 590 | 5.9% |
대만 | 317 | 3.2% |
캐나다 | 295 | 2.9% |
네덜란드 | 289 | 2.9% |
독일 | 283 | 2.8% |
스페인 | 170 | 1.7% |
벨기에 | 162 | 1.6% |
Other values (34) | 1519 | 15.2% |
Length
Value | Count | Frequency (%) |
미국 | 4363 | |
중국 | 1368 | 13.7% |
일본 | 644 | 6.4% |
필리핀 | 590 | 5.9% |
대만 | 317 | 3.2% |
캐나다 | 295 | 2.9% |
네덜란드 | 289 | 2.9% |
독일 | 283 | 2.8% |
스페인 | 170 | 1.7% |
벨기에 | 162 | 1.6% |
Other values (34) | 1519 | 15.2% |
원산지
Text
Distinct | 149 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
멕시코 | 1162 | 11.6% |
미국 | 877 | 8.7% |
인도 | 650 | 6.5% |
중국 | 605 | 6.0% |
일본 | 487 | 4.8% |
필리핀 | 466 | 4.6% |
베트남 | 436 | 4.3% |
튀르키예 | 397 | 3.9% |
캐나다 | 394 | 3.9% |
대한민국 | 256 | 2.5% |
Other values (143) | 4322 |
Most occurring characters
Value | Count | Frequency (%) |
국 | 2095 | 7.0% |
시 | 1650 | 5.5% |
코 | 1276 | 4.2% |
멕 | 1162 | 3.9% |
아 | 1052 | 3.5% |
도 | 1021 | 3.4% |
인 | 1015 | 3.4% |
미 | 945 | 3.1% |
리 | 898 | 3.0% |
스 | 866 | 2.9% |
Other values (148) | 18090 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 30015 | |
Space Separator | 52 | 0.2% |
Dash Punctuation | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 2095 | 7.0% |
시 | 1650 | 5.5% |
코 | 1276 | 4.3% |
멕 | 1162 | 3.9% |
아 | 1052 | 3.5% |
도 | 1021 | 3.4% |
인 | 1015 | 3.4% |
미 | 945 | 3.1% |
리 | 898 | 3.0% |
스 | 866 | 2.9% |
Other values (146) | 18035 |
Space Separator
Value | Count | Frequency (%) |
52 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 30015 | |
Common | 55 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 2095 | 7.0% |
시 | 1650 | 5.5% |
코 | 1276 | 4.3% |
멕 | 1162 | 3.9% |
아 | 1052 | 3.5% |
도 | 1021 | 3.4% |
인 | 1015 | 3.4% |
미 | 945 | 3.1% |
리 | 898 | 3.0% |
스 | 866 | 2.9% |
Other values (146) | 18035 |
Common
Value | Count | Frequency (%) |
52 | ||
- | 3 | 5.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 30015 | |
ASCII | 55 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
국 | 2095 | 7.0% |
시 | 1650 | 5.5% |
코 | 1276 | 4.3% |
멕 | 1162 | 3.9% |
아 | 1052 | 3.5% |
도 | 1021 | 3.4% |
인 | 1015 | 3.4% |
미 | 945 | 3.1% |
리 | 898 | 3.0% |
스 | 866 | 2.9% |
Other values (146) | 18035 |
ASCII
Value | Count | Frequency (%) |
52 | ||
- | 3 | 5.5% |
발생일자
Date
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2022-01-01 00:00:00 |
---|---|
Maximum | 2023-06-01 00:00:00 |
품목
Text
Distinct | 855 |
---|---|
Distinct (%) | 8.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 88 |
---|---|
Median length | 69 |
Mean length | 18.1872 |
Min length | 1 |
Characters and Unicode
Total characters | 181872 |
---|---|
Distinct characters | 571 |
Distinct categories | 9 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 267 ? |
---|---|
Unique (%) | 2.7% |
Sample
1st row | 조제품 기타 |
---|---|
2nd row | 팽이버섯(신선/냉장) |
3rd row | 닭고기(설육/간장제외/냉동) |
4th row | 기타버섯(신선/냉장) |
5th row | 콘 칩 |
Value | Count | Frequency (%) |
기타 | 2020 | 5.7% |
것 | 1808 | 5.1% |
이외 | 1018 | 2.9% |
않은 | 716 | 2.0% |
또는 | 644 | 1.8% |
제외 | 592 | 1.7% |
조제품 | 565 | 1.6% |
과실 | 536 | 1.5% |
및 | 486 | 1.4% |
콘 | 448 | 1.3% |
Other values (1460) | 26517 |
Most occurring characters
Value | Count | Frequency (%) |
25350 | 13.9% | |
( | 8103 | 4.5% |
) | 8102 | 4.5% |
기 | 6364 | 3.5% |
타 | 5986 | 3.3% |
, | 5069 | 2.8% |
제 | 4063 | 2.2% |
조 | 3738 | 2.1% |
/ | 3246 | 1.8% |
스 | 3189 | 1.8% |
Other values (561) | 108662 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 126308 | |
Space Separator | 25350 | 13.9% |
Other Punctuation | 8510 | 4.7% |
Open Punctuation | 8111 | 4.5% |
Close Punctuation | 8110 | 4.5% |
Lowercase Letter | 3547 | 2.0% |
Decimal Number | 1809 | 1.0% |
Uppercase Letter | 126 | 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 6364 | 5.0% |
타 | 5986 | 4.7% |
제 | 4063 | 3.2% |
조 | 3738 | 3.0% |
스 | 3189 | 2.5% |
이 | 2916 | 2.3% |
것 | 2816 | 2.2% |
과 | 2357 | 1.9% |
외 | 2172 | 1.7% |
품 | 2065 | 1.6% |
Other values (509) | 90642 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 427 | |
a | 424 | |
l | 338 | |
n | 321 | |
o | 217 | 6.1% |
r | 212 | 6.0% |
u | 209 | 5.9% |
t | 205 | 5.8% |
d | 203 | 5.7% |
m | 196 | 5.5% |
Other values (14) | 795 |
Decimal Number
Value | Count | Frequency (%) |
0 | 821 | |
2 | 394 | |
9 | 258 | 14.3% |
1 | 182 | 10.1% |
6 | 73 | 4.0% |
3 | 32 | 1.8% |
5 | 28 | 1.5% |
8 | 12 | 0.7% |
7 | 7 | 0.4% |
4 | 2 | 0.1% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 52 | |
L | 30 | |
P | 20 | 15.9% |
C | 11 | 8.7% |
T | 10 | 7.9% |
D | 2 | 1.6% |
O | 1 | 0.8% |
Other Punctuation
Value | Count | Frequency (%) |
, | 5069 | |
/ | 3246 | |
· | 126 | 1.5% |
. | 58 | 0.7% |
% | 11 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 8103 | |
[ | 8 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 8102 | |
] | 8 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
25350 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 126297 | |
Common | 51891 | |
Latin | 3673 | 2.0% |
Han | 11 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 6364 | 5.0% |
타 | 5986 | 4.7% |
제 | 4063 | 3.2% |
조 | 3738 | 3.0% |
스 | 3189 | 2.5% |
이 | 2916 | 2.3% |
것 | 2816 | 2.2% |
과 | 2357 | 1.9% |
외 | 2172 | 1.7% |
품 | 2065 | 1.6% |
Other values (503) | 90631 |
Latin
Value | Count | Frequency (%) |
e | 427 | |
a | 424 | |
l | 338 | 9.2% |
n | 321 | 8.7% |
o | 217 | 5.9% |
r | 212 | 5.8% |
u | 209 | 5.7% |
t | 205 | 5.6% |
d | 203 | 5.5% |
m | 196 | 5.3% |
Other values (21) | 921 |
Common
Value | Count | Frequency (%) |
25350 | ||
( | 8103 | 15.6% |
) | 8102 | 15.6% |
, | 5069 | 9.8% |
/ | 3246 | 6.3% |
0 | 821 | 1.6% |
2 | 394 | 0.8% |
9 | 258 | 0.5% |
1 | 182 | 0.4% |
· | 126 | 0.2% |
Other values (11) | 240 | 0.5% |
Han
Value | Count | Frequency (%) |
肉 | 4 | |
龍 | 2 | |
眼 | 2 | |
蓮 | 1 | 9.1% |
子 | 1 | 9.1% |
牛 | 1 | 9.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 124859 | |
ASCII | 55438 | |
Compat Jamo | 1438 | 0.8% |
None | 126 | 0.1% |
CJK | 8 | < 0.1% |
CJK Compat Ideographs | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
25350 | ||
( | 8103 | 14.6% |
) | 8102 | 14.6% |
, | 5069 | 9.1% |
/ | 3246 | 5.9% |
0 | 821 | 1.5% |
e | 427 | 0.8% |
a | 424 | 0.8% |
2 | 394 | 0.7% |
l | 338 | 0.6% |
Other values (41) | 3164 | 5.7% |
Hangul
Value | Count | Frequency (%) |
기 | 6364 | 5.1% |
타 | 5986 | 4.8% |
제 | 4063 | 3.3% |
조 | 3738 | 3.0% |
스 | 3189 | 2.6% |
이 | 2916 | 2.3% |
것 | 2816 | 2.3% |
과 | 2357 | 1.9% |
외 | 2172 | 1.7% |
품 | 2065 | 1.7% |
Other values (502) | 89193 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1438 |
None
Value | Count | Frequency (%) |
· | 126 |
CJK
Value | Count | Frequency (%) |
肉 | 4 | |
眼 | 2 | |
子 | 1 | 12.5% |
牛 | 1 | 12.5% |
CJK Compat Ideographs
Value | Count | Frequency (%) |
龍 | 2 | |
蓮 | 1 |
검역소
Text
MISSING
 
Distinct | 98 |
---|---|
Distinct (%) | 1.8% |
Missing | 4416 |
Missing (%) | 44.2% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
검역소 | 3759 | |
swid | 1108 | 11.7% |
seid | 833 | 8.8% |
wcid | 793 | 8.4% |
neid | 611 | 6.5% |
nbid | 414 | 4.4% |
상해 | 163 | 1.7% |
심천 | 160 | 1.7% |
광저우 | 153 | 1.6% |
천진 | 137 | 1.5% |
Other values (97) | 1303 | 13.8% |
Most occurring characters
Value | Count | Frequency (%) |
3852 | ||
역 | 3761 | |
I | 3759 | |
D | 3759 | |
검 | 3759 | |
소 | 3759 | |
S | 1941 | 5.5% |
W | 1901 | 5.4% |
E | 1444 | 4.1% |
N | 1025 | 2.9% |
Other values (147) | 6042 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15958 | |
Uppercase Letter | 15046 | |
Space Separator | 3852 | 11.0% |
Lowercase Letter | 116 | 0.3% |
Decimal Number | 28 | 0.1% |
Other Punctuation | 1 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
역 | 3761 | |
검 | 3759 | |
소 | 3759 | |
천 | 297 | 1.9% |
우 | 256 | 1.6% |
저 | 243 | 1.5% |
오 | 201 | 1.3% |
다 | 179 | 1.1% |
하 | 174 | 1.1% |
상 | 164 | 1.0% |
Other values (115) | 3165 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 19 | |
o | 14 | |
r | 12 | |
n | 10 | 8.6% |
z | 8 | 6.9% |
s | 8 | 6.9% |
l | 6 | 5.2% |
h | 5 | 4.3% |
g | 5 | 4.3% |
d | 4 | 3.4% |
Other values (8) | 25 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 3759 | |
D | 3759 | |
S | 1941 | |
W | 1901 | |
E | 1444 | 9.6% |
N | 1025 | 6.8% |
C | 795 | 5.3% |
B | 414 | 2.8% |
R | 6 | < 0.1% |
O | 2 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
3852 |
Decimal Number
Value | Count | Frequency (%) |
2 | 28 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15958 | |
Latin | 15162 | |
Common | 3882 | 11.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
역 | 3761 | |
검 | 3759 | |
소 | 3759 | |
천 | 297 | 1.9% |
우 | 256 | 1.6% |
저 | 243 | 1.5% |
오 | 201 | 1.3% |
다 | 179 | 1.1% |
하 | 174 | 1.1% |
상 | 164 | 1.0% |
Other values (115) | 3165 |
Latin
Value | Count | Frequency (%) |
I | 3759 | |
D | 3759 | |
S | 1941 | |
W | 1901 | |
E | 1444 | 9.5% |
N | 1025 | 6.8% |
C | 795 | 5.2% |
B | 414 | 2.7% |
e | 19 | 0.1% |
o | 14 | 0.1% |
Other values (18) | 91 | 0.6% |
Common
Value | Count | Frequency (%) |
3852 | ||
2 | 28 | 0.7% |
/ | 1 | < 0.1% |
- | 1 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 19044 | |
Hangul | 15958 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3852 | ||
I | 3759 | |
D | 3759 | |
S | 1941 | |
W | 1901 | |
E | 1444 | 7.6% |
N | 1025 | 5.4% |
C | 795 | 4.2% |
B | 414 | 2.2% |
2 | 28 | 0.1% |
Other values (22) | 126 | 0.7% |
Hangul
Value | Count | Frequency (%) |
역 | 3761 | |
검 | 3759 | |
소 | 3759 | |
천 | 297 | 1.9% |
우 | 256 | 1.6% |
저 | 243 | 1.5% |
오 | 201 | 1.3% |
다 | 179 | 1.1% |
하 | 174 | 1.1% |
상 | 164 | 1.0% |
Other values (115) | 3165 |
문제사유
Text
Distinct | 2118 |
---|---|
Distinct (%) | 21.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 529 |
---|---|
Median length | 282 |
Mean length | 45.5874 |
Min length | 5 |
Characters and Unicode
Total characters | 455874 |
---|---|
Distinct characters | 671 |
Distinct categories | 15 ? |
Distinct scripts | 5 ? |
Distinct blocks | 9 ? |
Unique
Unique | 1613 ? |
---|---|
Unique (%) | 16.1% |
Sample
1st row | 위생(미생물)/식중독균 살모넬라균 검출 |
---|---|
2nd row | 위생(미생물)/리스테리아균 검출 |
3rd row | 위생(미생물) / 살모넬라 티피뮤리움 검출 |
4th row | 성분(잔류농약)/살충제 화학물질 검출 |
5th row | 라벨링/인공 색소 성분 미표기 |
Value | Count | Frequency (%) |
검출 | 3975 | 4.2% |
및 | 3378 | 3.6% |
1797 | 1.9% | |
성분(식품첨가물 | 1625 | 1.7% |
않은 | 1530 | 1.6% |
미표기 | 947 | 1.0% |
의거 | 937 | 1.0% |
건강 | 895 | 0.9% |
판매 | 894 | 0.9% |
식품 | 804 | 0.8% |
Other values (3578) | 77838 |
Most occurring characters
Value | Count | Frequency (%) |
86059 | 18.9% | |
/ | 11371 | 2.5% |
, | 8190 | 1.8% |
품 | 7483 | 1.6% |
물 | 7190 | 1.6% |
) | 6730 | 1.5% |
( | 6719 | 1.5% |
생 | 6246 | 1.4% |
기 | 6219 | 1.4% |
가 | 5978 | 1.3% |
Other values (661) | 303689 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 289321 | |
Space Separator | 86073 | 18.9% |
Other Punctuation | 23657 | 5.2% |
Lowercase Letter | 21826 | 4.8% |
Decimal Number | 13446 | 2.9% |
Close Punctuation | 6859 | 1.5% |
Open Punctuation | 6847 | 1.5% |
Uppercase Letter | 4098 | 0.9% |
Math Symbol | 1637 | 0.4% |
Dash Punctuation | 1336 | 0.3% |
Other values (5) | 774 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
품 | 7483 | 2.6% |
물 | 7190 | 2.5% |
생 | 6246 | 2.2% |
기 | 6219 | 2.1% |
가 | 5978 | 2.1% |
검 | 5964 | 2.1% |
라 | 5868 | 2.0% |
성 | 5356 | 1.9% |
출 | 5168 | 1.8% |
식 | 4957 | 1.7% |
Other values (556) | 228892 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 2576 | |
g | 2029 | |
i | 2017 | |
t | 1946 | |
n | 1906 | |
d | 1813 | |
a | 1428 | 6.5% |
m | 1369 | 6.3% |
r | 1325 | 6.1% |
p | 1198 | 5.5% |
Other values (17) | 4219 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 1263 | |
F | 623 | |
D | 622 | |
B | 585 | |
G | 377 | 9.2% |
S | 122 | 3.0% |
C | 93 | 2.3% |
E | 88 | 2.1% |
T | 41 | 1.0% |
P | 36 | 0.9% |
Other values (15) | 248 | 6.1% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 11371 | |
, | 8190 | |
. | 3481 | 14.7% |
: | 246 | 1.0% |
、 | 161 | 0.7% |
' | 106 | 0.4% |
? | 57 | 0.2% |
· | 16 | 0.1% |
" | 12 | 0.1% |
% | 10 | < 0.1% |
Other values (3) | 7 | < 0.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 3332 | |
0 | 2883 | |
2 | 2289 | |
3 | 951 | 7.1% |
5 | 945 | 7.0% |
8 | 792 | 5.9% |
7 | 792 | 5.9% |
4 | 645 | 4.8% |
6 | 524 | 3.9% |
9 | 293 | 2.2% |
Math Symbol
Value | Count | Frequency (%) |
> | 671 | |
< | 671 | |
≤ | 241 | 14.7% |
× | 36 | 2.2% |
= | 9 | 0.5% |
± | 5 | 0.3% |
+ | 2 | 0.1% |
~ | 2 | 0.1% |
Other Number
Value | Count | Frequency (%) |
② | 18 | |
① | 18 | |
③ | 3 | 7.1% |
³ | 2 | 4.8% |
⁴ | 1 | 2.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 6730 | |
) | 121 | 1.8% |
」 | 4 | 0.1% |
] | 4 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 6719 | |
( | 120 | 1.8% |
[ | 4 | 0.1% |
「 | 4 | 0.1% |
Other Symbol
Value | Count | Frequency (%) |
㎠ | 482 | |
㎜ | 241 | |
℃ | 2 | 0.3% |
Space Separator
Value | Count | Frequency (%) |
86059 | ||
14 | < 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1336 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 3 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 3 |
Control
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 289307 | |
Common | 140629 | |
Latin | 25554 | 5.6% |
Greek | 372 | 0.1% |
Han | 12 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
품 | 7483 | 2.6% |
물 | 7190 | 2.5% |
생 | 6246 | 2.2% |
기 | 6219 | 2.1% |
가 | 5978 | 2.1% |
검 | 5964 | 2.1% |
라 | 5868 | 2.0% |
성 | 5356 | 1.9% |
출 | 5168 | 1.8% |
식 | 4957 | 1.7% |
Other values (543) | 228878 |
Common
Value | Count | Frequency (%) |
86059 | ||
/ | 11371 | 8.1% |
, | 8190 | 5.8% |
) | 6730 | 4.8% |
( | 6719 | 4.8% |
. | 3481 | 2.5% |
1 | 3332 | 2.4% |
0 | 2883 | 2.1% |
2 | 2289 | 1.6% |
- | 1336 | 1.0% |
Other values (43) | 8239 | 5.9% |
Latin
Value | Count | Frequency (%) |
o | 2576 | 10.1% |
g | 2029 | 7.9% |
i | 2017 | 7.9% |
t | 1946 | 7.6% |
n | 1906 | 7.5% |
d | 1813 | 7.1% |
a | 1428 | 5.6% |
m | 1369 | 5.4% |
r | 1325 | 5.2% |
A | 1263 | 4.9% |
Other values (42) | 7882 |
Han
Value | Count | Frequency (%) |
海 | 1 | |
達 | 1 | |
貿 | 1 | |
公 | 1 | |
易 | 1 | |
有 | 1 | |
限 | 1 | |
司 | 1 | |
利 | 1 | |
菜 | 1 | |
Other values (2) | 2 |
Greek
Value | Count | Frequency (%) |
μ | 372 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 289307 | |
ASCII | 164685 | |
None | 859 | 0.2% |
CJK Compat | 723 | 0.2% |
Math Operators | 241 | 0.1% |
Enclosed Alphanum | 39 | < 0.1% |
CJK | 12 | < 0.1% |
Punctuation | 6 | < 0.1% |
Letterlike Symbols | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
86059 | ||
/ | 11371 | 6.9% |
, | 8190 | 5.0% |
) | 6730 | 4.1% |
( | 6719 | 4.1% |
. | 3481 | 2.1% |
1 | 3332 | 2.0% |
0 | 2883 | 1.8% |
o | 2576 | 1.6% |
2 | 2289 | 1.4% |
Other values (73) | 31055 | 18.9% |
Hangul
Value | Count | Frequency (%) |
품 | 7483 | 2.6% |
물 | 7190 | 2.5% |
생 | 6246 | 2.2% |
기 | 6219 | 2.1% |
가 | 5978 | 2.1% |
검 | 5964 | 2.1% |
라 | 5868 | 2.0% |
성 | 5356 | 1.9% |
출 | 5168 | 1.8% |
식 | 4957 | 1.7% |
Other values (543) | 228878 |
CJK Compat
Value | Count | Frequency (%) |
㎠ | 482 | |
㎜ | 241 |
None
Value | Count | Frequency (%) |
μ | 372 | |
、 | 161 | |
) | 121 | 14.1% |
( | 120 | 14.0% |
× | 36 | 4.2% |
· | 16 | 1.9% |
14 | 1.6% | |
± | 5 | 0.6% |
」 | 4 | 0.5% |
「 | 4 | 0.5% |
Other values (4) | 6 | 0.7% |
Math Operators
Value | Count | Frequency (%) |
≤ | 241 |
Enclosed Alphanum
Value | Count | Frequency (%) |
② | 18 | |
① | 18 | |
③ | 3 | 7.7% |
Punctuation
Value | Count | Frequency (%) |
’ | 3 | |
‘ | 3 |
Letterlike Symbols
Value | Count | Frequency (%) |
℃ | 2 |
CJK
Value | Count | Frequency (%) |
海 | 1 | |
達 | 1 | |
貿 | 1 | |
公 | 1 | |
易 | 1 | |
有 | 1 | |
限 | 1 | |
司 | 1 | |
利 | 1 | |
菜 | 1 | |
Other values (2) | 2 |
조치사항
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
통관거부 | |
---|---|
리콜 | |
폐기 또는 반송 | |
기타 | |
압류 | 291 |
Other values (3) | 307 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.0422 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 리콜 |
---|---|
2nd row | 리콜 |
3rd row | 기타 |
4th row | 통관거부 |
5th row | 통관거부 |
Common Values
Value | Count | Frequency (%) |
통관거부 | 4004 | |
리콜 | 2380 | |
폐기 또는 반송 | 2069 | |
기타 | 949 | 9.5% |
압류 | 291 | 2.9% |
반송 | 200 | 2.0% |
폐기 | 104 | 1.0% |
소각 | 3 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
통관거부 | 4004 | |
리콜 | 2380 | |
반송 | 2269 | |
폐기 | 2173 | |
또는 | 2069 | |
기타 | 949 | 6.7% |
압류 | 291 | 2.1% |
소각 | 3 | < 0.1% |
구분 | 수입국 | 발생일자 | 검역소 | 조치사항 | |
---|---|---|---|---|---|
구분 | 1.000 | 0.205 | 0.470 | 0.326 | 0.096 |
수입국 | 0.205 | 1.000 | 0.321 | 1.000 | 0.889 |
발생일자 | 0.470 | 0.321 | 1.000 | 0.525 | 0.226 |
검역소 | 0.326 | 1.000 | 0.525 | 1.000 | 0.990 |
조치사항 | 0.096 | 0.889 | 0.226 | 0.990 | 1.000 |
구분 | 조치사항 | 수입국 | |
---|---|---|---|
구분 | 1.000 | 0.072 | 0.163 |
조치사항 | 0.072 | 1.000 | 0.590 |
수입국 | 0.163 | 0.590 | 1.000 |
구분 | 수입국 | 조치사항 | |
---|---|---|---|
구분 | 1.000 | 0.163 | 0.072 |
수입국 | 0.163 | 1.000 | 0.590 |
조치사항 | 0.072 | 0.590 | 1.000 |
구분 | 수입국 | 원산지 | 발생일자 | 품목 | 검역소 | 문제사유 | 조치사항 | |
---|---|---|---|---|---|---|---|---|
11839 | 경쟁국산 | 프랑스 | 스페인 | 2022-07 | 조제품 기타 | <NA> | 위생(미생물)/식중독균 살모넬라균 검출 | 리콜 |
6200 | 한국산 | 미국 | 대한민국 | 2022-11 | 팽이버섯(신선/냉장) | <NA> | 위생(미생물)/리스테리아균 검출 | 리콜 |
3278 | 경쟁국산 | 아일랜드 | 아일랜드 | 2023-01 | 닭고기(설육/간장제외/냉동) | <NA> | 위생(미생물) / 살모넬라 티피뮤리움 검출 | 기타 |
19984 | 경쟁국산 | 미국 | 중국 | 2022-03 | 기타버섯(신선/냉장) | WCID 검역소 | 성분(잔류농약)/살충제 화학물질 검출 | 통관거부 |
12823 | 경쟁국산 | 미국 | 멕시코 | 2022-07 | 콘 칩 | SWID 검역소 | 라벨링/인공 색소 성분 미표기 | 통관거부 |
8416 | 경쟁국산 | 중국 | 태국 | 2022-09 | 코코넛(신선, 건조) | 광저우 | 위생(미생물)/곰팡이 기준치 초과 | 폐기 또는 반송 |
18584 | 경쟁국산 | 미국 | 미국 | 2022-04 | 초콜릿과 초콜릿과자(다른 것으로 속을 채운 것/블록 모양ㆍ슬래브 모양ㆍ막대 모양의 것) | <NA> | 위생(미생물)/살모넬라균 검출 가능성 | 리콜 |
9973 | 경쟁국산 | 중국 | 이탈리아 | 2022-08 | 돼지고기(식용설육/족/냉동) | 상해 | 기타/검역검증 승인을 얻지 못함, <식품안전법>제92조의거, 수입 식품 해당국가 검역당국에 검역허가증명서를 받아야 함 | 폐기 또는 반송 |
8297 | 경쟁국산 | 오스트리아 | 프랑스 | 2022-09 | 가금류의 고기(육 또는 식용설육분.조분) | <NA> | 위생(미생물)/식중독균 캄필로박터균 검출 | 기타 |
13764 | 경쟁국산 | 리투아니아 | 미국 | 2022-06 | 기타어류(냉동) | <NA> | 성분(식품첨가물 및 유해물질)/수은 검출 | 압류 |
구분 | 수입국 | 원산지 | 발생일자 | 품목 | 검역소 | 문제사유 | 조치사항 | |
---|---|---|---|---|---|---|---|---|
13324 | 경쟁국산 | 중국 | 베트남 | 2022-06 | 기타(건조한 어류/염장했는지에 상관없으며 훈제한 것은 제외) | 난닝 | 성분(식품첨가물 및 유해물질)/식품첨가물 인산 및 인산염 사용량 초과 | 폐기 또는 반송 |
20024 | 경쟁국산 | 미국 | 말레이시아 | 2022-03 | 식물성 산물(식용) | NBID 검역소 | 성분(식품첨가물 및 유해물질)/승인 받지 못한 신약 포함 | 통관거부 |
9785 | 경쟁국산 | 호주 | 중국 | 2022-08 | 낙화생(탈각한 것)(기타) | <NA> | 위생(미생물)/기준치 이상의 아플라톡신 검출 | 통관거부 |
3727 | 경쟁국산 | 미국 | 러시아 | 2023-01 | 식빵(bread) | NBID 검역소 | 라벨링/비영양성 감미료인 사카린이 함유되어있지만, 라벨의 첨가제목록에 포함되어있지 않음 | 통관거부 |
22369 | 경쟁국산 | 대만 | 중국 | 2022-01 | 대추(건조) | <NA> | 성분(잔류농약)/ 잔류농약 프로파자이트 0.07 ppm 검출 | 폐기 또는 반송 |
14047 | 경쟁국산 | 미국 | 미국 | 2022-06 | 치즈(기타) | <NA> | 위생(미생물)/리스테리아균 검출 가능성 | 리콜 |
19920 | 경쟁국산 | 미국 | 태국 | 2022-03 | 배추속채소(양배추ㆍ꽃양배추ㆍ구경양배추ㆍ케일 외 기타/신선ㆍ냉장한 것) | WCID 검역소 | 위생(미생물)/독성물질 살모넬라균 검출 | 통관거부 |
2645 | 경쟁국산 | 미국 | 미국 | 2023-02 | 초콜릿과 초콜릿과자(기타) | <NA> | 라벨링/라벨에 표기되지 않은 성분(콩) 검출 | 리콜 |
6468 | 경쟁국산 | 미국 | 콜롬비아 | 2022-11 | 개사료 | NBID 검역소 | 위생(미생물)/독성물질 살모넬라균 검출 | 통관거부 |
14509 | 경쟁국산 | 미국 | 캐나다 | 2022-06 | 올리브(냉동하지 않은 것/조제 및 보존처리/식초나 초산으로 처리한 것 제외) | NBID 검역소 | 서류미비/규정에 따른 조건 하에 제조되고 있다는 것을 입증하는 서류 미제출 | 통관거부 |
Most frequently occurring
구분 | 수입국 | 원산지 | 발생일자 | 품목 | 검역소 | 문제사유 | 조치사항 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
152 | 경쟁국산 | 미국 | 멕시코 | 2022-04 | 콘 칩 | SWID 검역소 | 라벨링/인공 색소 성분 미표기 | 통관거부 | 114 |
203 | 경쟁국산 | 미국 | 멕시코 | 2022-08 | 콘 칩 | SWID 검역소 | 라벨링/인공 색소 성분 미표기 | 통관거부 | 63 |
291 | 경쟁국산 | 미국 | 미국 | 2022-06 | 치즈(기타) | <NA> | 위생(미생물)/리스테리아균 검출 가능성 | 리콜 | 48 |
148 | 경쟁국산 | 미국 | 멕시코 | 2022-04 | 치즈(가공/갈았거나 분상의 것 제외) | SWID 검역소 | 라벨링/인공 색소 성분 미표기 | 통관거부 | 45 |
323 | 경쟁국산 | 미국 | 미국 | 2023-02 | 베이커리 제품(빵, 건빵, 파이와 케이크, 비스킷, 쿠키와 크래커, 쌀과자 외 기타) | <NA> | 위생(미생물)/리스테리아균 검출 | 리콜 | 43 |
193 | 경쟁국산 | 미국 | 멕시코 | 2022-07 | 콘 칩 | SWID 검역소 | 라벨링/인공 색소 성분 미표기 | 통관거부 | 34 |
153 | 경쟁국산 | 미국 | 멕시코 | 2022-04 | 콘 칩 | SWID 검역소 | 라벨링/필수 라벨 정보가 영어로 표기되지 않음 | 통관거부 | 31 |
267 | 경쟁국산 | 미국 | 미국 | 2022-01 | 과실 샐러드 | <NA> | 위생(미생물)/리스테리아 균 검출 가능성 | 리콜 | 31 |
140 | 경쟁국산 | 미국 | 멕시코 | 2022-04 | 곡물제조식료품(기타) | SWID 검역소 | 라벨링/인공 색소 성분 미표기 | 통관거부 | 28 |
162 | 경쟁국산 | 미국 | 멕시코 | 2022-05 | 콘 칩 | SWID 검역소 | 라벨링/인공 색소 성분 미표기 | 통관거부 | 28 |