gimi9 Pandas Profiling

Dataset statistics

Number of variables	8
Number of observations	10000
Missing cells	4416
Missing cells (%)	5.5%
Duplicate rows	1142
Duplicate rows (%)	11.4%
Total size in memory	703.1 KiB
Average record size in memory	72.0 B

Variable types

Categorical	3
Text	4
DateTime	1

Dataset

Description	KATI(https://www.kati.net/index.do)에 수집되는 농식품의 통관문제 사례(수입국, 수출국, 검역소명, 불합격구분사유, 발생년월 등)
URL	https://www.data.go.kr/data/15071796/fileData.do

Alerts

Dataset has 1142 (11.4%) duplicate rows	Duplicates
`수입국` is highly overall correlated with `조치사항`	High correlation
`조치사항` is highly overall correlated with `수입국`	High correlation
`구분` is highly imbalanced (82.8%)	Imbalance
`검역소` has 4416 (44.2%) missing values	Missing

Reproduction

Analysis started	2023-12-12 23:43:29.179033
Analysis finished	2023-12-12 23:43:30.331749
Duration	1.15 second
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

구분
Categorical

IMBALANCE

Distinct	2
Distinct (%)	< 0.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

경쟁국산	9744
한국산	256

Length

Max length	4
Median length	4
Mean length	3.9744
Min length	3

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	경쟁국산
2nd row	한국산
3rd row	경쟁국산
4th row	경쟁국산
5th row	경쟁국산

Common Values

Value	Count	Frequency (%)
경쟁국산	9744	97.4%
한국산	256	2.6%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
경쟁국산	9744	97.4%
한국산	256	2.6%

수입국
Categorical

HIGH CORRELATION

Distinct	44
Distinct (%)	0.4%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

미국	4363
중국	1368
일본	644
필리핀	590
대만	317
Other values (39)	2718

Length

Max length	8
Median length	2
Mean length	2.4027
Min length	2

Unique

Unique	1 ?
Unique (%)	< 0.1%

Sample

1st row	프랑스
2nd row	미국
3rd row	아일랜드
4th row	미국
5th row	미국

Common Values

Value	Count	Frequency (%)
미국	4363	43.6%
중국	1368	13.7%
일본	644	6.4%
필리핀	590	5.9%
대만	317	3.2%
캐나다	295	2.9%
네덜란드	289	2.9%
독일	283	2.8%
스페인	170	1.7%
벨기에	162	1.6%
Other values (34)	1519	15.2%

Length

Histogram of lengths of the category

Value	Count	Frequency (%)
미국	4363	43.6%
중국	1368	13.7%
일본	644	6.4%
필리핀	590	5.9%
대만	317	3.2%
캐나다	295	2.9%
네덜란드	289	2.9%
독일	283	2.8%
스페인	170	1.7%
벨기에	162	1.6%
Other values (34)	1519	15.2%

원산지
Text

Distinct	149
Distinct (%)	1.5%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	11
Median length	10
Mean length	3.007
Min length	2

Characters and Unicode

Total characters	30070
Distinct characters	158
Distinct categories	3 ?
Distinct scripts	2 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	18 ?
Unique (%)	0.2%

Sample

1st row	스페인
2nd row	대한민국
3rd row	아일랜드
4th row	중국
5th row	멕시코

Value	Count	Frequency (%)
멕시코	1162	11.6%
미국	877	8.7%
인도	650	6.5%
중국	605	6.0%
일본	487	4.8%
필리핀	466	4.6%
베트남	436	4.3%
튀르키예	397	3.9%
캐나다	394	3.9%
대한민국	256	2.5%
Other values (143)	4322	43.0%

Most occurring characters

Value	Count	Frequency (%)
국	2095	7.0%
시	1650	5.5%
코	1276	4.2%
멕	1162	3.9%
아	1052	3.5%
도	1021	3.4%
인	1015	3.4%
미	945	3.1%
리	898	3.0%
스	866	2.9%
Other values (148)	18090	60.2%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	30015	99.8%
Space Separator	52	0.2%
Dash Punctuation	3	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
국	2095	7.0%
시	1650	5.5%
코	1276	4.3%
멕	1162	3.9%
아	1052	3.5%
도	1021	3.4%
인	1015	3.4%
미	945	3.1%
리	898	3.0%
스	866	2.9%
Other values (146)	18035	60.1%

Space Separator

Value	Count	Frequency (%)
	52	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	3	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	30015	99.8%
Common	55	0.2%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
국	2095	7.0%
시	1650	5.5%
코	1276	4.3%
멕	1162	3.9%
아	1052	3.5%
도	1021	3.4%
인	1015	3.4%
미	945	3.1%
리	898	3.0%
스	866	2.9%
Other values (146)	18035	60.1%

Common

Value	Count	Frequency (%)
	52	94.5%
-	3	5.5%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	30015	99.8%
ASCII	55	0.2%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
국	2095	7.0%
시	1650	5.5%
코	1276	4.3%
멕	1162	3.9%
아	1052	3.5%
도	1021	3.4%
인	1015	3.4%
미	945	3.1%
리	898	3.0%
스	866	2.9%
Other values (146)	18035	60.1%

ASCII

Value	Count	Frequency (%)
	52	94.5%
-	3	5.5%

발생일자
Date

Distinct	18
Distinct (%)	0.2%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Minimum	2022-01-01 00:00:00
Maximum	2023-06-01 00:00:00

Histogram

Histogram with fixed size bins (bins=18)

품목
Text

Distinct	855
Distinct (%)	8.6%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	88
Median length	69
Mean length	18.1872
Min length	1

Characters and Unicode

Total characters	181872
Distinct characters	571
Distinct categories	9 ?
Distinct scripts	4 ?
Distinct blocks	6 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	267 ?
Unique (%)	2.7%

Sample

1st row	조제품 기타
2nd row	팽이버섯(신선/냉장)
3rd row	닭고기(설육/간장제외/냉동)
4th row	기타버섯(신선/냉장)
5th row	콘 칩

Value	Count	Frequency (%)
기타	2020	5.7%
것	1808	5.1%
이외	1018	2.9%
않은	716	2.0%
또는	644	1.8%
제외	592	1.7%
조제품	565	1.6%
과실	536	1.5%
및	486	1.4%
콘	448	1.3%
Other values (1460)	26517	75.0%

Most occurring characters

Value	Count	Frequency (%)
	25350	13.9%
(	8103	4.5%
)	8102	4.5%
기	6364	3.5%
타	5986	3.3%
,	5069	2.8%
제	4063	2.2%
조	3738	2.1%
/	3246	1.8%
스	3189	1.8%
Other values (561)	108662	59.7%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	126308	69.4%
Space Separator	25350	13.9%
Other Punctuation	8510	4.7%
Open Punctuation	8111	4.5%
Close Punctuation	8110	4.5%
Lowercase Letter	3547	2.0%
Decimal Number	1809	1.0%
Uppercase Letter	126	0.1%
Dash Punctuation	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
기	6364	5.0%
타	5986	4.7%
제	4063	3.2%
조	3738	3.0%
스	3189	2.5%
이	2916	2.3%
것	2816	2.2%
과	2357	1.9%
외	2172	1.7%
품	2065	1.6%
Other values (509)	90642	71.8%

Lowercase Letter

Value	Count	Frequency (%)
e	427	12.0%
a	424	12.0%
l	338	9.5%
n	321	9.0%
o	217	6.1%
r	212	6.0%
u	209	5.9%
t	205	5.8%
d	203	5.7%
m	196	5.5%
Other values (14)	795	22.4%

Decimal Number

Value	Count	Frequency (%)
0	821	45.4%
2	394	21.8%
9	258	14.3%
1	182	10.1%
6	73	4.0%
3	32	1.8%
5	28	1.5%
8	12	0.7%
7	7	0.4%
4	2	0.1%

Uppercase Letter

Value	Count	Frequency (%)
B	52	41.3%
L	30	23.8%
P	20	15.9%
C	11	8.7%
T	10	7.9%
D	2	1.6%
O	1	0.8%

Other Punctuation

Value	Count	Frequency (%)
,	5069	59.6%
/	3246	38.1%
·	126	1.5%
.	58	0.7%
%	11	0.1%

Open Punctuation

Value	Count	Frequency (%)
(	8103	99.9%
[	8	0.1%

Close Punctuation

Value	Count	Frequency (%)
)	8102	99.9%
]	8	0.1%

Space Separator

Value	Count	Frequency (%)
	25350	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	126297	69.4%
Common	51891	28.5%
Latin	3673	2.0%
Han	11	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
기	6364	5.0%
타	5986	4.7%
제	4063	3.2%
조	3738	3.0%
스	3189	2.5%
이	2916	2.3%
것	2816	2.2%
과	2357	1.9%
외	2172	1.7%
품	2065	1.6%
Other values (503)	90631	71.8%

Latin

Value	Count	Frequency (%)
e	427	11.6%
a	424	11.5%
l	338	9.2%
n	321	8.7%
o	217	5.9%
r	212	5.8%
u	209	5.7%
t	205	5.6%
d	203	5.5%
m	196	5.3%
Other values (21)	921	25.1%

Common

Value	Count	Frequency (%)
	25350	48.9%
(	8103	15.6%
)	8102	15.6%
,	5069	9.8%
/	3246	6.3%
0	821	1.6%
2	394	0.8%
9	258	0.5%
1	182	0.4%
·	126	0.2%
Other values (11)	240	0.5%

Han

Value	Count	Frequency (%)
肉	4	36.4%
龍	2	18.2%
眼	2	18.2%
蓮	1	9.1%
子	1	9.1%
牛	1	9.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	124859	68.7%
ASCII	55438	30.5%
Compat Jamo	1438	0.8%
None	126	0.1%
CJK	8	< 0.1%
CJK Compat Ideographs	3	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	25350	45.7%
(	8103	14.6%
)	8102	14.6%
,	5069	9.1%
/	3246	5.9%
0	821	1.5%
e	427	0.8%
a	424	0.8%
2	394	0.7%
l	338	0.6%
Other values (41)	3164	5.7%

Hangul

Value	Count	Frequency (%)
기	6364	5.1%
타	5986	4.8%
제	4063	3.3%
조	3738	3.0%
스	3189	2.6%
이	2916	2.3%
것	2816	2.3%
과	2357	1.9%
외	2172	1.7%
품	2065	1.7%
Other values (502)	89193	71.4%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	1438	100.0%

None

Value	Count	Frequency (%)
·	126	100.0%

CJK

Value	Count	Frequency (%)
肉	4	50.0%
眼	2	25.0%
子	1	12.5%
牛	1	12.5%

CJK Compat Ideographs

Value	Count	Frequency (%)
龍	2	66.7%
蓮	1	33.3%

검역소
Text

MISSING

Distinct	98
Distinct (%)	1.8%
Missing	4416
Missing (%)	44.2%
Memory size	156.2 KiB

Length

Max length	49
Median length	8
Mean length	6.2682665
Min length	1

Characters and Unicode

Total characters	35002
Distinct characters	157
Distinct categories	7 ?
Distinct scripts	3 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	31 ?
Unique (%)	0.6%

Sample

1st row	WCID 검역소
2nd row	SWID 검역소
3rd row	광저우
4th row	상해
5th row	WCID 검역소

Value	Count	Frequency (%)
검역소	3759	39.8%
swid	1108	11.7%
seid	833	8.8%
wcid	793	8.4%
neid	611	6.5%
nbid	414	4.4%
상해	163	1.7%
심천	160	1.7%
광저우	153	1.6%
천진	137	1.5%
Other values (97)	1303	13.8%

Most occurring characters

Value	Count	Frequency (%)
	3852	11.0%
역	3761	10.7%
I	3759	10.7%
D	3759	10.7%
검	3759	10.7%
소	3759	10.7%
S	1941	5.5%
W	1901	5.4%
E	1444	4.1%
N	1025	2.9%
Other values (147)	6042	17.3%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	15958	45.6%
Uppercase Letter	15046	43.0%
Space Separator	3852	11.0%
Lowercase Letter	116	0.3%
Decimal Number	28	0.1%
Other Punctuation	1	< 0.1%
Dash Punctuation	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
역	3761	23.6%
검	3759	23.6%
소	3759	23.6%
천	297	1.9%
우	256	1.6%
저	243	1.5%
오	201	1.3%
다	179	1.1%
하	174	1.1%
상	164	1.0%
Other values (115)	3165	19.8%

Lowercase Letter

Value	Count	Frequency (%)
e	19	16.4%
o	14	12.1%
r	12	10.3%
n	10	8.6%
z	8	6.9%
s	8	6.9%
l	6	5.2%
h	5	4.3%
g	5	4.3%
d	4	3.4%
Other values (8)	25	21.6%

Uppercase Letter

Value	Count	Frequency (%)
I	3759	25.0%
D	3759	25.0%
S	1941	12.9%
W	1901	12.6%
E	1444	9.6%
N	1025	6.8%
C	795	5.3%
B	414	2.8%
R	6	< 0.1%
O	2	< 0.1%

Space Separator

Value	Count	Frequency (%)
	3852	100.0%

Decimal Number

Value	Count	Frequency (%)
2	28	100.0%

Other Punctuation

Value	Count	Frequency (%)
/	1	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	15958	45.6%
Latin	15162	43.3%
Common	3882	11.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
역	3761	23.6%
검	3759	23.6%
소	3759	23.6%
천	297	1.9%
우	256	1.6%
저	243	1.5%
오	201	1.3%
다	179	1.1%
하	174	1.1%
상	164	1.0%
Other values (115)	3165	19.8%

Latin

Value	Count	Frequency (%)
I	3759	24.8%
D	3759	24.8%
S	1941	12.8%
W	1901	12.5%
E	1444	9.5%
N	1025	6.8%
C	795	5.2%
B	414	2.7%
e	19	0.1%
o	14	0.1%
Other values (18)	91	0.6%

Common

Value	Count	Frequency (%)
	3852	99.2%
2	28	0.7%
/	1	< 0.1%
-	1	< 0.1%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	19044	54.4%
Hangul	15958	45.6%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	3852	20.2%
I	3759	19.7%
D	3759	19.7%
S	1941	10.2%
W	1901	10.0%
E	1444	7.6%
N	1025	5.4%
C	795	4.2%
B	414	2.2%
2	28	0.1%
Other values (22)	126	0.7%

Hangul

Value	Count	Frequency (%)
역	3761	23.6%
검	3759	23.6%
소	3759	23.6%
천	297	1.9%
우	256	1.6%
저	243	1.5%
오	201	1.3%
다	179	1.1%
하	174	1.1%
상	164	1.0%
Other values (115)	3165	19.8%

문제사유
Text

Distinct	2118
Distinct (%)	21.2%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	529
Median length	282
Mean length	45.5874
Min length	5

Characters and Unicode

Total characters	455874
Distinct characters	671
Distinct categories	15 ?
Distinct scripts	5 ?
Distinct blocks	9 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1613 ?
Unique (%)	16.1%

Sample

1st row	위생(미생물)/식중독균 살모넬라균 검출
2nd row	위생(미생물)/리스테리아균 검출
3rd row	위생(미생물) / 살모넬라 티피뮤리움 검출
4th row	성분(잔류농약)/살충제 화학물질 검출
5th row	라벨링/인공 색소 성분 미표기

Value	Count	Frequency (%)
검출	3975	4.2%
및	3378	3.6%
	1797	1.9%
성분(식품첨가물	1625	1.7%
않은	1530	1.6%
미표기	947	1.0%
의거	937	1.0%
건강	895	0.9%
판매	894	0.9%
식품	804	0.8%
Other values (3578)	77838	82.3%

Most occurring characters

Value	Count	Frequency (%)
	86059	18.9%
/	11371	2.5%
,	8190	1.8%
품	7483	1.6%
물	7190	1.6%
)	6730	1.5%
(	6719	1.5%
생	6246	1.4%
기	6219	1.4%
가	5978	1.3%
Other values (661)	303689	66.6%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	289321	63.5%
Space Separator	86073	18.9%
Other Punctuation	23657	5.2%
Lowercase Letter	21826	4.8%
Decimal Number	13446	2.9%
Close Punctuation	6859	1.5%
Open Punctuation	6847	1.5%
Uppercase Letter	4098	0.9%
Math Symbol	1637	0.4%
Dash Punctuation	1336	0.3%
Other values (5)	774	0.2%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
품	7483	2.6%
물	7190	2.5%
생	6246	2.2%
기	6219	2.1%
가	5978	2.1%
검	5964	2.1%
라	5868	2.0%
성	5356	1.9%
출	5168	1.8%
식	4957	1.7%
Other values (556)	228892	79.1%

Lowercase Letter

Value	Count	Frequency (%)
o	2576	11.8%
g	2029	9.3%
i	2017	9.2%
t	1946	8.9%
n	1906	8.7%
d	1813	8.3%
a	1428	6.5%
m	1369	6.3%
r	1325	6.1%
p	1198	5.5%
Other values (17)	4219	19.3%

Uppercase Letter

Value	Count	Frequency (%)
A	1263	30.8%
F	623	15.2%
D	622	15.2%
B	585	14.3%
G	377	9.2%
S	122	3.0%
C	93	2.3%
E	88	2.1%
T	41	1.0%
P	36	0.9%
Other values (15)	248	6.1%

Other Punctuation

Value	Count	Frequency (%)
/	11371	48.1%
,	8190	34.6%
.	3481	14.7%
:	246	1.0%
、	161	0.7%
'	106	0.4%
?	57	0.2%
·	16	0.1%
"	12	0.1%
%	10	< 0.1%
Other values (3)	7	< 0.1%

Decimal Number

Value	Count	Frequency (%)
1	3332	24.8%
0	2883	21.4%
2	2289	17.0%
3	951	7.1%
5	945	7.0%
8	792	5.9%
7	792	5.9%
4	645	4.8%
6	524	3.9%
9	293	2.2%

Math Symbol

Value	Count	Frequency (%)
>	671	41.0%
<	671	41.0%
≤	241	14.7%
×	36	2.2%
=	9	0.5%
±	5	0.3%
+	2	0.1%
~	2	0.1%

Other Number

Value	Count	Frequency (%)
②	18	42.9%
①	18	42.9%
③	3	7.1%
³	2	4.8%
⁴	1	2.4%

Close Punctuation

Value	Count	Frequency (%)
)	6730	98.1%
）	121	1.8%
」	4	0.1%
]	4	0.1%

Open Punctuation

Value	Count	Frequency (%)
(	6719	98.1%
（	120	1.8%
[	4	0.1%
「	4	0.1%

Other Symbol

Value	Count	Frequency (%)
㎠	482	66.5%
㎜	241	33.2%
℃	2	0.3%

Space Separator

Value	Count	Frequency (%)
	86059	> 99.9%
	14	< 0.1%

Dash Punctuation

Value	Count	Frequency (%)
-	1336	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	3	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	3	100.0%

Control

Value	Count	Frequency (%)
	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	289307	63.5%
Common	140629	30.8%
Latin	25554	5.6%
Greek	372	0.1%
Han	12	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
품	7483	2.6%
물	7190	2.5%
생	6246	2.2%
기	6219	2.1%
가	5978	2.1%
검	5964	2.1%
라	5868	2.0%
성	5356	1.9%
출	5168	1.8%
식	4957	1.7%
Other values (543)	228878	79.1%

Common

Value	Count	Frequency (%)
	86059	61.2%
/	11371	8.1%
,	8190	5.8%
)	6730	4.8%
(	6719	4.8%
.	3481	2.5%
1	3332	2.4%
0	2883	2.1%
2	2289	1.6%
-	1336	1.0%
Other values (43)	8239	5.9%

Latin

Value	Count	Frequency (%)
o	2576	10.1%
g	2029	7.9%
i	2017	7.9%
t	1946	7.6%
n	1906	7.5%
d	1813	7.1%
a	1428	5.6%
m	1369	5.4%
r	1325	5.2%
A	1263	4.9%
Other values (42)	7882	30.8%

Han

Value	Count	Frequency (%)
海	1	8.3%
達	1	8.3%
貿	1	8.3%
公	1	8.3%
易	1	8.3%
有	1	8.3%
限	1	8.3%
司	1	8.3%
利	1	8.3%
菜	1	8.3%
Other values (2)	2	16.7%

Greek

Value	Count	Frequency (%)
μ	372	100.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	289307	63.5%
ASCII	164685	36.1%
None	859	0.2%
CJK Compat	723	0.2%
Math Operators	241	0.1%
Enclosed Alphanum	39	< 0.1%
CJK	12	< 0.1%
Punctuation	6	< 0.1%
Letterlike Symbols	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	86059	52.3%
/	11371	6.9%
,	8190	5.0%
)	6730	4.1%
(	6719	4.1%
.	3481	2.1%
1	3332	2.0%
0	2883	1.8%
o	2576	1.6%
2	2289	1.4%
Other values (73)	31055	18.9%

Hangul

Value	Count	Frequency (%)
품	7483	2.6%
물	7190	2.5%
생	6246	2.2%
기	6219	2.1%
가	5978	2.1%
검	5964	2.1%
라	5868	2.0%
성	5356	1.9%
출	5168	1.8%
식	4957	1.7%
Other values (543)	228878	79.1%

CJK Compat

Value	Count	Frequency (%)
㎠	482	66.7%
㎜	241	33.3%

None

Value	Count	Frequency (%)
μ	372	43.3%
、	161	18.7%
）	121	14.1%
（	120	14.0%
×	36	4.2%
·	16	1.9%
	14	1.6%
±	5	0.6%
」	4	0.5%
「	4	0.5%
Other values (4)	6	0.7%

Math Operators

Value	Count	Frequency (%)
≤	241	100.0%

Enclosed Alphanum

Value	Count	Frequency (%)
②	18	46.2%
①	18	46.2%
③	3	7.7%

Punctuation

Value	Count	Frequency (%)
’	3	50.0%
‘	3	50.0%

Letterlike Symbols

Value	Count	Frequency (%)
℃	2	100.0%

CJK

Value	Count	Frequency (%)
海	1	8.3%
達	1	8.3%
貿	1	8.3%
公	1	8.3%
易	1	8.3%
有	1	8.3%
限	1	8.3%
司	1	8.3%
利	1	8.3%
菜	1	8.3%
Other values (2)	2	16.7%

조치사항
Categorical

HIGH CORRELATION

Distinct	8
Distinct (%)	0.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

통관거부	4004
리콜	2380
폐기 또는 반송	2069
기타	949
압류	291
Other values (3)	307

Length

Max length	8
Median length	4
Mean length	4.0422
Min length	2

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	리콜
2nd row	리콜
3rd row	기타
4th row	통관거부
5th row	통관거부

Common Values

Value	Count	Frequency (%)
통관거부	4004	40.0%
리콜	2380	23.8%
폐기 또는 반송	2069	20.7%
기타	949	9.5%
압류	291	2.9%
반송	200	2.0%
폐기	104	1.0%
소각	3	< 0.1%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
통관거부	4004	28.3%
리콜	2380	16.8%
반송	2269	16.0%
폐기	2173	15.4%
또는	2069	14.6%
기타	949	6.7%
압류	291	2.1%
소각	3	< 0.1%

Heatmap
Table

	구분	수입국	발생일자	검역소	조치사항
구분	1.000	0.205	0.470	0.326	0.096
수입국	0.205	1.000	0.321	1.000	0.889
발생일자	0.470	0.321	1.000	0.525	0.226
검역소	0.326	1.000	0.525	1.000	0.990
조치사항	0.096	0.889	0.226	0.990	1.000

Heatmap
Table

	구분	조치사항	수입국
구분	1.000	0.072	0.163
조치사항	0.072	1.000	0.590
수입국	0.163	0.590	1.000

Heatmap
Table

	구분	수입국	조치사항
구분	1.000	0.163	0.072
수입국	0.163	1.000	0.590
조치사항	0.072	0.590	1.000

Count
Matrix

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

First rows
Last rows

	구분	수입국	원산지	발생일자	품목	검역소	문제사유	조치사항
11839	경쟁국산	프랑스	스페인	2022-07	조제품 기타	<NA>	위생(미생물)/식중독균 살모넬라균 검출	리콜
6200	한국산	미국	대한민국	2022-11	팽이버섯(신선/냉장)	<NA>	위생(미생물)/리스테리아균 검출	리콜
3278	경쟁국산	아일랜드	아일랜드	2023-01	닭고기(설육/간장제외/냉동)	<NA>	위생(미생물) / 살모넬라 티피뮤리움 검출	기타
19984	경쟁국산	미국	중국	2022-03	기타버섯(신선/냉장)	WCID 검역소	성분(잔류농약)/살충제 화학물질 검출	통관거부
12823	경쟁국산	미국	멕시코	2022-07	콘 칩	SWID 검역소	라벨링/인공 색소 성분 미표기	통관거부
8416	경쟁국산	중국	태국	2022-09	코코넛(신선, 건조)	광저우	위생(미생물)/곰팡이 기준치 초과	폐기 또는 반송
18584	경쟁국산	미국	미국	2022-04	초콜릿과 초콜릿과자(다른 것으로 속을 채운 것/블록 모양ㆍ슬래브 모양ㆍ막대 모양의 것)	<NA>	위생(미생물)/살모넬라균 검출 가능성	리콜
9973	경쟁국산	중국	이탈리아	2022-08	돼지고기(식용설육/족/냉동)	상해	기타/검역검증 승인을 얻지 못함, <식품안전법>제92조의거, 수입 식품 해당국가 검역당국에 검역허가증명서를 받아야 함	폐기 또는 반송
8297	경쟁국산	오스트리아	프랑스	2022-09	가금류의 고기(육 또는 식용설육분.조분)	<NA>	위생(미생물)/식중독균 캄필로박터균 검출	기타
13764	경쟁국산	리투아니아	미국	2022-06	기타어류(냉동)	<NA>	성분(식품첨가물 및 유해물질)/수은 검출	압류

	구분	수입국	원산지	발생일자	품목	검역소	문제사유	조치사항
13324	경쟁국산	중국	베트남	2022-06	기타(건조한 어류/염장했는지에 상관없으며 훈제한 것은 제외)	난닝	성분(식품첨가물 및 유해물질)/식품첨가물 인산 및 인산염 사용량 초과	폐기 또는 반송
20024	경쟁국산	미국	말레이시아	2022-03	식물성 산물(식용)	NBID 검역소	성분(식품첨가물 및 유해물질)/승인 받지 못한 신약 포함	통관거부
9785	경쟁국산	호주	중국	2022-08	낙화생(탈각한 것)(기타)	<NA>	위생(미생물)/기준치 이상의 아플라톡신 검출	통관거부
3727	경쟁국산	미국	러시아	2023-01	식빵(bread)	NBID 검역소	라벨링/비영양성 감미료인 사카린이 함유되어있지만, 라벨의 첨가제목록에 포함되어있지 않음	통관거부
22369	경쟁국산	대만	중국	2022-01	대추(건조)	<NA>	성분(잔류농약)/ 잔류농약 프로파자이트 0.07 ppm 검출	폐기 또는 반송
14047	경쟁국산	미국	미국	2022-06	치즈(기타)	<NA>	위생(미생물)/리스테리아균 검출 가능성	리콜
19920	경쟁국산	미국	태국	2022-03	배추속채소(양배추ㆍ꽃양배추ㆍ구경양배추ㆍ케일 외 기타/신선ㆍ냉장한 것)	WCID 검역소	위생(미생물)/독성물질 살모넬라균 검출	통관거부
2645	경쟁국산	미국	미국	2023-02	초콜릿과 초콜릿과자(기타)	<NA>	라벨링/라벨에 표기되지 않은 성분(콩) 검출	리콜
6468	경쟁국산	미국	콜롬비아	2022-11	개사료	NBID 검역소	위생(미생물)/독성물질 살모넬라균 검출	통관거부
14509	경쟁국산	미국	캐나다	2022-06	올리브(냉동하지 않은 것/조제 및 보존처리/식초나 초산으로 처리한 것 제외)	NBID 검역소	서류미비/규정에 따른 조건 하에 제조되고 있다는 것을 입증하는 서류 미제출	통관거부

Most frequently occurring

	구분	수입국	원산지	발생일자	품목	검역소	문제사유	조치사항	# duplicates
152	경쟁국산	미국	멕시코	2022-04	콘 칩	SWID 검역소	라벨링/인공 색소 성분 미표기	통관거부	114
203	경쟁국산	미국	멕시코	2022-08	콘 칩	SWID 검역소	라벨링/인공 색소 성분 미표기	통관거부	63
291	경쟁국산	미국	미국	2022-06	치즈(기타)	<NA>	위생(미생물)/리스테리아균 검출 가능성	리콜	48
148	경쟁국산	미국	멕시코	2022-04	치즈(가공/갈았거나 분상의 것 제외)	SWID 검역소	라벨링/인공 색소 성분 미표기	통관거부	45
323	경쟁국산	미국	미국	2023-02	베이커리 제품(빵, 건빵, 파이와 케이크, 비스킷, 쿠키와 크래커, 쌀과자 외 기타)	<NA>	위생(미생물)/리스테리아균 검출	리콜	43
193	경쟁국산	미국	멕시코	2022-07	콘 칩	SWID 검역소	라벨링/인공 색소 성분 미표기	통관거부	34
153	경쟁국산	미국	멕시코	2022-04	콘 칩	SWID 검역소	라벨링/필수 라벨 정보가 영어로 표기되지 않음	통관거부	31
267	경쟁국산	미국	미국	2022-01	과실 샐러드	<NA>	위생(미생물)/리스테리아 균 검출 가능성	리콜	31
140	경쟁국산	미국	멕시코	2022-04	곡물제조식료품(기타)	SWID 검역소	라벨링/인공 색소 성분 미표기	통관거부	28
162	경쟁국산	미국	멕시코	2022-05	콘 칩	SWID 검역소	라벨링/인공 색소 성분 미표기	통관거부	28

Overview

Variables

Common Values

Length

Common Values (Plot)

Common Values

Length

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Space Separator

Dash Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Common

Most occurring blocks

Most frequent character per block

Hangul

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Decimal Number

Uppercase Letter

Other Punctuation

Open Punctuation

Close Punctuation

Space Separator

Dash Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Latin

Common

Han

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Compat Jamo

None

CJK

CJK Compat Ideographs

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Space Separator

Decimal Number

Other Punctuation

Dash Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Latin

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Math Symbol

Other Number

Close Punctuation

Open Punctuation

Other Symbol

Space Separator