gimi9 Pandas Profiling

Dataset statistics

Number of variables	8
Number of observations	771
Missing cells	125
Missing cells (%)	2.0%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	48.3 KiB
Average record size in memory	64.2 B

Variable types

Text	5
Categorical	2
Boolean	1

Dataset

Description	국립소록도병원에 입원중인 한센인의 질병 치료를 목적으로 사용하는 의약품 정보로 약품코드, 주성분, 약품분류, 마약류여부, 약품명칭, 한글명칭, 사용여부를 제공합니다.
Author	공공데이터포털
URL	https://www.data.go.kr/data/3069474/fileData.do

Alerts

`마약류` is highly imbalanced (83.7%)	Imbalance
`주성분` has 67 (8.7%) missing values	Missing
`약품분류` has 26 (3.4%) missing values	Missing
`한글명칭` has 28 (3.6%) missing values	Missing

Reproduction

Analysis started	2024-04-21 16:28:53.981535
Analysis finished	2024-04-21 16:28:56.078249
Duration	2.1 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

약품코드
Text

Distinct	770
Distinct (%)	100.0%
Missing	1
Missing (%)	0.1%
Memory size	6.1 KiB

Length

Max length	10
Median length	9
Mean length	4.9168831
Min length	2

Characters and Unicode

Total characters	3786
Distinct characters	40
Distinct categories	5 ?
Distinct scripts	2 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	770 ?
Unique (%)	100.0%

Sample

1st row	AAP650
2nd row	ABDZ
3rd row	ABLI2
4th row	ABLI5
5th row	ABOD10

Value	Count	Frequency (%)
aap650	1	0.1%
rsp2	1	0.1%
doxa	1	0.1%
d-lind	1	0.1%
d-loc	1	0.1%
dmd	1	0.1%
d-nzr	1	0.1%
doapcr	1	0.1%
dobe	1	0.1%
dom10	1	0.1%
Other values (760)	760	98.7%

Most occurring characters

Value	Count	Frequency (%)
-	376	9.9%
I	325	8.6%
A	229	6.0%
T	217	5.7%
P	202	5.3%
L	201	5.3%
D	189	5.0%
O	185	4.9%
C	174	4.6%
M	155	4.1%
Other values (30)	1533	40.5%

Most occurring categories

Value	Count	Frequency (%)
Uppercase Letter	3048	80.5%
Dash Punctuation	376	9.9%
Decimal Number	354	9.4%
Other Punctuation	7	0.2%
Lowercase Letter	1	< 0.1%

Most frequent character per category

Uppercase Letter

Value	Count	Frequency (%)
I	325	10.7%
A	229	7.5%
T	217	7.1%
P	202	6.6%
L	201	6.6%
D	189	6.2%
O	185	6.1%
C	174	5.7%
M	155	5.1%
S	151	5.0%
Other values (16)	1020	33.5%

Decimal Number

Value	Count	Frequency (%)
0	97	27.4%
5	83	23.4%
1	64	18.1%
2	58	16.4%
3	23	6.5%
4	13	3.7%
6	6	1.7%
7	5	1.4%
8	4	1.1%
9	1	0.3%

Other Punctuation

Value	Count	Frequency (%)
/	5	71.4%
.	2	28.6%

Dash Punctuation

Value	Count	Frequency (%)
-	376	100.0%

Lowercase Letter

Value	Count	Frequency (%)
a	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	3049	80.5%
Common	737	19.5%

Most frequent character per script

Latin

Value	Count	Frequency (%)
I	325	10.7%
A	229	7.5%
T	217	7.1%
P	202	6.6%
L	201	6.6%
D	189	6.2%
O	185	6.1%
C	174	5.7%
M	155	5.1%
S	151	5.0%
Other values (17)	1021	33.5%

Common

Value	Count	Frequency (%)
-	376	51.0%
0	97	13.2%
5	83	11.3%
1	64	8.7%
2	58	7.9%
3	23	3.1%
4	13	1.8%
6	6	0.8%
/	5	0.7%
7	5	0.7%
Other values (3)	7	0.9%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	3786	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
-	376	9.9%
I	325	8.6%
A	229	6.0%
T	217	5.7%
P	202	5.3%
L	201	5.3%
D	189	5.0%
O	185	4.9%
C	174	4.6%
M	155	4.1%
Other values (30)	1533	40.5%

주성분
Text

MISSING

Distinct	693
Distinct (%)	98.4%
Missing	67
Missing (%)	8.7%
Memory size	6.1 KiB

Length

Max length	10
Median length	9
Mean length	9.0014205
Min length	8

Characters and Unicode

Total characters	6337
Distinct characters	30
Distinct categories	3 ?
Distinct scripts	2 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	683 ?
Unique (%)	97.0%

Sample

1st row	101430ATR
2nd row	104303ATB
3rd row	451504ATB
4th row	451503ATB
5th row	451501ATD

Value	Count	Frequency (%)
101305atb	3	0.4%
333300cos	2	0.3%
101501atb	2	0.3%
247402bij	2	0.3%
246132ccm	2	0.3%
216201clq	2	0.3%
635300csi	2	0.3%
204002atb	2	0.3%
256500atr	2	0.3%
152103bij	2	0.3%
Other values (684)	684	97.0%

Most occurring characters

Value	Count	Frequency (%)
0	925	14.6%
1	820	12.9%
2	551	8.7%
3	468	7.4%
B	452	7.1%
A	382	6.0%
4	343	5.4%
T	308	4.9%
5	294	4.6%
C	223	3.5%
Other values (20)	1571	24.8%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	4215	66.5%
Uppercase Letter	2121	33.5%
Space Separator	1	< 0.1%

Most frequent character per category

Uppercase Letter

Value	Count	Frequency (%)
B	452	21.3%
A	382	18.0%
T	308	14.5%
C	223	10.5%
I	198	9.3%
J	183	8.6%
S	92	4.3%
O	68	3.2%
H	37	1.7%
L	35	1.7%
Other values (9)	143	6.7%

Decimal Number

Value	Count	Frequency (%)
0	925	21.9%
1	820	19.5%
2	551	13.1%
3	468	11.1%
4	343	8.1%
5	294	7.0%
6	222	5.3%
7	219	5.2%
8	197	4.7%
9	176	4.2%

Space Separator

Value	Count	Frequency (%)
	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	4216	66.5%
Latin	2121	33.5%

Most frequent character per script

Latin

Value	Count	Frequency (%)
B	452	21.3%
A	382	18.0%
T	308	14.5%
C	223	10.5%
I	198	9.3%
J	183	8.6%
S	92	4.3%
O	68	3.2%
H	37	1.7%
L	35	1.7%
Other values (9)	143	6.7%

Common

Value	Count	Frequency (%)
0	925	21.9%
1	820	19.4%
2	551	13.1%
3	468	11.1%
4	343	8.1%
5	294	7.0%
6	222	5.3%
7	219	5.2%
8	197	4.7%
9	176	4.2%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	6337	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
0	925	14.6%
1	820	12.9%
2	551	8.7%
3	468	7.4%
B	452	7.1%
A	382	6.0%
4	343	5.4%
T	308	4.9%
5	294	4.6%
C	223	3.5%
Other values (20)	1571	24.8%

약품분류
Text

MISSING

Distinct	104
Distinct (%)	14.0%
Missing	26
Missing (%)	3.4%
Memory size	6.1 KiB

Length

Max length	27
Median length	22
Mean length	11.914094
Min length	7

Characters and Unicode

Total characters	8876
Distinct characters	202
Distinct categories	7 ?
Distinct scripts	3 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	24 ?
Unique (%)	3.2%

Sample

1st row	114 해열.진통.소염제
2nd row	642 구충제
3rd row	117 정신신경용제
4th row	117 정신신경용제
5th row	117 정신신경용제

Value	Count	Frequency (%)
기타의	125	6.3%
117	58	2.9%
정신신경용제	58	2.9%
131	52	2.6%
안과용제	52	2.6%
주로	33	1.7%
및	32	1.6%
의약품	30	1.5%
해열.진통.소염제	29	1.5%
114	29	1.5%
Other values (229)	1476	74.8%

Most occurring characters

Value	Count	Frequency (%)
	1231	13.9%
1	677	7.6%
제	659	7.4%
2	479	5.4%
3	376	4.2%
용	351	4.0%
9	207	2.3%
기	186	2.1%
신	171	1.9%
6	168	1.9%
Other values (192)	4371	49.2%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	5198	58.6%
Decimal Number	2240	25.2%
Space Separator	1231	13.9%
Other Punctuation	135	1.5%
Uppercase Letter	32	0.4%
Close Punctuation	20	0.2%
Open Punctuation	20	0.2%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
제	659	12.7%
용	351	6.8%
기	186	3.6%
신	171	3.3%
의	160	3.1%
타	155	3.0%
성	122	2.3%
경	112	2.2%
약	111	2.1%
소	96	1.8%
Other values (169)	3075	59.2%

Decimal Number

Value	Count	Frequency (%)
1	677	30.2%
2	479	21.4%
3	376	16.8%
9	207	9.2%
6	168	7.5%
4	131	5.8%
7	80	3.6%
5	66	2.9%
8	47	2.1%
0	9	0.4%

Uppercase Letter

Value	Count	Frequency (%)
B	8	25.0%
A	6	18.8%
D	5	15.6%
P	4	12.5%
C	4	12.5%
X	3	9.4%
K	1	3.1%
E	1	3.1%

Other Punctuation

Value	Count	Frequency (%)
.	92	68.1%
,	43	31.9%

Space Separator

Value	Count	Frequency (%)
	1231	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	20	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	20	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	5198	58.6%
Common	3646	41.1%
Latin	32	0.4%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
제	659	12.7%
용	351	6.8%
기	186	3.6%
신	171	3.3%
의	160	3.1%
타	155	3.0%
성	122	2.3%
경	112	2.2%
약	111	2.1%
소	96	1.8%
Other values (169)	3075	59.2%

Common

Value	Count	Frequency (%)
	1231	33.8%
1	677	18.6%
2	479	13.1%
3	376	10.3%
9	207	5.7%
6	168	4.6%
4	131	3.6%
.	92	2.5%
7	80	2.2%
5	66	1.8%
Other values (5)	139	3.8%

Latin

Value	Count	Frequency (%)
B	8	25.0%
A	6	18.8%
D	5	15.6%
P	4	12.5%
C	4	12.5%
X	3	9.4%
K	1	3.1%
E	1	3.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	5198	58.6%
ASCII	3678	41.4%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	1231	33.5%
1	677	18.4%
2	479	13.0%
3	376	10.2%
9	207	5.6%
6	168	4.6%
4	131	3.6%
.	92	2.5%
7	80	2.2%
5	66	1.8%
Other values (13)	171	4.6%

Hangul

Value	Count	Frequency (%)
제	659	12.7%
용	351	6.8%
기	186	3.6%
신	171	3.3%
의	160	3.1%
타	155	3.0%
성	122	2.3%
경	112	2.2%
약	111	2.1%
소	96	1.8%
Other values (169)	3075	59.2%

약물구분
Categorical

Distinct	5
Distinct (%)	0.6%
Missing	0
Missing (%)	0.0%
Memory size	6.1 KiB

내복약(조제)	304
주사제	208
내복약(비조제)	116
외용약(기타)	101
외용약(안약)	42

Length

Max length	8
Median length	7
Mean length	6.0713359
Min length	3

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	내복약(조제)
2nd row	내복약(비조제)
3rd row	내복약(조제)
4th row	내복약(조제)
5th row	내복약(비조제)

Common Values

Value	Count	Frequency (%)
내복약(조제)	304	39.4%
주사제	208	27.0%
내복약(비조제)	116	15.0%
외용약(기타)	101	13.1%
외용약(안약)	42	5.4%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
내복약(조제	304	39.4%
주사제	208	27.0%
내복약(비조제	116	15.0%
외용약(기타	101	13.1%
외용약(안약	42	5.4%

마약류
Categorical

IMBALANCE

Distinct	3
Distinct (%)	0.4%
Missing	0
Missing (%)	0.0%
Memory size	6.1 KiB

일반	743
향정	19
마약	9

Length

Max length	2
Median length	2
Mean length	2
Min length	2

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	일반
2nd row	일반
3rd row	일반
4th row	일반
5th row	일반

Common Values

Value	Count	Frequency (%)
일반	743	96.4%
향정	19	2.5%
마약	9	1.2%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
일반	743	96.4%
향정	19	2.5%
마약	9	1.2%

약품명칭
Text

Distinct	765
Distinct (%)	99.6%
Missing	3
Missing (%)	0.4%
Memory size	6.1 KiB

Length

Max length	100
Median length	61
Mean length	27.950521
Min length	3

Characters and Unicode

Total characters	21466
Distinct characters	262
Distinct categories	12 ?
Distinct scripts	4 ?
Distinct blocks	4 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	762 ?
Unique (%)	99.2%

Sample

1st row	Acetaminophen 650mg/Tab
2nd row	Albendazole 400mg/Tab
3rd row	Aripiprazole 2mg
4th row	Aripiprazole 5mg
5th row	Aripiprazole OD 10mg/Tab

Value	Count	Frequency (%)
hcl	108	4.2%
sodium	58	2.2%
eye	40	1.5%
drop	39	1.5%
10mg/tab	21	0.8%
5mg/tab	18	0.7%
acid	18	0.7%
chloride	16	0.6%
sulfate	15	0.6%
100mg/tab	15	0.6%
Other values (1347)	2239	86.5%

Most occurring characters

Value	Count	Frequency (%)
	1824	8.5%
a	1320	6.1%
e	1264	5.9%
i	1213	5.7%
m	1155	5.4%
l	1059	4.9%
o	1056	4.9%
0	836	3.9%
n	808	3.8%
r	772	3.6%
Other values (252)	10159	47.3%

Most occurring categories

Value	Count	Frequency (%)
Lowercase Letter	13345	62.2%
Decimal Number	2297	10.7%
Uppercase Letter	1937	9.0%
Space Separator	1824	8.5%
Other Punctuation	1141	5.3%
Other Letter	584	2.7%
Other Symbol	179	0.8%
Open Punctuation	61	0.3%
Close Punctuation	59	0.3%
Dash Punctuation	36	0.2%
Other values (2)	3	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
외	33	5.7%
종	33	5.7%
포	29	5.0%
탕	20	3.4%
산	17	2.9%
제	14	2.4%
액	13	2.2%
정	13	2.2%
스	12	2.1%
주	11	1.9%
Other values (171)	389	66.6%

Lowercase Letter

Value	Count	Frequency (%)
a	1320	9.9%
e	1264	9.5%
i	1213	9.1%
m	1155	8.7%
l	1059	7.9%
o	1056	7.9%
n	808	6.1%
r	772	5.8%
t	732	5.5%
g	647	4.8%
Other values (18)	3319	24.9%

Uppercase Letter

Value	Count	Frequency (%)
T	337	17.4%
C	298	15.4%
A	173	8.9%
H	156	8.1%
B	123	6.4%
S	118	6.1%
D	88	4.5%
P	86	4.4%
L	76	3.9%
E	69	3.6%
Other values (15)	413	21.3%

Decimal Number

Value	Count	Frequency (%)
0	836	36.4%
5	420	18.3%
1	355	15.5%
2	301	13.1%
3	119	5.2%
4	100	4.4%
6	64	2.8%
7	39	1.7%
8	38	1.7%
9	25	1.1%

Other Punctuation

Value	Count	Frequency (%)
/	757	66.3%
.	231	20.2%
%	100	8.8%
,	41	3.6%
:	6	0.5%
&	3	0.3%
'	2	0.2%
·	1	0.1%

Other Symbol

Value	Count	Frequency (%)
㎎	138	77.1%
㎖	26	14.5%
㎍	14	7.8%
㎠	1	0.6%

Space Separator

Value	Count	Frequency (%)
	1824	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	61	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	59	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	36	100.0%

Math Symbol

Value	Count	Frequency (%)
+	2	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	15279	71.2%
Common	5600	26.1%
Hangul	584	2.7%
Greek	3	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
외	33	5.7%
종	33	5.7%
포	29	5.0%
탕	20	3.4%
산	17	2.9%
제	14	2.4%
액	13	2.2%
정	13	2.2%
스	12	2.1%
주	11	1.9%
Other values (171)	389	66.6%

Latin

Value	Count	Frequency (%)
a	1320	8.6%
e	1264	8.3%
i	1213	7.9%
m	1155	7.6%
l	1059	6.9%
o	1056	6.9%
n	808	5.3%
r	772	5.1%
t	732	4.8%
g	647	4.2%
Other values (41)	5253	34.4%

Common

Value	Count	Frequency (%)
	1824	32.6%
0	836	14.9%
/	757	13.5%
5	420	7.5%
1	355	6.3%
2	301	5.4%
.	231	4.1%
㎎	138	2.5%
3	119	2.1%
%	100	1.8%
Other values (18)	519	9.3%

Greek

Value	Count	Frequency (%)
α	2	66.7%
β	1	33.3%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	20699	96.4%
Hangul	584	2.7%
CJK Compat	179	0.8%
None	4	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	1824	8.8%
a	1320	6.4%
e	1264	6.1%
i	1213	5.9%
m	1155	5.6%
l	1059	5.1%
o	1056	5.1%
0	836	4.0%
n	808	3.9%
r	772	3.7%
Other values (64)	9392	45.4%

CJK Compat

Value	Count	Frequency (%)
㎎	138	77.1%
㎖	26	14.5%
㎍	14	7.8%
㎠	1	0.6%

Hangul

Value	Count	Frequency (%)
외	33	5.7%
종	33	5.7%
포	29	5.0%
탕	20	3.4%
산	17	2.9%
제	14	2.4%
액	13	2.2%
정	13	2.2%
스	12	2.1%
주	11	1.9%
Other values (171)	389	66.6%

None

Value	Count	Frequency (%)
α	2	50.0%
β	1	25.0%
·	1	25.0%

한글명칭
Text

MISSING

Distinct	738
Distinct (%)	99.3%
Missing	28
Missing (%)	3.6%
Memory size	6.1 KiB

Length

Max length	80
Median length	36
Mean length	14.397039
Min length	2

Characters and Unicode

Total characters	10697
Distinct characters	444
Distinct categories	10 ?
Distinct scripts	3 ?
Distinct blocks	4 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	733 ?
Unique (%)	98.7%

Sample

1st row	아세트아미노펜서방정 650mg
2nd row	알벤다졸정 400mg
3rd row	아리피프라졸 2mg
4th row	아리피프라졸정 5mg
5th row	아리피프라졸 OD 10mg 정

Value	Count	Frequency (%)
주	102	5.0%
정	88	4.3%
점안액	39	1.9%
캡슐	29	1.4%
염산	27	1.3%
5mg	24	1.2%
10mg	24	1.2%
100mg	21	1.0%
50mg	16	0.8%
크림	15	0.7%
Other values (1134)	1641	81.0%

Most occurring characters

Value	Count	Frequency (%)
	1284	12.0%
0	613	5.7%
m	507	4.7%
g	434	4.1%
5	313	2.9%
1	256	2.4%
정	256	2.4%
/	252	2.4%
2	209	2.0%
로	160	1.5%
Other values (434)	6413	60.0%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	5521	51.6%
Decimal Number	1620	15.1%
Lowercase Letter	1448	13.5%
Space Separator	1284	12.0%
Other Punctuation	468	4.4%
Uppercase Letter	183	1.7%
Other Symbol	82	0.8%
Close Punctuation	34	0.3%
Open Punctuation	34	0.3%
Dash Punctuation	23	0.2%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
정	256	4.6%
로	160	2.9%
주	160	2.9%
트	145	2.6%
리	140	2.5%
산	123	2.2%
스	113	2.0%
이	111	2.0%
염	100	1.8%
아	99	1.8%
Other values (366)	4114	74.5%

Lowercase Letter

Value	Count	Frequency (%)
m	507	35.0%
g	434	30.0%
l	135	9.3%
a	57	3.9%
e	50	3.5%
i	36	2.5%
n	32	2.2%
o	29	2.0%
r	26	1.8%
t	22	1.5%
Other values (13)	120	8.3%

Uppercase Letter

Value	Count	Frequency (%)
C	20	10.9%
T	17	9.3%
L	16	8.7%
B	14	7.7%
I	13	7.1%
S	13	7.1%
D	12	6.6%
U	12	6.6%
P	11	6.0%
A	10	5.5%
Other values (11)	45	24.6%

Decimal Number

Value	Count	Frequency (%)
0	613	37.8%
5	313	19.3%
1	256	15.8%
2	209	12.9%
3	74	4.6%
4	60	3.7%
6	39	2.4%
7	27	1.7%
8	20	1.2%
9	9	0.6%

Other Punctuation

Value	Count	Frequency (%)
/	252	53.8%
.	121	25.9%
%	74	15.8%
,	15	3.2%
:	4	0.9%
'	1	0.2%
·	1	0.2%

Other Symbol

Value	Count	Frequency (%)
㎎	59	72.0%
㎖	13	15.9%
㎍	10	12.2%

Space Separator

Value	Count	Frequency (%)
	1284	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	34	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	34	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	23	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	5521	51.6%
Common	3545	33.1%
Latin	1631	15.2%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
정	256	4.6%
로	160	2.9%
주	160	2.9%
트	145	2.6%
리	140	2.5%
산	123	2.2%
스	113	2.0%
이	111	2.0%
염	100	1.8%
아	99	1.8%
Other values (366)	4114	74.5%

Latin

Value	Count	Frequency (%)
m	507	31.1%
g	434	26.6%
l	135	8.3%
a	57	3.5%
e	50	3.1%
i	36	2.2%
n	32	2.0%
o	29	1.8%
r	26	1.6%
t	22	1.3%
Other values (34)	303	18.6%

Common

Value	Count	Frequency (%)
	1284	36.2%
0	613	17.3%
5	313	8.8%
1	256	7.2%
/	252	7.1%
2	209	5.9%
.	121	3.4%
3	74	2.1%
%	74	2.1%
4	60	1.7%
Other values (14)	289	8.2%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	5521	51.6%
ASCII	5093	47.6%
CJK Compat	82	0.8%
None	1	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	1284	25.2%
0	613	12.0%
m	507	10.0%
g	434	8.5%
5	313	6.1%
1	256	5.0%
/	252	4.9%
2	209	4.1%
l	135	2.7%
.	121	2.4%
Other values (54)	969	19.0%

Hangul

Value	Count	Frequency (%)
정	256	4.6%
로	160	2.9%
주	160	2.9%
트	145	2.6%
리	140	2.5%
산	123	2.2%
스	113	2.0%
이	111	2.0%
염	100	1.8%
아	99	1.8%
Other values (366)	4114	74.5%

CJK Compat

Value	Count	Frequency (%)
㎎	59	72.0%
㎖	13	15.9%
㎍	10	12.2%

None

Value	Count	Frequency (%)
·	1	100.0%

사용여부
Boolean

Distinct	2
Distinct (%)	0.3%
Missing	0
Missing (%)	0.0%
Memory size	899.0 B

True	462
False	309

Common Values (Table)
Common Values (Plot)

Value	Count	Frequency (%)
True	462	59.9%
False	309	40.1%

Heatmap
Table

	약물구분	마약류	사용여부
약물구분	1.000	0.103	0.144
마약류	0.103	1.000	0.038
사용여부	0.144	0.038	1.000

Heatmap
Table

	사용여부	약물구분	마약류
사용여부	1.000	0.176	0.062
약물구분	0.176	1.000	0.077
마약류	0.062	0.077	1.000

Heatmap
Table

	약물구분	마약류	사용여부
약물구분	1.000	0.077	0.176
마약류	0.077	1.000	0.062
사용여부	0.176	0.062	1.000

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	약품코드	주성분	약품분류	약물구분	마약류	약품명칭	한글명칭	사용여부
0	AAP650	101430ATR	114 해열.진통.소염제	내복약(조제)	일반	Acetaminophen 650mg/Tab	아세트아미노펜서방정 650mg	Y
1	ABDZ	104303ATB	642 구충제	내복약(비조제)	일반	Albendazole 400mg/Tab	알벤다졸정 400mg	Y
2	ABLI2	451504ATB	117 정신신경용제	내복약(조제)	일반	Aripiprazole 2mg	아리피프라졸 2mg	Y
3	ABLI5	451503ATB	117 정신신경용제	내복약(조제)	일반	Aripiprazole 5mg	아리피프라졸정 5mg	Y
4	ABOD10	451501ATD	117 정신신경용제	내복약(비조제)	일반	Aripiprazole OD 10mg/Tab	아리피프라졸 OD 10mg 정	Y
5	ACTI	260300ATB	141 항히스타민제	내복약(조제)	일반	Triprolidine HCl 2.5mg/Pseudoephedrine HCl 60mg Tab	트리프롤리딘/슈도에페드린정	Y
6	ACTN150	442330ATB	399 따로 분류되지 않는 대사성 의약품	내복약(비조제)	일반	Risedronate sodium 150mg/Tab	리세드론산 나트륨 정 150mg	Y
7	ACTN35	511200ATB	399 따로 분류되지 않는 대사성 의약품	내복약(비조제)	일반	Risedronate sodium 35㎎/Cholecalciferol 5600IU/Tab	리세드론산 나트륨 35㎎/콜레칼시페롤 5600IU/정	Y
8	ADT25	231101ATB	213 이뇨제	내복약(조제)	일반	Spironolactone 25mg/Tab	스피로노락톤정 25mg	Y
9	AGIO	214630AGN	238 하제,완장제	내복약(비조제)	일반	Agiocur pregranules 6g/포	아기오쿨원료과립 6g/포	Y

	약품코드	주성분	약품분류	약물구분	마약류	약품명칭	한글명칭	사용여부
761	VENIT	163601ATB	215 혈관보강제	내복약(조제)	일반	Fraction Flavonoid Purifiee Micronise 500mg/Tab	베니톨정 500mg	N
762	VITB6	221603ATB	313 비타민 B 제(비타민 B1 제외)	내복약(조제)	일반	Pyridoxine HCl 50mg/Tab	염산 피리독신 정 50mg	N
763	VITC	110404ATB	314 비타민 C 및 P 제	내복약(조제)	일반	Ascorbic Acid 500mg/Tab	<NA>	N
764	VIV	617101ATB	399 따로 분류되지 않는 대사성 의약품	내복약(조제)	일반	Bazedoxifene acetate 20mg	바제독시펜정	N
765	VLIDO	183902CLQ	121 국소마취제	외용약(기타)	일반	Lidocaine Viscous Soln. 2% 100ml/Btl	<NA>	N
766	VPA	247001ACS	113 항전간제	내복약(조제)	일반	Valproic acid 250mg/Cap	발프로익산 연질캅셀 250mg	N
767	WEL150	428102 ATR	117 정신신경용제	내복약(조제)	일반	Bupropion HCl 150mg	부프로피온 XL 150mg	N
768	X2032	<NA>	<NA>	주사제	일반	WRC(Washed RBC 400ml)	WRC(Washed RBC 400ml) (혈액)	N
769	ZOCO	227801ATB	218 동맥경화용제	내복약(조제)	일반	Simvastatin 20mg/Tab	심바스타틴정 20mg	N
770	ZPD6	250503ATR	112 최면진정제	내복약(조제)	향정	Zolpidem tartrate 6.25㎎/Tab	졸피뎀 6.25mg 정	N

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Uppercase Letter

Decimal Number

Other Punctuation

Dash Punctuation

Lowercase Letter

Most occurring scripts

Most frequent character per script

Latin

Common

Most occurring blocks

Most frequent character per block

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Uppercase Letter

Decimal Number

Space Separator

Most occurring scripts

Most frequent character per script

Latin

Common

Most occurring blocks

Most frequent character per block

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Decimal Number

Uppercase Letter

Other Punctuation

Space Separator

Close Punctuation

Open Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Common

Latin

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Common Values

Length

Common Values (Plot)

Common Values

Length

Common Values (Plot)

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Decimal Number

Other Punctuation

Other Symbol

Space Separator

Open Punctuation

Close Punctuation

Dash Punctuation

Math Symbol

Modifier Symbol

Most occurring scripts

Most frequent character per script

Hangul

Latin

Common

Greek

Most occurring blocks

Most frequent character per block

ASCII

CJK Compat