gimi9 Pandas Profiling

Dataset statistics

Number of variables	10
Number of observations	419
Missing cells	831
Missing cells (%)	19.8%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	32.9 KiB
Average record size in memory	80.3 B

Variable types

Unsupported	1
Categorical	4
Text	5

Dataset

Description	파일 다운로드
Author	서울특별시
URL	https://data.seoul.go.kr/dataList/OA-12967/F/1/datasetView.do

Alerts

`Unnamed: 6` is highly overall correlated with `Unnamed: 1`	High correlation
`Unnamed: 5` is highly overall correlated with `Unnamed: 1`	High correlation
`Unnamed: 1` is highly overall correlated with `Unnamed: 5` and 2 other fields	High correlation
`Unnamed: 7` is highly overall correlated with `Unnamed: 1`	High correlation
`Unnamed: 5` is highly imbalanced (84.3%)	Imbalance
`Unnamed: 6` is highly imbalanced (62.3%)	Imbalance
`Unnamed: 7` is highly imbalanced (65.7%)	Imbalance
`Unnamed: 8` has 410 (97.9%) missing values	Missing
`Unnamed: 9` has 413 (98.6%) missing values	Missing
`외국어 가능 약국 현황 (서울 열린데이터 광장)` is an unsupported type, check if it needs cleaning or further analysis	Unsupported

Reproduction

Analysis started	2024-04-06 11:14:40.129756
Analysis finished	2024-04-06 11:14:42.300390
Duration	2.17 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

외국어 가능 약국 현황 (서울 열린데이터 광장)
Unsupported

REJECTED UNSUPPORTED

Missing	2
Missing (%)	0.5%
Memory size	3.4 KiB

Unnamed: 1
Categorical

HIGH CORRELATION

Distinct	27
Distinct (%)	6.4%
Missing	0
Missing (%)	0.0%
Memory size	3.4 KiB

용산구	43
송파구	38
서초구	37
서대문구	33
마포구	25
Other values (22)	243

Length

Max length	4
Median length	3
Mean length	3.1264916
Min length	2

Unique

Unique	2 ?
Unique (%)	0.5%

Sample

1st row	<NA>
2nd row	자치구
3rd row	<NA>
4th row	종로구
5th row	종로구

Common Values

Value	Count	Frequency (%)
용산구	43	10.3%
송파구	38	9.1%
서초구	37	8.8%
서대문구	33	7.9%
마포구	25	6.0%
동작구	24	5.7%
중구	24	5.7%
성동구	21	5.0%
동대문구	20	4.8%
강북구	18	4.3%
Other values (17)	136	32.5%

Length

Histogram of lengths of the category

Value	Count	Frequency (%)
용산구	43	10.3%
송파구	38	9.1%
서초구	37	8.8%
서대문구	33	7.9%
마포구	25	6.0%
동작구	24	5.7%
중구	24	5.7%
성동구	21	5.0%
동대문구	20	4.8%
강북구	18	4.3%
Other values (16)	136	32.5%

Unnamed: 2
Text

Distinct	381
Distinct (%)	91.4%
Missing	2
Missing (%)	0.5%
Memory size	3.4 KiB

Length

Max length	11
Median length	10
Mean length	5.2494005
Min length	3

Characters and Unicode

Total characters	2189
Distinct characters	275
Distinct categories	4 ?
Distinct scripts	3 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	353 ?
Unique (%)	84.7%

Sample

1st row	약국이름
2nd row	김해약국
3rd row	보령약국
4th row	서울종로약국
5th row	수도약국

Value	Count	Frequency (%)
푸른약국	3	0.7%
태평양약국	3	0.7%
나무약국	3	0.7%
코끼리약국	3	0.7%
수약국	3	0.7%
후문약국	3	0.7%
열린약국	3	0.7%
정다운약국	3	0.7%
혜민약국	2	0.5%
대한약국	2	0.5%
Other values (371)	389	93.3%

Most occurring characters

Value	Count	Frequency (%)
약	420	19.2%
국	418	19.1%
리	59	2.7%
온	39	1.8%
누	34	1.6%
이	33	1.5%
화	22	1.0%
신	21	1.0%
한	21	1.0%
사	20	0.9%
Other values (265)	1102	50.3%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	2172	99.2%
Decimal Number	9	0.4%
Lowercase Letter	7	0.3%
Uppercase Letter	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
약	420	19.3%
국	418	19.2%
리	59	2.7%
온	39	1.8%
누	34	1.6%
이	33	1.5%
화	22	1.0%
신	21	1.0%
한	21	1.0%
사	20	0.9%
Other values (250)	1085	50.0%

Decimal Number

Value	Count	Frequency (%)
3	2	22.2%
2	2	22.2%
1	1	11.1%
4	1	11.1%
7	1	11.1%
5	1	11.1%
6	1	11.1%

Lowercase Letter

Value	Count	Frequency (%)
t	1	14.3%
h	1	14.3%
g	1	14.3%
i	1	14.3%
l	1	14.3%
e	1	14.3%
d	1	14.3%

Uppercase Letter

Value	Count	Frequency (%)
N	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	2172	99.2%
Common	9	0.4%
Latin	8	0.4%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
약	420	19.3%
국	418	19.2%
리	59	2.7%
온	39	1.8%
누	34	1.6%
이	33	1.5%
화	22	1.0%
신	21	1.0%
한	21	1.0%
사	20	0.9%
Other values (250)	1085	50.0%

Latin

Value	Count	Frequency (%)
N	1	12.5%
t	1	12.5%
h	1	12.5%
g	1	12.5%
i	1	12.5%
l	1	12.5%
e	1	12.5%
d	1	12.5%

Common

Value	Count	Frequency (%)
3	2	22.2%
2	2	22.2%
1	1	11.1%
4	1	11.1%
7	1	11.1%
5	1	11.1%
6	1	11.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	2172	99.2%
ASCII	17	0.8%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
약	420	19.3%
국	418	19.2%
리	59	2.7%
온	39	1.8%
누	34	1.6%
이	33	1.5%
화	22	1.0%
신	21	1.0%
한	21	1.0%
사	20	0.9%
Other values (250)	1085	50.0%

ASCII

Value	Count	Frequency (%)
3	2	11.8%
2	2	11.8%
N	1	5.9%
1	1	5.9%
4	1	5.9%
7	1	5.9%
5	1	5.9%
6	1	5.9%
t	1	5.9%
h	1	5.9%
Other values (5)	5	29.4%

Unnamed: 3
Text

Distinct	416
Distinct (%)	99.8%
Missing	2
Missing (%)	0.5%
Memory size	3.4 KiB

Length

Max length	51
Median length	44
Mean length	26.443645
Min length	8

Characters and Unicode

Total characters	11027
Distinct characters	351
Distinct categories	11 ?
Distinct scripts	3 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	415 ?
Unique (%)	99.5%

Sample

1st row	주소 (도로명)
2nd row	서울 종로구 종로 206(종로5가)
3rd row	서울 종로구 종로 203(종로5가)
4th row	서울 종로구 대학로 117 (명륜동4가)
5th row	서울 종로구 인사동길 40 (관훈동)

Value	Count	Frequency (%)
서울	416	17.8%
1층	65	2.8%
용산구	43	1.8%
송파구	38	1.6%
서초구	37	1.6%
서대문구	33	1.4%
마포구	25	1.1%
중구	25	1.1%
동작구	24	1.0%
성동구	21	0.9%
Other values (984)	1609	68.9%

Most occurring characters

Value	Count	Frequency (%)
	1947	17.7%
서	531	4.8%
1	512	4.6%
동	495	4.5%
로	465	4.2%
구	443	4.0%
울	420	3.8%
)	366	3.3%
(	366	3.3%
2	299	2.7%
Other values (341)	5183	47.0%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	6110	55.4%
Space Separator	1947	17.7%
Decimal Number	1860	16.9%
Close Punctuation	366	3.3%
Open Punctuation	366	3.3%
Other Punctuation	267	2.4%
Dash Punctuation	55	0.5%
Uppercase Letter	48	0.4%
Math Symbol	4	< 0.1%
Lowercase Letter	3	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
서	531	8.7%
동	495	8.1%
로	465	7.6%
구	443	7.3%
울	420	6.9%
대	162	2.7%
호	145	2.4%
층	133	2.2%
가	119	1.9%
길	103	1.7%
Other values (305)	3094	50.6%

Uppercase Letter

Value	Count	Frequency (%)
B	16	33.3%
A	8	16.7%
I	4	8.3%
G	3	6.2%
C	3	6.2%
N	2	4.2%
K	2	4.2%
D	2	4.2%
L	2	4.2%
F	1	2.1%
Other values (5)	5	10.4%

Decimal Number

Value	Count	Frequency (%)
1	512	27.5%
2	299	16.1%
3	194	10.4%
0	189	10.2%
4	154	8.3%
5	135	7.3%
7	110	5.9%
6	108	5.8%
8	81	4.4%
9	78	4.2%

Other Punctuation

Value	Count	Frequency (%)
,	263	98.5%
.	3	1.1%
/	1	0.4%

Lowercase Letter

Value	Count	Frequency (%)
e	2	66.7%
k	1	33.3%

Space Separator

Value	Count	Frequency (%)
	1947	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	366	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	366	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	55	100.0%

Math Symbol

Value	Count	Frequency (%)
~	4	100.0%

Control

Value	Count	Frequency (%)
	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	6110	55.4%
Common	4866	44.1%
Latin	51	0.5%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
서	531	8.7%
동	495	8.1%
로	465	7.6%
구	443	7.3%
울	420	6.9%
대	162	2.7%
호	145	2.4%
층	133	2.2%
가	119	1.9%
길	103	1.7%
Other values (305)	3094	50.6%

Common

Value	Count	Frequency (%)
	1947	40.0%
1	512	10.5%
)	366	7.5%
(	366	7.5%
2	299	6.1%
,	263	5.4%
3	194	4.0%
0	189	3.9%
4	154	3.2%
5	135	2.8%
Other values (9)	441	9.1%

Latin

Value	Count	Frequency (%)
B	16	31.4%
A	8	15.7%
I	4	7.8%
G	3	5.9%
C	3	5.9%
N	2	3.9%
e	2	3.9%
K	2	3.9%
D	2	3.9%
L	2	3.9%
Other values (7)	7	13.7%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	6110	55.4%
ASCII	4917	44.6%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	1947	39.6%
1	512	10.4%
)	366	7.4%
(	366	7.4%
2	299	6.1%
,	263	5.3%
3	194	3.9%
0	189	3.8%
4	154	3.1%
5	135	2.7%
Other values (26)	492	10.0%

Hangul

Value	Count	Frequency (%)
서	531	8.7%
동	495	8.1%
로	465	7.6%
구	443	7.3%
울	420	6.9%
대	162	2.7%
호	145	2.4%
층	133	2.2%
가	119	1.9%
길	103	1.7%
Other values (305)	3094	50.6%

Unnamed: 4
Text

Distinct	417
Distinct (%)	100.0%
Missing	2
Missing (%)	0.5%
Memory size	3.4 KiB

Length

Max length	13
Median length	11
Mean length	11.290168
Min length	4

Characters and Unicode

Total characters	4708
Distinct characters	16
Distinct categories	4 ?
Distinct scripts	2 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	417 ?
Unique (%)	100.0%

Sample

1st row	전화번호
2nd row	02-2267-1551
3rd row	02-763-8181
4th row	02-3676-4000
5th row	02-732-3336

Value	Count	Frequency (%)
02-2200-1577	1	0.2%
02-363-0888	1	0.2%
02-855-3843	1	0.2%
02-838-1158	1	0.2%
02-839-4551	1	0.2%
02-830-3995	1	0.2%
070-4222-1177	1	0.2%
02-2625-6040	1	0.2%
02-6956-2627	1	0.2%
02-851-2811	1	0.2%
Other values (407)	407	97.6%

Most occurring characters

Value	Count	Frequency (%)
-	831	17.7%
2	784	16.7%
0	694	14.7%
3	355	7.5%
7	336	7.1%
5	315	6.7%
8	301	6.4%
4	287	6.1%
1	284	6.0%
9	281	6.0%
Other values (6)	240	5.1%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	3871	82.2%
Dash Punctuation	831	17.7%
Other Letter	4	0.1%
Space Separator	2	< 0.1%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
2	784	20.3%
0	694	17.9%
3	355	9.2%
7	336	8.7%
5	315	8.1%
8	301	7.8%
4	287	7.4%
1	284	7.3%
9	281	7.3%
6	234	6.0%

Other Letter

Value	Count	Frequency (%)
전	1	25.0%
화	1	25.0%
번	1	25.0%
호	1	25.0%

Dash Punctuation

Value	Count	Frequency (%)
-	831	100.0%

Space Separator

Value	Count	Frequency (%)
	2	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	4704	99.9%
Hangul	4	0.1%

Most frequent character per script

Common

Value	Count	Frequency (%)
-	831	17.7%
2	784	16.7%
0	694	14.8%
3	355	7.5%
7	336	7.1%
5	315	6.7%
8	301	6.4%
4	287	6.1%
1	284	6.0%
9	281	6.0%
Other values (2)	236	5.0%

Hangul

Value	Count	Frequency (%)
전	1	25.0%
화	1	25.0%
번	1	25.0%
호	1	25.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	4704	99.9%
Hangul	4	0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
-	831	17.7%
2	784	16.7%
0	694	14.8%
3	355	7.5%
7	336	7.1%
5	315	6.7%
8	301	6.4%
4	287	6.1%
1	284	6.0%
9	281	6.0%
Other values (2)	236	5.0%

Hangul

Value	Count	Frequency (%)
전	1	25.0%
화	1	25.0%
번	1	25.0%
호	1	25.0%

Unnamed: 5
Categorical

HIGH CORRELATION IMBALANCE

Distinct	4
Distinct (%)	1.0%
Missing	0
Missing (%)	0.0%
Memory size	3.4 KiB

○	398
<NA>	19
가능 외국어	1
영어	1

Length

Max length	6
Median length	1
Mean length	1.150358
Min length	1

Unique

Unique	2 ?
Unique (%)	0.5%

Sample

1st row	<NA>
2nd row	가능 외국어
3rd row	영어
4th row	○
5th row	○

Common Values

Value	Count	Frequency (%)
○	398	95.0%
<NA>	19	4.5%
가능 외국어	1	0.2%
영어	1	0.2%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
○	398	94.8%
na	19	4.5%
가능	1	0.2%
외국어	1	0.2%
영어	1	0.2%

Unnamed: 6
Categorical

HIGH CORRELATION IMBALANCE

Distinct	3
Distinct (%)	0.7%
Missing	0
Missing (%)	0.0%
Memory size	3.4 KiB

<NA>	361
○	57
중국어	1

Length

Max length	4
Median length	4
Mean length	3.5894988
Min length	1

Unique

Unique	1 ?
Unique (%)	0.2%

Sample

1st row	<NA>
2nd row	<NA>
3rd row	중국어
4th row	○
5th row	○

Common Values

Value	Count	Frequency (%)
<NA>	361	86.2%
○	57	13.6%
중국어	1	0.2%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
na	361	86.2%
○	57	13.6%
중국어	1	0.2%

Unnamed: 7
Categorical

HIGH CORRELATION IMBALANCE

Distinct	3
Distinct (%)	0.7%
Missing	0
Missing (%)	0.0%
Memory size	3.4 KiB

<NA>	369
○	49
일본어	1

Length

Max length	4
Median length	4
Mean length	3.646778
Min length	1

Unique

Unique	1 ?
Unique (%)	0.2%

Sample

1st row	<NA>
2nd row	<NA>
3rd row	일본어
4th row	<NA>
5th row	○

Common Values

Value	Count	Frequency (%)
<NA>	369	88.1%
○	49	11.7%
일본어	1	0.2%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
na	369	88.1%
○	49	11.7%
일본어	1	0.2%

Unnamed: 8
Text

MISSING

Distinct	5
Distinct (%)	55.6%
Missing	410
Missing (%)	97.9%
Memory size	3.4 KiB

Length

Max length	4
Median length	4
Mean length	3.5555556
Min length	2

Characters and Unicode

Total characters	32
Distinct characters	13
Distinct categories	1 ?
Distinct scripts	1 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	2 ?
Unique (%)	22.2%

Sample

1st row	기타
2nd row	스페인어
3rd row	프랑스어
4th row	스페인어
5th row	스페인어

Value	Count	Frequency (%)
스페인어	3	33.3%
프랑스어	2	22.2%
독일어	2	22.2%
기타	1	11.1%
러시아어	1	11.1%

Most occurring characters

Value	Count	Frequency (%)
어	8	25.0%
스	5	15.6%
페	3	9.4%
인	3	9.4%
프	2	6.2%
랑	2	6.2%
독	2	6.2%
일	2	6.2%
기	1	3.1%
타	1	3.1%
Other values (3)	3	9.4%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	32	100.0%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
어	8	25.0%
스	5	15.6%
페	3	9.4%
인	3	9.4%
프	2	6.2%
랑	2	6.2%
독	2	6.2%
일	2	6.2%
기	1	3.1%
타	1	3.1%
Other values (3)	3	9.4%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	32	100.0%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
어	8	25.0%
스	5	15.6%
페	3	9.4%
인	3	9.4%
프	2	6.2%
랑	2	6.2%
독	2	6.2%
일	2	6.2%
기	1	3.1%
타	1	3.1%
Other values (3)	3	9.4%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	32	100.0%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
어	8	25.0%
스	5	15.6%
페	3	9.4%
인	3	9.4%
프	2	6.2%
랑	2	6.2%
독	2	6.2%
일	2	6.2%
기	1	3.1%
타	1	3.1%
Other values (3)	3	9.4%

Unnamed: 9
Text

MISSING

Distinct	6
Distinct (%)	100.0%
Missing	413
Missing (%)	98.6%
Memory size	3.4 KiB

Length

Max length	17
Median length	11.5
Mean length	10.833333
Min length	2

Characters and Unicode

Total characters	65
Distinct characters	39
Distinct categories	6 ?
Distinct scripts	2 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	6 ?
Unique (%)	100.0%

Sample

1st row	(2023. 1. 1. 기준)
2nd row	비고
3rd row	전산원 상담만 가능
4th row	오전시간 한정
5th row	일본어는 간단회화만 가능

Value	Count	Frequency (%)
가능	3	17.6%
1	2	11.8%
일본어는	2	11.8%
2023	1	5.9%
기준	1	5.9%
비고	1	5.9%
전산원	1	5.9%
상담만	1	5.9%
오전시간	1	5.9%
한정	1	5.9%
Other values (3)	3	17.6%

Most occurring characters

Value	Count	Frequency (%)
	11	16.9%
능	3	4.6%
.	3	4.6%
가	3	4.6%
만	3	4.6%
전	2	3.1%
일	2	3.1%
본	2	3.1%
2	2	3.1%
어	2	3.1%
Other values (29)	32	49.2%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	43	66.2%
Space Separator	11	16.9%
Decimal Number	6	9.2%
Other Punctuation	3	4.6%
Open Punctuation	1	1.5%
Close Punctuation	1	1.5%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
능	3	7.0%
가	3	7.0%
만	3	7.0%
전	2	4.7%
일	2	4.7%
본	2	4.7%
어	2	4.7%
는	2	4.7%
간	2	4.7%
정	1	2.3%
Other values (21)	21	48.8%

Decimal Number

Value	Count	Frequency (%)
2	2	33.3%
1	2	33.3%
3	1	16.7%
0	1	16.7%

Space Separator

Value	Count	Frequency (%)
	11	100.0%

Other Punctuation

Value	Count	Frequency (%)
.	3	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	1	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	43	66.2%
Common	22	33.8%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
능	3	7.0%
가	3	7.0%
만	3	7.0%
전	2	4.7%
일	2	4.7%
본	2	4.7%
어	2	4.7%
는	2	4.7%
간	2	4.7%
정	1	2.3%
Other values (21)	21	48.8%

Common

Value	Count	Frequency (%)
	11	50.0%
.	3	13.6%
2	2	9.1%
1	2	9.1%
(	1	4.5%
)	1	4.5%
3	1	4.5%
0	1	4.5%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	43	66.2%
ASCII	22	33.8%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	11	50.0%
.	3	13.6%
2	2	9.1%
1	2	9.1%
(	1	4.5%
)	1	4.5%
3	1	4.5%
0	1	4.5%

Hangul

Value	Count	Frequency (%)
능	3	7.0%
가	3	7.0%
만	3	7.0%
전	2	4.7%
일	2	4.7%
본	2	4.7%
어	2	4.7%
는	2	4.7%
간	2	4.7%
정	1	2.3%
Other values (21)	21	48.8%

Heatmap
Table

	Unnamed: 1	Unnamed: 5	Unnamed: 6	Unnamed: 7	Unnamed: 8	Unnamed: 9
Unnamed: 1	1.000	1.000	NaN	NaN	0.708	1.000
Unnamed: 5	1.000	1.000	0.673	0.672	1.000	1.000
Unnamed: 6	NaN	0.673	1.000	0.605	0.000	NaN
Unnamed: 7	NaN	0.672	0.605	1.000	NaN	NaN
Unnamed: 8	0.708	1.000	0.000	NaN	1.000	NaN
Unnamed: 9	1.000	1.000	NaN	NaN	NaN	1.000

Heatmap
Table

	Unnamed: 6	Unnamed: 5	Unnamed: 1	Unnamed: 7
Unnamed: 6	1.000	0.469	1.000	0.410
Unnamed: 5	0.469	1.000	0.969	0.469
Unnamed: 1	1.000	0.969	1.000	1.000
Unnamed: 7	0.410	0.469	1.000	1.000

Heatmap
Table

	Unnamed: 1	Unnamed: 5	Unnamed: 6	Unnamed: 7
Unnamed: 1	1.000	0.969	1.000	1.000
Unnamed: 5	0.969	1.000	0.469	0.469
Unnamed: 6	1.000	0.469	1.000	0.410
Unnamed: 7	1.000	0.469	0.410	1.000

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	외국어 가능 약국 현황 (서울 열린데이터 광장)	Unnamed: 1	Unnamed: 2	Unnamed: 3	Unnamed: 4	Unnamed: 5	Unnamed: 6	Unnamed: 7	Unnamed: 8	Unnamed: 9
0	NaN	<NA>	<NA>	<NA>	<NA>	<NA>	<NA>	<NA>	<NA>	(2023. 1. 1. 기준)
1	연번	자치구	약국이름	주소 (도로명)	전화번호	가능 외국어	<NA>	<NA>	<NA>	비고
2	NaN	<NA>	<NA>	<NA>	<NA>	영어	중국어	일본어	기타	<NA>
3	1	종로구	김해약국	서울 종로구 종로 206(종로5가)	02-2267-1551	○	○	<NA>	<NA>	<NA>
4	2	종로구	보령약국	서울 종로구 종로 203(종로5가)	02-763-8181	○	○	○	<NA>	<NA>
5	3	종로구	서울종로약국	서울 종로구 대학로 117 (명륜동4가)	02-3676-4000	○	○	<NA>	<NA>	<NA>
6	4	종로구	수도약국	서울 종로구 인사동길 40 (관훈동)	02-732-3336	○	<NA>	○	<NA>	<NA>
7	5	종로구	수약국	서울 종로구 종로 33 그랑서울 지하1층	02-778-5985	○	○	○	<NA>	<NA>
8	6	종로구	신서대문대학약국	서울 종로구 경교장1길 1	02-730-0737	○	<NA>	<NA>	<NA>	<NA>
9	7	종로구	신아산약국	서울 종로구 종로 255-2 (종로5가)	02-763-4600	○	<NA>	○	<NA>	<NA>

	외국어 가능 약국 현황 (서울 열린데이터 광장)	Unnamed: 1	Unnamed: 2	Unnamed: 3	Unnamed: 4	Unnamed: 5	Unnamed: 6	Unnamed: 7	Unnamed: 8	Unnamed: 9
409	407	강동구	베스트약국	서울 강동구 양재대로 1325(성내동)	02-474-2447	○	<NA>	<NA>	<NA>	<NA>
410	408	강동구	강남약국	서울 강동구 양재대로 1355(성내동)	02-486-7823	○	○	<NA>	<NA>	<NA>
411	409	강동구	명일마트종로약국	서울 강동구 고덕로 276, 지하(명일동, 이마트)	02-428-7845	○	<NA>	<NA>	<NA>	<NA>
412	410	강동구	파란약국	서울 강동구 양재대로 1325(성내동)	02-484-2479	○	<NA>	<NA>	<NA>	<NA>
413	411	강동구	대한약국	서울 강동구 천호대로 1027(천호동)	02-483-9165	○	<NA>	<NA>	<NA>	<NA>
414	412	강동구	한림약국	서울 강동구 성안로 149(천호동)	02-486-9744	○	<NA>	○	<NA>	일본어는 파트타임 약사님만 가능
415	413	강동구	시민당약국	서울 강동구 양재대로 1478(길동)	02-476-8100	○	<NA>	○	<NA>	<NA>
416	414	강동구	위드팜천사약국	서울 강동구 천호대로 1107, 101호(길동)	02-484-5152	○	<NA>	○	<NA>	<NA>
417	415	강동구	두레약국	서울 강동구 고덕로83길 6(고덕동)	02-429-1662	○	<NA>	○	<NA>	<NA>
418	416	강동구	강동태평양약국	서울 강동구 양재대로 1343 강동태평양약국	02-473-3377	○	<NA>	<NA>	<NA>	<NA>

Overview

Variables

Common Values

Length

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Decimal Number

Lowercase Letter

Uppercase Letter

Most occurring scripts

Most frequent character per script

Hangul

Latin

Common

Most occurring blocks

Most frequent character per block

Hangul

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Decimal Number

Other Punctuation

Lowercase Letter

Space Separator

Close Punctuation

Open Punctuation

Dash Punctuation

Math Symbol

Control

Most occurring scripts

Most frequent character per script

Hangul

Common

Latin

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Most occurring characters

Most occurring categories

Most frequent character per category

Decimal Number

Other Letter

Dash Punctuation

Space Separator

Most occurring scripts

Most frequent character per script

Common

Hangul

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Common Values

Length

Common Values (Plot)

Common Values

Length

Common Values (Plot)

Common Values

Length

Common Values (Plot)

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Most occurring scripts

Most frequent character per script

Hangul

Most occurring blocks

Most frequent character per block

Hangul

Most occurring characters

Most occurring categories

Most frequent character per category