gimi9 Pandas Profiling

Dataset statistics

Number of variables	4
Number of observations	10000
Missing cells	6
Missing cells (%)	< 0.1%
Duplicate rows	39
Duplicate rows (%)	0.4%
Total size in memory	390.6 KiB
Average record size in memory	40.0 B

Variable types

Text	4

Dataset

Description	경북학생문화회관 종합정보자료실에 소장 중인 도서 목록
Author	경상북도교육청 경상북도교육청문화원
URL	https://www.data.go.kr/data/3077714/fileData.do

Alerts

Dataset has 39 (0.4%) duplicate rows

Duplicates

Reproduction

Analysis started	2023-12-12 03:55:51.545968
Analysis finished	2023-12-12 03:55:54.264471
Duration	2.72 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

서명
Text

Distinct	9839
Distinct (%)	98.4%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	190
Median length	85
Mean length	18.7888
Min length	1

Characters and Unicode

Total characters	187888
Distinct characters	1551
Distinct categories	12 ?
Distinct scripts	6 ?
Distinct blocks	15 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	9738 ?
Unique (%)	97.4%

Sample

1st row	(잠수네) 프리스쿨 영어공부법 : 엄마와 아이가 모두 행복한 5세·6세·7세 로드맵
2nd row	당신이 옳다 : 큰글자도서
3rd row	내 거랑 바꿀래
4th row	구리와 구라의 소풍
5th row	고사성어 백과사전

Value	Count	Frequency (%)
	2973	6.2%
이야기	426	0.9%
2	308	0.6%
1	293	0.6%
장편소설	287	0.6%
위한	192	0.4%
우리	187	0.4%
the	173	0.4%
내	146	0.3%
3	134	0.3%
Other values (20765)	43055	89.4%

Most occurring characters

Value	Count	Frequency (%)
	39494	21.0%
이	3423	1.8%
의	3380	1.8%
:	2993	1.6%
는	2443	1.3%
기	1938	1.0%
리	1726	0.9%
e	1676	0.9%
가	1655	0.9%
사	1640	0.9%
Other values (1541)	127520	67.9%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	117118	62.3%
Space Separator	39494	21.0%
Lowercase Letter	13458	7.2%
Other Punctuation	7131	3.8%
Decimal Number	3941	2.1%
Uppercase Letter	2568	1.4%
Close Punctuation	1661	0.9%
Open Punctuation	1660	0.9%
Math Symbol	660	0.4%
Dash Punctuation	180	0.1%
Other values (2)	17	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
이	3423	2.9%
의	3380	2.9%
는	2443	2.1%
기	1938	1.7%
리	1726	1.5%
가	1655	1.4%
사	1640	1.4%
아	1589	1.4%
한	1563	1.3%
지	1526	1.3%
Other values (1413)	96235	82.2%

Lowercase Letter

Value	Count	Frequency (%)
e	1676	12.5%
o	1214	9.0%
i	1089	8.1%
a	1062	7.9%
n	1013	7.5%
t	921	6.8%
r	899	6.7%
s	824	6.1%
l	615	4.6%
h	596	4.4%
Other values (28)	3549	26.4%

Uppercase Letter

Value	Count	Frequency (%)
T	243	9.5%
S	236	9.2%
C	178	6.9%
E	172	6.7%
W	166	6.5%
A	162	6.3%
I	127	4.9%
L	111	4.3%
P	111	4.3%
M	107	4.2%
Other values (18)	955	37.2%

Other Punctuation

Value	Count	Frequency (%)
:	2993	42.0%
.	1453	20.4%
,	1376	19.3%
?	390	5.5%
!	380	5.3%
·	185	2.6%
'	96	1.3%
！	57	0.8%
？	49	0.7%
&	41	0.6%
Other values (13)	111	1.6%

Math Symbol

Value	Count	Frequency (%)
=	552	83.6%
~	43	6.5%
+	30	4.5%
>	7	1.1%
<	7	1.1%
＋	6	0.9%
∼	6	0.9%
\|	4	0.6%
｜	3	0.5%
→	1	0.2%

Decimal Number

Value	Count	Frequency (%)
1	1056	26.8%
2	731	18.5%
0	682	17.3%
3	372	9.4%
5	274	7.0%
4	248	6.3%
6	182	4.6%
7	140	3.6%
9	134	3.4%
8	122	3.1%

Close Punctuation

Value	Count	Frequency (%)
)	1625	97.8%
]	29	1.7%
』	4	0.2%
」	2	0.1%
》	1	0.1%

Open Punctuation

Value	Count	Frequency (%)
(	1624	97.8%
[	29	1.7%
『	4	0.2%
「	2	0.1%
《	1	0.1%

Letter Number

Value	Count	Frequency (%)
Ⅱ	7	70.0%
Ⅰ	2	20.0%
Ⅲ	1	10.0%

Other Symbol

Value	Count	Frequency (%)
ⓔ	5	71.4%
★	1	14.3%
│	1	14.3%

Space Separator

Value	Count	Frequency (%)
	39494	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	180	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	116844	62.2%
Common	54734	29.1%
Latin	16017	8.5%
Han	269	0.1%
Cyrillic	19	< 0.1%
Katakana	5	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
이	3423	2.9%
의	3380	2.9%
는	2443	2.1%
기	1938	1.7%
리	1726	1.5%
가	1655	1.4%
사	1640	1.4%
아	1589	1.4%
한	1563	1.3%
지	1526	1.3%
Other values (1288)	95961	82.1%

Han

Value	Count	Frequency (%)
河	19	7.1%
史	14	5.2%
月	13	4.8%
大	13	4.8%
說	11	4.1%
小	11	4.1%
二	9	3.3%
歷	8	3.0%
經	6	2.2%
註	6	2.2%
Other values (110)	159	59.1%

Common

Value	Count	Frequency (%)
	39494	72.2%
:	2993	5.5%
)	1625	3.0%
(	1624	3.0%
.	1453	2.7%
,	1376	2.5%
1	1056	1.9%
2	731	1.3%
0	682	1.2%
=	552	1.0%
Other values (49)	3148	5.8%

Latin

Value	Count	Frequency (%)
e	1676	10.5%
o	1214	7.6%
i	1089	6.8%
a	1062	6.6%
n	1013	6.3%
t	921	5.8%
r	899	5.6%
s	824	5.1%
l	615	3.8%
h	596	3.7%
Other values (45)	6108	38.1%

Cyrillic

Value	Count	Frequency (%)
е	3	15.8%
н	2	10.5%
и	2	10.5%
о	2	10.5%
в	1	5.3%
з	1	5.3%
З	1	5.3%
д	1	5.3%
а	1	5.3%
п	1	5.3%
Other values (4)	4	21.1%

Katakana

Value	Count	Frequency (%)
ジ	1	20.0%
ナ	1	20.0%
ア	1	20.0%
リ	1	20.0%
ュ	1	20.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	116834	62.2%
ASCII	70348	37.4%
None	372	0.2%
CJK	257	0.1%
Cyrillic	19	< 0.1%
CJK Compat Ideographs	12	< 0.1%
Number Forms	10	< 0.1%
Compat Jamo	10	< 0.1%
Punctuation	7	< 0.1%
Math Operators	6	< 0.1%
Other values (5)	13	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	39494	56.1%
:	2993	4.3%
e	1676	2.4%
)	1625	2.3%
(	1624	2.3%
.	1453	2.1%
,	1376	2.0%
o	1214	1.7%
i	1089	1.5%
a	1062	1.5%
Other values (76)	16742	23.8%

Hangul

Value	Count	Frequency (%)
이	3423	2.9%
의	3380	2.9%
는	2443	2.1%
기	1938	1.7%
리	1726	1.5%
가	1655	1.4%
사	1640	1.4%
아	1589	1.4%
한	1563	1.3%
지	1526	1.3%
Other values (1284)	95951	82.1%

None

Value	Count	Frequency (%)
·	185	49.7%
！	57	15.3%
？	49	13.2%
＇	20	5.4%
＆	16	4.3%
／	8	2.2%
：	6	1.6%
＋	6	1.6%
％	4	1.1%
『	4	1.1%
Other values (9)	17	4.6%

CJK

Value	Count	Frequency (%)
河	19	7.4%
史	14	5.4%
月	13	5.1%
大	13	5.1%
說	11	4.3%
小	11	4.3%
二	9	3.5%
經	6	2.3%
註	6	2.3%
釋	5	1.9%
Other values (105)	150	58.4%

CJK Compat Ideographs

Value	Count	Frequency (%)
歷	8	66.7%
茶	1	8.3%
不	1	8.3%
良	1	8.3%
奈	1	8.3%

Punctuation

Value	Count	Frequency (%)
…	7	100.0%

Number Forms

Value	Count	Frequency (%)
Ⅱ	7	70.0%
Ⅰ	2	20.0%
Ⅲ	1	10.0%

Math Operators

Value	Count	Frequency (%)
∼	6	100.0%

Enclosed Alphanum

Value	Count	Frequency (%)
ⓔ	5	100.0%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	4	40.0%
ㄱ	2	20.0%
ㄴ	2	20.0%
ㄷ	2	20.0%

Cyrillic

Value	Count	Frequency (%)
е	3	15.8%
н	2	10.5%
и	2	10.5%
о	2	10.5%
в	1	5.3%
з	1	5.3%
З	1	5.3%
д	1	5.3%
а	1	5.3%
п	1	5.3%
Other values (4)	4	21.1%

Arrows

Value	Count	Frequency (%)
→	1	100.0%

Katakana

Value	Count	Frequency (%)
ジ	1	20.0%
ナ	1	20.0%
ア	1	20.0%
リ	1	20.0%
ュ	1	20.0%

Misc Symbols

Value	Count	Frequency (%)
★	1	100.0%

Box Drawing

Value	Count	Frequency (%)
│	1	100.0%

저작자
Text

Distinct	8807
Distinct (%)	88.1%
Missing	1
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	138
Median length	115
Mean length	15.70227
Min length	2

Characters and Unicode

Total characters	157007
Distinct characters	1052
Distinct categories	11 ?
Distinct scripts	4 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	8153 ?
Unique (%)	81.5%

Sample

1st row	이신애 지음
2nd row	정혜신 지음
3rd row	엘자 드베르누아 글 ; 피에르 브이예 그림
4th row	나카가와 리에코 글 ; 야마와키 유리코 그림 ; 고광미 옮김
5th row	김원중 편저

Value	Count	Frequency (%)
	7636	15.8%
지음	4645	9.6%
글	3096	6.4%
그림	2959	6.1%
옮김	2702	5.6%
글·그림	350	0.7%
엮음	306	0.6%
by	216	0.4%
공]지음	195	0.4%
글.그림	190	0.4%
Other values (12732)	26063	53.9%

Most occurring characters

Value	Count	Frequency (%)
	39113	24.9%
;	7627	4.9%
지	5573	3.5%
음	5280	3.4%
김	5116	3.3%
글	3919	2.5%
그	3871	2.5%
림	3729	2.4%
이	3271	2.1%
옮	2793	1.8%
Other values (1042)	76715	48.9%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	99105	63.1%
Space Separator	39113	24.9%
Other Punctuation	9146	5.8%
Lowercase Letter	6258	4.0%
Uppercase Letter	1655	1.1%
Open Punctuation	793	0.5%
Close Punctuation	788	0.5%
Dash Punctuation	63	< 0.1%
Decimal Number	46	< 0.1%
Math Symbol	35	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
지	5573	5.6%
음	5280	5.3%
김	5116	5.2%
글	3919	4.0%
그	3871	3.9%
림	3729	3.8%
이	3271	3.3%
옮	2793	2.8%
스	1675	1.7%
정	1591	1.6%
Other values (958)	62287	62.8%

Lowercase Letter

Value	Count	Frequency (%)
e	714	11.4%
a	670	10.7%
n	641	10.2%
i	502	8.0%
r	455	7.3%
t	380	6.1%
o	376	6.0%
s	344	5.5%
l	328	5.2%
y	326	5.2%
Other values (16)	1522	24.3%

Uppercase Letter

Value	Count	Frequency (%)
S	192	11.6%
M	166	10.0%
B	121	7.3%
D	117	7.1%
K	108	6.5%
J	106	6.4%
E	97	5.9%
L	96	5.8%
C	80	4.8%
R	75	4.5%
Other values (16)	497	30.0%

Decimal Number

Value	Count	Frequency (%)
3	11	23.9%
1	9	19.6%
6	6	13.0%
2	5	10.9%
8	4	8.7%
0	4	8.7%
5	3	6.5%
4	3	6.5%
9	1	2.2%

Other Punctuation

Value	Count	Frequency (%)
;	7627	83.4%
.	671	7.3%
·	427	4.7%
,	308	3.4%
:	94	1.0%
&	13	0.1%
'	5	0.1%
!	1	< 0.1%

Open Punctuation

Value	Count	Frequency (%)
[	785	99.0%
〈	3	0.4%
(	2	0.3%
『	2	0.3%
「	1	0.1%

Close Punctuation

Value	Count	Frequency (%)
]	781	99.1%
)	2	0.3%
〉	2	0.3%
』	2	0.3%
」	1	0.1%

Math Symbol

Value	Count	Frequency (%)
>	18	51.4%
<	17	48.6%

Space Separator

Value	Count	Frequency (%)
	39113	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	63	100.0%

Other Symbol

Value	Count	Frequency (%)
ⓔ	5	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	99010	63.1%
Common	49989	31.8%
Latin	7913	5.0%
Han	95	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
지	5573	5.6%
음	5280	5.3%
김	5116	5.2%
글	3919	4.0%
그	3871	3.9%
림	3729	3.8%
이	3271	3.3%
옮	2793	2.8%
스	1675	1.7%
정	1591	1.6%
Other values (898)	62192	62.8%

Han

Value	Count	Frequency (%)
著	17	17.9%
編	6	6.3%
原	5	5.3%
李	3	3.2%
金	3	3.2%
共	2	2.1%
崔	2	2.1%
外	2	2.1%
朴	2	2.1%
趙	2	2.1%
Other values (50)	51	53.7%

Latin

Value	Count	Frequency (%)
e	714	9.0%
a	670	8.5%
n	641	8.1%
i	502	6.3%
r	455	5.8%
t	380	4.8%
o	376	4.8%
s	344	4.3%
l	328	4.1%
y	326	4.1%
Other values (42)	3177	40.1%

Common

Value	Count	Frequency (%)
	39113	78.2%
;	7627	15.3%
[	785	1.6%
]	781	1.6%
.	671	1.3%
·	427	0.9%
,	308	0.6%
:	94	0.2%
-	63	0.1%
>	18	< 0.1%
Other values (22)	102	0.2%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	99004	63.1%
ASCII	57459	36.6%
None	438	0.3%
CJK	90	0.1%
Compat Jamo	6	< 0.1%
Enclosed Alphanum	5	< 0.1%
CJK Compat Ideographs	5	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	39113	68.1%
;	7627	13.3%
[	785	1.4%
]	781	1.4%
e	714	1.2%
.	671	1.2%
a	670	1.2%
n	641	1.1%
i	502	0.9%
r	455	0.8%
Other values (66)	5500	9.6%

Hangul

Value	Count	Frequency (%)
지	5573	5.6%
음	5280	5.3%
김	5116	5.2%
글	3919	4.0%
그	3871	3.9%
림	3729	3.8%
이	3271	3.3%
옮	2793	2.8%
스	1675	1.7%
정	1591	1.6%
Other values (897)	62186	62.8%

None

Value	Count	Frequency (%)
·	427	97.5%
〈	3	0.7%
〉	2	0.5%
』	2	0.5%
『	2	0.5%
「	1	0.2%
」	1	0.2%

CJK

Value	Count	Frequency (%)
著	17	18.9%
編	6	6.7%
原	5	5.6%
金	3	3.3%
共	2	2.2%
崔	2	2.2%
外	2	2.2%
朴	2	2.2%
趙	2	2.2%
根	2	2.2%
Other values (47)	47	52.2%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	6	100.0%

Enclosed Alphanum

Value	Count	Frequency (%)
ⓔ	5	100.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
李	3	60.0%
龍	1	20.0%
柳	1	20.0%

발행자
Text

Distinct	2237
Distinct (%)	22.4%
Missing	4
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	28
Median length	24
Mean length	4.4458784
Min length	1

Characters and Unicode

Total characters	44441
Distinct characters	711
Distinct categories	9 ?
Distinct scripts	4 ?
Distinct blocks	4 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1165 ?
Unique (%)	11.7%

Sample

1st row	RHK
2nd row	해냄
3rd row	교원
4th row	한림출판사
5th row	민음사

Value	Count	Frequency (%)
교원	317	3.0%
문학동네	182	1.7%
비룡소	164	1.6%
창비	133	1.3%
자음과모음	115	1.1%
사계절	110	1.1%
민음사	109	1.0%
시공주니어	109	1.0%
주니어김영사	109	1.0%
아이세움	105	1.0%
Other values (2291)	8969	86.1%

Most occurring characters

Value	Count	Frequency (%)
사	1670	3.8%
스	1251	2.8%
이	1247	2.8%
어	1014	2.3%
북	888	2.0%
아	710	1.6%
한	640	1.4%
문	629	1.4%
교	602	1.4%
출	576	1.3%
Other values (701)	35214	79.2%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	39141	88.1%
Lowercase Letter	3444	7.7%
Uppercase Letter	1040	2.3%
Space Separator	426	1.0%
Decimal Number	157	0.4%
Other Punctuation	103	0.2%
Open Punctuation	59	0.1%
Close Punctuation	59	0.1%
Dash Punctuation	12	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
사	1670	4.3%
스	1251	3.2%
이	1247	3.2%
어	1014	2.6%
북	888	2.3%
아	710	1.8%
한	640	1.6%
문	629	1.6%
교	602	1.5%
출	576	1.5%
Other values (625)	29914	76.4%

Lowercase Letter

Value	Count	Frequency (%)
o	393	11.4%
s	370	10.7%
i	321	9.3%
a	274	8.0%
n	272	7.9%
l	247	7.2%
e	220	6.4%
r	217	6.3%
h	149	4.3%
k	133	3.9%
Other values (15)	848	24.6%

Uppercase Letter

Value	Count	Frequency (%)
B	155	14.9%
M	134	12.9%
K	92	8.8%
C	73	7.0%
P	62	6.0%
S	61	5.9%
H	60	5.8%
O	50	4.8%
D	45	4.3%
A	43	4.1%
Other values (15)	265	25.5%

Other Punctuation

Value	Count	Frequency (%)
&	47	45.6%
·	11	10.7%
＆	10	9.7%
.	9	8.7%
,	7	6.8%
@	4	3.9%
?	4	3.9%
'	3	2.9%
;	3	2.9%
:	3	2.9%

Decimal Number

Value	Count	Frequency (%)
1	68	43.3%
2	67	42.7%
3	5	3.2%
6	5	3.2%
0	5	3.2%
7	2	1.3%
8	2	1.3%
5	2	1.3%
4	1	0.6%

Open Punctuation

Value	Count	Frequency (%)
(	57	96.6%
[	2	3.4%

Close Punctuation

Value	Count	Frequency (%)
)	57	96.6%
]	2	3.4%

Space Separator

Value	Count	Frequency (%)
	426	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	12	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	39091	88.0%
Latin	4484	10.1%
Common	816	1.8%
Han	50	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
사	1670	4.3%
스	1251	3.2%
이	1247	3.2%
어	1014	2.6%
북	888	2.3%
아	710	1.8%
한	640	1.6%
문	629	1.6%
교	602	1.5%
출	576	1.5%
Other values (600)	29864	76.4%

Latin

Value	Count	Frequency (%)
o	393	8.8%
s	370	8.3%
i	321	7.2%
a	274	6.1%
n	272	6.1%
l	247	5.5%
e	220	4.9%
r	217	4.8%
B	155	3.5%
h	149	3.3%
Other values (40)	1866	41.6%

Common

Value	Count	Frequency (%)
	426	52.2%
1	68	8.3%
2	67	8.2%
(	57	7.0%
)	57	7.0%
&	47	5.8%
-	12	1.5%
·	11	1.3%
＆	10	1.2%
.	9	1.1%
Other values (16)	52	6.4%

Han

Value	Count	Frequency (%)
文	8	16.0%
社	7	14.0%
仁	4	8.0%
化	4	8.0%
景	4	8.0%
林	2	4.0%
東	2	4.0%
選	2	4.0%
木	1	2.0%
檜	1	2.0%
Other values (15)	15	30.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	39091	88.0%
ASCII	5279	11.9%
CJK	50	0.1%
None	21	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
사	1670	4.3%
스	1251	3.2%
이	1247	3.2%
어	1014	2.6%
북	888	2.3%
아	710	1.8%
한	640	1.6%
문	629	1.6%
교	602	1.5%
출	576	1.5%
Other values (600)	29864	76.4%

ASCII

Value	Count	Frequency (%)
	426	8.1%
o	393	7.4%
s	370	7.0%
i	321	6.1%
a	274	5.2%
n	272	5.2%
l	247	4.7%
e	220	4.2%
r	217	4.1%
B	155	2.9%
Other values (64)	2384	45.2%

None

Value	Count	Frequency (%)
·	11	52.4%
＆	10	47.6%

CJK

Value	Count	Frequency (%)
文	8	16.0%
社	7	14.0%
仁	4	8.0%
化	4	8.0%
景	4	8.0%
林	2	4.0%
東	2	4.0%
選	2	4.0%
木	1	2.0%
檜	1	2.0%
Other values (15)	15	30.0%

발행연도
Text

Distinct	53
Distinct (%)	0.5%
Missing	1
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	12
Median length	4
Mean length	4.0131013
Min length	3

Characters and Unicode

Total characters	40127
Distinct characters	17
Distinct categories	5 ?
Distinct scripts	2 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	18 ?
Unique (%)	0.2%

Sample

1st row	2014
2nd row	2019
3rd row	2009
4th row	2007
5th row	2007

Value	Count	Frequency (%)
2010	1797	18.0%
2009	1243	12.4%
2011	968	9.7%
2008	836	8.4%
2007	573	5.7%
2006	523	5.2%
2005	481	4.8%
2017	467	4.7%
2014	424	4.2%
2016	374	3.7%
Other values (38)	2313	23.1%

Most occurring characters

Value	Count	Frequency (%)
0	16068	40.0%
2	10516	26.2%
1	6743	16.8%
9	1681	4.2%
8	1183	2.9%
7	1045	2.6%
6	907	2.3%
5	809	2.0%
4	647	1.6%
3	440	1.1%
Other values (7)	88	0.2%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	40039	99.8%
Open Punctuation	38	0.1%
Close Punctuation	38	0.1%
Dash Punctuation	10	< 0.1%
Other Letter	2	< 0.1%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
0	16068	40.1%
2	10516	26.3%
1	6743	16.8%
9	1681	4.2%
8	1183	3.0%
7	1045	2.6%
6	907	2.3%
5	809	2.0%
4	647	1.6%
3	440	1.1%

Open Punctuation

Value	Count	Frequency (%)
[	37	97.4%
(	1	2.6%

Close Punctuation

Value	Count	Frequency (%)
]	37	97.4%
)	1	2.6%

Other Letter

Value	Count	Frequency (%)
단	1	50.0%
기	1	50.0%

Dash Punctuation

Value	Count	Frequency (%)
-	10	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	40125	> 99.9%
Hangul	2	< 0.1%

Most frequent character per script

Common

Value	Count	Frequency (%)
0	16068	40.0%
2	10516	26.2%
1	6743	16.8%
9	1681	4.2%
8	1183	2.9%
7	1045	2.6%
6	907	2.3%
5	809	2.0%
4	647	1.6%
3	440	1.1%
Other values (5)	86	0.2%

Hangul

Value	Count	Frequency (%)
단	1	50.0%
기	1	50.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	40125	> 99.9%
Hangul	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
0	16068	40.0%
2	10516	26.2%
1	6743	16.8%
9	1681	4.2%
8	1183	2.9%
7	1045	2.6%
6	907	2.3%
5	809	2.0%
4	647	1.6%
3	440	1.1%
Other values (5)	86	0.2%

Hangul

Value	Count	Frequency (%)
단	1	50.0%
기	1	50.0%

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	서명	저작자	발행자	발행연도
38865	(잠수네) 프리스쿨 영어공부법 : 엄마와 아이가 모두 행복한 5세·6세·7세 로드맵	이신애 지음	RHK	2014
49134	당신이 옳다 : 큰글자도서	정혜신 지음	해냄	2019
1871	내 거랑 바꿀래	엘자 드베르누아 글 ; 피에르 브이예 그림	교원	2009
1356	구리와 구라의 소풍	나카가와 리에코 글 ; 야마와키 유리코 그림 ; 고광미 옮김	한림출판사	2007
15424	고사성어 백과사전	김원중 편저	민음사	2007
20373	람세스 .2 영원의 신전	자크,크리스티앙	문학동네	2010
12452	스타벅스에서는 그란데를 사라	요시모토 요시오 지음 ; 홍성민 옮김	동아일보사	2008
19801	우리 서로 사랑할 수 있다면 : 용혜원 신작 시집	용혜원 지음 ; 임효 그림	나무생각	2010
41915	느영나영 제주	조지욱 글 ; 김동성 그림	나는별	2015
3238	초원의 집. 3	로라 잉걸스 와일더 글 ; 가스 윌리엄스 그림 ; 김석희 옮김	비룡소	2005

	서명	저작자	발행자	발행연도
8326	노란 누드	최영주 지음	미술문화	2008
5339	(이이화 선생님의)고구려 바로알기. 2, 장수왕에서 마지막 왕 보장왕까지	이이화 원작 ; 최금락 구성 ; 원병조 그림	해피북스	2007
6060	(푸름이)세계자연과학 = prumi science. 8, 관엽 식물 ~ 구황 식물	한국자연생태과학원 엮음	푸름이닷컴	2005
33724	숨겨진 심리학 : 최고의 프로파일러가 알려주는 설득과 협상의 비밀	표창원 지음	토네이도	2011
32500	(생각이 쑥쑥) 나의 첫 경제책. 1:, 돈이 뭐예요？	클레어 레웰린 지음 ; 마이크 고든 그림 ; 최연순 옮김	상상스쿨	2011
20192	자연주의 채식요리	이양지 지음 ; 한지선 [외]요리	리스컴	2010
45811	안녕, 웨이안 :칭산 소설	칭산 지음	한겨레출판	2018
36847	안네의 일기	Anne Frank 지음 ; Kay Sam Shephard 옮김	THE TEXT	2009
59	무슨 생각하니	로버트 잉펜 글. 그림 ; 문우일 옮김	국민서관	2006
2194	(21세기)먼나라 이웃나라. 11, 미국 2(역사편)	이원복 글·그림	김영사	2004

Most frequently occurring

	서명	저작자	발행자	발행연도	# duplicates
15	과학자가 들려주는 과학이야기 . 1-100	정완상 지음	자음과모음	2008	17
11	EQ 휴먼 파워. 1-60	정제광 외 글 ; 이형진 외 그림	한국톨스토이	2013	15
8	(영유아 통합발달 프로그램)뽀삐	프뢰벨유아교육연구소 글 ; 이의정 그림 ; 오은영 감수	베틀북	2012	10
31	저학년 명작 도서관. 1-28	편집부	예림당	2007	9
12	Little classic book. 1-20	그림 형제	예림당	2010	6
10	(칼빈)聖經註釋. 1-20	존 칼빈 原著 ; 존 칼빈 성경주석 출판위원회 편역	성서연구원	2012	5
14	개구쟁이 아치. 1-19	지은이: 기요노 사치코 ; 옮긴이: 고향옥	비룡소	2009-2010	4
38	한국민족문화대백과사전. 1-28	한국정신문화연구원	,한국정신문화연구원	1991	4
23	무엇일까?	[애플비편집부] 편	애플비	2009	3
0	(At Home)in the city	by Sharon Gordon	Marshall Cavendish	2008	2

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Math Symbol

Decimal Number

Close Punctuation

Open Punctuation

Letter Number

Other Symbol

Space Separator

Dash Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Han

Common

Latin

Cyrillic

Katakana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

CJK

CJK Compat Ideographs

Punctuation

Number Forms

Math Operators

Enclosed Alphanum

Compat Jamo

Cyrillic

Arrows

Katakana

Misc Symbols

Box Drawing

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Decimal Number

Other Punctuation

Open Punctuation

Close Punctuation

Math Symbol

Space Separator

Dash Punctuation

Other Symbol

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

CJK

Compat Jamo

Enclosed Alphanum

CJK Compat Ideographs

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Open Punctuation