gimi9 Pandas Profiling

Dataset statistics

Number of variables	5
Number of observations	10000
Missing cells	5
Missing cells (%)	< 0.1%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	468.8 KiB
Average record size in memory	48.0 B

Variable types

Text	5

Dataset

Description	전라남도 인재개발원 자료실(도서실)에서 보유하고 있는 자료들의 목록입니다. 자료 구성은 행정자료_영상자료(DVD)_일반도서로 구분되어 있습니다.
Author	전라남도
URL	https://www.data.go.kr/data/15067344/fileData.do

Alerts

등록번호 has unique values Unique

Reproduction

Analysis started	2024-04-20 19:30:04.154088
Analysis finished	2024-04-20 19:30:08.837527
Duration	4.68 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

등록번호
Text

UNIQUE

Distinct	10000
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	12
Median length	12
Mean length	12
Min length	12

Characters and Unicode

Total characters	120000
Distinct characters	15
Distinct categories	2 ?
Distinct scripts	2 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	10000 ?
Unique (%)	100.0%

Sample

1st row	IM0000020309
2nd row	IM0000008326
3rd row	IM0000028565
4th row	PA0000000252
5th row	IM0000007262

Value	Count	Frequency (%)
im0000020309	1	< 0.1%
im0000005409	1	< 0.1%
im0000018201	1	< 0.1%
im0000024584	1	< 0.1%
im0000003518	1	< 0.1%
im0000026122	1	< 0.1%
im0000021467	1	< 0.1%
im0000003891	1	< 0.1%
im0000006198	1	< 0.1%
im0000003600	1	< 0.1%
Other values (9990)	9990	99.9%

Most occurring characters

Value	Count	Frequency (%)
0	57636	48.0%
I	9612	8.0%
M	9612	8.0%
2	7360	6.1%
1	7211	6.0%
3	4774	4.0%
5	3942	3.3%
6	3919	3.3%
7	3911	3.3%
8	3886	3.2%
Other values (5)	8137	6.8%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	100000	83.3%
Uppercase Letter	20000	16.7%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
0	57636	57.6%
2	7360	7.4%
1	7211	7.2%
3	4774	4.8%
5	3942	3.9%
6	3919	3.9%
7	3911	3.9%
8	3886	3.9%
4	3825	3.8%
9	3536	3.5%

Uppercase Letter

Value	Count	Frequency (%)
I	9612	48.1%
M	9612	48.1%
A	388	1.9%
P	270	1.4%
V	118	0.6%

Most occurring scripts

Value	Count	Frequency (%)
Common	100000	83.3%
Latin	20000	16.7%

Most frequent character per script

Common

Value	Count	Frequency (%)
0	57636	57.6%
2	7360	7.4%
1	7211	7.2%
3	4774	4.8%
5	3942	3.9%
6	3919	3.9%
7	3911	3.9%
8	3886	3.9%
4	3825	3.8%
9	3536	3.5%

Latin

Value	Count	Frequency (%)
I	9612	48.1%
M	9612	48.1%
A	388	1.9%
P	270	1.4%
V	118	0.6%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	120000	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
0	57636	48.0%
I	9612	8.0%
M	9612	8.0%
2	7360	6.1%
1	7211	6.0%
3	4774	4.0%
5	3942	3.3%
6	3919	3.3%
7	3911	3.3%
8	3886	3.2%
Other values (5)	8137	6.8%

서명
Text

Distinct	9664
Distinct (%)	96.6%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	180
Median length	89
Mean length	17.3089
Min length	1

Characters and Unicode

Total characters	173089
Distinct characters	2107
Distinct categories	17 ?
Distinct scripts	5 ?
Distinct blocks	11 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	9377 ?
Unique (%)	93.8%

Sample

1st row	꿈꾸는 씨앗_영혼을 위한 101가지 이야기
2nd row	主觀式勞動法演習
3rd row	세라 이야기
4th row	全南水産
5th row	서양문화사

Value	Count	Frequency (%)
1	461	1.2%
2	449	1.2%
장편소설	275	0.7%
3	222	0.6%
이야기	180	0.5%
위한	155	0.4%
5	121	0.3%
4	116	0.3%
the	98	0.3%
of	97	0.2%
Other values (20252)	36672	94.4%

Most occurring characters

Value	Count	Frequency (%)
	28862	16.7%
의	4148	2.4%
_	3549	2.1%
이	2515	1.5%
.	2415	1.4%
사	2331	1.3%
는	2037	1.2%
한	1878	1.1%
기	1622	0.9%
,	1622	0.9%
Other values (2097)	122110	70.5%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	117250	67.7%
Space Separator	28862	16.7%
Lowercase Letter	8735	5.0%
Decimal Number	5785	3.3%
Other Punctuation	4251	2.5%
Connector Punctuation	3549	2.1%
Uppercase Letter	2483	1.4%
Close Punctuation	984	0.6%
Open Punctuation	984	0.6%
Dash Punctuation	115	0.1%
Other values (7)	91	0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
의	4148	3.5%
이	2515	2.1%
사	2331	2.0%
는	2037	1.7%
한	1878	1.6%
기	1622	1.4%
지	1559	1.3%
가	1489	1.3%
대	1422	1.2%
다	1416	1.2%
Other values (1995)	96833	82.6%

Lowercase Letter

Value	Count	Frequency (%)
e	1069	12.2%
o	842	9.6%
i	711	8.1%
a	682	7.8%
n	680	7.8%
t	627	7.2%
r	574	6.6%
s	516	5.9%
h	406	4.6%
l	402	4.6%
Other values (16)	2226	25.5%

Uppercase Letter

Value	Count	Frequency (%)
T	257	10.4%
S	228	9.2%
E	191	7.7%
A	185	7.5%
C	147	5.9%
I	124	5.0%
O	122	4.9%
M	120	4.8%
N	115	4.6%
B	106	4.3%
Other values (16)	888	35.8%

Other Punctuation

Value	Count	Frequency (%)
.	2415	56.8%
,	1622	38.2%
·	138	3.2%
/	36	0.8%
&	20	0.5%
;	7	0.2%
…	7	0.2%
＆	4	0.1%
@	1	< 0.1%
／	1	< 0.1%

Decimal Number

Value	Count	Frequency (%)
1	1504	26.0%
2	1060	18.3%
0	795	13.7%
3	568	9.8%
9	432	7.5%
5	382	6.6%
4	368	6.4%
6	233	4.0%
7	230	4.0%
8	213	3.7%

Math Symbol

Value	Count	Frequency (%)
~	23	40.4%
+	13	22.8%
>	9	15.8%
<	9	15.8%
\|	2	3.5%
=	1	1.8%

Close Punctuation

Value	Count	Frequency (%)
)	969	98.5%
]	9	0.9%
」	4	0.4%
』	1	0.1%
》	1	0.1%

Open Punctuation

Value	Count	Frequency (%)
(	969	98.5%
[	9	0.9%
「	4	0.4%
『	1	0.1%
《	1	0.1%

Letter Number

Value	Count	Frequency (%)
Ⅱ	12	52.2%
Ⅰ	6	26.1%
Ⅲ	2	8.7%
Ⅳ	2	8.7%
Ⅴ	1	4.3%

Other Symbol

Value	Count	Frequency (%)
★	1	50.0%
♥	1	50.0%

Space Separator

Value	Count	Frequency (%)
	28862	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	3549	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	115	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	4	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	2	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	2	100.0%

Other Number

Value	Count	Frequency (%)
②	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	112182	64.8%
Common	44598	25.8%
Latin	11241	6.5%
Han	5059	2.9%
Hiragana	9	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
의	4148	3.7%
이	2515	2.2%
사	2331	2.1%
는	2037	1.8%
한	1878	1.7%
기	1622	1.4%
지	1559	1.4%
가	1489	1.3%
대	1422	1.3%
다	1416	1.3%
Other values (1181)	91765	81.8%

Han

Value	Count	Frequency (%)
國	144	2.8%
學	111	2.2%
論	98	1.9%
韓	96	1.9%
史	90	1.8%
政	78	1.5%
法	74	1.5%
文	73	1.4%
說	70	1.4%
小	67	1.3%
Other values (798)	4158	82.2%

Latin

Value	Count	Frequency (%)
e	1069	9.5%
o	842	7.5%
i	711	6.3%
a	682	6.1%
n	680	6.0%
t	627	5.6%
r	574	5.1%
s	516	4.6%
h	406	3.6%
l	402	3.6%
Other values (47)	4732	42.1%

Common

Value	Count	Frequency (%)
	28862	64.7%
_	3549	8.0%
.	2415	5.4%
,	1622	3.6%
1	1504	3.4%
2	1060	2.4%
)	969	2.2%
(	969	2.2%
0	795	1.8%
3	568	1.3%
Other values (35)	2285	5.1%

Hiragana

Value	Count	Frequency (%)
の	3	33.3%
か	2	22.2%
い	1	11.1%
ら	1	11.1%
が	1	11.1%
み	1	11.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	112172	64.8%
ASCII	55647	32.1%
CJK	4896	2.8%
CJK Compat Ideographs	163	0.1%
None	155	0.1%
Number Forms	23	< 0.1%
Punctuation	11	< 0.1%
Compat Jamo	10	< 0.1%
Hiragana	9	< 0.1%
Misc Symbols	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	28862	51.9%
_	3549	6.4%
.	2415	4.3%
,	1622	2.9%
1	1504	2.7%
e	1069	1.9%
2	1060	1.9%
)	969	1.7%
(	969	1.7%
o	842	1.5%
Other values (72)	12786	23.0%

Hangul

Value	Count	Frequency (%)
의	4148	3.7%
이	2515	2.2%
사	2331	2.1%
는	2037	1.8%
한	1878	1.7%
기	1622	1.4%
지	1559	1.4%
가	1489	1.3%
대	1422	1.3%
다	1416	1.3%
Other values (1174)	91755	81.8%

CJK

Value	Count	Frequency (%)
國	144	2.9%
學	111	2.3%
論	98	2.0%
韓	96	2.0%
史	90	1.8%
政	78	1.6%
法	74	1.5%
文	73	1.5%
說	70	1.4%
小	67	1.4%
Other values (769)	3995	81.6%

None

Value	Count	Frequency (%)
·	138	89.0%
」	4	2.6%
「	4	2.6%
＆	4	2.6%
／	1	0.6%
』	1	0.6%
『	1	0.6%
《	1	0.6%
》	1	0.6%

CJK Compat Ideographs

Value	Count	Frequency (%)
歷	30	18.4%
論	29	17.8%
理	19	11.7%
李	15	9.2%
勞	13	8.0%
年	7	4.3%
女	5	3.1%
龍	4	2.5%
不	4	2.5%
老	4	2.5%
Other values (19)	33	20.2%

Number Forms

Value	Count	Frequency (%)
Ⅱ	12	52.2%
Ⅰ	6	26.1%
Ⅲ	2	8.7%
Ⅳ	2	8.7%
Ⅴ	1	4.3%

Punctuation

Value	Count	Frequency (%)
…	7	63.6%
‘	2	18.2%
’	2	18.2%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	4	40.0%
ㅣ	1	10.0%
ㅇ	1	10.0%
ㅎ	1	10.0%
ㅈ	1	10.0%
ㄷ	1	10.0%
ㅂ	1	10.0%

Hiragana

Value	Count	Frequency (%)
の	3	33.3%
か	2	22.2%
い	1	11.1%
ら	1	11.1%
が	1	11.1%
み	1	11.1%

Misc Symbols

Value	Count	Frequency (%)
★	1	50.0%
♥	1	50.0%

Enclosed Alphanum

Value	Count	Frequency (%)
②	1	100.0%

저작자
Text

Distinct	7932
Distinct (%)	79.3%
Missing	1
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	342
Median length	221
Mean length	10.470847
Min length	2

Characters and Unicode

Total characters	104698
Distinct characters	1490
Distinct categories	11 ?
Distinct scripts	4 ?
Distinct blocks	5 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	6948 ?
Unique (%)	69.5%

Sample

1st row	브라이언 카바노프지음 ; 주연진 옮김
2nd row	金致善
3rd row	프랜시스 호즈슨 버넷 글 ; 타샤 튜더 그림 ; 햇살과 나무꾼 옮김
4th row	全羅南道編.
5th row	문석홍 지음

Value	Count	Frequency (%)
지음	6039	19.3%
	2624	8.4%
옮김	1771	5.7%
저	666	2.1%
著	430	1.4%
편	415	1.3%
엮음	149	0.5%
그림	137	0.4%
역	131	0.4%
외	123	0.4%
Other values (10839)	18852	60.2%

Most occurring characters

Value	Count	Frequency (%)
	22213	21.2%
지	6630	6.3%
음	6277	6.0%
김	3628	3.5%
;	2611	2.5%
이	2221	2.1%
옮	1809	1.7%
,	1449	1.4%
스	1004	1.0%
정	991	0.9%
Other values (1480)	55865	53.4%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	75931	72.5%
Space Separator	22213	21.2%
Other Punctuation	4681	4.5%
Uppercase Letter	693	0.7%
Lowercase Letter	485	0.5%
Close Punctuation	274	0.3%
Open Punctuation	273	0.3%
Connector Punctuation	73	0.1%
Decimal Number	50	< 0.1%
Math Symbol	18	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
지	6630	8.7%
음	6277	8.3%
김	3628	4.8%
이	2221	2.9%
옮	1809	2.4%
스	1004	1.3%
정	991	1.3%
저	876	1.2%
영	860	1.1%
편	783	1.0%
Other values (1404)	50852	67.0%

Uppercase Letter

Value	Count	Frequency (%)
J	79	11.4%
S	57	8.2%
B	48	6.9%
C	47	6.8%
A	44	6.3%
K	43	6.2%
E	43	6.2%
H	41	5.9%
R	41	5.9%
M	33	4.8%
Other values (14)	217	31.3%

Lowercase Letter

Value	Count	Frequency (%)
e	69	14.2%
n	56	11.5%
r	52	10.7%
a	42	8.7%
i	40	8.2%
s	34	7.0%
o	33	6.8%
t	29	6.0%
l	17	3.5%
u	15	3.1%
Other values (13)	98	20.2%

Decimal Number

Value	Count	Frequency (%)
2	8	16.0%
1	7	14.0%
3	6	12.0%
4	6	12.0%
9	5	10.0%
8	4	8.0%
6	4	8.0%
0	4	8.0%
5	3	6.0%
7	3	6.0%

Other Punctuation

Value	Count	Frequency (%)
;	2611	55.8%
,	1449	31.0%
.	541	11.6%
·	73	1.6%
/	4	0.1%
．	1	< 0.1%
&	1	< 0.1%
\	1	< 0.1%

Close Punctuation

Value	Count	Frequency (%)
]	203	74.1%
)	70	25.5%
〉	1	0.4%

Open Punctuation

Value	Count	Frequency (%)
[	202	74.0%
(	70	25.6%
〈	1	0.4%

Math Symbol

Value	Count	Frequency (%)
>	9	50.0%
<	9	50.0%

Space Separator

Value	Count	Frequency (%)
	22213	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	73	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	7	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	72262	69.0%
Common	27589	26.4%
Han	3669	3.5%
Latin	1178	1.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
지	6630	9.2%
음	6277	8.7%
김	3628	5.0%
이	2221	3.1%
옮	1809	2.5%
스	1004	1.4%
정	991	1.4%
저	876	1.2%
영	860	1.2%
편	783	1.1%
Other values (815)	47183	65.3%

Han

Value	Count	Frequency (%)
著	484	13.2%
編	170	4.6%
金	157	4.3%
譯	151	4.1%
李	94	2.6%
國	62	1.7%
會	60	1.6%
朴	56	1.5%
韓	49	1.3%
硏	43	1.2%
Other values (579)	2343	63.9%

Latin

Value	Count	Frequency (%)
J	79	6.7%
e	69	5.9%
S	57	4.8%
n	56	4.8%
r	52	4.4%
B	48	4.1%
C	47	4.0%
A	44	3.7%
K	43	3.7%
E	43	3.7%
Other values (37)	640	54.3%

Common

Value	Count	Frequency (%)
	22213	80.5%
;	2611	9.5%
,	1449	5.3%
.	541	2.0%
]	203	0.7%
[	202	0.7%
·	73	0.3%
_	73	0.3%
(	70	0.3%
)	70	0.3%
Other values (19)	84	0.3%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	72262	69.0%
ASCII	28691	27.4%
CJK	3532	3.4%
CJK Compat Ideographs	137	0.1%
None	76	0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	22213	77.4%
;	2611	9.1%
,	1449	5.1%
.	541	1.9%
]	203	0.7%
[	202	0.7%
J	79	0.3%
_	73	0.3%
(	70	0.2%
)	70	0.2%
Other values (62)	1180	4.1%

Hangul

Value	Count	Frequency (%)
지	6630	9.2%
음	6277	8.7%
김	3628	5.0%
이	2221	3.1%
옮	1809	2.5%
스	1004	1.4%
정	991	1.4%
저	876	1.2%
영	860	1.2%
편	783	1.1%
Other values (815)	47183	65.3%

CJK

Value	Count	Frequency (%)
著	484	13.7%
編	170	4.8%
金	157	4.4%
譯	151	4.3%
國	62	1.8%
會	60	1.7%
朴	56	1.6%
韓	49	1.4%
硏	43	1.2%
文	41	1.2%
Other values (557)	2259	64.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
李	94	68.6%
烈	6	4.4%
柳	5	3.6%
林	4	2.9%
劉	4	2.9%
龍	4	2.9%
廉	2	1.5%
聯	2	1.5%
歷	2	1.5%
沈	2	1.5%
Other values (12)	12	8.8%

None

Value	Count	Frequency (%)
·	73	96.1%
〉	1	1.3%
〈	1	1.3%
．	1	1.3%

발행자
Text

Distinct	3178
Distinct (%)	31.8%
Missing	3
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	47
Median length	38
Mean length	4.4886466
Min length	1

Characters and Unicode

Total characters	44873
Distinct characters	978
Distinct categories	10 ?
Distinct scripts	5 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1936 ?
Unique (%)	19.4%

Sample

1st row	동해출판
2nd row	博英社
3rd row	시공주니어
4th row	전라남도
5th row	서울대학교출판부

Value	Count	Frequency (%)
박영사	151	1.4%
김영사	133	1.3%
문학동네	109	1.0%
전라남도지방공무원교육원	103	1.0%
위즈덤하우스	94	0.9%
민음사	90	0.9%
고려원	83	0.8%
전라남도	83	0.8%
한길사	81	0.8%
법문사	72	0.7%
Other values (3233)	9432	90.4%

Most occurring characters

Value	Count	Frequency (%)
사	3195	7.1%
문	1425	3.2%
스	1083	2.4%
판	946	2.1%
출	923	2.1%
원	817	1.8%
학	676	1.5%
화	643	1.4%
북	637	1.4%
한	609	1.4%
Other values (968)	33919	75.6%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	42420	94.5%
Lowercase Letter	654	1.5%
Uppercase Letter	581	1.3%
Space Separator	442	1.0%
Decimal Number	209	0.5%
Close Punctuation	190	0.4%
Open Punctuation	189	0.4%
Connector Punctuation	108	0.2%
Other Punctuation	78	0.2%
Dash Punctuation	2	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
사	3195	7.5%
문	1425	3.4%
스	1083	2.6%
판	946	2.2%
출	923	2.2%
원	817	1.9%
학	676	1.6%
화	643	1.5%
북	637	1.5%
한	609	1.4%
Other values (898)	31466	74.2%

Uppercase Letter

Value	Count	Frequency (%)
B	95	16.4%
M	64	11.0%
H	48	8.3%
P	47	8.1%
K	43	7.4%
O	34	5.9%
C	30	5.2%
R	28	4.8%
S	28	4.8%
I	25	4.3%
Other values (14)	139	23.9%

Lowercase Letter

Value	Count	Frequency (%)
o	121	18.5%
n	59	9.0%
e	56	8.6%
i	54	8.3%
k	44	6.7%
s	43	6.6%
a	39	6.0%
b	31	4.7%
r	30	4.6%
u	26	4.0%
Other values (13)	151	23.1%

Decimal Number

Value	Count	Frequency (%)
2	94	45.0%
1	90	43.1%
0	13	6.2%
3	5	2.4%
8	2	1.0%
9	2	1.0%
4	2	1.0%
7	1	0.5%

Other Punctuation

Value	Count	Frequency (%)
&	27	34.6%
·	21	26.9%
.	10	12.8%
＆	10	12.8%
@	4	5.1%
/	3	3.8%
,	2	2.6%
;	1	1.3%

Open Punctuation

Value	Count	Frequency (%)
(	146	77.2%
[	43	22.8%

Close Punctuation

Value	Count	Frequency (%)
)	146	76.8%
]	44	23.2%

Space Separator

Value	Count	Frequency (%)
	442	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	108	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	2	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	39326	87.6%
Han	3088	6.9%
Latin	1235	2.8%
Common	1218	2.7%
Katakana	6	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
사	3195	8.1%
문	1425	3.6%
스	1083	2.8%
판	946	2.4%
출	923	2.3%
원	817	2.1%
학	676	1.7%
화	643	1.6%
북	637	1.6%
한	609	1.5%
Other values (609)	28372	72.1%

Han

Value	Count	Frequency (%)
社	493	16.0%
文	214	6.9%
出	94	3.0%
版	94	3.0%
學	90	2.9%
英	72	2.3%
化	68	2.2%
博	57	1.8%
國	55	1.8%
堂	49	1.6%
Other values (273)	1802	58.4%

Latin

Value	Count	Frequency (%)
o	121	9.8%
B	95	7.7%
M	64	5.2%
n	59	4.8%
e	56	4.5%
i	54	4.4%
H	48	3.9%
P	47	3.8%
k	44	3.6%
K	43	3.5%
Other values (37)	604	48.9%

Common

Value	Count	Frequency (%)
	442	36.3%
(	146	12.0%
)	146	12.0%
_	108	8.9%
2	94	7.7%
1	90	7.4%
]	44	3.6%
[	43	3.5%
&	27	2.2%
·	21	1.7%
Other values (13)	57	4.7%

Katakana

Value	Count	Frequency (%)
ダ	1	16.7%
イ	1	16.7%
ヤ	1	16.7%
モ	1	16.7%
ン	1	16.7%
ド	1	16.7%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	39323	87.6%
CJK	3072	6.8%
ASCII	2422	5.4%
None	31	0.1%
CJK Compat Ideographs	16	< 0.1%
Katakana	6	< 0.1%
Compat Jamo	3	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
사	3195	8.1%
문	1425	3.6%
스	1083	2.8%
판	946	2.4%
출	923	2.3%
원	817	2.1%
학	676	1.7%
화	643	1.6%
북	637	1.6%
한	609	1.5%
Other values (607)	28369	72.1%

CJK

Value	Count	Frequency (%)
社	493	16.0%
文	214	7.0%
出	94	3.1%
版	94	3.1%
學	90	2.9%
英	72	2.3%
化	68	2.2%
博	57	1.9%
國	55	1.8%
堂	49	1.6%
Other values (267)	1786	58.1%

ASCII

Value	Count	Frequency (%)
	442	18.2%
(	146	6.0%
)	146	6.0%
o	121	5.0%
_	108	4.5%
B	95	3.9%
2	94	3.9%
1	90	3.7%
M	64	2.6%
n	59	2.4%
Other values (58)	1057	43.6%

None

Value	Count	Frequency (%)
·	21	67.7%
＆	10	32.3%

CJK Compat Ideographs

Value	Count	Frequency (%)
良	10	62.5%
女	2	12.5%
綠	1	6.2%
栗	1	6.2%
林	1	6.2%
聯	1	6.2%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	2	66.7%
ㅅ	1	33.3%

Katakana

Value	Count	Frequency (%)
ダ	1	16.7%
イ	1	16.7%
ヤ	1	16.7%
モ	1	16.7%
ン	1	16.7%
ド	1	16.7%

발행년도
Text

Distinct	72
Distinct (%)	0.7%
Missing	1
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	6
Median length	4
Mean length	4.0008001
Min length	3

Characters and Unicode

Total characters	40004
Distinct characters	13
Distinct categories	4 ?
Distinct scripts	1 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	11 ?
Unique (%)	0.1%

Sample

1st row	2011
2nd row	1992
3rd row	2004
4th row	1984
5th row	1988

Value	Count	Frequency (%)
1988	542	5.4%
1986	474	4.7%
1989	465	4.7%
1987	406	4.1%
1990	395	4.0%
2009	331	3.3%
2021	327	3.3%
1991	314	3.1%
1993	299	3.0%
2010	292	2.9%
Other values (57)	6154	61.5%

Most occurring characters

Value	Count	Frequency (%)
9	8541	21.4%
1	8435	21.1%
0	7560	18.9%
2	6570	16.4%
8	4001	10.0%
7	1273	3.2%
6	1031	2.6%
3	1021	2.6%
4	816	2.0%
5	747	1.9%
Other values (3)	9	< 0.1%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	39995	> 99.9%
Open Punctuation	4	< 0.1%
Close Punctuation	4	< 0.1%
Other Punctuation	1	< 0.1%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
9	8541	21.4%
1	8435	21.1%
0	7560	18.9%
2	6570	16.4%
8	4001	10.0%
7	1273	3.2%
6	1031	2.6%
3	1021	2.6%
4	816	2.0%
5	747	1.9%

Open Punctuation

Value	Count	Frequency (%)
[	4	100.0%

Close Punctuation

Value	Count	Frequency (%)
]	4	100.0%

Other Punctuation

Value	Count	Frequency (%)
,	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	40004	100.0%

Most frequent character per script

Common

Value	Count	Frequency (%)
9	8541	21.4%
1	8435	21.1%
0	7560	18.9%
2	6570	16.4%
8	4001	10.0%
7	1273	3.2%
6	1031	2.6%
3	1021	2.6%
4	816	2.0%
5	747	1.9%
Other values (3)	9	< 0.1%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	40004	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
9	8541	21.4%
1	8435	21.1%
0	7560	18.9%
2	6570	16.4%
8	4001	10.0%
7	1273	3.2%
6	1031	2.6%
3	1021	2.6%
4	816	2.0%
5	747	1.9%
Other values (3)	9	< 0.1%

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	등록번호	서명	저작자	발행자	발행년도
17921	IM0000020309	꿈꾸는 씨앗_영혼을 위한 101가지 이야기	브라이언 카바노프지음 ; 주연진 옮김	동해출판	2011
8159	IM0000008326	主觀式勞動法演習	金致善	博英社	1992
26076	IM0000028565	세라 이야기	프랜시스 호즈슨 버넷 글 ; 타샤 튜더 그림 ; 햇살과 나무꾼 옮김	시공주니어	2004
30433	PA0000000252	全南水産	全羅南道編.	전라남도	1984
7331	IM0000007262	서양문화사	문석홍 지음	서울대학교출판부	1988
25349	IM0000027837	은행의 사생활_서민들만 모르는 은행거래의 비밀	박혜정 지음	다산북스	2009
22164	IM0000024642	우리가 있기에 내가 있습니다_world culture open	홍석현	쌤앤파커스	2016
29515	IM0000032046	살인자의 쇼핑목록	강지영 지음	네오픽션	2022
4989	IM0000004810	현대사상과비평. 7	김형석 지음	민주원사	1981
29794	IM0000032325	골린이 4주 만에 필드 나가기_골프장 부킹부터 용품, 스윙 방법, 점수 계산까지	김정락	황금부엉이	2022

	등록번호	서명	저작자	발행자	발행년도
9268	IM0000010610	革命이데올로기와 葛藤_ 思想·運動·體系·歷史	金永俊著	亞細亞文化社	1982
21093	IM0000023547	마르크스의 역사적 유물론과 인간론	김창호 지음	竹山	1991
9198	IM0000010482	자유의조건. 2	아르만도 발라다레스 저 ; 정성호 역	나남	1987
9014	IM0000010247	성냥갑속의 여자	신달자 지음	자유문학사	1993
21007	IM0000023458	잠 도둑들	스탠리 코렌 지음 ; 안인희 옮김	황금가지	1997
3082	IM0000002847	외국의 지방재정조정제도, 연구자료집	한국지방행정연구원 지음	한국지방행정연구원	1997
30264	PA0000000083	(2012년도) 교육훈련계획. 2012	전라남도지방공무원교육원 편	전라남도지방공무원교육원	2012
4816	IM0000004635	국역동문선. 4	민족문화추진회 지음	민족문화추진회	1986
5737	IM0000005625	대한국사. 12	이경근 지음	신태양사	1973
20445	IM0000022881	(구조조정기의)국가와 노동	최영기, 이장원 편저	나무와 숲	1998

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Decimal Number

Uppercase Letter

Most occurring scripts

Most frequent character per script

Common

Latin

Most occurring blocks

Most frequent character per block

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Math Symbol

Close Punctuation

Open Punctuation

Letter Number

Other Symbol

Space Separator

Connector Punctuation

Dash Punctuation

Modifier Symbol

Initial Punctuation

Final Punctuation

Other Number

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Hiragana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

CJK

None

CJK Compat Ideographs

Number Forms

Punctuation

Compat Jamo

Hiragana

Misc Symbols

Enclosed Alphanum

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Decimal Number

Other Punctuation

Close Punctuation

Open Punctuation

Math Symbol

Space Separator

Connector Punctuation

Dash Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

CJK

CJK Compat Ideographs