gimi9 Pandas Profiling

Dataset statistics

Number of variables	8
Number of observations	10000
Missing cells	7
Missing cells (%)	< 0.1%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	712.9 KiB
Average record size in memory	73.0 B

Variable types

Categorical	2
Text	5
Numeric	1

Dataset

Description	대전광역시 유성구 진잠도서관에서 보유하고 있는 도서목록에 대한 데이터로 소장처, 자료실, 등록번호, 설명, 저자, 출판사, 출판년, 청구기호 등의 항목을 제공합니다.
Author	대전광역시 유성구
URL	https://www.data.go.kr/data/15053382/fileData.do

Alerts

`소장처` has constant value ""	Constant
`등록번호` has unique values	Unique

Reproduction

Analysis started	2023-12-12 21:19:57.287201
Analysis finished	2023-12-12 21:19:59.959304
Duration	2.67 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

소장처
Categorical

CONSTANT

Distinct	1
Distinct (%)	< 0.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

진잠도서관	10000

Length

Max length	5
Median length	5
Mean length	5
Min length	5

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	진잠도서관
2nd row	진잠도서관
3rd row	진잠도서관
4th row	진잠도서관
5th row	진잠도서관

Common Values

Value	Count	Frequency (%)
진잠도서관	10000	100.0%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
진잠도서관	10000	100.0%

자료실
Categorical

Distinct	2
Distinct (%)	< 0.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

어린이실	5471
종합자료실	4529

Length

Max length	5
Median length	4
Mean length	4.4529
Min length	4

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	종합자료실
2nd row	어린이실
3rd row	어린이실
4th row	종합자료실
5th row	어린이실

Common Values

Value	Count	Frequency (%)
어린이실	5471	54.7%
종합자료실	4529	45.3%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
어린이실	5471	54.7%
종합자료실	4529	45.3%

등록번호
Text

UNIQUE

Distinct	10000
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	8
Median length	8
Mean length	7.5319
Min length	4

Characters and Unicode

Total characters	75319
Distinct characters	13
Distinct categories	2 ?
Distinct scripts	2 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	10000 ?
Unique (%)	100.0%

Sample

1st row	CEM87950
2nd row	CEM82135
3rd row	CEM68971
4th row	EM23565
5th row	EM51941

Value	Count	Frequency (%)
cem87950	1	< 0.1%
em45939	1	< 0.1%
cem83597	1	< 0.1%
em42536	1	< 0.1%
cem84842	1	< 0.1%
cem71774	1	< 0.1%
cem66680	1	< 0.1%
cem86347	1	< 0.1%
cem62689	1	< 0.1%
em8584	1	< 0.1%
Other values (9990)	9990	99.9%

Most occurring characters

Value	Count	Frequency (%)
E	10000	13.3%
M	10000	13.3%
C	5656	7.5%
8	5426	7.2%
5	5309	7.0%
7	5287	7.0%
6	5264	7.0%
4	5080	6.7%
3	5011	6.7%
9	4959	6.6%
Other values (3)	13327	17.7%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	49663	65.9%
Uppercase Letter	25656	34.1%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
8	5426	10.9%
5	5309	10.7%
7	5287	10.6%
6	5264	10.6%
4	5080	10.2%
3	5011	10.1%
9	4959	10.0%
2	4920	9.9%
1	4511	9.1%
0	3896	7.8%

Uppercase Letter

Value	Count	Frequency (%)
E	10000	39.0%
M	10000	39.0%
C	5656	22.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	49663	65.9%
Latin	25656	34.1%

Most frequent character per script

Common

Value	Count	Frequency (%)
8	5426	10.9%
5	5309	10.7%
7	5287	10.6%
6	5264	10.6%
4	5080	10.2%
3	5011	10.1%
9	4959	10.0%
2	4920	9.9%
1	4511	9.1%
0	3896	7.8%

Latin

Value	Count	Frequency (%)
E	10000	39.0%
M	10000	39.0%
C	5656	22.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	75319	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
E	10000	13.3%
M	10000	13.3%
C	5656	7.5%
8	5426	7.2%
5	5309	7.0%
7	5287	7.0%
6	5264	7.0%
4	5080	6.7%
3	5011	6.7%
9	4959	6.6%
Other values (3)	13327	17.7%

서명
Text

Distinct	9861
Distinct (%)	98.6%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	134
Median length	80
Mean length	21.2187
Min length	1

Characters and Unicode

Total characters	212187
Distinct characters	1682
Distinct categories	17 ?
Distinct scripts	7 ?
Distinct blocks	13 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	9732 ?
Unique (%)	97.3%

Sample

1st row	베토벤 : 절망의 심연에서 불러낸 환희의 선율 = Ludwig Van Beethoven
2nd row	Shirley homes and the lithuanian case
3rd row	우리 모두 이웃이야! :서로 친친! 지구 마을 사람들
4th row	(네이피어가 들려주는) 로그 이야기
5th row	Bambi`s Hide-and-Seek

Value	Count	Frequency (%)
	3911	7.1%
이야기	526	1.0%
the	304	0.6%
장편소설	301	0.5%
1	287	0.5%
위한	273	0.5%
2	267	0.5%
우리	198	0.4%
내	173	0.3%
나는	138	0.2%
Other values (22376)	48840	88.4%

Most occurring characters

Value	Count	Frequency (%)
	46916	22.1%
:	3823	1.8%
이	3801	1.8%
의	3722	1.8%
는	2867	1.4%
기	2231	1.1%
e	2023	1.0%
가	2014	0.9%
리	1830	0.9%
한	1795	0.8%
Other values (1672)	141165	66.5%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	129448	61.0%
Space Separator	46916	22.1%
Lowercase Letter	17295	8.2%
Other Punctuation	7945	3.7%
Decimal Number	3688	1.7%
Uppercase Letter	2848	1.3%
Open Punctuation	1655	0.8%
Close Punctuation	1655	0.8%
Math Symbol	486	0.2%
Dash Punctuation	174	0.1%
Other values (7)	77	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
이	3801	2.9%
의	3722	2.9%
는	2867	2.2%
기	2231	1.7%
가	2014	1.6%
리	1830	1.4%
한	1795	1.4%
사	1731	1.3%
지	1696	1.3%
아	1660	1.3%
Other values (1521)	106101	82.0%

Lowercase Letter

Value	Count	Frequency (%)
e	2023	11.7%
a	1485	8.6%
o	1436	8.3%
n	1335	7.7%
t	1333	7.7%
i	1259	7.3%
r	1196	6.9%
s	1073	6.2%
h	841	4.9%
l	692	4.0%
Other values (45)	4622	26.7%

Uppercase Letter

Value	Count	Frequency (%)
T	310	10.9%
S	272	9.6%
A	192	6.7%
C	191	6.7%
M	163	5.7%
I	154	5.4%
D	143	5.0%
B	143	5.0%
E	133	4.7%
H	123	4.3%
Other values (25)	1024	36.0%

Other Punctuation

Value	Count	Frequency (%)
:	3823	48.1%
,	1787	22.5%
.	1322	16.6%
!	635	8.0%
·	149	1.9%
'	107	1.3%
＆	23	0.3%
&	19	0.2%
%	16	0.2%
！	15	0.2%
Other values (11)	49	0.6%

Decimal Number

Value	Count	Frequency (%)
1	998	27.1%
0	645	17.5%
2	626	17.0%
3	402	10.9%
4	262	7.1%
5	237	6.4%
6	144	3.9%
7	134	3.6%
9	125	3.4%
8	115	3.1%

Math Symbol

Value	Count	Frequency (%)
=	416	85.6%
~	40	8.2%
+	17	3.5%
｜	5	1.0%
×	3	0.6%
<	2	0.4%
>	2	0.4%
∼	1	0.2%

Open Punctuation

Value	Count	Frequency (%)
(	1571	94.9%
[	72	4.4%
「	5	0.3%
『	4	0.2%
《	3	0.2%

Close Punctuation

Value	Count	Frequency (%)
)	1571	94.9%
]	72	4.4%
」	5	0.3%
』	4	0.2%
》	3	0.2%

Dash Punctuation

Value	Count	Frequency (%)
-	173	99.4%
―	1	0.6%

Modifier Symbol

Value	Count	Frequency (%)
`	44	84.6%
´	8	15.4%

Letter Number

Value	Count	Frequency (%)
Ⅰ	5	71.4%
Ⅱ	2	28.6%

Space Separator

Value	Count	Frequency (%)
	46916	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	7	100.0%

Format

Value	Count	Frequency (%)
	4	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	4	100.0%

Other Symbol

Value	Count	Frequency (%)
★	2	100.0%

Connector Punctuation

Value	Count	Frequency (%)
＿	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	129068	60.8%
Common	62589	29.5%
Latin	19877	9.4%
Cyrillic	273	0.1%
Han	262	0.1%
Hiragana	104	< 0.1%
Katakana	14	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
이	3801	2.9%
의	3722	2.9%
는	2867	2.2%
기	2231	1.7%
가	2014	1.6%
리	1830	1.4%
한	1795	1.4%
사	1731	1.3%
지	1696	1.3%
아	1660	1.3%
Other values (1293)	105721	81.9%

Han

Value	Count	Frequency (%)
小	11	4.2%
的	5	1.9%
上	5	1.9%
神	5	1.9%
德	4	1.5%
史	4	1.5%
事	4	1.5%
新	4	1.5%
中	4	1.5%
女	4	1.5%
Other values (163)	212	80.9%

Common

Value	Count	Frequency (%)
	46916	75.0%
:	3823	6.1%
,	1787	2.9%
(	1571	2.5%
)	1571	2.5%
.	1322	2.1%
1	998	1.6%
0	645	1.0%
!	635	1.0%
2	626	1.0%
Other values (49)	2695	4.3%

Latin

Value	Count	Frequency (%)
e	2023	10.2%
a	1485	7.5%
o	1436	7.2%
n	1335	6.7%
t	1333	6.7%
i	1259	6.3%
r	1196	6.0%
s	1073	5.4%
h	841	4.2%
l	692	3.5%
Other values (46)	7204	36.2%

Hiragana

Value	Count	Frequency (%)
い	6	5.8%
と	6	5.8%
っ	5	4.8%
た	5	4.8%
の	5	4.8%
て	5	4.8%
か	4	3.8%
け	4	3.8%
な	4	3.8%
る	4	3.8%
Other values (34)	56	53.8%

Cyrillic

Value	Count	Frequency (%)
а	33	12.1%
о	27	9.9%
н	24	8.8%
г	19	7.0%
э	17	6.2%
л	16	5.9%
р	14	5.1%
д	14	5.1%
и	9	3.3%
к	8	2.9%
Other values (26)	92	33.7%

Katakana

Value	Count	Frequency (%)
マ	3	21.4%
パ	2	14.3%
ス	1	7.1%
ド	1	7.1%
バ	1	7.1%
イ	1	7.1%
ア	1	7.1%
ピ	1	7.1%
ッ	1	7.1%
ハ	1	7.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	129046	60.8%
ASCII	82183	38.7%
Cyrillic	273	0.1%
None	255	0.1%
CJK	255	0.1%
Hiragana	104	< 0.1%
Compat Jamo	22	< 0.1%
Punctuation	18	< 0.1%
Katakana	14	< 0.1%
Number Forms	7	< 0.1%
Other values (3)	10	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	46916	57.1%
:	3823	4.7%
e	2023	2.5%
,	1787	2.2%
(	1571	1.9%
)	1571	1.9%
a	1485	1.8%
o	1436	1.7%
n	1335	1.6%
t	1333	1.6%
Other values (75)	18903	23.0%

Hangul

Value	Count	Frequency (%)
이	3801	2.9%
의	3722	2.9%
는	2867	2.2%
기	2231	1.7%
가	2014	1.6%
리	1830	1.4%
한	1795	1.4%
사	1731	1.3%
지	1696	1.3%
아	1660	1.3%
Other values (1286)	105699	81.9%

None

Value	Count	Frequency (%)
·	149	58.4%
＆	23	9.0%
！	15	5.9%
´	8	3.1%
％	6	2.4%
｜	5	2.0%
＇	5	2.0%
」	5	2.0%
「	5	2.0%
đ	4	1.6%
Other values (12)	30	11.8%

Cyrillic

Value	Count	Frequency (%)
а	33	12.1%
о	27	9.9%
н	24	8.8%
г	19	7.0%
э	17	6.2%
л	16	5.9%
р	14	5.1%
д	14	5.1%
и	9	3.3%
к	8	2.9%
Other values (26)	92	33.7%

CJK

Value	Count	Frequency (%)
小	11	4.3%
的	5	2.0%
上	5	2.0%
神	5	2.0%
德	4	1.6%
史	4	1.6%
事	4	1.6%
新	4	1.6%
中	4	1.6%
川	3	1.2%
Other values (160)	206	80.8%

Punctuation

Value	Count	Frequency (%)
’	7	38.9%
…	6	33.3%
‘	4	22.2%
―	1	5.6%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	6	27.3%
ㅅ	5	22.7%
ㅋ	4	18.2%
ㄷ	2	9.1%
ㄴ	2	9.1%
ㄱ	2	9.1%
ㅁ	1	4.5%

Hiragana

Value	Count	Frequency (%)
い	6	5.8%
と	6	5.8%
っ	5	4.8%
た	5	4.8%
の	5	4.8%
て	5	4.8%
か	4	3.8%
け	4	3.8%
な	4	3.8%
る	4	3.8%
Other values (34)	56	53.8%

Number Forms

Value	Count	Frequency (%)
Ⅰ	5	71.4%
Ⅱ	2	28.6%

CJK Compat Ideographs

Value	Count	Frequency (%)
女	4	57.1%
歷	2	28.6%
金	1	14.3%

Katakana

Value	Count	Frequency (%)
マ	3	21.4%
パ	2	14.3%
ス	1	7.1%
ド	1	7.1%
バ	1	7.1%
イ	1	7.1%
ア	1	7.1%
ピ	1	7.1%
ッ	1	7.1%
ハ	1	7.1%

Misc Symbols

Value	Count	Frequency (%)
★	2	100.0%

Math Operators

Value	Count	Frequency (%)
∼	1	100.0%

저자
Text

Distinct	8328
Distinct (%)	83.3%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	138
Median length	105
Mean length	11.3602
Min length	2

Characters and Unicode

Total characters	113602
Distinct characters	1185
Distinct categories	14 ?
Distinct scripts	7 ?
Distinct blocks	11 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	7379 ?
Unique (%)	73.8%

Sample

1st row	최은규
2nd row	Bassett, Jennifer
3rd row	김성은
4th row	김승태 지음
5th row	by Andrea Posner-Sanchez ; illustrated by Isidre Mones

Value	Count	Frequency (%)
	4239	13.0%
지음	1845	5.6%
그림	1829	5.6%
글	1424	4.4%
옮김	1374	4.2%
by	372	1.1%
글·그림	146	0.4%
엮음	130	0.4%
illustrated	107	0.3%
외	79	0.2%
Other values (11291)	21121	64.7%

Most occurring characters

Value	Count	Frequency (%)
	23681	20.8%
;	4220	3.7%
김	3132	2.8%
이	2608	2.3%
지	2567	2.3%
그	2246	2.0%
림	2134	1.9%
음	2048	1.8%
,	1853	1.6%
글	1734	1.5%
Other values (1175)	67379	59.3%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	68479	60.3%
Space Separator	23681	20.8%
Lowercase Letter	11494	10.1%
Other Punctuation	7016	6.2%
Uppercase Letter	2177	1.9%
Open Punctuation	328	0.3%
Close Punctuation	326	0.3%
Dash Punctuation	56	< 0.1%
Decimal Number	26	< 0.1%
Math Symbol	13	< 0.1%
Other values (4)	6	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
김	3132	4.6%
이	2608	3.8%
지	2567	3.7%
그	2246	3.3%
림	2134	3.1%
음	2048	3.0%
글	1734	2.5%
옮	1427	2.1%
스	1323	1.9%
정	1178	1.7%
Other values (1042)	48082	70.2%

Lowercase Letter

Value	Count	Frequency (%)
e	1196	10.4%
a	1160	10.1%
n	965	8.4%
r	924	8.0%
i	878	7.6%
l	796	6.9%
t	745	6.5%
o	713	6.2%
y	621	5.4%
s	542	4.7%
Other values (46)	2954	25.7%

Uppercase Letter

Value	Count	Frequency (%)
S	225	10.3%
M	194	8.9%
J	176	8.1%
B	154	7.1%
R	138	6.3%
A	133	6.1%
L	127	5.8%
C	113	5.2%
D	107	4.9%
K	94	4.3%
Other values (35)	716	32.9%

Other Punctuation

Value	Count	Frequency (%)
;	4220	60.1%
,	1853	26.4%
.	386	5.5%
:	326	4.6%
·	204	2.9%
&	11	0.2%
'	7	0.1%
/	6	0.1%
＆	2	< 0.1%
＇	1	< 0.1%

Decimal Number

Value	Count	Frequency (%)
3	6	23.1%
0	6	23.1%
2	5	19.2%
1	5	19.2%
9	1	3.8%
8	1	3.8%
4	1	3.8%
7	1	3.8%

Open Punctuation

Value	Count	Frequency (%)
[	210	64.0%
(	116	35.4%
〈	2	0.6%

Close Punctuation

Value	Count	Frequency (%)
]	210	64.4%
)	115	35.3%
〉	1	0.3%

Math Symbol

Value	Count	Frequency (%)
>	7	53.8%
<	6	46.2%

Space Separator

Value	Count	Frequency (%)
	23681	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	56	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	3	100.0%

Other Symbol

Value	Count	Frequency (%)
ⓔ	1	100.0%

Letter Number

Value	Count	Frequency (%)
Ⅳ	1	100.0%

Currency Symbol

Value	Count	Frequency (%)
$	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	68237	60.1%
Common	31451	27.7%
Latin	13439	11.8%
Cyrillic	233	0.2%
Han	188	0.2%
Hiragana	41	< 0.1%
Katakana	13	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
김	3132	4.6%
이	2608	3.8%
지	2567	3.8%
그	2246	3.3%
림	2134	3.1%
음	2048	3.0%
글	1734	2.5%
옮	1427	2.1%
스	1323	1.9%
정	1178	1.7%
Other values (871)	47840	70.1%

Han

Value	Count	Frequency (%)
著	14	7.4%
文	6	3.2%
德	5	2.7%
尼	4	2.1%
子	3	1.6%
金	3	1.6%
斯	3	1.6%
里	3	1.6%
克	3	1.6%
英	3	1.6%
Other values (117)	141	75.0%

Latin

Value	Count	Frequency (%)
e	1196	8.9%
a	1160	8.6%
n	965	7.2%
r	924	6.9%
i	878	6.5%
l	796	5.9%
t	745	5.5%
o	713	5.3%
y	621	4.6%
s	542	4.0%
Other values (44)	4899	36.5%

Cyrillic

Value	Count	Frequency (%)
а	28	12.0%
н	20	8.6%
и	19	8.2%
р	17	7.3%
о	16	6.9%
л	11	4.7%
с	9	3.9%
д	8	3.4%
г	8	3.4%
э	7	3.0%
Other values (38)	90	38.6%

Common

Value	Count	Frequency (%)
	23681	75.3%
;	4220	13.4%
,	1853	5.9%
.	386	1.2%
:	326	1.0%
[	210	0.7%
]	210	0.7%
·	204	0.6%
(	116	0.4%
)	115	0.4%
Other values (21)	130	0.4%

Hiragana

Value	Count	Frequency (%)
い	4	9.8%
う	2	4.9%
た	2	4.9%
こ	2	4.9%
え	2	4.9%
か	2	4.9%
つ	2	4.9%
さ	2	4.9%
お	1	2.4%
で	1	2.4%
Other values (21)	21	51.2%

Katakana

Value	Count	Frequency (%)
タ	1	7.7%
レ	1	7.7%
オ	1	7.7%
ニ	1	7.7%
ド	1	7.7%
ゴ	1	7.7%
ア	1	7.7%
ク	1	7.7%
ヤ	1	7.7%
ト	1	7.7%
Other values (3)	3	23.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	68210	60.0%
ASCII	44677	39.3%
Cyrillic	233	0.2%
None	211	0.2%
CJK	185	0.2%
Hiragana	41	< 0.1%
Compat Jamo	27	< 0.1%
Katakana	13	< 0.1%
CJK Compat Ideographs	3	< 0.1%
Enclosed Alphanum	1	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	23681	53.0%
;	4220	9.4%
,	1853	4.1%
e	1196	2.7%
a	1160	2.6%
n	965	2.2%
r	924	2.1%
i	878	2.0%
l	796	1.8%
t	745	1.7%
Other values (67)	8259	18.5%

Hangul

Value	Count	Frequency (%)
김	3132	4.6%
이	2608	3.8%
지	2567	3.8%
그	2246	3.3%
림	2134	3.1%
음	2048	3.0%
글	1734	2.5%
옮	1427	2.1%
스	1323	1.9%
정	1178	1.7%
Other values (868)	47813	70.1%

None

Value	Count	Frequency (%)
·	204	96.7%
〈	2	0.9%
＆	2	0.9%
ø	1	0.5%
＇	1	0.5%
〉	1	0.5%

Cyrillic

Value	Count	Frequency (%)
а	28	12.0%
н	20	8.6%
и	19	8.2%
р	17	7.3%
о	16	6.9%
л	11	4.7%
с	9	3.9%
д	8	3.4%
г	8	3.4%
э	7	3.0%
Other values (38)	90	38.6%

CJK

Value	Count	Frequency (%)
著	14	7.6%
文	6	3.2%
德	5	2.7%
尼	4	2.2%
子	3	1.6%
金	3	1.6%
斯	3	1.6%
里	3	1.6%
克	3	1.6%
英	3	1.6%
Other values (115)	138	74.6%

Compat Jamo

Value	Count	Frequency (%)
ㅋ	12	44.4%
ㅅ	12	44.4%
ㆍ	3	11.1%

Hiragana

Value	Count	Frequency (%)
い	4	9.8%
う	2	4.9%
た	2	4.9%
こ	2	4.9%
え	2	4.9%
か	2	4.9%
つ	2	4.9%
さ	2	4.9%
お	1	2.4%
で	1	2.4%
Other values (21)	21	51.2%

CJK Compat Ideographs

Value	Count	Frequency (%)
李	2	66.7%
沈	1	33.3%

Katakana

Value	Count	Frequency (%)
タ	1	7.7%
レ	1	7.7%
オ	1	7.7%
ニ	1	7.7%
ド	1	7.7%
ゴ	1	7.7%
ア	1	7.7%
ク	1	7.7%
ヤ	1	7.7%
ト	1	7.7%
Other values (3)	3	23.1%

Enclosed Alphanum

Value	Count	Frequency (%)
ⓔ	1	100.0%

Number Forms

Value	Count	Frequency (%)
Ⅳ	1	100.0%

출판사
Text

Distinct	2485
Distinct (%)	24.9%
Missing	2
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	54
Median length	40
Mean length	4.824965
Min length	1

Characters and Unicode

Total characters	48240
Distinct characters	793
Distinct categories	11 ?
Distinct scripts	6 ?
Distinct blocks	6 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1333 ?
Unique (%)	13.3%

Sample

1st row	아르테
2nd row	Oxford University Press
3rd row	토토북
4th row	자음과모음
5th row	Moonjinmedia

Value	Count	Frequency (%)
비룡소	196	1.8%
시공주니어	178	1.7%
문학동네	177	1.6%
창비	175	1.6%
주니어김영사	96	0.9%
김영사	95	0.9%
아이세움	95	0.9%
books	85	0.8%
자음과모음	85	0.8%
위즈덤하우스	82	0.8%
Other values (2522)	9489	88.2%

Most occurring characters

Value	Count	Frequency (%)
사	1473	3.1%
스	1422	2.9%
이	1239	2.6%
북	1120	2.3%
어	1100	2.3%
o	926	1.9%
	755	1.6%
아	696	1.4%
s	684	1.4%
e	673	1.4%
Other values (783)	38152	79.1%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	37911	78.6%
Lowercase Letter	7184	14.9%
Uppercase Letter	1915	4.0%
Space Separator	755	1.6%
Decimal Number	158	0.3%
Other Punctuation	133	0.3%
Open Punctuation	83	0.2%
Close Punctuation	82	0.2%
Dash Punctuation	10	< 0.1%
Modifier Symbol	7	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
사	1473	3.9%
스	1422	3.8%
이	1239	3.3%
북	1120	3.0%
어	1100	2.9%
아	696	1.8%
비	610	1.6%
문	583	1.5%
니	582	1.5%
리	568	1.5%
Other values (674)	28518	75.2%

Lowercase Letter

Value	Count	Frequency (%)
o	926	12.9%
s	684	9.5%
e	673	9.4%
i	561	7.8%
a	548	7.6%
n	542	7.5%
r	528	7.3%
t	292	4.1%
l	289	4.0%
d	260	3.6%
Other values (34)	1881	26.2%

Uppercase Letter

Value	Count	Frequency (%)
B	233	12.2%
H	179	9.3%
P	153	8.0%
S	150	7.8%
C	147	7.7%
M	137	7.2%
R	122	6.4%
O	112	5.8%
T	93	4.9%
K	93	4.9%
Other values (25)	496	25.9%

Other Punctuation

Value	Count	Frequency (%)
&	29	21.8%
＆	24	18.0%
.	21	15.8%
'	18	13.5%
,	11	8.3%
·	11	8.3%
;	7	5.3%
#	6	4.5%
:	3	2.3%
/	1	0.8%
Other values (2)	2	1.5%

Decimal Number

Value	Count	Frequency (%)
1	67	42.4%
2	62	39.2%
0	10	6.3%
3	8	5.1%
4	3	1.9%
6	3	1.9%
8	2	1.3%
7	2	1.3%
5	1	0.6%

Open Punctuation

Value	Count	Frequency (%)
(	78	94.0%
[	5	6.0%

Close Punctuation

Value	Count	Frequency (%)
)	78	95.1%
]	4	4.9%

Math Symbol

Value	Count	Frequency (%)
+	1	50.0%
\|	1	50.0%

Space Separator

Value	Count	Frequency (%)
	755	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	10	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	7	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	37777	78.3%
Latin	9019	18.7%
Common	1230	2.5%
Han	128	0.3%
Cyrillic	80	0.2%
Katakana	6	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
사	1473	3.9%
스	1422	3.8%
이	1239	3.3%
북	1120	3.0%
어	1100	2.9%
아	696	1.8%
비	610	1.6%
문	583	1.5%
니	582	1.5%
리	568	1.5%
Other values (618)	28384	75.1%

Latin

Value	Count	Frequency (%)
o	926	10.3%
s	684	7.6%
e	673	7.5%
i	561	6.2%
a	548	6.1%
n	542	6.0%
r	528	5.9%
t	292	3.2%
l	289	3.2%
d	260	2.9%
Other values (42)	3716	41.2%

Han

Value	Count	Frequency (%)
社	19	14.8%
版	15	11.7%
出	15	11.7%
吉	6	4.7%
林	6	4.7%
美	5	3.9%
文	3	2.3%
北	3	2.3%
京	3	2.3%
民	3	2.3%
Other values (40)	50	39.1%

Common

Value	Count	Frequency (%)
	755	61.4%
(	78	6.3%
)	78	6.3%
1	67	5.4%
2	62	5.0%
&	29	2.4%
＆	24	2.0%
.	21	1.7%
'	18	1.5%
,	11	0.9%
Other values (20)	87	7.1%

Cyrillic

Value	Count	Frequency (%)
с	10	12.5%
н	8	10.0%
а	7	8.8%
е	7	8.8%
р	6	7.5%
т	4	5.0%
к	4	5.0%
п	3	3.8%
э	3	3.8%
И	3	3.8%
Other values (17)	25	31.2%

Katakana

Value	Count	Frequency (%)
ポ	1	16.7%
プ	1	16.7%
ラ	1	16.7%
ニ	1	16.7%
ュ	1	16.7%
ス	1	16.7%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	37777	78.3%
ASCII	10213	21.2%
CJK	128	0.3%
Cyrillic	80	0.2%
None	36	0.1%
Katakana	6	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
사	1473	3.9%
스	1422	3.8%
이	1239	3.3%
북	1120	3.0%
어	1100	2.9%
아	696	1.8%
비	610	1.6%
문	583	1.5%
니	582	1.5%
리	568	1.5%
Other values (618)	28384	75.1%

ASCII

Value	Count	Frequency (%)
o	926	9.1%
	755	7.4%
s	684	6.7%
e	673	6.6%
i	561	5.5%
a	548	5.4%
n	542	5.3%
r	528	5.2%
t	292	2.9%
l	289	2.8%
Other values (69)	4415	43.2%

None

Value	Count	Frequency (%)
＆	24	66.7%
·	11	30.6%
＇	1	2.8%

CJK

Value	Count	Frequency (%)
社	19	14.8%
版	15	11.7%
出	15	11.7%
吉	6	4.7%
林	6	4.7%
美	5	3.9%
文	3	2.3%
北	3	2.3%
京	3	2.3%
民	3	2.3%
Other values (40)	50	39.1%

Cyrillic

Value	Count	Frequency (%)
с	10	12.5%
н	8	10.0%
а	7	8.8%
е	7	8.8%
р	6	7.5%
т	4	5.0%
к	4	5.0%
п	3	3.8%
э	3	3.8%
И	3	3.8%
Other values (17)	25	31.2%

Katakana

Value	Count	Frequency (%)
ポ	1	16.7%
プ	1	16.7%
ラ	1	16.7%
ニ	1	16.7%
ュ	1	16.7%
ス	1	16.7%

출판년
Real number (ℝ)

Distinct	40
Distinct (%)	0.4%
Missing	5
Missing (%)	< 0.1%
Infinite	0
Infinite (%)	0.0%
Mean	2013.1859

Minimum	1958
Maximum	2022
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	166.0 KiB

Quantile statistics

Minimum	1958
5-th percentile	2003
Q1	2010
median	2014
Q3	2017
95-th percentile	2021
Maximum	2022
Range	64
Interquartile range (IQR)	7

Descriptive statistics

Standard deviation	5.4537792
Coefficient of variation (CV)	0.0027090291
Kurtosis	2.4880081
Mean	2013.1859
Median Absolute Deviation (MAD)	4
Skewness	-0.95990311
Sum	20121793
Variance	29.743707
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=40)

Value	Count	Frequency (%)
2017	770	7.7%
2016	731	7.3%
2010	731	7.3%
2011	730	7.3%
2015	688	6.9%
2012	652	6.5%
2019	641	6.4%
2013	595	5.9%
2018	578	5.8%
2014	560	5.6%
Other values (30)	3319	33.2%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
1958	1	< 0.1%
1980	1	< 0.1%
1981	4	< 0.1%
1984	2	< 0.1%
1986	1	< 0.1%
1987	1	< 0.1%
1989	2	< 0.1%
1990	4	< 0.1%
1991	11	0.1%
1992	4	< 0.1%

Value	Count	Frequency (%)
2022	175	1.8%
2021	460	4.6%
2020	477	4.8%
2019	641	6.4%
2018	578	5.8%
2017	770	7.7%
2016	731	7.3%
2015	688	6.9%
2014	560	5.6%
2013	595	5.9%

청구기호
Text

Distinct	9885
Distinct (%)	98.9%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	23
Median length	21
Mean length	12.5752
Min length	3

Characters and Unicode

Total characters	125752
Distinct characters	634
Distinct categories	9 ?
Distinct scripts	4 ?
Distinct blocks	4 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	9777 ?
Unique (%)	97.8%

Sample

1st row	082 클589ㅇ v.17
2nd row	808 O98o v.1-30
3rd row	331.5 김567ㅇ
4th row	410 수922ㅈ 39
5th row	747 F982m K-6

Value	Count	Frequency (%)
808.9	551	2.2%
843	482	1.9%
813.8	451	1.8%
c.2	341	1.4%
082	273	1.1%
2	246	1.0%
408	240	1.0%
813.7	238	0.9%
1	232	0.9%
808.91	231	0.9%
Other values (8451)	21855	86.9%

Most occurring characters

Value	Count	Frequency (%)
	15144	12.0%
8	12683	10.1%
1	10688	8.5%
3	9418	7.5%
.	9173	7.3%
9	7644	6.1%
2	7609	6.1%
4	7487	6.0%
5	6456	5.1%
7	5737	4.6%
Other values (624)	33713	26.8%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	78435	62.4%
Other Letter	18901	15.0%
Space Separator	15144	12.0%
Other Punctuation	9185	7.3%
Lowercase Letter	3106	2.5%
Uppercase Letter	546	0.4%
Dash Punctuation	427	0.3%
Open Punctuation	4	< 0.1%
Close Punctuation	4	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
ㅇ	1816	9.6%
ㅅ	1144	6.1%
ㄱ	910	4.8%
ㅎ	722	3.8%
ㅂ	687	3.6%
ㅈ	644	3.4%
이	644	3.4%
김	643	3.4%
ㄴ	595	3.1%
ㅁ	584	3.1%
Other values (564)	10512	55.6%

Uppercase Letter

Value	Count	Frequency (%)
B	73	13.4%
S	60	11.0%
M	52	9.5%
L	42	7.7%
P	41	7.5%
F	34	6.2%
C	31	5.7%
O	30	5.5%
N	26	4.8%
H	25	4.6%
Other values (13)	132	24.2%

Lowercase Letter

Value	Count	Frequency (%)
v	2185	70.3%
c	468	15.1%
m	65	2.1%
p	52	1.7%
s	46	1.5%
j	40	1.3%
r	34	1.1%
o	33	1.1%
t	26	0.8%
a	21	0.7%
Other values (11)	136	4.4%

Decimal Number

Value	Count	Frequency (%)
8	12683	16.2%
1	10688	13.6%
3	9418	12.0%
9	7644	9.7%
2	7609	9.7%
4	7487	9.5%
5	6456	8.2%
7	5737	7.3%
6	5717	7.3%
0	4996	6.4%

Other Punctuation

Value	Count	Frequency (%)
.	9173	99.9%
,	12	0.1%

Space Separator

Value	Count	Frequency (%)
	15144	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	427	100.0%

Open Punctuation

Value	Count	Frequency (%)
[	4	100.0%

Close Punctuation

Value	Count	Frequency (%)
]	4	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	103199	82.1%
Hangul	18899	15.0%
Latin	3652	2.9%
Han	2	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
ㅇ	1816	9.6%
ㅅ	1144	6.1%
ㄱ	910	4.8%
ㅎ	722	3.8%
ㅂ	687	3.6%
ㅈ	644	3.4%
이	644	3.4%
김	643	3.4%
ㄴ	595	3.1%
ㅁ	584	3.1%
Other values (562)	10510	55.6%

Latin

Value	Count	Frequency (%)
v	2185	59.8%
c	468	12.8%
B	73	2.0%
m	65	1.8%
S	60	1.6%
p	52	1.4%
M	52	1.4%
s	46	1.3%
L	42	1.2%
P	41	1.1%
Other values (34)	568	15.6%

Common

Value	Count	Frequency (%)
	15144	14.7%
8	12683	12.3%
1	10688	10.4%
3	9418	9.1%
.	9173	8.9%
9	7644	7.4%
2	7609	7.4%
4	7487	7.3%
5	6456	6.3%
7	5737	5.6%
Other values (6)	11160	10.8%

Han

Value	Count	Frequency (%)
下	1	50.0%
上	1	50.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	106851	85.0%
Hangul	9762	7.8%
Compat Jamo	9137	7.3%
CJK	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	15144	14.2%
8	12683	11.9%
1	10688	10.0%
3	9418	8.8%
.	9173	8.6%
9	7644	7.2%
2	7609	7.1%
4	7487	7.0%
5	6456	6.0%
7	5737	5.4%
Other values (50)	14812	13.9%

Compat Jamo

Value	Count	Frequency (%)
ㅇ	1816	19.9%
ㅅ	1144	12.5%
ㄱ	910	10.0%
ㅎ	722	7.9%
ㅂ	687	7.5%
ㅈ	644	7.0%
ㄴ	595	6.5%
ㅁ	584	6.4%
ㅊ	554	6.1%
ㄷ	426	4.7%
Other values (9)	1055	11.5%

Hangul

Value	Count	Frequency (%)
이	644	6.6%
김	643	6.6%
박	277	2.8%
정	189	1.9%
최	156	1.6%
아	152	1.6%
사	146	1.5%
조	143	1.5%
시	133	1.4%
한	132	1.4%
Other values (543)	7147	73.2%

CJK

Value	Count	Frequency (%)
下	1	50.0%
上	1	50.0%

출판년

출판년

Phik (φk)
Auto

Heatmap
Table

	자료실	출판년
자료실	1.000	0.163
출판년	0.163	1.000

Heatmap
Table

	출판년	자료실
출판년	1.000	0.174
자료실	0.174	1.000

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	소장처	자료실	등록번호	서명	저자	출판사	출판년	청구기호
8781	진잠도서관	종합자료실	CEM87950	베토벤 : 절망의 심연에서 불러낸 환희의 선율 = Ludwig Van Beethoven	최은규	아르테	2020	082 클589ㅇ v.17
14357	진잠도서관	어린이실	CEM82135	Shirley homes and the lithuanian case	Bassett, Jennifer	Oxford University Press	2012	808 O98o v.1-30
26216	진잠도서관	어린이실	CEM68971	우리 모두 이웃이야! :서로 친친! 지구 마을 사람들	김성은	토토북	2015	331.5 김567ㅇ
60702	진잠도서관	종합자료실	EM23565	(네이피어가 들려주는) 로그 이야기	김승태 지음	자음과모음	2008	410 수922ㅈ 39
41591	진잠도서관	어린이실	EM51941	Bambi`s Hide-and-Seek	by Andrea Posner-Sanchez ; illustrated by Isidre Mones	Moonjinmedia	2011	747 F982m K-6
33919	진잠도서관	어린이실	CEM59976	이슬람의 황금시대를 연 칼리프들	김지항	그레이트북스	2013	909 으933ㄱ v.16
41847	진잠도서관	종합자료실	EM51615	인플레이션과 세계경제 대예측	아사쿠라 게이 지음 ; 이연재 옮김	매일경제신문사	2013	321.97 아275ㅇ
3471	진잠도서관	종합자료실	CEM93346	사라진 내일	차일드, 리	Openhouse(오픈하우스)	2013	843.5 차165ㅅ
64503	진잠도서관	어린이실	EM16499	음악,아름다운 소리의 세계	호세 루이스 코르테스 지음,신승혜 옮김	을파소	2003	670.4 호392ㅇ
10638	진잠도서관	어린이실	CEM86012	초등영어 문장만들기가 먼저다 . 4 , 수식어로 문장 꾸미기	박광희	사람in	2019	746 박213ㅊ v.4

	소장처	자료실	등록번호	서명	저자	출판사	출판년	청구기호
55048	진잠도서관	어린이실	EM33365	비버 벤이 집을 지었어	비키 이건 글 ; 다니엘라 데 루카 그림 ; 신혜정 옮김	다섯수레	2009	491 이125ㅂ
32593	진잠도서관	어린이실	CEM61557	살꽃이야기	이현주	한겨레아이들	2014	808.9 징985ㅎ v.18
63119	진잠도서관	어린이실	EM19339	(피에르 오귀스트) 르누아르	마이크 버네치어 글·그림 ; 오정환 번역	한국몬테소리	2002	609.9 버112ㄹ 9
1787	진잠도서관	종합자료실	CEM95042	그해, 선셋 비치에서 : 니콜라스 스파크스 장편소설	스파크스, 니콜라스	문학사상	2022	843.6 스236ㄱ
33769	진잠도서관	어린이실	CEM60127	같은 병을 앓는 사람끼리 가엾게 여긴다 :동병상련	최유성	통큰세상	2010	711.47 하138ㅌ v.3
1447	진잠도서관	어린이실	CEM95382	(처음 읽는) 그리스 로마 신화 . 3 , 인간의 탄생과 판도라	최설희	아이세움	2020	219.2 최759ㄱ v.3
55710	진잠도서관	종합자료실	EM32412	과학자가 말하는, 환경 문제의 진실과 거짓말	이케다 기요히코 지음 ; 한석호 옮김	소와당	2011	539.9 이732ㄱ
66277	진잠도서관	종합자료실	EM10319	생명의 아픔 : 박경리 생명 에세이	박경리 지음	이룸	2004	814.6 박173ㅅ
20773	진잠도서관	어린이실	CEM75191	응가가 쑴풍	조은수	한울림어린이	2018	375.1 쭈999ㅎ v.8
8810	진잠도서관	종합자료실	CEM87920	나는 독일인입니다 : 전쟁과 역사와 죄의식에 대하여	크루크, 노라	엘리	2020	909.54 크567ㄴ

Overview

Variables

Common Values

Length

Common Values (Plot)

Common Values

Length

Common Values (Plot)

Most occurring characters

Most occurring categories

Most frequent character per category

Decimal Number

Uppercase Letter

Most occurring scripts

Most frequent character per script

Common

Latin

Most occurring blocks

Most frequent character per block

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Math Symbol

Open Punctuation

Close Punctuation

Dash Punctuation

Modifier Symbol

Letter Number

Space Separator

Final Punctuation

Format

Initial Punctuation

Other Symbol

Connector Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Han

Common

Latin

Hiragana

Cyrillic

Katakana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

Cyrillic

CJK

Punctuation

Compat Jamo

Hiragana

Number Forms

CJK Compat Ideographs

Katakana

Misc Symbols

Math Operators

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Open Punctuation

Close Punctuation

Math Symbol

Space Separator

Dash Punctuation

Modifier Symbol

Other Symbol

Letter Number