gimi9 Pandas Profiling

Dataset statistics

Number of variables	5
Number of observations	10000
Missing cells	104
Missing cells (%)	0.2%
Duplicate rows	24
Duplicate rows (%)	0.2%
Total size in memory	478.5 KiB
Average record size in memory	49.0 B

Variable types

Text	4
Numeric	1

Dataset

Description	한국형사법무정책연구원 도서관 소장자료의 목록정보(도서명, 저자, 출판사 등) 제공합니다. 소장자료의 세부사항 확인 등은 한국형사법무정책연구원 전자도서관 홈페이지를 이용 바랍니다.
Author	한국형사법무정책연구원
URL	https://www.data.go.kr/data/3038094/fileData.do

Alerts

Dataset has 24 (0.2%) duplicate rows

Duplicates

Reproduction

Analysis started	2023-12-12 07:22:35.905501
Analysis finished	2023-12-12 07:22:39.029885
Duration	3.12 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

서명
Text

Distinct	8628
Distinct (%)	86.3%
Missing	2
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	518
Median length	208
Mean length	37.239448
Min length	2

Characters and Unicode

Total characters	372320
Distinct characters	1917
Distinct categories	16 ?
Distinct scripts	7 ?
Distinct blocks	12 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	7982 ?
Unique (%)	79.8%

Sample

1st row	한국사회 폭력문화의 구조화에 관한 연구
2nd row	Social psychology
3rd row	Betubungsmittelgesetz
4th row	(알기쉬운) 수사 형사 실무 :수사기술과 판례 중심으로
5th row	분단독일의 정치사회학

Value	Count	Frequency (%)
and	1735	3.1%
the	1560	2.8%
of	1404	2.5%
in	987	1.8%
und	722	1.3%
der	581	1.0%
연구	555	1.0%
	470	0.8%
a	468	0.8%
관한	424	0.8%
Other values (16781)	46920	84.0%

Most occurring characters

Value	Count	Frequency (%)
	45856	12.3%
e	28648	7.7%
i	20901	5.6%
n	20612	5.5%
t	17479	4.7%
r	17204	4.6%
a	16026	4.3%
s	14759	4.0%
o	14438	3.9%
c	10719	2.9%
Other values (1907)	165678	44.5%

Most occurring categories

Value	Count	Frequency (%)
Lowercase Letter	229424	61.6%
Other Letter	65651	17.6%
Space Separator	45856	12.3%
Uppercase Letter	16627	4.5%
Decimal Number	5408	1.5%
Other Punctuation	5321	1.4%
Open Punctuation	1467	0.4%
Close Punctuation	1467	0.4%
Dash Punctuation	937	0.3%
Letter Number	88	< 0.1%
Other values (6)	74	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
의	2063	3.1%
사	1674	2.5%
한	1287	2.0%
법	1129	1.7%
구	1068	1.6%
연	1026	1.6%
제	1005	1.5%
法	932	1.4%
정	823	1.3%
과	819	1.2%
Other values (1788)	53825	82.0%

Lowercase Letter

Value	Count	Frequency (%)
e	28648	12.5%
i	20901	9.1%
n	20612	9.0%
t	17479	7.6%
r	17204	7.5%
a	16026	7.0%
s	14759	6.4%
o	14438	6.3%
c	10719	4.7%
l	10000	4.4%
Other values (18)	58638	25.6%

Uppercase Letter

Value	Count	Frequency (%)
S	1975	11.9%
A	1239	7.5%
T	1193	7.2%
C	1148	6.9%
P	995	6.0%
I	975	5.9%
D	950	5.7%
E	922	5.5%
R	842	5.1%
G	755	4.5%
Other values (16)	5633	33.9%

Other Punctuation

Value	Count	Frequency (%)
:	2535	47.6%
,	1685	31.7%
.	417	7.8%
·	176	3.3%
'	167	3.1%
§	122	2.3%
"	67	1.3%
&	59	1.1%
/	51	1.0%
;	14	0.3%
Other values (7)	28	0.5%

Decimal Number

Value	Count	Frequency (%)
1	1262	23.3%
2	943	17.4%
0	832	15.4%
9	605	11.2%
8	377	7.0%
3	357	6.6%
7	288	5.3%
4	281	5.2%
5	232	4.3%
6	231	4.3%

Letter Number

Value	Count	Frequency (%)
Ⅱ	28	31.8%
Ⅰ	27	30.7%
Ⅲ	14	15.9%
Ⅳ	9	10.2%
Ⅷ	4	4.5%
Ⅵ	2	2.3%
Ⅸ	2	2.3%
Ⅴ	1	1.1%
Ⅹ	1	1.1%

Math Symbol

Value	Count	Frequency (%)
~	11	28.2%
<	7	17.9%
>	7	17.9%
+	6	15.4%
=	6	15.4%
∥	1	2.6%
∬	1	2.6%

Open Punctuation

Value	Count	Frequency (%)
(	1408	96.0%
[	45	3.1%
「	9	0.6%
〔	2	0.1%
『	2	0.1%
《	1	0.1%

Close Punctuation

Value	Count	Frequency (%)
)	1407	95.9%
]	45	3.1%
」	10	0.7%
〕	2	0.1%
』	2	0.1%
》	1	0.1%

Dash Punctuation

Value	Count	Frequency (%)
-	923	98.5%
―	14	1.5%

Modifier Symbol

Value	Count	Frequency (%)
˙	13	92.9%
`	1	7.1%

Final Punctuation

Value	Count	Frequency (%)
’	12	92.3%
”	1	7.7%

Space Separator

Value	Count	Frequency (%)
	45856	100.0%

Format

Value	Count	Frequency (%)
	5	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	2	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	246133	66.1%
Common	60530	16.3%
Hangul	49810	13.4%
Han	13793	3.7%
Hiragana	1072	0.3%
Katakana	976	0.3%
Greek	6	< 0.1%

Most frequent character per script

Han

Value	Count	Frequency (%)
法	932	6.8%
刑	444	3.2%
事	330	2.4%
硏	290	2.1%
究	287	2.1%
論	224	1.6%
國	218	1.6%
學	201	1.5%
會	169	1.2%
犯	169	1.2%
Other values (947)	10529	76.3%

Hangul

Value	Count	Frequency (%)
의	2063	4.1%
사	1674	3.4%
한	1287	2.6%
법	1129	2.3%
구	1068	2.1%
연	1026	2.1%
제	1005	2.0%
정	823	1.7%
과	819	1.6%
형	806	1.6%
Other values (707)	38110	76.5%

Katakana

Value	Count	Frequency (%)
ン	85	8.7%
ス	62	6.4%
ル	49	5.0%
ク	41	4.2%
ア	39	4.0%
イ	39	4.0%
メ	38	3.9%
タ	35	3.6%
コ	33	3.4%
ト	32	3.3%
Other values (61)	523	53.6%

Latin

Value	Count	Frequency (%)
e	28648	11.6%
i	20901	8.5%
n	20612	8.4%
t	17479	7.1%
r	17204	7.0%
a	16026	6.5%
s	14759	6.0%
o	14438	5.9%
c	10719	4.4%
l	10000	4.1%
Other values (52)	75347	30.6%

Common

Value	Count	Frequency (%)
	45856	75.8%
:	2535	4.2%
,	1685	2.8%
(	1408	2.3%
)	1407	2.3%
1	1262	2.1%
2	943	1.6%
-	923	1.5%
0	832	1.4%
9	605	1.0%
Other values (46)	3074	5.1%

Hiragana

Value	Count	Frequency (%)
の	338	31.5%
と	181	16.9%
る	72	6.7%
に	53	4.9%
か	34	3.2%
を	33	3.1%
す	27	2.5%
た	23	2.1%
ら	21	2.0%
め	19	1.8%
Other values (43)	271	25.3%

Greek

Value	Count	Frequency (%)
β	6	100.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	306052	82.2%
Hangul	49784	13.4%
CJK	13527	3.6%
Hiragana	1072	0.3%
Katakana	976	0.3%
None	485	0.1%
CJK Compat Ideographs	266	0.1%
Number Forms	88	< 0.1%
Punctuation	29	< 0.1%
Compat Jamo	26	< 0.1%
Other values (2)	15	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	45856	15.0%
e	28648	9.4%
i	20901	6.8%
n	20612	6.7%
t	17479	5.7%
r	17204	5.6%
a	16026	5.2%
s	14759	4.8%
o	14438	4.7%
c	10719	3.5%
Other values (77)	99410	32.5%

Hangul

Value	Count	Frequency (%)
의	2063	4.1%
사	1674	3.4%
한	1287	2.6%
법	1129	2.3%
구	1068	2.1%
연	1026	2.1%
제	1005	2.0%
정	823	1.7%
과	819	1.6%
형	806	1.6%
Other values (703)	38084	76.5%

CJK

Value	Count	Frequency (%)
法	932	6.9%
刑	444	3.3%
事	330	2.4%
硏	290	2.1%
究	287	2.1%
論	224	1.7%
國	218	1.6%
學	201	1.5%
會	169	1.2%
犯	169	1.2%
Other values (907)	10263	75.9%

Hiragana

Value	Count	Frequency (%)
の	338	31.5%
と	181	16.9%
る	72	6.7%
に	53	4.9%
か	34	3.2%
を	33	3.1%
す	27	2.5%
た	23	2.1%
ら	21	2.0%
め	19	1.8%
Other values (43)	271	25.3%

None

Value	Count	Frequency (%)
·	176	36.3%
ß	136	28.0%
§	122	25.2%
」	10	2.1%
「	9	1.9%
、	9	1.9%
β	6	1.2%
	5	1.0%
〕	2	0.4%
〔	2	0.4%
Other values (6)	8	1.6%

Katakana

Value	Count	Frequency (%)
ン	85	8.7%
ス	62	6.4%
ル	49	5.0%
ク	41	4.2%
ア	39	4.0%
イ	39	4.0%
メ	38	3.9%
タ	35	3.6%
コ	33	3.4%
ト	32	3.3%
Other values (61)	523	53.6%

CJK Compat Ideographs

Value	Count	Frequency (%)
論	73	27.4%
理	54	20.3%
年	23	8.6%
勞	14	5.3%
女	13	4.9%
不	11	4.1%
立	10	3.8%
歷	8	3.0%
六	6	2.3%
類	5	1.9%
Other values (30)	49	18.4%

Number Forms

Value	Count	Frequency (%)
Ⅱ	28	31.8%
Ⅰ	27	30.7%
Ⅲ	14	15.9%
Ⅳ	9	10.2%
Ⅷ	4	4.5%
Ⅵ	2	2.3%
Ⅸ	2	2.3%
Ⅴ	1	1.1%
Ⅹ	1	1.1%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	22	84.6%
ㅡ	2	7.7%
ㅎ	1	3.8%
ㅇ	1	3.8%

Punctuation

Value	Count	Frequency (%)
―	14	48.3%
’	12	41.4%
‘	2	6.9%
”	1	3.4%

Modifier Letters

Value	Count	Frequency (%)
˙	13	100.0%

Math Operators

Value	Count	Frequency (%)
∥	1	50.0%
∬	1	50.0%

저자
Text

Distinct	6514
Distinct (%)	65.1%
Missing	1
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	128
Median length	93
Mean length	12.428643
Min length	1

Characters and Unicode

Total characters	124274
Distinct characters	1261
Distinct categories	13 ?
Distinct scripts	7 ?
Distinct blocks	8 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	5775 ?
Unique (%)	57.8%

Sample

1st row	한국형사정책연구원
2nd row	Kenneth J., Gergen
3rd row	Harald Hans, Krner
4th row	서주연
5th row	다렌돌프,랄프

Value	Count	Frequency (%)
한국형사정책연구원	1220	6.1%
of	173	0.9%
j	166	0.8%
법무부	157	0.8%
a	148	0.7%
s	146	0.7%
대검찰청	139	0.7%
r	131	0.7%
institute	124	0.6%
justice	120	0.6%
Other values (8088)	17340	87.3%

Most occurring characters

Value	Count	Frequency (%)
	9865	7.9%
e	8210	6.6%
a	6288	5.1%
r	6116	4.9%
n	6050	4.9%
i	5179	4.2%
,	5020	4.0%
o	4131	3.3%
t	3946	3.2%
l	3807	3.1%
Other values (1251)	65662	52.8%

Most occurring categories

Value	Count	Frequency (%)
Lowercase Letter	64132	51.6%
Other Letter	29783	24.0%
Uppercase Letter	13958	11.2%
Space Separator	9867	7.9%
Other Punctuation	6149	4.9%
Dash Punctuation	261	0.2%
Close Punctuation	51	< 0.1%
Open Punctuation	50	< 0.1%
Decimal Number	15	< 0.1%
Final Punctuation	4	< 0.1%
Other values (3)	4	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
원	1639	5.5%
국	1593	5.3%
정	1582	5.3%
한	1567	5.3%
연	1554	5.2%
사	1506	5.1%
구	1497	5.0%
형	1353	4.5%
책	1259	4.2%
법	546	1.8%
Other values (1169)	15687	52.7%

Lowercase Letter

Value	Count	Frequency (%)
e	8210	12.8%
a	6288	9.8%
r	6116	9.5%
n	6050	9.4%
i	5179	8.1%
o	4131	6.4%
t	3946	6.2%
l	3807	5.9%
s	3423	5.3%
h	2620	4.1%
Other values (19)	14362	22.4%

Uppercase Letter

Value	Count	Frequency (%)
S	1087	7.8%
J	1025	7.3%
M	960	6.9%
R	901	6.5%
C	858	6.1%
H	846	6.1%
B	831	6.0%
A	806	5.8%
D	722	5.2%
L	646	4.6%
Other values (16)	5276	37.8%

Other Punctuation

Value	Count	Frequency (%)
,	5020	81.6%
.	1047	17.0%
'	28	0.5%
·	21	0.3%
/	16	0.3%
&	10	0.2%
;	5	0.1%
"	2	< 0.1%

Decimal Number

Value	Count	Frequency (%)
6	4	26.7%
3	4	26.7%
2	3	20.0%
0	2	13.3%
7	1	6.7%
1	1	6.7%

Close Punctuation

Value	Count	Frequency (%)
)	35	68.6%
]	15	29.4%
》	1	2.0%

Space Separator

Value	Count	Frequency (%)
	9865	> 99.9%
	2	< 0.1%

Open Punctuation

Value	Count	Frequency (%)
(	35	70.0%
[	15	30.0%

Math Symbol

Value	Count	Frequency (%)
>	1	50.0%
<	1	50.0%

Dash Punctuation

Value	Count	Frequency (%)
-	261	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	4	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	1	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	78089	62.8%
Hangul	28030	22.6%
Common	16401	13.2%
Han	1525	1.2%
Katakana	210	0.2%
Hiragana	18	< 0.1%
Greek	1	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
원	1639	5.8%
국	1593	5.7%
정	1582	5.6%
한	1567	5.6%
연	1554	5.5%
사	1506	5.4%
구	1497	5.3%
형	1353	4.8%
책	1259	4.5%
법	546	1.9%
Other values (588)	13934	49.7%

Han

Value	Count	Frequency (%)
會	38	2.5%
田	33	2.2%
大	31	2.0%
法	31	2.0%
一	22	1.4%
事	18	1.2%
學	17	1.1%
本	17	1.1%
護	15	1.0%
究	15	1.0%
Other values (500)	1288	84.5%

Katakana

Value	Count	Frequency (%)
ン	20	9.5%
ス	13	6.2%
ル	10	4.8%
イ	9	4.3%
ト	8	3.8%
タ	7	3.3%
マ	7	3.3%
ネ	7	3.3%
ェ	6	2.9%
ッ	6	2.9%
Other values (47)	117	55.7%

Latin

Value	Count	Frequency (%)
e	8210	10.5%
a	6288	8.1%
r	6116	7.8%
n	6050	7.7%
i	5179	6.6%
o	4131	5.3%
t	3946	5.1%
l	3807	4.9%
s	3423	4.4%
h	2620	3.4%
Other values (44)	28319	36.3%

Common

Value	Count	Frequency (%)
	9865	60.1%
,	5020	30.6%
.	1047	6.4%
-	261	1.6%
(	35	0.2%
)	35	0.2%
'	28	0.2%
·	21	0.1%
/	16	0.1%
]	15	0.1%
Other values (17)	58	0.4%

Hiragana

Value	Count	Frequency (%)
ま	2	11.1%
み	2	11.1%
い	2	11.1%
な	2	11.1%
う	1	5.6%
ょ	1	5.6%
ぎ	1	5.6%
ら	1	5.6%
せ	1	5.6%
と	1	5.6%
Other values (4)	4	22.2%

Greek

Value	Count	Frequency (%)
β	1	100.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	94448	76.0%
Hangul	28030	22.6%
CJK	1513	1.2%
Katakana	210	0.2%
None	38	< 0.1%
Hiragana	18	< 0.1%
CJK Compat Ideographs	12	< 0.1%
Punctuation	5	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	9865	10.4%
e	8210	8.7%
a	6288	6.7%
r	6116	6.5%
n	6050	6.4%
i	5179	5.5%
,	5020	5.3%
o	4131	4.4%
t	3946	4.2%
l	3807	4.0%
Other values (64)	35836	37.9%

Hangul

Value	Count	Frequency (%)
원	1639	5.8%
국	1593	5.7%
정	1582	5.6%
한	1567	5.6%
연	1554	5.5%
사	1506	5.4%
구	1497	5.3%
형	1353	4.8%
책	1259	4.5%
법	546	1.9%
Other values (588)	13934	49.7%

CJK

Value	Count	Frequency (%)
會	38	2.5%
田	33	2.2%
大	31	2.0%
法	31	2.0%
一	22	1.5%
事	18	1.2%
學	17	1.1%
本	17	1.1%
護	15	1.0%
究	15	1.0%
Other values (492)	1276	84.3%

None

Value	Count	Frequency (%)
·	21	55.3%
ß	11	28.9%
	2	5.3%
ŉ	2	5.3%
》	1	2.6%
β	1	2.6%

Katakana

Value	Count	Frequency (%)
ン	20	9.5%
ス	13	6.2%
ル	10	4.8%
イ	9	4.3%
ト	8	3.8%
タ	7	3.3%
マ	7	3.3%
ネ	7	3.3%
ェ	6	2.9%
ッ	6	2.9%
Other values (47)	117	55.7%

Punctuation

Value	Count	Frequency (%)
’	4	80.0%
‘	1	20.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
李	3	25.0%
聯	2	16.7%
勞	2	16.7%
林	1	8.3%
龍	1	8.3%
立	1	8.3%
鈴	1	8.3%
金	1	8.3%

Hiragana

Value	Count	Frequency (%)
ま	2	11.1%
み	2	11.1%
い	2	11.1%
な	2	11.1%
う	1	5.6%
ょ	1	5.6%
ぎ	1	5.6%
ら	1	5.6%
せ	1	5.6%
と	1	5.6%
Other values (4)	4	22.2%

출판사
Text

Distinct	2687
Distinct (%)	27.1%
Missing	80
Missing (%)	0.8%
Memory size	156.2 KiB

Length

Max length	100
Median length	75
Mean length	13.089415
Min length	1

Characters and Unicode

Total characters	129847
Distinct characters	958
Distinct categories	12 ?
Distinct scripts	6 ?
Distinct blocks	9 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1722 ?
Unique (%)	17.4%

Sample

1st row	한국형사정책연구원
2nd row	Springer-Verlag
3rd row	C.H.Beck'sche Verlagsbuchhandlung
4th row	국문사
5th row	한길사

Value	Count	Frequency (%)
한국형사정책연구원	1279	6.7%
press	985	5.2%
university	565	3.0%
verlag	415	2.2%
	412	2.2%
of	318	1.7%
information	305	1.6%
dissertation	302	1.6%
umi	302	1.6%
services	289	1.5%
Other values (2649)	13890	72.9%

Most occurring characters

Value	Count	Frequency (%)
	9147	7.0%
e	8941	6.9%
r	7037	5.4%
s	6494	5.0%
i	6444	5.0%
n	6117	4.7%
a	5313	4.1%
t	5157	4.0%
o	4547	3.5%
l	3952	3.0%
Other values (948)	66698	51.4%

Most occurring categories

Value	Count	Frequency (%)
Lowercase Letter	74306	57.2%
Other Letter	29441	22.7%
Uppercase Letter	14751	11.4%
Space Separator	9147	7.0%
Other Punctuation	1755	1.4%
Dash Punctuation	325	0.3%
Decimal Number	49	< 0.1%
Close Punctuation	33	< 0.1%
Open Punctuation	33	< 0.1%
Math Symbol	3	< 0.1%
Other values (2)	4	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
사	1945	6.6%
원	1613	5.5%
한	1594	5.4%
국	1545	5.2%
연	1460	5.0%
구	1446	4.9%
정	1381	4.7%
책	1336	4.5%
형	1328	4.5%
社	553	1.9%
Other values (866)	15240	51.8%

Lowercase Letter

Value	Count	Frequency (%)
e	8941	12.0%
r	7037	9.5%
s	6494	8.7%
i	6444	8.7%
n	6117	8.2%
a	5313	7.2%
t	5157	6.9%
o	4547	6.1%
l	3952	5.3%
c	2810	3.8%
Other values (17)	17494	23.5%

Uppercase Letter

Value	Count	Frequency (%)
P	1984	13.4%
C	1205	8.2%
U	1194	8.1%
I	1187	8.0%
S	1174	8.0%
M	810	5.5%
H	784	5.3%
D	743	5.0%
B	683	4.6%
V	629	4.3%
Other values (16)	4358	29.5%

Decimal Number

Value	Count	Frequency (%)
1	18	36.7%
9	10	20.4%
2	8	16.3%
6	3	6.1%
8	3	6.1%
4	2	4.1%
5	2	4.1%
3	1	2.0%
0	1	2.0%
7	1	2.0%

Other Punctuation

Value	Count	Frequency (%)
.	948	54.0%
&	353	20.1%
,	220	12.5%
'	171	9.7%
/	41	2.3%
·	10	0.6%
＆	5	0.3%
;	4	0.2%
:	3	0.2%

Dash Punctuation

Value	Count	Frequency (%)
-	323	99.4%
－	1	0.3%
―	1	0.3%

Final Punctuation

Value	Count	Frequency (%)
’	2	66.7%
”	1	33.3%

Space Separator

Value	Count	Frequency (%)
	9147	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	33	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	33	100.0%

Math Symbol

Value	Count	Frequency (%)
+	3	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	89057	68.6%
Hangul	21641	16.7%
Common	11349	8.7%
Han	7636	5.9%
Katakana	105	0.1%
Hiragana	59	< 0.1%

Most frequent character per script

Han

Value	Count	Frequency (%)
社	553	7.2%
法	467	6.1%
大	293	3.8%
文	291	3.8%
學	242	3.2%
版	213	2.8%
務	211	2.8%
出	211	2.8%
院	180	2.4%
堂	151	2.0%
Other values (416)	4824	63.2%

Hangul

Value	Count	Frequency (%)
사	1945	9.0%
원	1613	7.5%
한	1594	7.4%
국	1545	7.1%
연	1460	6.7%
구	1446	6.7%
정	1381	6.4%
책	1336	6.2%
형	1328	6.1%
학	320	1.5%
Other values (391)	7673	35.5%

Latin

Value	Count	Frequency (%)
e	8941	10.0%
r	7037	7.9%
s	6494	7.3%
i	6444	7.2%
n	6117	6.9%
a	5313	6.0%
t	5157	5.8%
o	4547	5.1%
l	3952	4.4%
c	2810	3.2%
Other values (43)	32245	36.2%

Katakana

Value	Count	Frequency (%)
イ	8	7.6%
ミ	7	6.7%
タ	7	6.7%
ズ	7	6.7%
ン	6	5.7%
ネ	6	5.7%
ム	6	5.7%
ル	6	5.7%
ァ	5	4.8%
ヴ	5	4.8%
Other values (26)	42	40.0%

Common

Value	Count	Frequency (%)
	9147	80.6%
.	948	8.4%
&	353	3.1%
-	323	2.8%
,	220	1.9%
'	171	1.5%
/	41	0.4%
)	33	0.3%
(	33	0.3%
1	18	0.2%
Other values (19)	62	0.5%

Hiragana

Value	Count	Frequency (%)
い	11	18.6%
せ	10	16.9%
う	10	16.9%
ぎ	10	16.9%
ょ	7	11.9%
よ	3	5.1%
の	2	3.4%
み	1	1.7%
ら	1	1.7%
と	1	1.7%
Other values (3)	3	5.1%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	100384	77.3%
Hangul	21636	16.7%
CJK	7591	5.8%
Katakana	105	0.1%
Hiragana	59	< 0.1%
CJK Compat Ideographs	45	< 0.1%
None	17	< 0.1%
Compat Jamo	5	< 0.1%
Punctuation	5	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	9147	9.1%
e	8941	8.9%
r	7037	7.0%
s	6494	6.5%
i	6444	6.4%
n	6117	6.1%
a	5313	5.3%
t	5157	5.1%
o	4547	4.5%
l	3952	3.9%
Other values (64)	37235	37.1%

Hangul

Value	Count	Frequency (%)
사	1945	9.0%
원	1613	7.5%
한	1594	7.4%
국	1545	7.1%
연	1460	6.7%
구	1446	6.7%
정	1381	6.4%
책	1336	6.2%
형	1328	6.1%
학	320	1.5%
Other values (388)	7668	35.4%

CJK

Value	Count	Frequency (%)
社	553	7.3%
法	467	6.2%
大	293	3.9%
文	291	3.8%
學	242	3.2%
版	213	2.8%
務	211	2.8%
出	211	2.8%
院	180	2.4%
堂	151	2.0%
Other values (401)	4779	63.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
立	12	26.7%
女	6	13.3%
論	5	11.1%
勞	5	11.1%
梨	2	4.4%
良	2	4.4%
綠	2	4.4%
更	2	4.4%
不	2	4.4%
粒	2	4.4%
Other values (5)	5	11.1%

Hiragana

Value	Count	Frequency (%)
い	11	18.6%
せ	10	16.9%
う	10	16.9%
ぎ	10	16.9%
ょ	7	11.9%
よ	3	5.1%
の	2	3.4%
み	1	1.7%
ら	1	1.7%
と	1	1.7%
Other values (3)	3	5.1%

None

Value	Count	Frequency (%)
·	10	58.8%
＆	5	29.4%
ß	1	5.9%
－	1	5.9%

Katakana

Value	Count	Frequency (%)
イ	8	7.6%
ミ	7	6.7%
タ	7	6.7%
ズ	7	6.7%
ン	6	5.7%
ネ	6	5.7%
ム	6	5.7%
ル	6	5.7%
ァ	5	4.8%
ヴ	5	4.8%
Other values (26)	42	40.0%

Compat Jamo

Value	Count	Frequency (%)
ㅎ	2	40.0%
ㄴ	2	40.0%
ㆍ	1	20.0%

Punctuation

Value	Count	Frequency (%)
’	2	40.0%
‘	1	20.0%
”	1	20.0%
―	1	20.0%

출판년
Real number (ℝ)

Distinct	116
Distinct (%)	1.2%
Missing	8
Missing (%)	0.1%
Infinite	0
Infinite (%)	0.0%
Mean	1997.2622

Minimum	1881
Maximum	2022
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	166.0 KiB

Quantile statistics

Minimum	1881
5-th percentile	1974
Q1	1987
median	1999
Q3	2010
95-th percentile	2018
Maximum	2022
Range	141
Interquartile range (IQR)	23

Descriptive statistics

Standard deviation	16.163441
Coefficient of variation (CV)	0.0080927988
Kurtosis	5.060253
Mean	1997.2622
Median Absolute Deviation (MAD)	11
Skewness	-1.4084062
Sum	19956644
Variance	261.25683
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=50)

Value	Count	Frequency (%)
1988	462	4.6%
1989	413	4.1%
1986	346	3.5%
1987	312	3.1%
2014	289	2.9%
2007	283	2.8%
2011	272	2.7%
2006	264	2.6%
2003	264	2.6%
2010	261	2.6%
Other values (106)	6826	68.3%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
1881	1	< 0.1%
1895	2	< 0.1%
1896	1	< 0.1%
1897	1	< 0.1%
1898	1	< 0.1%
1899	2	< 0.1%
1901	2	< 0.1%
1902	1	< 0.1%
1903	2	< 0.1%
1904	1	< 0.1%

Value	Count	Frequency (%)
2022	20	0.2%
2021	198	2.0%
2020	158	1.6%
2019	122	1.2%
2018	125	1.2%
2017	217	2.2%
2016	201	2.0%
2015	221	2.2%
2014	289	2.9%
2013	226	2.3%

청구기호
Text

Distinct	9884
Distinct (%)	99.0%
Missing	13
Missing (%)	0.1%
Memory size	156.2 KiB

Length

Max length	30
Median length	26
Mean length	13.575448
Min length	1

Characters and Unicode

Total characters	135578
Distinct characters	529
Distinct categories	12 ?
Distinct scripts	3 ?
Distinct blocks	6 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	9804 ?
Unique (%)	98.2%

Sample

1st row	KIC 08-13 3
2nd row	302 .G367S
3rd row	344.0440263 .K84B
4th row	363.25 서77수
5th row	306.20943 .다294분

Value	Count	Frequency (%)
v	1336	5.1%
kic	1297	5.0%
2	796	3.1%
1	526	2.0%
c	461	1.8%
345.0074	288	1.1%
3	268	1.0%
345	235	0.9%
e	231	0.9%
364	181	0.7%
Other values (10432)	20380	78.4%

Most occurring characters

Value	Count	Frequency (%)
	16351	12.1%
3	12299	9.1%
.	11743	8.7%
4	9864	7.3%
0	8914	6.6%
1	8474	6.3%
2	8448	6.2%
6	7219	5.3%
5	6982	5.1%
9	5088	3.8%
Other values (519)	40196	29.6%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	76284	56.3%
Uppercase Letter	17108	12.6%
Space Separator	16351	12.1%
Other Punctuation	12199	9.0%
Other Letter	9529	7.0%
Lowercase Letter	2336	1.7%
Dash Punctuation	1751	1.3%
Letter Number	6	< 0.1%
Close Punctuation	5	< 0.1%
Open Punctuation	5	< 0.1%
Other values (2)	4	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
법	702	7.4%
한	461	4.8%
형	410	4.3%
대	295	3.1%
이	261	2.7%
연	256	2.7%
사	233	2.4%
김	214	2.2%
부	186	2.0%
정	158	1.7%
Other values (451)	6353	66.7%

Uppercase Letter

Value	Count	Frequency (%)
C	2278	13.3%
I	2108	12.3%
K	1821	10.6%
S	1525	8.9%
E	962	5.6%
M	897	5.2%
B	835	4.9%
A	816	4.8%
U	634	3.7%
P	607	3.5%
Other values (16)	4625	27.0%

Lowercase Letter

Value	Count	Frequency (%)
v	1548	66.3%
c	706	30.2%
a	17	0.7%
d	16	0.7%
i	13	0.6%
l	12	0.5%
y	5	0.2%
o	5	0.2%
r	3	0.1%
t	2	0.1%
Other values (7)	9	0.4%

Decimal Number

Value	Count	Frequency (%)
3	12299	16.1%
4	9864	12.9%
0	8914	11.7%
1	8474	11.1%
2	8448	11.1%
6	7219	9.5%
5	6982	9.2%
9	5088	6.7%
7	5022	6.6%
8	3974	5.2%

Other Punctuation

Value	Count	Frequency (%)
.	11743	96.3%
/	451	3.7%
'	3	< 0.1%
,	2	< 0.1%

Letter Number

Value	Count	Frequency (%)
Ⅰ	3	50.0%
Ⅹ	2	33.3%
Ⅱ	1	16.7%

Other Symbol

Value	Count	Frequency (%)
★	1	33.3%
◆	1	33.3%
▼	1	33.3%

Space Separator

Value	Count	Frequency (%)
	16351	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	1751	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	5	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	5	100.0%

Math Symbol

Value	Count	Frequency (%)
~	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	106599	78.6%
Latin	19450	14.3%
Hangul	9529	7.0%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
법	702	7.4%
한	461	4.8%
형	410	4.3%
대	295	3.1%
이	261	2.7%
연	256	2.7%
사	233	2.4%
김	214	2.2%
부	186	2.0%
정	158	1.7%
Other values (451)	6353	66.7%

Latin

Value	Count	Frequency (%)
C	2278	11.7%
I	2108	10.8%
K	1821	9.4%
v	1548	8.0%
S	1525	7.8%
E	962	4.9%
M	897	4.6%
B	835	4.3%
A	816	4.2%
c	706	3.6%
Other values (36)	5954	30.6%

Common

Value	Count	Frequency (%)
	16351	15.3%
3	12299	11.5%
.	11743	11.0%
4	9864	9.3%
0	8914	8.4%
1	8474	7.9%
2	8448	7.9%
6	7219	6.8%
5	6982	6.5%
9	5088	4.8%
Other values (12)	11217	10.5%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	126040	93.0%
Hangul	9528	7.0%
Number Forms	6	< 0.1%
Geometric Shapes	2	< 0.1%
Misc Symbols	1	< 0.1%
Compat Jamo	1	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	16351	13.0%
3	12299	9.8%
.	11743	9.3%
4	9864	7.8%
0	8914	7.1%
1	8474	6.7%
2	8448	6.7%
6	7219	5.7%
5	6982	5.5%
9	5088	4.0%
Other values (52)	30658	24.3%

Hangul

Value	Count	Frequency (%)
법	702	7.4%
한	461	4.8%
형	410	4.3%
대	295	3.1%
이	261	2.7%
연	256	2.7%
사	233	2.4%
김	214	2.2%
부	186	2.0%
정	158	1.7%
Other values (450)	6352	66.7%

Number Forms

Value	Count	Frequency (%)
Ⅰ	3	50.0%
Ⅹ	2	33.3%
Ⅱ	1	16.7%

Misc Symbols

Value	Count	Frequency (%)
★	1	100.0%

Geometric Shapes

Value	Count	Frequency (%)
◆	1	50.0%
▼	1	50.0%

Compat Jamo

Value	Count	Frequency (%)
ㄱ	1	100.0%

출판년

출판년

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	서명	저자	출판사	출판년	청구기호
29353	한국사회 폭력문화의 구조화에 관한 연구	한국형사정책연구원	한국형사정책연구원	2008	KIC 08-13 3
10599	Social psychology	Kenneth J., Gergen	Springer-Verlag	1986	302 .G367S
11619	Betubungsmittelgesetz	Harald Hans, Krner	C.H.Beck'sche Verlagsbuchhandlung	1990	344.0440263 .K84B
27580	(알기쉬운) 수사 형사 실무 :수사기술과 판례 중심으로	서주연	국문사	2006	363.25 서77수
628	분단독일의 정치사회학	다렌돌프,랄프	한길사	1986	306.20943 .다294분
24101	사이버로펌에 대한 합리적인 규제 및 입법방안	한국형사정책연구원	한국형사정책연구원	2003	KIC 03-41 c. 2
35567	Die Nebenfolge im System strafrechtlicher Sanktionen Eine Untersuchung zur Dogmatik der Nebenfolge sowie zur Einordnung von Normen als Nebenfolge	Sebastian Sobota	Duncker & Humblot	2015	345.430773 S443N
1496	民衆時代의 論理	노명식	展望社	1981	305.56 .노34민
6835	Betrug als Wirtschaftsdelikt Eine dogmatischempirische Untersuchung anhand einer Aktenanalyse von 1696 Betrugsverfahren in der Bundesrepublik Deutschland aus den Jahren 1974-79	Leßner, Johanna	Centaurus-Verlagsgesellschaft	1984	364.168 L639B
5465	Richter und Staatsanwalt im Dienst fr den Brger Die Vortrge und Referate des Deutschen Richtertages 1987 in Hamburg	Deutscher, Richterbund	Carl Heymanns Verlag KG	1988	345.05 .R535R

	서명	저자	출판사	출판년	청구기호
6209	Komplikationsdichte arztlicher Eingriffe	Wolfgang,, Mattig	Gustav Fischer Verlag	1983	617.01 .M444K
2270	基礎社會學	안전삼랑	東洋經濟新報社	1988	301 .안74기 v. 3 1988
24497	국가마약퇴치전략과 소년형사정책	한국형사정책연구원	한국형사정책연구원	2004	KIC 04-44 2
1915	(The) Oxford English dictionary	J. A., Simpson	Clarendon Press	1989	423 .S613O v. 20
10822	Soviet and East European transport problems	John,, Ambler	St. Martin's Press	1985	388.947 .A493S
35563	Europisches Strafrecht	Bernd Hecker	Springer Verlag	2015	345.24 B524E E.5
26256	식품안전, 소비자의 마음에 답이 있다 :전 총리실 전문위원이 제안하는 식품안전진단서	곽노성	(주)에세이	2008	363.192 곽25식
32226	Being Realistic about Reasons	Scanlon, T. M	Oxford University	2014	170 S283B
34014	한·중 자유무역협정에 따른 형사정책 대응전략 연구	한국형사정책연구원	한국형사정책연구원	2012	KIC 12-T16
2538	Constitutional law, the American constitution, constitutional rights and liberties	William B., Lockhart	West Publishing Co	1987	342.085 .L816C

Most frequently occurring

	서명	저자	출판사	출판년	청구기호	# duplicates
8	Statistiques criminelles internationales	International criminal police organization, [ed.]	Interpol	1959	364.021 .I61S	6
2	Hong Kong Correctional services	The Commissioner of Correctional Service	The Commissioner of Correctional Services	1990	CCS .C824S	5
5	Materialien zum Bericht der Kommission zur Auswertung der Erfahrungen mit dem reformierten §218 StGB I-III	Der Bundesminister fr Jugend, Familie und Gesundheit Postfach	W. Kohlhammer	1981	362.074 .K79S v. 92.	3
14	現代搜査叢書	제일가제법령출판사	第一加除法令出版社	1987	363.25074 .제68현 v. II-	3
17	검사의 기소재량에 관한 연구	한국형사정책연구원	한국형사정책연구원	1993	KIC 92-16	3
0	Comparative social research	Richard F., Tomasson	JAI Press Inc	1980	301.05 T655C c. 1	2
1	Epidemiologic trends in drug abuse :proceedings community epidemiology work group	National Institute on Drug Abuse	U. S. Department of Health and Human Services	1989	NIDA .E64	2
3	In the Shadow of Justice :Postwar Liberalism and the Remaking of Political Philosophy	Katrina Forrester	Princeton University Press	2019	320.011 K19I	2
4	Integration through law :Europe and the American federal experience	Mauro,, Cappelletti	Walter de Gruyter	1985	340.2 .C247I v. 1.	2
6	Quellen zur Reform des Straf und Strafprozeßrechts	Schubert, Werner	Walter de Gruyter & Co	1988	345.0074 .S384Q v. 2.2.	2

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Letter Number

Math Symbol

Open Punctuation

Close Punctuation

Dash Punctuation

Modifier Symbol

Final Punctuation

Space Separator

Format

Initial Punctuation

Connector Punctuation

Most occurring scripts

Most frequent character per script

Han

Hangul

Katakana

Latin

Common

Hiragana

Greek

Most occurring blocks

Most frequent character per block

ASCII

Hangul

CJK

Hiragana

None

Katakana

CJK Compat Ideographs

Number Forms

Compat Jamo

Punctuation

Modifier Letters

Math Operators

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Close Punctuation

Space Separator

Open Punctuation

Math Symbol

Dash Punctuation

Final Punctuation

Initial Punctuation

Modifier Symbol

Most occurring scripts

Most frequent character per script

Hangul

Han

Katakana

Latin

Common

Hiragana

Greek

Most occurring blocks

Most frequent character per block

ASCII

Hangul

CJK

None

Katakana

Punctuation

CJK Compat Ideographs

Hiragana

Most occurring characters