gimi9 Pandas Profiling

Dataset statistics

Number of variables	7
Number of observations	1452
Missing cells	42
Missing cells (%)	0.4%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	82.4 KiB
Average record size in memory	58.1 B

Variable types

Numeric	2
Text	4
Categorical	1

Dataset

Description	외교부 소속의 국립외교원 도서관이 소장하고 있는 도서에 대한 자료명, 저자, 발행처, 발행연도 등의 데이터를 제공합니다.
URL	https://www.data.go.kr/data/15042193/fileData.do

Alerts

`소장청구기호` has 32 (2.2%) missing values	Missing
`번호` has unique values	Unique

Reproduction

Analysis started	2023-12-12 13:42:01.421333
Analysis finished	2023-12-12 13:42:03.561595
Duration	2.14 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

번호
Real number (ℝ)

UNIQUE

Distinct	1452
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	726.5

Minimum	1
Maximum	1452
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	12.9 KiB

Quantile statistics

Minimum	1
5-th percentile	73.55
Q1	363.75
median	726.5
Q3	1089.25
95-th percentile	1379.45
Maximum	1452
Range	1451
Interquartile range (IQR)	725.5

Descriptive statistics

Standard deviation	419.30061
Coefficient of variation (CV)	0.57715156
Kurtosis	-1.2
Mean	726.5
Median Absolute Deviation (MAD)	363
Skewness	0
Sum	1054878
Variance	175813
Monotonicity	Strictly increasing

Histogram with fixed size bins (bins=50)

Value	Count	Frequency (%)
1	1	0.1%
977	1	0.1%
975	1	0.1%
974	1	0.1%
973	1	0.1%
972	1	0.1%
971	1	0.1%
970	1	0.1%
969	1	0.1%
968	1	0.1%
Other values (1442)	1442	99.3%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
1	1	0.1%
2	1	0.1%
3	1	0.1%
4	1	0.1%
5	1	0.1%
6	1	0.1%
7	1	0.1%
8	1	0.1%
9	1	0.1%
10	1	0.1%

Value	Count	Frequency (%)
1452	1	0.1%
1451	1	0.1%
1450	1	0.1%
1449	1	0.1%
1448	1	0.1%
1447	1	0.1%
1446	1	0.1%
1445	1	0.1%
1444	1	0.1%
1443	1	0.1%

서명
Text

Distinct	1451
Distinct (%)	99.9%
Missing	0
Missing (%)	0.0%
Memory size	11.5 KiB

Length

Max length	147
Median length	91
Mean length	34.342287
Min length	1

Characters and Unicode

Total characters	49865
Distinct characters	1211
Distinct categories	14 ?
Distinct scripts	7 ?
Distinct blocks	11 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1450 ?
Unique (%)	99.9%

Sample

1st row	디자인 씽킹 퍼실리테이션 대백과 :바로 써먹는 60가지 디자인 도구
2nd row	동물권 논쟁 :피터 싱어·탐 레건 그리고 제3의 해법
3rd row	(데일 카네기) 대화론 :당신의 말에 생명을 불어넣어라
4th row	(happy와 sad 그 이상이 필요한 이들을 위한) 영어 감정 표현 사전
5th row	Linguistic forms at the border of lexis and grammar :grammaticalization of adpositions across languages

Value	Count	Frequency (%)
the	273	2.7%
of	155	1.5%
and	152	1.5%
	142	1.4%
in	79	0.8%
international	57	0.6%
law	51	0.5%
a	46	0.5%
위한	45	0.4%
이야기	40	0.4%
Other values (5538)	8971	89.6%

Most occurring characters

Value	Count	Frequency (%)
	8580	17.2%
e	1632	3.3%
i	1556	3.1%
n	1525	3.1%
a	1493	3.0%
o	1357	2.7%
t	1329	2.7%
r	1119	2.2%
:	920	1.8%
s	872	1.7%
Other values (1201)	29482	59.1%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	20796	41.7%
Lowercase Letter	15993	32.1%
Space Separator	8580	17.2%
Other Punctuation	1569	3.1%
Uppercase Letter	1230	2.5%
Decimal Number	853	1.7%
Close Punctuation	269	0.5%
Open Punctuation	269	0.5%
Math Symbol	204	0.4%
Dash Punctuation	89	0.2%
Other values (4)	13	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
의	825	4.0%
이	436	2.1%
한	397	1.9%
는	366	1.8%
국	334	1.6%
가	324	1.6%
지	299	1.4%
기	289	1.4%
사	286	1.4%
전	265	1.3%
Other values (1083)	16975	81.6%

Lowercase Letter

Value	Count	Frequency (%)
e	1632	10.2%
i	1556	9.7%
n	1525	9.5%
a	1493	9.3%
o	1357	8.5%
t	1329	8.3%
r	1119	7.0%
s	872	5.5%
l	710	4.4%
c	597	3.7%
Other values (35)	3803	23.8%

Uppercase Letter

Value	Count	Frequency (%)
T	149	12.1%
A	110	8.9%
S	104	8.5%
I	100	8.1%
C	93	7.6%
E	76	6.2%
K	58	4.7%
N	55	4.5%
P	53	4.3%
U	49	4.0%
Other values (17)	383	31.1%

Other Punctuation

Value	Count	Frequency (%)
:	920	58.6%
,	275	17.5%
?	149	9.5%
'	81	5.2%
.	64	4.1%
·	53	3.4%
!	11	0.7%
"	6	0.4%
/	5	0.3%
&	3	0.2%
Other values (2)	2	0.1%

Decimal Number

Value	Count	Frequency (%)
1	193	22.6%
2	192	22.5%
0	166	19.5%
9	77	9.0%
3	58	6.8%
5	48	5.6%
4	33	3.9%
7	32	3.8%
8	29	3.4%
6	25	2.9%

Math Symbol

Value	Count	Frequency (%)
=	190	93.1%
~	7	3.4%
<	2	1.0%
+	2	1.0%
～	1	0.5%
×	1	0.5%
>	1	0.5%

Close Punctuation

Value	Count	Frequency (%)
)	258	95.9%
]	5	1.9%
』	4	1.5%
」	2	0.7%

Open Punctuation

Value	Count	Frequency (%)
(	258	95.9%
[	5	1.9%
『	4	1.5%
「	2	0.7%

Final Punctuation

Value	Count	Frequency (%)
’	3	75.0%
”	1	25.0%

Letter Number

Value	Count	Frequency (%)
Ⅲ	2	66.7%
Ⅱ	1	33.3%

Initial Punctuation

Value	Count	Frequency (%)
‘	1	50.0%
“	1	50.0%

Space Separator

Value	Count	Frequency (%)
	8580	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	89	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	4	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	19997	40.1%
Latin	17165	34.4%
Common	11843	23.8%
Han	514	1.0%
Katakana	156	0.3%
Hiragana	129	0.3%
Cyrillic	61	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
의	825	4.1%
이	436	2.2%
한	397	2.0%
는	366	1.8%
국	334	1.7%
가	324	1.6%
지	299	1.5%
기	289	1.4%
사	286	1.4%
전	265	1.3%
Other values (768)	16176	80.9%

Han

Value	Count	Frequency (%)
日	10	1.9%
際	9	1.8%
新	9	1.8%
論	9	1.8%
史	9	1.8%
中	9	1.8%
政	9	1.8%
衛	8	1.6%
國	8	1.6%
治	8	1.6%
Other values (230)	426	82.9%

Latin

Value	Count	Frequency (%)
e	1632	9.5%
i	1556	9.1%
n	1525	8.9%
a	1493	8.7%
o	1357	7.9%
t	1329	7.7%
r	1119	6.5%
s	872	5.1%
l	710	4.1%
c	597	3.5%
Other values (44)	4975	29.0%

Common

Value	Count	Frequency (%)
	8580	72.4%
:	920	7.8%
,	275	2.3%
)	258	2.2%
(	258	2.2%
1	193	1.6%
2	192	1.6%
=	190	1.6%
0	166	1.4%
?	149	1.3%
Other values (34)	662	5.6%

Katakana

Value	Count	Frequency (%)
ク	13	8.3%
ア	12	7.7%
ン	10	6.4%
ッ	9	5.8%
ジ	8	5.1%
ド	7	4.5%
ブ	6	3.8%
ロ	6	3.8%
ハ	6	3.8%
ス	5	3.2%
Other values (33)	74	47.4%

Hiragana

Value	Count	Frequency (%)
の	35	27.1%
る	18	14.0%
と	10	7.8%
す	8	6.2%
を	7	5.4%
に	5	3.9%
か	5	3.9%
が	4	3.1%
な	3	2.3%
た	3	2.3%
Other values (22)	31	24.0%

Cyrillic

Value	Count	Frequency (%)
о	10	16.4%
к	7	11.5%
р	7	11.5%
н	5	8.2%
и	4	6.6%
в	4	6.6%
а	3	4.9%
с	3	4.9%
е	3	4.9%
м	2	3.3%
Other values (10)	13	21.3%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	28930	58.0%
Hangul	19989	40.1%
CJK	513	1.0%
Katakana	156	0.3%
Hiragana	129	0.3%
None	69	0.1%
Cyrillic	61	0.1%
Compat Jamo	8	< 0.1%
Punctuation	6	< 0.1%
Number Forms	3	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	8580	29.7%
e	1632	5.6%
i	1556	5.4%
n	1525	5.3%
a	1493	5.2%
o	1357	4.7%
t	1329	4.6%
r	1119	3.9%
:	920	3.2%
s	872	3.0%
Other values (73)	8547	29.5%

Hangul

Value	Count	Frequency (%)
의	825	4.1%
이	436	2.2%
한	397	2.0%
는	366	1.8%
국	334	1.7%
가	324	1.6%
지	299	1.5%
기	289	1.4%
사	286	1.4%
전	265	1.3%
Other values (766)	16168	80.9%

None

Value	Count	Frequency (%)
·	53	76.8%
『	4	5.8%
』	4	5.8%
」	2	2.9%
「	2	2.9%
～	1	1.4%
×	1	1.4%
ı	1	1.4%
、	1	1.4%

Hiragana

Value	Count	Frequency (%)
の	35	27.1%
る	18	14.0%
と	10	7.8%
す	8	6.2%
を	7	5.4%
に	5	3.9%
か	5	3.9%
が	4	3.1%
な	3	2.3%
た	3	2.3%
Other values (22)	31	24.0%

Katakana

Value	Count	Frequency (%)
ク	13	8.3%
ア	12	7.7%
ン	10	6.4%
ッ	9	5.8%
ジ	8	5.1%
ド	7	4.5%
ブ	6	3.8%
ロ	6	3.8%
ハ	6	3.8%
ス	5	3.2%
Other values (33)	74	47.4%

CJK

Value	Count	Frequency (%)
日	10	1.9%
際	9	1.8%
新	9	1.8%
論	9	1.8%
史	9	1.8%
中	9	1.8%
政	9	1.8%
衛	8	1.6%
國	8	1.6%
治	8	1.6%
Other values (229)	425	82.8%

Cyrillic

Value	Count	Frequency (%)
о	10	16.4%
к	7	11.5%
р	7	11.5%
н	5	8.2%
и	4	6.6%
в	4	6.6%
а	3	4.9%
с	3	4.9%
е	3	4.9%
м	2	3.3%
Other values (10)	13	21.3%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	5	62.5%
ㅡ	3	37.5%

Punctuation

Value	Count	Frequency (%)
’	3	50.0%
‘	1	16.7%
”	1	16.7%
“	1	16.7%

Number Forms

Value	Count	Frequency (%)
Ⅲ	2	66.7%
Ⅱ	1	33.3%

CJK Compat Ideographs

Value	Count	Frequency (%)
不	1	100.0%

저자
Text

Distinct	1334
Distinct (%)	92.1%
Missing	3
Missing (%)	0.2%
Memory size	11.5 KiB

Length

Max length	51
Median length	48
Mean length	6.8640442
Min length	2

Characters and Unicode

Total characters	9946
Distinct characters	678
Distinct categories	13 ?
Distinct scripts	5 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1251 ?
Unique (%)	86.3%

Sample

1st row	알다나, 멜리사
2nd row	임종식
3rd row	카네기, 데일
4th row	노리스, 샘
5th row	Rhee, Seongha

Value	Count	Frequency (%)
michael	11	0.5%
존	11	0.5%
j	10	0.4%
r	9	0.4%
m	7	0.3%
l	7	0.3%
브라이언	6	0.3%
카네기	6	0.3%
데일	6	0.3%
a	6	0.3%
Other values (1876)	2186	96.5%

Most occurring characters

Value	Count	Frequency (%)
	829	8.3%
,	529	5.3%
e	354	3.6%
a	353	3.5%
n	294	3.0%
i	258	2.6%
r	235	2.4%
o	228	2.3%
이	179	1.8%
l	172	1.7%
Other values (668)	6515	65.5%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	4786	48.1%
Lowercase Letter	3020	30.4%
Space Separator	829	8.3%
Uppercase Letter	708	7.1%
Other Punctuation	567	5.7%
Dash Punctuation	17	0.2%
Open Punctuation	4	< 0.1%
Modifier Symbol	4	< 0.1%
Close Punctuation	4	< 0.1%
Decimal Number	4	< 0.1%
Other values (3)	3	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
이	179	3.7%
김	145	3.0%
스	94	2.0%
정	84	1.8%
리	67	1.4%
영	62	1.3%
박	52	1.1%
시	48	1.0%
마	48	1.0%
한	47	1.0%
Other values (598)	3960	82.7%

Lowercase Letter

Value	Count	Frequency (%)
e	354	11.7%
a	353	11.7%
n	294	9.7%
i	258	8.5%
r	235	7.8%
o	228	7.5%
l	172	5.7%
h	149	4.9%
t	148	4.9%
s	127	4.2%
Other values (18)	702	23.2%

Uppercase Letter

Value	Count	Frequency (%)
M	68	9.6%
S	61	8.6%
J	52	7.3%
P	50	7.1%
A	45	6.4%
B	45	6.4%
G	42	5.9%
H	39	5.5%
R	37	5.2%
C	36	5.1%
Other values (16)	233	32.9%

Other Punctuation

Value	Count	Frequency (%)
,	529	93.3%
?	22	3.9%
.	14	2.5%
/	1	0.2%
&	1	0.2%

Decimal Number

Value	Count	Frequency (%)
2	2	50.0%
0	1	25.0%
1	1	25.0%

Space Separator

Value	Count	Frequency (%)
	829	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	17	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	4	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	4	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	4	100.0%

Math Symbol

Value	Count	Frequency (%)
+	1	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	1	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	4554	45.8%
Latin	3728	37.5%
Common	1432	14.4%
Han	220	2.2%
Katakana	12	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
이	179	3.9%
김	145	3.2%
스	94	2.1%
정	84	1.8%
리	67	1.5%
영	62	1.4%
박	52	1.1%
시	48	1.1%
마	48	1.1%
한	47	1.0%
Other values (467)	3728	81.9%

Han

Value	Count	Frequency (%)
田	6	2.7%
社	6	2.7%
朝	6	2.7%
新	6	2.7%
雲	6	2.7%
聞	6	2.7%
集	6	2.7%
編	6	2.7%
正	4	1.8%
井	4	1.8%
Other values (113)	164	74.5%

Latin

Value	Count	Frequency (%)
e	354	9.5%
a	353	9.5%
n	294	7.9%
i	258	6.9%
r	235	6.3%
o	228	6.1%
l	172	4.6%
h	149	4.0%
t	148	4.0%
s	127	3.4%
Other values (44)	1410	37.8%

Common

Value	Count	Frequency (%)
	829	57.9%
,	529	36.9%
?	22	1.5%
-	17	1.2%
.	14	1.0%
(	4	0.3%
`	4	0.3%
)	4	0.3%
2	2	0.1%
/	1	0.1%
Other values (6)	6	0.4%

Katakana

Value	Count	Frequency (%)
ア	3	25.0%
ク	2	16.7%
ラ	2	16.7%
ン	1	8.3%
イ	1	8.3%
ジ	1	8.3%
チ	1	8.3%
ブ	1	8.3%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	5154	51.8%
Hangul	4554	45.8%
CJK	218	2.2%
Katakana	12	0.1%
None	4	< 0.1%
CJK Compat Ideographs	2	< 0.1%
Punctuation	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	829	16.1%
,	529	10.3%
e	354	6.9%
a	353	6.8%
n	294	5.7%
i	258	5.0%
r	235	4.6%
o	228	4.4%
l	172	3.3%
h	149	2.9%
Other values (55)	1753	34.0%

Hangul

Value	Count	Frequency (%)
이	179	3.9%
김	145	3.2%
스	94	2.1%
정	84	1.8%
리	67	1.5%
영	62	1.4%
박	52	1.1%
시	48	1.1%
마	48	1.1%
한	47	1.0%
Other values (467)	3728	81.9%

CJK

Value	Count	Frequency (%)
田	6	2.8%
社	6	2.8%
朝	6	2.8%
新	6	2.8%
雲	6	2.8%
聞	6	2.8%
集	6	2.8%
編	6	2.8%
正	4	1.8%
井	4	1.8%
Other values (111)	162	74.3%

Katakana

Value	Count	Frequency (%)
ア	3	25.0%
ク	2	16.7%
ラ	2	16.7%
ン	1	8.3%
イ	1	8.3%
ジ	1	8.3%
チ	1	8.3%
ブ	1	8.3%

None

Value	Count	Frequency (%)
ø	2	50.0%
ł	1	25.0%
ß	1	25.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
李	1	50.0%
龍	1	50.0%

Punctuation

Value	Count	Frequency (%)
‘	1	50.0%
’	1	50.0%

발행처
Text

Distinct	728
Distinct (%)	50.2%
Missing	3
Missing (%)	0.2%
Memory size	11.5 KiB

Length

Max length	66
Median length	50
Mean length	7.6859903
Min length	1

Characters and Unicode

Total characters	11137
Distinct characters	541
Distinct categories	10 ?
Distinct scripts	6 ?
Distinct blocks	6 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	506 ?
Unique (%)	34.9%

Sample

1st row	유엑스리뷰
2nd row	경진출판
3rd row	국일미디어
4th row	길벗이지톡
5th row	글로벌콘텐츠

Value	Count	Frequency (%)
press	102	5.2%
university	92	4.7%
박영사	62	3.1%
동북아역사재단	33	1.7%
oxford	32	1.6%
cambridge	22	1.1%
books	22	1.1%
문학동네	21	1.1%
routledge	20	1.0%
	20	1.0%
Other values (801)	1544	78.4%

Most occurring characters

Value	Count	Frequency (%)
	523	4.7%
e	495	4.4%
r	478	4.3%
s	459	4.1%
i	457	4.1%
n	345	3.1%
o	310	2.8%
사	303	2.7%
a	272	2.4%
t	270	2.4%
Other values (531)	7225	64.9%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	5144	46.2%
Lowercase Letter	4448	39.9%
Uppercase Letter	857	7.7%
Space Separator	523	4.7%
Other Punctuation	83	0.7%
Decimal Number	47	0.4%
Open Punctuation	14	0.1%
Close Punctuation	14	0.1%
Modifier Symbol	4	< 0.1%
Dash Punctuation	3	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
사	303	5.9%
스	176	3.4%
북	150	2.9%
문	131	2.5%
아	113	2.2%
출	96	1.9%
판	96	1.9%
학	93	1.8%
한	88	1.7%
이	86	1.7%
Other values (464)	3812	74.1%

Lowercase Letter

Value	Count	Frequency (%)
e	495	11.1%
r	478	10.7%
s	459	10.3%
i	457	10.3%
n	345	7.8%
o	310	7.0%
a	272	6.1%
t	270	6.1%
l	213	4.8%
d	138	3.1%
Other values (15)	1011	22.7%

Uppercase Letter

Value	Count	Frequency (%)
P	172	20.1%
U	100	11.7%
C	78	9.1%
B	68	7.9%
S	60	7.0%
R	42	4.9%
O	36	4.2%
I	36	4.2%
L	33	3.9%
H	31	3.6%
Other values (15)	201	23.5%

Other Punctuation

Value	Count	Frequency (%)
&	23	27.7%
?	21	25.3%
.	19	22.9%
,	14	16.9%
'	4	4.8%
#	1	1.2%
＆	1	1.2%

Decimal Number

Value	Count	Frequency (%)
2	24	51.1%
1	19	40.4%
7	2	4.3%
0	1	2.1%
4	1	2.1%

Space Separator

Value	Count	Frequency (%)
	523	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	14	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	14	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	4	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	3	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Latin	5305	47.6%
Hangul	4851	43.6%
Common	688	6.2%
Han	261	2.3%
Katakana	29	0.3%
Hiragana	3	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
사	303	6.2%
스	176	3.6%
북	150	3.1%
문	131	2.7%
아	113	2.3%
출	96	2.0%
판	96	2.0%
학	93	1.9%
한	88	1.8%
이	86	1.8%
Other values (368)	3519	72.5%

Han

Value	Count	Frequency (%)
社	34	13.0%
書	16	6.1%
新	14	5.4%
文	14	5.4%
房	12	4.6%
聞	10	3.8%
朝	7	2.7%
雲	6	2.3%
日	6	2.3%
本	5	1.9%
Other values (66)	137	52.5%

Latin

Value	Count	Frequency (%)
e	495	9.3%
r	478	9.0%
s	459	8.7%
i	457	8.6%
n	345	6.5%
o	310	5.8%
a	272	5.1%
t	270	5.1%
l	213	4.0%
P	172	3.2%
Other values (40)	1834	34.6%

Common

Value	Count	Frequency (%)
	523	76.0%
2	24	3.5%
&	23	3.3%
?	21	3.1%
.	19	2.8%
1	19	2.8%
(	14	2.0%
)	14	2.0%
,	14	2.0%
`	4	0.6%
Other values (7)	13	1.9%

Katakana

Value	Count	Frequency (%)
ル	4	13.8%
ネ	4	13.8%
ヴ	3	10.3%
ミ	3	10.3%
ァ	3	10.3%
ド	1	3.4%
モ	1	3.4%
ン	1	3.4%
ヤ	1	3.4%
イ	1	3.4%
Other values (7)	7	24.1%

Hiragana

Value	Count	Frequency (%)
も	1	33.3%
す	1	33.3%
ず	1	33.3%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	5992	53.8%
Hangul	4851	43.6%
CJK	261	2.3%
Katakana	29	0.3%
Hiragana	3	< 0.1%
None	1	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	523	8.7%
e	495	8.3%
r	478	8.0%
s	459	7.7%
i	457	7.6%
n	345	5.8%
o	310	5.2%
a	272	4.5%
t	270	4.5%
l	213	3.6%
Other values (56)	2170	36.2%

Hangul

Value	Count	Frequency (%)
사	303	6.2%
스	176	3.6%
북	150	3.1%
문	131	2.7%
아	113	2.3%
출	96	2.0%
판	96	2.0%
학	93	1.9%
한	88	1.8%
이	86	1.8%
Other values (368)	3519	72.5%

CJK

Value	Count	Frequency (%)
社	34	13.0%
書	16	6.1%
新	14	5.4%
文	14	5.4%
房	12	4.6%
聞	10	3.8%
朝	7	2.7%
雲	6	2.3%
日	6	2.3%
本	5	1.9%
Other values (66)	137	52.5%

Katakana

Value	Count	Frequency (%)
ル	4	13.8%
ネ	4	13.8%
ヴ	3	10.3%
ミ	3	10.3%
ァ	3	10.3%
ド	1	3.4%
モ	1	3.4%
ン	1	3.4%
ヤ	1	3.4%
イ	1	3.4%
Other values (7)	7	24.1%

Hiragana

Value	Count	Frequency (%)
も	1	33.3%
す	1	33.3%
ず	1	33.3%

None

Value	Count	Frequency (%)
＆	1	100.0%

발행연도
Real number (ℝ)

Distinct	42
Distinct (%)	2.9%
Missing	4
Missing (%)	0.3%
Infinite	0
Infinite (%)	0.0%
Mean	2019.2866

Minimum	1961
Maximum	2023
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	12.9 KiB

Quantile statistics

Minimum	1961
5-th percentile	2006
Q1	2020
median	2022
Q3	2022
95-th percentile	2023
Maximum	2023
Range	62
Interquartile range (IQR)	2

Descriptive statistics

Standard deviation	6.5045867
Coefficient of variation (CV)	0.00322123
Kurtosis	15.18145
Mean	2019.2866
Median Absolute Deviation (MAD)	1
Skewness	-3.5006052
Sum	2923927
Variance	42.309648
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=42)

Value	Count	Frequency (%)
2022	696	47.9%
2021	216	14.9%
2023	158	10.9%
2020	63	4.3%
2019	30	2.1%
2014	29	2.0%
2015	26	1.8%
2012	25	1.7%
2018	25	1.7%
2016	22	1.5%
Other values (32)	158	10.9%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
1961	1	0.1%
1972	1	0.1%
1977	1	0.1%
1982	2	0.1%
1984	1	0.1%
1985	1	0.1%
1987	2	0.1%
1988	1	0.1%
1989	1	0.1%
1990	3	0.2%

Value	Count	Frequency (%)
2023	158	10.9%
2022	696	47.9%
2021	216	14.9%
2020	63	4.3%
2019	30	2.1%
2018	25	1.7%
2017	18	1.2%
2016	22	1.5%
2015	26	1.8%
2014	29	2.0%

유형
Categorical

Distinct	2
Distinct (%)	0.1%
Missing	0
Missing (%)	0.0%
Memory size	11.5 KiB

단행본(KORMARC)	1209
단행본(USMARC)	243

Length

Max length	12
Median length	12
Mean length	11.832645
Min length	11

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	단행본(KORMARC)
2nd row	단행본(KORMARC)
3rd row	단행본(KORMARC)
4th row	단행본(KORMARC)
5th row	단행본(USMARC)

Common Values

Value	Count	Frequency (%)
단행본(KORMARC)	1209	83.3%
단행본(USMARC)	243	16.7%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
단행본(kormarc	1209	83.3%
단행본(usmarc	243	16.7%

소장청구기호
Text

MISSING

Distinct	1420
Distinct (%)	100.0%
Missing	32
Missing (%)	2.2%
Memory size	11.5 KiB

Length

Max length	140
Median length	105
Mean length	22.933099
Min length	14

Characters and Unicode

Total characters	32565
Distinct characters	451
Distinct categories	9 ?
Distinct scripts	3 ?
Distinct blocks	3 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1420 ?
Unique (%)	100.0%

Sample

1st row	국립외교원 658.4063 알221디
2nd row	국립외교원 179.3 임75동
3rd row	국립외교원 808.5 카213대
4th row	국립외교원 428 노239영
5th row	국립외교원 401 R469L

Value	Count	Frequency (%)
국립외교원	1420	27.0%
외교정책자료실	208	4.0%
i	93	1.8%
342.519	36	0.7%
951.903	33	0.6%
v.1/v.2	25	0.5%
895.74	24	0.5%
일73	23	0.4%
r	23	0.4%
158.1	21	0.4%
Other values (2327)	3356	63.8%

Most occurring characters

Value	Count	Frequency (%)
	3842	11.8%
3	2300	7.1%
1	1849	5.7%
2	1755	5.4%
9	1726	5.3%
.	1701	5.2%
외	1630	5.0%
교	1630	5.0%
5	1557	4.8%
국	1463	4.5%
Other values (441)	13112	40.3%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	14368	44.1%
Other Letter	11247	34.5%
Space Separator	3842	11.8%
Other Punctuation	1977	6.1%
Uppercase Letter	768	2.4%
Lowercase Letter	338	1.0%
Open Punctuation	11	< 0.1%
Close Punctuation	11	< 0.1%
Dash Punctuation	3	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
외	1630	14.5%
교	1630	14.5%
국	1463	13.0%
원	1424	12.7%
립	1420	12.6%
정	280	2.5%
자	222	2.0%
책	211	1.9%
실	209	1.9%
료	208	1.8%
Other values (375)	2550	22.7%

Uppercase Letter

Value	Count	Frequency (%)
I	117	15.2%
S	52	6.8%
R	50	6.5%
P	47	6.1%
M	45	5.9%
G	44	5.7%
C	43	5.6%
H	42	5.5%
F	33	4.3%
B	33	4.3%
Other values (16)	262	34.1%

Lowercase Letter

Value	Count	Frequency (%)
v	267	79.0%
w	9	2.7%
c	8	2.4%
h	7	2.1%
s	6	1.8%
a	5	1.5%
l	5	1.5%
f	4	1.2%
p	3	0.9%
i	3	0.9%
Other values (12)	21	6.2%

Decimal Number

Value	Count	Frequency (%)
3	2300	16.0%
1	1849	12.9%
2	1755	12.2%
9	1726	12.0%
5	1557	10.8%
7	1202	8.4%
0	1202	8.4%
4	1063	7.4%
8	935	6.5%
6	779	5.4%

Other Punctuation

Value	Count	Frequency (%)
.	1701	86.0%
/	231	11.7%
,	32	1.6%
?	13	0.7%

Space Separator

Value	Count	Frequency (%)
	3842	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	11	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	11	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	3	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	20212	62.1%
Hangul	11247	34.5%
Latin	1106	3.4%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
외	1630	14.5%
교	1630	14.5%
국	1463	13.0%
원	1424	12.7%
립	1420	12.6%
정	280	2.5%
자	222	2.0%
책	211	1.9%
실	209	1.9%
료	208	1.8%
Other values (375)	2550	22.7%

Latin

Value	Count	Frequency (%)
v	267	24.1%
I	117	10.6%
S	52	4.7%
R	50	4.5%
P	47	4.2%
M	45	4.1%
G	44	4.0%
C	43	3.9%
H	42	3.8%
F	33	3.0%
Other values (38)	366	33.1%

Common

Value	Count	Frequency (%)
	3842	19.0%
3	2300	11.4%
1	1849	9.1%
2	1755	8.7%
9	1726	8.5%
.	1701	8.4%
5	1557	7.7%
7	1202	5.9%
0	1202	5.9%
4	1063	5.3%
Other values (8)	2015	10.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	21318	65.5%
Hangul	11125	34.2%
Compat Jamo	122	0.4%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	3842	18.0%
3	2300	10.8%
1	1849	8.7%
2	1755	8.2%
9	1726	8.1%
.	1701	8.0%
5	1557	7.3%
7	1202	5.6%
0	1202	5.6%
4	1063	5.0%
Other values (56)	3121	14.6%

Hangul

Value	Count	Frequency (%)
외	1630	14.7%
교	1630	14.7%
국	1463	13.2%
원	1424	12.8%
립	1420	12.8%
정	280	2.5%
자	222	2.0%
책	211	1.9%
실	209	1.9%
료	208	1.9%
Other values (360)	2428	21.8%

Compat Jamo

Value	Count	Frequency (%)
ㅇ	23	18.9%
ㄱ	16	13.1%
ㅈ	15	12.3%
ㅎ	10	8.2%
ㅂ	9	7.4%
ㅁ	9	7.4%
ㅅ	8	6.6%
ㄴ	8	6.6%
ㄷ	7	5.7%
ㅊ	6	4.9%
Other values (5)	11	9.0%

번호
발행연도

발행연도
번호

발행연도
번호

Phik (φk)
Auto

Heatmap
Table

	번호	발행연도	유형
번호	1.000	0.361	0.264
발행연도	0.361	1.000	0.152
유형	0.264	0.152	1.000

Heatmap
Table

	번호	발행연도	유형
번호	1.000	-0.362	0.202
발행연도	-0.362	1.000	0.150
유형	0.202	0.150	1.000

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	번호	서명	저자	발행처	발행연도	유형	소장청구기호
0	1	디자인 씽킹 퍼실리테이션 대백과 :바로 써먹는 60가지 디자인 도구	알다나, 멜리사	유엑스리뷰	2021	단행본(KORMARC)	국립외교원 658.4063 알221디
1	2	동물권 논쟁 :피터 싱어·탐 레건 그리고 제3의 해법	임종식	경진출판	2021	단행본(KORMARC)	국립외교원 179.3 임75동
2	3	(데일 카네기) 대화론 :당신의 말에 생명을 불어넣어라	카네기, 데일	국일미디어	2023	단행본(KORMARC)	국립외교원 808.5 카213대
3	4	(happy와 sad 그 이상이 필요한 이들을 위한) 영어 감정 표현 사전	노리스, 샘	길벗이지톡	2022	단행본(KORMARC)	국립외교원 428 노239영
4	5	Linguistic forms at the border of lexis and grammar :grammaticalization of adpositions across languages	Rhee, Seongha	글로벌콘텐츠	2021	단행본(USMARC)	국립외교원 401 R469L
5	6	식민지 조선의 서양음악 수용과 일본인의 음악활동	김지선	민속원	2021	단행본(KORMARC)	국립외교원 951.903 김79식
6	7	지역을 디자인하다 :지방소멸에 대처하는 지역마케팅 교과서	미야조에 겐시	학연문화사	2021	단행본(KORMARC)	국립외교원 307 미62지
7	8	(파이썬으로 배우는) 과학계산	김웅태	서울대학교출판문화원	2021	단행본(KORMARC)	국립외교원 005.1 김67과
8	9	(2023 제14회) 젊은작가상 수상작품집	이미상	문학동네	2023	단행본(KORMARC)	국립외교원 895.73 젊68 2023 외교정책자료실 811.32 젊68 2023
9	10	썬킴의 거침없는 중국사 :(신화시대부터 청나라까지)영화처럼 읽는 중국 역사 이야기	킴, 썬	지식의숲	2023	단행본(KORMARC)	국립외교원 951 킴53썬

	번호	서명	저자	발행처	발행연도	유형	소장청구기호
1442	1443	수출입물류통계연보	관세청	관세청 한국관세무역개발원	2006	단행본(KORMARC)	국립외교원 R 382.0212 관53수 2005/2006/2014/2015/2016/2017/2020/2021, R 382.0212 관53수 2018
1443	1444	(The) new Mandarins :how British foreign folicy works	Dickie, John	I. B. Tauris	2004	단행본(KORMARC)	국립외교원 327.41 D552N
1444	1445	북한 주요 인물정보	통일부	통일부	2000	단행본(KORMARC)	국립외교원 R 920.05193 북91ㄹ 2014/2015/2017/2018/2021/2022
1445	1446	북한 기관별 인명록	통일부	통일부	1999	단행본(KORMARC)	국립외교원 R 920.05193 북91ㄷ 2012/2012(색인)/2013/2014/2015/2017/2018/2020/2021/2022, R 920.05193 북91ㄷ 2019
1446	1447	통일한국의 외교안보 :전망과 대책	이태환	세종연구소	1999	단행본(KORMARC)	국립외교원 327.519 이832통
1447	1448	북한인권백서	통일연구원	통일연구원	1996	단행본(KORMARC)	국립외교원 L 323.4095193 북91 2009, R 323.4095193 북91 2009/2010/2011/2012/2013/2014/2015/2016/2017/2018/2021...
1448	1449	Strategy and arms control	Schelling, Thomas C	The Twentieth Century Fund	1961	단행본(KORMARC)	국립외교원 327.174 S322s
1449	1450	United Nations handbook	New Zealand Ministry of Foreign Affairs	New Zealand Ministry of Foreign Affairs	1977	단행본(KORMARC)	국립외교원 R 341.2302 U58 2000/2001/2008/2009/2011/2012/2017/2018/2019/2020
1450	1451	국방백서	국방부	國防部	<NA>	단행본(KORMARC)	국립외교원 R 355.45 국41 2022, R 355.45 국41 2018
1451	1452	海外의 韓國獨立運動史料	國家報勳處	國家報勳處	1995	단행본(KORMARC)	국립외교원 H 951.903 해66 v.36/v.4/v.45/v.6/v.7/v.8/v.9

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Math Symbol

Close Punctuation

Open Punctuation

Final Punctuation

Letter Number

Initial Punctuation

Space Separator

Dash Punctuation

Modifier Symbol

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Katakana

Hiragana

Cyrillic

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

Hiragana

Katakana

CJK

Cyrillic

Compat Jamo

Punctuation

Number Forms

CJK Compat Ideographs

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Space Separator

Dash Punctuation

Open Punctuation

Modifier Symbol

Close Punctuation

Math Symbol

Initial Punctuation

Final Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Katakana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

CJK

Katakana

None

CJK Compat Ideographs

Punctuation

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation