gimi9 Pandas Profiling

Dataset statistics

Number of variables	5
Number of observations	4376
Missing cells	1221
Missing cells (%)	5.6%
Duplicate rows	240
Duplicate rows (%)	5.5%
Total size in memory	171.1 KiB
Average record size in memory	40.0 B

Variable types

Text	4
DateTime	1

Dataset

Description	여성사전시관에서 관리하고 있는 도서 정보를 제공합니다. (도서명, 저자명, 출판사명, 출판연도, 데이터기준일자)
Author	여성가족부
URL	https://www.data.go.kr/data/15085795/fileData.do

Alerts

`데이터기준일자` has constant value ""	Constant
Dataset has 240 (5.5%) duplicate rows	Duplicates
`저자명` has 789 (18.0%) missing values	Missing
`출판사명` has 432 (9.9%) missing values	Missing

Reproduction

Analysis started	2023-12-12 06:59:43.751890
Analysis finished	2023-12-12 06:59:45.312256
Duration	1.56 second
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

도서명
Text

Distinct	3987
Distinct (%)	91.1%
Missing	0
Missing (%)	0.0%
Memory size	34.3 KiB

Length

Max length	116
Median length	73
Mean length	17.280393
Min length	1

Characters and Unicode

Total characters	75619
Distinct characters	1243
Distinct categories	17 ?
Distinct scripts	7 ?
Distinct blocks	12 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	3735 ?
Unique (%)	85.4%

Sample

1st row	독립을 향한 여성영웅들의 행진
2nd row	토지주택박물관 전시도록
3rd row	"다문화 가정의 현화과 정책방안"-경제, 여성, 자녀교육문제 중심으로-
4th row	"다시함께"와 함께걷기
5th row	"다시함께"와 함께걷기 2

Value	Count	Frequency (%)
	280	1.6%
여성	140	0.8%
연구	138	0.8%
역사	103	0.6%
한국	103	0.6%
이야기	94	0.5%
위한	90	0.5%
1	79	0.5%
정책보고서	73	0.4%
2	71	0.4%
Other values (8301)	16186	93.3%

Most occurring characters

Value	Count	Frequency (%)
	13415	17.7%
성	1657	2.2%
의	1586	2.1%
여	1523	2.0%
사	1293	1.7%
1	1137	1.5%
한	1079	1.4%
0	1069	1.4%
2	935	1.2%
기	861	1.1%
Other values (1233)	51064	67.5%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	51727	68.4%
Space Separator	13419	17.7%
Decimal Number	4789	6.3%
Lowercase Letter	1841	2.4%
Other Punctuation	1512	2.0%
Uppercase Letter	1253	1.7%
Dash Punctuation	443	0.6%
Close Punctuation	184	0.2%
Open Punctuation	183	0.2%
Math Symbol	170	0.2%
Other values (7)	98	0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
성	1657	3.2%
의	1586	3.1%
여	1523	2.9%
사	1293	2.5%
한	1079	2.1%
기	861	1.7%
국	852	1.6%
이	718	1.4%
대	687	1.3%
아	603	1.2%
Other values (1127)	40868	79.0%

Uppercase Letter

Value	Count	Frequency (%)
E	125	10.0%
I	106	8.5%
A	96	7.7%
T	81	6.5%
O	80	6.4%
F	77	6.1%
N	75	6.0%
R	68	5.4%
S	67	5.3%
C	58	4.6%
Other values (17)	420	33.5%

Lowercase Letter

Value	Count	Frequency (%)
e	263	14.3%
o	179	9.7%
n	177	9.6%
i	147	8.0%
t	140	7.6%
a	127	6.9%
r	126	6.8%
s	100	5.4%
l	83	4.5%
u	77	4.2%
Other values (15)	422	22.9%

Other Punctuation

Value	Count	Frequency (%)
,	494	32.7%
:	380	25.1%
'	295	19.5%
.	177	11.7%
/	54	3.6%
?	38	2.5%
"	34	2.2%
!	26	1.7%
•	4	0.3%
&	4	0.3%
Other values (3)	6	0.4%

Decimal Number

Value	Count	Frequency (%)
1	1137	23.7%
0	1069	22.3%
2	935	19.5%
3	341	7.1%
5	267	5.6%
9	266	5.6%
4	241	5.0%
6	195	4.1%
7	173	3.6%
8	165	3.4%

Math Symbol

Value	Count	Frequency (%)
~	60	35.3%
∙	50	29.4%
>	26	15.3%
<	26	15.3%
+	6	3.5%
×	1	0.6%
=	1	0.6%

Letter Number

Value	Count	Frequency (%)
Ⅱ	21	50.0%
Ⅰ	9	21.4%
Ⅲ	5	11.9%
Ⅳ	5	11.9%
Ⅴ	1	2.4%
Ⅹ	1	2.4%

Dash Punctuation

Value	Count	Frequency (%)
-	438	98.9%
―	4	0.9%
–	1	0.2%

Close Punctuation

Value	Count	Frequency (%)
)	174	94.6%
』	9	4.9%
」	1	0.5%

Open Punctuation

Value	Count	Frequency (%)
(	173	94.5%
『	9	4.9%
「	1	0.5%

Space Separator

Value	Count	Frequency (%)
	13415	> 99.9%
	4	< 0.1%

Other Number

Value	Count	Frequency (%)
②	1	50.0%
①	1	50.0%

Connector Punctuation

Value	Count	Frequency (%)
_	44	100.0%

Spacing Mark

Value	Count	Frequency (%)
〮	3	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	3	100.0%

Modifier Letter

Value	Count	Frequency (%)
ー	2	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	2	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	51110	67.6%
Common	20753	27.4%
Latin	3135	4.1%
Han	529	0.7%
Katakana	49	0.1%
Hiragana	42	0.1%
Greek	1	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
성	1657	3.2%
의	1586	3.1%
여	1523	3.0%
사	1293	2.5%
한	1079	2.1%
기	861	1.7%
국	852	1.7%
이	718	1.4%
대	687	1.3%
아	603	1.2%
Other values (876)	40251	78.8%

Han

Value	Count	Frequency (%)
性	30	5.7%
史	26	4.9%
女	24	4.5%
新	19	3.6%
展	18	3.4%
硏	14	2.6%
究	14	2.6%
年	13	2.5%
歷	11	2.1%
女	10	1.9%
Other values (202)	350	66.2%

Latin

Value	Count	Frequency (%)
e	263	8.4%
o	179	5.7%
n	177	5.6%
i	147	4.7%
t	140	4.5%
a	127	4.1%
r	126	4.0%
E	125	4.0%
I	106	3.4%
s	100	3.2%
Other values (47)	1645	52.5%

Common

Value	Count	Frequency (%)
	13415	64.6%
1	1137	5.5%
0	1069	5.2%
2	935	4.5%
,	494	2.4%
-	438	2.1%
:	380	1.8%
3	341	1.6%
'	295	1.4%
5	267	1.3%
Other values (37)	1982	9.6%

Hiragana

Value	Count	Frequency (%)
の	7	16.7%
と	4	9.5%
か	4	9.5%
み	4	9.5%
う	3	7.1%
よ	2	4.8%
る	2	4.8%
ら	2	4.8%
お	2	4.8%
す	1	2.4%
Other values (11)	11	26.2%

Katakana

Value	Count	Frequency (%)
ア	5	10.2%
ダ	4	8.2%
ェ	4	8.2%
ム	4	8.2%
ヅ	4	8.2%
ン	4	8.2%
ジ	3	6.1%
ソ	3	6.1%
リ	2	4.1%
ォ	2	4.1%
Other values (9)	14	28.6%

Greek

Value	Count	Frequency (%)
Ι	1	100.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	51093	67.6%
ASCII	23752	31.4%
CJK	498	0.7%
Katakana	51	0.1%
Math Operators	50	0.1%
Number Forms	42	0.1%
Hiragana	42	0.1%
CJK Compat Ideographs	31	< 0.1%
None	29	< 0.1%
Punctuation	15	< 0.1%
Other values (2)	16	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	13415	56.5%
1	1137	4.8%
0	1069	4.5%
2	935	3.9%
,	494	2.1%
-	438	1.8%
:	380	1.6%
3	341	1.4%
'	295	1.2%
5	267	1.1%
Other values (72)	4981	21.0%

Hangul

Value	Count	Frequency (%)
성	1657	3.2%
의	1586	3.1%
여	1523	3.0%
사	1293	2.5%
한	1079	2.1%
기	861	1.7%
국	852	1.7%
이	718	1.4%
대	687	1.3%
아	603	1.2%
Other values (861)	40234	78.7%

Math Operators

Value	Count	Frequency (%)
∙	50	100.0%

CJK

Value	Count	Frequency (%)
性	30	6.0%
史	26	5.2%
新	19	3.8%
展	18	3.6%
硏	14	2.8%
究	14	2.8%
年	13	2.6%
歷	11	2.2%
女	10	2.0%
花	10	2.0%
Other values (195)	333	66.9%

CJK Compat Ideographs

Value	Count	Frequency (%)
女	24	77.4%
李	2	6.5%
金	1	3.2%
龍	1	3.2%
列	1	3.2%
歷	1	3.2%
梨	1	3.2%

Number Forms

Value	Count	Frequency (%)
Ⅱ	21	50.0%
Ⅰ	9	21.4%
Ⅲ	5	11.9%
Ⅳ	5	11.9%
Ⅴ	1	2.4%
Ⅹ	1	2.4%

None

Value	Count	Frequency (%)
『	9	31.0%
』	9	31.0%
	4	13.8%
〮	3	10.3%
」	1	3.4%
「	1	3.4%
×	1	3.4%
Ι	1	3.4%

Hiragana

Value	Count	Frequency (%)
の	7	16.7%
と	4	9.5%
か	4	9.5%
み	4	9.5%
う	3	7.1%
よ	2	4.8%
る	2	4.8%
ら	2	4.8%
お	2	4.8%
す	1	2.4%
Other values (11)	11	26.2%

Katakana

Value	Count	Frequency (%)
ア	5	9.8%
ダ	4	7.8%
ェ	4	7.8%
ム	4	7.8%
ヅ	4	7.8%
ン	4	7.8%
ジ	3	5.9%
ソ	3	5.9%
リ	2	3.9%
ォ	2	3.9%
Other values (10)	16	31.4%

Punctuation

Value	Count	Frequency (%)
―	4	26.7%
•	4	26.7%
’	3	20.0%
‘	2	13.3%
…	1	6.7%
–	1	6.7%

Compat Jamo

Value	Count	Frequency (%)
ㄱ	1	7.1%
ㄴ	1	7.1%
ㄷ	1	7.1%
ㄹ	1	7.1%
ㅁ	1	7.1%
ㅂ	1	7.1%
ㅅ	1	7.1%
ㅇ	1	7.1%
ㅈ	1	7.1%
ㅍ	1	7.1%
Other values (4)	4	28.6%

Enclosed Alphanum

Value	Count	Frequency (%)
②	1	50.0%
①	1	50.0%

저자명
Text

MISSING

Distinct	2252
Distinct (%)	62.8%
Missing	789
Missing (%)	18.0%
Memory size	34.3 KiB

Length

Max length	100
Median length	36
Mean length	7.9163647
Min length	1

Characters and Unicode

Total characters	28396
Distinct characters	707
Distinct categories	11 ?
Distinct scripts	4 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1809 ?
Unique (%)	50.4%

Sample

1st row
2nd row	다시함께센터
3rd row	다시함께센터
4th row	다시함께센터
5th row	정선희

Value	Count	Frequency (%)
역	296	4.4%
	158	2.4%
외	142	2.1%
그림	101	1.5%
글	58	0.9%
숙명여자대학교	58	0.9%
한국여성연구소	45	0.7%
저	45	0.7%
퍼블릭아트	43	0.6%
옮김	38	0.6%
Other values (3340)	5692	85.3%

Most occurring characters

Value	Count	Frequency (%)
	3247	11.4%
이	779	2.7%
,	717	2.5%
여	617	2.2%
성	583	2.1%
김	534	1.9%
정	494	1.7%
국	420	1.5%
한	405	1.4%
역	378	1.3%
Other values (697)	20222	71.2%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	23008	81.0%
Space Separator	3247	11.4%
Other Punctuation	1134	4.0%
Lowercase Letter	532	1.9%
Uppercase Letter	282	1.0%
Decimal Number	126	0.4%
Open Punctuation	21	0.1%
Close Punctuation	21	0.1%
Other Symbol	11	< 0.1%
Math Symbol	9	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
이	779	3.4%
여	617	2.7%
성	583	2.5%
김	534	2.3%
정	494	2.1%
국	420	1.8%
한	405	1.8%
역	378	1.6%
연	357	1.6%
박	350	1.5%
Other values (625)	18091	78.6%

Uppercase Letter

Value	Count	Frequency (%)
A	31	11.0%
M	27	9.6%
B	26	9.2%
S	22	7.8%
E	21	7.4%
R	15	5.3%
C	13	4.6%
K	12	4.3%
T	12	4.3%
N	12	4.3%
Other values (14)	91	32.3%

Lowercase Letter

Value	Count	Frequency (%)
e	77	14.5%
n	53	10.0%
a	47	8.8%
r	44	8.3%
o	42	7.9%
i	33	6.2%
s	32	6.0%
u	31	5.8%
t	27	5.1%
l	24	4.5%
Other values (13)	122	22.9%

Decimal Number

Value	Count	Frequency (%)
1	24	19.0%
3	23	18.3%
4	19	15.1%
0	15	11.9%
5	13	10.3%
2	12	9.5%
8	9	7.1%
7	5	4.0%
9	4	3.2%
6	2	1.6%

Other Punctuation

Value	Count	Frequency (%)
,	717	63.2%
/	358	31.6%
.	49	4.3%
'	5	0.4%
:	4	0.4%
․	1	0.1%

Math Symbol

Value	Count	Frequency (%)
<	3	33.3%
>	3	33.3%
∙	2	22.2%
+	1	11.1%

Space Separator

Value	Count	Frequency (%)
	3247	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	21	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	21	100.0%

Other Symbol

Value	Count	Frequency (%)
㈜	11	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	5	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	22910	80.7%
Common	4563	16.1%
Latin	814	2.9%
Han	109	0.4%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
이	779	3.4%
여	617	2.7%
성	583	2.5%
김	534	2.3%
정	494	2.2%
국	420	1.8%
한	405	1.8%
역	378	1.6%
연	357	1.6%
박	350	1.5%
Other values (590)	17993	78.5%

Latin

Value	Count	Frequency (%)
e	77	9.5%
n	53	6.5%
a	47	5.8%
r	44	5.4%
o	42	5.2%
i	33	4.1%
s	32	3.9%
u	31	3.8%
A	31	3.8%
t	27	3.3%
Other values (37)	397	48.8%

Han

Value	Count	Frequency (%)
外	27	24.8%
著	6	5.5%
子	4	3.7%
譯	4	3.7%
女	4	3.7%
所	3	2.8%
大	3	2.8%
學	3	2.8%
校	3	2.8%
韓	3	2.8%
Other values (26)	49	45.0%

Common

Value	Count	Frequency (%)
	3247	71.2%
,	717	15.7%
/	358	7.8%
.	49	1.1%
1	24	0.5%
3	23	0.5%
(	21	0.5%
)	21	0.5%
4	19	0.4%
0	15	0.3%
Other values (14)	69	1.5%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	22899	80.6%
ASCII	5374	18.9%
CJK	106	0.4%
None	11	< 0.1%
CJK Compat Ideographs	3	< 0.1%
Math Operators	2	< 0.1%
Punctuation	1	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	3247	60.4%
,	717	13.3%
/	358	6.7%
e	77	1.4%
n	53	1.0%
.	49	0.9%
a	47	0.9%
r	44	0.8%
o	42	0.8%
i	33	0.6%
Other values (59)	707	13.2%

Hangul

Value	Count	Frequency (%)
이	779	3.4%
여	617	2.7%
성	583	2.5%
김	534	2.3%
정	494	2.2%
국	420	1.8%
한	405	1.8%
역	378	1.7%
연	357	1.6%
박	350	1.5%
Other values (589)	17982	78.5%

CJK

Value	Count	Frequency (%)
外	27	25.5%
著	6	5.7%
子	4	3.8%
譯	4	3.8%
女	4	3.8%
所	3	2.8%
大	3	2.8%
學	3	2.8%
校	3	2.8%
韓	3	2.8%
Other values (24)	46	43.4%

None

Value	Count	Frequency (%)
㈜	11	100.0%

Math Operators

Value	Count	Frequency (%)
∙	2	100.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
女	2	66.7%
李	1	33.3%

Punctuation

Value	Count	Frequency (%)
․	1	100.0%

출판사명
Text

MISSING

Distinct	1514
Distinct (%)	38.4%
Missing	432
Missing (%)	9.9%
Memory size	34.3 KiB

Length

Max length	54
Median length	37
Mean length	6.3651116
Min length	1

Characters and Unicode

Total characters	25104
Distinct characters	641
Distinct categories	11 ?
Distinct scripts	6 ?
Distinct blocks	8 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	972 ?
Unique (%)	24.6%

Sample

1st row	국립여성사전시관
2nd row	토지주택박물관
3rd row	한국여성경제학회
4th row	다시함께센터
5th row	다시함께센터

Value	Count	Frequency (%)
한국여성정책연구원	97	2.1%
국립민속박물관	87	1.9%
재)경기도가족여성연구원	78	1.7%
대한민국역사박물관	45	1.0%
여성가족부	40	0.9%
국립여성사전시관	38	0.8%
창비	37	0.8%
국학자료원	36	0.8%
문화	35	0.8%
한울	31	0.7%
Other values (1655)	4100	88.7%

Most occurring characters

Value	Count	Frequency (%)
사	1052	4.2%
여	763	3.0%
성	756	3.0%
	724	2.9%
국	685	2.7%
관	595	2.4%
한	550	2.2%
원	538	2.1%
문	513	2.0%
물	464	1.8%
Other values (631)	18464	73.6%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	22602	90.0%
Lowercase Letter	745	3.0%
Space Separator	725	2.9%
Uppercase Letter	459	1.8%
Other Punctuation	168	0.7%
Decimal Number	127	0.5%
Open Punctuation	125	0.5%
Close Punctuation	125	0.5%
Other Symbol	23	0.1%
Math Symbol	4	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
사	1052	4.7%
여	763	3.4%
성	756	3.3%
국	685	3.0%
관	595	2.6%
한	550	2.4%
원	538	2.4%
문	513	2.3%
물	464	2.1%
박	453	2.0%
Other values (564)	16233	71.8%

Lowercase Letter

Value	Count	Frequency (%)
e	100	13.4%
u	75	10.1%
r	71	9.5%
n	64	8.6%
o	63	8.5%
s	62	8.3%
a	55	7.4%
t	50	6.7%
i	39	5.2%
m	35	4.7%
Other values (14)	131	17.6%

Uppercase Letter

Value	Count	Frequency (%)
M	52	11.3%
A	44	9.6%
E	35	7.6%
C	30	6.5%
F	27	5.9%
I	25	5.4%
S	24	5.2%
N	24	5.2%
O	22	4.8%
L	22	4.8%
Other values (13)	154	33.6%

Decimal Number

Value	Count	Frequency (%)
0	44	34.6%
1	41	32.3%
2	16	12.6%
3	12	9.4%
5	8	6.3%
8	3	2.4%
7	2	1.6%
6	1	0.8%

Other Punctuation

Value	Count	Frequency (%)
,	119	70.8%
/	18	10.7%
.	13	7.7%
&	13	7.7%
'	5	3.0%

Space Separator

Value	Count	Frequency (%)
	724	99.9%
	1	0.1%

Open Punctuation

Value	Count	Frequency (%)
(	125	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	125	100.0%

Other Symbol

Value	Count	Frequency (%)
㈜	23	100.0%

Math Symbol

Value	Count	Frequency (%)
∙	4	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	22393	89.2%
Common	1275	5.1%
Latin	1204	4.8%
Han	222	0.9%
Hiragana	6	< 0.1%
Katakana	4	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
사	1052	4.7%
여	763	3.4%
성	756	3.4%
국	685	3.1%
관	595	2.7%
한	550	2.5%
원	538	2.4%
문	513	2.3%
물	464	2.1%
박	453	2.0%
Other values (473)	16024	71.6%

Han

Value	Count	Frequency (%)
史	13	5.9%
梨	11	5.0%
花	11	5.0%
所	9	4.1%
究	9	4.1%
歷	9	4.1%
硏	9	4.1%
性	8	3.6%
館	7	3.2%
会	7	3.2%
Other values (74)	129	58.1%

Latin

Value	Count	Frequency (%)
e	100	8.3%
u	75	6.2%
r	71	5.9%
n	64	5.3%
o	63	5.2%
s	62	5.1%
a	55	4.6%
M	52	4.3%
t	50	4.2%
A	44	3.7%
Other values (37)	568	47.2%

Common

Value	Count	Frequency (%)
	724	56.8%
(	125	9.8%
)	125	9.8%
,	119	9.3%
0	44	3.5%
1	41	3.2%
/	18	1.4%
2	16	1.3%
.	13	1.0%
&	13	1.0%
Other values (9)	37	2.9%

Hiragana

Value	Count	Frequency (%)
の	2	33.3%
お	2	33.3%
さ	1	16.7%
か	1	16.7%

Katakana

Value	Count	Frequency (%)
リ	1	25.0%
バ	1	25.0%
テ	1	25.0%
ィ	1	25.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	22370	89.1%
ASCII	2474	9.9%
CJK	214	0.9%
None	24	0.1%
CJK Compat Ideographs	8	< 0.1%
Hiragana	6	< 0.1%
Math Operators	4	< 0.1%
Katakana	4	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
사	1052	4.7%
여	763	3.4%
성	756	3.4%
국	685	3.1%
관	595	2.7%
한	550	2.5%
원	538	2.4%
문	513	2.3%
물	464	2.1%
박	453	2.0%
Other values (472)	16001	71.5%

ASCII

Value	Count	Frequency (%)
	724	29.3%
(	125	5.1%
)	125	5.1%
,	119	4.8%
e	100	4.0%
u	75	3.0%
r	71	2.9%
n	64	2.6%
o	63	2.5%
s	62	2.5%
Other values (54)	946	38.2%

None

Value	Count	Frequency (%)
㈜	23	95.8%
	1	4.2%

CJK

Value	Count	Frequency (%)
史	13	6.1%
梨	11	5.1%
花	11	5.1%
所	9	4.2%
究	9	4.2%
歷	9	4.2%
硏	9	4.2%
性	8	3.7%
館	7	3.3%
会	7	3.3%
Other values (71)	121	56.5%

CJK Compat Ideographs

Value	Count	Frequency (%)
女	5	62.5%
歷	2	25.0%
金	1	12.5%

Math Operators

Value	Count	Frequency (%)
∙	4	100.0%

Hiragana

Value	Count	Frequency (%)
の	2	33.3%
お	2	33.3%
さ	1	16.7%
か	1	16.7%

Katakana

Value	Count	Frequency (%)
リ	1	25.0%
バ	1	25.0%
テ	1	25.0%
ィ	1	25.0%

출판연도
Text

Distinct	65
Distinct (%)	1.5%
Missing	0
Missing (%)	0.0%
Memory size	34.3 KiB

Length

Max length	4
Median length	4
Mean length	3.9968007
Min length	2

Characters and Unicode

Total characters	17490
Distinct characters	11
Distinct categories	2 ?
Distinct scripts	1 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	4 ?
Unique (%)	0.1%

Sample

1st row	2015
2nd row	2015
3rd row	2010
4th row	2004
5th row	2005

Value	Count	Frequency (%)
2011	309	7.2%
2008	279	6.5%
2009	256	6.0%
2010	246	5.7%
2006	241	5.6%
2007	215	5.0%
2012	215	5.0%
2003	210	4.9%
2005	197	4.6%
2002	181	4.2%
Other values (52)	1935	45.2%

Most occurring characters

Value	Count	Frequency (%)
0	6135	35.1%
2	4131	23.6%
1	2724	15.6%
9	1462	8.4%
8	585	3.3%
7	493	2.8%
6	453	2.6%
3	403	2.3%
4	379	2.2%
5	371	2.1%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	17136	98.0%
Space Separator	354	2.0%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
0	6135	35.8%
2	4131	24.1%
1	2724	15.9%
9	1462	8.5%
8	585	3.4%
7	493	2.9%
6	453	2.6%
3	403	2.4%
4	379	2.2%
5	371	2.2%

Space Separator

Value	Count	Frequency (%)
	354	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	17490	100.0%

Most frequent character per script

Common

Value	Count	Frequency (%)
0	6135	35.1%
2	4131	23.6%
1	2724	15.6%
9	1462	8.4%
8	585	3.3%
7	493	2.8%
6	453	2.6%
3	403	2.3%
4	379	2.2%
5	371	2.1%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	17490	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
0	6135	35.1%
2	4131	23.6%
1	2724	15.6%
9	1462	8.4%
8	585	3.3%
7	493	2.8%
6	453	2.6%
3	403	2.3%
4	379	2.2%
5	371	2.1%

데이터기준일자
Date

CONSTANT

Distinct	1
Distinct (%)	< 0.1%
Missing	0
Missing (%)	0.0%
Memory size	34.3 KiB

Minimum	2021-08-06 00:00:00
Maximum	2021-08-06 00:00:00

Histogram

Histogram with fixed size bins (bins=1)

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	도서명	저자명	출판사명	출판연도	데이터기준일자
0	독립을 향한 여성영웅들의 행진	<NA>	국립여성사전시관	2015	2021-08-06
1	토지주택박물관 전시도록	<NA>	토지주택박물관	2015	2021-08-06
2	"다문화 가정의 현화과 정책방안"-경제, 여성, 자녀교육문제 중심으로-		한국여성경제학회	2010	2021-08-06
3	"다시함께"와 함께걷기	다시함께센터	다시함께센터	2004	2021-08-06
4	"다시함께"와 함께걷기 2	다시함께센터	다시함께센터	2005	2021-08-06
5	"다시함께"와 함께걷기3	다시함께센터	다시함께센터	2006	2021-08-06
6	"이익을 만들고 행복을 나누는" 사회적 기업	정선희	다우	2004	2021-08-06
7	(자료로 본) 한국영화사 1권	정종화	열화당	1997	2021-08-06
8	(자료로 본) 한국영화사 2권	정종화	열화당	1997	2021-08-06
9	1% 리더만 아는 유머대화법	임붕영	미래지식	2012	2021-08-06

	도서명	저자명	출판사명	출판연도	데이터기준일자
4366	희망을 키우는 착한 소비: 커피, 바나나, 청바지에 담긴 공정무역의 역사	니코 로전, 프란스 판 데어 호프 / 김영중 역	서해문집	2008	2021-08-06
4367	흰곰 가족의 5층짜리 신발 가게	오오데 유카코, 김영주 역	북스토리아이	2016	2021-08-06
4368	흰둥이네 할머니	송언 글/김성민 그림	현암사	2003	2021-08-06
4369	金南日報重要事件 20年史 1952年~1960年(上券)	<NA>	金南日報社		2021-08-06
4370	女四書	김종권 역	명문당	1987	2021-08-06
4371	女性史硏究入門	<NA>	歷史科学協議会		2021-08-06
4372	女性學新論改訂版	李花女子大學校韓國女性硏究所	<NA>		2021-08-06
4373	龍仁瑞峰寺 (용인 서봉사지)	수원대학교박물관	용인시∙수원대학교박물관	2009	2021-08-06
4374	李聖子, 예술과 삶	이지은, 강영주, 정영목, 심삼용	생각의 나무	2007	2021-08-06
4375	梨花百年史 1886~1986	심치선	이화여자고등학교	1994	2021-08-06

Most frequently occurring

	도서명	저자명	출판사명	출판연도	데이터기준일자	# duplicates
41	구석구석 젠더정치	남윤인순	해피스토리	2014	2021-08-06	11
19	2013 구술자료집 살아있는 여성사 2002~2013	<NA>	국립여성사전시관	2013	2021-08-06	6
83	서간도에 들꽃 피다 <3>	이윤옥	얼레빗	2011	2021-08-06	6
118	여성사 강좌 1 新여성	<NA>	여성사 전시관	2005	2021-08-06	6
170	조선성자 방애인	배은희	두인		2021-08-06	6
190	페미니스트 저널 IF	도서출판이프	<NA>	2003	2021-08-06	6
40	교사를 위한 '청소년 노동인권 교육'	국립여성사전시관	국립여성사전시관	2009	2021-08-06	5
48	나를 만든 위대한 유산	여성사전시관	여성사전시관	2008	2021-08-06	5
53	대한민국의 미래 여성이 품다 국립여성사박물관	<NA>	국립여성사박물관 건립추진위원회	2012	2021-08-06	5
105	여성 60년사, 그 삶의 발자취	여성부	여성부	2008	2021-08-06	5

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Other Punctuation

Decimal Number

Math Symbol

Letter Number

Dash Punctuation

Close Punctuation

Open Punctuation

Space Separator

Other Number

Connector Punctuation

Spacing Mark

Final Punctuation

Modifier Letter

Initial Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Hiragana

Katakana

Greek

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Math Operators

CJK

CJK Compat Ideographs

Number Forms

None

Hiragana

Katakana

Punctuation

Compat Jamo

Enclosed Alphanum

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Decimal Number

Other Punctuation

Math Symbol

Space Separator

Open Punctuation

Close Punctuation

Other Symbol

Dash Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Latin

Han

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

CJK

None

Math Operators

CJK Compat Ideographs

Punctuation

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter