gimi9 Pandas Profiling

Dataset statistics

Number of variables	4
Number of observations	10000
Missing cells	8
Missing cells (%)	< 0.1%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	390.6 KiB
Average record size in memory	40.0 B

Variable types

Text	4

Dataset

Description	한국농수산대학은 대한민국 농수산업의 특성화 대학으로서 농림축산식품부 소속 직속기관이며 국내외의 다양한 농수축산업 자료를 보유하고 있는 바 이에 대한 전문도서 목록과 정보를 공개하여 국민의 알 권리 충족에 기여하고자 함.
Author	한국농수산대학
URL	https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20181018000000000966

Alerts

등록번호 has unique values Unique

Reproduction

Analysis started	2023-12-11 03:38:40.143866
Analysis finished	2023-12-11 03:38:43.169388
Duration	3.03 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

등록번호
Text

UNIQUE

Distinct	10000
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	8
Median length	8
Mean length	8
Min length	8

Characters and Unicode

Total characters	80000
Distinct characters	12
Distinct categories	2 ?
Distinct scripts	2 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	10000 ?
Unique (%)	100.0%

Sample

1st row	EM009707
2nd row	EM007493
3rd row	EM013864
4th row	EM001651
5th row	EM010540

Value	Count	Frequency (%)
em009707	1	< 0.1%
em010873	1	< 0.1%
em007962	1	< 0.1%
em001155	1	< 0.1%
em009011	1	< 0.1%
em012066	1	< 0.1%
em013937	1	< 0.1%
em004436	1	< 0.1%
em004647	1	< 0.1%
em005436	1	< 0.1%
Other values (9990)	9990	99.9%

Most occurring characters

Value	Count	Frequency (%)
0	21529	26.9%
E	10000	12.5%
M	10000	12.5%
1	7344	9.2%
2	4459	5.6%
3	4377	5.5%
4	3767	4.7%
7	3763	4.7%
5	3752	4.7%
6	3679	4.6%
Other values (2)	7330	9.2%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	60000	75.0%
Uppercase Letter	20000	25.0%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
0	21529	35.9%
1	7344	12.2%
2	4459	7.4%
3	4377	7.3%
4	3767	6.3%
7	3763	6.3%
5	3752	6.3%
6	3679	6.1%
8	3671	6.1%
9	3659	6.1%

Uppercase Letter

Value	Count	Frequency (%)
E	10000	50.0%
M	10000	50.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	60000	75.0%
Latin	20000	25.0%

Most frequent character per script

Common

Value	Count	Frequency (%)
0	21529	35.9%
1	7344	12.2%
2	4459	7.4%
3	4377	7.3%
4	3767	6.3%
7	3763	6.3%
5	3752	6.3%
6	3679	6.1%
8	3671	6.1%
9	3659	6.1%

Latin

Value	Count	Frequency (%)
E	10000	50.0%
M	10000	50.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	80000	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
0	21529	26.9%
E	10000	12.5%
M	10000	12.5%
1	7344	9.2%
2	4459	5.6%
3	4377	5.5%
4	3767	4.7%
7	3763	4.7%
5	3752	4.7%
6	3679	4.6%
Other values (2)	7330	9.2%

도서명
Text

Distinct	6642
Distinct (%)	66.4%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	191
Median length	130
Mean length	20.2071
Min length	2

Characters and Unicode

Total characters	202071
Distinct characters	2091
Distinct categories	15 ?
Distinct scripts	6 ?
Distinct blocks	13 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	5378 ?
Unique (%)	53.8%

Sample

1st row	농촌지표. 2008
2nd row	신개발 농기계 : 논 농사편
3rd row	신 조경시공학
4th row	蠶種學
5th row	양봉 사계절 관리법

Value	Count	Frequency (%)
	3225	8.1%
및	525	1.3%
위한	343	0.9%
연구	244	0.6%
of	201	0.5%
관한	179	0.4%
농산물	167	0.4%
방안	163	0.4%
report	128	0.3%
보고서	123	0.3%
Other values (13547)	34511	86.7%

Most occurring characters

Value	Count	Frequency (%)
	30094	14.9%
농	3706	1.8%
업	2908	1.4%
0	2786	1.4%
:	2518	1.2%
기	2493	1.2%
2	2137	1.1%
의	2076	1.0%
1	2064	1.0%
e	2023	1.0%
Other values (2081)	149266	73.9%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	127091	62.9%
Space Separator	30100	14.9%
Lowercase Letter	18052	8.9%
Decimal Number	10351	5.1%
Other Punctuation	6088	3.0%
Uppercase Letter	4262	2.1%
Open Punctuation	2035	1.0%
Close Punctuation	2033	1.0%
Dash Punctuation	1195	0.6%
Math Symbol	688	0.3%
Other values (5)	176	0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
농	3706	2.9%
업	2908	2.3%
기	2493	2.0%
의	2076	1.6%
과	1961	1.5%
연	1930	1.5%
사	1922	1.5%
구	1654	1.3%
산	1606	1.3%
한	1433	1.1%
Other values (1960)	105402	82.9%

Uppercase Letter

Value	Count	Frequency (%)
A	506	11.9%
R	417	9.8%
I	346	8.1%
E	298	7.0%
T	267	6.3%
O	256	6.0%
S	228	5.3%
C	212	5.0%
N	211	5.0%
P	205	4.8%
Other values (22)	1316	30.9%

Lowercase Letter

Value	Count	Frequency (%)
e	2023	11.2%
o	1675	9.3%
r	1553	8.6%
n	1520	8.4%
a	1435	7.9%
i	1346	7.5%
t	1304	7.2%
s	1074	5.9%
l	884	4.9%
c	781	4.3%
Other values (16)	4457	24.7%

Other Punctuation

Value	Count	Frequency (%)
:	2518	41.4%
.	1767	29.0%
·	714	11.7%
,	457	7.5%
?	191	3.1%
/	136	2.2%
'	125	2.1%
&	82	1.3%
!	47	0.8%
;	14	0.2%
Other values (9)	37	0.6%

Decimal Number

Value	Count	Frequency (%)
0	2786	26.9%
2	2137	20.6%
1	2064	19.9%
9	1081	10.4%
5	423	4.1%
3	380	3.7%
7	379	3.7%
6	373	3.6%
8	363	3.5%
4	358	3.5%
Other values (4)	7	0.1%

Letter Number

Value	Count	Frequency (%)
Ⅱ	64	38.1%
Ⅰ	59	35.1%
Ⅴ	22	13.1%
Ⅲ	15	8.9%
Ⅳ	6	3.6%
Ⅶ	1	0.6%
Ⅵ	1	0.6%

Math Symbol

Value	Count	Frequency (%)
=	604	87.8%
~	68	9.9%
∼	12	1.7%
+	3	0.4%
＋	1	0.1%

Open Punctuation

Value	Count	Frequency (%)
(	1930	94.8%
[	92	4.5%
「	11	0.5%
『	2	0.1%

Close Punctuation

Value	Count	Frequency (%)
)	1928	94.8%
]	92	4.5%
」	11	0.5%
』	2	0.1%

Other Symbol

Value	Count	Frequency (%)
◎	2	50.0%
│	1	25.0%
▼	1	25.0%

Space Separator

Value	Count	Frequency (%)
	30094	> 99.9%
	6	< 0.1%

Dash Punctuation

Value	Count	Frequency (%)
-	1194	99.9%
―	1	0.1%

Final Punctuation

Value	Count	Frequency (%)
’	2	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	1	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	99575	49.3%
Common	52498	26.0%
Han	23193	11.5%
Latin	22482	11.1%
Hiragana	2286	1.1%
Katakana	2037	1.0%

Most frequent character per script

Han

Value	Count	Frequency (%)
學	943	4.1%
農	930	4.0%
業	618	2.7%
物	441	1.9%
産	422	1.8%
生	365	1.6%
畜	326	1.4%
論	308	1.3%
究	283	1.2%
硏	281	1.2%
Other values (1009)	18276	78.8%

Hangul

Value	Count	Frequency (%)
농	3706	3.7%
업	2908	2.9%
기	2493	2.5%
의	2076	2.1%
과	1961	2.0%
연	1930	1.9%
사	1922	1.9%
구	1654	1.7%
산	1606	1.6%
한	1433	1.4%
Other values (800)	77886	78.2%

Katakana

Value	Count	Frequency (%)
ン	153	7.5%
ト	81	4.0%
ク	80	3.9%
ブ	79	3.9%
イ	78	3.8%
ハ	71	3.5%
ラ	70	3.4%
ア	67	3.3%
ル	65	3.2%
ス	63	3.1%
Other values (66)	1230	60.4%

Latin

Value	Count	Frequency (%)
e	2023	9.0%
o	1675	7.5%
r	1553	6.9%
n	1520	6.8%
a	1435	6.4%
i	1346	6.0%
t	1304	5.8%
s	1074	4.8%
l	884	3.9%
c	781	3.5%
Other values (55)	8887	39.5%

Hiragana

Value	Count	Frequency (%)
の	630	27.6%
と	262	11.5%
る	98	4.3%
り	92	4.0%
し	81	3.5%
く	71	3.1%
て	71	3.1%
か	61	2.7%
い	60	2.6%
を	59	2.6%
Other values (55)	801	35.0%

Common

Value	Count	Frequency (%)
	30094	57.3%
0	2786	5.3%
:	2518	4.8%
2	2137	4.1%
1	2064	3.9%
(	1930	3.7%
)	1928	3.7%
.	1767	3.4%
-	1194	2.3%
9	1081	2.1%
Other values (46)	4999	9.5%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	99497	49.2%
ASCII	74014	36.6%
CJK	22786	11.3%
Hiragana	2286	1.1%
Katakana	2037	1.0%
None	777	0.4%
CJK Compat Ideographs	407	0.2%
Number Forms	168	0.1%
Compat Jamo	78	< 0.1%
Math Operators	12	< 0.1%
Other values (3)	9	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	30094	40.7%
0	2786	3.8%
:	2518	3.4%
2	2137	2.9%
1	2064	2.8%
e	2023	2.7%
(	1930	2.6%
)	1928	2.6%
.	1767	2.4%
o	1675	2.3%
Other values (74)	25092	33.9%

Hangul

Value	Count	Frequency (%)
농	3706	3.7%
업	2908	2.9%
기	2493	2.5%
의	2076	2.1%
과	1961	2.0%
연	1930	1.9%
사	1922	1.9%
구	1654	1.7%
산	1606	1.6%
한	1433	1.4%
Other values (799)	77808	78.2%

CJK

Value	Count	Frequency (%)
學	943	4.1%
農	930	4.1%
業	618	2.7%
物	441	1.9%
産	422	1.9%
生	365	1.6%
畜	326	1.4%
論	308	1.4%
究	283	1.2%
硏	281	1.2%
Other values (966)	17869	78.4%

None

Value	Count	Frequency (%)
·	714	91.9%
「	11	1.4%
」	11	1.4%
、	7	0.9%
	6	0.8%
＆	4	0.5%
＊	3	0.4%
０	2	0.3%
２	2	0.3%
１	2	0.3%
Other values (12)	15	1.9%

Hiragana

Value	Count	Frequency (%)
の	630	27.6%
と	262	11.5%
る	98	4.3%
り	92	4.0%
し	81	3.5%
く	71	3.1%
て	71	3.1%
か	61	2.7%
い	60	2.6%
を	59	2.6%
Other values (55)	801	35.0%

Katakana

Value	Count	Frequency (%)
ン	153	7.5%
ト	81	4.0%
ク	80	3.9%
ブ	79	3.9%
イ	78	3.8%
ハ	71	3.5%
ラ	70	3.4%
ア	67	3.3%
ル	65	3.2%
ス	63	3.1%
Other values (66)	1230	60.4%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	78	100.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
利	64	15.7%
論	59	14.5%
年	39	9.6%
林	37	9.1%
流	30	7.4%
理	27	6.6%
酪	26	6.4%
樂	23	5.7%
金	12	2.9%
糧	6	1.5%
Other values (33)	84	20.6%

Number Forms

Value	Count	Frequency (%)
Ⅱ	64	38.1%
Ⅰ	59	35.1%
Ⅴ	22	13.1%
Ⅲ	15	8.9%
Ⅳ	6	3.6%
Ⅶ	1	0.6%
Ⅵ	1	0.6%

Math Operators

Value	Count	Frequency (%)
∼	12	100.0%

Geometric Shapes

Value	Count	Frequency (%)
◎	2	66.7%
▼	1	33.3%

Punctuation

Value	Count	Frequency (%)
’	2	40.0%
‘	1	20.0%
…	1	20.0%
―	1	20.0%

Box Drawing

Value	Count	Frequency (%)
│	1	100.0%

저자명
Text

Distinct	2721
Distinct (%)	27.2%
Missing	8
Missing (%)	0.1%
Memory size	156.2 KiB

Length

Max length	49
Median length	46
Mean length	6.7607086
Min length	2

Characters and Unicode

Total characters	67553
Distinct characters	935
Distinct categories	10 ?
Distinct scripts	6 ?
Distinct blocks	8 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1779 ?
Unique (%)	17.8%

Sample

1st row	농촌자원개발연구소
2nd row	농촌진흥청
3rd row	강태호 외
4th row	정원복
5th row	조도행

Value	Count	Frequency (%)
농촌진흥청	1036	8.1%
한국농촌경제연구원	865	6.8%
농림부	172	1.3%
국립원예특작과학원	161	1.3%
국립농업과학원	155	1.2%
위원회	131	1.0%
농업과학기술원	124	1.0%
대학교	123	1.0%
도서	123	1.0%
1종	123	1.0%
Other values (3192)	9754	76.4%

Most occurring characters

Value	Count	Frequency (%)
농	4323	6.4%
원	2853	4.2%
	2801	4.1%
촌	2263	3.3%
국	2059	3.0%
구	1851	2.7%
연	1829	2.7%
진	1486	2.2%
한	1374	2.0%
청	1359	2.0%
Other values (925)	45355	67.1%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	60799	90.0%
Space Separator	2801	4.1%
Lowercase Letter	1850	2.7%
Other Punctuation	1081	1.6%
Uppercase Letter	759	1.1%
Decimal Number	144	0.2%
Close Punctuation	39	0.1%
Open Punctuation	39	0.1%
Math Symbol	21	< 0.1%
Dash Punctuation	20	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
농	4323	7.1%
원	2853	4.7%
촌	2263	3.7%
국	2059	3.4%
구	1851	3.0%
연	1829	3.0%
진	1486	2.4%
한	1374	2.3%
청	1359	2.2%
학	1334	2.2%
Other values (858)	40068	65.9%

Lowercase Letter

Value	Count	Frequency (%)
t	224	12.1%
e	204	11.0%
i	181	9.8%
a	176	9.5%
n	166	9.0%
r	136	7.4%
o	133	7.2%
l	122	6.6%
c	106	5.7%
u	102	5.5%
Other values (14)	300	16.2%

Uppercase Letter

Value	Count	Frequency (%)
A	88	11.6%
N	88	11.6%
I	84	11.1%
T	57	7.5%
R	55	7.2%
S	50	6.6%
E	41	5.4%
L	40	5.3%
H	38	5.0%
O	34	4.5%
Other values (14)	184	24.2%

Other Punctuation

Value	Count	Frequency (%)
.	851	78.7%
,	188	17.4%
?	26	2.4%
·	12	1.1%
&	4	0.4%

Decimal Number

Value	Count	Frequency (%)
1	128	88.9%
4	10	6.9%
5	2	1.4%
0	2	1.4%
2	2	1.4%

Math Symbol

Value	Count	Frequency (%)
\|	17	81.0%
<	2	9.5%
>	2	9.5%

Close Punctuation

Value	Count	Frequency (%)
]	32	82.1%
)	7	17.9%

Open Punctuation

Value	Count	Frequency (%)
[	32	82.1%
(	7	17.9%

Space Separator

Value	Count	Frequency (%)
	2801	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	20	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	59144	87.6%
Common	4145	6.1%
Latin	2609	3.9%
Han	1581	2.3%
Katakana	47	0.1%
Hiragana	27	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
농	4323	7.3%
원	2853	4.8%
촌	2263	3.8%
국	2059	3.5%
구	1851	3.1%
연	1829	3.1%
진	1486	2.5%
한	1374	2.3%
청	1359	2.3%
학	1334	2.3%
Other values (526)	38413	64.9%

Han

Value	Count	Frequency (%)
會	139	8.8%
水	135	8.5%
産	131	8.3%
學	131	8.3%
本	129	8.2%
日	129	8.2%
農	48	3.0%
協	37	2.3%
文	32	2.0%
田	21	1.3%
Other values (269)	649	41.0%

Latin

Value	Count	Frequency (%)
t	224	8.6%
e	204	7.8%
i	181	6.9%
a	176	6.7%
n	166	6.4%
r	136	5.2%
o	133	5.1%
l	122	4.7%
c	106	4.1%
u	102	3.9%
Other values (38)	1059	40.6%

Katakana

Value	Count	Frequency (%)
ン	4	8.5%
ア	3	6.4%
イ	3	6.4%
ド	3	6.4%
ト	3	6.4%
リ	2	4.3%
フ	2	4.3%
ッ	2	4.3%
ル	2	4.3%
ュ	1	2.1%
Other values (22)	22	46.8%

Hiragana

Value	Count	Frequency (%)
し	2	7.4%
わ	2	7.4%
か	2	7.4%
た	2	7.4%
だ	2	7.4%
の	2	7.4%
な	1	3.7%
べ	1	3.7%
け	1	3.7%
ら	1	3.7%
Other values (11)	11	40.7%

Common

Value	Count	Frequency (%)
	2801	67.6%
.	851	20.5%
,	188	4.5%
1	128	3.1%
]	32	0.8%
[	32	0.8%
?	26	0.6%
-	20	0.5%
\|	17	0.4%
·	12	0.3%
Other values (9)	38	0.9%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	59143	87.6%
ASCII	6742	10.0%
CJK	1572	2.3%
Katakana	47	0.1%
Hiragana	27	< 0.1%
None	12	< 0.1%
CJK Compat Ideographs	9	< 0.1%
Compat Jamo	1	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
농	4323	7.3%
원	2853	4.8%
촌	2263	3.8%
국	2059	3.5%
구	1851	3.1%
연	1829	3.1%
진	1486	2.5%
한	1374	2.3%
청	1359	2.3%
학	1334	2.3%
Other values (525)	38412	64.9%

ASCII

Value	Count	Frequency (%)
	2801	41.5%
.	851	12.6%
t	224	3.3%
e	204	3.0%
,	188	2.8%
i	181	2.7%
a	176	2.6%
n	166	2.5%
r	136	2.0%
o	133	2.0%
Other values (56)	1682	24.9%

CJK

Value	Count	Frequency (%)
會	139	8.8%
水	135	8.6%
産	131	8.3%
學	131	8.3%
本	129	8.2%
日	129	8.2%
農	48	3.1%
協	37	2.4%
文	32	2.0%
田	21	1.3%
Other values (263)	640	40.7%

None

Value	Count	Frequency (%)
·	12	100.0%

Katakana

Value	Count	Frequency (%)
ン	4	8.5%
ア	3	6.4%
イ	3	6.4%
ド	3	6.4%
ト	3	6.4%
リ	2	4.3%
フ	2	4.3%
ッ	2	4.3%
ル	2	4.3%
ュ	1	2.1%
Other values (22)	22	46.8%

CJK Compat Ideographs

Value	Count	Frequency (%)
酪	3	33.3%
林	2	22.2%
鈴	1	11.1%
聯	1	11.1%
栗	1	11.1%
李	1	11.1%

Hiragana

Value	Count	Frequency (%)
し	2	7.4%
わ	2	7.4%
か	2	7.4%
た	2	7.4%
だ	2	7.4%
の	2	7.4%
な	1	3.7%
べ	1	3.7%
け	1	3.7%
ら	1	3.7%
Other values (11)	11	40.7%

Compat Jamo

Value	Count	Frequency (%)
ㅇ	1	100.0%

출판사
Text

Distinct	1531
Distinct (%)	15.3%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	71
Median length	57
Mean length	7.2347
Min length	1

Characters and Unicode

Total characters	72347
Distinct characters	890
Distinct categories	10 ?
Distinct scripts	6 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	808 ?
Unique (%)	8.1%

Sample

1st row	농촌진흥청 농업과학기술원
2nd row	농촌진흥청
3rd row	문운당
4th row	東亞大學校出版部
5th row	오성출판사

Value	Count	Frequency (%)
농촌진흥청	2301	19.4%
한국농촌경제연구원	549	4.6%
先進文化社	395	3.3%
韓國農村經濟硏究院	335	2.8%
鄕文社	331	2.8%
농림부	253	2.1%
農山漁村文化協會	230	1.9%
농업과학기술원	166	1.4%
농민신문사	148	1.2%
恒星社厚生閣	133	1.1%
Other values (1482)	7019	59.2%

Most occurring characters

Value	Count	Frequency (%)
농	5015	6.9%
촌	3028	4.2%
진	2514	3.5%
청	2442	3.4%
흥	2386	3.3%
원	2171	3.0%
	1980	2.7%
국	1652	2.3%
社	1398	1.9%
文	1294	1.8%
Other values (880)	48467	67.0%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	67248	93.0%
Space Separator	1980	2.7%
Lowercase Letter	1751	2.4%
Uppercase Letter	651	0.9%
Other Punctuation	230	0.3%
Close Punctuation	200	0.3%
Open Punctuation	200	0.3%
Dash Punctuation	55	0.1%
Decimal Number	31	< 0.1%
Math Symbol	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
농	5015	7.5%
촌	3028	4.5%
진	2514	3.7%
청	2442	3.6%
흥	2386	3.5%
원	2171	3.2%
국	1652	2.5%
社	1398	2.1%
文	1294	1.9%
연	1273	1.9%
Other values (813)	44075	65.5%

Lowercase Letter

Value	Count	Frequency (%)
e	197	11.3%
t	189	10.8%
o	162	9.3%
n	160	9.1%
i	159	9.1%
a	149	8.5%
r	117	6.7%
l	110	6.3%
u	82	4.7%
s	82	4.7%
Other values (14)	344	19.6%

Uppercase Letter

Value	Count	Frequency (%)
A	99	15.2%
R	76	11.7%
D	54	8.3%
N	49	7.5%
I	48	7.4%
O	45	6.9%
S	44	6.8%
H	31	4.8%
C	26	4.0%
E	24	3.7%
Other values (13)	155	23.8%

Other Punctuation

Value	Count	Frequency (%)
:	97	42.2%
?	42	18.3%
,	34	14.8%
.	32	13.9%
&	12	5.2%
·	12	5.2%
#	1	0.4%

Decimal Number

Value	Count	Frequency (%)
4	11	35.5%
2	8	25.8%
1	6	19.4%
0	4	12.9%
8	1	3.2%
9	1	3.2%

Close Punctuation

Value	Count	Frequency (%)
]	149	74.5%
)	51	25.5%

Open Punctuation

Value	Count	Frequency (%)
[	149	74.5%
(	51	25.5%

Space Separator

Value	Count	Frequency (%)
	1980	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	55	100.0%

Math Symbol

Value	Count	Frequency (%)
+	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	51720	71.5%
Han	15096	20.9%
Common	2697	3.7%
Latin	2402	3.3%
Katakana	375	0.5%
Hiragana	57	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
농	5015	9.7%
촌	3028	5.9%
진	2514	4.9%
청	2442	4.7%
흥	2386	4.6%
원	2171	4.2%
국	1652	3.2%
연	1273	2.5%
구	1245	2.4%
학	1206	2.3%
Other values (425)	28788	55.7%

Han

Value	Count	Frequency (%)
社	1398	9.3%
文	1294	8.6%
農	785	5.2%
化	750	5.0%
村	658	4.4%
國	461	3.1%
韓	448	3.0%
進	422	2.8%
先	404	2.7%
會	389	2.6%
Other values (315)	8087	53.6%

Latin

Value	Count	Frequency (%)
e	197	8.2%
t	189	7.9%
o	162	6.7%
n	160	6.7%
i	159	6.6%
a	149	6.2%
r	117	4.9%
l	110	4.6%
A	99	4.1%
u	82	3.4%
Other values (37)	978	40.7%

Katakana

Value	Count	Frequency (%)
ン	37	9.9%
ス	28	7.5%
レ	26	6.9%
ジ	23	6.1%
ル	22	5.9%
ナ	21	5.6%
フ	19	5.1%
ラ	19	5.1%
グ	19	5.1%
ャ	17	4.5%
Other values (35)	144	38.4%

Common

Value	Count	Frequency (%)
	1980	73.4%
]	149	5.5%
[	149	5.5%
:	97	3.6%
-	55	2.0%
(	51	1.9%
)	51	1.9%
?	42	1.6%
,	34	1.3%
.	32	1.2%
Other values (10)	57	2.1%

Hiragana

Value	Count	Frequency (%)
の	33	57.9%
い	3	5.3%
と	3	5.3%
え	2	3.5%
し	2	3.5%
ず	2	3.5%
ろ	1	1.8%
ぎ	1	1.8%
よ	1	1.8%
う	1	1.8%
Other values (8)	8	14.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	51720	71.5%
CJK	15066	20.8%
ASCII	5087	7.0%
Katakana	375	0.5%
Hiragana	57	0.1%
CJK Compat Ideographs	30	< 0.1%
None	12	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
농	5015	9.7%
촌	3028	5.9%
진	2514	4.9%
청	2442	4.7%
흥	2386	4.6%
원	2171	4.2%
국	1652	3.2%
연	1273	2.5%
구	1245	2.4%
학	1206	2.3%
Other values (425)	28788	55.7%

ASCII

Value	Count	Frequency (%)
	1980	38.9%
e	197	3.9%
t	189	3.7%
o	162	3.2%
n	160	3.1%
i	159	3.1%
]	149	2.9%
[	149	2.9%
a	149	2.9%
r	117	2.3%
Other values (56)	1676	32.9%

CJK

Value	Count	Frequency (%)
社	1398	9.3%
文	1294	8.6%
農	785	5.2%
化	750	5.0%
村	658	4.4%
國	461	3.1%
韓	448	3.0%
進	422	2.8%
先	404	2.7%
會	389	2.6%
Other values (301)	8057	53.5%

Katakana

Value	Count	Frequency (%)
ン	37	9.9%
ス	28	7.5%
レ	26	6.9%
ジ	23	6.1%
ル	22	5.9%
ナ	21	5.6%
フ	19	5.1%
ラ	19	5.1%
グ	19	5.1%
ャ	17	4.5%
Other values (35)	144	38.4%

Hiragana

Value	Count	Frequency (%)
の	33	57.9%
い	3	5.3%
と	3	5.3%
え	2	3.5%
し	2	3.5%
ず	2	3.5%
ろ	1	1.8%
ぎ	1	1.8%
よ	1	1.8%
う	1	1.8%
Other values (8)	8	14.0%

None

Value	Count	Frequency (%)
·	12	100.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
綠	8	26.7%
柳	4	13.3%
酪	3	10.0%
論	2	6.7%
沈	2	6.7%
金	2	6.7%
良	2	6.7%
參	1	3.3%
老	1	3.3%
龍	1	3.3%
Other values (4)	4	13.3%

Count
Matrix

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

First rows
Last rows

	등록번호	도서명	저자명	출판사
9706	EM009707	농촌지표. 2008	농촌자원개발연구소	농촌진흥청 농업과학기술원
7492	EM007493	신개발 농기계 : 논 농사편	농촌진흥청	농촌진흥청
13863	EM013864	신 조경시공학	강태호 외	문운당
1650	EM001651	蠶種學	정원복	東亞大學校出版部
10539	EM010540	양봉 사계절 관리법	조도행	오성출판사
2044	EM002045	畜産學 II	정천용	한국방송대학교출판부
4076	EM004077	1996年度農村振興試驗硏究事業年報	농촌진흥청	農村振興廳
7806	EM007807	식물검역연보. 1999-2014	국립식물검역소	농림축산검역본부 식물검역부
4568	EM004569	농업과학기술 연구개발 1997년도 시험연구보고서 : 맥류편	작물시험장	농촌진흥청 작물시험장
11748	EM011749	(2010) 농림어업총조사보고서 . 1-2 = 2010 agriculture, forestry & fishery census report : forestry : 임업	통계청	통계청

	등록번호	도서명	저자명	출판사
11933	EM011934	주요 농산물 유통실태. 2000-2014	농수산물유통공사	농수산물유통공사
4867	EM004868	農業科學論文集終刊特輯號	농촌진흥청	農村振興廳
4094	EM004095	식물유전자원 국제기술회의 결과보고서	농업과학기술원	농업과학기술원 유전자원과
8159	EM008160	농산물 품질관리사 : 우리농산물지킴이. I	부민문화사 자연과학부	부민문화사
5173	EM005174	녹차산업의 발전 방향과 정책과제	한국농촌경제연구원	한국농촌경제연구원
13874	EM013875	은수저 6	아라카와 히로무	학산문화사
7682	EM007683	식량농업식물유전자원 국제조약 = INTERNATIONAL TREATY ON PLANT GENETIC RESOURCES FOR FOOD AND AGRICULTURE	농업생명공학연구원	농촌진흥청 농업생명공학연구원
471	EM000472	農業動力學	정창주	文運堂
3940	EM003941	사회주의 농업의 변모	한국농촌경제연구원	韓國農村經濟硏究院
12619	EM012620	개도국 농촌개발을 위한 협력모델과 전략수립 방안	한국농촌경제연구원	한국농촌경제연구원

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Decimal Number

Uppercase Letter

Most occurring scripts

Most frequent character per script

Common

Latin

Most occurring blocks

Most frequent character per block

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Other Punctuation

Decimal Number

Letter Number

Math Symbol

Open Punctuation

Close Punctuation

Other Symbol

Space Separator

Dash Punctuation

Final Punctuation

Initial Punctuation

Modifier Symbol

Most occurring scripts

Most frequent character per script

Han

Hangul

Katakana

Latin

Hiragana

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

CJK

None

Hiragana

Katakana

Compat Jamo

CJK Compat Ideographs

Number Forms

Math Operators

Geometric Shapes

Punctuation

Box Drawing

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Math Symbol

Close Punctuation

Open Punctuation

Space Separator

Dash Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Katakana

Hiragana

Common

Most occurring blocks

Most frequent character per block

Hangul

ASCII