gimi9 Pandas Profiling

Dataset statistics

Number of variables	6
Number of observations	10000
Missing cells	0
Missing cells (%)	0.0%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	556.6 KiB
Average record size in memory	57.0 B

Variable types

Numeric	1
Text	5

Dataset

Description	부산광역시연제구_자료관도서목록_20230411
Author	부산광역시 연제구
URL	http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15048049

Alerts

`번호` has unique values	Unique
`등록번호` has unique values	Unique

Reproduction

Analysis started	2023-12-10 16:13:03.882830
Analysis finished	2023-12-10 16:13:06.940320
Duration	3.06 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

번호
Real number (ℝ)

UNIQUE

Distinct	10000
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	46015.229

Minimum	4
Maximum	91789
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	166.0 KiB

Quantile statistics

Minimum	4
5-th percentile	4608.75
Q1	23296.25
median	45744
Q3	69115.25
95-th percentile	87440.45
Maximum	91789
Range	91785
Interquartile range (IQR)	45819

Descriptive statistics

Standard deviation	26456.761
Coefficient of variation (CV)	0.57495662
Kurtosis	-1.1951469
Mean	46015.229
Median Absolute Deviation (MAD)	22927
Skewness	0.00012559612
Sum	4.6015229 × 10⁸
Variance	6.9996018 × 10⁸
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=50)

Value	Count	Frequency (%)
75892	1	< 0.1%
90223	1	< 0.1%
48117	1	< 0.1%
26892	1	< 0.1%
13869	1	< 0.1%
66604	1	< 0.1%
72619	1	< 0.1%
39497	1	< 0.1%
71676	1	< 0.1%
4346	1	< 0.1%
Other values (9990)	9990	99.9%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
4	1	< 0.1%
12	1	< 0.1%
18	1	< 0.1%
24	1	< 0.1%
25	1	< 0.1%
28	1	< 0.1%
38	1	< 0.1%
42	1	< 0.1%
47	1	< 0.1%
64	1	< 0.1%

Value	Count	Frequency (%)
91789	1	< 0.1%
91783	1	< 0.1%
91779	1	< 0.1%
91773	1	< 0.1%
91762	1	< 0.1%
91747	1	< 0.1%
91744	1	< 0.1%
91739	1	< 0.1%
91737	1	< 0.1%
91735	1	< 0.1%

등록번호
Text

UNIQUE

Distinct	10000
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	12
Median length	12
Mean length	12
Min length	12

Characters and Unicode

Total characters	120000
Distinct characters	13
Distinct categories	2 ?
Distinct scripts	2 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	10000 ?
Unique (%)	100.0%

Sample

1st row	ABN000063728
2nd row	ABN000121630
3rd row	ABN000090195
4th row	ABN000054975
5th row	ABN000072929

Value	Count	Frequency (%)
abn000063728	1	< 0.1%
abn000104306	1	< 0.1%
abn000054846	1	< 0.1%
abn000108452	1	< 0.1%
abn000095053	1	< 0.1%
abn000122026	1	< 0.1%
abn000138335	1	< 0.1%
abn000073421	1	< 0.1%
abn000067208	1	< 0.1%
abn000048766	1	< 0.1%
Other values (9990)	9990	99.9%

Most occurring characters

Value	Count	Frequency (%)
0	40292	33.6%
A	10000	8.3%
B	10000	8.3%
N	10000	8.3%
1	9389	7.8%
5	5407	4.5%
4	5127	4.3%
8	5049	4.2%
6	5040	4.2%
3	5030	4.2%
Other values (3)	14666	12.2%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	90000	75.0%
Uppercase Letter	30000	25.0%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
0	40292	44.8%
1	9389	10.4%
5	5407	6.0%
4	5127	5.7%
8	5049	5.6%
6	5040	5.6%
3	5030	5.6%
2	4953	5.5%
9	4861	5.4%
7	4852	5.4%

Uppercase Letter

Value	Count	Frequency (%)
A	10000	33.3%
B	10000	33.3%
N	10000	33.3%

Most occurring scripts

Value	Count	Frequency (%)
Common	90000	75.0%
Latin	30000	25.0%

Most frequent character per script

Common

Value	Count	Frequency (%)
0	40292	44.8%
1	9389	10.4%
5	5407	6.0%
4	5127	5.7%
8	5049	5.6%
6	5040	5.6%
3	5030	5.6%
2	4953	5.5%
9	4861	5.4%
7	4852	5.4%

Latin

Value	Count	Frequency (%)
A	10000	33.3%
B	10000	33.3%
N	10000	33.3%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	120000	100.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
0	40292	33.6%
A	10000	8.3%
B	10000	8.3%
N	10000	8.3%
1	9389	7.8%
5	5407	4.5%
4	5127	4.3%
8	5049	4.2%
6	5040	4.2%
3	5030	4.2%
Other values (3)	14666	12.2%

서명
Text

Distinct	9858
Distinct (%)	98.6%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	302
Median length	92
Mean length	23.7966
Min length	1

Characters and Unicode

Total characters	237966
Distinct characters	1608
Distinct categories	17 ?
Distinct scripts	5 ?
Distinct blocks	12 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	9720 ?
Unique (%)	97.2%

Sample

1st row	밤을 건너는 소년
2nd row	천 개의 죽음이 내게 말해준 것들
3rd row	쉬엄쉬엄 가도 괜찮아요
4th row	졸업선물 : 성공이 아닌 성장을 위한 이야기
5th row	한국 산문선. 3, 위험한 백성

Value	Count	Frequency (%)
	4394	7.3%
이야기	439	0.7%
1	301	0.5%
위한	293	0.5%
2	291	0.5%
내	221	0.4%
the	172	0.3%
한	172	0.3%
우리	163	0.3%
나는	150	0.2%
Other values (24566)	53885	89.1%

Most occurring characters

Value	Count	Frequency (%)
	50530	21.2%
의	4439	1.9%
:	4223	1.8%
이	4138	1.7%
는	3509	1.5%
기	2378	1.0%
,	2232	0.9%
가	2183	0.9%
한	2133	0.9%
사	2076	0.9%
Other values (1598)	160125	67.3%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	148539	62.4%
Space Separator	50530	21.2%
Lowercase Letter	16863	7.1%
Other Punctuation	9764	4.1%
Decimal Number	4593	1.9%
Uppercase Letter	2347	1.0%
Open Punctuation	2245	0.9%
Close Punctuation	2245	0.9%
Math Symbol	621	0.3%
Dash Punctuation	170	0.1%
Other values (7)	49	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
의	4439	3.0%
이	4138	2.8%
는	3509	2.4%
기	2378	1.6%
가	2183	1.5%
한	2133	1.4%
사	2076	1.4%
리	1974	1.3%
지	1964	1.3%
다	1960	1.3%
Other values (1474)	121785	82.0%

Lowercase Letter

Value	Count	Frequency (%)
e	1966	11.7%
o	1515	9.0%
a	1419	8.4%
i	1339	7.9%
t	1249	7.4%
n	1197	7.1%
r	1142	6.8%
s	1096	6.5%
l	734	4.4%
h	723	4.3%
Other values (17)	4483	26.6%

Uppercase Letter

Value	Count	Frequency (%)
S	268	11.4%
T	229	9.8%
C	140	6.0%
M	134	5.7%
B	130	5.5%
P	123	5.2%
D	118	5.0%
W	114	4.9%
A	113	4.8%
G	107	4.6%
Other values (16)	871	37.1%

Other Punctuation

Value	Count	Frequency (%)
:	4223	43.3%
,	2232	22.9%
.	1458	14.9%
!	665	6.8%
?	473	4.8%
·	284	2.9%
'	260	2.7%
;	34	0.3%
&	29	0.3%
"	22	0.2%
Other values (11)	84	0.9%

Decimal Number

Value	Count	Frequency (%)
1	1163	25.3%
0	903	19.7%
2	825	18.0%
3	394	8.6%
5	331	7.2%
4	283	6.2%
6	200	4.4%
9	187	4.1%
8	157	3.4%
7	150	3.3%

Math Symbol

Value	Count	Frequency (%)
=	522	84.1%
~	47	7.6%
+	18	2.9%
×	9	1.4%
<	8	1.3%
>	8	1.3%
\|	5	0.8%
→	2	0.3%
｜	1	0.2%
＋	1	0.2%

Other Number

Value	Count	Frequency (%)
②	2	28.6%
⑤	1	14.3%
④	1	14.3%
③	1	14.3%
₂	1	14.3%
①	1	14.3%

Open Punctuation

Value	Count	Frequency (%)
(	1739	77.5%
[	476	21.2%
『	22	1.0%
「	5	0.2%
《	3	0.1%

Close Punctuation

Value	Count	Frequency (%)
)	1739	77.5%
]	476	21.2%
』	22	1.0%
」	5	0.2%
》	3	0.1%

Letter Number

Value	Count	Frequency (%)
Ⅱ	10	41.7%
Ⅰ	6	25.0%
Ⅸ	4	16.7%
Ⅲ	4	16.7%

Other Symbol

Value	Count	Frequency (%)
★	5	62.5%
☆	2	25.0%
℃	1	12.5%

Modifier Symbol

Value	Count	Frequency (%)
´	2	66.7%
`	1	33.3%

Space Separator

Value	Count	Frequency (%)
	50530	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	170	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	3	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	3	100.0%

Initial Punctuation

Value	Count	Frequency (%)
‘	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	148313	62.3%
Common	70193	29.5%
Latin	19231	8.1%
Han	226	0.1%
Greek	3	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
의	4439	3.0%
이	4138	2.8%
는	3509	2.4%
기	2378	1.6%
가	2183	1.5%
한	2133	1.4%
사	2076	1.4%
리	1974	1.3%
지	1964	1.3%
다	1960	1.3%
Other values (1317)	121559	82.0%

Han

Value	Count	Frequency (%)
學	11	4.9%
文	7	3.1%
代	6	2.7%
現	6	2.7%
年	4	1.8%
國	4	1.8%
下	4	1.8%
上	4	1.8%
法	4	1.8%
海	3	1.3%
Other values (147)	173	76.5%

Common

Value	Count	Frequency (%)
	50530	72.0%
:	4223	6.0%
,	2232	3.2%
(	1739	2.5%
)	1739	2.5%
.	1458	2.1%
1	1163	1.7%
0	903	1.3%
2	825	1.2%
!	665	0.9%
Other values (57)	4716	6.7%

Latin

Value	Count	Frequency (%)
e	1966	10.2%
o	1515	7.9%
a	1419	7.4%
i	1339	7.0%
t	1249	6.5%
n	1197	6.2%
r	1142	5.9%
s	1096	5.7%
l	734	3.8%
h	723	3.8%
Other values (46)	6851	35.6%

Greek

Value	Count	Frequency (%)
π	3	100.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	148297	62.3%
ASCII	88974	37.4%
None	401	0.2%
CJK	219	0.1%
Number Forms	24	< 0.1%
Compat Jamo	16	< 0.1%
Punctuation	12	< 0.1%
Misc Symbols	7	< 0.1%
CJK Compat Ideographs	7	< 0.1%
Enclosed Alphanum	6	< 0.1%
Other values (2)	3	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	50530	56.8%
:	4223	4.7%
,	2232	2.5%
e	1966	2.2%
(	1739	2.0%
)	1739	2.0%
o	1515	1.7%
.	1458	1.6%
a	1419	1.6%
i	1339	1.5%
Other values (79)	20814	23.4%

Hangul

Value	Count	Frequency (%)
의	4439	3.0%
이	4138	2.8%
는	3509	2.4%
기	2378	1.6%
가	2183	1.5%
한	2133	1.4%
사	2076	1.4%
리	1974	1.3%
지	1964	1.3%
다	1960	1.3%
Other values (1309)	121543	82.0%

None

Value	Count	Frequency (%)
·	284	70.8%
『	22	5.5%
』	22	5.5%
＆	20	5.0%
％	16	4.0%
×	9	2.2%
」	5	1.2%
「	5	1.2%
《	3	0.7%
π	3	0.7%
Other values (9)	12	3.0%

CJK

Value	Count	Frequency (%)
學	11	5.0%
文	7	3.2%
代	6	2.7%
現	6	2.7%
年	4	1.8%
國	4	1.8%
下	4	1.8%
上	4	1.8%
法	4	1.8%
海	3	1.4%
Other values (140)	166	75.8%

Number Forms

Value	Count	Frequency (%)
Ⅱ	10	41.7%
Ⅰ	6	25.0%
Ⅸ	4	16.7%
Ⅲ	4	16.7%

Punctuation

Value	Count	Frequency (%)
…	8	66.7%
’	3	25.0%
‘	1	8.3%

Misc Symbols

Value	Count	Frequency (%)
★	5	71.4%
☆	2	28.6%

Compat Jamo

Value	Count	Frequency (%)
ㄱ	3	18.8%
ㄴ	3	18.8%
ㄷ	3	18.8%
ㅅ	2	12.5%
ㆍ	2	12.5%
ㅇ	1	6.2%
ㅋ	1	6.2%
ㅎ	1	6.2%

Enclosed Alphanum

Value	Count	Frequency (%)
②	2	33.3%
⑤	1	16.7%
④	1	16.7%
③	1	16.7%
①	1	16.7%

Arrows

Value	Count	Frequency (%)
→	2	100.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
龍	1	14.3%
歷	1	14.3%
不	1	14.3%
老	1	14.3%
療	1	14.3%
料	1	14.3%
理	1	14.3%

Letterlike Symbols

Value	Count	Frequency (%)
℃	1	100.0%

저자
Text

Distinct	8907
Distinct (%)	89.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	156
Median length	111
Mean length	15.9349
Min length	2

Characters and Unicode

Total characters	159349
Distinct characters	1034
Distinct categories	12 ?
Distinct scripts	5 ?
Distinct blocks	8 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	8169 ?
Unique (%)	81.7%

Sample

1st row	최양선 지음
2nd row	고칸 메구미 지음 ; 오시연 옮김
3rd row	서정홍 지음
4th row	신영준 글 ; 서동민 그림
5th row	이종묵, 장유승 [공]편역

Value	Count	Frequency (%)
	6815	14.6%
지음	5649	12.1%
옮김	3020	6.5%
그림	2511	5.4%
글	2020	4.3%
글·그림	606	1.3%
by	572	1.2%
공]지음	385	0.8%
외	242	0.5%
illustrated	165	0.4%
Other values (13489)	24708	52.9%

Most occurring characters

Value	Count	Frequency (%)
	36764	23.1%
지	7013	4.4%
;	6812	4.3%
음	6298	4.0%
김	5550	3.5%
그	3430	2.2%
림	3325	2.1%
옮	3124	2.0%
이	3117	2.0%
글	2904	1.8%
Other values (1024)	81012	50.8%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	97677	61.3%
Space Separator	36764	23.1%
Lowercase Letter	11305	7.1%
Other Punctuation	9399	5.9%
Uppercase Letter	1917	1.2%
Open Punctuation	1082	0.7%
Close Punctuation	1080	0.7%
Dash Punctuation	56	< 0.1%
Decimal Number	52	< 0.1%
Math Symbol	14	< 0.1%
Other values (2)	3	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
지	7013	7.2%
음	6298	6.4%
김	5550	5.7%
그	3430	3.5%
림	3325	3.4%
옮	3124	3.2%
이	3117	3.2%
글	2904	3.0%
정	1573	1.6%
스	1545	1.6%
Other values (936)	59798	61.2%

Lowercase Letter

Value	Count	Frequency (%)
a	1131	10.0%
e	1117	9.9%
t	910	8.0%
r	896	7.9%
l	893	7.9%
i	856	7.6%
y	819	7.2%
n	775	6.9%
b	650	5.7%
o	619	5.5%
Other values (16)	2639	23.3%

Uppercase Letter

Value	Count	Frequency (%)
M	179	9.3%
J	167	8.7%
S	148	7.7%
A	138	7.2%
B	124	6.5%
C	124	6.5%
K	113	5.9%
R	112	5.8%
D	89	4.6%
L	87	4.5%
Other values (16)	636	33.2%

Other Punctuation

Value	Count	Frequency (%)
;	6812	72.5%
,	1260	13.4%
·	721	7.7%
.	510	5.4%
:	72	0.8%
&	8	0.1%
?	4	< 0.1%
／	4	< 0.1%
/	3	< 0.1%
"	2	< 0.1%
Other values (2)	3	< 0.1%

Decimal Number

Value	Count	Frequency (%)
2	12	23.1%
1	10	19.2%
3	8	15.4%
0	7	13.5%
4	4	7.7%
7	3	5.8%
6	3	5.8%
9	2	3.8%
5	2	3.8%
8	1	1.9%

Open Punctuation

Value	Count	Frequency (%)
[	1068	98.7%
(	9	0.8%
『	3	0.3%
〈	2	0.2%

Close Punctuation

Value	Count	Frequency (%)
]	1066	98.7%
)	9	0.8%
』	3	0.3%
〉	2	0.2%

Math Symbol

Value	Count	Frequency (%)
<	7	50.0%
>	7	50.0%

Space Separator

Value	Count	Frequency (%)
	36764	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	56	100.0%

Other Symbol

Value	Count	Frequency (%)
ⓔ	2	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	97647	61.3%
Common	48450	30.4%
Latin	13222	8.3%
Han	28	< 0.1%
Katakana	2	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
지	7013	7.2%
음	6298	6.4%
김	5550	5.7%
그	3430	3.5%
림	3325	3.4%
옮	3124	3.2%
이	3117	3.2%
글	2904	3.0%
정	1573	1.6%
스	1545	1.6%
Other values (912)	59768	61.2%

Latin

Value	Count	Frequency (%)
a	1131	8.6%
e	1117	8.4%
t	910	6.9%
r	896	6.8%
l	893	6.8%
i	856	6.5%
y	819	6.2%
n	775	5.9%
b	650	4.9%
o	619	4.7%
Other values (42)	4556	34.5%

Common

Value	Count	Frequency (%)
	36764	75.9%
;	6812	14.1%
,	1260	2.6%
[	1068	2.2%
]	1066	2.2%
·	721	1.5%
.	510	1.1%
:	72	0.1%
-	56	0.1%
2	12	< 0.1%
Other values (26)	109	0.2%

Han

Value	Count	Frequency (%)
著	4	14.3%
川	2	7.1%
玉	2	7.1%
金	1	3.6%
鎭	1	3.6%
雄	1	3.6%
光	1	3.6%
朴	1	3.6%
惠	1	3.6%
一	1	3.6%
Other values (13)	13	46.4%

Katakana

Value	Count	Frequency (%)
ナ	2	100.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	97640	61.3%
ASCII	60933	38.2%
None	737	0.5%
CJK	27	< 0.1%
Compat Jamo	7	< 0.1%
Katakana	2	< 0.1%
Enclosed Alphanum	2	< 0.1%
CJK Compat Ideographs	1	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	36764	60.3%
;	6812	11.2%
,	1260	2.1%
a	1131	1.9%
e	1117	1.8%
[	1068	1.8%
]	1066	1.7%
t	910	1.5%
r	896	1.5%
l	893	1.5%
Other values (70)	9016	14.8%

Hangul

Value	Count	Frequency (%)
지	7013	7.2%
음	6298	6.5%
김	5550	5.7%
그	3430	3.5%
림	3325	3.4%
옮	3124	3.2%
이	3117	3.2%
글	2904	3.0%
정	1573	1.6%
스	1545	1.6%
Other values (908)	59761	61.2%

None

Value	Count	Frequency (%)
·	721	97.8%
／	4	0.5%
』	3	0.4%
『	3	0.4%
〈	2	0.3%
〉	2	0.3%
＆	2	0.3%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	4	57.1%
ㅆ	1	14.3%
ㅂ	1	14.3%
ㅎ	1	14.3%

CJK

Value	Count	Frequency (%)
著	4	14.8%
川	2	7.4%
玉	2	7.4%
金	1	3.7%
鎭	1	3.7%
雄	1	3.7%
光	1	3.7%
朴	1	3.7%
惠	1	3.7%
一	1	3.7%
Other values (12)	12	44.4%

Katakana

Value	Count	Frequency (%)
ナ	2	100.0%

Enclosed Alphanum

Value	Count	Frequency (%)
ⓔ	2	100.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
李	1	100.0%

발행자
Text

Distinct	2859
Distinct (%)	28.6%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	67
Median length	47
Mean length	4.9513
Min length	1

Characters and Unicode

Total characters	49513
Distinct characters	777
Distinct categories	10 ?
Distinct scripts	4 ?
Distinct blocks	4 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1524 ?
Unique (%)	15.2%

Sample

1st row	사계절
2nd row	웅진지식하우스:웅진씽크빅
3rd row	단비
4th row	로크미디어
5th row	민음사

Value	Count	Frequency (%)
문학동네	177	1.7%
창비	158	1.5%
위즈덤하우스	109	1.0%
비룡소	100	0.9%
books	97	0.9%
서울문화사	89	0.8%
김영사	75	0.7%
사계절	64	0.6%
민음사	64	0.6%
자음과모음	63	0.6%
Other values (2914)	9652	90.6%

Most occurring characters

Value	Count	Frequency (%)
스	1716	3.5%
북	1351	2.7%
사	1349	2.7%
이	1287	2.6%
어	876	1.8%
아	775	1.6%
문	753	1.5%
o	735	1.5%
	648	1.3%
비	622	1.3%
Other values (767)	39401	79.6%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	41094	83.0%
Lowercase Letter	5360	10.8%
Uppercase Letter	1413	2.9%
Other Punctuation	705	1.4%
Space Separator	648	1.3%
Decimal Number	141	0.3%
Close Punctuation	64	0.1%
Open Punctuation	64	0.1%
Dash Punctuation	23	< 0.1%
Connector Punctuation	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
스	1716	4.2%
북	1351	3.3%
사	1349	3.3%
이	1287	3.1%
어	876	2.1%
아	775	1.9%
문	753	1.8%
비	622	1.5%
리	617	1.5%
학	540	1.3%
Other values (689)	31208	75.9%

Uppercase Letter

Value	Count	Frequency (%)
B	239	16.9%
H	118	8.4%
S	116	8.2%
P	105	7.4%
C	93	6.6%
R	91	6.4%
M	82	5.8%
A	76	5.4%
K	69	4.9%
L	67	4.7%
Other values (16)	357	25.3%

Lowercase Letter

Value	Count	Frequency (%)
o	735	13.7%
e	519	9.7%
s	488	9.1%
r	438	8.2%
i	378	7.1%
n	374	7.0%
a	345	6.4%
l	280	5.2%
k	255	4.8%
t	242	4.5%
Other values (15)	1306	24.4%

Other Punctuation

Value	Count	Frequency (%)
:	571	81.0%
&	38	5.4%
'	36	5.1%
·	18	2.6%
.	15	2.1%
＆	9	1.3%
#	7	1.0%
,	7	1.0%
;	3	0.4%
"	1	0.1%

Decimal Number

Value	Count	Frequency (%)
2	59	41.8%
1	57	40.4%
0	7	5.0%
3	7	5.0%
5	3	2.1%
6	2	1.4%
4	2	1.4%
8	2	1.4%
9	1	0.7%
7	1	0.7%

Close Punctuation

Value	Count	Frequency (%)
)	63	98.4%
]	1	1.6%

Open Punctuation

Value	Count	Frequency (%)
(	63	98.4%
[	1	1.6%

Space Separator

Value	Count	Frequency (%)
	648	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	23	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	41057	82.9%
Latin	6773	13.7%
Common	1646	3.3%
Han	37	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
스	1716	4.2%
북	1351	3.3%
사	1349	3.3%
이	1287	3.1%
어	876	2.1%
아	775	1.9%
문	753	1.8%
비	622	1.5%
리	617	1.5%
학	540	1.3%
Other values (663)	31171	75.9%

Latin

Value	Count	Frequency (%)
o	735	10.9%
e	519	7.7%
s	488	7.2%
r	438	6.5%
i	378	5.6%
n	374	5.5%
a	345	5.1%
l	280	4.1%
k	255	3.8%
t	242	3.6%
Other values (41)	2719	40.1%

Common

Value	Count	Frequency (%)
	648	39.4%
:	571	34.7%
)	63	3.8%
(	63	3.8%
2	59	3.6%
1	57	3.5%
&	38	2.3%
'	36	2.2%
-	23	1.4%
·	18	1.1%
Other values (17)	70	4.3%

Han

Value	Count	Frequency (%)
文	5	13.5%
選	3	8.1%
東	3	8.1%
社	2	5.4%
人	2	5.4%
仁	2	5.4%
冊	1	2.7%
房	1	2.7%
古	1	2.7%
學	1	2.7%
Other values (16)	16	43.2%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	41057	82.9%
ASCII	8392	16.9%
CJK	37	0.1%
None	27	0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
스	1716	4.2%
북	1351	3.3%
사	1349	3.3%
이	1287	3.1%
어	876	2.1%
아	775	1.9%
문	753	1.8%
비	622	1.5%
리	617	1.5%
학	540	1.3%
Other values (663)	31171	75.9%

ASCII

Value	Count	Frequency (%)
o	735	8.8%
	648	7.7%
:	571	6.8%
e	519	6.2%
s	488	5.8%
r	438	5.2%
i	378	4.5%
n	374	4.5%
a	345	4.1%
l	280	3.3%
Other values (66)	3616	43.1%

None

Value	Count	Frequency (%)
·	18	66.7%
＆	9	33.3%

CJK

Value	Count	Frequency (%)
文	5	13.5%
選	3	8.1%
東	3	8.1%
社	2	5.4%
人	2	5.4%
仁	2	5.4%
冊	1	2.7%
房	1	2.7%
古	1	2.7%
學	1	2.7%
Other values (16)	16	43.2%

청구기호
Text

Distinct	9998
Distinct (%)	> 99.9%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	19
Median length	16
Mean length	10.4287
Min length	5

Characters and Unicode

Total characters	104287
Distinct characters	41
Distinct categories	9 ?
Distinct scripts	3 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	9996 ?
Unique (%)	> 99.9%

Sample

1st row	808.31-3-108
2nd row	512.804-11
3rd row	811.7-960
4th row	818-563
5th row	814.5-1-3

Value	Count	Frequency (%)
아동	2242	15.8%
그림책	920	6.5%
영어	337	2.4%
더책	234	1.6%
시니어	162	1.1%
큰글자	146	1.0%
mom	80	0.6%
보드북	75	0.5%
참고	19	0.1%
점자	6	< 0.1%
Other values (9944)	10004	70.3%

Most occurring characters

Value	Count	Frequency (%)
-	13123	12.6%
1	12530	12.0%
3	9709	9.3%
8	9607	9.2%
2	8442	8.1%
.	6097	5.8%
4	6093	5.8%
5	5151	4.9%
0	5025	4.8%
9	4808	4.6%
Other values (31)	23702	22.7%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	69701	66.8%
Dash Punctuation	13123	12.6%
Other Letter	9596	9.2%
Other Punctuation	6097	5.8%
Space Separator	4225	4.1%
Math Symbol	1298	1.2%
Uppercase Letter	243	0.2%
Open Punctuation	2	< 0.1%
Close Punctuation	2	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
아	2243	23.4%
동	2243	23.4%
책	1154	12.0%
림	920	9.6%
그	920	9.6%
어	499	5.2%
영	337	3.5%
더	234	2.4%
니	162	1.7%
시	162	1.7%
Other values (12)	722	7.5%

Decimal Number

Value	Count	Frequency (%)
1	12530	18.0%
3	9709	13.9%
8	9607	13.8%
2	8442	12.1%
4	6093	8.7%
5	5151	7.4%
0	5025	7.2%
9	4808	6.9%
7	4672	6.7%
6	3664	5.3%

Uppercase Letter

Value	Count	Frequency (%)
M	160	65.8%
O	80	32.9%
A	3	1.2%

Dash Punctuation

Value	Count	Frequency (%)
-	13123	100.0%

Other Punctuation

Value	Count	Frequency (%)
.	6097	100.0%

Space Separator

Value	Count	Frequency (%)
	4225	100.0%

Math Symbol

Value	Count	Frequency (%)
=	1298	100.0%

Open Punctuation

Value	Count	Frequency (%)
[	2	100.0%

Close Punctuation

Value	Count	Frequency (%)
]	2	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	94448	90.6%
Hangul	9596	9.2%
Latin	243	0.2%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
아	2243	23.4%
동	2243	23.4%
책	1154	12.0%
림	920	9.6%
그	920	9.6%
어	499	5.2%
영	337	3.5%
더	234	2.4%
니	162	1.7%
시	162	1.7%
Other values (12)	722	7.5%

Common

Value	Count	Frequency (%)
-	13123	13.9%
1	12530	13.3%
3	9709	10.3%
8	9607	10.2%
2	8442	8.9%
.	6097	6.5%
4	6093	6.5%
5	5151	5.5%
0	5025	5.3%
9	4808	5.1%
Other values (6)	13863	14.7%

Latin

Value	Count	Frequency (%)
M	160	65.8%
O	80	32.9%
A	3	1.2%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	94691	90.8%
Hangul	9596	9.2%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
-	13123	13.9%
1	12530	13.2%
3	9709	10.3%
8	9607	10.1%
2	8442	8.9%
.	6097	6.4%
4	6093	6.4%
5	5151	5.4%
0	5025	5.3%
9	4808	5.1%
Other values (9)	14106	14.9%

Hangul

Value	Count	Frequency (%)
아	2243	23.4%
동	2243	23.4%
책	1154	12.0%
림	920	9.6%
그	920	9.6%
어	499	5.2%
영	337	3.5%
더	234	2.4%
니	162	1.7%
시	162	1.7%
Other values (12)	722	7.5%

번호

번호

Count
Matrix

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

First rows
Last rows

	번호	등록번호	서명	저자	발행자	청구기호
75891	75892	ABN000063728	밤을 건너는 소년	최양선 지음	사계절	808.31-3-108
27287	27288	ABN000121630	천 개의 죽음이 내게 말해준 것들	고칸 메구미 지음 ; 오시연 옮김	웅진지식하우스:웅진씽크빅	512.804-11
51088	51089	ABN000090195	쉬엄쉬엄 가도 괜찮아요	서정홍 지음	단비	811.7-960
84314	84315	ABN000054975	졸업선물 : 성공이 아닌 성장을 위한 이야기	신영준 글 ; 서동민 그림	로크미디어	818-563
67062	67063	ABN000072929	한국 산문선. 3, 위험한 백성	이종묵, 장유승 [공]편역	민음사	814.5-1-3
44403	44404	ABN000099376	유전과 게놈 : '개성'은 어떻게 유전되는가? : 유전의 기본부터 맞춤의료, 게놈 편집까지	[뉴턴프레스 편] ; 강금희 ; 이세영 [공] 번역	아이뉴턴	408-2-117
10987	10988	ABN000141216	(더책)아빠나무	김미영 글·그림	고래뱃속	더책 813.8-515
83202	83203	ABN000056168	하나야 놀자 두리야 놀자	김녹두 글 ; 김진화 그림	문학동네	아동 813.8-1492
63862	63863	ABN000076270	희망	앙드레 말로 지음 ; 김웅권 옮김	문학동네	808.31-2-163
19904	19905	ABN000131545	(더책)아빠가 둘이야?	임지형 글 ; 윤태규 그림	키다리	더책 813.8-474

	번호	등록번호	서명	저자	발행자	청구기호
46	47	ABN000154706	외계에서 온 펀자이씨	엄유진 글·그림	문학동네	818-1919-2
51780	51781	ABN000089501	(청소년)북유럽 신화=. 3Norse mythology	노경실 지음	자음과모음	219.23-9-3
28721	28722	ABN000120195	국어를 좋아해 : 의성어·의태어	기린교육연구소 글·기획 ; 김소희 그림	기린미디어	아동 710-26-3
54928	54929	ABN000086150	익숙한 길의 왼쪽	황선미 지음	미디어창비	814.7-680
11352	11353	ABN000140851	빛이 매혹이 될 때 : 빛의 물리학은 어떻게 예술과 우리의 세계를 확장시켰나	서민아 지음	인플루엔셜	425-4=3
11362	11363	ABN000140841	성공한 나라 불안한 시민 : 대전환 시대, 한국 복지국가의 새판 짜기	이태수 외 지음	헤이북스	338.15-16=3
70336	70337	ABN000069546	(최열 아저씨의)지구 온난화 이야기	최열 글 ; 조원희 그림	도요새:환경재단	아동 539.9-41
8353	8354	ABN000144951	세계를 품은 외교관 : 외교관을 꿈꾸는 이들을 위한 스토리 가이드북	민동석 지음	이담Books	321.55-65
42643	42644	ABN000101151	수탉과 독재자	카르멘 애그라 디디 글 ; 유진 옐친 그림 ; 김경희 옮김	길벗어린이	그림책 843-1189
91618	91619	ABN000047336	(한현조·천종현 선생님의)천하무적 창의수학 연구소. 1, 수편	한헌조 ; 천종현 [공]지음 ; 배소미 스토리 ; 김영진 그림	보랏빛소	아동 410-98-1

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Decimal Number

Uppercase Letter

Most occurring scripts

Most frequent character per script

Common

Latin

Most occurring blocks

Most frequent character per block

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Math Symbol

Other Number

Open Punctuation

Close Punctuation

Letter Number

Other Symbol

Modifier Symbol

Space Separator

Dash Punctuation

Connector Punctuation

Final Punctuation

Initial Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Han

Common

Latin

Greek

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

CJK

Number Forms

Punctuation

Misc Symbols

Compat Jamo

Enclosed Alphanum

Arrows

CJK Compat Ideographs

Letterlike Symbols

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Open Punctuation

Close Punctuation

Math Symbol

Space Separator

Dash Punctuation

Other Symbol

Connector Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Latin

Common

Han

Katakana

Most occurring blocks

Most frequent character per block

ASCII