gimi9 Pandas Profiling

Dataset statistics

Number of variables	5
Number of observations	10000
Missing cells	35
Missing cells (%)	0.1%
Duplicate rows	699
Duplicate rows (%)	7.0%
Total size in memory	468.8 KiB
Average record size in memory	48.0 B

Variable types

Text	4
Categorical	1

Dataset

Description	대구광역시 중구 교양정보실 도서목록입니다 (도서명, 저자, 출판사 등의 정보를 제공합니다.)
Author	대구광역시 중구
URL	https://www.data.go.kr/data/15054147/fileData.do

Alerts

`데이터기준일자` has constant value ""	Constant
Dataset has 699 (7.0%) duplicate rows	Duplicates

Reproduction

Analysis started	2023-12-11 23:52:34.789570
Analysis finished	2023-12-11 23:52:36.672051
Duration	1.88 second
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

도서명
Text

Distinct	9008
Distinct (%)	90.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	59
Median length	47
Mean length	13.3404
Min length	1

Characters and Unicode

Total characters	133404
Distinct characters	1506
Distinct categories	13 ?
Distinct scripts	6 ?
Distinct blocks	13 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	8228 ?
Unique (%)	82.3%

Sample

1st row	명품도시를 만드는 열정
2nd row	쥬라기공원.2
3rd row	허와 실의 인간학 (지략편)
4th row	곰스크로 가는 기차
5th row	서울을 디자인한다

Value	Count	Frequency (%)
1	205	0.7%
2	199	0.7%
이야기	159	0.5%
내	118	0.4%
중구	103	0.3%
나는	87	0.3%
3	85	0.3%
위한	82	0.3%
우리	73	0.2%
대구	73	0.2%
Other values (15088)	28932	96.1%

Most occurring characters

Value	Count	Frequency (%)
	20140	15.1%
의	2764	2.1%
)	2744	2.1%
(	2739	2.1%
이	2174	1.6%
.	2120	1.6%
0	2059	1.5%
1	1976	1.5%
2	1946	1.5%
사	1853	1.4%
Other values (1496)	92889	69.6%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	92726	69.5%
Space Separator	20140	15.1%
Decimal Number	9426	7.1%
Close Punctuation	3233	2.4%
Open Punctuation	3229	2.4%
Other Punctuation	2890	2.2%
Uppercase Letter	847	0.6%
Lowercase Letter	602	0.5%
Dash Punctuation	216	0.2%
Math Symbol	66	< 0.1%
Other values (3)	29	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
의	2764	3.0%
이	2174	2.3%
사	1853	2.0%
는	1480	1.6%
기	1464	1.6%
지	1287	1.4%
다	1186	1.3%
대	1166	1.3%
리	1111	1.2%
한	1091	1.2%
Other values (1398)	77150	83.2%

Uppercase Letter

Value	Count	Frequency (%)
O	73	8.6%
E	62	7.3%
S	61	7.2%
R	59	7.0%
A	59	7.0%
B	56	6.6%
I	56	6.6%
N	54	6.4%
T	44	5.2%
C	31	3.7%
Other values (16)	292	34.5%

Lowercase Letter

Value	Count	Frequency (%)
e	79	13.1%
o	61	10.1%
a	42	7.0%
r	42	7.0%
n	39	6.5%
i	37	6.1%
t	36	6.0%
h	33	5.5%
l	33	5.5%
y	31	5.1%
Other values (14)	169	28.1%

Other Punctuation

Value	Count	Frequency (%)
.	2120	73.4%
/	182	6.3%
;	157	5.4%
:	105	3.6%
?	95	3.3%
!	90	3.1%
·	77	2.7%
'	24	0.8%
,	20	0.7%
&	9	0.3%
Other values (6)	11	0.4%

Decimal Number

Value	Count	Frequency (%)
0	2059	21.8%
1	1976	21.0%
2	1946	20.6%
9	743	7.9%
3	712	7.6%
5	522	5.5%
4	521	5.5%
6	349	3.7%
7	300	3.2%
8	298	3.2%

Math Symbol

Value	Count	Frequency (%)
~	44	66.7%
+	15	22.7%
=	3	4.5%
∼	2	3.0%
>	1	1.5%
<	1	1.5%

Letter Number

Value	Count	Frequency (%)
Ⅰ	11	42.3%
Ⅱ	7	26.9%
Ⅳ	4	15.4%
Ⅲ	3	11.5%
Ⅶ	1	3.8%

Close Punctuation

Value	Count	Frequency (%)
)	2744	84.9%
]	488	15.1%
』	1	< 0.1%

Open Punctuation

Value	Count	Frequency (%)
(	2739	84.8%
[	489	15.1%
『	1	< 0.1%

Other Symbol

Value	Count	Frequency (%)
ⓔ	1	50.0%
℃	1	50.0%

Space Separator

Value	Count	Frequency (%)
	20140	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	216	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	92147	69.1%
Common	39203	29.4%
Latin	1475	1.1%
Han	574	0.4%
Katakana	4	< 0.1%
Hiragana	1	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
의	2764	3.0%
이	2174	2.4%
사	1853	2.0%
는	1480	1.6%
기	1464	1.6%
지	1287	1.4%
다	1186	1.3%
대	1166	1.3%
리	1111	1.2%
한	1091	1.2%
Other values (1148)	76571	83.1%

Han

Value	Count	Frequency (%)
大	19	3.3%
子	17	3.0%
書	13	2.3%
四	12	2.1%
集	11	1.9%
東	8	1.4%
詩	8	1.4%
說	8	1.4%
名	8	1.4%
法	7	1.2%
Other values (235)	463	80.7%

Latin

Value	Count	Frequency (%)
e	79	5.4%
O	73	4.9%
E	62	4.2%
S	61	4.1%
o	61	4.1%
R	59	4.0%
A	59	4.0%
B	56	3.8%
I	56	3.8%
N	54	3.7%
Other values (45)	855	58.0%

Common

Value	Count	Frequency (%)
	20140	51.4%
)	2744	7.0%
(	2739	7.0%
.	2120	5.4%
0	2059	5.3%
1	1976	5.0%
2	1946	5.0%
9	743	1.9%
3	712	1.8%
5	522	1.3%
Other values (33)	3502	8.9%

Katakana

Value	Count	Frequency (%)
ク	1	25.0%
モ	1	25.0%
ル	1	25.0%
コ	1	25.0%

Hiragana

Value	Count	Frequency (%)
の	1	100.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	92141	69.1%
ASCII	40562	30.4%
CJK	554	0.4%
None	84	0.1%
Number Forms	26	< 0.1%
CJK Compat Ideographs	20	< 0.1%
Compat Jamo	6	< 0.1%
Katakana	4	< 0.1%
Punctuation	2	< 0.1%
Math Operators	2	< 0.1%
Other values (3)	3	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	20140	49.7%
)	2744	6.8%
(	2739	6.8%
.	2120	5.2%
0	2059	5.1%
1	1976	4.9%
2	1946	4.8%
9	743	1.8%
3	712	1.8%
5	522	1.3%
Other values (73)	4861	12.0%

Hangul

Value	Count	Frequency (%)
의	2764	3.0%
이	2174	2.4%
사	1853	2.0%
는	1480	1.6%
기	1464	1.6%
지	1287	1.4%
다	1186	1.3%
대	1166	1.3%
리	1111	1.2%
한	1091	1.2%
Other values (1142)	76565	83.1%

None

Value	Count	Frequency (%)
·	77	91.7%
！	3	3.6%
。	1	1.2%
『	1	1.2%
』	1	1.2%
＆	1	1.2%

CJK

Value	Count	Frequency (%)
大	19	3.4%
子	17	3.1%
書	13	2.3%
四	12	2.2%
集	11	2.0%
東	8	1.4%
詩	8	1.4%
說	8	1.4%
名	8	1.4%
法	7	1.3%
Other values (223)	443	80.0%

Number Forms

Value	Count	Frequency (%)
Ⅰ	11	42.3%
Ⅱ	7	26.9%
Ⅳ	4	15.4%
Ⅲ	3	11.5%
Ⅶ	1	3.8%

CJK Compat Ideographs

Value	Count	Frequency (%)
女	6	30.0%
李	3	15.0%
金	2	10.0%
裸	1	5.0%
滑	1	5.0%
靈	1	5.0%
戀	1	5.0%
龜	1	5.0%
龍	1	5.0%
療	1	5.0%
Other values (2)	2	10.0%

Punctuation

Value	Count	Frequency (%)
…	2	100.0%

Math Operators

Value	Count	Frequency (%)
∼	2	100.0%

Compat Jamo

Value	Count	Frequency (%)
ㄷ	1	16.7%
ㄱ	1	16.7%
ㄴ	1	16.7%
ㅇ	1	16.7%
ㅍ	1	16.7%
ㆍ	1	16.7%

Enclosed Alphanum

Value	Count	Frequency (%)
ⓔ	1	100.0%

Letterlike Symbols

Value	Count	Frequency (%)
℃	1	100.0%

Katakana

Value	Count	Frequency (%)
ク	1	25.0%
モ	1	25.0%
ル	1	25.0%
コ	1	25.0%

Hiragana

Value	Count	Frequency (%)
の	1	100.0%

저자
Text

Distinct	6440
Distinct (%)	64.4%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	73
Median length	66
Mean length	9.1001
Min length	2

Characters and Unicode

Total characters	91001
Distinct characters	951
Distinct categories	11 ?
Distinct scripts	4 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	5040 ?
Unique (%)	50.4%

Sample

1st row	박문하
2nd row	마이클 크리튼 지음; 정영목 옮김
3rd row	이병주 편저
4th row	프리츠 오르트만 지음
5th row	권영걸

Value	Count	Frequency (%)
지음	4479	17.4%
옮김	1493	5.8%
편	1238	4.8%
	549	2.1%
그림	354	1.4%
엮음	322	1.2%
저	309	1.2%
대구광역시	265	1.0%
외	249	1.0%
글	194	0.8%
Other values (7964)	16358	63.4%

Most occurring characters

Value	Count	Frequency (%)
	15889	17.5%
지	5319	5.8%
음	5246	5.8%
김	3051	3.4%
;	2818	3.1%
이	1912	2.1%
편	1703	1.9%
옮	1527	1.7%
구	1319	1.4%
정	1033	1.1%
Other values (941)	51184	56.2%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	70289	77.2%
Space Separator	15889	17.5%
Other Punctuation	3448	3.8%
Uppercase Letter	462	0.5%
Lowercase Letter	272	0.3%
Close Punctuation	211	0.2%
Open Punctuation	210	0.2%
Decimal Number	168	0.2%
Dash Punctuation	41	< 0.1%
Math Symbol	10	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
지	5319	7.6%
음	5246	7.5%
김	3051	4.3%
이	1912	2.7%
편	1703	2.4%
옮	1527	2.2%
구	1319	1.9%
정	1033	1.5%
시	974	1.4%
스	825	1.2%
Other values (863)	47380	67.4%

Uppercase Letter

Value	Count	Frequency (%)
S	49	10.6%
B	38	8.2%
R	36	7.8%
M	34	7.4%
K	31	6.7%
A	30	6.5%
C	30	6.5%
J	29	6.3%
E	25	5.4%
H	21	4.5%
Other values (14)	139	30.1%

Lowercase Letter

Value	Count	Frequency (%)
a	26	9.6%
n	26	9.6%
i	25	9.2%
e	23	8.5%
o	22	8.1%
t	19	7.0%
r	16	5.9%
s	15	5.5%
m	13	4.8%
l	13	4.8%
Other values (13)	74	27.2%

Other Punctuation

Value	Count	Frequency (%)
;	2818	81.7%
.	561	16.3%
·	38	1.1%
&	9	0.3%
,	7	0.2%
:	7	0.2%
/	5	0.1%
…	1	< 0.1%
＆	1	< 0.1%
／	1	< 0.1%

Decimal Number

Value	Count	Frequency (%)
1	34	20.2%
2	32	19.0%
0	28	16.7%
5	25	14.9%
8	19	11.3%
3	12	7.1%
6	8	4.8%
4	6	3.6%
7	3	1.8%
9	1	0.6%

Close Punctuation

Value	Count	Frequency (%)
]	195	92.4%
)	15	7.1%
〉	1	0.5%

Open Punctuation

Value	Count	Frequency (%)
[	195	92.9%
(	14	6.7%
〈	1	0.5%

Math Symbol

Value	Count	Frequency (%)
<	5	50.0%
>	5	50.0%

Space Separator

Value	Count	Frequency (%)
	15889	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	41	100.0%

Other Symbol

Value	Count	Frequency (%)
ⓔ	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	70186	77.1%
Common	19978	22.0%
Latin	734	0.8%
Han	103	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
지	5319	7.6%
음	5246	7.5%
김	3051	4.3%
이	1912	2.7%
편	1703	2.4%
옮	1527	2.2%
구	1319	1.9%
정	1033	1.5%
시	974	1.4%
스	825	1.2%
Other values (784)	47277	67.4%

Han

Value	Count	Frequency (%)
著	6	5.8%
會	4	3.9%
編	4	3.9%
博	3	2.9%
纂	2	1.9%
美	2	1.9%
委	2	1.9%
學	2	1.9%
外	2	1.9%
員	2	1.9%
Other values (69)	74	71.8%

Latin

Value	Count	Frequency (%)
S	49	6.7%
B	38	5.2%
R	36	4.9%
M	34	4.6%
K	31	4.2%
A	30	4.1%
C	30	4.1%
J	29	4.0%
a	26	3.5%
n	26	3.5%
Other values (37)	405	55.2%

Common

Value	Count	Frequency (%)
	15889	79.5%
;	2818	14.1%
.	561	2.8%
]	195	1.0%
[	195	1.0%
-	41	0.2%
·	38	0.2%
1	34	0.2%
2	32	0.2%
0	28	0.1%
Other values (21)	147	0.7%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	70186	77.1%
ASCII	20668	22.7%
CJK	99	0.1%
None	42	< 0.1%
CJK Compat Ideographs	4	< 0.1%
Enclosed Alphanum	1	< 0.1%
Punctuation	1	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	15889	76.9%
;	2818	13.6%
.	561	2.7%
]	195	0.9%
[	195	0.9%
S	49	0.2%
-	41	0.2%
B	38	0.2%
R	36	0.2%
M	34	0.2%
Other values (61)	812	3.9%

Hangul

Value	Count	Frequency (%)
지	5319	7.6%
음	5246	7.5%
김	3051	4.3%
이	1912	2.7%
편	1703	2.4%
옮	1527	2.2%
구	1319	1.9%
정	1033	1.5%
시	974	1.4%
스	825	1.2%
Other values (784)	47277	67.4%

None

Value	Count	Frequency (%)
·	38	90.5%
＆	1	2.4%
〈	1	2.4%
／	1	2.4%
〉	1	2.4%

CJK

Value	Count	Frequency (%)
著	6	6.1%
會	4	4.0%
編	4	4.0%
博	3	3.0%
纂	2	2.0%
美	2	2.0%
委	2	2.0%
學	2	2.0%
外	2	2.0%
員	2	2.0%
Other values (65)	70	70.7%

CJK Compat Ideographs

Value	Count	Frequency (%)
柳	1	25.0%
李	1	25.0%
林	1	25.0%
綾	1	25.0%

Enclosed Alphanum

Value	Count	Frequency (%)
ⓔ	1	100.0%

Punctuation

Value	Count	Frequency (%)
…	1	100.0%

출판사
Text

Distinct	3139
Distinct (%)	31.4%
Missing	7
Missing (%)	0.1%
Memory size	156.2 KiB

Length

Max length	54
Median length	25
Mean length	5.0847593
Min length	1

Characters and Unicode

Total characters	50812
Distinct characters	777
Distinct categories	10 ?
Distinct scripts	4 ?
Distinct blocks	7 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1732 ?
Unique (%)	17.3%

Sample

1st row	단풍나무
2nd row	김영사
3rd row	중앙미디어
4th row	북인더갭
5th row	디자인하우스

Value	Count	Frequency (%)
대구광역시	361	3.2%
중구	138	1.2%
중구청	128	1.1%
문학동네	111	1.0%
통계청	109	1.0%
김영사	96	0.9%
한길사	81	0.7%
한국지방행정연구원	80	0.7%
고려원	71	0.6%
도서출판	70	0.6%
Other values (3110)	9889	88.8%

Most occurring characters

Value	Count	Frequency (%)
사	2807	5.5%
구	1490	2.9%
판	1470	2.9%
출	1470	2.9%
문	1289	2.5%
	1236	2.4%
시	1045	2.1%
대	998	2.0%
서	798	1.6%
원	779	1.5%
Other values (767)	37430	73.7%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	46796	92.1%
Space Separator	1236	2.4%
Close Punctuation	720	1.4%
Open Punctuation	720	1.4%
Lowercase Letter	453	0.9%
Uppercase Letter	347	0.7%
Decimal Number	284	0.6%
Other Punctuation	222	0.4%
Dash Punctuation	33	0.1%
Other Symbol	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
사	2807	6.0%
구	1490	3.2%
판	1470	3.1%
출	1470	3.1%
문	1289	2.8%
시	1045	2.2%
대	998	2.1%
서	798	1.7%
원	779	1.7%
스	776	1.7%
Other values (691)	33874	72.4%

Uppercase Letter

Value	Count	Frequency (%)
B	70	20.2%
K	34	9.8%
H	33	9.5%
O	25	7.2%
S	23	6.6%
R	22	6.3%
M	22	6.3%
P	15	4.3%
C	15	4.3%
G	14	4.0%
Other values (16)	74	21.3%

Lowercase Letter

Value	Count	Frequency (%)
o	89	19.6%
s	44	9.7%
n	34	7.5%
i	34	7.5%
k	33	7.3%
e	33	7.3%
b	26	5.7%
a	26	5.7%
m	23	5.1%
r	20	4.4%
Other values (12)	91	20.1%

Other Punctuation

Value	Count	Frequency (%)
.	125	56.3%
:	31	14.0%
&	23	10.4%
/	22	9.9%
·	7	3.2%
;	5	2.3%
＆	4	1.8%
?	2	0.9%
!	1	0.5%
@	1	0.5%

Decimal Number

Value	Count	Frequency (%)
1	88	31.0%
2	77	27.1%
0	32	11.3%
8	24	8.5%
5	18	6.3%
3	14	4.9%
9	9	3.2%
4	9	3.2%
6	7	2.5%
7	6	2.1%

Close Punctuation

Value	Count	Frequency (%)
)	703	97.6%
]	17	2.4%

Open Punctuation

Value	Count	Frequency (%)
(	703	97.6%
[	17	2.4%

Space Separator

Value	Count	Frequency (%)
	1236	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	33	100.0%

Other Symbol

Value	Count	Frequency (%)
▶	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	46438	91.4%
Common	3216	6.3%
Latin	800	1.6%
Han	358	0.7%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
사	2807	6.0%
구	1490	3.2%
판	1470	3.2%
출	1470	3.2%
문	1289	2.8%
시	1045	2.3%
대	998	2.1%
서	798	1.7%
원	779	1.7%
스	776	1.7%
Other values (591)	33516	72.2%

Han

Value	Count	Frequency (%)
社	55	15.4%
文	36	10.1%
出	30	8.4%
版	29	8.1%
徽	12	3.4%
學	11	3.1%
徹	9	2.5%
日	7	2.0%
報	6	1.7%
國	6	1.7%
Other values (90)	157	43.9%

Latin

Value	Count	Frequency (%)
o	89	11.1%
B	70	8.8%
s	44	5.5%
n	34	4.2%
K	34	4.2%
i	34	4.2%
k	33	4.1%
H	33	4.1%
e	33	4.1%
b	26	3.2%
Other values (38)	370	46.2%

Common

Value	Count	Frequency (%)
	1236	38.4%
)	703	21.9%
(	703	21.9%
.	125	3.9%
1	88	2.7%
2	77	2.4%
-	33	1.0%
0	32	1.0%
:	31	1.0%
8	24	0.7%
Other values (18)	164	5.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	46432	91.4%
ASCII	4004	7.9%
CJK	357	0.7%
None	11	< 0.1%
Compat Jamo	6	< 0.1%
Geometric Shapes	1	< 0.1%
CJK Compat Ideographs	1	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
사	2807	6.0%
구	1490	3.2%
판	1470	3.2%
출	1470	3.2%
문	1289	2.8%
시	1045	2.3%
대	998	2.1%
서	798	1.7%
원	779	1.7%
스	776	1.7%
Other values (586)	33510	72.2%

ASCII

Value	Count	Frequency (%)
	1236	30.9%
)	703	17.6%
(	703	17.6%
.	125	3.1%
o	89	2.2%
1	88	2.2%
2	77	1.9%
B	70	1.7%
s	44	1.1%
n	34	0.8%
Other values (63)	835	20.9%

CJK

Value	Count	Frequency (%)
社	55	15.4%
文	36	10.1%
出	30	8.4%
版	29	8.1%
徽	12	3.4%
學	11	3.1%
徹	9	2.5%
日	7	2.0%
報	6	1.7%
國	6	1.7%
Other values (89)	156	43.7%

None

Value	Count	Frequency (%)
·	7	63.6%
＆	4	36.4%

Compat Jamo

Value	Count	Frequency (%)
ㄴ	2	33.3%
ㅊ	1	16.7%
ㅁ	1	16.7%
ㄱ	1	16.7%
ㅇ	1	16.7%

Geometric Shapes

Value	Count	Frequency (%)
▶	1	100.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
女	1	100.0%

발행연도
Text

Distinct	57
Distinct (%)	0.6%
Missing	28
Missing (%)	0.3%
Memory size	156.2 KiB

Length

Max length	14
Median length	4
Mean length	4.0020056
Min length	4

Characters and Unicode

Total characters	39908
Distinct characters	14
Distinct categories	5 ?
Distinct scripts	2 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	10 ?
Unique (%)	0.1%

Sample

1st row	2008
2nd row	1992
3rd row	1992
4th row	2010
5th row	2010

Value	Count	Frequency (%)
1992	1051	10.5%
1994	619	6.2%
1993	545	5.5%
2010	505	5.1%
2011	436	4.4%
2013	434	4.4%
1991	433	4.3%
2012	425	4.3%
1995	414	4.2%
2009	375	3.8%
Other values (48)	4737	47.5%

Most occurring characters

Value	Count	Frequency (%)
9	9346	23.4%
0	8809	22.1%
1	8533	21.4%
2	7166	18.0%
3	1279	3.2%
4	1217	3.0%
8	1049	2.6%
5	923	2.3%
6	822	2.1%
7	756	1.9%
Other values (4)	8	< 0.1%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	39900	> 99.9%
Open Punctuation	2	< 0.1%
Space Separator	2	< 0.1%
Other Letter	2	< 0.1%
Close Punctuation	2	< 0.1%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
9	9346	23.4%
0	8809	22.1%
1	8533	21.4%
2	7166	18.0%
3	1279	3.2%
4	1217	3.1%
8	1049	2.6%
5	923	2.3%
6	822	2.1%
7	756	1.9%

Open Punctuation

Value	Count	Frequency (%)
(	2	100.0%

Space Separator

Value	Count	Frequency (%)
	2	100.0%

Other Letter

Value	Count	Frequency (%)
쇄	2	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	2	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	39906	> 99.9%
Hangul	2	< 0.1%

Most frequent character per script

Common

Value	Count	Frequency (%)
9	9346	23.4%
0	8809	22.1%
1	8533	21.4%
2	7166	18.0%
3	1279	3.2%
4	1217	3.0%
8	1049	2.6%
5	923	2.3%
6	822	2.1%
7	756	1.9%
Other values (3)	6	< 0.1%

Hangul

Value	Count	Frequency (%)
쇄	2	100.0%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	39906	> 99.9%
Hangul	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
9	9346	23.4%
0	8809	22.1%
1	8533	21.4%
2	7166	18.0%
3	1279	3.2%
4	1217	3.0%
8	1049	2.6%
5	923	2.3%
6	822	2.1%
7	756	1.9%
Other values (3)	6	< 0.1%

Hangul

Value	Count	Frequency (%)
쇄	2	100.0%

데이터기준일자
Categorical

CONSTANT

Distinct	1
Distinct (%)	< 0.1%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

2020-10-13	10000

Length

Max length	10
Median length	10
Mean length	10
Min length	10

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	2020-10-13
2nd row	2020-10-13
3rd row	2020-10-13
4th row	2020-10-13
5th row	2020-10-13

Common Values

Value	Count	Frequency (%)
2020-10-13	10000	100.0%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
2020-10-13	10000	100.0%

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	도서명	저자	출판사	발행연도	데이터기준일자
5579	명품도시를 만드는 열정	박문하	단풍나무	2008	2020-10-13
14117	쥬라기공원.2	마이클 크리튼 지음; 정영목 옮김	김영사	1992	2020-10-13
12844	허와 실의 인간학 (지략편)	이병주 편저	중앙미디어	1992	2020-10-13
5026	곰스크로 가는 기차	프리츠 오르트만 지음	북인더갭	2010	2020-10-13
4834	서울을 디자인한다	권영걸	디자인하우스	2010	2020-10-13
9626	(2005년도)대구경북지역 경제연보	한국은행 대구경북본부 편	한국은행 대구경북본부	2006	2020-10-13
16538	부적.3	스테판 킹; 피터 스트로브 공저; 정성호 옮김	밝은세상	1992	2020-10-13
5008	광고천재 이제석	이제석 지음	학고재	2011	2020-10-13
14490	인샬라.하	권현숙 지음	한겨레신문사	1995	2020-10-13
2563	누구보다 축구전문가가 되고싶다	시미즈 히데토 지음	브레인스토어	2014	2020-10-13

	도서명	저자	출판사	발행연도	데이터기준일자
11305	술.2; 한국의 술문화	이상희 지음	선	2009	2020-10-13
18532	(THANK YOU POWER 0.3초의 기적)감사의 힘	데보라 노빌 지음; 김용남 옮김;	위드덤하우스	2009	2020-10-13
18249	그래서 그들은 바다로 갔다 2	그리샴 존; 공경희 옮김 ;	시공사	1992	2020-10-13
8001	(지방행정혁신 표준매뉴얼)백100% 이해하기	대구광역시 편	대구광역시	<NA>	2020-10-13
11759	회상	헤르만 헤세 지음; 공병억 옮김	상아	1988	2020-10-13
12649	행정정보체계론	하미승 저	법문사	1999	2020-10-13
4489	몸에 밴 어린 시절	W. 휴 미실다인 지음 ;이석규;이종범 옮김	가톨릭출판사	2011	2020-10-13
17451	대망. 18[죽이지 않는 검]	야마오까 소하찌 지음;박재희 옮김	중앙	1998	2020-10-13
3049	[2012년도] 지역발전계획에 관한 연차보고서	지역발전위원회	지역발전위원회 지식경제부	2013	2020-10-13
9190	(이원복 교수의) 와인의 세계. 세계의 와인	이원복 지음	김영사	2008	2020-10-13

Most frequently occurring

	도서명	저자	출판사	발행연도	데이터기준일자	# duplicates
42	(비평과 소통의 10년)삼촌설	설정수 서동훈 지음	경북일보	2008	2020-10-13	14
566	임꺽정	이두호 지음	프레스빌	1995	2020-10-13	10
372	사랑이 어떻더니	문무학	학이사	2011	2020-10-13	5
454	아침을 열어주는 3분의 지혜	용혜원 지음	평단문화사	2010	2020-10-13	5
35	(모든 직장인의 로망)좋아하는 일 하면서 먹고살기	양병무 지음	비전과리더십	2009	2020-10-13	4
43	(사랑의 테마 장편 옴니버스 소설시리즈 1) 금잔화	경요 지음; 김은신 옮김	홍익출판사	1992	2020-10-13	4
51	(세계는 지금 새로운 리더를 요구한다)리더스 웨이	달라이 라마. 라우렌스 판 덴 마위젠베르흐 지음 ; 김승욱 옮김	문학동네	2009	2020-10-13	4
54	(소설)강태공.	대채치 지음;김택원 평역;	혜서원	1991	2020-10-13	4
98	(이오덕 생활이야기)울면서 하는 숙제	이오덕 지음	산하	1990	2020-10-13	4
135	Next 민주주의 3.0	코리아매니페스토	한국매니페스토실천본부	2013	2020-10-13	4

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Other Punctuation

Decimal Number

Math Symbol

Letter Number

Close Punctuation

Open Punctuation

Other Symbol

Space Separator

Dash Punctuation

Modifier Symbol

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Katakana

Hiragana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

CJK

Number Forms

CJK Compat Ideographs

Punctuation

Math Operators

Compat Jamo

Enclosed Alphanum

Letterlike Symbols

Katakana

Hiragana

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Other Punctuation

Decimal Number

Close Punctuation

Open Punctuation

Math Symbol

Space Separator

Dash Punctuation

Other Symbol

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

CJK

CJK Compat Ideographs

Enclosed Alphanum

Punctuation

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Other Punctuation

Decimal Number

Close Punctuation

Open Punctuation