gimi9 Pandas Profiling

Dataset statistics

Number of variables	5
Number of observations	10000
Missing cells	3
Missing cells (%)	< 0.1%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	488.3 KiB
Average record size in memory	50.0 B

Variable types

Numeric	2
Text	3

Dataset

Description	한국폴리텍대학이 소유한 도서목록(도서명, 저자, 출판사)
Author	학교법인한국폴리텍
URL	https://www.data.go.kr/data/15042488/fileData.do

Alerts

`번호` is highly overall correlated with `출판년도`	High correlation
`출판년도` is highly overall correlated with `번호`	High correlation
`번호` has unique values	Unique

Reproduction

Analysis started	2023-12-12 23:27:20.769525
Analysis finished	2023-12-12 23:27:23.117932
Duration	2.35 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

번호
Real number (ℝ)

HIGH CORRELATION UNIQUE

Distinct	10000
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	47378.844

Minimum	2
Maximum	95288
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	166.0 KiB

Quantile statistics

Minimum	2
5-th percentile	4871.1
Q1	24017.75
median	47303.5
Q3	71098.25
95-th percentile	90341.1
Maximum	95288
Range	95286
Interquartile range (IQR)	47080.5

Descriptive statistics

Standard deviation	27228.551
Coefficient of variation (CV)	0.57469851
Kurtosis	-1.1797871
Mean	47378.844
Median Absolute Deviation (MAD)	23479.5
Skewness	0.01206069
Sum	4.7378844 × 10⁸
Variance	7.4139399 × 10⁸
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=50)

Value	Count	Frequency (%)
48170	1	< 0.1%
13506	1	< 0.1%
31867	1	< 0.1%
25189	1	< 0.1%
86185	1	< 0.1%
67690	1	< 0.1%
7968	1	< 0.1%
65789	1	< 0.1%
74524	1	< 0.1%
72553	1	< 0.1%
Other values (9990)	9990	99.9%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
2	1	< 0.1%
6	1	< 0.1%
9	1	< 0.1%
10	1	< 0.1%
14	1	< 0.1%
40	1	< 0.1%
45	1	< 0.1%
60	1	< 0.1%
100	1	< 0.1%
112	1	< 0.1%

Value	Count	Frequency (%)
95288	1	< 0.1%
95287	1	< 0.1%
95274	1	< 0.1%
95251	1	< 0.1%
95242	1	< 0.1%
95240	1	< 0.1%
95224	1	< 0.1%
95212	1	< 0.1%
95208	1	< 0.1%
95206	1	< 0.1%

도서명
Text

Distinct	7651
Distinct (%)	76.5%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	157
Median length	78
Mean length	22.2849
Min length	1

Characters and Unicode

Total characters	222849
Distinct characters	1434
Distinct categories	15 ?
Distinct scripts	5 ?
Distinct blocks	11 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	6573 ?
Unique (%)	65.7%

Sample

1st row	언제 들어도 좋은 말:이석원 이야기 산문집
2nd row	백미러 속의 우주:대칭으로 읽는 현대 물리학
3rd row	소년이 온다:한강 장편소설
4th row	위대하라:3포 세대에게 들려주는 희망의 메시지
5th row	SSAT 삼성직무적성검사 실전모의고사

Value	Count	Frequency (%)
위한	381	0.8%
장편소설	214	0.4%
이야기	204	0.4%
어떻게	181	0.4%
	173	0.4%
나는	170	0.4%
모든	139	0.3%
및	127	0.3%
기술	125	0.3%
한	113	0.2%
Other values (19610)	46554	96.2%

Most occurring characters

Value	Count	Frequency (%)
	38476	17.3%
:	5028	2.3%
의	4680	2.1%
이	3508	1.6%
기	3444	1.5%
는	3375	1.5%
사	2580	1.2%
한	2148	1.0%
지	2083	0.9%
가	2032	0.9%
Other values (1424)	155495	69.8%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	147788	66.3%
Space Separator	38476	17.3%
Lowercase Letter	13511	6.1%
Other Punctuation	8665	3.9%
Decimal Number	5901	2.6%
Uppercase Letter	4145	1.9%
Open Punctuation	1667	0.7%
Close Punctuation	1662	0.7%
Math Symbol	748	0.3%
Dash Punctuation	131	0.1%
Other values (5)	155	0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
의	4680	3.2%
이	3508	2.4%
기	3444	2.3%
는	3375	2.3%
사	2580	1.7%
한	2148	1.5%
지	2083	1.4%
가	2032	1.4%
인	2019	1.4%
하	1955	1.3%
Other values (1308)	119964	81.2%

Uppercase Letter

Value	Count	Frequency (%)
C	425	10.3%
S	373	9.0%
T	362	8.7%
A	323	7.8%
D	277	6.7%
I	269	6.5%
P	250	6.0%
M	219	5.3%
N	189	4.6%
E	182	4.4%
Other values (18)	1276	30.8%

Lowercase Letter

Value	Count	Frequency (%)
e	1452	10.7%
i	1347	10.0%
a	1260	9.3%
o	1215	9.0%
n	1208	8.9%
t	1012	7.5%
r	913	6.8%
s	767	5.7%
l	612	4.5%
c	569	4.2%
Other values (16)	3156	23.4%

Other Punctuation

Value	Count	Frequency (%)
:	5028	58.0%
.	1342	15.5%
,	1202	13.9%
·	356	4.1%
!	200	2.3%
;	172	2.0%
?	118	1.4%
&	77	0.9%
/	47	0.5%
%	26	0.3%
Other values (11)	97	1.1%

Decimal Number

Value	Count	Frequency (%)
1	1443	24.5%
0	1163	19.7%
2	1058	17.9%
3	624	10.6%
5	373	6.3%
4	353	6.0%
9	241	4.1%
7	227	3.8%
6	220	3.7%
8	199	3.4%

Math Symbol

Value	Count	Frequency (%)
=	623	83.3%
+	61	8.2%
~	49	6.6%
>	7	0.9%
<	7	0.9%
×	1	0.1%

Open Punctuation

Value	Count	Frequency (%)
(	1568	94.1%
[	90	5.4%
『	7	0.4%
「	2	0.1%

Close Punctuation

Value	Count	Frequency (%)
)	1563	94.0%
]	90	5.4%
』	7	0.4%
」	2	0.1%

Letter Number

Value	Count	Frequency (%)
Ⅰ	5	41.7%
Ⅱ	4	33.3%
Ⅲ	2	16.7%
Ⅳ	1	8.3%

Other Symbol

Value	Count	Frequency (%)
°	4	50.0%
ⓔ	2	25.0%
℃	1	12.5%
®	1	12.5%

Dash Punctuation

Value	Count	Frequency (%)
-	130	99.2%
―	1	0.8%

Modifier Symbol

Value	Count	Frequency (%)
´	64	54.2%
`	54	45.8%

Final Punctuation

Value	Count	Frequency (%)
’	11	91.7%
”	1	8.3%

Initial Punctuation

Value	Count	Frequency (%)
‘	4	80.0%
“	1	20.0%

Space Separator

Value	Count	Frequency (%)
	38476	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	147547	66.2%
Common	57393	25.8%
Latin	17668	7.9%
Han	236	0.1%
Katakana	5	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
의	4680	3.2%
이	3508	2.4%
기	3444	2.3%
는	3375	2.3%
사	2580	1.7%
한	2148	1.5%
지	2083	1.4%
가	2032	1.4%
인	2019	1.4%
하	1955	1.3%
Other values (1172)	119723	81.1%

Han

Value	Count	Frequency (%)
月	9	3.8%
生	9	3.8%
國	7	3.0%
未	6	2.5%
譯	6	2.5%
集	5	2.1%
註	4	1.7%
三	4	1.7%
上	4	1.7%
朝	4	1.7%
Other values (121)	178	75.4%

Common

Value	Count	Frequency (%)
	38476	67.0%
:	5028	8.8%
(	1568	2.7%
)	1563	2.7%
1	1443	2.5%
.	1342	2.3%
,	1202	2.1%
0	1163	2.0%
2	1058	1.8%
3	624	1.1%
Other values (48)	3926	6.8%

Latin

Value	Count	Frequency (%)
e	1452	8.2%
i	1347	7.6%
a	1260	7.1%
o	1215	6.9%
n	1208	6.8%
t	1012	5.7%
r	913	5.2%
s	767	4.3%
l	612	3.5%
c	569	3.2%
Other values (48)	7313	41.4%

Katakana

Value	Count	Frequency (%)
ジ	1	20.0%
ュ	1	20.0%
リ	1	20.0%
ナ	1	20.0%
ア	1	20.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	147542	66.2%
ASCII	74494	33.4%
None	531	0.2%
CJK	234	0.1%
Punctuation	21	< 0.1%
Number Forms	12	< 0.1%
Compat Jamo	5	< 0.1%
Katakana	5	< 0.1%
Enclosed Alphanum	2	< 0.1%
CJK Compat Ideographs	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	38476	51.6%
:	5028	6.7%
(	1568	2.1%
)	1563	2.1%
e	1452	1.9%
1	1443	1.9%
i	1347	1.8%
.	1342	1.8%
a	1260	1.7%
o	1215	1.6%
Other values (75)	19800	26.6%

Hangul

Value	Count	Frequency (%)
의	4680	3.2%
이	3508	2.4%
기	3444	2.3%
는	3375	2.3%
사	2580	1.7%
한	2148	1.5%
지	2083	1.4%
가	2032	1.4%
인	2019	1.4%
하	1955	1.3%
Other values (1171)	119718	81.1%

None

Value	Count	Frequency (%)
·	356	67.0%
´	64	12.1%
？	23	4.3%
＆	23	4.3%
＇	18	3.4%
『	7	1.3%
』	7	1.3%
／	6	1.1%
．	4	0.8%
°	4	0.8%
Other values (9)	19	3.6%

Punctuation

Value	Count	Frequency (%)
’	11	52.4%
‘	4	19.0%
…	3	14.3%
“	1	4.8%
”	1	4.8%
―	1	4.8%

CJK

Value	Count	Frequency (%)
月	9	3.8%
生	9	3.8%
國	7	3.0%
未	6	2.6%
譯	6	2.6%
集	5	2.1%
註	4	1.7%
三	4	1.7%
上	4	1.7%
朝	4	1.7%
Other values (119)	176	75.2%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	5	100.0%

Number Forms

Value	Count	Frequency (%)
Ⅰ	5	41.7%
Ⅱ	4	33.3%
Ⅲ	2	16.7%
Ⅳ	1	8.3%

Enclosed Alphanum

Value	Count	Frequency (%)
ⓔ	2	100.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
李	1	50.0%
黎	1	50.0%

Katakana

Value	Count	Frequency (%)
ジ	1	20.0%
ュ	1	20.0%
リ	1	20.0%
ナ	1	20.0%
ア	1	20.0%

Letterlike Symbols

Value	Count	Frequency (%)
℃	1	100.0%

저자명
Text

Distinct	6432
Distinct (%)	64.3%
Missing	3
Missing (%)	< 0.1%
Memory size	156.2 KiB

Length

Max length	231
Median length	121
Mean length	12.603981
Min length	1

Characters and Unicode

Total characters	126002
Distinct characters	962
Distinct categories	14 ?
Distinct scripts	5 ?
Distinct blocks	9 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	5101 ?
Unique (%)	51.0%

Sample

1st row	이석원 지음
2nd row	데이브 골드버그 지음;박병철 옮김
3rd row	한강 지음
4th row	강건 지음
5th row	해커스잡취업교육연구소 편

Value	Count	Frequency (%)
지음	4782	16.7%
옮김	3164	11.0%
공저	332	1.2%
외	259	0.9%
지은이	166	0.6%
편저	148	0.5%
그림	136	0.5%
글·그림	127	0.4%
저	117	0.4%
편	96	0.3%
Other values (9380)	19378	67.5%

Most occurring characters

Value	Count	Frequency (%)
	18889	15.0%
지	8888	7.1%
음	8324	6.6%
;	7529	6.0%
김	5938	4.7%
옮	3322	2.6%
이	3132	2.5%
스	1365	1.1%
정	1339	1.1%
영	1236	1.0%
Other values (952)	66040	52.4%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	94563	75.0%
Space Separator	18889	15.0%
Other Punctuation	8652	6.9%
Lowercase Letter	1381	1.1%
Uppercase Letter	1116	0.9%
Open Punctuation	565	0.4%
Close Punctuation	564	0.4%
Decimal Number	164	0.1%
Math Symbol	51	< 0.1%
Dash Punctuation	40	< 0.1%
Other values (4)	17	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
지	8888	9.4%
음	8324	8.8%
김	5938	6.3%
옮	3322	3.5%
이	3132	3.3%
스	1365	1.4%
정	1339	1.4%
영	1236	1.3%
박	940	1.0%
리	913	1.0%
Other values (867)	59166	62.6%

Lowercase Letter

Value	Count	Frequency (%)
a	184	13.3%
i	152	11.0%
e	123	8.9%
r	115	8.3%
o	103	7.5%
t	81	5.9%
n	76	5.5%
u	74	5.4%
h	63	4.6%
s	60	4.3%
Other values (14)	350	25.3%

Uppercase Letter

Value	Count	Frequency (%)
S	132	11.8%
B	105	9.4%
C	83	7.4%
D	79	7.1%
M	65	5.8%
K	63	5.6%
J	62	5.6%
A	60	5.4%
E	60	5.4%
T	57	5.1%
Other values (14)	350	31.4%

Other Punctuation

Value	Count	Frequency (%)
;	7529	87.0%
.	326	3.8%
:	279	3.2%
,	265	3.1%
·	226	2.6%
/	10	0.1%
&	9	0.1%
＆	6	0.1%
%	1	< 0.1%
?	1	< 0.1%

Decimal Number

Value	Count	Frequency (%)
0	46	28.0%
1	37	22.6%
2	25	15.2%
3	20	12.2%
6	15	9.1%
8	9	5.5%
9	5	3.0%
5	3	1.8%
4	2	1.2%
7	2	1.2%

Open Punctuation

Value	Count	Frequency (%)
[	559	98.9%
(	3	0.5%
『	2	0.4%
〈	1	0.2%

Close Punctuation

Value	Count	Frequency (%)
]	558	98.9%
)	3	0.5%
』	2	0.4%
〉	1	0.2%

Math Symbol

Value	Count	Frequency (%)
<	25	49.0%
>	25	49.0%
+	1	2.0%

Space Separator

Value	Count	Frequency (%)
	18889	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	40	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	12	100.0%

Modifier Symbol

Value	Count	Frequency (%)
´	3	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	1	100.0%

Other Symbol

Value	Count	Frequency (%)
ⓔ	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	94513	75.0%
Common	28942	23.0%
Latin	2497	2.0%
Han	45	< 0.1%
Katakana	5	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
지	8888	9.4%
음	8324	8.8%
김	5938	6.3%
옮	3322	3.5%
이	3132	3.3%
스	1365	1.4%
정	1339	1.4%
영	1236	1.3%
박	940	1.0%
리	913	1.0%
Other values (821)	59116	62.5%

Latin

Value	Count	Frequency (%)
a	184	7.4%
i	152	6.1%
S	132	5.3%
e	123	4.9%
r	115	4.6%
B	105	4.2%
o	103	4.1%
C	83	3.3%
t	81	3.2%
D	79	3.2%
Other values (38)	1340	53.7%

Han

Value	Count	Frequency (%)
集	3	6.7%
李	2	4.4%
編	2	4.4%
外	1	2.2%
鳳	1	2.2%
北	1	2.2%
嶋	1	2.2%
千	1	2.2%
鶴	1	2.2%
子	1	2.2%
Other values (31)	31	68.9%

Common

Value	Count	Frequency (%)
	18889	65.3%
;	7529	26.0%
[	559	1.9%
]	558	1.9%
.	326	1.1%
:	279	1.0%
,	265	0.9%
·	226	0.8%
0	46	0.2%
-	40	0.1%
Other values (27)	225	0.8%

Katakana

Value	Count	Frequency (%)
ブ	1	20.0%
ル	1	20.0%
ガ	1	20.0%
イ	1	20.0%
ド	1	20.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	94511	75.0%
ASCII	31196	24.8%
None	241	0.2%
CJK	43	< 0.1%
Katakana	5	< 0.1%
CJK Compat Ideographs	2	< 0.1%
Compat Jamo	2	< 0.1%
Punctuation	1	< 0.1%
Enclosed Alphanum	1	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	18889	60.5%
;	7529	24.1%
[	559	1.8%
]	558	1.8%
.	326	1.0%
:	279	0.9%
,	265	0.8%
a	184	0.6%
i	152	0.5%
S	132	0.4%
Other values (66)	2323	7.4%

Hangul

Value	Count	Frequency (%)
지	8888	9.4%
음	8324	8.8%
김	5938	6.3%
옮	3322	3.5%
이	3132	3.3%
스	1365	1.4%
정	1339	1.4%
영	1236	1.3%
박	940	1.0%
리	913	1.0%
Other values (820)	59114	62.5%

None

Value	Count	Frequency (%)
·	226	93.8%
＆	6	2.5%
´	3	1.2%
『	2	0.8%
』	2	0.8%
〈	1	0.4%
〉	1	0.4%

CJK

Value	Count	Frequency (%)
集	3	7.0%
編	2	4.7%
外	1	2.3%
鳳	1	2.3%
北	1	2.3%
嶋	1	2.3%
千	1	2.3%
鶴	1	2.3%
子	1	2.3%
實	1	2.3%
Other values (30)	30	69.8%

CJK Compat Ideographs

Value	Count	Frequency (%)
李	2	100.0%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	2	100.0%

Katakana

Value	Count	Frequency (%)
ブ	1	20.0%
ル	1	20.0%
ガ	1	20.0%
イ	1	20.0%
ド	1	20.0%

Punctuation

Value	Count	Frequency (%)
’	1	100.0%

Enclosed Alphanum

Value	Count	Frequency (%)
ⓔ	1	100.0%

출판사
Text

Distinct	2276
Distinct (%)	22.8%
Missing	0
Missing (%)	0.0%
Memory size	156.2 KiB

Length

Max length	41
Median length	27
Mean length	5.1109
Min length	1

Characters and Unicode

Total characters	51109
Distinct characters	670
Distinct categories	9 ?
Distinct scripts	4 ?
Distinct blocks	4 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1286 ?
Unique (%)	12.9%

Sample

1st row	금책
2nd row	해나무
3rd row	파주:창비
4th row	누림북스
5th row	챔프스터디

Value	Count	Frequency (%)
한국폴리텍대학	971	9.3%
민음사	321	3.1%
문학동네	161	1.5%
서울	132	1.3%
파주:문학동네	127	1.2%
위즈덤하우스	103	1.0%
열린책들	97	0.9%
김영사	93	0.9%
창비	88	0.8%
시공사	80	0.8%
Other values (2176)	8219	79.1%

Most occurring characters

Value	Count	Frequency (%)
스	1818	3.6%
사	1640	3.2%
:	1595	3.1%
학	1570	3.1%
리	1516	3.0%
한	1351	2.6%
파	1190	2.3%
대	1151	2.3%
주	1095	2.1%
북	1086	2.1%
Other values (660)	37097	72.6%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	45379	88.8%
Lowercase Letter	2090	4.1%
Other Punctuation	1676	3.3%
Uppercase Letter	836	1.6%
Space Separator	450	0.9%
Decimal Number	323	0.6%
Close Punctuation	177	0.3%
Open Punctuation	177	0.3%
Modifier Symbol	1	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
스	1818	4.0%
사	1640	3.6%
학	1570	3.5%
리	1516	3.3%
한	1351	3.0%
파	1190	2.6%
대	1151	2.5%
주	1095	2.4%
북	1086	2.4%
국	1082	2.4%
Other values (586)	31880	70.3%

Uppercase Letter

Value	Count	Frequency (%)
B	186	22.2%
M	77	9.2%
A	62	7.4%
H	54	6.5%
S	51	6.1%
K	42	5.0%
I	40	4.8%
R	40	4.8%
P	38	4.5%
D	33	3.9%
Other values (16)	213	25.5%

Lowercase Letter

Value	Count	Frequency (%)
o	365	17.5%
s	197	9.4%
e	165	7.9%
a	158	7.6%
k	144	6.9%
i	144	6.9%
n	132	6.3%
r	115	5.5%
t	102	4.9%
l	87	4.2%
Other values (15)	481	23.0%

Other Punctuation

Value	Count	Frequency (%)
:	1595	95.2%
.	46	2.7%
&	13	0.8%
;	6	0.4%
·	5	0.3%
,	4	0.2%
＆	4	0.2%
#	2	0.1%
?	1	0.1%

Decimal Number

Value	Count	Frequency (%)
1	140	43.3%
2	137	42.4%
0	17	5.3%
3	15	4.6%
6	5	1.5%
5	4	1.2%
4	3	0.9%
8	2	0.6%

Close Punctuation

Value	Count	Frequency (%)
)	144	81.4%
]	33	18.6%

Open Punctuation

Value	Count	Frequency (%)
(	144	81.4%
[	33	18.6%

Space Separator

Value	Count	Frequency (%)
	450	100.0%

Modifier Symbol

Value	Count	Frequency (%)
´	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	45362	88.8%
Latin	2926	5.7%
Common	2804	5.5%
Han	17	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
스	1818	4.0%
사	1640	3.6%
학	1570	3.5%
리	1516	3.3%
한	1351	3.0%
파	1190	2.6%
대	1151	2.5%
주	1095	2.4%
북	1086	2.4%
국	1082	2.4%
Other values (569)	31863	70.2%

Latin

Value	Count	Frequency (%)
o	365	12.5%
s	197	6.7%
B	186	6.4%
e	165	5.6%
a	158	5.4%
k	144	4.9%
i	144	4.9%
n	132	4.5%
r	115	3.9%
t	102	3.5%
Other values (41)	1218	41.6%

Common

Value	Count	Frequency (%)
:	1595	56.9%
	450	16.0%
)	144	5.1%
(	144	5.1%
1	140	5.0%
2	137	4.9%
.	46	1.6%
]	33	1.2%
[	33	1.2%
0	17	0.6%
Other values (13)	65	2.3%

Han

Value	Count	Frequency (%)
慶	1	5.9%
南	1	5.9%
日	1	5.9%
報	1	5.9%
築	1	5.9%
大	1	5.9%
明	1	5.9%
會	1	5.9%
學	1	5.9%
堂	1	5.9%
Other values (7)	7	41.2%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	45362	88.8%
ASCII	5720	11.2%
CJK	17	< 0.1%
None	10	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
스	1818	4.0%
사	1640	3.6%
학	1570	3.5%
리	1516	3.3%
한	1351	3.0%
파	1190	2.6%
대	1151	2.5%
주	1095	2.4%
북	1086	2.4%
국	1082	2.4%
Other values (569)	31863	70.2%

ASCII

Value	Count	Frequency (%)
:	1595	27.9%
	450	7.9%
o	365	6.4%
s	197	3.4%
B	186	3.3%
e	165	2.9%
a	158	2.8%
)	144	2.5%
k	144	2.5%
i	144	2.5%
Other values (61)	2172	38.0%

None

Value	Count	Frequency (%)
·	5	50.0%
＆	4	40.0%
´	1	10.0%

CJK

Value	Count	Frequency (%)
慶	1	5.9%
南	1	5.9%
日	1	5.9%
報	1	5.9%
築	1	5.9%
大	1	5.9%
明	1	5.9%
會	1	5.9%
學	1	5.9%
堂	1	5.9%
Other values (7)	7	41.2%

출판년도
Real number (ℝ)

HIGH CORRELATION

Distinct	10
Distinct (%)	0.1%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	2015.4039

Minimum	1997
Maximum	2020
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	166.0 KiB

Quantile statistics

Minimum	1997
5-th percentile	2013
Q1	2014
median	2015
Q3	2017
95-th percentile	2018
Maximum	2020
Range	23
Interquartile range (IQR)	3

Descriptive statistics

Standard deviation	1.7329354
Coefficient of variation (CV)	0.00085984521
Kurtosis	0.40130981
Mean	2015.4039
Median Absolute Deviation (MAD)	1
Skewness	0.11720383
Sum	20154039
Variance	3.0030651
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=10)

Value	Count	Frequency (%)
2015	2011	20.1%
2016	1812	18.1%
2014	1721	17.2%
2013	1685	16.9%
2017	1305	13.1%
2018	1106	11.1%
2019	351	3.5%
2020	5	0.1%
2008	3	< 0.1%
1997	1	< 0.1%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
1997	1	< 0.1%
2008	3	< 0.1%
2013	1685	16.9%
2014	1721	17.2%
2015	2011	20.1%
2016	1812	18.1%
2017	1305	13.1%
2018	1106	11.1%
2019	351	3.5%
2020	5	0.1%

Value	Count	Frequency (%)
2020	5	0.1%
2019	351	3.5%
2018	1106	11.1%
2017	1305	13.1%
2016	1812	18.1%
2015	2011	20.1%
2014	1721	17.2%
2013	1685	16.9%
2008	3	< 0.1%
1997	1	< 0.1%

번호
출판년도

출판년도
번호

출판년도
번호

Phik (φk)
Auto

Heatmap
Table

	번호	출판년도
번호	1.000	0.977
출판년도	0.977	1.000

Heatmap
Table

	번호	출판년도
번호	1.000	-0.984
출판년도	-0.984	1.000

Count
Matrix

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

First rows
Last rows

	번호	도서명	저자명	출판사	출판년도
48168	48170	언제 들어도 좋은 말:이석원 이야기 산문집	이석원 지음	금책	2015
51434	51436	백미러 속의 우주:대칭으로 읽는 현대 물리학	데이브 골드버그 지음;박병철 옮김	해나무	2015
40829	40831	소년이 온다:한강 장편소설	한강 지음	파주:창비	2016
23219	23220	위대하라:3포 세대에게 들려주는 희망의 메시지	강건 지음	누림북스	2017
74741	74743	SSAT 삼성직무적성검사 실전모의고사	해커스잡취업교육연구소 편	챔프스터디	2014
46359	46361	센서 공학=Sensor Technology	원용규;손진근;백승영 지음	한국폴리텍대학	2015
5785	5786	사물인터넷(IoT) 유·무선 통신 실습	양정모;장선권;이용 지음	한국폴리텍대학	2018
32614	32615	연민의 굴레:쉬는 시간.2	재활용 글·그림	학산문화사	2016
19473	19474	(설민석의) 한국사 대모험.2:설쌤의 라이벌, 황 대감의 등장	설민석;스토리박스 글;정현희 그림	파주:아이휴먼	2017
65189	65191	영화 읽어주는 인문학	안용태 지음	생각의길	2014

	번호	도서명	저자명	출판사	출판년도
50634	50636	로봇 시대, 인간의 일:인공지능 시대를 살아가야 할 이들을 위한 안내서	구본권 지음	어크로스	2015
3669	3670	헤드스트롱 퍼포먼스:운동과 영양, 뇌과학을 통해 멘탈 퍼포먼스를 강화하라	마르셀 다나 지음;이경숙;이주용 옮김	행복에너지	2018
31666	31667	기계가공기능장:필기	정연택, 이상준, 조영배, 손일권 공저	파주:건기원	2016
94765	94767	(99% 사람들이 하지 않는 단 1%)혁신하려면 실행하라	비제이 고빈다라잔;크리스 트림블 지음;롯데인재개발원 옮김	글로세움	2013
89413	89415	캘린더 호수	서정춘 지음	시인생각	2013
29168	29169	압록강은 흐른다	이미록 지음;박균 옮김	살림	2016
10720	10721	예측 불가능한 시대에 행복하게 사는 법:4차 산업혁명 시대를 위한 생존전략	윤성식 지음	파주:수오서재	2018
11912	11913	비통한 자들을 위한 정치학:왜 민주주의에서 마음이 중요한가	파커 J. 파머 지음	파주:글항아리	2018
83071	83073	파운데이션과 제국	아이작 아시모프 지음;김옥수 옮김	황금가지	2013
30271	30272	그리드를 파괴하라:창의력을 만드는 공간 혁신 전략	천의영;이동우 지음	세종서적	2016

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Other Punctuation

Decimal Number

Math Symbol

Open Punctuation

Close Punctuation

Letter Number

Other Symbol

Dash Punctuation

Modifier Symbol

Final Punctuation

Initial Punctuation

Space Separator

Most occurring scripts

Most frequent character per script

Hangul

Han

Common

Latin

Katakana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

Punctuation

CJK

Compat Jamo

Number Forms

Enclosed Alphanum

CJK Compat Ideographs

Katakana

Letterlike Symbols

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Open Punctuation

Close Punctuation

Math Symbol

Space Separator

Dash Punctuation

Connector Punctuation

Modifier Symbol

Final Punctuation

Other Symbol

Most occurring scripts

Most frequent character per script

Hangul

Latin

Han

Common

Katakana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

CJK

CJK Compat Ideographs

Compat Jamo

Katakana

Punctuation

Enclosed Alphanum

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter