gimi9 Pandas Profiling

Dataset statistics

Number of variables	4
Number of observations	6372
Missing cells	112
Missing cells (%)	0.4%
Duplicate rows	124
Duplicate rows (%)	1.9%
Total size in memory	199.3 KiB
Average record size in memory	32.0 B

Variable types

Text	4

Dataset

Description	평생학습계좌제 학습과정 운영 기관에서 등록한 교재 관련 정보로서 교재명, 저자명, 출판사명, 출판년도에 관한 네 가지 정보를 제공합니다.
Author	국가평생교육진흥원
URL	https://www.data.go.kr/data/15090722/fileData.do

Alerts

Dataset has 124 (1.9%) duplicate rows

Duplicates

Reproduction

Analysis started	2023-12-12 14:05:53.114112
Analysis finished	2023-12-12 14:05:55.002943
Duration	1.89 second
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

교재명
Text

Distinct	5512
Distinct (%)	86.5%
Missing	1
Missing (%)	< 0.1%
Memory size	49.9 KiB

Length

Max length	94
Median length	77
Mean length	11.719981
Min length	1

Characters and Unicode

Total characters	74668
Distinct characters	980
Distinct categories	15 ?
Distinct scripts	5 ?
Distinct blocks	10 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	5079 ?
Unique (%)	79.7%

Sample

1st row	한국사 마인드맵 지도자과정
2nd row	나를 미치게 하는 너
3rd row	마흔의 심리학
4th row	모모
5th row	아픈 영혼, 책을 만나다

Value	Count	Frequency (%)
	144	0.9%
실제	124	0.8%
나무	112	0.7%
위한	112	0.7%
이론과	111	0.7%
1	97	0.6%
2급	74	0.5%
및	72	0.5%
2	70	0.5%
중국어	70	0.5%
Other values (7176)	14494	93.6%

Most occurring characters

Value	Count	Frequency (%)
	9214	12.3%
기	1325	1.8%
사	1087	1.5%
이	984	1.3%
의	876	1.2%
리	862	1.2%
과	857	1.1%
2	831	1.1%
1	744	1.0%
e	744	1.0%
Other values (970)	57144	76.5%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	51009	68.3%
Space Separator	9215	12.3%
Lowercase Letter	5777	7.7%
Uppercase Letter	3624	4.9%
Decimal Number	2828	3.8%
Other Punctuation	673	0.9%
Close Punctuation	551	0.7%
Open Punctuation	551	0.7%
Dash Punctuation	298	0.4%
Math Symbol	63	0.1%
Other values (5)	79	0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
기	1325	2.6%
사	1087	2.1%
이	984	1.9%
의	876	1.7%
리	862	1.7%
과	857	1.7%
정	739	1.4%
지	724	1.4%
교	709	1.4%
어	708	1.4%
Other values (875)	42138	82.6%

Lowercase Letter

Value	Count	Frequency (%)
e	744	12.9%
a	491	8.5%
i	481	8.3%
n	446	7.7%
t	444	7.7%
r	431	7.5%
o	415	7.2%
s	351	6.1%
l	241	4.2%
h	220	3.8%
Other values (16)	1513	26.2%

Uppercase Letter

Value	Count	Frequency (%)
S	367	10.1%
E	341	9.4%
T	330	9.1%
I	265	7.3%
P	247	6.8%
C	242	6.7%
A	208	5.7%
B	189	5.2%
O	175	4.8%
N	168	4.6%
Other values (16)	1092	30.1%

Other Punctuation

Value	Count	Frequency (%)
,	287	42.6%
&	90	13.4%
:	72	10.7%
/	64	9.5%
.	42	6.2%
·	35	5.2%
?	21	3.1%
!	19	2.8%
;	15	2.2%
%	14	2.1%
Other values (3)	14	2.1%

Decimal Number

Value	Count	Frequency (%)
2	831	29.4%
1	744	26.3%
0	557	19.7%
3	255	9.0%
4	119	4.2%
5	105	3.7%
7	85	3.0%
6	56	2.0%
8	52	1.8%
9	24	0.8%

Math Symbol

Value	Count	Frequency (%)
~	35	55.6%
+	19	30.2%
\|	7	11.1%
<	1	1.6%
>	1	1.6%

Letter Number

Value	Count	Frequency (%)
Ⅰ	25	42.4%
Ⅱ	23	39.0%
Ⅳ	6	10.2%
Ⅲ	5	8.5%

Space Separator

Value	Count	Frequency (%)
	9214	> 99.9%
	1	< 0.1%

Close Punctuation

Value	Count	Frequency (%)
)	479	86.9%
]	72	13.1%

Open Punctuation

Value	Count	Frequency (%)
(	479	86.9%
[	72	13.1%

Dash Punctuation

Value	Count	Frequency (%)
-	298	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	9	100.0%

Final Punctuation

Value	Count	Frequency (%)
’	8	100.0%

Other Number

Value	Count	Frequency (%)
①	2	100.0%

Modifier Symbol

Value	Count	Frequency (%)
`	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	50862	68.1%
Common	14199	19.0%
Latin	9460	12.7%
Han	142	0.2%
Hiragana	5	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
기	1325	2.6%
사	1087	2.1%
이	984	1.9%
의	876	1.7%
리	862	1.7%
과	857	1.7%
정	739	1.5%
지	724	1.4%
교	709	1.4%
어	708	1.4%
Other values (785)	41991	82.6%

Han

Value	Count	Frequency (%)
新	8	5.6%
全	6	4.2%
學	5	3.5%
下	4	2.8%
上	4	2.8%
子	3	2.1%
論	3	2.1%
命	3	2.1%
語	3	2.1%
集	3	2.1%
Other values (75)	100	70.4%

Latin

Value	Count	Frequency (%)
e	744	7.9%
a	491	5.2%
i	481	5.1%
n	446	4.7%
t	444	4.7%
r	431	4.6%
o	415	4.4%
S	367	3.9%
s	351	3.7%
E	341	3.6%
Other values (46)	4949	52.3%

Common

Value	Count	Frequency (%)
	9214	64.9%
2	831	5.9%
1	744	5.2%
0	557	3.9%
)	479	3.4%
(	479	3.4%
-	298	2.1%
,	287	2.0%
3	255	1.8%
4	119	0.8%
Other values (29)	936	6.6%

Hiragana

Value	Count	Frequency (%)
あ	1	20.0%
り	1	20.0%
が	1	20.0%
と	1	20.0%
う	1	20.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	50855	68.1%
ASCII	23554	31.5%
CJK	136	0.2%
Number Forms	59	0.1%
None	36	< 0.1%
Punctuation	8	< 0.1%
Compat Jamo	7	< 0.1%
CJK Compat Ideographs	6	< 0.1%
Hiragana	5	< 0.1%
Enclosed Alphanum	2	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	9214	39.1%
2	831	3.5%
1	744	3.2%
e	744	3.2%
0	557	2.4%
a	491	2.1%
i	481	2.0%
)	479	2.0%
(	479	2.0%
n	446	1.9%
Other values (77)	9088	38.6%

Hangul

Value	Count	Frequency (%)
기	1325	2.6%
사	1087	2.1%
이	984	1.9%
의	876	1.7%
리	862	1.7%
과	857	1.7%
정	739	1.5%
지	724	1.4%
교	709	1.4%
어	708	1.4%
Other values (780)	41984	82.6%

None

Value	Count	Frequency (%)
·	35	97.2%
	1	2.8%

Number Forms

Value	Count	Frequency (%)
Ⅰ	25	42.4%
Ⅱ	23	39.0%
Ⅳ	6	10.2%
Ⅲ	5	8.5%

CJK

Value	Count	Frequency (%)
新	8	5.9%
全	6	4.4%
學	5	3.7%
下	4	2.9%
上	4	2.9%
子	3	2.2%
論	3	2.2%
命	3	2.2%
語	3	2.2%
集	3	2.2%
Other values (70)	94	69.1%

Punctuation

Value	Count	Frequency (%)
’	8	100.0%

Compat Jamo

Value	Count	Frequency (%)
ㅅ	2	28.6%
ㅁ	2	28.6%
ㅈ	1	14.3%
ㄴ	1	14.3%
ㅎ	1	14.3%

CJK Compat Ideographs

Value	Count	Frequency (%)
樂	2	33.3%
論	1	16.7%
禮	1	16.7%
理	1	16.7%
茶	1	16.7%

Enclosed Alphanum

Value	Count	Frequency (%)
①	2	100.0%

Hiragana

Value	Count	Frequency (%)
あ	1	20.0%
り	1	20.0%
が	1	20.0%
と	1	20.0%
う	1	20.0%

저자
Text

Distinct	3863
Distinct (%)	60.9%
Missing	30
Missing (%)	0.5%
Memory size	49.9 KiB

Length

Max length	50
Median length	48
Mean length	6.4880164
Min length	1

Characters and Unicode

Total characters	41147
Distinct characters	681
Distinct categories	10 ?
Distinct scripts	4 ?
Distinct blocks	5 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	3013 ?
Unique (%)	47.5%

Sample

1st row	양근숙
2nd row	레스카터
3rd row	황선미
4th row	이경수
5th row	김영아

Value	Count	Frequency (%)
외	482	5.1%
	247	2.6%
자체제작	101	1.1%
교육과학기술부	85	0.9%
공저	81	0.9%
편집부	74	0.8%
교육부	69	0.7%
해군교육사령부	66	0.7%
강사	58	0.6%
kim	56	0.6%
Other values (4538)	8087	86.0%

Most occurring characters

Value	Count	Frequency (%)
	3145	7.6%
교	1126	2.7%
,	1039	2.5%
김	1007	2.4%
이	872	2.1%
정	867	2.1%
육	748	1.8%
외	628	1.5%
원	572	1.4%
영	528	1.3%
Other values (671)	30615	74.4%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	31119	75.6%
Lowercase Letter	3153	7.7%
Space Separator	3150	7.7%
Uppercase Letter	1536	3.7%
Other Punctuation	1337	3.2%
Decimal Number	320	0.8%
Close Punctuation	179	0.4%
Dash Punctuation	177	0.4%
Open Punctuation	173	0.4%
Math Symbol	3	< 0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
교	1126	3.6%
김	1007	3.2%
이	872	2.8%
정	867	2.8%
육	748	2.4%
외	628	2.0%
원	572	1.8%
영	528	1.7%
부	519	1.7%
학	494	1.6%
Other values (593)	23758	76.3%

Lowercase Letter

Value	Count	Frequency (%)
a	434	13.8%
e	396	12.6%
n	305	9.7%
r	299	9.5%
i	265	8.4%
o	183	5.8%
s	173	5.5%
l	168	5.3%
c	133	4.2%
t	123	3.9%
Other values (16)	674	21.4%

Uppercase Letter

Value	Count	Frequency (%)
G	108	7.0%
M	107	7.0%
K	106	6.9%
J	106	6.9%
S	105	6.8%
C	103	6.7%
A	100	6.5%
R	96	6.2%
E	72	4.7%
T	66	4.3%
Other values (15)	567	36.9%

Decimal Number

Value	Count	Frequency (%)
1	79	24.7%
2	70	21.9%
3	42	13.1%
4	34	10.6%
5	30	9.4%
6	25	7.8%
7	15	4.7%
0	10	3.1%
9	9	2.8%
8	6	1.9%

Other Punctuation

Value	Count	Frequency (%)
,	1039	77.7%
.	162	12.1%
/	52	3.9%
&	42	3.1%
·	26	1.9%
:	9	0.7%
;	5	0.4%
，	2	0.1%

Space Separator

Value	Count	Frequency (%)
	3145	99.8%
	5	0.2%

Close Punctuation

Value	Count	Frequency (%)
)	178	99.4%
]	1	0.6%

Open Punctuation

Value	Count	Frequency (%)
(	172	99.4%
[	1	0.6%

Math Symbol

Value	Count	Frequency (%)
\|	2	66.7%
×	1	33.3%

Dash Punctuation

Value	Count	Frequency (%)
-	177	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	31074	75.5%
Common	5339	13.0%
Latin	4689	11.4%
Han	45	0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
교	1126	3.6%
김	1007	3.2%
이	872	2.8%
정	867	2.8%
육	748	2.4%
외	628	2.0%
원	572	1.8%
영	528	1.7%
부	519	1.7%
학	494	1.6%
Other values (564)	23713	76.3%

Latin

Value	Count	Frequency (%)
a	434	9.3%
e	396	8.4%
n	305	6.5%
r	299	6.4%
i	265	5.7%
o	183	3.9%
s	173	3.7%
l	168	3.6%
c	133	2.8%
t	123	2.6%
Other values (41)	2210	47.1%

Han

Value	Count	Frequency (%)
金	4	8.9%
慶	3	6.7%
漢	3	6.7%
著	3	6.7%
徐	2	4.4%
海	2	4.4%
毛	2	4.4%
芙	2	4.4%
桂	2	4.4%
戴	2	4.4%
Other values (19)	20	44.4%

Common

Value	Count	Frequency (%)
	3145	58.9%
,	1039	19.5%
)	178	3.3%
-	177	3.3%
(	172	3.2%
.	162	3.0%
1	79	1.5%
2	70	1.3%
/	52	1.0%
3	42	0.8%
Other values (17)	223	4.2%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	31051	75.5%
ASCII	9994	24.3%
CJK	45	0.1%
None	34	0.1%
Compat Jamo	23	0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	3145	31.5%
,	1039	10.4%
a	434	4.3%
e	396	4.0%
n	305	3.1%
r	299	3.0%
i	265	2.7%
o	183	1.8%
)	178	1.8%
-	177	1.8%
Other values (64)	3573	35.8%

Hangul

Value	Count	Frequency (%)
교	1126	3.6%
김	1007	3.2%
이	872	2.8%
정	867	2.8%
육	748	2.4%
외	628	2.0%
원	572	1.8%
영	528	1.7%
부	519	1.7%
학	494	1.6%
Other values (556)	23690	76.3%

None

Value	Count	Frequency (%)
·	26	76.5%
	5	14.7%
，	2	5.9%
×	1	2.9%

Compat Jamo

Value	Count	Frequency (%)
ㆍ	15	65.2%
ㅎ	2	8.7%
ㅕ	1	4.3%
ㄴ	1	4.3%
ㄹ	1	4.3%
ㄻ	1	4.3%
ㄷ	1	4.3%
ㅁ	1	4.3%

CJK

Value	Count	Frequency (%)
金	4	8.9%
慶	3	6.7%
漢	3	6.7%
著	3	6.7%
徐	2	4.4%
海	2	4.4%
毛	2	4.4%
芙	2	4.4%
桂	2	4.4%
戴	2	4.4%
Other values (19)	20	44.4%

출판사
Text

Distinct	2108
Distinct (%)	33.3%
Missing	37
Missing (%)	0.6%
Memory size	49.9 KiB

Length

Max length	40
Median length	28
Mean length	5.4112076
Min length	1

Characters and Unicode

Total characters	34280
Distinct characters	645
Distinct categories	11 ?
Distinct scripts	4 ?
Distinct blocks	6 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	1398 ?
Unique (%)	22.1%

Sample

1st row	삼인
2nd row	사계절
3rd row	위즈덤하우스
4th row	삼인
5th row	창비

Value	Count	Frequency (%)
자체제작	441	6.2%
	244	3.4%
국군인쇄창	224	3.2%
학지사	191	2.7%
도서출판	97	1.4%
자체교재	88	1.2%
자체	87	1.2%
해군인쇄창	80	1.1%
제작	76	1.1%
다락원	66	0.9%
Other values (2177)	5492	77.5%

Most occurring characters

Value	Count	Frequency (%)
사	1445	4.2%
교	1048	3.1%
	810	2.4%
자	771	2.2%
국	713	2.1%
체	703	2.1%
학	676	2.0%
제	667	1.9%
원	639	1.9%
작	590	1.7%
Other values (635)	26218	76.5%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	30039	87.6%
Lowercase Letter	1119	3.3%
Uppercase Letter	1101	3.2%
Space Separator	816	2.4%
Close Punctuation	338	1.0%
Open Punctuation	331	1.0%
Dash Punctuation	252	0.7%
Decimal Number	122	0.4%
Other Punctuation	108	0.3%
Other Symbol	52	0.2%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
사	1445	4.8%
교	1048	3.5%
자	771	2.6%
국	713	2.4%
체	703	2.3%
학	676	2.3%
제	667	2.2%
원	639	2.1%
작	590	2.0%
판	564	1.9%
Other values (563)	22223	74.0%

Lowercase Letter

Value	Count	Frequency (%)
o	134	12.0%
n	117	10.5%
e	107	9.6%
s	101	9.0%
a	95	8.5%
r	91	8.1%
i	72	6.4%
g	52	4.6%
m	45	4.0%
d	45	4.0%
Other values (14)	260	23.2%

Uppercase Letter

Value	Count	Frequency (%)
C	104	9.4%
O	97	8.8%
E	85	7.7%
P	78	7.1%
M	74	6.7%
A	71	6.4%
S	67	6.1%
B	58	5.3%
L	52	4.7%
R	51	4.6%
Other values (14)	364	33.1%

Decimal Number

Value	Count	Frequency (%)
1	46	37.7%
2	36	29.5%
3	13	10.7%
5	10	8.2%
0	10	8.2%
9	4	3.3%
6	2	1.6%
4	1	0.8%

Other Punctuation

Value	Count	Frequency (%)
.	58	53.7%
,	17	15.7%
&	12	11.1%
/	11	10.2%
·	6	5.6%
:	4	3.7%

Space Separator

Value	Count	Frequency (%)
	810	99.3%
	6	0.7%

Close Punctuation

Value	Count	Frequency (%)
)	332	98.2%
]	6	1.8%

Open Punctuation

Value	Count	Frequency (%)
(	325	98.2%
[	6	1.8%

Math Symbol

Value	Count	Frequency (%)
\|	1	50.0%
×	1	50.0%

Dash Punctuation

Value	Count	Frequency (%)
-	252	100.0%

Other Symbol

Value	Count	Frequency (%)
㈜	52	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	30086	87.8%
Latin	2220	6.5%
Common	1969	5.7%
Han	5	< 0.1%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
사	1445	4.8%
교	1048	3.5%
자	771	2.6%
국	713	2.4%
체	703	2.3%
학	676	2.2%
제	667	2.2%
원	639	2.1%
작	590	2.0%
판	564	1.9%
Other values (559)	22270	74.0%

Latin

Value	Count	Frequency (%)
o	134	6.0%
n	117	5.3%
e	107	4.8%
C	104	4.7%
s	101	4.5%
O	97	4.4%
a	95	4.3%
r	91	4.1%
E	85	3.8%
P	78	3.5%
Other values (38)	1211	54.5%

Common

Value	Count	Frequency (%)
	810	41.1%
)	332	16.9%
(	325	16.5%
-	252	12.8%
.	58	2.9%
1	46	2.3%
2	36	1.8%
,	17	0.9%
3	13	0.7%
&	12	0.6%
Other values (13)	68	3.5%

Han

Value	Count	Frequency (%)
土	1	20.0%
堂	1	20.0%
金	1	20.0%
二	1	20.0%
不	1	20.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	30029	87.6%
ASCII	4176	12.2%
None	65	0.2%
Compat Jamo	5	< 0.1%
CJK	4	< 0.1%
CJK Compat Ideographs	1	< 0.1%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
사	1445	4.8%
교	1048	3.5%
자	771	2.6%
국	713	2.4%
체	703	2.3%
학	676	2.3%
제	667	2.2%
원	639	2.1%
작	590	2.0%
판	564	1.9%
Other values (554)	22213	74.0%

ASCII

Value	Count	Frequency (%)
	810	19.4%
)	332	8.0%
(	325	7.8%
-	252	6.0%
o	134	3.2%
n	117	2.8%
e	107	2.6%
C	104	2.5%
s	101	2.4%
O	97	2.3%
Other values (58)	1797	43.0%

None

Value	Count	Frequency (%)
㈜	52	80.0%
·	6	9.2%
	6	9.2%
×	1	1.5%

Compat Jamo

Value	Count	Frequency (%)
ㅎ	2	40.0%
ㄱ	1	20.0%
ㄷ	1	20.0%
ㅁ	1	20.0%

CJK

Value	Count	Frequency (%)
土	1	25.0%
堂	1	25.0%
二	1	25.0%
不	1	25.0%

CJK Compat Ideographs

Value	Count	Frequency (%)
金	1	100.0%

출판년도
Text

Distinct	60
Distinct (%)	0.9%
Missing	44
Missing (%)	0.7%
Memory size	49.9 KiB

Length

Max length	4
Median length	4
Mean length	3.8111568
Min length	1

Characters and Unicode

Total characters	24117
Distinct characters	14
Distinct categories	4 ?
Distinct scripts	1 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	14 ?
Unique (%)	0.2%

Sample

1st row	2010
2nd row	2007
3rd row	2002
4th row	2007
5th row	2009

Value	Count	Frequency (%)
2010	696	11.0%
2014	495	7.8%
2011	494	7.8%
2012	473	7.5%
2013	445	7.0%
2009	427	6.8%
0	394	6.2%
2015	363	5.7%
2007	313	5.0%
2008	290	4.6%
Other values (48)	1933	30.6%

Most occurring characters

Value	Count	Frequency (%)
0	8658	35.9%
2	6764	28.0%
1	4513	18.7%
9	1018	4.2%
4	606	2.5%
3	560	2.3%
5	531	2.2%
8	530	2.2%
7	436	1.8%
6	387	1.6%
Other values (4)	114	0.5%

Most occurring categories

Value	Count	Frequency (%)
Decimal Number	24003	99.5%
Space Separator	88	0.4%
Dash Punctuation	24	0.1%
Connector Punctuation	2	< 0.1%

Most frequent character per category

Decimal Number

Value	Count	Frequency (%)
0	8658	36.1%
2	6764	28.2%
1	4513	18.8%
9	1018	4.2%
4	606	2.5%
3	560	2.3%
5	531	2.2%
8	530	2.2%
7	436	1.8%
6	387	1.6%

Space Separator

Value	Count	Frequency (%)
	83	94.3%
	5	5.7%

Dash Punctuation

Value	Count	Frequency (%)
-	24	100.0%

Connector Punctuation

Value	Count	Frequency (%)
_	2	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Common	24117	100.0%

Most frequent character per script

Common

Value	Count	Frequency (%)
0	8658	35.9%
2	6764	28.0%
1	4513	18.7%
9	1018	4.2%
4	606	2.5%
3	560	2.3%
5	531	2.2%
8	530	2.2%
7	436	1.8%
6	387	1.6%
Other values (4)	114	0.5%

Most occurring blocks

Value	Count	Frequency (%)
ASCII	24112	> 99.9%
None	5	< 0.1%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
0	8658	35.9%
2	6764	28.1%
1	4513	18.7%
9	1018	4.2%
4	606	2.5%
3	560	2.3%
5	531	2.2%
8	530	2.2%
7	436	1.8%
6	387	1.6%
Other values (3)	109	0.5%

None

Value	Count	Frequency (%)
	5	100.0%

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

First rows
Last rows

	교재명	저자	출판사	출판년도
0	한국사 마인드맵 지도자과정	양근숙	<NA>	2010
1	나를 미치게 하는 너	레스카터	삼인	2007
2	마흔의 심리학	황선미	사계절	2002
3	모모	이경수	위즈덤하우스	2007
4	아픈 영혼, 책을 만나다	김영아	삼인	2009
5	엄마를 부탁해	신경숙	창비	2008
6	우리들의 행복한 시간	공지영	오픈하우스	2010
7	유진과유진	이금이	푸른책들	2008
8	심성계발을 위한 미술치료의 이론과 실제	(사)한국심성교육개발원	(사)한국심성교육개발원	2008
9	세계 최고의 명강사를 꿈꿔라	류석우	씨앗을 뿌리는 사람	2004

	교재명	저자	출판사	출판년도
6362	한식조리기능사	전명숙	현능출판사	2010
6363	한글지도의 이론과 실제	김영희	(주)아침나라	2010
6364	역사속유물이야기	플라토비	플라토비	2013
6365	소망의 나무 1,2,3	교육과학기술부	평생교육진흥원	2007
6366	소망의 나무 교사용 지도서	교육과학기술부	평생교육진흥원	2007
6367	우쿨렐레	염인정	아름출판사	1987
6368	커피바리스타	현광진	한수출판사	2010
6369	테스트	테스트	테스트	1900
6370	하모니카	정옥선	태림스코어	2016
6371	해피바이엘	심재응	현대음악	2001

Most frequently occurring

	교재명	저자	출판사	출판년도	# duplicates
115	프린트물 제공	강사	홈플러스평생교육스쿨	0	13
113	프린트물 제공	강사	홈플러스 평생교육스쿨	0	12
114	프린트물 제공	강사	홈플러스 평생교육스쿨	2014	7
118	프린트물제공	강사	홈플러스평생교육스쿨	0	4
27	동화구연의 이론과 실제	이규원	동화사랑	2002	3
33	미술치료의 이론과 실제	김인선 조수경 외	한국삼성교육개발원	0	3
39	박선생 역사교실	박선생	박선생창의역사지리교실	2018	3
46	산업안전보건교육	한국산업안전보건공단	-	2012	3
56	손뜨개 교재	뜨개나무	뜨개나무	0	3
59	스토리텔링과 책놀이	이송은	창지사	2012	3

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Other Punctuation

Decimal Number

Math Symbol

Letter Number

Space Separator

Close Punctuation

Open Punctuation

Dash Punctuation

Connector Punctuation

Final Punctuation

Other Number

Modifier Symbol

Most occurring scripts

Most frequent character per script

Hangul

Han

Latin

Common

Hiragana

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

Number Forms

CJK

Punctuation

Compat Jamo

CJK Compat Ideographs

Enclosed Alphanum

Hiragana

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Decimal Number

Other Punctuation

Space Separator

Close Punctuation

Open Punctuation

Math Symbol

Dash Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Latin

Han

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

None

Compat Jamo

CJK

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Lowercase Letter

Uppercase Letter

Decimal Number

Other Punctuation

Space Separator

Close Punctuation

Open Punctuation

Math Symbol

Dash Punctuation

Other Symbol

Most occurring scripts