Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 6309 |
Missing cells | 17 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 345.2 KiB |
Average record size in memory | 56.0 B |
Variable types
Categorical | 1 |
---|---|
Text | 4 |
DateTime | 1 |
Boolean | 1 |
Dataset
Description | 천안시 도서관에서 구입한 각종 전자도서 자료를 인터넷에 제공하며, 모바일 및 홈페이지에서 전차책을 대출 구독 가능합니다. |
---|---|
URL | https://www.data.go.kr/data/15090702/fileData.do |
서비스 유무 is highly imbalanced (92.8%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 09:12:07.164501 |
---|---|
Analysis finished | 2023-12-12 09:12:09.068794 |
Duration | 1.9 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
도서공급사
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 49.4 KiB |
(주)북큐브네트웍스 | |
---|---|
교보전자책 | |
북레일전자책 | |
우리전자책 |
Length
Max length | 10 |
---|---|
Median length | 6 |
Mean length | 7.6425741 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | (주)북큐브네트웍스 |
---|---|
2nd row | (주)북큐브네트웍스 |
3rd row | (주)북큐브네트웍스 |
4th row | (주)북큐브네트웍스 |
5th row | (주)북큐브네트웍스 |
Common Values
Value | Count | Frequency (%) |
(주)북큐브네트웍스 | 3122 | |
교보전자책 | 1373 | |
북레일전자책 | 1062 | 16.8% |
우리전자책 | 752 | 11.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
주)북큐브네트웍스 | 3122 | |
교보전자책 | 1373 | |
북레일전자책 | 1062 | 16.8% |
우리전자책 | 752 | 11.9% |
출판사
Text
Distinct | 997 |
---|---|
Distinct (%) | 15.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 49.4 KiB |
Value | Count | Frequency (%) |
위즈덤하우스 | 296 | 4.6% |
지혜의숲 | 134 | 2.1% |
rhk | 133 | 2.1% |
성현사 | 124 | 1.9% |
21세기북스 | 121 | 1.9% |
동도서기 | 108 | 1.7% |
문학동네 | 106 | 1.7% |
광보사 | 102 | 1.6% |
웅진지식하우스 | 93 | 1.4% |
나무생각 | 91 | 1.4% |
Other values (990) | 5106 |
Most occurring characters
Value | Count | Frequency (%) |
스 | 1821 | 6.4% |
북 | 1136 | 4.0% |
사 | 708 | 2.5% |
이 | 623 | 2.2% |
리 | 494 | 1.7% |
아 | 469 | 1.7% |
우 | 468 | 1.6% |
하 | 444 | 1.6% |
즈 | 419 | 1.5% |
지 | 391 | 1.4% |
Other values (535) | 21395 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 26023 | |
Uppercase Letter | 815 | 2.9% |
Lowercase Letter | 661 | 2.3% |
Decimal Number | 324 | 1.1% |
Close Punctuation | 206 | 0.7% |
Open Punctuation | 206 | 0.7% |
Space Separator | 105 | 0.4% |
Other Punctuation | 26 | 0.1% |
Other Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 1821 | 7.0% |
북 | 1136 | 4.4% |
사 | 708 | 2.7% |
이 | 623 | 2.4% |
리 | 494 | 1.9% |
아 | 469 | 1.8% |
우 | 468 | 1.8% |
하 | 444 | 1.7% |
즈 | 419 | 1.6% |
지 | 391 | 1.5% |
Other values (478) | 19050 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 165 | |
H | 145 | |
R | 139 | |
B | 63 | 7.7% |
D | 57 | 7.0% |
O | 49 | 6.0% |
M | 43 | 5.3% |
I | 39 | 4.8% |
P | 30 | 3.7% |
S | 23 | 2.8% |
Other values (12) | 62 | 7.6% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 122 | |
t | 86 | |
r | 84 | |
a | 76 | |
o | 70 | |
s | 47 | 7.1% |
n | 28 | 4.2% |
y | 23 | 3.5% |
k | 23 | 3.5% |
l | 20 | 3.0% |
Other values (9) | 82 |
Decimal Number
Value | Count | Frequency (%) |
2 | 134 | |
1 | 131 | |
0 | 16 | 4.9% |
4 | 16 | 4.9% |
3 | 11 | 3.4% |
9 | 8 | 2.5% |
8 | 7 | 2.2% |
6 | 1 | 0.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 18 | |
& | 4 | 15.4% |
# | 3 | 11.5% |
: | 1 | 3.8% |
Close Punctuation
Value | Count | Frequency (%) |
) | 206 |
Open Punctuation
Value | Count | Frequency (%) |
( | 206 |
Space Separator
Value | Count | Frequency (%) |
105 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 26021 | |
Latin | 1476 | 5.2% |
Common | 867 | 3.1% |
Han | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 1821 | 7.0% |
북 | 1136 | 4.4% |
사 | 708 | 2.7% |
이 | 623 | 2.4% |
리 | 494 | 1.9% |
아 | 469 | 1.8% |
우 | 468 | 1.8% |
하 | 444 | 1.7% |
즈 | 419 | 1.6% |
지 | 391 | 1.5% |
Other values (475) | 19048 |
Latin
Value | Count | Frequency (%) |
K | 165 | 11.2% |
H | 145 | 9.8% |
R | 139 | 9.4% |
e | 122 | 8.3% |
t | 86 | 5.8% |
r | 84 | 5.7% |
a | 76 | 5.1% |
o | 70 | 4.7% |
B | 63 | 4.3% |
D | 57 | 3.9% |
Other values (31) | 469 |
Common
Value | Count | Frequency (%) |
) | 206 | |
( | 206 | |
2 | 134 | |
1 | 131 | |
105 | ||
. | 18 | 2.1% |
0 | 16 | 1.8% |
4 | 16 | 1.8% |
3 | 11 | 1.3% |
9 | 8 | 0.9% |
Other values (5) | 16 | 1.8% |
Han
Value | Count | Frequency (%) |
休 | 1 | |
知 | 1 | |
利 | 1 | |
世 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 26019 | |
ASCII | 2343 | 8.3% |
CJK | 3 | < 0.1% |
None | 2 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
스 | 1821 | 7.0% |
북 | 1136 | 4.4% |
사 | 708 | 2.7% |
이 | 623 | 2.4% |
리 | 494 | 1.9% |
아 | 469 | 1.8% |
우 | 468 | 1.8% |
하 | 444 | 1.7% |
즈 | 419 | 1.6% |
지 | 391 | 1.5% |
Other values (474) | 19046 |
ASCII
Value | Count | Frequency (%) |
) | 206 | 8.8% |
( | 206 | 8.8% |
K | 165 | 7.0% |
H | 145 | 6.2% |
R | 139 | 5.9% |
2 | 134 | 5.7% |
1 | 131 | 5.6% |
e | 122 | 5.2% |
105 | 4.5% | |
t | 86 | 3.7% |
Other values (46) | 904 |
None
Value | Count | Frequency (%) |
㈜ | 2 |
CJK
Value | Count | Frequency (%) |
休 | 1 | |
知 | 1 | |
世 | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
利 | 1 |
도서분철
Text
Distinct | 6283 |
---|---|
Distinct (%) | 99.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 49.4 KiB |
Length
Max length | 92 |
---|---|
Median length | 68 |
Mean length | 17.655254 |
Min length | 1 |
Characters and Unicode
Total characters | 111387 |
---|---|
Distinct characters | 1283 |
Distinct categories | 15 ? |
Distinct scripts | 4 ? |
Distinct blocks | 8 ? |
Unique
Unique | 6257 ? |
---|---|
Unique (%) | 99.2% |
Sample
1st row | 챗GPT 혁명 |
---|---|
2nd row | 공부하고 있다는 착각 |
3rd row | 그럴 수 있어 |
4th row | 내 아이가 낯설어진 부모들에게 |
5th row | 스몰 트라우마 |
Value | Count | Frequency (%) |
1507 | 4.9% | |
위한 | 185 | 0.6% |
2 | 170 | 0.6% |
1 | 157 | 0.5% |
이야기 | 152 | 0.5% |
내 | 137 | 0.4% |
나는 | 136 | 0.4% |
한 | 87 | 0.3% |
나를 | 85 | 0.3% |
법 | 79 | 0.3% |
Other values (12857) | 27984 |
Most occurring characters
Value | Count | Frequency (%) |
24401 | 21.9% | |
의 | 2278 | 2.0% |
는 | 2144 | 1.9% |
이 | 2143 | 1.9% |
다 | 1365 | 1.2% |
기 | 1196 | 1.1% |
지 | 1189 | 1.1% |
가 | 1135 | 1.0% |
한 | 1132 | 1.0% |
하 | 1127 | 1.0% |
Other values (1273) | 73277 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 78279 | |
Space Separator | 24401 | 21.9% |
Decimal Number | 2632 | 2.4% |
Other Punctuation | 1913 | 1.7% |
Lowercase Letter | 1061 | 1.0% |
Uppercase Letter | 954 | 0.9% |
Dash Punctuation | 701 | 0.6% |
Open Punctuation | 665 | 0.6% |
Close Punctuation | 664 | 0.6% |
Math Symbol | 57 | 0.1% |
Other values (5) | 60 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
의 | 2278 | 2.9% |
는 | 2144 | 2.7% |
이 | 2143 | 2.7% |
다 | 1365 | 1.7% |
기 | 1196 | 1.5% |
지 | 1189 | 1.5% |
가 | 1135 | 1.4% |
한 | 1132 | 1.4% |
하 | 1127 | 1.4% |
사 | 1084 | 1.4% |
Other values (1162) | 63486 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 106 | 11.1% |
T | 103 | 10.8% |
A | 75 | 7.9% |
E | 70 | 7.3% |
I | 65 | 6.8% |
O | 59 | 6.2% |
N | 53 | 5.6% |
M | 44 | 4.6% |
B | 44 | 4.6% |
C | 43 | 4.5% |
Other values (16) | 292 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 196 | |
o | 84 | 7.9% |
i | 79 | 7.4% |
n | 76 | 7.2% |
t | 74 | 7.0% |
h | 67 | 6.3% |
a | 65 | 6.1% |
r | 52 | 4.9% |
l | 52 | 4.9% |
s | 48 | 4.5% |
Other values (15) | 268 |
Other Punctuation
Value | Count | Frequency (%) |
: | 922 | |
, | 580 | |
! | 127 | 6.6% |
. | 101 | 5.3% |
? | 95 | 5.0% |
· | 28 | 1.5% |
' | 14 | 0.7% |
% | 12 | 0.6% |
& | 9 | 0.5% |
/ | 5 | 0.3% |
Other values (8) | 20 | 1.0% |
Decimal Number
Value | Count | Frequency (%) |
1 | 674 | |
0 | 600 | |
2 | 469 | |
3 | 254 | 9.7% |
5 | 169 | 6.4% |
4 | 141 | 5.4% |
9 | 97 | 3.7% |
7 | 80 | 3.0% |
8 | 74 | 2.8% |
6 | 74 | 2.8% |
Open Punctuation
Value | Count | Frequency (%) |
( | 341 | |
[ | 300 | |
〈 | 14 | 2.1% |
《 | 6 | 0.9% |
『 | 3 | 0.5% |
【 | 1 | 0.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 340 | |
] | 300 | |
〉 | 14 | 2.1% |
》 | 6 | 0.9% |
』 | 3 | 0.5% |
】 | 1 | 0.2% |
Math Symbol
Value | Count | Frequency (%) |
| | 15 | |
+ | 15 | |
~ | 13 | |
| | 10 | |
> | 2 | 3.5% |
< | 2 | 3.5% |
Other Number
Value | Count | Frequency (%) |
① | 2 | |
② | 2 | |
⑤ | 1 | |
⑧ | 1 | |
③ | 1 | |
④ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 16 | |
” | 2 | 11.1% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 15 | |
“ | 2 | 11.8% |
Space Separator
Value | Count | Frequency (%) |
24401 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 701 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 11 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 78233 | |
Common | 31093 | 27.9% |
Latin | 2015 | 1.8% |
Han | 46 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
의 | 2278 | 2.9% |
는 | 2144 | 2.7% |
이 | 2143 | 2.7% |
다 | 1365 | 1.7% |
기 | 1196 | 1.5% |
지 | 1189 | 1.5% |
가 | 1135 | 1.5% |
한 | 1132 | 1.4% |
하 | 1127 | 1.4% |
사 | 1084 | 1.4% |
Other values (1120) | 63440 |
Common
Value | Count | Frequency (%) |
24401 | ||
: | 922 | 3.0% |
- | 701 | 2.3% |
1 | 674 | 2.2% |
0 | 600 | 1.9% |
, | 580 | 1.9% |
2 | 469 | 1.5% |
( | 341 | 1.1% |
) | 340 | 1.1% |
[ | 300 | 1.0% |
Other values (50) | 1765 | 5.7% |
Latin
Value | Count | Frequency (%) |
e | 196 | 9.7% |
S | 106 | 5.3% |
T | 103 | 5.1% |
o | 84 | 4.2% |
i | 79 | 3.9% |
n | 76 | 3.8% |
A | 75 | 3.7% |
t | 74 | 3.7% |
E | 70 | 3.5% |
h | 67 | 3.3% |
Other values (41) | 1085 |
Han
Value | Count | Frequency (%) |
上 | 3 | 6.5% |
無 | 2 | 4.3% |
詩 | 2 | 4.3% |
螳 | 1 | 2.2% |
死 | 1 | 2.2% |
螂 | 1 | 2.2% |
木 | 1 | 2.2% |
古 | 1 | 2.2% |
乭 | 1 | 2.2% |
分 | 1 | 2.2% |
Other values (32) | 32 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 78227 | |
ASCII | 32960 | |
None | 102 | 0.1% |
CJK | 45 | < 0.1% |
Punctuation | 38 | < 0.1% |
Enclosed Alphanum | 8 | < 0.1% |
Compat Jamo | 6 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
24401 | ||
: | 922 | 2.8% |
- | 701 | 2.1% |
1 | 674 | 2.0% |
0 | 600 | 1.8% |
, | 580 | 1.8% |
2 | 469 | 1.4% |
( | 341 | 1.0% |
) | 340 | 1.0% |
[ | 300 | 0.9% |
Other values (76) | 3632 | 11.0% |
Hangul
Value | Count | Frequency (%) |
의 | 2278 | 2.9% |
는 | 2144 | 2.7% |
이 | 2143 | 2.7% |
다 | 1365 | 1.7% |
기 | 1196 | 1.5% |
지 | 1189 | 1.5% |
가 | 1135 | 1.5% |
한 | 1132 | 1.4% |
하 | 1127 | 1.4% |
사 | 1084 | 1.4% |
Other values (1119) | 63434 |
None
Value | Count | Frequency (%) |
· | 28 | |
| | 15 | |
〉 | 14 | |
〈 | 14 | |
《 | 6 | 5.9% |
》 | 6 | 5.9% |
/ | 5 | 4.9% |
& | 4 | 3.9% |
『 | 3 | 2.9% |
』 | 3 | 2.9% |
Other values (4) | 4 | 3.9% |
Punctuation
Value | Count | Frequency (%) |
’ | 16 | |
‘ | 15 | |
… | 3 | 7.9% |
“ | 2 | 5.3% |
” | 2 | 5.3% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 6 |
CJK
Value | Count | Frequency (%) |
上 | 3 | 6.7% |
無 | 2 | 4.4% |
詩 | 2 | 4.4% |
螳 | 1 | 2.2% |
死 | 1 | 2.2% |
螂 | 1 | 2.2% |
木 | 1 | 2.2% |
古 | 1 | 2.2% |
乭 | 1 | 2.2% |
分 | 1 | 2.2% |
Other values (31) | 31 |
Enclosed Alphanum
Value | Count | Frequency (%) |
① | 2 | |
② | 2 | |
⑤ | 1 | |
⑧ | 1 | |
③ | 1 | |
④ | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
泥 | 1 |
도서카테고리
Text
Distinct | 103 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 49.4 KiB |
Length
Max length | 22 |
---|---|
Median length | 18 |
Mean length | 10.006023 |
Min length | 4 |
Characters and Unicode
Total characters | 63128 |
---|---|
Distinct characters | 199 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 11 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 경제/비즈니스/경제/경영 |
---|---|
2nd row | 인문/인문학산책 |
3rd row | 에세이/산문/산문집 |
4th row | 가정/생활/자녀교육 |
5th row | 인문/심리/정신분석 |
Value | Count | Frequency (%) |
문학/한국소설 | 967 | |
경제/비즈니스/성공철학/자기계발 | 608 | 9.6% |
문학/외국소설 | 470 | 7.4% |
에세이/산문/산문집 | 416 | 6.6% |
경제/비즈니스/경제/경영 | 383 | 6.1% |
인문/인문학산책 | 323 | 5.1% |
에세이/산문/에세이 | 262 | 4.1% |
경제/비즈니스/재테크/투자 | 250 | 4.0% |
인문/심리/정신분석 | 194 | 3.1% |
에세이/산문/자기계발 | 163 | 2.6% |
Other values (97) | 2292 |
Most occurring characters
Value | Count | Frequency (%) |
/ | 11496 | 18.2% |
문 | 4065 | 6.4% |
학 | 3399 | 5.4% |
경 | 2173 | 3.4% |
산 | 1763 | 2.8% |
국 | 1752 | 2.8% |
제 | 1736 | 2.7% |
이 | 1649 | 2.6% |
소 | 1497 | 2.4% |
설 | 1497 | 2.4% |
Other values (189) | 32101 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 51453 | |
Other Punctuation | 11503 | 18.2% |
Uppercase Letter | 77 | 0.1% |
Lowercase Letter | 40 | 0.1% |
Decimal Number | 24 | < 0.1% |
Space Separator | 19 | < 0.1% |
Math Symbol | 12 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
문 | 4065 | 7.9% |
학 | 3399 | 6.6% |
경 | 2173 | 4.2% |
산 | 1763 | 3.4% |
국 | 1752 | 3.4% |
제 | 1736 | 3.4% |
이 | 1649 | 3.2% |
소 | 1497 | 2.9% |
설 | 1497 | 2.9% |
즈 | 1424 | 2.8% |
Other values (167) | 30498 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 10 | |
u | 5 | |
k | 5 | |
e | 5 | |
i | 5 | |
t | 5 | |
l | 5 |
Decimal Number
Value | Count | Frequency (%) |
2 | 5 | |
6 | 5 | |
1 | 5 | |
5 | 5 | |
3 | 2 | 8.3% |
4 | 2 | 8.3% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 31 | |
F | 26 | |
B | 10 | 13.0% |
M | 5 | 6.5% |
E | 5 | 6.5% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 11496 | |
& | 7 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
19 |
Math Symbol
Value | Count | Frequency (%) |
~ | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 51453 | |
Common | 11558 | 18.3% |
Latin | 117 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
문 | 4065 | 7.9% |
학 | 3399 | 6.6% |
경 | 2173 | 4.2% |
산 | 1763 | 3.4% |
국 | 1752 | 3.4% |
제 | 1736 | 3.4% |
이 | 1649 | 3.2% |
소 | 1497 | 2.9% |
설 | 1497 | 2.9% |
즈 | 1424 | 2.8% |
Other values (167) | 30498 |
Latin
Value | Count | Frequency (%) |
S | 31 | |
F | 26 | |
o | 10 | 8.5% |
B | 10 | 8.5% |
M | 5 | 4.3% |
E | 5 | 4.3% |
u | 5 | 4.3% |
k | 5 | 4.3% |
e | 5 | 4.3% |
i | 5 | 4.3% |
Other values (2) | 10 | 8.5% |
Common
Value | Count | Frequency (%) |
/ | 11496 | |
19 | 0.2% | |
~ | 12 | 0.1% |
& | 7 | 0.1% |
2 | 5 | < 0.1% |
6 | 5 | < 0.1% |
1 | 5 | < 0.1% |
5 | 5 | < 0.1% |
3 | 2 | < 0.1% |
4 | 2 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 51453 | |
ASCII | 11675 | 18.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
/ | 11496 | |
S | 31 | 0.3% |
F | 26 | 0.2% |
19 | 0.2% | |
~ | 12 | 0.1% |
o | 10 | 0.1% |
B | 10 | 0.1% |
& | 7 | 0.1% |
M | 5 | < 0.1% |
2 | 5 | < 0.1% |
Other values (12) | 54 | 0.5% |
Hangul
Value | Count | Frequency (%) |
문 | 4065 | 7.9% |
학 | 3399 | 6.6% |
경 | 2173 | 4.2% |
산 | 1763 | 3.4% |
국 | 1752 | 3.4% |
제 | 1736 | 3.4% |
이 | 1649 | 3.2% |
소 | 1497 | 2.9% |
설 | 1497 | 2.9% |
즈 | 1424 | 2.8% |
Other values (167) | 30498 |
도서출판일자
Date
Distinct | 2311 |
---|---|
Distinct (%) | 36.7% |
Missing | 17 |
Missing (%) | 0.3% |
Memory size | 49.4 KiB |
Minimum | 1996-12-12 00:00:00 |
---|---|
Maximum | 2023-07-28 00:00:00 |
저자
Text
Distinct | 4199 |
---|---|
Distinct (%) | 66.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 49.4 KiB |
Value | Count | Frequency (%) |
채만식 | 110 | 1.2% |
이효석 | 86 | 0.9% |
김동인 | 85 | 0.9% |
존 | 46 | 0.5% |
최서해 | 41 | 0.4% |
편집부 | 36 | 0.4% |
그림 | 34 | 0.4% |
외 | 33 | 0.3% |
글 | 33 | 0.3% |
나도향 | 31 | 0.3% |
Other values (5476) | 8954 |
Most occurring characters
Value | Count | Frequency (%) |
3182 | 9.8% | |
이 | 1274 | 3.9% |
김 | 871 | 2.7% |
스 | 691 | 2.1% |
, | 558 | 1.7% |
리 | 537 | 1.7% |
정 | 454 | 1.4% |
영 | 373 | 1.2% |
미 | 347 | 1.1% |
박 | 321 | 1.0% |
Other values (812) | 23814 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 27526 | |
Space Separator | 3182 | 9.8% |
Other Punctuation | 706 | 2.2% |
Lowercase Letter | 390 | 1.2% |
Uppercase Letter | 357 | 1.1% |
Close Punctuation | 101 | 0.3% |
Open Punctuation | 101 | 0.3% |
Decimal Number | 37 | 0.1% |
Math Symbol | 8 | < 0.1% |
Dash Punctuation | 7 | < 0.1% |
Other values (3) | 7 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 1274 | 4.6% |
김 | 871 | 3.2% |
스 | 691 | 2.5% |
리 | 537 | 2.0% |
정 | 454 | 1.6% |
영 | 373 | 1.4% |
미 | 347 | 1.3% |
박 | 321 | 1.2% |
나 | 315 | 1.1% |
지 | 298 | 1.1% |
Other values (733) | 22045 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 50 | |
B | 40 | |
E | 34 | 9.5% |
K | 27 | 7.6% |
J | 21 | 5.9% |
C | 21 | 5.9% |
M | 20 | 5.6% |
A | 19 | 5.3% |
L | 18 | 5.0% |
T | 14 | 3.9% |
Other values (13) | 93 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 48 | |
e | 41 | |
i | 38 | 9.7% |
n | 33 | 8.5% |
l | 28 | 7.2% |
r | 25 | 6.4% |
o | 22 | 5.6% |
t | 21 | 5.4% |
h | 17 | 4.4% |
d | 17 | 4.4% |
Other values (13) | 100 |
Decimal Number
Value | Count | Frequency (%) |
2 | 9 | |
1 | 8 | |
4 | 5 | |
9 | 4 | |
0 | 4 | |
8 | 2 | 5.4% |
7 | 2 | 5.4% |
5 | 2 | 5.4% |
6 | 1 | 2.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 558 | |
. | 124 | 17.6% |
& | 7 | 1.0% |
; | 7 | 1.0% |
? | 4 | 0.6% |
# | 3 | 0.4% |
: | 2 | 0.3% |
, | 1 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 90 | |
〉 | 9 | 8.9% |
』 | 1 | 1.0% |
》 | 1 | 1.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 90 | |
〈 | 9 | 8.9% |
『 | 1 | 1.0% |
《 | 1 | 1.0% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 | |
- | 1 | 14.3% |
Math Symbol
Value | Count | Frequency (%) |
> | 4 | |
< | 4 |
Space Separator
Value | Count | Frequency (%) |
3182 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 4 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 2 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 27506 | |
Common | 4149 | 12.8% |
Latin | 747 | 2.3% |
Han | 20 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 1274 | 4.6% |
김 | 871 | 3.2% |
스 | 691 | 2.5% |
리 | 537 | 2.0% |
정 | 454 | 1.7% |
영 | 373 | 1.4% |
미 | 347 | 1.3% |
박 | 321 | 1.2% |
나 | 315 | 1.1% |
지 | 298 | 1.1% |
Other values (721) | 22025 |
Latin
Value | Count | Frequency (%) |
S | 50 | 6.7% |
a | 48 | 6.4% |
e | 41 | 5.5% |
B | 40 | 5.4% |
i | 38 | 5.1% |
E | 34 | 4.6% |
n | 33 | 4.4% |
l | 28 | 3.7% |
K | 27 | 3.6% |
r | 25 | 3.3% |
Other values (36) | 383 |
Common
Value | Count | Frequency (%) |
3182 | ||
, | 558 | 13.4% |
. | 124 | 3.0% |
) | 90 | 2.2% |
( | 90 | 2.2% |
2 | 9 | 0.2% |
〉 | 9 | 0.2% |
〈 | 9 | 0.2% |
1 | 8 | 0.2% |
& | 7 | 0.2% |
Other values (23) | 63 | 1.5% |
Han
Value | Count | Frequency (%) |
葉 | 2 | |
秋 | 2 | |
香 | 2 | |
口 | 2 | |
坂 | 2 | |
多 | 2 | |
子 | 2 | |
佳 | 2 | |
慕 | 1 | |
姿 | 1 | |
Other values (2) | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 27506 | |
ASCII | 4866 | 15.0% |
None | 24 | 0.1% |
CJK | 20 | 0.1% |
Punctuation | 6 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3182 | ||
, | 558 | 11.5% |
. | 124 | 2.5% |
) | 90 | 1.8% |
( | 90 | 1.8% |
S | 50 | 1.0% |
a | 48 | 1.0% |
e | 41 | 0.8% |
B | 40 | 0.8% |
i | 38 | 0.8% |
Other values (59) | 605 | 12.4% |
Hangul
Value | Count | Frequency (%) |
이 | 1274 | 4.6% |
김 | 871 | 3.2% |
스 | 691 | 2.5% |
리 | 537 | 2.0% |
정 | 454 | 1.7% |
영 | 373 | 1.4% |
미 | 347 | 1.3% |
박 | 321 | 1.2% |
나 | 315 | 1.1% |
지 | 298 | 1.1% |
Other values (721) | 22025 |
None
Value | Count | Frequency (%) |
〉 | 9 | |
〈 | 9 | |
』 | 1 | 4.2% |
『 | 1 | 4.2% |
《 | 1 | 4.2% |
》 | 1 | 4.2% |
, | 1 | 4.2% |
- | 1 | 4.2% |
Punctuation
Value | Count | Frequency (%) |
’ | 4 | |
‘ | 2 |
CJK
Value | Count | Frequency (%) |
葉 | 2 | |
秋 | 2 | |
香 | 2 | |
口 | 2 | |
坂 | 2 | |
多 | 2 | |
子 | 2 | |
佳 | 2 | |
慕 | 1 | |
姿 | 1 | |
Other values (2) | 2 |
서비스 유무
Boolean
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.3 KiB |
True | |
---|---|
False | 55 |
Value | Count | Frequency (%) |
True | 6254 | |
False | 55 | 0.9% |
도서공급사 | 서비스 유무 | |
---|---|---|
도서공급사 | 1.000 | 0.304 |
서비스 유무 | 0.304 | 1.000 |
도서공급사 | 서비스 유무 | |
---|---|---|
도서공급사 | 1.000 | 0.203 |
서비스 유무 | 0.203 | 1.000 |
도서공급사 | 서비스 유무 | |
---|---|---|
도서공급사 | 1.000 | 0.203 |
서비스 유무 | 0.203 | 1.000 |
도서공급사 | 출판사 | 도서분철 | 도서카테고리 | 도서출판일자 | 저자 | 서비스 유무 | |
---|---|---|---|---|---|---|---|
0 | (주)북큐브네트웍스 | 베가북스 | 챗GPT 혁명 | 경제/비즈니스/경제/경영 | 2023-07-28 | 권기대 | Y |
1 | (주)북큐브네트웍스 | 웅진지식하우스 | 공부하고 있다는 착각 | 인문/인문학산책 | 2023-07-27 | 대니엘 윌링햄 | Y |
2 | (주)북큐브네트웍스 | 웅진지식하우스 | 그럴 수 있어 | 에세이/산문/산문집 | 2023-07-27 | 양희은 | Y |
3 | (주)북큐브네트웍스 | 위즈덤하우스 | 내 아이가 낯설어진 부모들에게 | 가정/생활/자녀교육 | 2023-07-27 | 최정미 | Y |
4 | (주)북큐브네트웍스 | 갤리온 | 스몰 트라우마 | 인문/심리/정신분석 | 2023-07-27 | 멕 애럴 | Y |
5 | (주)북큐브네트웍스 | 카시오페아 | 엄마가 되고 내면아이를 만났다 | 가정/생활/자녀교육 | 2023-07-27 | 안정희 | Y |
6 | (주)북큐브네트웍스 | 갤리온 | 힘든 일을 먼저 하라 | 경제/비즈니스/성공철학/자기계발 | 2023-07-27 | 스콧 앨런 | Y |
7 | (주)북큐브네트웍스 | 열린책들 | 꿀벌의 예언 1 | 문학/외국소설 | 2023-07-17 | 베르나르 베르베르 | Y |
8 | (주)북큐브네트웍스 | 열린책들 | 꿀벌의 예언 2 | 문학/외국소설 | 2023-07-17 | 베르나르 베르베르 | Y |
9 | (주)북큐브네트웍스 | 글항아리 | 한국전쟁의 기원 1 | 역사/한국사 | 2023-07-14 | 브루스 커밍스 | Y |
도서공급사 | 출판사 | 도서분철 | 도서카테고리 | 도서출판일자 | 저자 | 서비스 유무 | |
---|---|---|---|---|---|---|---|
6299 | 북레일전자책 | 이북코리아 | [디지털 구연동화 환경동화] 들판의 청소부 송장벌레 | 어린이/멀티동화 | <NA> | 앙리 파브르 | N |
6300 | 북레일전자책 | 이북코리아 | [디지털 구연동화 환경동화] 마음씨 착한 매미 | 어린이/멀티동화 | <NA> | 앙리 파브르 | N |
6301 | 북레일전자책 | 이북코리아 | [디지털 구연동화 환경동화] 마취총을 쏘는 왕노래기벌 | 어린이/멀티동화 | <NA> | 앙리 파브르 | N |
6302 | 북레일전자책 | 이북코리아 | [디지털 구연동화 환경동화] 음악가 수염풍뎅이 | 어린이/멀티동화 | <NA> | 앙리 파브르 | N |
6303 | 북레일전자책 | 이북코리아 | [디지털 구연동화 환경동화] 행진하는 불개미 | 어린이/멀티동화 | <NA> | 앙리 파브르 | N |
6304 | 북레일전자책 | 이북코리아 | [디지털 영어동화 Level3] Colum moor and the elves | 어린이/멀티동화 | <NA> | KidSing사업부 | N |
6305 | 북레일전자책 | 이북코리아 | [디지털 영어동화 Level3] Frank`s big fish | 어린이/멀티동화 | <NA> | KidSing사업부 | N |
6306 | 북레일전자책 | 이북코리아 | [디지털 영어동화 Level3] Ginger and Pickles | 어린이/멀티동화 | <NA> | KidSing사업부 | N |
6307 | 북레일전자책 | 이북코리아 | [디지털 영어동화 Level3] Jack and the Beanstalk | 어린이/멀티동화 | <NA> | KidSing사업부 | N |
6308 | 북레일전자책 | 이북코리아 | [디지털 영어동화 Level3] The greedy cat | 어린이/멀티동화 | <NA> | KidSing사업부 | N |