Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 10000 |
Missing cells | 166 |
Missing cells (%) | 0.6% |
Duplicate rows | 412 |
Duplicate rows (%) | 4.1% |
Total size in memory | 312.5 KiB |
Average record size in memory | 32.0 B |
Variable types
Text | 3 |
---|
Dataset
Description | 문경시 중앙도서관이 소장하고 있는 도서의 서지정보에 대한 데이터로 도서의 서명, 저자, 출판사 등의 항목을 제공합니다. |
---|---|
Author | 경상북도 문경시 |
URL | https://www.data.go.kr/data/15052141/fileData.do |
Dataset has 412 (4.1%) duplicate rows | Duplicates |
저자 has 159 (1.6%) missing values | Missing |
Reproduction
Analysis started | 2024-04-29 22:32:39.286685 |
---|---|
Analysis finished | 2024-04-29 22:32:41.509067 |
Duration | 2.22 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
서명
Text
Distinct | 9196 |
---|---|
Distinct (%) | 92.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 153 |
---|---|
Median length | 94 |
Mean length | 14.122 |
Min length | 1 |
Characters and Unicode
Total characters | 141220 |
---|---|
Distinct characters | 1991 |
Distinct categories | 12 ? |
Distinct scripts | 6 ? |
Distinct blocks | 10 ? |
Unique
Unique | 8701 ? |
---|---|
Unique (%) | 87.0% |
Sample
1st row | 나의 고전 읽기 |
---|---|
2nd row | 꽃 피우는 아이 티스투 |
3rd row | 지구는 대단해 |
4th row | 약용식물 |
5th row | 날마다 홍차 |
Value | Count | Frequency (%) |
이야기 | 285 | 0.9% |
위한 | 124 | 0.4% |
장편소설 | 121 | 0.4% |
우리 | 104 | 0.3% |
the | 96 | 0.3% |
내 | 92 | 0.3% |
92 | 0.3% | |
of | 90 | 0.3% |
세계 | 89 | 0.3% |
역사 | 75 | 0.2% |
Other values (17780) | 31946 |
Most occurring characters
Value | Count | Frequency (%) |
23752 | 16.8% | |
의 | 2785 | 2.0% |
이 | 2626 | 1.9% |
는 | 1730 | 1.2% |
기 | 1711 | 1.2% |
) | 1570 | 1.1% |
( | 1569 | 1.1% |
사 | 1552 | 1.1% |
e | 1482 | 1.0% |
리 | 1437 | 1.0% |
Other values (1981) | 101006 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 93790 | |
Space Separator | 23752 | 16.8% |
Lowercase Letter | 12535 | 8.9% |
Other Punctuation | 3057 | 2.2% |
Uppercase Letter | 2305 | 1.6% |
Decimal Number | 1978 | 1.4% |
Close Punctuation | 1575 | 1.1% |
Open Punctuation | 1573 | 1.1% |
Math Symbol | 567 | 0.4% |
Dash Punctuation | 77 | 0.1% |
Other values (2) | 11 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
의 | 2785 | 3.0% |
이 | 2626 | 2.8% |
는 | 1730 | 1.8% |
기 | 1711 | 1.8% |
사 | 1552 | 1.7% |
리 | 1437 | 1.5% |
한 | 1287 | 1.4% |
가 | 1267 | 1.4% |
아 | 1156 | 1.2% |
지 | 1083 | 1.2% |
Other values (1880) | 77156 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1482 | |
o | 1115 | 8.9% |
n | 1024 | 8.2% |
i | 1016 | 8.1% |
a | 1016 | 8.1% |
r | 895 | 7.1% |
t | 872 | 7.0% |
s | 771 | 6.2% |
l | 567 | 4.5% |
h | 507 | 4.0% |
Other values (17) | 3270 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 213 | 9.2% |
S | 188 | 8.2% |
C | 162 | 7.0% |
A | 145 | 6.3% |
I | 137 | 5.9% |
E | 130 | 5.6% |
P | 126 | 5.5% |
M | 119 | 5.2% |
D | 114 | 4.9% |
B | 110 | 4.8% |
Other values (16) | 861 |
Other Punctuation
Value | Count | Frequency (%) |
: | 1338 | |
, | 584 | |
? | 399 | 13.1% |
! | 288 | 9.4% |
. | 176 | 5.8% |
' | 80 | 2.6% |
· | 75 | 2.5% |
& | 36 | 1.2% |
/ | 31 | 1.0% |
% | 11 | 0.4% |
Other values (10) | 39 | 1.3% |
Decimal Number
Value | Count | Frequency (%) |
0 | 559 | |
1 | 402 | |
2 | 271 | |
3 | 186 | 9.4% |
5 | 154 | 7.8% |
9 | 110 | 5.6% |
4 | 78 | 3.9% |
7 | 77 | 3.9% |
6 | 72 | 3.6% |
8 | 69 | 3.5% |
Math Symbol
Value | Count | Frequency (%) |
= | 525 | |
~ | 20 | 3.5% |
+ | 20 | 3.5% |
∼ | 1 | 0.2% |
+ | 1 | 0.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1570 | |
] | 2 | 0.1% |
」 | 2 | 0.1% |
』 | 1 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1569 | |
「 | 2 | 0.1% |
『 | 1 | 0.1% |
[ | 1 | 0.1% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 7 | |
Ⅱ | 3 |
Space Separator
Value | Count | Frequency (%) |
23752 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 77 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 91440 | |
Common | 32580 | 23.1% |
Latin | 14850 | 10.5% |
Han | 2242 | 1.6% |
Hiragana | 81 | 0.1% |
Katakana | 27 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
의 | 2785 | 3.0% |
이 | 2626 | 2.9% |
는 | 1730 | 1.9% |
기 | 1711 | 1.9% |
사 | 1552 | 1.7% |
리 | 1437 | 1.6% |
한 | 1287 | 1.4% |
가 | 1267 | 1.4% |
아 | 1156 | 1.3% |
지 | 1083 | 1.2% |
Other values (1216) | 74806 |
Han
Value | Count | Frequency (%) |
國 | 82 | 3.7% |
學 | 67 | 3.0% |
大 | 48 | 2.1% |
法 | 48 | 2.1% |
韓 | 40 | 1.8% |
史 | 38 | 1.7% |
論 | 34 | 1.5% |
說 | 23 | 1.0% |
戰 | 21 | 0.9% |
政 | 21 | 0.9% |
Other values (603) | 1820 |
Latin
Value | Count | Frequency (%) |
e | 1482 | 10.0% |
o | 1115 | 7.5% |
n | 1024 | 6.9% |
i | 1016 | 6.8% |
a | 1016 | 6.8% |
r | 895 | 6.0% |
t | 872 | 5.9% |
s | 771 | 5.2% |
l | 567 | 3.8% |
h | 507 | 3.4% |
Other values (45) | 5585 |
Common
Value | Count | Frequency (%) |
23752 | ||
) | 1570 | 4.8% |
( | 1569 | 4.8% |
: | 1338 | 4.1% |
, | 584 | 1.8% |
0 | 559 | 1.7% |
= | 525 | 1.6% |
1 | 402 | 1.2% |
? | 399 | 1.2% |
! | 288 | 0.9% |
Other values (36) | 1594 | 4.9% |
Hiragana
Value | Count | Frequency (%) |
の | 10 | 12.3% |
い | 5 | 6.2% |
す | 5 | 6.2% |
さ | 5 | 6.2% |
お | 4 | 4.9% |
う | 4 | 4.9% |
な | 3 | 3.7% |
し | 3 | 3.7% |
ん | 3 | 3.7% |
り | 3 | 3.7% |
Other values (26) | 36 |
Katakana
Value | Count | Frequency (%) |
ジ | 5 | |
ョ | 3 | |
パ | 2 | 7.4% |
マ | 2 | 7.4% |
ン | 2 | 7.4% |
ア | 2 | 7.4% |
ニ | 2 | 7.4% |
メ | 2 | 7.4% |
ゾ | 1 | 3.7% |
ウ | 1 | 3.7% |
Other values (5) | 5 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 91425 | |
ASCII | 47317 | |
CJK | 2192 | 1.6% |
None | 102 | 0.1% |
Hiragana | 81 | 0.1% |
CJK Compat Ideographs | 50 | < 0.1% |
Katakana | 27 | < 0.1% |
Compat Jamo | 15 | < 0.1% |
Number Forms | 10 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
23752 | ||
) | 1570 | 3.3% |
( | 1569 | 3.3% |
e | 1482 | 3.1% |
: | 1338 | 2.8% |
o | 1115 | 2.4% |
n | 1024 | 2.2% |
i | 1016 | 2.1% |
a | 1016 | 2.1% |
r | 895 | 1.9% |
Other values (76) | 12540 |
Hangul
Value | Count | Frequency (%) |
의 | 2785 | 3.0% |
이 | 2626 | 2.9% |
는 | 1730 | 1.9% |
기 | 1711 | 1.9% |
사 | 1552 | 1.7% |
리 | 1437 | 1.6% |
한 | 1287 | 1.4% |
가 | 1267 | 1.4% |
아 | 1156 | 1.3% |
지 | 1083 | 1.2% |
Other values (1210) | 74791 |
CJK
Value | Count | Frequency (%) |
國 | 82 | 3.7% |
學 | 67 | 3.1% |
大 | 48 | 2.2% |
法 | 48 | 2.2% |
韓 | 40 | 1.8% |
史 | 38 | 1.7% |
論 | 34 | 1.6% |
說 | 23 | 1.0% |
戰 | 21 | 1.0% |
政 | 21 | 1.0% |
Other values (578) | 1770 |
None
Value | Count | Frequency (%) |
· | 75 | |
? | 6 | 5.9% |
& | 6 | 5.9% |
! | 3 | 2.9% |
、 | 2 | 2.0% |
đ | 2 | 2.0% |
「 | 2 | 2.0% |
」 | 2 | 2.0% |
『 | 1 | 1.0% |
』 | 1 | 1.0% |
Other values (2) | 2 | 2.0% |
Hiragana
Value | Count | Frequency (%) |
の | 10 | 12.3% |
い | 5 | 6.2% |
す | 5 | 6.2% |
さ | 5 | 6.2% |
お | 4 | 4.9% |
う | 4 | 4.9% |
な | 3 | 3.7% |
し | 3 | 3.7% |
ん | 3 | 3.7% |
り | 3 | 3.7% |
Other values (26) | 36 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 7 | |
Ⅱ | 3 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
理 | 7 | |
歷 | 5 | 10.0% |
李 | 5 | 10.0% |
劉 | 4 | 8.0% |
論 | 4 | 8.0% |
女 | 2 | 4.0% |
勞 | 2 | 4.0% |
金 | 2 | 4.0% |
禮 | 2 | 4.0% |
隸 | 2 | 4.0% |
Other values (15) | 15 |
Katakana
Value | Count | Frequency (%) |
ジ | 5 | |
ョ | 3 | |
パ | 2 | 7.4% |
マ | 2 | 7.4% |
ン | 2 | 7.4% |
ア | 2 | 7.4% |
ニ | 2 | 7.4% |
メ | 2 | 7.4% |
ゾ | 1 | 3.7% |
ウ | 1 | 3.7% |
Other values (5) | 5 |
Compat Jamo
Value | Count | Frequency (%) |
ㄷ | 4 | |
ㄴ | 4 | |
ㄱ | 4 | |
ㅅ | 1 | 6.7% |
ㄹ | 1 | 6.7% |
ㆍ | 1 | 6.7% |
Math Operators
Value | Count | Frequency (%) |
∼ | 1 |
저자
Text
MISSING
 
Distinct | 8496 |
---|---|
Distinct (%) | 86.3% |
Missing | 159 |
Missing (%) | 1.6% |
Memory size | 156.2 KiB |
Length
Max length | 114 |
---|---|
Median length | 76 |
Mean length | 12.651661 |
Min length | 2 |
Characters and Unicode
Total characters | 124505 |
---|---|
Distinct characters | 1506 |
Distinct categories | 13 ? |
Distinct scripts | 7 ? |
Distinct blocks | 11 ? |
Unique
Unique | 7713 ? |
---|---|
Unique (%) | 78.4% |
Sample
1st row | 공지영 외 지음 |
---|---|
2nd row | 모리스 드뤼옹 지음;나선희 옮김 |
3rd row | 고하라 도모유키 글;마츠오카 다츠히데 그림;신미원 옮김 |
4th row | 김태정 글,사진 |
5th row | 김유나 지음 |
Value | Count | Frequency (%) |
지음 | 2929 | 9.9% |
옮김 | 2215 | 7.5% |
그림 | 1640 | 5.5% |
저 | 402 | 1.4% |
편 | 255 | 0.9% |
글 | 249 | 0.8% |
엮음 | 229 | 0.8% |
by | 162 | 0.5% |
외 | 159 | 0.5% |
著 | 152 | 0.5% |
Other values (13302) | 21303 |
Most occurring characters
Value | Count | Frequency (%) |
19895 | 16.0% | |
; | 6241 | 5.0% |
지 | 5713 | 4.6% |
음 | 5592 | 4.5% |
김 | 4374 | 3.5% |
이 | 2757 | 2.2% |
그 | 2556 | 2.1% |
림 | 2474 | 2.0% |
옮 | 2309 | 1.9% |
글 | 2018 | 1.6% |
Other values (1496) | 70576 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 87846 | |
Space Separator | 19895 | 16.0% |
Other Punctuation | 7806 | 6.3% |
Lowercase Letter | 5724 | 4.6% |
Uppercase Letter | 1495 | 1.2% |
Open Punctuation | 796 | 0.6% |
Close Punctuation | 796 | 0.6% |
Decimal Number | 90 | 0.1% |
Dash Punctuation | 38 | < 0.1% |
Math Symbol | 14 | < 0.1% |
Other values (3) | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 5713 | 6.5% |
음 | 5592 | 6.4% |
김 | 4374 | 5.0% |
이 | 2757 | 3.1% |
그 | 2556 | 2.9% |
림 | 2474 | 2.8% |
옮 | 2309 | 2.6% |
글 | 2018 | 2.3% |
스 | 1257 | 1.4% |
정 | 1256 | 1.4% |
Other values (1409) | 57540 |
Uppercase Letter
Value | Count | Frequency (%) |
M | 137 | 9.2% |
S | 121 | 8.1% |
J | 111 | 7.4% |
B | 106 | 7.1% |
C | 102 | 6.8% |
A | 87 | 5.8% |
L | 78 | 5.2% |
K | 77 | 5.2% |
E | 72 | 4.8% |
H | 64 | 4.3% |
Other values (17) | 540 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 608 | |
a | 577 | |
i | 491 | 8.6% |
r | 463 | 8.1% |
n | 455 | 7.9% |
t | 398 | 7.0% |
o | 386 | 6.7% |
l | 349 | 6.1% |
s | 297 | 5.2% |
y | 267 | 4.7% |
Other values (16) | 1433 |
Other Punctuation
Value | Count | Frequency (%) |
; | 6241 | |
. | 982 | 12.6% |
, | 177 | 2.3% |
· | 175 | 2.2% |
? | 137 | 1.8% |
: | 64 | 0.8% |
& | 11 | 0.1% |
' | 7 | 0.1% |
* | 6 | 0.1% |
& | 2 | < 0.1% |
Other values (3) | 4 | 0.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 25 | |
2 | 22 | |
5 | 10 | 11.1% |
0 | 7 | 7.8% |
8 | 7 | 7.8% |
3 | 6 | 6.7% |
4 | 5 | 5.6% |
7 | 4 | 4.4% |
6 | 3 | 3.3% |
9 | 1 | 1.1% |
Open Punctuation
Value | Count | Frequency (%) |
[ | 793 | |
( | 3 | 0.4% |
Close Punctuation
Value | Count | Frequency (%) |
] | 793 | |
) | 3 | 0.4% |
Math Symbol
Value | Count | Frequency (%) |
< | 7 | |
> | 7 |
Space Separator
Value | Count | Frequency (%) |
19895 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 38 |
Modifier Symbol
Value | Count | Frequency (%) |
^ | 3 |
Control
Value | Count | Frequency (%) |
1 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 85872 | |
Common | 29439 | 23.6% |
Latin | 7219 | 5.8% |
Han | 1814 | 1.5% |
Katakana | 138 | 0.1% |
Hiragana | 22 | < 0.1% |
Cyrillic | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 5713 | 6.7% |
음 | 5592 | 6.5% |
김 | 4374 | 5.1% |
이 | 2757 | 3.2% |
그 | 2556 | 3.0% |
림 | 2474 | 2.9% |
옮 | 2309 | 2.7% |
글 | 2018 | 2.4% |
스 | 1257 | 1.5% |
정 | 1256 | 1.5% |
Other values (855) | 55566 |
Han
Value | Count | Frequency (%) |
著 | 236 | 13.0% |
譯 | 59 | 3.3% |
李 | 54 | 3.0% |
編 | 51 | 2.8% |
金 | 48 | 2.6% |
朴 | 26 | 1.4% |
共 | 24 | 1.3% |
韓 | 22 | 1.2% |
崔 | 21 | 1.2% |
國 | 19 | 1.0% |
Other values (482) | 1254 |
Latin
Value | Count | Frequency (%) |
e | 608 | 8.4% |
a | 577 | 8.0% |
i | 491 | 6.8% |
r | 463 | 6.4% |
n | 455 | 6.3% |
t | 398 | 5.5% |
o | 386 | 5.3% |
l | 349 | 4.8% |
s | 297 | 4.1% |
y | 267 | 3.7% |
Other values (43) | 2928 |
Katakana
Value | Count | Frequency (%) |
レ | 12 | 8.7% |
リ | 9 | 6.5% |
ア | 6 | 4.3% |
ッ | 6 | 4.3% |
ン | 6 | 4.3% |
ト | 6 | 4.3% |
エ | 6 | 4.3% |
ス | 6 | 4.3% |
イ | 5 | 3.6% |
ニ | 4 | 2.9% |
Other values (39) | 72 |
Common
Value | Count | Frequency (%) |
19895 | ||
; | 6241 | 21.2% |
. | 982 | 3.3% |
[ | 793 | 2.7% |
] | 793 | 2.7% |
, | 177 | 0.6% |
· | 175 | 0.6% |
? | 137 | 0.5% |
: | 64 | 0.2% |
- | 38 | 0.1% |
Other values (23) | 144 | 0.5% |
Hiragana
Value | Count | Frequency (%) |
み | 4 | |
え | 2 | |
る | 2 | |
ぐ | 2 | |
め | 2 | |
く | 2 | |
ぶ | 2 | |
ん | 1 | 4.5% |
こ | 1 | 4.5% |
や | 1 | 4.5% |
Other values (3) | 3 |
Cyrillic
Value | Count | Frequency (%) |
Ф | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 85864 | |
ASCII | 36479 | |
CJK | 1734 | 1.4% |
None | 177 | 0.1% |
Katakana | 138 | 0.1% |
CJK Compat Ideographs | 80 | 0.1% |
Hiragana | 22 | < 0.1% |
Compat Jamo | 8 | < 0.1% |
Cyrillic | 1 | < 0.1% |
Punctuation | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
19895 | ||
; | 6241 | 17.1% |
. | 982 | 2.7% |
[ | 793 | 2.2% |
] | 793 | 2.2% |
e | 608 | 1.7% |
a | 577 | 1.6% |
i | 491 | 1.3% |
r | 463 | 1.3% |
n | 455 | 1.2% |
Other values (72) | 5181 | 14.2% |
Hangul
Value | Count | Frequency (%) |
지 | 5713 | 6.7% |
음 | 5592 | 6.5% |
김 | 4374 | 5.1% |
이 | 2757 | 3.2% |
그 | 2556 | 3.0% |
림 | 2474 | 2.9% |
옮 | 2309 | 2.7% |
글 | 2018 | 2.4% |
스 | 1257 | 1.5% |
정 | 1256 | 1.5% |
Other values (852) | 55558 |
CJK
Value | Count | Frequency (%) |
著 | 236 | 13.6% |
譯 | 59 | 3.4% |
編 | 51 | 2.9% |
金 | 48 | 2.8% |
朴 | 26 | 1.5% |
共 | 24 | 1.4% |
韓 | 22 | 1.3% |
崔 | 21 | 1.2% |
國 | 19 | 1.1% |
趙 | 18 | 1.0% |
Other values (463) | 1210 |
None
Value | Count | Frequency (%) |
· | 175 | |
& | 2 | 1.1% |
CJK Compat Ideographs
Value | Count | Frequency (%) |
李 | 54 | |
寧 | 3 | 3.8% |
烈 | 3 | 3.8% |
龍 | 2 | 2.5% |
梁 | 2 | 2.5% |
沈 | 2 | 2.5% |
柳 | 2 | 2.5% |
綾 | 1 | 1.2% |
參 | 1 | 1.2% |
良 | 1 | 1.2% |
Other values (9) | 9 | 11.2% |
Katakana
Value | Count | Frequency (%) |
レ | 12 | 8.7% |
リ | 9 | 6.5% |
ア | 6 | 4.3% |
ッ | 6 | 4.3% |
ン | 6 | 4.3% |
ト | 6 | 4.3% |
エ | 6 | 4.3% |
ス | 6 | 4.3% |
イ | 5 | 3.6% |
ニ | 4 | 2.9% |
Other values (39) | 72 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 6 | |
ㅆ | 1 | 12.5% |
ㅇ | 1 | 12.5% |
Hiragana
Value | Count | Frequency (%) |
み | 4 | |
え | 2 | |
る | 2 | |
ぐ | 2 | |
め | 2 | |
く | 2 | |
ぶ | 2 | |
ん | 1 | 4.5% |
こ | 1 | 4.5% |
や | 1 | 4.5% |
Other values (3) | 3 |
Cyrillic
Value | Count | Frequency (%) |
Ф | 1 |
Punctuation
Value | Count | Frequency (%) |
… | 1 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 |
출판사
Text
Distinct | 2841 |
---|---|
Distinct (%) | 28.4% |
Missing | 7 |
Missing (%) | 0.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
문학동네 | 157 | 1.5% |
김영사 | 135 | 1.3% |
교원 | 135 | 1.3% |
시공사 | 107 | 1.0% |
비룡소 | 102 | 1.0% |
웅진닷컴 | 91 | 0.9% |
민음사 | 80 | 0.8% |
창비 | 75 | 0.7% |
프뢰벨 | 70 | 0.7% |
문학과지성사 | 67 | 0.6% |
Other values (2891) | 9463 |
Most occurring characters
Value | Count | Frequency (%) |
사 | 2608 | 6.0% |
문 | 1170 | 2.7% |
판 | 848 | 1.9% |
출 | 848 | 1.9% |
이 | 814 | 1.9% |
스 | 814 | 1.9% |
학 | 812 | 1.9% |
한 | 654 | 1.5% |
어 | 594 | 1.4% |
원 | 569 | 1.3% |
Other values (901) | 33951 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 39419 | |
Lowercase Letter | 2266 | 5.2% |
Uppercase Letter | 866 | 2.0% |
Space Separator | 532 | 1.2% |
Other Punctuation | 404 | 0.9% |
Decimal Number | 139 | 0.3% |
Close Punctuation | 21 | < 0.1% |
Open Punctuation | 21 | < 0.1% |
Dash Punctuation | 12 | < 0.1% |
Connector Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 2608 | 6.6% |
문 | 1170 | 3.0% |
판 | 848 | 2.2% |
출 | 848 | 2.2% |
이 | 814 | 2.1% |
스 | 814 | 2.1% |
학 | 812 | 2.1% |
한 | 654 | 1.7% |
어 | 594 | 1.5% |
원 | 569 | 1.4% |
Other values (822) | 29688 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 349 | |
a | 200 | 8.8% |
i | 188 | 8.3% |
e | 170 | 7.5% |
s | 155 | 6.8% |
n | 153 | 6.8% |
r | 141 | 6.2% |
l | 136 | 6.0% |
c | 100 | 4.4% |
t | 100 | 4.4% |
Other values (15) | 574 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 197 | |
M | 127 | |
S | 76 | 8.8% |
P | 52 | 6.0% |
H | 49 | 5.7% |
K | 44 | 5.1% |
O | 42 | 4.8% |
C | 38 | 4.4% |
I | 30 | 3.5% |
L | 25 | 2.9% |
Other values (14) | 186 |
Other Punctuation
Value | Count | Frequency (%) |
: | 162 | |
& | 79 | |
? | 70 | |
* | 23 | 5.7% |
. | 21 | 5.2% |
, | 16 | 4.0% |
& | 12 | 3.0% |
' | 7 | 1.7% |
; | 6 | 1.5% |
@ | 3 | 0.7% |
Other values (3) | 5 | 1.2% |
Decimal Number
Value | Count | Frequency (%) |
2 | 60 | |
1 | 55 | |
0 | 13 | 9.4% |
5 | 3 | 2.2% |
8 | 2 | 1.4% |
4 | 2 | 1.4% |
9 | 1 | 0.7% |
6 | 1 | 0.7% |
3 | 1 | 0.7% |
7 | 1 | 0.7% |
Close Punctuation
Value | Count | Frequency (%) |
) | 20 | |
] | 1 | 4.8% |
Open Punctuation
Value | Count | Frequency (%) |
( | 20 | |
[ | 1 | 4.8% |
Space Separator
Value | Count | Frequency (%) |
532 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 12 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 37995 | |
Latin | 3132 | 7.2% |
Han | 1408 | 3.2% |
Common | 1131 | 2.6% |
Hiragana | 8 | < 0.1% |
Katakana | 8 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 2608 | 6.9% |
문 | 1170 | 3.1% |
판 | 848 | 2.2% |
출 | 848 | 2.2% |
이 | 814 | 2.1% |
스 | 814 | 2.1% |
학 | 812 | 2.1% |
한 | 654 | 1.7% |
어 | 594 | 1.6% |
원 | 569 | 1.5% |
Other values (587) | 28264 |
Han
Value | Count | Frequency (%) |
社 | 209 | 14.8% |
文 | 101 | 7.2% |
出 | 67 | 4.8% |
版 | 67 | 4.8% |
學 | 37 | 2.6% |
英 | 33 | 2.3% |
法 | 32 | 2.3% |
化 | 24 | 1.7% |
堂 | 23 | 1.6% |
大 | 23 | 1.6% |
Other values (211) | 792 |
Latin
Value | Count | Frequency (%) |
o | 349 | 11.1% |
a | 200 | 6.4% |
B | 197 | 6.3% |
i | 188 | 6.0% |
e | 170 | 5.4% |
s | 155 | 4.9% |
n | 153 | 4.9% |
r | 141 | 4.5% |
l | 136 | 4.3% |
M | 127 | 4.1% |
Other values (39) | 1316 |
Common
Value | Count | Frequency (%) |
532 | ||
: | 162 | 14.3% |
& | 79 | 7.0% |
? | 70 | 6.2% |
2 | 60 | 5.3% |
1 | 55 | 4.9% |
* | 23 | 2.0% |
. | 21 | 1.9% |
) | 20 | 1.8% |
( | 20 | 1.8% |
Other values (20) | 89 | 7.9% |
Katakana
Value | Count | Frequency (%) |
ア | 1 | |
ス | 1 | |
マ | 1 | |
タ | 1 | |
ニ | 1 | |
ジ | 1 | |
ノ | 1 | |
オ | 1 |
Hiragana
Value | Count | Frequency (%) |
の | 3 | |
ひ | 1 | 12.5% |
か | 1 | 12.5% |
り | 1 | 12.5% |
く | 1 | 12.5% |
に | 1 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 37995 | |
ASCII | 4248 | 9.7% |
CJK | 1387 | 3.2% |
CJK Compat Ideographs | 21 | < 0.1% |
None | 15 | < 0.1% |
Hiragana | 8 | < 0.1% |
Katakana | 8 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
사 | 2608 | 6.9% |
문 | 1170 | 3.1% |
판 | 848 | 2.2% |
출 | 848 | 2.2% |
이 | 814 | 2.1% |
스 | 814 | 2.1% |
학 | 812 | 2.1% |
한 | 654 | 1.7% |
어 | 594 | 1.6% |
원 | 569 | 1.5% |
Other values (587) | 28264 |
ASCII
Value | Count | Frequency (%) |
532 | 12.5% | |
o | 349 | 8.2% |
a | 200 | 4.7% |
B | 197 | 4.6% |
i | 188 | 4.4% |
e | 170 | 4.0% |
: | 162 | 3.8% |
s | 155 | 3.6% |
n | 153 | 3.6% |
r | 141 | 3.3% |
Other values (66) | 2001 |
CJK
Value | Count | Frequency (%) |
社 | 209 | 15.1% |
文 | 101 | 7.3% |
出 | 67 | 4.8% |
版 | 67 | 4.8% |
學 | 37 | 2.7% |
英 | 33 | 2.4% |
法 | 32 | 2.3% |
化 | 24 | 1.7% |
堂 | 23 | 1.7% |
大 | 23 | 1.7% |
Other values (206) | 771 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
金 | 12 | |
良 | 6 | |
梨 | 1 | 4.8% |
嶺 | 1 | 4.8% |
麗 | 1 | 4.8% |
None
Value | Count | Frequency (%) |
& | 12 | |
· | 2 | 13.3% |
đ | 1 | 6.7% |
Hiragana
Value | Count | Frequency (%) |
の | 3 | |
ひ | 1 | 12.5% |
か | 1 | 12.5% |
り | 1 | 12.5% |
く | 1 | 12.5% |
に | 1 | 12.5% |
Katakana
Value | Count | Frequency (%) |
ア | 1 | |
ス | 1 | |
マ | 1 | |
タ | 1 | |
ニ | 1 | |
ジ | 1 | |
ノ | 1 | |
オ | 1 |
서명 | 저자 | 출판사 | |
---|---|---|---|
61854 | 나의 고전 읽기 | 공지영 외 지음 | 북섬 |
23671 | 꽃 피우는 아이 티스투 | 모리스 드뤼옹 지음;나선희 옮김 | 길벗어린이 |
62071 | 지구는 대단해 | 고하라 도모유키 글;마츠오카 다츠히데 그림;신미원 옮김 | 아이세움 |
10743 | 약용식물 | 김태정 글,사진 | 대원사 |
76817 | 날마다 홍차 | 김유나 지음 | 장서가:청어람M&B |
41191 | 식충식물의 세계 | 전의식;김정환 공저 | 도요새 |
36704 | 미스 론리하트 | 너새네이얼 웨스트 지음;이종인 옮김 | 마음산책 |
2949 | 윤리학의 역사 | 강재륜 지음 | 大旺社 |
56690 | (사진으로 보는)문경의 근대 100년사 | 문경시 [편] | 문경시 |
81306 | 2012 신춘문예 당선시집 | 김민철;류성훈;안미옥;여성민 [공]지음 | 문학세계사 |
서명 | 저자 | 출판사 | |
---|---|---|---|
75519 | 다빈치 푸드:판타지 요리과학만화 | 스튜디오 애니멀 지음 | 아울북:북이십일 |
59612 | (코믹 메이플스토리) 수학도둑 | 송도수 글;서정 엔터테인먼트 그림;여운방 콘텐츠 | 서울문화사 |
45838 | 베짱이 할아버지 | 김나무 글;강전희 그림 | 문학동네어린이 |
27269 | 아기옷 | <NA> | 홍익 |
88178 | 무민과 아빠의 첫 운전 | 토베 얀손 지음;이지영 옮김 | 어린이작가정신 |
94798 | 이건희의 서재:고독 몰입 독서로 미래를 창조하라 | 안상헌 지음 | 책비 |
5497 | 唐詩三百首 I | 채지충 만화;황병국 번역 | 대현 |
20755 | 원감국사가송 | 고대민족문화연구소 [편];이종찬 역주 | 고대민족문화연구소 |
66497 | 아웃=Out | 기리노 나쓰오 지음;김수현 옮김 | 황금가지 |
66905 | 천 년의 사랑 직지 | 조경희 글;박철민 그림 | 대교출판 |
Most frequently occurring
서명 | 저자 | 출판사 | # duplicates | |
---|---|---|---|---|
330 | 이조실록 | 사회과학원 민족고전연구소 번역 | 여강 | 42 |
399 | 헤밍웨이 테마위인 | <NA> | 한국헤밍웨이 | 12 |
310 | 옥스퍼드 원어 성경대전=(The) Oxford Bible interpreter | 제자원 편 | 제자원 | 11 |
75 | (프뢰벨) 자연관찰/ | <NA> | 프뢰벨 | 10 |
224 | 바투바투 인물이야기=: | <NA> | 웅진닷컴 | 9 |
8 | (戰略) 삼국지 | 요코야마 미쓰테루 지음;박영 옮김 | 대현 | 8 |
43 | (월간) 도예 | <NA> | 월간 세라믹스, | 8 |
62 | (코믹 메이플스토리) 수학도둑 | 송도수 글;서정은 그림 | 서울문화사 | 8 |
71 | (프뢰벨) 뉴 컨셉동화 | <NA> | 프뢰벨 | 8 |
76 | (프뢰벨) 테마영어동화 | ;프뢰벨 유아교육연구소 옮김 | 프뢰벨 | 8 |