Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 35 |
Missing cells (%) | 0.1% |
Duplicate rows | 699 |
Duplicate rows (%) | 7.0% |
Total size in memory | 468.8 KiB |
Average record size in memory | 48.0 B |
Variable types
Text | 4 |
---|---|
Categorical | 1 |
Dataset
Description | 대구광역시 중구 교양정보실 도서목록입니다 (도서명, 저자, 출판사 등의 정보를 제공합니다.) |
---|---|
Author | 대구광역시 중구 |
URL | https://www.data.go.kr/data/15054147/fileData.do |
데이터기준일자 has constant value "" | Constant |
Dataset has 699 (7.0%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-11 23:52:34.789570 |
---|---|
Analysis finished | 2023-12-11 23:52:36.672051 |
Duration | 1.88 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
도서명
Text
Distinct | 9008 |
---|---|
Distinct (%) | 90.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 59 |
---|---|
Median length | 47 |
Mean length | 13.3404 |
Min length | 1 |
Characters and Unicode
Total characters | 133404 |
---|---|
Distinct characters | 1506 |
Distinct categories | 13 ? |
Distinct scripts | 6 ? |
Distinct blocks | 13 ? |
Unique
Unique | 8228 ? |
---|---|
Unique (%) | 82.3% |
Sample
1st row | 명품도시를 만드는 열정 |
---|---|
2nd row | 쥬라기공원.2 |
3rd row | 허와 실의 인간학 (지략편) |
4th row | 곰스크로 가는 기차 |
5th row | 서울을 디자인한다 |
Value | Count | Frequency (%) |
1 | 205 | 0.7% |
2 | 199 | 0.7% |
이야기 | 159 | 0.5% |
내 | 118 | 0.4% |
중구 | 103 | 0.3% |
나는 | 87 | 0.3% |
3 | 85 | 0.3% |
위한 | 82 | 0.3% |
우리 | 73 | 0.2% |
대구 | 73 | 0.2% |
Other values (15088) | 28932 |
Most occurring characters
Value | Count | Frequency (%) |
20140 | 15.1% | |
의 | 2764 | 2.1% |
) | 2744 | 2.1% |
( | 2739 | 2.1% |
이 | 2174 | 1.6% |
. | 2120 | 1.6% |
0 | 2059 | 1.5% |
1 | 1976 | 1.5% |
2 | 1946 | 1.5% |
사 | 1853 | 1.4% |
Other values (1496) | 92889 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 92726 | |
Space Separator | 20140 | 15.1% |
Decimal Number | 9426 | 7.1% |
Close Punctuation | 3233 | 2.4% |
Open Punctuation | 3229 | 2.4% |
Other Punctuation | 2890 | 2.2% |
Uppercase Letter | 847 | 0.6% |
Lowercase Letter | 602 | 0.5% |
Dash Punctuation | 216 | 0.2% |
Math Symbol | 66 | < 0.1% |
Other values (3) | 29 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
의 | 2764 | 3.0% |
이 | 2174 | 2.3% |
사 | 1853 | 2.0% |
는 | 1480 | 1.6% |
기 | 1464 | 1.6% |
지 | 1287 | 1.4% |
다 | 1186 | 1.3% |
대 | 1166 | 1.3% |
리 | 1111 | 1.2% |
한 | 1091 | 1.2% |
Other values (1398) | 77150 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 73 | 8.6% |
E | 62 | 7.3% |
S | 61 | 7.2% |
R | 59 | 7.0% |
A | 59 | 7.0% |
B | 56 | 6.6% |
I | 56 | 6.6% |
N | 54 | 6.4% |
T | 44 | 5.2% |
C | 31 | 3.7% |
Other values (16) | 292 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 79 | |
o | 61 | 10.1% |
a | 42 | 7.0% |
r | 42 | 7.0% |
n | 39 | 6.5% |
i | 37 | 6.1% |
t | 36 | 6.0% |
h | 33 | 5.5% |
l | 33 | 5.5% |
y | 31 | 5.1% |
Other values (14) | 169 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2120 | |
/ | 182 | 6.3% |
; | 157 | 5.4% |
: | 105 | 3.6% |
? | 95 | 3.3% |
! | 90 | 3.1% |
· | 77 | 2.7% |
' | 24 | 0.8% |
, | 20 | 0.7% |
& | 9 | 0.3% |
Other values (6) | 11 | 0.4% |
Decimal Number
Value | Count | Frequency (%) |
0 | 2059 | |
1 | 1976 | |
2 | 1946 | |
9 | 743 | 7.9% |
3 | 712 | 7.6% |
5 | 522 | 5.5% |
4 | 521 | 5.5% |
6 | 349 | 3.7% |
7 | 300 | 3.2% |
8 | 298 | 3.2% |
Math Symbol
Value | Count | Frequency (%) |
~ | 44 | |
+ | 15 | 22.7% |
= | 3 | 4.5% |
∼ | 2 | 3.0% |
> | 1 | 1.5% |
< | 1 | 1.5% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 11 | |
Ⅱ | 7 | |
Ⅳ | 4 | 15.4% |
Ⅲ | 3 | 11.5% |
Ⅶ | 1 | 3.8% |
Close Punctuation
Value | Count | Frequency (%) |
) | 2744 | |
] | 488 | 15.1% |
』 | 1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 2739 | |
[ | 489 | 15.1% |
『 | 1 | < 0.1% |
Other Symbol
Value | Count | Frequency (%) |
ⓔ | 1 | |
℃ | 1 |
Space Separator
Value | Count | Frequency (%) |
20140 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 216 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 92147 | |
Common | 39203 | |
Latin | 1475 | 1.1% |
Han | 574 | 0.4% |
Katakana | 4 | < 0.1% |
Hiragana | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
의 | 2764 | 3.0% |
이 | 2174 | 2.4% |
사 | 1853 | 2.0% |
는 | 1480 | 1.6% |
기 | 1464 | 1.6% |
지 | 1287 | 1.4% |
다 | 1186 | 1.3% |
대 | 1166 | 1.3% |
리 | 1111 | 1.2% |
한 | 1091 | 1.2% |
Other values (1148) | 76571 |
Han
Value | Count | Frequency (%) |
大 | 19 | 3.3% |
子 | 17 | 3.0% |
書 | 13 | 2.3% |
四 | 12 | 2.1% |
集 | 11 | 1.9% |
東 | 8 | 1.4% |
詩 | 8 | 1.4% |
說 | 8 | 1.4% |
名 | 8 | 1.4% |
法 | 7 | 1.2% |
Other values (235) | 463 |
Latin
Value | Count | Frequency (%) |
e | 79 | 5.4% |
O | 73 | 4.9% |
E | 62 | 4.2% |
S | 61 | 4.1% |
o | 61 | 4.1% |
R | 59 | 4.0% |
A | 59 | 4.0% |
B | 56 | 3.8% |
I | 56 | 3.8% |
N | 54 | 3.7% |
Other values (45) | 855 |
Common
Value | Count | Frequency (%) |
20140 | ||
) | 2744 | 7.0% |
( | 2739 | 7.0% |
. | 2120 | 5.4% |
0 | 2059 | 5.3% |
1 | 1976 | 5.0% |
2 | 1946 | 5.0% |
9 | 743 | 1.9% |
3 | 712 | 1.8% |
5 | 522 | 1.3% |
Other values (33) | 3502 | 8.9% |
Katakana
Value | Count | Frequency (%) |
ク | 1 | |
モ | 1 | |
ル | 1 | |
コ | 1 |
Hiragana
Value | Count | Frequency (%) |
の | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 92141 | |
ASCII | 40562 | |
CJK | 554 | 0.4% |
None | 84 | 0.1% |
Number Forms | 26 | < 0.1% |
CJK Compat Ideographs | 20 | < 0.1% |
Compat Jamo | 6 | < 0.1% |
Katakana | 4 | < 0.1% |
Punctuation | 2 | < 0.1% |
Math Operators | 2 | < 0.1% |
Other values (3) | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
20140 | ||
) | 2744 | 6.8% |
( | 2739 | 6.8% |
. | 2120 | 5.2% |
0 | 2059 | 5.1% |
1 | 1976 | 4.9% |
2 | 1946 | 4.8% |
9 | 743 | 1.8% |
3 | 712 | 1.8% |
5 | 522 | 1.3% |
Other values (73) | 4861 | 12.0% |
Hangul
Value | Count | Frequency (%) |
의 | 2764 | 3.0% |
이 | 2174 | 2.4% |
사 | 1853 | 2.0% |
는 | 1480 | 1.6% |
기 | 1464 | 1.6% |
지 | 1287 | 1.4% |
다 | 1186 | 1.3% |
대 | 1166 | 1.3% |
리 | 1111 | 1.2% |
한 | 1091 | 1.2% |
Other values (1142) | 76565 |
None
Value | Count | Frequency (%) |
· | 77 | |
! | 3 | 3.6% |
。 | 1 | 1.2% |
『 | 1 | 1.2% |
』 | 1 | 1.2% |
& | 1 | 1.2% |
CJK
Value | Count | Frequency (%) |
大 | 19 | 3.4% |
子 | 17 | 3.1% |
書 | 13 | 2.3% |
四 | 12 | 2.2% |
集 | 11 | 2.0% |
東 | 8 | 1.4% |
詩 | 8 | 1.4% |
說 | 8 | 1.4% |
名 | 8 | 1.4% |
法 | 7 | 1.3% |
Other values (223) | 443 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 11 | |
Ⅱ | 7 | |
Ⅳ | 4 | 15.4% |
Ⅲ | 3 | 11.5% |
Ⅶ | 1 | 3.8% |
CJK Compat Ideographs
Value | Count | Frequency (%) |
女 | 6 | |
李 | 3 | |
金 | 2 | 10.0% |
裸 | 1 | 5.0% |
滑 | 1 | 5.0% |
靈 | 1 | 5.0% |
戀 | 1 | 5.0% |
龜 | 1 | 5.0% |
龍 | 1 | 5.0% |
療 | 1 | 5.0% |
Other values (2) | 2 | 10.0% |
Punctuation
Value | Count | Frequency (%) |
… | 2 |
Math Operators
Value | Count | Frequency (%) |
∼ | 2 |
Compat Jamo
Value | Count | Frequency (%) |
ㄷ | 1 | |
ㄱ | 1 | |
ㄴ | 1 | |
ㅇ | 1 | |
ㅍ | 1 | |
ㆍ | 1 |
Enclosed Alphanum
Value | Count | Frequency (%) |
ⓔ | 1 |
Letterlike Symbols
Value | Count | Frequency (%) |
℃ | 1 |
Katakana
Value | Count | Frequency (%) |
ク | 1 | |
モ | 1 | |
ル | 1 | |
コ | 1 |
Hiragana
Value | Count | Frequency (%) |
の | 1 |
저자
Text
Distinct | 6440 |
---|---|
Distinct (%) | 64.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 73 |
---|---|
Median length | 66 |
Mean length | 9.1001 |
Min length | 2 |
Characters and Unicode
Total characters | 91001 |
---|---|
Distinct characters | 951 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 7 ? |
Unique
Unique | 5040 ? |
---|---|
Unique (%) | 50.4% |
Sample
1st row | 박문하 |
---|---|
2nd row | 마이클 크리튼 지음; 정영목 옮김 |
3rd row | 이병주 편저 |
4th row | 프리츠 오르트만 지음 |
5th row | 권영걸 |
Value | Count | Frequency (%) |
지음 | 4479 | 17.4% |
옮김 | 1493 | 5.8% |
편 | 1238 | 4.8% |
549 | 2.1% | |
그림 | 354 | 1.4% |
엮음 | 322 | 1.2% |
저 | 309 | 1.2% |
대구광역시 | 265 | 1.0% |
외 | 249 | 1.0% |
글 | 194 | 0.8% |
Other values (7964) | 16358 |
Most occurring characters
Value | Count | Frequency (%) |
15889 | 17.5% | |
지 | 5319 | 5.8% |
음 | 5246 | 5.8% |
김 | 3051 | 3.4% |
; | 2818 | 3.1% |
이 | 1912 | 2.1% |
편 | 1703 | 1.9% |
옮 | 1527 | 1.7% |
구 | 1319 | 1.4% |
정 | 1033 | 1.1% |
Other values (941) | 51184 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 70289 | |
Space Separator | 15889 | 17.5% |
Other Punctuation | 3448 | 3.8% |
Uppercase Letter | 462 | 0.5% |
Lowercase Letter | 272 | 0.3% |
Close Punctuation | 211 | 0.2% |
Open Punctuation | 210 | 0.2% |
Decimal Number | 168 | 0.2% |
Dash Punctuation | 41 | < 0.1% |
Math Symbol | 10 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 5319 | 7.6% |
음 | 5246 | 7.5% |
김 | 3051 | 4.3% |
이 | 1912 | 2.7% |
편 | 1703 | 2.4% |
옮 | 1527 | 2.2% |
구 | 1319 | 1.9% |
정 | 1033 | 1.5% |
시 | 974 | 1.4% |
스 | 825 | 1.2% |
Other values (863) | 47380 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 49 | 10.6% |
B | 38 | 8.2% |
R | 36 | 7.8% |
M | 34 | 7.4% |
K | 31 | 6.7% |
A | 30 | 6.5% |
C | 30 | 6.5% |
J | 29 | 6.3% |
E | 25 | 5.4% |
H | 21 | 4.5% |
Other values (14) | 139 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 26 | 9.6% |
n | 26 | 9.6% |
i | 25 | 9.2% |
e | 23 | 8.5% |
o | 22 | 8.1% |
t | 19 | 7.0% |
r | 16 | 5.9% |
s | 15 | 5.5% |
m | 13 | 4.8% |
l | 13 | 4.8% |
Other values (13) | 74 |
Other Punctuation
Value | Count | Frequency (%) |
; | 2818 | |
. | 561 | 16.3% |
· | 38 | 1.1% |
& | 9 | 0.3% |
, | 7 | 0.2% |
: | 7 | 0.2% |
/ | 5 | 0.1% |
… | 1 | < 0.1% |
& | 1 | < 0.1% |
/ | 1 | < 0.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 34 | |
2 | 32 | |
0 | 28 | |
5 | 25 | |
8 | 19 | |
3 | 12 | 7.1% |
6 | 8 | 4.8% |
4 | 6 | 3.6% |
7 | 3 | 1.8% |
9 | 1 | 0.6% |
Close Punctuation
Value | Count | Frequency (%) |
] | 195 | |
) | 15 | 7.1% |
〉 | 1 | 0.5% |
Open Punctuation
Value | Count | Frequency (%) |
[ | 195 | |
( | 14 | 6.7% |
〈 | 1 | 0.5% |
Math Symbol
Value | Count | Frequency (%) |
< | 5 | |
> | 5 |
Space Separator
Value | Count | Frequency (%) |
15889 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 41 |
Other Symbol
Value | Count | Frequency (%) |
ⓔ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 70186 | |
Common | 19978 | 22.0% |
Latin | 734 | 0.8% |
Han | 103 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 5319 | 7.6% |
음 | 5246 | 7.5% |
김 | 3051 | 4.3% |
이 | 1912 | 2.7% |
편 | 1703 | 2.4% |
옮 | 1527 | 2.2% |
구 | 1319 | 1.9% |
정 | 1033 | 1.5% |
시 | 974 | 1.4% |
스 | 825 | 1.2% |
Other values (784) | 47277 |
Han
Value | Count | Frequency (%) |
著 | 6 | 5.8% |
會 | 4 | 3.9% |
編 | 4 | 3.9% |
博 | 3 | 2.9% |
纂 | 2 | 1.9% |
美 | 2 | 1.9% |
委 | 2 | 1.9% |
學 | 2 | 1.9% |
外 | 2 | 1.9% |
員 | 2 | 1.9% |
Other values (69) | 74 |
Latin
Value | Count | Frequency (%) |
S | 49 | 6.7% |
B | 38 | 5.2% |
R | 36 | 4.9% |
M | 34 | 4.6% |
K | 31 | 4.2% |
A | 30 | 4.1% |
C | 30 | 4.1% |
J | 29 | 4.0% |
a | 26 | 3.5% |
n | 26 | 3.5% |
Other values (37) | 405 |
Common
Value | Count | Frequency (%) |
15889 | ||
; | 2818 | 14.1% |
. | 561 | 2.8% |
] | 195 | 1.0% |
[ | 195 | 1.0% |
- | 41 | 0.2% |
· | 38 | 0.2% |
1 | 34 | 0.2% |
2 | 32 | 0.2% |
0 | 28 | 0.1% |
Other values (21) | 147 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 70186 | |
ASCII | 20668 | 22.7% |
CJK | 99 | 0.1% |
None | 42 | < 0.1% |
CJK Compat Ideographs | 4 | < 0.1% |
Enclosed Alphanum | 1 | < 0.1% |
Punctuation | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
15889 | ||
; | 2818 | 13.6% |
. | 561 | 2.7% |
] | 195 | 0.9% |
[ | 195 | 0.9% |
S | 49 | 0.2% |
- | 41 | 0.2% |
B | 38 | 0.2% |
R | 36 | 0.2% |
M | 34 | 0.2% |
Other values (61) | 812 | 3.9% |
Hangul
Value | Count | Frequency (%) |
지 | 5319 | 7.6% |
음 | 5246 | 7.5% |
김 | 3051 | 4.3% |
이 | 1912 | 2.7% |
편 | 1703 | 2.4% |
옮 | 1527 | 2.2% |
구 | 1319 | 1.9% |
정 | 1033 | 1.5% |
시 | 974 | 1.4% |
스 | 825 | 1.2% |
Other values (784) | 47277 |
None
Value | Count | Frequency (%) |
· | 38 | |
& | 1 | 2.4% |
〈 | 1 | 2.4% |
/ | 1 | 2.4% |
〉 | 1 | 2.4% |
CJK
Value | Count | Frequency (%) |
著 | 6 | 6.1% |
會 | 4 | 4.0% |
編 | 4 | 4.0% |
博 | 3 | 3.0% |
纂 | 2 | 2.0% |
美 | 2 | 2.0% |
委 | 2 | 2.0% |
學 | 2 | 2.0% |
外 | 2 | 2.0% |
員 | 2 | 2.0% |
Other values (65) | 70 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
柳 | 1 | |
李 | 1 | |
林 | 1 | |
綾 | 1 |
Enclosed Alphanum
Value | Count | Frequency (%) |
ⓔ | 1 |
Punctuation
Value | Count | Frequency (%) |
… | 1 |
출판사
Text
Distinct | 3139 |
---|---|
Distinct (%) | 31.4% |
Missing | 7 |
Missing (%) | 0.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
대구광역시 | 361 | 3.2% |
중구 | 138 | 1.2% |
중구청 | 128 | 1.1% |
문학동네 | 111 | 1.0% |
통계청 | 109 | 1.0% |
김영사 | 96 | 0.9% |
한길사 | 81 | 0.7% |
한국지방행정연구원 | 80 | 0.7% |
고려원 | 71 | 0.6% |
도서출판 | 70 | 0.6% |
Other values (3110) | 9889 |
Most occurring characters
Value | Count | Frequency (%) |
사 | 2807 | 5.5% |
구 | 1490 | 2.9% |
판 | 1470 | 2.9% |
출 | 1470 | 2.9% |
문 | 1289 | 2.5% |
1236 | 2.4% | |
시 | 1045 | 2.1% |
대 | 998 | 2.0% |
서 | 798 | 1.6% |
원 | 779 | 1.5% |
Other values (767) | 37430 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 46796 | |
Space Separator | 1236 | 2.4% |
Close Punctuation | 720 | 1.4% |
Open Punctuation | 720 | 1.4% |
Lowercase Letter | 453 | 0.9% |
Uppercase Letter | 347 | 0.7% |
Decimal Number | 284 | 0.6% |
Other Punctuation | 222 | 0.4% |
Dash Punctuation | 33 | 0.1% |
Other Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 2807 | 6.0% |
구 | 1490 | 3.2% |
판 | 1470 | 3.1% |
출 | 1470 | 3.1% |
문 | 1289 | 2.8% |
시 | 1045 | 2.2% |
대 | 998 | 2.1% |
서 | 798 | 1.7% |
원 | 779 | 1.7% |
스 | 776 | 1.7% |
Other values (691) | 33874 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 70 | |
K | 34 | |
H | 33 | |
O | 25 | 7.2% |
S | 23 | 6.6% |
R | 22 | 6.3% |
M | 22 | 6.3% |
P | 15 | 4.3% |
C | 15 | 4.3% |
G | 14 | 4.0% |
Other values (16) | 74 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 89 | |
s | 44 | |
n | 34 | 7.5% |
i | 34 | 7.5% |
k | 33 | 7.3% |
e | 33 | 7.3% |
b | 26 | 5.7% |
a | 26 | 5.7% |
m | 23 | 5.1% |
r | 20 | 4.4% |
Other values (12) | 91 |
Other Punctuation
Value | Count | Frequency (%) |
. | 125 | |
: | 31 | 14.0% |
& | 23 | 10.4% |
/ | 22 | 9.9% |
· | 7 | 3.2% |
; | 5 | 2.3% |
& | 4 | 1.8% |
? | 2 | 0.9% |
! | 1 | 0.5% |
@ | 1 | 0.5% |
Decimal Number
Value | Count | Frequency (%) |
1 | 88 | |
2 | 77 | |
0 | 32 | 11.3% |
8 | 24 | 8.5% |
5 | 18 | 6.3% |
3 | 14 | 4.9% |
9 | 9 | 3.2% |
4 | 9 | 3.2% |
6 | 7 | 2.5% |
7 | 6 | 2.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 703 | |
] | 17 | 2.4% |
Open Punctuation
Value | Count | Frequency (%) |
( | 703 | |
[ | 17 | 2.4% |
Space Separator
Value | Count | Frequency (%) |
1236 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 33 |
Other Symbol
Value | Count | Frequency (%) |
▶ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 46438 | |
Common | 3216 | 6.3% |
Latin | 800 | 1.6% |
Han | 358 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 2807 | 6.0% |
구 | 1490 | 3.2% |
판 | 1470 | 3.2% |
출 | 1470 | 3.2% |
문 | 1289 | 2.8% |
시 | 1045 | 2.3% |
대 | 998 | 2.1% |
서 | 798 | 1.7% |
원 | 779 | 1.7% |
스 | 776 | 1.7% |
Other values (591) | 33516 |
Han
Value | Count | Frequency (%) |
社 | 55 | 15.4% |
文 | 36 | 10.1% |
出 | 30 | 8.4% |
版 | 29 | 8.1% |
徽 | 12 | 3.4% |
學 | 11 | 3.1% |
徹 | 9 | 2.5% |
日 | 7 | 2.0% |
報 | 6 | 1.7% |
國 | 6 | 1.7% |
Other values (90) | 157 |
Latin
Value | Count | Frequency (%) |
o | 89 | 11.1% |
B | 70 | 8.8% |
s | 44 | 5.5% |
n | 34 | 4.2% |
K | 34 | 4.2% |
i | 34 | 4.2% |
k | 33 | 4.1% |
H | 33 | 4.1% |
e | 33 | 4.1% |
b | 26 | 3.2% |
Other values (38) | 370 |
Common
Value | Count | Frequency (%) |
1236 | ||
) | 703 | |
( | 703 | |
. | 125 | 3.9% |
1 | 88 | 2.7% |
2 | 77 | 2.4% |
- | 33 | 1.0% |
0 | 32 | 1.0% |
: | 31 | 1.0% |
8 | 24 | 0.7% |
Other values (18) | 164 | 5.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 46432 | |
ASCII | 4004 | 7.9% |
CJK | 357 | 0.7% |
None | 11 | < 0.1% |
Compat Jamo | 6 | < 0.1% |
Geometric Shapes | 1 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
사 | 2807 | 6.0% |
구 | 1490 | 3.2% |
판 | 1470 | 3.2% |
출 | 1470 | 3.2% |
문 | 1289 | 2.8% |
시 | 1045 | 2.3% |
대 | 998 | 2.1% |
서 | 798 | 1.7% |
원 | 779 | 1.7% |
스 | 776 | 1.7% |
Other values (586) | 33510 |
ASCII
Value | Count | Frequency (%) |
1236 | ||
) | 703 | |
( | 703 | |
. | 125 | 3.1% |
o | 89 | 2.2% |
1 | 88 | 2.2% |
2 | 77 | 1.9% |
B | 70 | 1.7% |
s | 44 | 1.1% |
n | 34 | 0.8% |
Other values (63) | 835 |
CJK
Value | Count | Frequency (%) |
社 | 55 | 15.4% |
文 | 36 | 10.1% |
出 | 30 | 8.4% |
版 | 29 | 8.1% |
徽 | 12 | 3.4% |
學 | 11 | 3.1% |
徹 | 9 | 2.5% |
日 | 7 | 2.0% |
報 | 6 | 1.7% |
國 | 6 | 1.7% |
Other values (89) | 156 |
None
Value | Count | Frequency (%) |
· | 7 | |
& | 4 |
Compat Jamo
Value | Count | Frequency (%) |
ㄴ | 2 | |
ㅊ | 1 | |
ㅁ | 1 | |
ㄱ | 1 | |
ㅇ | 1 |
Geometric Shapes
Value | Count | Frequency (%) |
▶ | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
女 | 1 |
발행연도
Text
Distinct | 57 |
---|---|
Distinct (%) | 0.6% |
Missing | 28 |
Missing (%) | 0.3% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
1992 | 1051 | 10.5% |
1994 | 619 | 6.2% |
1993 | 545 | 5.5% |
2010 | 505 | 5.1% |
2011 | 436 | 4.4% |
2013 | 434 | 4.4% |
1991 | 433 | 4.3% |
2012 | 425 | 4.3% |
1995 | 414 | 4.2% |
2009 | 375 | 3.8% |
Other values (48) | 4737 |
Most occurring characters
Value | Count | Frequency (%) |
9 | 9346 | |
0 | 8809 | |
1 | 8533 | |
2 | 7166 | |
3 | 1279 | 3.2% |
4 | 1217 | 3.0% |
8 | 1049 | 2.6% |
5 | 923 | 2.3% |
6 | 822 | 2.1% |
7 | 756 | 1.9% |
Other values (4) | 8 | < 0.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 39900 | |
Open Punctuation | 2 | < 0.1% |
Space Separator | 2 | < 0.1% |
Other Letter | 2 | < 0.1% |
Close Punctuation | 2 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
9 | 9346 | |
0 | 8809 | |
1 | 8533 | |
2 | 7166 | |
3 | 1279 | 3.2% |
4 | 1217 | 3.1% |
8 | 1049 | 2.6% |
5 | 923 | 2.3% |
6 | 822 | 2.1% |
7 | 756 | 1.9% |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Space Separator
Value | Count | Frequency (%) |
2 |
Other Letter
Value | Count | Frequency (%) |
쇄 | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 39906 | |
Hangul | 2 | < 0.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
9 | 9346 | |
0 | 8809 | |
1 | 8533 | |
2 | 7166 | |
3 | 1279 | 3.2% |
4 | 1217 | 3.0% |
8 | 1049 | 2.6% |
5 | 923 | 2.3% |
6 | 822 | 2.1% |
7 | 756 | 1.9% |
Other values (3) | 6 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
쇄 | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 39906 | |
Hangul | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
9 | 9346 | |
0 | 8809 | |
1 | 8533 | |
2 | 7166 | |
3 | 1279 | 3.2% |
4 | 1217 | 3.0% |
8 | 1049 | 2.6% |
5 | 923 | 2.3% |
6 | 822 | 2.1% |
7 | 756 | 1.9% |
Other values (3) | 6 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
쇄 | 2 |
데이터기준일자
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2020-10-13 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2020-10-13 |
---|---|
2nd row | 2020-10-13 |
3rd row | 2020-10-13 |
4th row | 2020-10-13 |
5th row | 2020-10-13 |
Common Values
Value | Count | Frequency (%) |
2020-10-13 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2020-10-13 | 10000 |
도서명 | 저자 | 출판사 | 발행연도 | 데이터기준일자 | |
---|---|---|---|---|---|
5579 | 명품도시를 만드는 열정 | 박문하 | 단풍나무 | 2008 | 2020-10-13 |
14117 | 쥬라기공원.2 | 마이클 크리튼 지음; 정영목 옮김 | 김영사 | 1992 | 2020-10-13 |
12844 | 허와 실의 인간학 (지략편) | 이병주 편저 | 중앙미디어 | 1992 | 2020-10-13 |
5026 | 곰스크로 가는 기차 | 프리츠 오르트만 지음 | 북인더갭 | 2010 | 2020-10-13 |
4834 | 서울을 디자인한다 | 권영걸 | 디자인하우스 | 2010 | 2020-10-13 |
9626 | (2005년도)대구경북지역 경제연보 | 한국은행 대구경북본부 편 | 한국은행 대구경북본부 | 2006 | 2020-10-13 |
16538 | 부적.3 | 스테판 킹; 피터 스트로브 공저; 정성호 옮김 | 밝은세상 | 1992 | 2020-10-13 |
5008 | 광고천재 이제석 | 이제석 지음 | 학고재 | 2011 | 2020-10-13 |
14490 | 인샬라.하 | 권현숙 지음 | 한겨레신문사 | 1995 | 2020-10-13 |
2563 | 누구보다 축구전문가가 되고싶다 | 시미즈 히데토 지음 | 브레인스토어 | 2014 | 2020-10-13 |
도서명 | 저자 | 출판사 | 발행연도 | 데이터기준일자 | |
---|---|---|---|---|---|
11305 | 술.2; 한국의 술문화 | 이상희 지음 | 선 | 2009 | 2020-10-13 |
18532 | (THANK YOU POWER 0.3초의 기적)감사의 힘 | 데보라 노빌 지음; 김용남 옮김; | 위드덤하우스 | 2009 | 2020-10-13 |
18249 | 그래서 그들은 바다로 갔다 2 | 그리샴 존; 공경희 옮김 ; | 시공사 | 1992 | 2020-10-13 |
8001 | (지방행정혁신 표준매뉴얼)백100% 이해하기 | 대구광역시 편 | 대구광역시 | <NA> | 2020-10-13 |
11759 | 회상 | 헤르만 헤세 지음; 공병억 옮김 | 상아 | 1988 | 2020-10-13 |
12649 | 행정정보체계론 | 하미승 저 | 법문사 | 1999 | 2020-10-13 |
4489 | 몸에 밴 어린 시절 | W. 휴 미실다인 지음 ;이석규;이종범 옮김 | 가톨릭출판사 | 2011 | 2020-10-13 |
17451 | 대망. 18[죽이지 않는 검] | 야마오까 소하찌 지음;박재희 옮김 | 중앙 | 1998 | 2020-10-13 |
3049 | [2012년도] 지역발전계획에 관한 연차보고서 | 지역발전위원회 | 지역발전위원회 지식경제부 | 2013 | 2020-10-13 |
9190 | (이원복 교수의) 와인의 세계. 세계의 와인 | 이원복 지음 | 김영사 | 2008 | 2020-10-13 |
Most frequently occurring
도서명 | 저자 | 출판사 | 발행연도 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|
42 | (비평과 소통의 10년)삼촌설 | 설정수 서동훈 지음 | 경북일보 | 2008 | 2020-10-13 | 14 |
566 | 임꺽정 | 이두호 지음 | 프레스빌 | 1995 | 2020-10-13 | 10 |
372 | 사랑이 어떻더니 | 문무학 | 학이사 | 2011 | 2020-10-13 | 5 |
454 | 아침을 열어주는 3분의 지혜 | 용혜원 지음 | 평단문화사 | 2010 | 2020-10-13 | 5 |
35 | (모든 직장인의 로망)좋아하는 일 하면서 먹고살기 | 양병무 지음 | 비전과리더십 | 2009 | 2020-10-13 | 4 |
43 | (사랑의 테마 장편 옴니버스 소설시리즈 1) 금잔화 | 경요 지음; 김은신 옮김 | 홍익출판사 | 1992 | 2020-10-13 | 4 |
51 | (세계는 지금 새로운 리더를 요구한다)리더스 웨이 | 달라이 라마. 라우렌스 판 덴 마위젠베르흐 지음 ; 김승욱 옮김 | 문학동네 | 2009 | 2020-10-13 | 4 |
54 | (소설)강태공. | 대채치 지음;김택원 평역; | 혜서원 | 1991 | 2020-10-13 | 4 |
98 | (이오덕 생활이야기)울면서 하는 숙제 | 이오덕 지음 | 산하 | 1990 | 2020-10-13 | 4 |
135 | Next 민주주의 3.0 | 코리아매니페스토 | 한국매니페스토실천본부 | 2013 | 2020-10-13 | 4 |