Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 6560 |
Missing cells | 333 |
Missing cells (%) | 0.7% |
Duplicate rows | 350 |
Duplicate rows (%) | 5.3% |
Total size in memory | 365.3 KiB |
Average record size in memory | 57.0 B |
Variable types
Text | 3 |
---|---|
Categorical | 2 |
Numeric | 1 |
DateTime | 1 |
Dataset
Description | 한국산업기술기획평가원에서 보유하고 있는 도서 정보(도서명, 도서구분(명), 저자, 출판사, 발행년도, 도서등록일자, 도서위치)를 제공합니다. |
---|---|
Author | 한국산업기술기획평가원 |
URL | https://www.data.go.kr/data/15039776/fileData.do |
도서구분(명) has constant value "" | Constant |
Dataset has 350 (5.3%) duplicate rows | Duplicates |
도서위치 is highly imbalanced (68.2%) | Imbalance |
저자 has 285 (4.3%) missing values | Missing |
Reproduction
Analysis started | 2023-12-11 23:02:22.206769 |
---|---|
Analysis finished | 2023-12-11 23:02:24.031815 |
Duration | 1.83 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
도서명
Text
Distinct | 5866 |
---|---|
Distinct (%) | 89.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.4 KiB |
Length
Max length | 155 |
---|---|
Median length | 122 |
Mean length | 23.452287 |
Min length | 1 |
Characters and Unicode
Total characters | 153847 |
---|---|
Distinct characters | 1210 |
Distinct categories | 15 ? |
Distinct scripts | 6 ? |
Distinct blocks | 10 ? |
Unique
Unique | 5253 ? |
---|---|
Unique (%) | 80.1% |
Sample
1st row | 법전,1993 |
---|---|
2nd row | SPSS/PC+ II |
3rd row | SPSS/PC+ I |
4th row | 90년대의 전자산업비젼 |
5th row | 소법전,1993 |
Value | Count | Frequency (%) |
1021 | 3.5% | |
및 | 276 | 1.0% |
위한 | 245 | 0.8% |
and | 214 | 0.7% |
the | 192 | 0.7% |
of | 178 | 0.6% |
연구 | 140 | 0.5% |
관한 | 104 | 0.4% |
technology | 102 | 0.4% |
전략 | 90 | 0.3% |
Other values (11888) | 26478 |
Most occurring characters
Value | Count | Frequency (%) |
22600 | 14.7% | |
0 | 3557 | 2.3% |
기 | 2976 | 1.9% |
2 | 2490 | 1.6% |
e | 2486 | 1.6% |
n | 2108 | 1.4% |
o | 1944 | 1.3% |
업 | 1939 | 1.3% |
a | 1779 | 1.2% |
의 | 1766 | 1.1% |
Other values (1200) | 110202 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 80974 | |
Space Separator | 22600 | 14.7% |
Lowercase Letter | 21024 | 13.7% |
Uppercase Letter | 10868 | 7.1% |
Decimal Number | 10232 | 6.7% |
Other Punctuation | 3522 | 2.3% |
Open Punctuation | 1667 | 1.1% |
Close Punctuation | 1664 | 1.1% |
Dash Punctuation | 896 | 0.6% |
Math Symbol | 279 | 0.2% |
Other values (5) | 121 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 2976 | 3.7% |
업 | 1939 | 2.4% |
의 | 1766 | 2.2% |
사 | 1717 | 2.1% |
술 | 1411 | 1.7% |
지 | 1314 | 1.6% |
한 | 1257 | 1.6% |
전 | 1235 | 1.5% |
과 | 1133 | 1.4% |
이 | 1111 | 1.4% |
Other values (1094) | 65115 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 2486 | |
n | 2108 | |
o | 1944 | 9.2% |
a | 1779 | 8.5% |
i | 1704 | 8.1% |
t | 1611 | 7.7% |
r | 1410 | 6.7% |
s | 1218 | 5.8% |
c | 924 | 4.4% |
l | 868 | 4.1% |
Other values (16) | 4972 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 1034 | 9.5% |
T | 903 | 8.3% |
E | 883 | 8.1% |
S | 797 | 7.3% |
A | 790 | 7.3% |
O | 729 | 6.7% |
C | 691 | 6.4% |
R | 680 | 6.3% |
N | 614 | 5.6% |
D | 494 | 4.5% |
Other values (16) | 3253 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1124 | |
: | 991 | |
, | 518 | |
; | 263 | 7.5% |
/ | 257 | 7.3% |
& | 142 | 4.0% |
' | 69 | 2.0% |
· | 47 | 1.3% |
? | 38 | 1.1% |
! | 33 | 0.9% |
Other values (5) | 40 | 1.1% |
Decimal Number
Value | Count | Frequency (%) |
0 | 3557 | |
2 | 2490 | |
1 | 1446 | |
9 | 588 | 5.7% |
3 | 530 | 5.2% |
4 | 402 | 3.9% |
5 | 397 | 3.9% |
6 | 306 | 3.0% |
7 | 267 | 2.6% |
8 | 249 | 2.4% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 29 | |
Ⅰ | 26 | |
Ⅲ | 15 | |
Ⅳ | 11 | 10.8% |
Ⅴ | 6 | 5.9% |
Ⅹ | 4 | 3.9% |
Ⅵ | 3 | 2.9% |
Ⅷ | 3 | 2.9% |
Ⅸ | 3 | 2.9% |
Ⅶ | 2 | 2.0% |
Math Symbol
Value | Count | Frequency (%) |
= | 172 | |
~ | 75 | |
+ | 21 | 7.5% |
< | 4 | 1.4% |
> | 4 | 1.4% |
| | 3 | 1.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1604 | |
[ | 60 | 3.6% |
「 | 3 | 0.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1602 | |
] | 59 | 3.5% |
」 | 3 | 0.2% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 895 | |
- | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
22600 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 11 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 4 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 3 |
Other Number
Value | Count | Frequency (%) |
₂ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 80581 | |
Common | 40879 | |
Latin | 31994 | 20.8% |
Han | 338 | 0.2% |
Hiragana | 41 | < 0.1% |
Katakana | 14 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 2976 | 3.7% |
업 | 1939 | 2.4% |
의 | 1766 | 2.2% |
사 | 1717 | 2.1% |
술 | 1411 | 1.8% |
지 | 1314 | 1.6% |
한 | 1257 | 1.6% |
전 | 1235 | 1.5% |
과 | 1133 | 1.4% |
이 | 1111 | 1.4% |
Other values (893) | 64722 |
Han
Value | Count | Frequency (%) |
國 | 14 | 4.1% |
上 | 13 | 3.8% |
下 | 13 | 3.8% |
中 | 11 | 3.3% |
學 | 11 | 3.3% |
新 | 10 | 3.0% |
韓 | 9 | 2.7% |
大 | 7 | 2.1% |
工 | 6 | 1.8% |
術 | 5 | 1.5% |
Other values (155) | 239 |
Latin
Value | Count | Frequency (%) |
e | 2486 | 7.8% |
n | 2108 | 6.6% |
o | 1944 | 6.1% |
a | 1779 | 5.6% |
i | 1704 | 5.3% |
t | 1611 | 5.0% |
r | 1410 | 4.4% |
s | 1218 | 3.8% |
I | 1034 | 3.2% |
c | 924 | 2.9% |
Other values (52) | 15776 |
Common
Value | Count | Frequency (%) |
22600 | ||
0 | 3557 | 8.7% |
2 | 2490 | 6.1% |
( | 1604 | 3.9% |
) | 1602 | 3.9% |
1 | 1446 | 3.5% |
. | 1124 | 2.7% |
: | 991 | 2.4% |
- | 895 | 2.2% |
9 | 588 | 1.4% |
Other values (34) | 3982 | 9.7% |
Hiragana
Value | Count | Frequency (%) |
の | 6 | |
き | 4 | 9.8% |
か | 3 | 7.3% |
と | 2 | 4.9% |
る | 2 | 4.9% |
い | 2 | 4.9% |
な | 2 | 4.9% |
ま | 2 | 4.9% |
で | 2 | 4.9% |
く | 2 | 4.9% |
Other values (14) | 14 |
Katakana
Value | Count | Frequency (%) |
リ | 2 | |
カ | 2 | |
ク | 1 | |
ッ | 1 | |
チ | 1 | |
ス | 1 | |
ラ | 1 | |
プ | 1 | |
メ | 1 | |
ア | 1 | |
Other values (2) | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 80514 | |
ASCII | 72707 | |
CJK | 332 | 0.2% |
Number Forms | 102 | 0.1% |
Compat Jamo | 67 | < 0.1% |
None | 60 | < 0.1% |
Hiragana | 41 | < 0.1% |
Katakana | 14 | < 0.1% |
CJK Compat Ideographs | 6 | < 0.1% |
Punctuation | 4 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
22600 | ||
0 | 3557 | 4.9% |
2 | 2490 | 3.4% |
e | 2486 | 3.4% |
n | 2108 | 2.9% |
o | 1944 | 2.7% |
a | 1779 | 2.4% |
i | 1704 | 2.3% |
t | 1611 | 2.2% |
( | 1604 | 2.2% |
Other values (79) | 30824 |
Hangul
Value | Count | Frequency (%) |
기 | 2976 | 3.7% |
업 | 1939 | 2.4% |
의 | 1766 | 2.2% |
사 | 1717 | 2.1% |
술 | 1411 | 1.8% |
지 | 1314 | 1.6% |
한 | 1257 | 1.6% |
전 | 1235 | 1.5% |
과 | 1133 | 1.4% |
이 | 1111 | 1.4% |
Other values (892) | 64655 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 67 |
None
Value | Count | Frequency (%) |
· | 47 | |
& | 5 | 8.3% |
「 | 3 | 5.0% |
」 | 3 | 5.0% |
- | 1 | 1.7% |
₂ | 1 | 1.7% |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 29 | |
Ⅰ | 26 | |
Ⅲ | 15 | |
Ⅳ | 11 | 10.8% |
Ⅴ | 6 | 5.9% |
Ⅹ | 4 | 3.9% |
Ⅵ | 3 | 2.9% |
Ⅷ | 3 | 2.9% |
Ⅸ | 3 | 2.9% |
Ⅶ | 2 | 2.0% |
CJK
Value | Count | Frequency (%) |
國 | 14 | 4.2% |
上 | 13 | 3.9% |
下 | 13 | 3.9% |
中 | 11 | 3.3% |
學 | 11 | 3.3% |
新 | 10 | 3.0% |
韓 | 9 | 2.7% |
大 | 7 | 2.1% |
工 | 6 | 1.8% |
術 | 5 | 1.5% |
Other values (152) | 233 |
Hiragana
Value | Count | Frequency (%) |
の | 6 | |
き | 4 | 9.8% |
か | 3 | 7.3% |
と | 2 | 4.9% |
る | 2 | 4.9% |
い | 2 | 4.9% |
な | 2 | 4.9% |
ま | 2 | 4.9% |
で | 2 | 4.9% |
く | 2 | 4.9% |
Other values (14) | 14 |
Punctuation
Value | Count | Frequency (%) |
’ | 4 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
勞 | 3 | |
論 | 2 | |
連 | 1 | 16.7% |
Katakana
Value | Count | Frequency (%) |
リ | 2 | |
カ | 2 | |
ク | 1 | |
ッ | 1 | |
チ | 1 | |
ス | 1 | |
ラ | 1 | |
プ | 1 | |
メ | 1 | |
ア | 1 | |
Other values (2) | 2 |
도서구분(명)
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.4 KiB |
단행본 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 단행본 |
---|---|
2nd row | 단행본 |
3rd row | 단행본 |
4th row | 단행본 |
5th row | 단행본 |
Common Values
Value | Count | Frequency (%) |
단행본 | 6560 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단행본 | 6560 |
저자
Text
MISSING
 
Distinct | 3748 |
---|---|
Distinct (%) | 59.7% |
Missing | 285 |
Missing (%) | 4.3% |
Memory size | 51.4 KiB |
Length
Max length | 77 |
---|---|
Median length | 69 |
Mean length | 10.432829 |
Min length | 1 |
Characters and Unicode
Total characters | 65466 |
---|---|
Distinct characters | 804 |
Distinct categories | 10 ? |
Distinct scripts | 5 ? |
Distinct blocks | 7 ? |
Unique
Unique | 2928 ? |
---|---|
Unique (%) | 46.7% |
Sample
1st row | 조상원 편저 |
---|---|
2nd row | 이용구,원태연,정성원 공저 |
3rd row | 이용구,원태연,정성원 공저 |
4th row | 신용태 편저 |
5th row | 신용태 편저 |
Value | Count | Frequency (%) |
지음 | 244 | 2.1% |
한국산업기술평가원 | 220 | 1.9% |
저 | 206 | 1.8% |
옮김 | 200 | 1.7% |
외 | 163 | 1.4% |
152 | 1.3% | |
편 | 129 | 1.1% |
by | 117 | 1.0% |
산업자원부 | 103 | 0.9% |
공저 | 92 | 0.8% |
Other values (5441) | 10091 |
Most occurring characters
Value | Count | Frequency (%) |
5482 | 8.4% | |
/ | 1619 | 2.5% |
, | 1555 | 2.4% |
기 | 1519 | 2.3% |
원 | 1469 | 2.2% |
국 | 1415 | 2.2% |
한 | 1380 | 2.1% |
김 | 1159 | 1.8% |
업 | 1149 | 1.8% |
이 | 1093 | 1.7% |
Other values (794) | 47626 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 45814 | |
Space Separator | 5482 | 8.4% |
Lowercase Letter | 5299 | 8.1% |
Other Punctuation | 4170 | 6.4% |
Uppercase Letter | 4003 | 6.1% |
Open Punctuation | 274 | 0.4% |
Close Punctuation | 271 | 0.4% |
Decimal Number | 124 | 0.2% |
Dash Punctuation | 27 | < 0.1% |
Math Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 1519 | 3.3% |
원 | 1469 | 3.2% |
국 | 1415 | 3.1% |
한 | 1380 | 3.0% |
김 | 1159 | 2.5% |
업 | 1149 | 2.5% |
이 | 1093 | 2.4% |
산 | 1065 | 2.3% |
술 | 1000 | 2.2% |
정 | 765 | 1.7% |
Other values (717) | 33800 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 673 | |
a | 552 | |
n | 478 | 9.0% |
i | 431 | 8.1% |
o | 425 | 8.0% |
r | 422 | 8.0% |
l | 301 | 5.7% |
t | 298 | 5.6% |
s | 234 | 4.4% |
h | 212 | 4.0% |
Other values (17) | 1273 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 363 | 9.1% |
E | 314 | 7.8% |
R | 302 | 7.5% |
S | 265 | 6.6% |
C | 220 | 5.5% |
I | 215 | 5.4% |
T | 209 | 5.2% |
B | 198 | 4.9% |
L | 196 | 4.9% |
O | 193 | 4.8% |
Other values (16) | 1528 |
Decimal Number
Value | Count | Frequency (%) |
2 | 31 | |
1 | 28 | |
0 | 22 | |
7 | 11 | 8.9% |
3 | 9 | 7.3% |
6 | 8 | 6.5% |
8 | 7 | 5.6% |
4 | 5 | 4.0% |
5 | 3 | 2.4% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 1619 | |
, | 1555 | |
. | 738 | |
; | 144 | 3.5% |
& | 74 | 1.8% |
: | 24 | 0.6% |
· | 14 | 0.3% |
' | 2 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 197 | |
[ | 77 | 28.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 193 | |
] | 78 |
Space Separator
Value | Count | Frequency (%) |
5482 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 27 |
Math Symbol
Value | Count | Frequency (%) |
= | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 45706 | |
Common | 10350 | 15.8% |
Latin | 9302 | 14.2% |
Han | 103 | 0.2% |
Hiragana | 5 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 1519 | 3.3% |
원 | 1469 | 3.2% |
국 | 1415 | 3.1% |
한 | 1380 | 3.0% |
김 | 1159 | 2.5% |
업 | 1149 | 2.5% |
이 | 1093 | 2.4% |
산 | 1065 | 2.3% |
술 | 1000 | 2.2% |
정 | 765 | 1.7% |
Other values (645) | 33692 |
Han
Value | Count | Frequency (%) |
著 | 16 | 15.5% |
金 | 3 | 2.9% |
共 | 3 | 2.9% |
編 | 3 | 2.9% |
外 | 2 | 1.9% |
院 | 2 | 1.9% |
報 | 2 | 1.9% |
情 | 2 | 1.9% |
國 | 2 | 1.9% |
韓 | 2 | 1.9% |
Other values (58) | 66 |
Latin
Value | Count | Frequency (%) |
e | 673 | 7.2% |
a | 552 | 5.9% |
n | 478 | 5.1% |
i | 431 | 4.6% |
o | 425 | 4.6% |
r | 422 | 4.5% |
A | 363 | 3.9% |
E | 314 | 3.4% |
R | 302 | 3.2% |
l | 301 | 3.2% |
Other values (43) | 5041 |
Common
Value | Count | Frequency (%) |
5482 | ||
/ | 1619 | 15.6% |
, | 1555 | 15.0% |
. | 738 | 7.1% |
( | 197 | 1.9% |
) | 193 | 1.9% |
; | 144 | 1.4% |
] | 78 | 0.8% |
[ | 77 | 0.7% |
& | 74 | 0.7% |
Other values (14) | 193 | 1.9% |
Hiragana
Value | Count | Frequency (%) |
と | 2 | |
り | 1 | |
ま | 1 | |
め | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 45582 | |
ASCII | 19637 | |
Compat Jamo | 124 | 0.2% |
CJK | 102 | 0.2% |
None | 15 | < 0.1% |
Hiragana | 5 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
5482 | ||
/ | 1619 | 8.2% |
, | 1555 | 7.9% |
. | 738 | 3.8% |
e | 673 | 3.4% |
a | 552 | 2.8% |
n | 478 | 2.4% |
i | 431 | 2.2% |
o | 425 | 2.2% |
r | 422 | 2.1% |
Other values (65) | 7262 |
Hangul
Value | Count | Frequency (%) |
기 | 1519 | 3.3% |
원 | 1469 | 3.2% |
국 | 1415 | 3.1% |
한 | 1380 | 3.0% |
김 | 1159 | 2.5% |
업 | 1149 | 2.5% |
이 | 1093 | 2.4% |
산 | 1065 | 2.3% |
술 | 1000 | 2.2% |
정 | 765 | 1.7% |
Other values (643) | 33568 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 123 | |
ㄱ | 1 | 0.8% |
CJK
Value | Count | Frequency (%) |
著 | 16 | 15.7% |
金 | 3 | 2.9% |
共 | 3 | 2.9% |
編 | 3 | 2.9% |
外 | 2 | 2.0% |
院 | 2 | 2.0% |
報 | 2 | 2.0% |
情 | 2 | 2.0% |
國 | 2 | 2.0% |
韓 | 2 | 2.0% |
Other values (57) | 65 |
None
Value | Count | Frequency (%) |
· | 14 | |
ø | 1 | 6.7% |
Hiragana
Value | Count | Frequency (%) |
と | 2 | |
り | 1 | |
ま | 1 | |
め | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
論 | 1 |
출판사
Text
Distinct | 1957 |
---|---|
Distinct (%) | 29.8% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 51.4 KiB |
Value | Count | Frequency (%) |
한국산업기술평가원 | 210 | 2.8% |
한국과학기술정보연구원(kisti | 178 | 2.4% |
산업자원부 | 145 | 1.9% |
한국산업기술재단 | 125 | 1.7% |
한국산업기술평가관리원 | 104 | 1.4% |
특허청 | 103 | 1.4% |
한국산업기술평가원(itep | 92 | 1.2% |
산업연구원 | 87 | 1.2% |
매일경제신문사 | 66 | 0.9% |
press | 63 | 0.8% |
Other values (2013) | 6336 |
Most occurring characters
Value | Count | Frequency (%) |
기 | 1932 | 3.9% |
한 | 1918 | 3.8% |
원 | 1881 | 3.8% |
국 | 1864 | 3.7% |
술 | 1497 | 3.0% |
업 | 1390 | 2.8% |
산 | 1320 | 2.6% |
연 | 988 | 2.0% |
사 | 984 | 2.0% |
962 | 1.9% | |
Other values (623) | 35336 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 39463 | |
Uppercase Letter | 4867 | 9.7% |
Lowercase Letter | 2943 | 5.9% |
Space Separator | 962 | 1.9% |
Open Punctuation | 591 | 1.2% |
Close Punctuation | 590 | 1.2% |
Other Punctuation | 424 | 0.8% |
Decimal Number | 205 | 0.4% |
Dash Punctuation | 27 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 1932 | 4.9% |
한 | 1918 | 4.9% |
원 | 1881 | 4.8% |
국 | 1864 | 4.7% |
술 | 1497 | 3.8% |
업 | 1390 | 3.5% |
산 | 1320 | 3.3% |
연 | 988 | 2.5% |
사 | 984 | 2.5% |
구 | 917 | 2.3% |
Other values (548) | 24772 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 799 | |
S | 543 | |
T | 539 | |
E | 481 | |
P | 358 | 7.4% |
K | 324 | 6.7% |
A | 291 | 6.0% |
R | 236 | 4.8% |
C | 185 | 3.8% |
O | 177 | 3.6% |
Other values (16) | 934 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 354 | |
n | 263 | |
i | 255 | 8.7% |
a | 243 | 8.3% |
r | 237 | 8.1% |
s | 218 | 7.4% |
o | 213 | 7.2% |
l | 188 | 6.4% |
t | 176 | 6.0% |
c | 142 | 4.8% |
Other values (16) | 654 |
Decimal Number
Value | Count | Frequency (%) |
1 | 81 | |
2 | 68 | |
4 | 14 | 6.8% |
3 | 10 | 4.9% |
6 | 8 | 3.9% |
0 | 8 | 3.9% |
7 | 7 | 3.4% |
8 | 5 | 2.4% |
9 | 2 | 1.0% |
5 | 2 | 1.0% |
Other Punctuation
Value | Count | Frequency (%) |
, | 141 | |
/ | 125 | |
. | 81 | |
& | 65 | |
' | 5 | 1.2% |
; | 5 | 1.2% |
: | 2 | 0.5% |
Open Punctuation
Value | Count | Frequency (%) |
( | 589 | |
[ | 2 | 0.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 588 | |
] | 2 | 0.3% |
Space Separator
Value | Count | Frequency (%) |
962 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 27 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 39355 | |
Latin | 7810 | 15.6% |
Common | 2799 | 5.6% |
Han | 103 | 0.2% |
Katakana | 5 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 1932 | 4.9% |
한 | 1918 | 4.9% |
원 | 1881 | 4.8% |
국 | 1864 | 4.7% |
술 | 1497 | 3.8% |
업 | 1390 | 3.5% |
산 | 1320 | 3.4% |
연 | 988 | 2.5% |
사 | 984 | 2.5% |
구 | 917 | 2.3% |
Other values (500) | 24664 |
Latin
Value | Count | Frequency (%) |
I | 799 | 10.2% |
S | 543 | 7.0% |
T | 539 | 6.9% |
E | 481 | 6.2% |
P | 358 | 4.6% |
e | 354 | 4.5% |
K | 324 | 4.1% |
A | 291 | 3.7% |
n | 263 | 3.4% |
i | 255 | 3.3% |
Other values (42) | 3603 |
Han
Value | Count | Frequency (%) |
社 | 19 | |
英 | 11 | 10.7% |
博 | 8 | 7.8% |
文 | 5 | 4.9% |
經 | 4 | 3.9% |
國 | 3 | 2.9% |
韓 | 3 | 2.9% |
究 | 3 | 2.9% |
硏 | 3 | 2.9% |
院 | 3 | 2.9% |
Other values (33) | 41 |
Common
Value | Count | Frequency (%) |
962 | ||
( | 589 | |
) | 588 | |
, | 141 | 5.0% |
/ | 125 | 4.5% |
1 | 81 | 2.9% |
. | 81 | 2.9% |
2 | 68 | 2.4% |
& | 65 | 2.3% |
- | 27 | 1.0% |
Other values (13) | 72 | 2.6% |
Katakana
Value | Count | Frequency (%) |
ト | 1 | |
ク | 1 | |
ペ | 1 | |
ス | 1 | |
ア | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 39338 | |
ASCII | 10609 | 21.2% |
CJK | 103 | 0.2% |
Compat Jamo | 17 | < 0.1% |
Katakana | 5 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
기 | 1932 | 4.9% |
한 | 1918 | 4.9% |
원 | 1881 | 4.8% |
국 | 1864 | 4.7% |
술 | 1497 | 3.8% |
업 | 1390 | 3.5% |
산 | 1320 | 3.4% |
연 | 988 | 2.5% |
사 | 984 | 2.5% |
구 | 917 | 2.3% |
Other values (499) | 24647 |
ASCII
Value | Count | Frequency (%) |
962 | 9.1% | |
I | 799 | 7.5% |
( | 589 | 5.6% |
) | 588 | 5.5% |
S | 543 | 5.1% |
T | 539 | 5.1% |
E | 481 | 4.5% |
P | 358 | 3.4% |
e | 354 | 3.3% |
K | 324 | 3.1% |
Other values (65) | 5072 |
CJK
Value | Count | Frequency (%) |
社 | 19 | |
英 | 11 | 10.7% |
博 | 8 | 7.8% |
文 | 5 | 4.9% |
經 | 4 | 3.9% |
國 | 3 | 2.9% |
韓 | 3 | 2.9% |
究 | 3 | 2.9% |
硏 | 3 | 2.9% |
院 | 3 | 2.9% |
Other values (33) | 41 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 17 |
Katakana
Value | Count | Frequency (%) |
ト | 1 | |
ク | 1 | |
ペ | 1 | |
ス | 1 | |
ア | 1 |
발행년도
Real number (ℝ)
Distinct | 42 |
---|---|
Distinct (%) | 0.6% |
Missing | 47 |
Missing (%) | 0.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2007.0969 |
Minimum | 1976 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 57.8 KiB |
Quantile statistics
Minimum | 1976 |
---|---|
5-th percentile | 1995 |
Q1 | 2002 |
median | 2006 |
Q3 | 2013 |
95-th percentile | 2021 |
Maximum | 2023 |
Range | 47 |
Interquartile range (IQR) | 11 |
Descriptive statistics
Standard deviation | 7.9915867 |
---|---|
Coefficient of variation (CV) | 0.0039816647 |
Kurtosis | -0.63996945 |
Mean | 2007.0969 |
Median Absolute Deviation (MAD) | 5 |
Skewness | 0.17819647 |
Sum | 13072222 |
Variance | 63.865459 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2004 | 510 | 7.8% |
2005 | 375 | 5.7% |
2002 | 353 | 5.4% |
2000 | 342 | 5.2% |
2020 | 341 | 5.2% |
2003 | 329 | 5.0% |
2006 | 321 | 4.9% |
2001 | 320 | 4.9% |
2008 | 297 | 4.5% |
2007 | 295 | 4.5% |
Other values (32) | 3030 |
Value | Count | Frequency (%) |
1976 | 1 | < 0.1% |
1979 | 1 | < 0.1% |
1983 | 1 | < 0.1% |
1985 | 5 | 0.1% |
1986 | 2 | < 0.1% |
1987 | 3 | < 0.1% |
1988 | 3 | < 0.1% |
1989 | 11 | 0.2% |
1990 | 16 | |
1991 | 37 |
Value | Count | Frequency (%) |
2023 | 41 | 0.6% |
2022 | 65 | 1.0% |
2021 | 293 | |
2020 | 341 | |
2019 | 256 | |
2018 | 91 | 1.4% |
2017 | 52 | 0.8% |
2016 | 72 | 1.1% |
2015 | 99 | 1.5% |
2014 | 106 | 1.6% |
도서등록일자
Date
Distinct | 1560 |
---|---|
Distinct (%) | 23.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.4 KiB |
Minimum | 1993-07-13 00:00:00 |
---|---|
Maximum | 2023-08-02 00:00:00 |
도서위치
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.4 KiB |
대구본원 | |
---|---|
북카페 | |
대전분원 | 151 |
자료실 | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8969512 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대구본원 |
---|---|
2nd row | 대구본원 |
3rd row | 대구본원 |
4th row | 대구본원 |
5th row | 대구본원 |
Common Values
Value | Count | Frequency (%) |
대구본원 | 5733 | |
북카페 | 674 | 10.3% |
대전분원 | 151 | 2.3% |
자료실 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대구본원 | 5733 | |
북카페 | 674 | 10.3% |
대전분원 | 151 | 2.3% |
자료실 | 2 | < 0.1% |
발행년도 | 도서위치 | |
---|---|---|
발행년도 | 1.000 | 0.672 |
도서위치 | 0.672 | 1.000 |
발행년도 | 도서위치 | |
---|---|---|
발행년도 | 1.000 | 0.472 |
도서위치 | 0.472 | 1.000 |
도서명 | 도서구분(명) | 저자 | 출판사 | 발행년도 | 도서등록일자 | 도서위치 | |
---|---|---|---|---|---|---|---|
0 | 법전,1993 | 단행본 | 조상원 편저 | 현암사 | 1993 | 1993-07-13 | 대구본원 |
1 | SPSS/PC+ II | 단행본 | 이용구,원태연,정성원 공저 | 자유아카데미 | 1991 | 1993-09-16 | 대구본원 |
2 | SPSS/PC+ I | 단행본 | 이용구,원태연,정성원 공저 | 자유아카데미 | 1991 | 1993-09-16 | 대구본원 |
3 | 90년대의 전자산업비젼 | 단행본 | <NA> | 통상산업성전자기기과 | 1989 | 1993-10-11 | 대구본원 |
4 | 소법전,1993 | 단행본 | <NA> | 법전출판사 | 1993 | 1993-11-12 | 대구본원 |
5 | 일본어한자읽기사전 | 단행본 | 신용태 편저 | 해문출판사 | 1992 | 1993-11-12 | 대구본원 |
6 | 일본어한자읽기사전 | 단행본 | 신용태 편저 | 해문출판사 | 1992 | 1993-11-12 | 대구본원 |
7 | 10년후 일본의 선진기술시장 | 단행본 | 청유전 저 | 다이아몬드사 | 1992 | 1993-11-12 | 대구본원 |
8 | 일본의 오리지널기술 아메리카에 공포한다 | 단행본 | 소림기흥 저 | 조도전출판 | 1990 | 1993-11-12 | 대구본원 |
9 | 산업과학기술의 동향과 과제 | 단행본 | <NA> | 통상산업성 | 1992 | 1993-11-26 | 대구본원 |
도서명 | 도서구분(명) | 저자 | 출판사 | 발행년도 | 도서등록일자 | 도서위치 | |
---|---|---|---|---|---|---|---|
6550 | 128호실의 원고 | 단행본 | 카티 보니당 | 한스미디어 | 2020 | 2023-07-21 | 북카페 |
6551 | 일의 격 | 단행본 | 신수정 | 턴어라운드 | 2021 | 2023-07-21 | 북카페 |
6552 | 거인의 어깨 위에서 | 단행본 | 선우휘 외 | 조선뉴스프레스 | 2023 | 2023-07-21 | 북카페 |
6553 | 세이노의 가르침 | 단행본 | 세이노 | 데이원 | 2023 | 2023-07-21 | 대전분원 |
6554 | 카구야 프로젝트 | 단행본 | 원샨 | 아작 | 2020 | 2023-07-21 | 북카페 |
6555 | 과학이 필요한 시간 : 빅뱅에서 다중우주로 가는 초광속 초밀착 길 안내서 | 단행본 | 궤도 | 동아시아 | 2022 | 2023-07-21 | 북카페 |
6556 | 소르본 철학 수업 | 단행본 | 전진 | 나무의철학 | 2020 | 2023-07-21 | 북카페 |
6557 | 세계를 품다 2023 | 단행본 | 글로벌 리더 선정자 22인 | 매일경제신문사 | 2023 | 2023-07-21 | 북카페 |
6558 | ESS사업 아는 만큼 성공한다 | 단행본 | 최동배 | 산경E뉴스신문사 | 2023 | 2023-08-02 | 북카페 |
6559 | ESS사업 아는 만큼 성공한다 | 단행본 | 최동배 | 산경E뉴스신문사 | 2023 | 2023-08-02 | 북카페 |
Most frequently occurring
도서명 | 도서구분(명) | 저자 | 출판사 | 발행년도 | 도서등록일자 | 도서위치 | # duplicates | |
---|---|---|---|---|---|---|---|---|
110 | Turning Points : GLOBAL AGENDA 2018 | 단행본 | 뉴스1 | 뉴스1 | 2018 | 2018-03-12 | 대구본원 | 10 |
230 | 산업집적의 공간구조와 지역혁신 거버넌스 | 단행본 | 정준호,김선배,변창욱 공저 | 산업연구원 | 2004 | 2007-03-26 | 대구본원 | 8 |
94 | High-Office Program : 2007 Microsoft Office System | 단행본 | 한국마이크로소프트(유) | 한국마이크로소프트(유) | 2007 | 2007-10-31 | 대구본원 | 5 |
153 | 김대중 대통령의 시스템 사고 | 단행본 | 김동환 | 집문당 | 2000 | 2018-02-12 | 대구본원 | 5 |
157 | 나를 성장시키는 생각의 기술 | 단행본 | 이창후 | 소울메이트 | 2011 | 2018-02-13 | 대구본원 | 5 |
160 | 논리적 사고와 글쓰기 | 단행본 | 가톨릭관동대학교 글쓰기 교재 편찬위원회 | 경진출판 | 2017 | 2018-02-13 | 대구본원 | 5 |
173 | 디베이트와 논리적 사고 | 단행본 | Dr.Z | 성숙한삶 | 2013 | 2018-02-12 | 대구본원 | 5 |
1 | (11가지 질문도구의)비판적 사고력 연습 | 단행본 | M. 닐 브라운 | 돈키호테 | 2016 | 2018-02-12 | 대구본원 | 4 |
86 | 4차산업 투자지도 | 단행본 | 한국비즈니스정보 | 어바웃어북 | 2017 | 2020-04-28 | 대구본원 | 4 |
325 | 초일류 기업의 합리적 사고력 | 단행본 | 강관수 | 세화 | 2007 | 2018-02-12 | 대구본원 | 4 |