Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 71 |
Missing cells | 1 |
Missing cells (%) | 0.4% |
Duplicate rows | 2 |
Duplicate rows (%) | 2.8% |
Total size in memory | 2.4 KiB |
Average record size in memory | 34.9 B |
Variable types
Text | 3 |
---|---|
Numeric | 1 |
Dataset
Description | 한국장애인고용공단에서 사회공헌활동차원에서 시각장애인들을 위해 음성, 문자, 촉각의 형태로 입력한 시각장애인 음성, 문자, 촉각 도서 목록 데이터 |
---|---|
URL | https://www.data.go.kr/data/15004147/fileData.do |
Dataset has 2 (2.8%) duplicate rows | Duplicates |
출판사 has 1 (1.4%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 14:50:51.172479 |
---|---|
Analysis finished | 2023-12-12 14:50:52.009785 |
Duration | 0.84 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
도서명
Text
Distinct | 68 |
---|---|
Distinct (%) | 95.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
Length
Max length | 26 |
---|---|
Median length | 17 |
Mean length | 9.9295775 |
Min length | 1 |
Characters and Unicode
Total characters | 705 |
---|---|
Distinct characters | 238 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 65 ? |
---|---|
Unique (%) | 91.5% |
Sample
1st row | 시각장애인을 위한 내 힘으로 글쓰기Ⅰ(촉각도서) |
---|---|
2nd row | 어느 날, 내 죽음에 네가 들어왔다 |
3rd row | 기분을 관리하면 인생이 관리된다 |
4th row | 저만치 혼자서 |
5th row | 수호지1 |
Value | Count | Frequency (%) |
불편한 | 3 | 1.5% |
펭귄 | 3 | 1.5% |
기분을 | 2 | 1.0% |
일이 | 2 | 1.0% |
내 | 2 | 1.0% |
나는 | 2 | 1.0% |
삼개주막 | 2 | 1.0% |
관리하면 | 2 | 1.0% |
인 | 2 | 1.0% |
레슨 | 2 | 1.0% |
Other values (169) | 175 |
Most occurring characters
Value | Count | Frequency (%) |
126 | 17.9% | |
다 | 16 | 2.3% |
의 | 15 | 2.1% |
지 | 15 | 2.1% |
리 | 12 | 1.7% |
한 | 11 | 1.6% |
하 | 11 | 1.6% |
는 | 11 | 1.6% |
기 | 9 | 1.3% |
호 | 9 | 1.3% |
Other values (228) | 470 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 546 | |
Space Separator | 126 | 17.9% |
Decimal Number | 19 | 2.7% |
Other Punctuation | 7 | 1.0% |
Uppercase Letter | 4 | 0.6% |
Open Punctuation | 1 | 0.1% |
Close Punctuation | 1 | 0.1% |
Letter Number | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
다 | 16 | 2.9% |
의 | 15 | 2.7% |
지 | 15 | 2.7% |
리 | 12 | 2.2% |
한 | 11 | 2.0% |
하 | 11 | 2.0% |
는 | 11 | 2.0% |
기 | 9 | 1.6% |
호 | 9 | 1.6% |
수 | 9 | 1.6% |
Other values (212) | 428 |
Decimal Number
Value | Count | Frequency (%) |
2 | 6 | |
1 | 5 | |
5 | 2 | 10.5% |
3 | 2 | 10.5% |
8 | 1 | 5.3% |
7 | 1 | 5.3% |
6 | 1 | 5.3% |
4 | 1 | 5.3% |
Uppercase Letter
Value | Count | Frequency (%) |
D | 2 | |
A | 1 | |
H | 1 |
Space Separator
Value | Count | Frequency (%) |
126 |
Other Punctuation
Value | Count | Frequency (%) |
, | 7 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 546 | |
Common | 154 | 21.8% |
Latin | 5 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
다 | 16 | 2.9% |
의 | 15 | 2.7% |
지 | 15 | 2.7% |
리 | 12 | 2.2% |
한 | 11 | 2.0% |
하 | 11 | 2.0% |
는 | 11 | 2.0% |
기 | 9 | 1.6% |
호 | 9 | 1.6% |
수 | 9 | 1.6% |
Other values (212) | 428 |
Common
Value | Count | Frequency (%) |
126 | ||
, | 7 | 4.5% |
2 | 6 | 3.9% |
1 | 5 | 3.2% |
5 | 2 | 1.3% |
3 | 2 | 1.3% |
8 | 1 | 0.6% |
7 | 1 | 0.6% |
6 | 1 | 0.6% |
4 | 1 | 0.6% |
Other values (2) | 2 | 1.3% |
Latin
Value | Count | Frequency (%) |
D | 2 | |
A | 1 | |
H | 1 | |
Ⅰ | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 546 | |
ASCII | 158 | 22.4% |
Number Forms | 1 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
126 | ||
, | 7 | 4.4% |
2 | 6 | 3.8% |
1 | 5 | 3.2% |
D | 2 | 1.3% |
5 | 2 | 1.3% |
3 | 2 | 1.3% |
A | 1 | 0.6% |
H | 1 | 0.6% |
8 | 1 | 0.6% |
Other values (5) | 5 | 3.2% |
Hangul
Value | Count | Frequency (%) |
다 | 16 | 2.9% |
의 | 15 | 2.7% |
지 | 15 | 2.7% |
리 | 12 | 2.2% |
한 | 11 | 2.0% |
하 | 11 | 2.0% |
는 | 11 | 2.0% |
기 | 9 | 1.6% |
호 | 9 | 1.6% |
수 | 9 | 1.6% |
Other values (212) | 428 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 1 |
저자
Text
Distinct | 55 |
---|---|
Distinct (%) | 77.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
Length
Max length | 27 |
---|---|
Median length | 21 |
Mean length | 8.1267606 |
Min length | 2 |
Characters and Unicode
Total characters | 577 |
---|---|
Distinct characters | 156 |
Distinct categories | 4 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 48 ? |
---|---|
Unique (%) | 67.6% |
Sample
1st row | 한국시각장애인엽합회, 한국장애인고용공단 |
---|---|
2nd row | 세이카 료겐, 김윤경 번역 |
3rd row | 김다슬 |
4th row | 김훈 |
5th row | 시내암 저, 이문열 편역 |
Value | Count | Frequency (%) |
저 | 26 | 14.4% |
역 | 18 | 10.0% |
시내암 | 8 | 4.4% |
이문열 | 8 | 4.4% |
편역 | 8 | 4.4% |
김훈 | 4 | 2.2% |
김호연 | 3 | 1.7% |
심연희 | 2 | 1.1% |
코엘료 | 2 | 1.1% |
김다슬 | 2 | 1.1% |
Other values (93) | 99 |
Most occurring characters
Value | Count | Frequency (%) |
109 | 18.9% | |
, | 33 | 5.7% |
저 | 27 | 4.7% |
역 | 27 | 4.7% |
김 | 20 | 3.5% |
이 | 19 | 3.3% |
시 | 10 | 1.7% |
진 | 9 | 1.6% |
암 | 8 | 1.4% |
문 | 8 | 1.4% |
Other values (146) | 307 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 431 | |
Space Separator | 109 | 18.9% |
Other Punctuation | 35 | 6.1% |
Uppercase Letter | 2 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
저 | 27 | 6.3% |
역 | 27 | 6.3% |
김 | 20 | 4.6% |
이 | 19 | 4.4% |
시 | 10 | 2.3% |
진 | 9 | 2.1% |
암 | 8 | 1.9% |
문 | 8 | 1.9% |
열 | 8 | 1.9% |
편 | 8 | 1.9% |
Other values (141) | 287 |
Other Punctuation
Value | Count | Frequency (%) |
, | 33 | |
. | 2 | 5.7% |
Uppercase Letter
Value | Count | Frequency (%) |
D | 1 | |
W | 1 |
Space Separator
Value | Count | Frequency (%) |
109 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 431 | |
Common | 144 | 25.0% |
Latin | 2 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
저 | 27 | 6.3% |
역 | 27 | 6.3% |
김 | 20 | 4.6% |
이 | 19 | 4.4% |
시 | 10 | 2.3% |
진 | 9 | 2.1% |
암 | 8 | 1.9% |
문 | 8 | 1.9% |
열 | 8 | 1.9% |
편 | 8 | 1.9% |
Other values (141) | 287 |
Common
Value | Count | Frequency (%) |
109 | ||
, | 33 | 22.9% |
. | 2 | 1.4% |
Latin
Value | Count | Frequency (%) |
D | 1 | |
W | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 431 | |
ASCII | 146 | 25.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
109 | ||
, | 33 | 22.6% |
. | 2 | 1.4% |
D | 1 | 0.7% |
W | 1 | 0.7% |
Hangul
Value | Count | Frequency (%) |
저 | 27 | 6.3% |
역 | 27 | 6.3% |
김 | 20 | 4.6% |
이 | 19 | 4.4% |
시 | 10 | 2.3% |
진 | 9 | 2.1% |
암 | 8 | 1.9% |
문 | 8 | 1.9% |
열 | 8 | 1.9% |
편 | 8 | 1.9% |
Other values (141) | 287 |
출판사
Text
MISSING
 
Distinct | 46 |
---|---|
Distinct (%) | 65.7% |
Missing | 1 |
Missing (%) | 1.4% |
Memory size | 700.0 B |
Value | Count | Frequency (%) |
알에이치코리아 | 8 | 11.3% |
문학동네 | 7 | 9.9% |
민음사 | 3 | 4.2% |
고즈넉이엔티 | 3 | 4.2% |
나무옆의자 | 3 | 4.2% |
푸른숲 | 2 | 2.8% |
다산책방 | 2 | 2.8% |
김영사 | 2 | 2.8% |
㈜필름 | 2 | 2.8% |
인플루엔셜 | 2 | 2.8% |
Other values (37) | 37 |
Most occurring characters
Value | Count | Frequency (%) |
이 | 12 | 3.8% |
치 | 9 | 2.8% |
리 | 9 | 2.8% |
알 | 8 | 2.5% |
동 | 8 | 2.5% |
스 | 8 | 2.5% |
사 | 8 | 2.5% |
에 | 8 | 2.5% |
네 | 8 | 2.5% |
학 | 8 | 2.5% |
Other values (117) | 234 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 294 | |
Lowercase Letter | 20 | 6.2% |
Other Symbol | 4 | 1.2% |
Uppercase Letter | 1 | 0.3% |
Space Separator | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 12 | 4.1% |
치 | 9 | 3.1% |
리 | 9 | 3.1% |
알 | 8 | 2.7% |
동 | 8 | 2.7% |
스 | 8 | 2.7% |
사 | 8 | 2.7% |
에 | 8 | 2.7% |
네 | 8 | 2.7% |
학 | 8 | 2.7% |
Other values (103) | 208 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 6 | |
b | 2 | 10.0% |
n | 2 | 10.0% |
k | 2 | 10.0% |
i | 2 | 10.0% |
a | 1 | 5.0% |
y | 1 | 5.0% |
m | 1 | 5.0% |
r | 1 | 5.0% |
d | 1 | 5.0% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 4 |
Uppercase Letter
Value | Count | Frequency (%) |
H | 1 |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 298 | |
Latin | 21 | 6.6% |
Common | 1 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 12 | 4.0% |
치 | 9 | 3.0% |
리 | 9 | 3.0% |
알 | 8 | 2.7% |
동 | 8 | 2.7% |
스 | 8 | 2.7% |
사 | 8 | 2.7% |
에 | 8 | 2.7% |
네 | 8 | 2.7% |
학 | 8 | 2.7% |
Other values (104) | 212 |
Latin
Value | Count | Frequency (%) |
o | 6 | |
b | 2 | 9.5% |
n | 2 | 9.5% |
k | 2 | 9.5% |
i | 2 | 9.5% |
a | 1 | 4.8% |
y | 1 | 4.8% |
m | 1 | 4.8% |
r | 1 | 4.8% |
H | 1 | 4.8% |
Other values (2) | 2 | 9.5% |
Common
Value | Count | Frequency (%) |
1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 294 | |
ASCII | 22 | 6.9% |
None | 4 | 1.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
이 | 12 | 4.1% |
치 | 9 | 3.1% |
리 | 9 | 3.1% |
알 | 8 | 2.7% |
동 | 8 | 2.7% |
스 | 8 | 2.7% |
사 | 8 | 2.7% |
에 | 8 | 2.7% |
네 | 8 | 2.7% |
학 | 8 | 2.7% |
Other values (103) | 208 |
ASCII
Value | Count | Frequency (%) |
o | 6 | |
b | 2 | 9.1% |
n | 2 | 9.1% |
k | 2 | 9.1% |
i | 2 | 9.1% |
a | 1 | 4.5% |
y | 1 | 4.5% |
m | 1 | 4.5% |
r | 1 | 4.5% |
H | 1 | 4.5% |
Other values (3) | 3 |
None
Value | Count | Frequency (%) |
㈜ | 4 |
페이지
Real number (ℝ)
Distinct | 49 |
---|---|
Distinct (%) | 69.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 307.97183 |
Minimum | 8 |
---|---|
Maximum | 676 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 771.0 B |
Quantile statistics
Minimum | 8 |
---|---|
5-th percentile | 212 |
Q1 | 256 |
median | 303 |
Q3 | 348 |
95-th percentile | 424 |
Maximum | 676 |
Range | 668 |
Interquartile range (IQR) | 92 |
Descriptive statistics
Standard deviation | 85.658954 |
---|---|
Coefficient of variation (CV) | 0.27813892 |
Kurtosis | 5.5943403 |
Mean | 307.97183 |
Median Absolute Deviation (MAD) | 47 |
Skewness | 0.67850131 |
Sum | 21866 |
Variance | 7337.4563 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
256 | 6 | 8.5% |
320 | 3 | 4.2% |
264 | 3 | 4.2% |
348 | 3 | 4.2% |
304 | 2 | 2.8% |
268 | 2 | 2.8% |
296 | 2 | 2.8% |
424 | 2 | 2.8% |
288 | 2 | 2.8% |
388 | 2 | 2.8% |
Other values (39) | 44 |
Value | Count | Frequency (%) |
8 | 1 | |
156 | 1 | |
184 | 1 | |
208 | 1 | |
216 | 2 | |
222 | 1 | |
236 | 1 | |
238 | 1 | |
239 | 1 | |
240 | 1 |
Value | Count | Frequency (%) |
676 | 1 | |
500 | 1 | |
438 | 1 | |
424 | 2 | |
420 | 1 | |
408 | 1 | |
392 | 1 | |
388 | 2 | |
380 | 1 | |
376 | 1 |
도서명 | 저자 | 출판사 | 페이지 | |
---|---|---|---|---|
도서명 | 1.000 | 1.000 | 0.998 | 1.000 |
저자 | 1.000 | 1.000 | 0.999 | 0.985 |
출판사 | 0.998 | 0.999 | 1.000 | 0.932 |
페이지 | 1.000 | 0.985 | 0.932 | 1.000 |
도서명 | 저자 | 출판사 | 페이지 | |
---|---|---|---|---|
0 | 시각장애인을 위한 내 힘으로 글쓰기Ⅰ(촉각도서) | 한국시각장애인엽합회, 한국장애인고용공단 | <NA> | 8 |
1 | 어느 날, 내 죽음에 네가 들어왔다 | 세이카 료겐, 김윤경 번역 | ㈜바이포엠 스튜디오 | 296 |
2 | 기분을 관리하면 인생이 관리된다 | 김다슬 | ㈜필름 | 280 |
3 | 저만치 혼자서 | 김훈 | ㈜문학동네 | 264 |
4 | 수호지1 | 시내암 저, 이문열 편역 | 알에이치코리아 | 360 |
5 | 수호지2 | 시내암 저, 이문열 편역 | 알에이치코리아 | 348 |
6 | 수호지3 | 시내암 저, 이문열 편역 | 알에이치코리아 | 348 |
7 | 수호지4 | 시내암 저, 이문열 편역 | 알에이치코리아 | 332 |
8 | 수호지5 | 시내암 저, 이문열 편역 | 알에이치코리아 | 344 |
9 | 수호지6 | 시내암 저, 이문열 편역 | 알에이치코리아 | 328 |
도서명 | 저자 | 출판사 | 페이지 | |
---|---|---|---|---|
61 | 여덟건의 완벽한 살인 | 피터 스완슨 저, 노진선 역 | 푸른숲 | 320 |
62 | 투명인간은 밀실에 숨는다 | 아쓰카와 다쓰미 저, 이재원 역 | 디앤씨미디어 | 348 |
63 | 방과 후 복수활동 | 박성신, 윤자영, 양수련, 장우석 공저 | 북오션 | 256 |
64 | 조선의 왈가닥 비바리 | 천영미 | 고즈넉이엔티 | 420 |
65 | 절벽의 밤 | 미치오 슈스케 저, 김은모 역 | 청미래 | 264 |
66 | 주아 | 최윤호 | Harmonybook | 256 |
67 | 파친코1 | 이민진 저, 신승미 역 | 인플루엔셜 | 388 |
68 | 파친코2 | 이민진 저, 신승미 역 | 인플루엔셜 | 380 |
69 | 하얼빈 | 김훈 | 문학동네 | 308 |
70 | 불편한 편의점2 | 김호연 | 나무옆의자 | 320 |
Most frequently occurring
도서명 | 저자 | 출판사 | 페이지 | # duplicates | |
---|---|---|---|---|---|
0 | 기분을 관리하면 인생이 관리된다 | 김다슬 | ㈜필름 | 280 | 2 |
1 | 불편한 편의점2 | 김호연 | 나무옆의자 | 320 | 2 |