Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 30 |
Missing cells | 6 |
Missing cells (%) | 4.0% |
Duplicate rows | 1 |
Duplicate rows (%) | 3.3% |
Total size in memory | 1.3 KiB |
Average record size in memory | 44.4 B |
Variable types
Text | 4 |
---|---|
Categorical | 1 |
Dataset
Description | 독립기념관 교양총서의 제목, 작가, 파일명 등의 자료입니다. |
---|---|
Author | 독립기념관 |
URL | https://www.data.go.kr/data/15067846/fileData.do |
Dataset has 1 (3.3%) duplicate rows | Duplicates |
제목 has 2 (6.7%) missing values | Missing |
작가 has 2 (6.7%) missing values | Missing |
파일명 has 2 (6.7%) missing values | Missing |
Reproduction
Analysis started | 2023-12-13 00:48:46.409573 |
---|---|
Analysis finished | 2023-12-13 00:48:46.833672 |
Duration | 0.42 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
자료번호
Text
Distinct | 29 |
---|---|
Distinct (%) | 96.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
2 | 1 | 3.6% |
3 | 1 | 3.6% |
28 | 1 | 3.6% |
27 | 1 | 3.6% |
26 | 1 | 3.6% |
25 | 1 | 3.6% |
24 | 1 | 3.6% |
23 | 1 | 3.6% |
22 | 1 | 3.6% |
21 | 1 | 3.6% |
Other values (18) | 18 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 13 | |
2 | 12 | |
3 | 3 | 6.1% |
4 | 3 | 6.1% |
5 | 3 | 6.1% |
6 | 3 | 6.1% |
7 | 3 | 6.1% |
8 | 3 | 6.1% |
2 | 4.1% | |
9 | 2 | 4.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 47 | |
Space Separator | 2 | 4.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 13 | |
2 | 12 | |
3 | 3 | 6.4% |
4 | 3 | 6.4% |
5 | 3 | 6.4% |
6 | 3 | 6.4% |
7 | 3 | 6.4% |
8 | 3 | 6.4% |
9 | 2 | 4.3% |
0 | 2 | 4.3% |
Space Separator
Value | Count | Frequency (%) |
2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 49 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 13 | |
2 | 12 | |
3 | 3 | 6.1% |
4 | 3 | 6.1% |
5 | 3 | 6.1% |
6 | 3 | 6.1% |
7 | 3 | 6.1% |
8 | 3 | 6.1% |
2 | 4.1% | |
9 | 2 | 4.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 49 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 13 | |
2 | 12 | |
3 | 3 | 6.1% |
4 | 3 | 6.1% |
5 | 3 | 6.1% |
6 | 3 | 6.1% |
7 | 3 | 6.1% |
8 | 3 | 6.1% |
2 | 4.1% | |
9 | 2 | 4.1% |
제목
Text
MISSING
 
Distinct | 28 |
---|---|
Distinct (%) | 100.0% |
Missing | 2 |
Missing (%) | 6.7% |
Memory size | 372.0 B |
Length
Max length | 39 |
---|---|
Median length | 32.5 |
Mean length | 16.821429 |
Min length | 5 |
Characters and Unicode
Total characters | 471 |
---|---|
Distinct characters | 110 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 28 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 한국 독립운동사의 재조명 |
---|---|
2nd row | 만주·노령지역의 독립운동 |
3rd row | 3.1독립운동 |
4th row | 한국여성 독립운동 |
5th row | 한국근대문학과 문인들의 독립운동 |
Value | Count | Frequency (%) |
역사왜곡 | 7 | 7.6% |
일문판 | 4 | 4.3% |
어떻게 | 4 | 4.3% |
위안부 | 3 | 3.3% |
알고 | 3 | 3.3% |
있나요 | 3 | 3.3% |
독립운동 | 3 | 3.3% |
근대화론 | 2 | 2.2% |
일본군 | 2 | 2.2% |
한국 | 2 | 2.2% |
Other values (47) | 59 |
Most occurring characters
Value | Count | Frequency (%) |
73 | 15.5% | |
일 | 15 | 3.2% |
사 | 14 | 3.0% |
국 | 13 | 2.8% |
한 | 12 | 2.5% |
의 | 12 | 2.5% |
문 | 11 | 2.3% |
역 | 10 | 2.1% |
동 | 9 | 1.9% |
( | 9 | 1.9% |
Other values (100) | 293 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 358 | |
Space Separator | 73 | 15.5% |
Other Punctuation | 16 | 3.4% |
Open Punctuation | 9 | 1.9% |
Close Punctuation | 9 | 1.9% |
Decimal Number | 6 | 1.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
일 | 15 | 4.2% |
사 | 14 | 3.9% |
국 | 13 | 3.6% |
한 | 12 | 3.4% |
의 | 12 | 3.4% |
문 | 11 | 3.1% |
역 | 10 | 2.8% |
동 | 9 | 2.5% |
서 | 9 | 2.5% |
양 | 9 | 2.5% |
Other values (91) | 244 |
Other Punctuation
Value | Count | Frequency (%) |
? | 9 | |
, | 3 | 18.8% |
· | 3 | 18.8% |
. | 1 | 6.2% |
Decimal Number
Value | Count | Frequency (%) |
3 | 3 | |
1 | 3 |
Space Separator
Value | Count | Frequency (%) |
73 |
Open Punctuation
Value | Count | Frequency (%) |
( | 9 |
Close Punctuation
Value | Count | Frequency (%) |
) | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 358 | |
Common | 113 | 24.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
일 | 15 | 4.2% |
사 | 14 | 3.9% |
국 | 13 | 3.6% |
한 | 12 | 3.4% |
의 | 12 | 3.4% |
문 | 11 | 3.1% |
역 | 10 | 2.8% |
동 | 9 | 2.5% |
서 | 9 | 2.5% |
양 | 9 | 2.5% |
Other values (91) | 244 |
Common
Value | Count | Frequency (%) |
73 | ||
( | 9 | 8.0% |
? | 9 | 8.0% |
) | 9 | 8.0% |
, | 3 | 2.7% |
· | 3 | 2.7% |
3 | 3 | 2.7% |
1 | 3 | 2.7% |
. | 1 | 0.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 358 | |
ASCII | 110 | 23.4% |
None | 3 | 0.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
73 | ||
( | 9 | 8.2% |
? | 9 | 8.2% |
) | 9 | 8.2% |
, | 3 | 2.7% |
3 | 3 | 2.7% |
1 | 3 | 2.7% |
. | 1 | 0.9% |
Hangul
Value | Count | Frequency (%) |
일 | 15 | 4.2% |
사 | 14 | 3.9% |
국 | 13 | 3.6% |
한 | 12 | 3.4% |
의 | 12 | 3.4% |
문 | 11 | 3.1% |
역 | 10 | 2.8% |
동 | 9 | 2.5% |
서 | 9 | 2.5% |
양 | 9 | 2.5% |
Other values (91) | 244 |
None
Value | Count | Frequency (%) |
· | 3 |
작가
Text
MISSING
 
Distinct | 24 |
---|---|
Distinct (%) | 85.7% |
Missing | 2 |
Missing (%) | 6.7% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
강정숙 | 3 | 10.7% |
허수열 | 2 | 7.1% |
한철호 | 2 | 7.1% |
이정은 | 2 | 7.1% |
김준엽 | 1 | 3.6% |
김호일 | 1 | 3.6% |
이균영 | 1 | 3.6% |
이현희 | 1 | 3.6% |
권태억 | 1 | 3.6% |
권영민 | 1 | 3.6% |
Other values (13) | 13 |
Most occurring characters
Value | Count | Frequency (%) |
7 | 7.7% | |
김 | 5 | 5.5% |
정 | 5 | 5.5% |
이 | 4 | 4.4% |
수 | 4 | 4.4% |
호 | 4 | 4.4% |
박 | 4 | 4.4% |
강 | 3 | 3.3% |
숙 | 3 | 3.3% |
은 | 3 | 3.3% |
Other values (35) | 49 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 84 | |
Space Separator | 7 | 7.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 5 | 6.0% |
정 | 5 | 6.0% |
이 | 4 | 4.8% |
수 | 4 | 4.8% |
호 | 4 | 4.8% |
박 | 4 | 4.8% |
강 | 3 | 3.6% |
숙 | 3 | 3.6% |
은 | 3 | 3.6% |
영 | 3 | 3.6% |
Other values (34) | 46 |
Space Separator
Value | Count | Frequency (%) |
7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 84 | |
Common | 7 | 7.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 5 | 6.0% |
정 | 5 | 6.0% |
이 | 4 | 4.8% |
수 | 4 | 4.8% |
호 | 4 | 4.8% |
박 | 4 | 4.8% |
강 | 3 | 3.6% |
숙 | 3 | 3.6% |
은 | 3 | 3.6% |
영 | 3 | 3.6% |
Other values (34) | 46 |
Common
Value | Count | Frequency (%) |
7 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 84 | |
ASCII | 7 | 7.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
7 |
Hangul
Value | Count | Frequency (%) |
김 | 5 | 6.0% |
정 | 5 | 6.0% |
이 | 4 | 4.8% |
수 | 4 | 4.8% |
호 | 4 | 4.8% |
박 | 4 | 4.8% |
강 | 3 | 3.6% |
숙 | 3 | 3.6% |
은 | 3 | 3.6% |
영 | 3 | 3.6% |
Other values (34) | 46 |
파일명
Text
MISSING
 
Distinct | 28 |
---|---|
Distinct (%) | 100.0% |
Missing | 2 |
Missing (%) | 6.7% |
Memory size | 372.0 B |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 8.6785714 |
Min length | 8 |
Characters and Unicode
Total characters | 243 |
---|---|
Distinct characters | 15 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 28 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | e0001.pdf |
---|---|
2nd row | e0002.pdf |
3rd row | e0003.pdf |
4th row | e0004.pdf |
5th row | e0005.pdf |
Value | Count | Frequency (%) |
e0002.pdf | 1 | 3.6% |
e0003.pdf | 1 | 3.6% |
e028.pdf | 1 | 3.6% |
e027.pdf | 1 | 3.6% |
e026.pdf | 1 | 3.6% |
e025.pdf | 1 | 3.6% |
e024.pdf | 1 | 3.6% |
e023.pdf | 1 | 3.6% |
e022.pdf | 1 | 3.6% |
e021.pdf | 1 | 3.6% |
Other values (18) | 18 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 58 | |
e | 28 | |
. | 28 | |
p | 28 | |
d | 28 | |
f | 28 | |
1 | 13 | 5.3% |
2 | 12 | 4.9% |
3 | 3 | 1.2% |
4 | 3 | 1.2% |
Other values (5) | 14 | 5.8% |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 112 | |
Decimal Number | 103 | |
Other Punctuation | 28 | 11.5% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 58 | |
1 | 13 | 12.6% |
2 | 12 | 11.7% |
3 | 3 | 2.9% |
4 | 3 | 2.9% |
5 | 3 | 2.9% |
6 | 3 | 2.9% |
7 | 3 | 2.9% |
8 | 3 | 2.9% |
9 | 2 | 1.9% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 28 | |
p | 28 | |
d | 28 | |
f | 28 |
Other Punctuation
Value | Count | Frequency (%) |
. | 28 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 131 | |
Latin | 112 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 58 | |
. | 28 | |
1 | 13 | 9.9% |
2 | 12 | 9.2% |
3 | 3 | 2.3% |
4 | 3 | 2.3% |
5 | 3 | 2.3% |
6 | 3 | 2.3% |
7 | 3 | 2.3% |
8 | 3 | 2.3% |
Latin
Value | Count | Frequency (%) |
e | 28 | |
p | 28 | |
d | 28 | |
f | 28 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 243 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 58 | |
e | 28 | |
. | 28 | |
p | 28 | |
d | 28 | |
f | 28 | |
1 | 13 | 5.3% |
2 | 12 | 4.9% |
3 | 3 | 1.2% |
4 | 3 | 1.2% |
Other values (5) | 14 | 5.8% |
내용
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 10.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
- | |
---|---|
이 책은 국내외 독자들이 위안부 문제를 차근차근 이해할 수 있도록 하고 위안부 문제의 문제의 본질이 무엇이며, 우리가 어떻게 이해하고 해결 할 지 그 해답을 찾고자 제작하였다. | |
<NA> | 2 |
Length
Max length | 98 |
---|---|
Median length | 1 |
Mean length | 10.9 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | - |
---|---|
2nd row | - |
3rd row | - |
4th row | - |
5th row | - |
Common Values
Value | Count | Frequency (%) |
- | 25 | |
이 책은 국내외 독자들이 위안부 문제를 차근차근 이해할 수 있도록 하고 위안부 문제의 문제의 본질이 무엇이며, 우리가 어떻게 이해하고 해결 할 지 그 해답을 찾고자 제작하였다. | 3 | 10.0% |
<NA> | 2 | 6.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
25 | ||
위안부 | 6 | 5.7% |
문제의 | 6 | 5.7% |
무엇이며 | 3 | 2.9% |
제작하였다 | 3 | 2.9% |
찾고자 | 3 | 2.9% |
해답을 | 3 | 2.9% |
그 | 3 | 2.9% |
지 | 3 | 2.9% |
할 | 3 | 2.9% |
Other values (16) | 47 |
자료번호 | 제목 | 작가 | 파일명 | 내용 | |
---|---|---|---|---|---|
자료번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
제목 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
작가 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
파일명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
내용 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
자료번호 | 제목 | 작가 | 파일명 | 내용 | |
---|---|---|---|---|---|
0 | 1 | 한국 독립운동사의 재조명 | 김준엽 | e0001.pdf | - |
1 | 2 | 만주·노령지역의 독립운동 | 박영석 | e0002.pdf | - |
2 | 3 | 3.1독립운동 | 신용하 | e0003.pdf | - |
3 | 4 | 한국여성 독립운동 | 박용옥 | e0004.pdf | - |
4 | 5 | 한국근대문학과 문인들의 독립운동 | 김윤식 | e0005.pdf | - |
5 | 6 | 한국의 경제발전 | 박우회 | e0006.pdf | - |
6 | 7 | 대한민국의 수립 | 김학준 | e0007.pdf | - |
7 | 8 | 천개소문전, 몽배금태조 | 박은식 | e0008.pdf | - |
8 | 9 | 을지문덕, 이순신전, 최도통전 | 신채호 | e0009.pdf | - |
9 | 10 | 한말의 의병전쟁 | 조동걸 | e0010.pdf | - |
자료번호 | 제목 | 작가 | 파일명 | 내용 | |
---|---|---|---|---|---|
20 | 21 | 역사왜곡교양서 (일본군 위안부 알고 있나요? 영문판) | 강정숙 | e021.pdf | 이 책은 국내외 독자들이 위안부 문제를 차근차근 이해할 수 있도록 하고 위안부 문제의 문제의 본질이 무엇이며, 우리가 어떻게 이해하고 해결 할 지 그 해답을 찾고자 제작하였다. |
21 | 22 | 역사왜곡교양서 (일본군 위안부 알고 있나요? 일문판) | 강정숙 | e022.pdf | 이 책은 국내외 독자들이 위안부 문제를 차근차근 이해할 수 있도록 하고 위안부 문제의 문제의 본질이 무엇이며, 우리가 어떻게 이해하고 해결 할 지 그 해답을 찾고자 제작하였다. |
22 | 23 | 역사왜곡 교양서(근대 일본은 한국을 어떻게 병탄했나?) | 한철호 | e023.pdf | - |
23 | 24 | 역사왜곡 교양서(근대 일본은 한국을 어떻게 병탄했나? 일문판) | 한철호 | e024.pdf | - |
24 | 25 | 역사왜곡 교양서(식민지 근대화론 무엇이 문제인가?) | 허수열 | e025.pdf | - |
25 | 26 | 역사왜곡 교양서(식민지 근대화론 무엇이 문제인가? 일문판) | 허수열 | e026.pdf | - |
26 | 27 | 역사왜곡 교양서(일본제국주의는 3·1운동을 어떻게 탄압했나?) | 이정은 | e027.pdf | - |
27 | 28 | 역사왜곡 교양서(일본제국주의는 3·1운동을 어떻게 탄압했나? 일문판) | 이정은 | e028.pdf | - |
28 | <NA> | <NA> | <NA> | <NA> | |
29 | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
자료번호 | 제목 | 작가 | 파일명 | 내용 | # duplicates | |
---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | 2 |