Overview

Dataset statistics

Number of variables4
Number of observations4558
Missing cells1
Missing cells (%)< 0.1%
Duplicate rows200
Duplicate rows (%)4.4%
Total size in memory142.6 KiB
Average record size in memory32.0 B

Variable types

Categorical2
Text2

Dataset

Description전라남도 장흥군 정남진 도서관에 보유하고 있는 전자도서 목록 현황으로서 전자도서 책제목, 전자도서 저작자의 항목의 데이터를 제공합니다.
URLhttps://www.data.go.kr/data/15086692/fileData.do

Alerts

구분 has constant value ""Constant
데이터기준일자 has constant value ""Constant
Dataset has 200 (4.4%) duplicate rowsDuplicates

Reproduction

Analysis started2023-12-12 16:57:21.325382
Analysis finished2023-12-12 16:57:22.598474
Duration1.27 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

구분
Categorical

CONSTANT 

Distinct1
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size35.7 KiB
전자책
4558 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row전자책
2nd row전자책
3rd row전자책
4th row전자책
5th row전자책

Common Values

ValueCountFrequency (%)
전자책 4558
100.0%

Length

2023-12-13T01:57:22.665719image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:57:22.752106image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
전자책 4558
100.0%

서명
Text

Distinct4336
Distinct (%)95.2%
Missing1
Missing (%)< 0.1%
Memory size35.7 KiB
2023-12-13T01:57:23.164673image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length92
Median length63
Mean length21.824665
Min length1

Characters and Unicode

Total characters99455
Distinct characters1277
Distinct categories14 ?
Distinct scripts4 ?
Distinct blocks8 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique4115 ?
Unique (%)90.3%

Sample

1st row팀워크를 위한 10가지 성공전략
2nd row치질 입원 않고 통증없이 낫는다
3rd row(예비 중학생이 꼭 알아야 할) 한국 10대 고전
4th row여름이 전해준 첫사랑의 향기
5th row(간직하고 싶은) 열두살의 작은 비밀
ValueCountFrequency (%)
2032
 
7.5%
1 240
 
0.9%
이야기 232
 
0.9%
2 229
 
0.8%
위한 184
 
0.7%
보는 119
 
0.4%
117
 
0.4%
112
 
0.4%
3 100
 
0.4%
장편소설 98
 
0.4%
Other values (10936) 23550
87.2%
2023-12-13T01:57:23.809366image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
22565
 
22.7%
: 2075
 
2.1%
1997
 
2.0%
1957
 
2.0%
1750
 
1.8%
1090
 
1.1%
1019
 
1.0%
997
 
1.0%
995
 
1.0%
985
 
1.0%
Other values (1267) 64025
64.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 68159
68.5%
Space Separator 22566
 
22.7%
Other Punctuation 4204
 
4.2%
Decimal Number 2401
 
2.4%
Close Punctuation 563
 
0.6%
Open Punctuation 561
 
0.6%
Lowercase Letter 454
 
0.5%
Uppercase Letter 383
 
0.4%
Math Symbol 64
 
0.1%
Dash Punctuation 54
 
0.1%
Other values (4) 46
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
1997
 
2.9%
1957
 
2.9%
1750
 
2.6%
1090
 
1.6%
1019
 
1.5%
997
 
1.5%
995
 
1.5%
985
 
1.4%
949
 
1.4%
919
 
1.3%
Other values (1163) 55501
81.4%
Uppercase Letter
ValueCountFrequency (%)
S 38
 
9.9%
E 36
 
9.4%
T 30
 
7.8%
W 28
 
7.3%
I 25
 
6.5%
O 22
 
5.7%
P 22
 
5.7%
A 20
 
5.2%
D 19
 
5.0%
B 17
 
4.4%
Other values (16) 126
32.9%
Lowercase Letter
ValueCountFrequency (%)
e 52
11.5%
h 46
 
10.1%
o 41
 
9.0%
y 38
 
8.4%
i 31
 
6.8%
t 26
 
5.7%
n 25
 
5.5%
s 24
 
5.3%
a 23
 
5.1%
l 23
 
5.1%
Other values (12) 125
27.5%
Other Punctuation
ValueCountFrequency (%)
: 2075
49.4%
. 889
21.1%
, 859
20.4%
! 127
 
3.0%
? 124
 
2.9%
· 59
 
1.4%
' 25
 
0.6%
" 14
 
0.3%
& 6
 
0.1%
/ 6
 
0.1%
Other values (8) 20
 
0.5%
Decimal Number
ValueCountFrequency (%)
1 665
27.7%
2 434
18.1%
0 429
17.9%
3 238
 
9.9%
5 159
 
6.6%
4 140
 
5.8%
9 96
 
4.0%
6 87
 
3.6%
8 77
 
3.2%
7 76
 
3.2%
Close Punctuation
ValueCountFrequency (%)
) 541
96.1%
] 12
 
2.1%
5
 
0.9%
3
 
0.5%
1
 
0.2%
1
 
0.2%
Open Punctuation
ValueCountFrequency (%)
( 539
96.1%
[ 12
 
2.1%
5
 
0.9%
3
 
0.5%
1
 
0.2%
1
 
0.2%
Math Symbol
ValueCountFrequency (%)
~ 29
45.3%
= 11
 
17.2%
+ 9
 
14.1%
< 6
 
9.4%
> 6
 
9.4%
× 3
 
4.7%
Space Separator
ValueCountFrequency (%)
22565
> 99.9%
  1
 
< 0.1%
Initial Punctuation
ValueCountFrequency (%)
19
90.5%
2
 
9.5%
Final Punctuation
ValueCountFrequency (%)
19
90.5%
2
 
9.5%
Letter Number
ValueCountFrequency (%)
1
50.0%
1
50.0%
Dash Punctuation
ValueCountFrequency (%)
- 54
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 68094
68.5%
Common 30457
30.6%
Latin 839
 
0.8%
Han 65
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
1997
 
2.9%
1957
 
2.9%
1750
 
2.6%
1090
 
1.6%
1019
 
1.5%
997
 
1.5%
995
 
1.5%
985
 
1.4%
949
 
1.4%
919
 
1.3%
Other values (1110) 55436
81.4%
Common
ValueCountFrequency (%)
22565
74.1%
: 2075
 
6.8%
. 889
 
2.9%
, 859
 
2.8%
1 665
 
2.2%
) 541
 
1.8%
( 539
 
1.8%
2 434
 
1.4%
0 429
 
1.4%
3 238
 
0.8%
Other values (44) 1223
 
4.0%
Han
ValueCountFrequency (%)
3
 
4.6%
3
 
4.6%
3
 
4.6%
2
 
3.1%
2
 
3.1%
2
 
3.1%
2
 
3.1%
2
 
3.1%
2
 
3.1%
1
 
1.5%
Other values (43) 43
66.2%
Latin
ValueCountFrequency (%)
e 52
 
6.2%
h 46
 
5.5%
o 41
 
4.9%
y 38
 
4.5%
S 38
 
4.5%
E 36
 
4.3%
i 31
 
3.7%
T 30
 
3.6%
W 28
 
3.3%
t 26
 
3.1%
Other values (40) 473
56.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 68091
68.5%
ASCII 31156
31.3%
None 93
 
0.1%
CJK 64
 
0.1%
Punctuation 45
 
< 0.1%
Compat Jamo 3
 
< 0.1%
Number Forms 2
 
< 0.1%
CJK Compat Ideographs 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
22565
72.4%
: 2075
 
6.7%
. 889
 
2.9%
, 859
 
2.8%
1 665
 
2.1%
) 541
 
1.7%
( 539
 
1.7%
2 434
 
1.4%
0 429
 
1.4%
3 238
 
0.8%
Other values (72) 1922
 
6.2%
Hangul
ValueCountFrequency (%)
1997
 
2.9%
1957
 
2.9%
1750
 
2.6%
1090
 
1.6%
1019
 
1.5%
997
 
1.5%
995
 
1.5%
985
 
1.4%
949
 
1.4%
919
 
1.3%
Other values (1109) 55433
81.4%
None
ValueCountFrequency (%)
· 59
63.4%
5
 
5.4%
5
 
5.4%
4
 
4.3%
3
 
3.2%
3
 
3.2%
× 3
 
3.2%
3
 
3.2%
2
 
2.2%
  1
 
1.1%
Other values (5) 5
 
5.4%
Punctuation
ValueCountFrequency (%)
19
42.2%
19
42.2%
3
 
6.7%
2
 
4.4%
2
 
4.4%
CJK
ValueCountFrequency (%)
3
 
4.7%
3
 
4.7%
3
 
4.7%
2
 
3.1%
2
 
3.1%
2
 
3.1%
2
 
3.1%
2
 
3.1%
2
 
3.1%
1
 
1.6%
Other values (42) 42
65.6%
Compat Jamo
ValueCountFrequency (%)
3
100.0%
CJK Compat Ideographs
ValueCountFrequency (%)
1
100.0%
Number Forms
ValueCountFrequency (%)
1
50.0%
1
50.0%
Distinct3143
Distinct (%)69.0%
Missing0
Missing (%)0.0%
Memory size35.7 KiB
2023-12-13T01:57:24.165869image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length64
Median length61
Mean length9.8935937
Min length2

Characters and Unicode

Total characters45095
Distinct characters715
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique2544 ?
Unique (%)55.8%

Sample

1st row톰 매시 지음 ; 조은경 옮김
2nd row이영훈 ; 전호진 [공]지음
3rd row허순봉 지음 ; 김홍 그림
4th row이성 지음
5th row이성 지음
ValueCountFrequency (%)
지음 2476
 
18.7%
1231
 
9.3%
옮김 692
 
5.2%
그림 278
 
2.1%
지은이 165
 
1.2%
엮음 139
 
1.1%
109
 
0.8%
편집부 85
 
0.6%
구인환 62
 
0.5%
성낙수 61
 
0.5%
Other values (4305) 7924
59.9%
2023-12-13T01:57:24.634055image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
9841
21.8%
3035
 
6.7%
2794
 
6.2%
1558
 
3.5%
1456
 
3.2%
; 1230
 
2.7%
755
 
1.7%
523
 
1.2%
502
 
1.1%
, 439
 
1.0%
Other values (705) 22962
50.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 31940
70.8%
Space Separator 9841
 
21.8%
Other Punctuation 2073
 
4.6%
Lowercase Letter 500
 
1.1%
Uppercase Letter 306
 
0.7%
Close Punctuation 189
 
0.4%
Open Punctuation 189
 
0.4%
Decimal Number 36
 
0.1%
Math Symbol 16
 
< 0.1%
Dash Punctuation 5
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
3035
 
9.5%
2794
 
8.7%
1558
 
4.9%
1456
 
4.6%
755
 
2.4%
523
 
1.6%
502
 
1.6%
438
 
1.4%
368
 
1.2%
368
 
1.2%
Other values (639) 20143
63.1%
Uppercase Letter
ValueCountFrequency (%)
B 46
15.0%
L 30
 
9.8%
S 28
 
9.2%
M 22
 
7.2%
P 20
 
6.5%
K 20
 
6.5%
J 17
 
5.6%
D 14
 
4.6%
E 13
 
4.2%
N 11
 
3.6%
Other values (13) 85
27.8%
Lowercase Letter
ValueCountFrequency (%)
e 86
17.2%
r 65
13.0%
t 58
11.6%
a 44
8.8%
o 44
8.8%
n 44
8.8%
i 41
8.2%
h 21
 
4.2%
l 18
 
3.6%
s 16
 
3.2%
Other values (11) 63
12.6%
Other Punctuation
ValueCountFrequency (%)
; 1230
59.3%
, 439
 
21.2%
: 300
 
14.5%
. 79
 
3.8%
· 21
 
1.0%
/ 3
 
0.1%
! 1
 
< 0.1%
Decimal Number
ValueCountFrequency (%)
1 17
47.2%
2 14
38.9%
4 3
 
8.3%
8 1
 
2.8%
3 1
 
2.8%
Close Punctuation
ValueCountFrequency (%)
] 187
98.9%
) 1
 
0.5%
1
 
0.5%
Open Punctuation
ValueCountFrequency (%)
[ 187
98.9%
( 1
 
0.5%
1
 
0.5%
Math Symbol
ValueCountFrequency (%)
< 8
50.0%
> 8
50.0%
Space Separator
ValueCountFrequency (%)
9841
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 5
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 31940
70.8%
Common 12349
 
27.4%
Latin 806
 
1.8%

Most frequent character per script

Hangul
ValueCountFrequency (%)
3035
 
9.5%
2794
 
8.7%
1558
 
4.9%
1456
 
4.6%
755
 
2.4%
523
 
1.6%
502
 
1.6%
438
 
1.4%
368
 
1.2%
368
 
1.2%
Other values (639) 20143
63.1%
Latin
ValueCountFrequency (%)
e 86
 
10.7%
r 65
 
8.1%
t 58
 
7.2%
B 46
 
5.7%
a 44
 
5.5%
o 44
 
5.5%
n 44
 
5.5%
i 41
 
5.1%
L 30
 
3.7%
S 28
 
3.5%
Other values (34) 320
39.7%
Common
ValueCountFrequency (%)
9841
79.7%
; 1230
 
10.0%
, 439
 
3.6%
: 300
 
2.4%
] 187
 
1.5%
[ 187
 
1.5%
. 79
 
0.6%
· 21
 
0.2%
1 17
 
0.1%
2 14
 
0.1%
Other values (12) 34
 
0.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 31940
70.8%
ASCII 13132
29.1%
None 23
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
9841
74.9%
; 1230
 
9.4%
, 439
 
3.3%
: 300
 
2.3%
] 187
 
1.4%
[ 187
 
1.4%
e 86
 
0.7%
. 79
 
0.6%
r 65
 
0.5%
t 58
 
0.4%
Other values (53) 660
 
5.0%
Hangul
ValueCountFrequency (%)
3035
 
9.5%
2794
 
8.7%
1558
 
4.9%
1456
 
4.6%
755
 
2.4%
523
 
1.6%
502
 
1.6%
438
 
1.4%
368
 
1.2%
368
 
1.2%
Other values (639) 20143
63.1%
None
ValueCountFrequency (%)
· 21
91.3%
1
 
4.3%
1
 
4.3%

데이터기준일자
Categorical

CONSTANT 

Distinct1
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size35.7 KiB
2023-08-28
4558 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2023-08-28
2nd row2023-08-28
3rd row2023-08-28
4th row2023-08-28
5th row2023-08-28

Common Values

ValueCountFrequency (%)
2023-08-28 4558
100.0%

Length

2023-12-13T01:57:24.776304image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:57:24.880149image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2023-08-28 4558
100.0%

Missing values

2023-12-13T01:57:22.425052image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T01:57:22.553593image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

구분서명저작자데이터기준일자
0전자책팀워크를 위한 10가지 성공전략톰 매시 지음 ; 조은경 옮김2023-08-28
1전자책치질 입원 않고 통증없이 낫는다이영훈 ; 전호진 [공]지음2023-08-28
2전자책(예비 중학생이 꼭 알아야 할) 한국 10대 고전허순봉 지음 ; 김홍 그림2023-08-28
3전자책여름이 전해준 첫사랑의 향기이성 지음2023-08-28
4전자책(간직하고 싶은) 열두살의 작은 비밀이성 지음2023-08-28
5전자책똥개도 사랑해 주세요허순봉 지음2023-08-28
6전자책사랑하는 내 아들아, 세상을 다 가져라필립 체스터필드 지음 ; 조은경 옮김2023-08-28
7전자책꼴찌 천사오카다 준 지음 ; 손미선 옮김2023-08-28
8전자책쉿! 숨소리도 내지마!귀신연구모임 지음2023-08-28
9전자책(논술과 사고력을 키워주는) 세상을 바꾼 아이들 : 과학자편이야기 세상 지음 ; 이규성 그림2023-08-28
구분서명저작자데이터기준일자
4548전자책천국보다 성스러운지은이: 김보영 ; 그래픽: 변영근2023-08-28
4549전자책천국보다 성스러운지은이: 김보영 ; 그래픽: 변영근2023-08-28
4550전자책천년의 수업 : 나와 세상의 경계를 허무는 9가지 질문지은이: 김헌2023-08-28
4551전자책천년의 수업 : 나와 세상의 경계를 허무는 9가지 질문지은이: 김헌2023-08-28
4552전자책치킨에는 진화의 역사가 있다 : 닭볏부터 닭발까지, 본격 치킨 TMI지은이: 가와카미 가즈토 ; 옮긴이: 김소연2023-08-28
4553전자책치킨에는 진화의 역사가 있다 : 닭볏부터 닭발까지, 본격 치킨 TMI지은이: 가와카미 가즈토 ; 옮긴이: 김소연2023-08-28
4554전자책카카오와 네이버는 어떻게 은행이 되었나 : 핀테크 트렌드로 보는 미래 금융김강원 지음2023-08-28
4555전자책카카오와 네이버는 어떻게 은행이 되었나 : 핀테크 트렌드로 보는 미래 금융김강원 지음2023-08-28
4556전자책칼과 혀 : 권정현 장편소설 : 제7회 혼불문학상 수상작지은이: 권정현2023-08-28
4557전자책칼과 혀 : 권정현 장편소설 : 제7회 혼불문학상 수상작지은이: 권정현2023-08-28

Duplicate rows

Most frequently occurring

구분서명저작자데이터기준일자# duplicates
0전자책(100가지 물건으로) 다시 쓰는 여성 세계사매기 앤드루스, 제니스 로마스 지음 ; 홍승원 옮김2023-08-282
1전자책(길 잃은 시간여행자를 위한) 문명 건설 가이드 : 인간이 만들어낸 거의 모든 도구와 기계의 원리라이언 노스 지음 ; 조은영 옮김2023-08-282
2전자책(빅터 프랭클의) 죽음의 수용소에서 : 죽음조차 희망으로 승화시킨 인간 존엄성의 승리빅터 프랭클 지음 ; 이시형 옮김2023-08-282
3전자책(사진과 그림으로 보는) 북한 현대사 : 1945~김성보, 기광서, 이신철 지음2023-08-282
4전자책(세상 친절한) 중국 상식 : 62가지 질문으로 들여다본 중국인의 뇌 구조이벌찬, 오로라 지음2023-08-282
5전자책(아는 만큼 당첨되는) 청약의 기술 : 2030 싱글도, 무자녀 신혼부부도, 유주택자도 당첨되는 청약 5단계 전략열정로즈 지음2023-08-282
6전자책(야사로 보는)고려의 역사. 1최범서2023-08-282
7전자책(절대 배신하지 않는) 공부의 기술 : 당신의 노력을 합격으로 바꾸는 14일 완성 공부 습관 프로젝트이상욱 지음2023-08-282
8전자책(죽기 전에 가 봐야 할) 국내여행 버킷리스트 101 : 강원도 : 색다른 여행지를 찾아다니는 부부 여행 작가의 특별한 대한민국 여행지 소개최미선, 신석교 지음2023-08-282
9전자책(죽기 전에 가 봐야 할) 국내여행 버킷리스트 101 : 경기도 : 색다른 여행지를 찾아다니는 부부 여행 작가의 특별한 대한민국 여행지 소개최미선, 신석교 지음2023-08-282