Overview

Dataset statistics

Number of variables5
Number of observations808
Missing cells0
Missing cells (%)0.0%
Duplicate rows1
Duplicate rows (%)0.1%
Total size in memory31.7 KiB
Average record size in memory40.2 B

Variable types

Categorical4
Text1

Dataset

Description경기도_고양시_오디오북정보(제목, 성우명, 저자명, 연도, 부제목) - 고양시 시립도서관 19개관 및 작은도서관 오디오북 정보 작성
URLhttps://www.data.go.kr/data/15085051/fileData.do

Alerts

Dataset has 1 (0.1%) duplicate rowsDuplicates
저자명 is highly overall correlated with 제목 and 2 other fieldsHigh correlation
제목 is highly overall correlated with 성우명 and 2 other fieldsHigh correlation
연도 is highly overall correlated with 제목 and 2 other fieldsHigh correlation
성우명 is highly overall correlated with 제목 and 2 other fieldsHigh correlation

Reproduction

Analysis started2023-12-12 16:03:08.538499
Analysis finished2023-12-12 16:03:09.215382
Duration0.68 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

제목
Categorical

HIGH CORRELATION 

Distinct24
Distinct (%)3.0%
Missing0
Missing (%)0.0%
Memory size6.4 KiB
새기고 싶은 명문장
99 
벤자민 버튼의 시간은 거꾸로 간다
64 
오페라의 유령
62 
상처받지 않을 권리
55 
시골의사 박경철의 자기혁명
 
44
Other values (19)
484 

Length

Max length19
Median length15
Mean length11.164604
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row아기도깨비와 오토 제국
2nd row아기도깨비와 오토 제국
3rd row아기도깨비와 오토 제국
4th row아기도깨비와 오토 제국
5th row아기도깨비와 오토 제국

Common Values

ValueCountFrequency (%)
새기고 싶은 명문장 99
 
12.3%
벤자민 버튼의 시간은 거꾸로 간다 64
 
7.9%
오페라의 유령 62
 
7.7%
상처받지 않을 권리 55
 
6.8%
시골의사 박경철의 자기혁명 44
 
5.4%
꿈 너머 꿈 43
 
5.3%
그 남자네 집 41
 
5.1%
현명한 부모는 아이를 느리게 키운다 40
 
5.0%
스티브 잡스 창조 카리스마 37
 
4.6%
클래식을 좋아하세요 36
 
4.5%
Other values (14) 287
35.5%

Length

2023-12-13T01:03:09.318426image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
새기고 99
 
3.9%
싶은 99
 
3.9%
명문장 99
 
3.9%
86
 
3.4%
버튼의 64
 
2.5%
거꾸로 64
 
2.5%
간다 64
 
2.5%
벤자민 64
 
2.5%
시간은 64
 
2.5%
오페라의 62
 
2.5%
Other values (59) 1746
69.5%

성우명
Categorical

HIGH CORRELATION 

Distinct15
Distinct (%)1.9%
Missing0
Missing (%)0.0%
Memory size6.4 KiB
안혜경
194 
최석환
122 
남주현
95 
김미정
56 
김태범
44 
Other values (10)
297 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row임승미
2nd row임승미
3rd row임승미
4th row임승미
5th row임승미

Common Values

ValueCountFrequency (%)
안혜경 194
24.0%
최석환 122
15.1%
남주현 95
11.8%
김미정 56
 
6.9%
김태범 44
 
5.4%
서혜정 43
 
5.3%
이승연 42
 
5.2%
홍영란 41
 
5.1%
김경아 37
 
4.6%
조안나 36
 
4.5%
Other values (5) 98
12.1%

Length

2023-12-13T01:03:09.460443image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
안혜경 194
24.0%
최석환 122
15.1%
남주현 95
11.8%
김미정 56
 
6.9%
김태범 44
 
5.4%
서혜정 43
 
5.3%
이승연 42
 
5.2%
홍영란 41
 
5.1%
김경아 37
 
4.6%
조안나 36
 
4.5%
Other values (5) 98
12.1%

저자명
Categorical

HIGH CORRELATION 

Distinct24
Distinct (%)3.0%
Missing0
Missing (%)0.0%
Memory size6.4 KiB
박수밀, 송원찬
99 
스콧 피츠제럴드
64 
가스통 르루
62 
강신주
55 
박경철
 
44
Other values (19)
484 

Length

Max length11
Median length3
Mean length4.7314356
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row이현주
2nd row이현주
3rd row이현주
4th row이현주
5th row이현주

Common Values

ValueCountFrequency (%)
박수밀, 송원찬 99
 
12.3%
스콧 피츠제럴드 64
 
7.9%
가스통 르루 62
 
7.7%
강신주 55
 
6.8%
박경철 44
 
5.4%
고도원 43
 
5.3%
박완서 41
 
5.1%
신의진 40
 
5.0%
김영한 37
 
4.6%
김순배 36
 
4.5%
Other values (14) 287
35.5%

Length

2023-12-13T01:03:09.588545image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
박수밀 99
 
8.5%
송원찬 99
 
8.5%
스콧 96
 
8.3%
피츠제럴드 96
 
8.3%
가스통 62
 
5.4%
르루 62
 
5.4%
강신주 55
 
4.7%
박경철 44
 
3.8%
고도원 43
 
3.7%
박완서 41
 
3.5%
Other values (20) 461
39.8%

연도
Categorical

HIGH CORRELATION 

Distinct20
Distinct (%)2.5%
Missing0
Missing (%)0.0%
Memory size6.4 KiB
2012-05-30
99 
2009-07-01
87 
2009-01-02
64 
2008-09-19
62 
2012-05-10
57 
Other values (15)
439 

Length

Max length10
Median length10
Mean length9.9108911
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2002-09-30
2nd row2002-09-30
3rd row2002-09-30
4th row2002-09-30
5th row2002-09-30

Common Values

ValueCountFrequency (%)
2012-05-30 99
12.3%
2009-07-01 87
 
10.8%
2009-01-02 64
 
7.9%
2008-09-19 62
 
7.7%
2012-05-10 57
 
7.1%
2011-10-05 44
 
5.4%
2007-04-16 43
 
5.3%
2012-01-22 41
 
5.1%
2010-06-15 40
 
5.0%
2006-11-15 37
 
4.6%
Other values (10) 234
29.0%

Length

2023-12-13T01:03:09.759592image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
2012-05-30 99
12.3%
2009-07-01 87
 
10.8%
2009-01-02 64
 
7.9%
2008-09-19 62
 
7.7%
2012-05-10 57
 
7.1%
2011-10-05 44
 
5.4%
2007-04-16 43
 
5.3%
2012-01-22 41
 
5.1%
2010-06-15 40
 
5.0%
2006-11-15 37
 
4.6%
Other values (10) 234
29.0%
Distinct785
Distinct (%)97.2%
Missing0
Missing (%)0.0%
Memory size6.4 KiB
2023-12-13T01:03:10.073660image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length47
Median length35
Mean length20.006188
Min length2

Characters and Unicode

Total characters16165
Distinct characters692
Distinct categories11 ?
Distinct scripts4 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique779 ?
Unique (%)96.4%

Sample

1st row아기도깨비와 오토 제국 - 노래하는 치과의사
2nd row아기도깨비와 오토 제국 - 춤추는 버스에서
3rd row아기도깨비와 오토 제국 - 검은 안경과 땅딸보_1
4th row아기도깨비와 오토 제국 - 검은 안경과 땅딸보_2
5th row아기도깨비와 오토 제국 - 할아버지 시계
ValueCountFrequency (%)
225
 
5.3%
48
 
1.1%
41
 
1.0%
남자네 41
 
1.0%
창조 39
 
0.9%
chapter 39
 
0.9%
카리스마 37
 
0.9%
스티브잡스 37
 
0.9%
위대한 33
 
0.8%
개츠비 32
 
0.8%
Other values (2048) 3644
86.4%
2023-12-13T01:03:10.559620image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
3463
 
21.4%
_ 603
 
3.7%
0 495
 
3.1%
470
 
2.9%
1 373
 
2.3%
2 344
 
2.1%
313
 
1.9%
3 244
 
1.5%
232
 
1.4%
226
 
1.4%
Other values (682) 9402
58.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 9433
58.4%
Space Separator 3463
 
21.4%
Decimal Number 2035
 
12.6%
Connector Punctuation 603
 
3.7%
Lowercase Letter 304
 
1.9%
Dash Punctuation 228
 
1.4%
Other Punctuation 67
 
0.4%
Uppercase Letter 18
 
0.1%
Math Symbol 6
 
< 0.1%
Open Punctuation 4
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
470
 
5.0%
313
 
3.3%
232
 
2.5%
226
 
2.4%
221
 
2.3%
198
 
2.1%
168
 
1.8%
150
 
1.6%
140
 
1.5%
126
 
1.3%
Other values (625) 7189
76.2%
Lowercase Letter
ValueCountFrequency (%)
t 41
13.5%
e 41
13.5%
r 41
13.5%
a 40
13.2%
h 40
13.2%
c 40
13.2%
p 39
12.8%
o 4
 
1.3%
v 3
 
1.0%
s 3
 
1.0%
Other values (9) 12
 
3.9%
Decimal Number
ValueCountFrequency (%)
0 495
24.3%
1 373
18.3%
2 344
16.9%
3 244
12.0%
4 181
 
8.9%
5 160
 
7.9%
6 99
 
4.9%
7 57
 
2.8%
8 46
 
2.3%
9 36
 
1.8%
Uppercase Letter
ValueCountFrequency (%)
E 4
22.2%
A 2
11.1%
D 2
11.1%
C 2
11.1%
O 2
11.1%
P 2
11.1%
N 1
 
5.6%
B 1
 
5.6%
L 1
 
5.6%
M 1
 
5.6%
Other Punctuation
ValueCountFrequency (%)
, 43
64.2%
. 13
 
19.4%
' 6
 
9.0%
! 3
 
4.5%
· 1
 
1.5%
? 1
 
1.5%
Open Punctuation
ValueCountFrequency (%)
2
50.0%
( 1
25.0%
1
25.0%
Close Punctuation
ValueCountFrequency (%)
2
50.0%
) 1
25.0%
1
25.0%
Dash Punctuation
ValueCountFrequency (%)
- 226
99.1%
2
 
0.9%
Math Symbol
ValueCountFrequency (%)
3
50.0%
3
50.0%
Space Separator
ValueCountFrequency (%)
3463
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 603
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 9432
58.3%
Common 6410
39.7%
Latin 322
 
2.0%
Han 1
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
470
 
5.0%
313
 
3.3%
232
 
2.5%
226
 
2.4%
221
 
2.3%
198
 
2.1%
168
 
1.8%
150
 
1.6%
140
 
1.5%
126
 
1.3%
Other values (624) 7188
76.2%
Latin
ValueCountFrequency (%)
t 41
12.7%
e 41
12.7%
r 41
12.7%
a 40
12.4%
h 40
12.4%
c 40
12.4%
p 39
12.1%
o 4
 
1.2%
E 4
 
1.2%
v 3
 
0.9%
Other values (19) 29
9.0%
Common
ValueCountFrequency (%)
3463
54.0%
_ 603
 
9.4%
0 495
 
7.7%
1 373
 
5.8%
2 344
 
5.4%
3 244
 
3.8%
- 226
 
3.5%
4 181
 
2.8%
5 160
 
2.5%
6 99
 
1.5%
Other values (18) 222
 
3.5%
Han
ValueCountFrequency (%)
1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 9432
58.3%
ASCII 6717
41.6%
None 9
 
0.1%
Math Operators 6
 
< 0.1%
CJK 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
3463
51.6%
_ 603
 
9.0%
0 495
 
7.4%
1 373
 
5.6%
2 344
 
5.1%
3 244
 
3.6%
- 226
 
3.4%
4 181
 
2.7%
5 160
 
2.4%
6 99
 
1.5%
Other values (39) 529
 
7.9%
Hangul
ValueCountFrequency (%)
470
 
5.0%
313
 
3.3%
232
 
2.5%
226
 
2.4%
221
 
2.3%
198
 
2.1%
168
 
1.8%
150
 
1.6%
140
 
1.5%
126
 
1.3%
Other values (624) 7188
76.2%
Math Operators
ValueCountFrequency (%)
3
50.0%
3
50.0%
None
ValueCountFrequency (%)
2
22.2%
2
22.2%
2
22.2%
· 1
11.1%
1
11.1%
1
11.1%
CJK
ValueCountFrequency (%)
1
100.0%

Correlations

2023-12-13T01:03:10.706081image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
제목성우명저자명연도
제목1.0001.0001.0001.000
성우명1.0001.0001.0000.988
저자명1.0001.0001.0001.000
연도1.0000.9881.0001.000
2023-12-13T01:03:10.815356image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
저자명제목연도성우명
저자명1.0001.0000.9970.994
제목1.0001.0000.9970.994
연도0.9970.9971.0000.909
성우명0.9940.9940.9091.000
2023-12-13T01:03:10.938537image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
제목성우명저자명연도
제목1.0000.9941.0000.997
성우명0.9941.0000.9940.909
저자명1.0000.9941.0000.997
연도0.9970.9090.9971.000

Missing values

2023-12-13T01:03:09.073312image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T01:03:09.172431image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

제목성우명저자명연도부제목
0아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 노래하는 치과의사
1아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 춤추는 버스에서
2아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 검은 안경과 땅딸보_1
3아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 검은 안경과 땅딸보_2
4아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 할아버지 시계
5아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 다들남 건설 주식회사
6아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 눈부신 오토 제국
7아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 루루가 루루지_1
8아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 루루가 루루지_2
9아기도깨비와 오토 제국임승미이현주2002-09-30아기도깨비와 오토 제국 - 하-585
제목성우명저자명연도부제목
798홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 2부_3장 02 현세의 국가와 기독교 국가는 대립되지 않는다
799홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 2부_3장 03 성경을 그릇되게 해석한 어둠의 나라
800홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 3부_01 질서를 생각한 철학자
801홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 3부_02 불을 품은 책에 대한 당대의 평가
802홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 3부_03 사회를 상상하는 하나의 모델
803홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 3부_04 절대권력은 정당한 권력일까
804홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 3부_05 우리가 실제로 경험한 리바이어던
805홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 3부_06 새로운 사회를 상상하다
806홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 지식 체인_홉스의 《리바이어던》을 왜 혁명적이라고 하는가
807홉스의 리바이어던이승연오하나2012-05-10홉스의 리바이어던 - 엔딩

Duplicate rows

Most frequently occurring

제목성우명저자명연도부제목# duplicates
0곧, 어른의 시간이 시작된다백영옥백영옥2012-09-052장_02 36.5도보다 더 온기 있는 것들2