Overview

Dataset statistics

Number of variables3
Number of observations115
Missing cells0
Missing cells (%)0.0%
Duplicate rows13
Duplicate rows (%)11.3%
Total size in memory2.8 KiB
Average record size in memory25.1 B

Variable types

Categorical1
Text2

Dataset

Description광주교통공사 전동차내안내방송에 대한 데이터로 안내방송 구성표에 따른 구간, 방송멘트, 방송에 해당하는 음원파일명을 제공합니다.
Author광주교통공사
URLhttps://www.data.go.kr/data/15053588/fileData.do

Alerts

Dataset has 13 (11.3%) duplicate rowsDuplicates

Reproduction

Analysis started2023-12-12 00:26:53.580789
Analysis finished2023-12-12 00:26:54.129312
Duration0.55 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

방송구간
Categorical

Distinct26
Distinct (%)22.6%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
평동역 (시발역)
12 
공항역
녹동역 (시발역)
 
6
상무역
 
6
소태역 (시발역)
 
6
Other values (21)
77 

Length

Max length14
Median length9
Mean length5.8521739
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row녹동역 (시발역)
2nd row녹동역 (시발역)
3rd row녹동역 (시발역)
4th row녹동역 (시발역)
5th row녹동역 (시발역)

Common Values

ValueCountFrequency (%)
평동역 (시발역) 12
 
10.4%
공항역 8
 
7.0%
녹동역 (시발역) 6
 
5.2%
상무역 6
 
5.2%
소태역 (시발역) 6
 
5.2%
남광주역 6
 
5.2%
농성역 6
 
5.2%
김대중컨벤션센터 (마륵)역 6
 
5.2%
금남로4가역 5
 
4.3%
금남로5가역 5
 
4.3%
Other values (16) 49
42.6%

Length

2023-12-12T09:26:54.195817image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
시발역 24
16.3%
평동역 15
 
10.2%
소태역 11
 
7.5%
공항역 8
 
5.4%
녹동역 8
 
5.4%
상무역 6
 
4.1%
남광주역 6
 
4.1%
농성역 6
 
4.1%
김대중컨벤션센터 6
 
4.1%
마륵)역 6
 
4.1%
Other values (13) 51
34.7%
Distinct69
Distinct (%)60.0%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
2023-12-12T09:26:54.526347image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length472
Median length182
Mean length124.73043
Min length2

Characters and Unicode

Total characters14344
Distinct characters415
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique39 ?
Unique (%)33.9%

Sample

1st row오늘도 광주도시철도를 이용해 주셔서 감사합니다. 가시는 목적지까지 안전하고 편안하게 모시겠습니다. Thank you for taking the Gwangju subway. We'll take you to your destination safely and comfortably.
2nd row퓨전국악【돈돌날이 (국악신호음악CD1 - 34)】
3rd row이 열차는 [평동, 평동]행 열차입니다. [평동] 방면으로 가실 손님은 이 열차를 이용하시기 바랍니다. 감사합니다. This train is for [Pyeongdong, Pyeongdong]. Thank you.
4th row승객여러분! 코로나-19 예방을 위해 마스크를 착용하지 않은 경우 감염병예방법에 따라 과태료가 부과될 수 있음을 알려드리오니 열차 이용 시 반드시 마스크를 착용해주시기 바랍니다.
5th row[공사 로고송] 안전하고 신속해요. 편안하고 쾌적해요. 항상 우리 곁에 함께해요. 광주도시철도공사 광주도시철도공사
ValueCountFrequency (%)
바랍니다 77
 
2.8%
이번 68
 
2.5%
the 49
 
1.8%
your 48
 
1.8%
station 46
 
1.7%
내리실 43
 
1.6%
this 43
 
1.6%
is 43
 
1.6%
역은 40
 
1.5%
있습니다 39
 
1.4%
Other values (602) 2216
81.7%
2023-12-12T09:26:55.055473image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2651
 
18.5%
o 421
 
2.9%
. 371
 
2.6%
n 301
 
2.1%
a 261
 
1.8%
257
 
1.8%
t 252
 
1.8%
249
 
1.7%
e 248
 
1.7%
244
 
1.7%
Other values (405) 9089
63.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 7070
49.3%
Lowercase Letter 3165
22.1%
Space Separator 2651
 
18.5%
Other Punctuation 618
 
4.3%
Uppercase Letter 307
 
2.1%
Decimal Number 196
 
1.4%
Open Punctuation 151
 
1.1%
Close Punctuation 150
 
1.0%
Dash Punctuation 36
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
257
 
3.6%
249
 
3.5%
244
 
3.5%
219
 
3.1%
154
 
2.2%
138
 
2.0%
131
 
1.9%
124
 
1.8%
121
 
1.7%
115
 
1.6%
Other values (340) 5318
75.2%
Lowercase Letter
ValueCountFrequency (%)
o 421
13.3%
n 301
9.5%
a 261
8.2%
t 252
 
8.0%
e 248
 
7.8%
s 244
 
7.7%
i 240
 
7.6%
r 230
 
7.3%
h 167
 
5.3%
g 165
 
5.2%
Other values (13) 636
20.1%
Uppercase Letter
ValueCountFrequency (%)
T 98
31.9%
S 34
 
11.1%
C 33
 
10.7%
P 25
 
8.1%
G 22
 
7.2%
D 19
 
6.2%
M 16
 
5.2%
N 12
 
3.9%
A 10
 
3.3%
H 8
 
2.6%
Other values (8) 30
 
9.8%
Decimal Number
ValueCountFrequency (%)
1 38
19.4%
2 35
17.9%
0 30
15.3%
8 25
12.8%
4 23
11.7%
5 20
10.2%
9 10
 
5.1%
3 8
 
4.1%
6 7
 
3.6%
Other Punctuation
ValueCountFrequency (%)
. 371
60.0%
, 156
25.2%
' 43
 
7.0%
! 36
 
5.8%
& 4
 
0.6%
# 4
 
0.6%
; 4
 
0.6%
Close Punctuation
ValueCountFrequency (%)
] 104
69.3%
) 45
30.0%
1
 
0.7%
Open Punctuation
ValueCountFrequency (%)
[ 104
68.9%
( 46
30.5%
1
 
0.7%
Space Separator
ValueCountFrequency (%)
2651
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 36
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 7070
49.3%
Common 3802
26.5%
Latin 3472
24.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
257
 
3.6%
249
 
3.5%
244
 
3.5%
219
 
3.1%
154
 
2.2%
138
 
2.0%
131
 
1.9%
124
 
1.8%
121
 
1.7%
115
 
1.6%
Other values (340) 5318
75.2%
Latin
ValueCountFrequency (%)
o 421
12.1%
n 301
 
8.7%
a 261
 
7.5%
t 252
 
7.3%
e 248
 
7.1%
s 244
 
7.0%
i 240
 
6.9%
r 230
 
6.6%
h 167
 
4.8%
g 165
 
4.8%
Other values (31) 943
27.2%
Common
ValueCountFrequency (%)
2651
69.7%
. 371
 
9.8%
, 156
 
4.1%
] 104
 
2.7%
[ 104
 
2.7%
( 46
 
1.2%
) 45
 
1.2%
' 43
 
1.1%
1 38
 
1.0%
! 36
 
0.9%
Other values (14) 208
 
5.5%

Most occurring blocks

ValueCountFrequency (%)
ASCII 7272
50.7%
Hangul 7070
49.3%
None 2
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2651
36.5%
o 421
 
5.8%
. 371
 
5.1%
n 301
 
4.1%
a 261
 
3.6%
t 252
 
3.5%
e 248
 
3.4%
s 244
 
3.4%
i 240
 
3.3%
r 230
 
3.2%
Other values (53) 2053
28.2%
Hangul
ValueCountFrequency (%)
257
 
3.6%
249
 
3.5%
244
 
3.5%
219
 
3.1%
154
 
2.2%
138
 
2.0%
131
 
1.9%
124
 
1.8%
121
 
1.7%
115
 
1.6%
Other values (340) 5318
75.2%
None
ValueCountFrequency (%)
1
50.0%
1
50.0%
Distinct56
Distinct (%)48.7%
Missing0
Missing (%)0.0%
Memory size1.0 KiB
2023-12-12T09:26:55.303684image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length5
Median length3
Mean length3.2869565
Min length2

Characters and Unicode

Total characters378
Distinct characters17
Distinct categories4 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique29 ?
Unique (%)25.2%

Sample

1st rowS04
2nd rowS04
3rd rowS04
4th rowS04
5th rowS04
ValueCountFrequency (%)
s04 12
 
10.4%
광고 10
 
8.7%
s03 6
 
5.2%
s02 6
 
5.2%
n015 5
 
4.3%
n017 4
 
3.5%
n006 3
 
2.6%
n004 2
 
1.7%
p91 2
 
1.7%
p94 2
 
1.7%
Other values (45) 63
54.8%
2023-12-12T09:26:55.699589image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 100
26.5%
N 42
11.1%
1 40
 
10.6%
P 33
 
8.7%
S 24
 
6.3%
4 21
 
5.6%
3 16
 
4.2%
2 16
 
4.2%
8 16
 
4.2%
9 14
 
3.7%
Other values (7) 56
14.8%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 252
66.7%
Uppercase Letter 105
27.8%
Other Letter 20
 
5.3%
Space Separator 1
 
0.3%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
0 100
39.7%
1 40
 
15.9%
4 21
 
8.3%
3 16
 
6.3%
2 16
 
6.3%
8 16
 
6.3%
9 14
 
5.6%
5 11
 
4.4%
7 9
 
3.6%
6 9
 
3.6%
Uppercase Letter
ValueCountFrequency (%)
N 42
40.0%
P 33
31.4%
S 24
22.9%
D 6
 
5.7%
Other Letter
ValueCountFrequency (%)
10
50.0%
10
50.0%
Space Separator
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 253
66.9%
Latin 105
27.8%
Hangul 20
 
5.3%

Most frequent character per script

Common
ValueCountFrequency (%)
0 100
39.5%
1 40
 
15.8%
4 21
 
8.3%
3 16
 
6.3%
2 16
 
6.3%
8 16
 
6.3%
9 14
 
5.5%
5 11
 
4.3%
7 9
 
3.6%
6 9
 
3.6%
Latin
ValueCountFrequency (%)
N 42
40.0%
P 33
31.4%
S 24
22.9%
D 6
 
5.7%
Hangul
ValueCountFrequency (%)
10
50.0%
10
50.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 358
94.7%
Hangul 20
 
5.3%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 100
27.9%
N 42
11.7%
1 40
 
11.2%
P 33
 
9.2%
S 24
 
6.7%
4 21
 
5.9%
3 16
 
4.5%
2 16
 
4.5%
8 16
 
4.5%
9 14
 
3.9%
Other values (5) 36
 
10.1%
Hangul
ValueCountFrequency (%)
10
50.0%
10
50.0%

Correlations

2023-12-12T09:26:55.793468image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
방송구간방송멘트파일명
방송구간1.0000.9600.994
방송멘트0.9601.0000.986
파일명0.9940.9861.000

Missing values

2023-12-12T09:26:54.028053image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T09:26:54.100734image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

방송구간방송멘트파일명
0녹동역 (시발역)오늘도 광주도시철도를 이용해 주셔서 감사합니다. 가시는 목적지까지 안전하고 편안하게 모시겠습니다. Thank you for taking the Gwangju subway. We'll take you to your destination safely and comfortably.S04
1녹동역 (시발역)퓨전국악【돈돌날이 (국악신호음악CD1 - 34)】S04
2녹동역 (시발역)이 열차는 [평동, 평동]행 열차입니다. [평동] 방면으로 가실 손님은 이 열차를 이용하시기 바랍니다. 감사합니다. This train is for [Pyeongdong, Pyeongdong]. Thank you.S04
3녹동역 (시발역)승객여러분! 코로나-19 예방을 위해 마스크를 착용하지 않은 경우 감염병예방법에 따라 과태료가 부과될 수 있음을 알려드리오니 열차 이용 시 반드시 마스크를 착용해주시기 바랍니다.S04
4녹동역 (시발역)[공사 로고송] 안전하고 신속해요. 편안하고 쾌적해요. 항상 우리 곁에 함께해요. 광주도시철도공사 광주도시철도공사S04
5녹동역 (시발역)클래식음악(Clarinet Concerto in a Major 클라리넷 협주곡 2악장-모짜르트)S04
6소태역이번 역은 소태, 소태역입니다. 이 역에는 벌교, 고흥, 보성, 장흥방면의 시외버스정류장이 있습니다. 내리실 문은 오른쪽입니다. This station is [Sotae, sotae]. The door's on your [right].N001
7소태역 (시발역)오늘도 광주도시철도를 이용해 주셔서 감사합니다. 가시는 목적지까지 안전하고 편안하게 모시겠습니다. Thank you for taking the Gwangju subway. We'll take you to your destination safely and comfortably.S04
8소태역 (시발역)퓨전국악(돈돌날이 (국악신호음악CD1 - 34))S04
9소태역 (시발역)이 열차는 [평동, 평동]행 열차입니다. [평동] 방면으로 가실 손님은 이 열차를 이용하시기 바랍니다. 감사합니다. This train is for [Pyeongdong, Pyeongdong]. Thank you.S04
방송구간방송멘트파일명
105남광주역이번 역은남광주, 남광주역입니다. 이 역에는 추억여행전시관과 열린도서관이 있습니다. 내리실 문은오른쪽입니다. 남광주시장, 전남대학교병원, 조선대학교 방면으로 가실 분은 이번 역에서 내리시기 바랍니다. This station is [Namgwangju, Namgwangju].The door's on your [right].N003
106남광주역파랑새안과(광고)광고
107학동증심사입구승객여러분! 저희 도시철도는 승객안전과 범죄예방을 위해 노력하고 있습니다. 위험물 소지자나 거동수상자, 의심스러운 물체 등을 발견하시면 112 또는 604-8000번으로 즉시 신고해주시기 바랍니다.P82
108학동증심사입구이번 역은 학동증심사입구, 학동증심사입구역입니다. 이 역에는 무등산국립공원테마관이 있습니다. 내리실 문은 오른쪽입니다. 대중교통수단을 이용하여 무등산에 가실 분은 이번 역에서 내리시기 바라며, 도보로 가실 분은 소태역 3, 4번 출구와 연결된 무등산 등산로를 이용하시기 바랍니다. 광주의 명산, 무등산을 사랑합시다. This station is [Hakdong&#8228;JeungSimsa, Hakdong&#8228;JeungSimsa]. The door's on your [right].N002
109소태역 (종착역)퓨전국악(벨소리2 (CD1 - 2))D03
110소태역 (종착역)이번 역은 이 열차의 종착역인 [소태, 소태]역입니다. 이 역에는 벌교, 고흥, 보성, 장흥방면의 시외버스정류장이 있습니다. 내리실 문은 [오른쪽]입니다. 내리실 때에는 차안에 두고 내리는 물건이 없는지 다시 한번 살펴보시기 바랍니다. 오늘도 저희 광주도시철도 [1호선]을 이용해 주셔서 감사합니다. 안녕히 가십시오. This station is [Sotae, sotae]. The door's on your [right]. The last station. Please check to make sure you have all your belongings with you, as you leave the train. Thank you. 이번역은 종착역입니다. 승객여러분께서는 모두 하차해 주시기 바랍니다. 녹동행 열차를 이용하실 분은 녹동행 열차시간표를 확인하여 다음 열차를 이용하시기 바랍니다.D03
111소태역승객여러분! 쾌적하고 편안한 도시철도 이용을 위하여 역구내와 전동차 내에서 허가 없이 종교활동이나 물품을 판매하는 행위 등은 금지되어 있습니다. 올바른 도시철도 이용문화 조성 및 기초질서확립에 협조하여 주시기 바랍니다.P81
112소태역이번 역은 소태, 소태역입니다. 이 역에는 벌교, 고흥, 보성, 장흥방면의 시외버스정류장이 있습니다. 내리실 문은 오른쪽입니다. This station is [Sotae, sotae]. The door's on your [right].N001
113녹동역퓨전국악(벨소리2 (CD1 - 2))D02
114녹동역이번 역은 이 열차의 종착역인 [녹동, 녹동]역입니다. 내리실 문은 [오른쪽]입니다. 내리실 때에는 차안에 두고 내리는 물건이 없는지 다시 한번 살펴보시기 바랍니다. 오늘도 저희 광주도시철도 [1호선]을 이용해 주셔서 감사합니다. 안녕히 가십시오. This station is [Nokdong, Nokdong]. The door's on your [right]. The last station. Please check to make sure you have all your belongings with you, as you leave the train. Thank you. 이번역은 종착역입니다.D02

Duplicate rows

Most frequently occurring

방송구간방송멘트파일명# duplicates
0공항역새소리N0152
1공항역이번 역은 공항, 공항역입니다. 내리실 문은 오른쪽입니다. 광주공항으로 가실 분은 이번 역에서 내리시기 바랍니다. This station is [Airport. Airport]. The door's on your [right]. Passengers to Gwangju Airport get off here.N0152
2광주송정역새소리N0172
3금남로4가역스마트 저축은행(광고)광고2
4금남로5가역이번 역은 금남로5가, 금남로5가역입니다. 이 역에는 광주학생독립운동기념홍보관과 추억의 영화거리가 있습니다. 내리실 문은 오른쪽입니다. 동부소방서나 광주고용복지플러스센터 방면으로 가실 분은 이번 역에서 내리시기 바랍니다. This station is [Geumnamno 5(o)-ga, Geumnamno 5(o)-ga]. The door's on your [right].N0062
5김대중컨벤션센터 (마륵)역이번 역은 김대중컨벤션센터(마륵), 김대중컨벤션센터(마륵)역입니다. 이 역에는 세계인권전시관이 있습니다. 내리실 문은 오른쪽입니다. This station is [KimDaejung Convention Center(Mareuk), KimDaejung Convention Center(Mareuk)]. The door's on your [right].N0142
6김대중컨벤션센터 (마륵)역조은에스치과광고2
7남광주역파랑새안과(광고)광고2
8농성역MG새마을금고광고2
9상무역애듀윌 광주학원광고2