Overview

Dataset statistics

Number of variables7
Number of observations159
Missing cells0
Missing cells (%)0.0%
Duplicate rows3
Duplicate rows (%)1.9%
Total size in memory9.1 KiB
Average record size in memory58.8 B

Variable types

Categorical6
Text1

Dataset

Description부산교통공사에서 운영하는 부산1호선의 엘리베이터테 대한 데이터로 철도운영기관명, 선명, 역명, 출입구번호, 상세위치, 정원인원, 정원중량의데이터가 있습니다.
Author국가철도공단
URLhttps://www.data.go.kr/data/15041376/fileData.do

Alerts

철도운영기관명 has constant value ""Constant
선명 has constant value ""Constant
Dataset has 3 (1.9%) duplicate rowsDuplicates
정원_중량(kg) is highly overall correlated with 역명 and 1 other fieldsHigh correlation
정원_인원 is highly overall correlated with 역명 and 1 other fieldsHigh correlation
역명 is highly overall correlated with 정원_인원 and 1 other fieldsHigh correlation
정원_인원 is highly imbalanced (63.2%)Imbalance
정원_중량(kg) is highly imbalanced (63.2%)Imbalance

Reproduction

Analysis started2023-12-12 22:47:21.973499
Analysis finished2023-12-12 22:47:22.487655
Duration0.51 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

철도운영기관명
Categorical

CONSTANT 

Distinct1
Distinct (%)0.6%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
부산교통공사
159 

Length

Max length6
Median length6
Mean length6
Min length6

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row부산교통공사
2nd row부산교통공사
3rd row부산교통공사
4th row부산교통공사
5th row부산교통공사

Common Values

ValueCountFrequency (%)
부산교통공사 159
100.0%

Length

2023-12-13T07:47:22.560640image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T07:47:22.660943image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
부산교통공사 159
100.0%

선명
Categorical

CONSTANT 

Distinct1
Distinct (%)0.6%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
1호선
159 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row1호선
2nd row1호선
3rd row1호선
4th row1호선
5th row1호선

Common Values

ValueCountFrequency (%)
1호선 159
100.0%

Length

2023-12-13T07:47:22.744653image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T07:47:22.822398image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
1호선 159
100.0%

역명
Categorical

HIGH CORRELATION 

Distinct40
Distinct (%)25.2%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
동매
 
10
범내골
 
6
양정
 
6
다대포해수욕장
 
6
당리
 
5
Other values (35)
126 

Length

Max length7
Median length2
Mean length2.5220126
Min length2

Unique

Unique2 ?
Unique (%)1.3%

Sample

1st row노포
2nd row노포
3rd row범어사
4th row범어사
5th row범어사

Common Values

ValueCountFrequency (%)
동매 10
 
6.3%
범내골 6
 
3.8%
양정 6
 
3.8%
다대포해수욕장 6
 
3.8%
당리 5
 
3.1%
하단 5
 
3.1%
교대 5
 
3.1%
낫개 5
 
3.1%
다대포항 5
 
3.1%
1서면 4
 
2.5%
Other values (30) 102
64.2%

Length

2023-12-13T07:47:22.912134image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
동매 10
 
6.3%
양정 6
 
3.8%
다대포해수욕장 6
 
3.8%
범내골 6
 
3.8%
당리 5
 
3.1%
하단 5
 
3.1%
교대 5
 
3.1%
낫개 5
 
3.1%
다대포항 5
 
3.1%
부산역 4
 
2.5%
Other values (30) 102
64.2%

출입구번호
Categorical

Distinct21
Distinct (%)13.2%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
<NA>
58 
3번
15 
4번
15 
1번
14 
2번
12 
Other values (16)
45 

Length

Max length7
Median length2
Mean length2.9496855
Min length1

Unique

Unique6 ?
Unique (%)3.8%

Sample

1st row2번
2nd row2번
3rd row3번
4th row4번
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 58
36.5%
3번 15
 
9.4%
4번 15
 
9.4%
1번 14
 
8.8%
2번 12
 
7.5%
6번 10
 
6.3%
5번 9
 
5.7%
2번4번 5
 
3.1%
7번 3
 
1.9%
13번 2
 
1.3%
Other values (11) 16
 
10.1%

Length

2023-12-13T07:47:23.021867image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
na 58
36.2%
4번 16
 
10.0%
3번 15
 
9.4%
1번 14
 
8.8%
2번 12
 
7.5%
6번 11
 
6.9%
5번 9
 
5.6%
2번4번 5
 
3.1%
7번 3
 
1.9%
6번8번 2
 
1.2%
Other values (10) 15
 
9.4%
Distinct155
Distinct (%)97.5%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
2023-12-13T07:47:23.227942image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length64
Median length51
Mean length36.842767
Min length13

Characters and Unicode

Total characters5858
Distinct characters174
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique152 ?
Unique (%)95.6%

Sample

1st row(2F) 2번 출입구 앞 (1F) 밤어사역 방향 승강장 6-1 출입문 앞
2nd row(2F) 2번 출입구 앞 (1F) 노포행 승강장 6-1 출입문 앞
3rd row(1F) 3번출입구 (B2) 1번/3번 출입구 방향
4th row(1F) 4번출입구(B2) 2번/4번 출입구 방향
5th row(B2) 남산역 방향 표내는 곳 내 1번/3번 출입구 방향(B3) 남산역 방향 승강장 8-1 출입문 앞
ValueCountFrequency (%)
출입구 134
 
9.0%
방향 121
 
8.1%
1f 89
 
6.0%
승강장 69
 
4.6%
68
 
4.6%
b1 68
 
4.6%
출입문 64
 
4.3%
55
 
3.7%
36
 
2.4%
근처 23
 
1.5%
Other values (230) 763
51.2%
2023-12-13T07:47:23.588836image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1362
23.3%
1 325
 
5.5%
( 316
 
5.4%
) 316
 
5.4%
231
 
3.9%
217
 
3.7%
211
 
3.6%
B 193
 
3.3%
169
 
2.9%
139
 
2.4%
Other values (164) 2379
40.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2712
46.3%
Space Separator 1362
23.3%
Decimal Number 722
 
12.3%
Open Punctuation 316
 
5.4%
Close Punctuation 316
 
5.4%
Uppercase Letter 310
 
5.3%
Dash Punctuation 73
 
1.2%
Other Punctuation 43
 
0.7%
Lowercase Letter 4
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
231
 
8.5%
217
 
8.0%
211
 
7.8%
169
 
6.2%
139
 
5.1%
133
 
4.9%
106
 
3.9%
92
 
3.4%
90
 
3.3%
79
 
2.9%
Other values (142) 1245
45.9%
Decimal Number
ValueCountFrequency (%)
1 325
45.0%
2 137
19.0%
3 83
 
11.5%
4 51
 
7.1%
6 37
 
5.1%
5 33
 
4.6%
0 22
 
3.0%
7 20
 
2.8%
8 13
 
1.8%
9 1
 
0.1%
Uppercase Letter
ValueCountFrequency (%)
B 193
62.3%
F 110
35.5%
X 3
 
1.0%
G 3
 
1.0%
L 1
 
0.3%
Other Punctuation
ValueCountFrequency (%)
/ 37
86.0%
. 6
 
14.0%
Space Separator
ValueCountFrequency (%)
1362
100.0%
Open Punctuation
ValueCountFrequency (%)
( 316
100.0%
Close Punctuation
ValueCountFrequency (%)
) 316
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 73
100.0%
Lowercase Letter
ValueCountFrequency (%)
m 4
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 2832
48.3%
Hangul 2712
46.3%
Latin 314
 
5.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
231
 
8.5%
217
 
8.0%
211
 
7.8%
169
 
6.2%
139
 
5.1%
133
 
4.9%
106
 
3.9%
92
 
3.4%
90
 
3.3%
79
 
2.9%
Other values (142) 1245
45.9%
Common
ValueCountFrequency (%)
1362
48.1%
1 325
 
11.5%
( 316
 
11.2%
) 316
 
11.2%
2 137
 
4.8%
3 83
 
2.9%
- 73
 
2.6%
4 51
 
1.8%
/ 37
 
1.3%
6 37
 
1.3%
Other values (6) 95
 
3.4%
Latin
ValueCountFrequency (%)
B 193
61.5%
F 110
35.0%
m 4
 
1.3%
X 3
 
1.0%
G 3
 
1.0%
L 1
 
0.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 3146
53.7%
Hangul 2712
46.3%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1362
43.3%
1 325
 
10.3%
( 316
 
10.0%
) 316
 
10.0%
B 193
 
6.1%
2 137
 
4.4%
F 110
 
3.5%
3 83
 
2.6%
- 73
 
2.3%
4 51
 
1.6%
Other values (12) 180
 
5.7%
Hangul
ValueCountFrequency (%)
231
 
8.5%
217
 
8.0%
211
 
7.8%
169
 
6.2%
139
 
5.1%
133
 
4.9%
106
 
3.9%
92
 
3.4%
90
 
3.3%
79
 
2.9%
Other values (142) 1245
45.9%

정원_인원
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct4
Distinct (%)2.5%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
13
136 
15
18 
10
 
3
8
 
2

Length

Max length2
Median length2
Mean length1.9874214
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row10
2nd row10
3rd row13
4th row13
5th row13

Common Values

ValueCountFrequency (%)
13 136
85.5%
15 18
 
11.3%
10 3
 
1.9%
8 2
 
1.3%

Length

2023-12-13T07:47:23.739407image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T07:47:23.850171image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
13 136
85.5%
15 18
 
11.3%
10 3
 
1.9%
8 2
 
1.3%

정원_중량(kg)
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct4
Distinct (%)2.5%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
1000
136 
1150
18 
750
 
3
630
 
2

Length

Max length4
Median length4
Mean length3.9685535
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row750
2nd row750
3rd row1000
4th row1000
5th row1000

Common Values

ValueCountFrequency (%)
1000 136
85.5%
1150 18
 
11.3%
750 3
 
1.9%
630 2
 
1.3%

Length

2023-12-13T07:47:23.954051image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T07:47:24.060328image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
1000 136
85.5%
1150 18
 
11.3%
750 3
 
1.9%
630 2
 
1.3%

Correlations

2023-12-13T07:47:24.127947image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
역명출입구번호정원_인원정원_중량(kg)
역명1.0000.5270.9300.930
출입구번호0.5271.0000.0000.000
정원_인원0.9300.0001.0001.000
정원_중량(kg)0.9300.0001.0001.000
2023-12-13T07:47:24.208954image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
정원_중량(kg)출입구번호역명정원_인원
정원_중량(kg)1.0000.0000.6231.000
출입구번호0.0001.0000.1190.000
역명0.6230.1191.0000.623
정원_인원1.0000.0000.6231.000
2023-12-13T07:47:24.283437image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
역명출입구번호정원_인원정원_중량(kg)
역명1.0000.1190.6230.623
출입구번호0.1191.0000.0000.000
정원_인원0.6230.0001.0001.000
정원_중량(kg)0.6230.0001.0001.000

Missing values

2023-12-13T07:47:22.301256image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T07:47:22.433899image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

철도운영기관명선명역명출입구번호상세위치정원_인원정원_중량(kg)
0부산교통공사1호선노포2번(2F) 2번 출입구 앞 (1F) 밤어사역 방향 승강장 6-1 출입문 앞10750
1부산교통공사1호선노포2번(2F) 2번 출입구 앞 (1F) 노포행 승강장 6-1 출입문 앞10750
2부산교통공사1호선범어사3번(1F) 3번출입구 (B2) 1번/3번 출입구 방향131000
3부산교통공사1호선범어사4번(1F) 4번출입구(B2) 2번/4번 출입구 방향131000
4부산교통공사1호선범어사<NA>(B2) 남산역 방향 표내는 곳 내 1번/3번 출입구 방향(B3) 남산역 방향 승강장 8-1 출입문 앞131000
5부산교통공사1호선범어사<NA>(B2) 노포역 방향 표내는 곳 내 2번/4번 출입구방향(B3) 노포역 방향 승강장 8-1출입문 앞131000
6부산교통공사1호선남산3번(1F) 3번 출입구 앞(B1) 10번 표내는 곳 옆131000
7부산교통공사1호선남산4번(1F) 4번 출입구 앞(B1) 20번 표내는 곳 옆131000
8부산교통공사1호선남산<NA>(B1) 15번 표내는 곳 앞(B2) 두실역 방향 승강장 5-3 출입문 앞131000
9부산교통공사1호선남산<NA>(B1) 25번 표내는 곳 앞 2번/4번 출입구 방향(B2) 범어사역 방향 승강장 8-2 출입문 앞131000
철도운영기관명선명역명출입구번호상세위치정원_인원정원_중량(kg)
149부산교통공사1호선다대포항3번(B1) 3번 출입구 방향 (중층) 3번 출입구 방향 (1F) 3번 출입구 옆151150
150부산교통공사1호선다대포항4번(B1) 4번 출입구 방향 (중층) 4번 출입구 방향 (1F) 4번 출입구 옆 (2F) 4번 출입구 옆151150
151부산교통공사1호선다대포항<NA>(B2) 다대포해수욕장역 방향 5-1 출입문 앞 (B1) 다대포해수욕장역 방향 표내는 곳 안151150
152부산교통공사1호선다대포항<NA>(B2) 낫개역 방향 5-1 출잎문 앞 (B1) 낫개역 방향 표내는 곳 안151150
153부산교통공사1호선다대포해수욕장3번(1F) 3번 출입구 옆(B1) 13번 출입구 방향 에스컬레이터 3호기 앞151150
154부산교통공사1호선다대포해수욕장4번(1F) 2번 출입구 옆(B1) 고객센터 옆151150
155부산교통공사1호선다대포해수욕장<NA>(B1) 20번대 표 내는 곳 옆(B2) 상선 방향 승강장 6-1 출입문 앞151150
156부산교통공사1호선다대포해수욕장<NA>(B1) 30번대 표 내는 곳 옆(B2) 다대포항역 방향 승강장 6-1 출입문 앞151150
157부산교통공사1호선다대포해수욕장<NA>(1F) 2번 출입구 앞(B2) 지하 주차장151150
158부산교통공사1호선다대포해수욕장<NA>(1F) 지상 주차장(B2) 지하 주차장131000

Duplicate rows

Most frequently occurring

철도운영기관명선명역명출입구번호상세위치정원_인원정원_중량(kg)# duplicates
2부산교통공사1호선동매6번(1F) 6번 출입구 앞(B1) 대합실 만남의 광장 근처1310003
0부산교통공사1호선당리3번(1F) 3번출입구 엘리베이터 자체가 3번 출입구로 지정(계단X)1310002
1부산교통공사1호선동매1번(1F) 1번 출입구 앞(B1) 대합실 고객센터 근처1310002