Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 360 |
Missing cells | 1 |
Missing cells (%) | < 0.1% |
Duplicate rows | 17 |
Duplicate rows (%) | 4.7% |
Total size in memory | 20.2 KiB |
Average record size in memory | 57.4 B |
Variable types
Categorical | 4 |
---|---|
Text | 2 |
Numeric | 1 |
Dataset
Description | 부산교통공사에서 관리하는 도시광역철도역들의 철도운영기관명, 선명, 역명, 공기호흡기의 역층, 출구번호, 상세위치의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041446/fileData.do |
철도운영기관명 has constant value "" | Constant |
Dataset has 17 (4.7%) duplicate rows | Duplicates |
출입구번호 is highly overall correlated with 층 and 1 other fields | High correlation |
지상지하 is highly overall correlated with 층 and 1 other fields | High correlation |
층 is highly overall correlated with 선명 and 2 other fields | High correlation |
선명 is highly overall correlated with 층 | High correlation |
지상지하 is highly imbalanced (97.2%) | Imbalance |
출입구번호 is highly imbalanced (84.0%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 12:09:31.460737 |
---|---|
Analysis finished | 2023-12-12 12:09:32.133062 |
Duration | 0.67 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
부산교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산교통공사 |
---|---|
2nd row | 부산교통공사 |
3rd row | 부산교통공사 |
4th row | 부산교통공사 |
5th row | 부산교통공사 |
Common Values
Value | Count | Frequency (%) |
부산교통공사 | 360 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부산교통공사 | 360 |
선명
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 1.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
1호선 | |
---|---|
2호선 | |
3호선 | |
4호선 | |
3호선 | 5 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0138889 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1호선 |
---|---|
2nd row | 1호선 |
3rd row | 1호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
1호선 | 132 | |
2호선 | 95 | |
3호선 | 66 | |
4호선 | 62 | |
3호선 | 5 | 1.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1호선 | 132 | |
2호선 | 95 | |
3호선 | 71 | |
4호선 | 62 |
역명
Text
Distinct | 87 |
---|---|
Distinct (%) | 24.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
Value | Count | Frequency (%) |
동래역 | 10 | 2.8% |
배산역 | 10 | 2.8% |
대티역 | 10 | 2.8% |
연산역 | 9 | 2.5% |
서대신역 | 8 | 2.2% |
명장역 | 8 | 2.2% |
충렬사역 | 8 | 2.2% |
수안역 | 8 | 2.2% |
종합운동장역 | 8 | 2.2% |
서동역 | 8 | 2.2% |
Other values (77) | 273 |
Most occurring characters
Value | Count | Frequency (%) |
역 | 360 | |
대 | 50 | 3.9% |
산 | 45 | 3.6% |
동 | 43 | 3.4% |
장 | 40 | 3.2% |
사 | 30 | 2.4% |
남 | 25 | 2.0% |
수 | 22 | 1.7% |
서 | 21 | 1.7% |
포 | 19 | 1.5% |
Other values (106) | 612 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1265 | |
Other Punctuation | 2 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
역 | 360 | |
대 | 50 | 4.0% |
산 | 45 | 3.6% |
동 | 43 | 3.4% |
장 | 40 | 3.2% |
사 | 30 | 2.4% |
남 | 25 | 2.0% |
수 | 22 | 1.7% |
서 | 21 | 1.7% |
포 | 19 | 1.5% |
Other values (105) | 610 |
Other Punctuation
Value | Count | Frequency (%) |
· | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1265 | |
Common | 2 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
역 | 360 | |
대 | 50 | 4.0% |
산 | 45 | 3.6% |
동 | 43 | 3.4% |
장 | 40 | 3.2% |
사 | 30 | 2.4% |
남 | 25 | 2.0% |
수 | 22 | 1.7% |
서 | 21 | 1.7% |
포 | 19 | 1.5% |
Other values (105) | 610 |
Common
Value | Count | Frequency (%) |
· | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1265 | |
None | 2 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
역 | 360 | |
대 | 50 | 4.0% |
산 | 45 | 3.6% |
동 | 43 | 3.4% |
장 | 40 | 3.2% |
사 | 30 | 2.4% |
남 | 25 | 2.0% |
수 | 22 | 1.7% |
서 | 21 | 1.7% |
포 | 19 | 1.5% |
Other values (105) | 610 |
None
Value | Count | Frequency (%) |
· | 2 |
지상지하
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
지하 | |
---|---|
중층 | 1 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 지하 |
---|---|
2nd row | 중층 |
3rd row | 지하 |
4th row | 지하 |
5th row | 지하 |
Common Values
Value | Count | Frequency (%) |
지하 | 359 | |
중층 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하 | 359 | |
중층 | 1 | 0.3% |
층
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 2.5% |
Missing | 1 |
Missing (%) | 0.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.1810585 |
Minimum | 1 |
---|---|
Maximum | 9 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 2 |
95-th percentile | 5 |
Maximum | 9 |
Range | 8 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 1.4562821 |
---|---|
Coefficient of variation (CV) | 0.66769511 |
Kurtosis | 7.2244943 |
Mean | 2.1810585 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 2.4160847 |
Sum | 783 |
Variance | 2.1207575 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2 | 159 | |
1 | 118 | |
3 | 41 | 11.4% |
4 | 17 | 4.7% |
5 | 10 | 2.8% |
6 | 4 | 1.1% |
8 | 4 | 1.1% |
9 | 4 | 1.1% |
7 | 2 | 0.6% |
(Missing) | 1 | 0.3% |
Value | Count | Frequency (%) |
1 | 118 | |
2 | 159 | |
3 | 41 | 11.4% |
4 | 17 | 4.7% |
5 | 10 | 2.8% |
6 | 4 | 1.1% |
7 | 2 | 0.6% |
8 | 4 | 1.1% |
9 | 4 | 1.1% |
Value | Count | Frequency (%) |
9 | 4 | 1.1% |
8 | 4 | 1.1% |
7 | 2 | 0.6% |
6 | 4 | 1.1% |
5 | 10 | 2.8% |
4 | 17 | 4.7% |
3 | 41 | 11.4% |
2 | 159 | |
1 | 118 |
출입구번호
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 12 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
<NA> | |
---|---|
2/4 | 4 |
2 | 4 |
4 | 3 |
5 | 2 |
Other values (7) | 11 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.8388889 |
Min length | 1 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.8% |
Sample
1st row | 2/4 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 336 | |
2/4 | 4 | 1.1% |
2 | 4 | 1.1% |
4 | 3 | 0.8% |
5 | 2 | 0.6% |
3 | 2 | 0.6% |
7 | 2 | 0.6% |
1 | 2 | 0.6% |
10 | 2 | 0.6% |
3/4/6 | 1 | 0.3% |
Other values (2) | 2 | 0.6% |
Length
Value | Count | Frequency (%) |
na | 336 | |
2/4 | 4 | 1.1% |
2 | 4 | 1.1% |
4 | 3 | 0.8% |
5 | 2 | 0.6% |
3 | 2 | 0.6% |
7 | 2 | 0.6% |
1 | 2 | 0.6% |
10 | 2 | 0.6% |
3/4/6 | 1 | 0.3% |
Other values (2) | 2 | 0.6% |
상세위치
Text
Distinct | 298 |
---|---|
Distinct (%) | 82.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
Length
Max length | 69 |
---|---|
Median length | 28 |
Mean length | 16.494444 |
Min length | 4 |
Characters and Unicode
Total characters | 5938 |
---|---|
Distinct characters | 191 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 279 ? |
---|---|
Unique (%) | 77.5% |
Sample
1st row | (B1) 역무안전실 출입문 인근 |
---|---|
2nd row | (중층) 중층 복도 |
3rd row | (B2) 기능동 환기실D 복도 |
4th row | (B2) 상선 2-3 맞은편 소화전 내 |
5th row | (B2) 상선 7-2 맞은편 소화전 내 |
Value | Count | Frequency (%) |
앞 | 127 | 8.4% |
승강장 | 91 | 6.0% |
b2 | 88 | 5.8% |
역무안전실 | 69 | 4.6% |
출입문 | 60 | 4.0% |
방향 | 53 | 3.5% |
b1 | 53 | 3.5% |
52 | 3.5% | |
하선 | 51 | 3.4% |
상선 | 49 | 3.3% |
Other values (321) | 812 |
Most occurring characters
Value | Count | Frequency (%) |
1171 | 19.7% | |
( | 274 | 4.6% |
) | 273 | 4.6% |
B | 218 | 3.7% |
2 | 192 | 3.2% |
- | 163 | 2.7% |
역 | 157 | 2.6% |
1 | 155 | 2.6% |
선 | 150 | 2.5% |
실 | 145 | 2.4% |
Other values (181) | 3040 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2994 | |
Space Separator | 1171 | 19.7% |
Decimal Number | 673 | 11.3% |
Uppercase Letter | 298 | 5.0% |
Open Punctuation | 274 | 4.6% |
Close Punctuation | 273 | 4.6% |
Dash Punctuation | 163 | 2.7% |
Other Punctuation | 89 | 1.5% |
Lowercase Letter | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
역 | 157 | 5.2% |
선 | 150 | 5.0% |
실 | 145 | 4.8% |
앞 | 143 | 4.8% |
장 | 138 | 4.6% |
승 | 125 | 4.2% |
강 | 123 | 4.1% |
방 | 110 | 3.7% |
하 | 106 | 3.5% |
출 | 95 | 3.2% |
Other values (154) | 1702 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 218 | |
E | 22 | 7.4% |
S | 18 | 6.0% |
L | 10 | 3.4% |
D | 9 | 3.0% |
P | 8 | 2.7% |
A | 7 | 2.3% |
V | 3 | 1.0% |
G | 2 | 0.7% |
M | 1 | 0.3% |
Decimal Number
Value | Count | Frequency (%) |
2 | 192 | |
1 | 155 | |
3 | 119 | |
4 | 96 | |
5 | 39 | 5.8% |
6 | 34 | 5.1% |
8 | 16 | 2.4% |
7 | 12 | 1.8% |
9 | 6 | 0.9% |
0 | 4 | 0.6% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 2 | |
o | 1 |
Space Separator
Value | Count | Frequency (%) |
1171 |
Open Punctuation
Value | Count | Frequency (%) |
( | 274 |
Close Punctuation
Value | Count | Frequency (%) |
) | 273 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 163 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 89 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2994 | |
Common | 2643 | |
Latin | 301 | 5.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
역 | 157 | 5.2% |
선 | 150 | 5.0% |
실 | 145 | 4.8% |
앞 | 143 | 4.8% |
장 | 138 | 4.6% |
승 | 125 | 4.2% |
강 | 123 | 4.1% |
방 | 110 | 3.7% |
하 | 106 | 3.5% |
출 | 95 | 3.2% |
Other values (154) | 1702 |
Common
Value | Count | Frequency (%) |
1171 | ||
( | 274 | 10.4% |
) | 273 | 10.3% |
2 | 192 | 7.3% |
- | 163 | 6.2% |
1 | 155 | 5.9% |
3 | 119 | 4.5% |
4 | 96 | 3.6% |
/ | 89 | 3.4% |
5 | 39 | 1.5% |
Other values (5) | 72 | 2.7% |
Latin
Value | Count | Frequency (%) |
B | 218 | |
E | 22 | 7.3% |
S | 18 | 6.0% |
L | 10 | 3.3% |
D | 9 | 3.0% |
P | 8 | 2.7% |
A | 7 | 2.3% |
V | 3 | 1.0% |
G | 2 | 0.7% |
s | 2 | 0.7% |
Other values (2) | 2 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2994 | |
ASCII | 2944 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1171 | ||
( | 274 | 9.3% |
) | 273 | 9.3% |
B | 218 | 7.4% |
2 | 192 | 6.5% |
- | 163 | 5.5% |
1 | 155 | 5.3% |
3 | 119 | 4.0% |
4 | 96 | 3.3% |
/ | 89 | 3.0% |
Other values (17) | 194 | 6.6% |
Hangul
Value | Count | Frequency (%) |
역 | 157 | 5.2% |
선 | 150 | 5.0% |
실 | 145 | 4.8% |
앞 | 143 | 4.8% |
장 | 138 | 4.6% |
승 | 125 | 4.2% |
강 | 123 | 4.1% |
방 | 110 | 3.7% |
하 | 106 | 3.5% |
출 | 95 | 3.2% |
Other values (154) | 1702 |
선명 | 역명 | 지상지하 | 층 | 출입구번호 | |
---|---|---|---|---|---|
선명 | 1.000 | 0.990 | 0.000 | 0.705 | 0.776 |
역명 | 0.990 | 1.000 | 0.000 | 0.733 | 0.925 |
지상지하 | 0.000 | 0.000 | 1.000 | NaN | NaN |
층 | 0.705 | 0.733 | NaN | 1.000 | NaN |
출입구번호 | 0.776 | 0.925 | NaN | NaN | 1.000 |
선명 | 출입구번호 | 지상지하 | |
---|---|---|---|
선명 | 1.000 | 0.470 | 0.000 |
출입구번호 | 0.470 | 1.000 | 1.000 |
지상지하 | 0.000 | 1.000 | 1.000 |
층 | 선명 | 지상지하 | 출입구번호 | |
---|---|---|---|---|
층 | 1.000 | 0.503 | 1.000 | 1.000 |
선명 | 0.503 | 1.000 | 0.000 | 0.470 |
지상지하 | 1.000 | 0.000 | 1.000 | 1.000 |
출입구번호 | 1.000 | 0.470 | 1.000 | 1.000 |
철도운영기관명 | 선명 | 역명 | 지상지하 | 층 | 출입구번호 | 상세위치 | |
---|---|---|---|---|---|---|---|
0 | 부산교통공사 | 1호선 | 다대포해수욕장역 | 지하 | 1 | 2/4 | (B1) 역무안전실 출입문 인근 |
1 | 부산교통공사 | 1호선 | 다대포해수욕장역 | 중층 | <NA> | <NA> | (중층) 중층 복도 |
2 | 부산교통공사 | 1호선 | 다대포해수욕장역 | 지하 | 2 | <NA> | (B2) 기능동 환기실D 복도 |
3 | 부산교통공사 | 1호선 | 다대포해수욕장역 | 지하 | 2 | <NA> | (B2) 상선 2-3 맞은편 소화전 내 |
4 | 부산교통공사 | 1호선 | 다대포해수욕장역 | 지하 | 2 | <NA> | (B2) 상선 7-2 맞은편 소화전 내 |
5 | 부산교통공사 | 1호선 | 다대포해수욕장역 | 지하 | 2 | <NA> | (B2) 하선 2-3 맞은편 소화전 |
6 | 부산교통공사 | 1호선 | 다대포해수욕장역 | 지하 | 2 | <NA> | (B2) 하선 7-2 맞은편 소화전 내 |
7 | 부산교통공사 | 1호선 | 다대포항역 | 지하 | 2 | <NA> | (B2) 다대포해수욕장역 방향(상행) 승강장 6-2 |
8 | 부산교통공사 | 1호선 | 다대포항역 | 지하 | 2 | <NA> | (B2) 낫개역 방향(하행) 승강장 6-2 |
9 | 부산교통공사 | 1호선 | 다대포항역 | 지하 | 2 | <NA> | (B2) 다대포해수욕장역 방향(상행) 승강장 3-2 |
철도운영기관명 | 선명 | 역명 | 지상지하 | 층 | 출입구번호 | 상세위치 | |
---|---|---|---|---|---|---|---|
350 | 부산교통공사 | 4호선 | 금사역 | 지하 | 1 | <NA> | 대합실 역무기기실앞(1) |
351 | 부산교통공사 | 4호선 | 금사역 | 지하 | 2 | <NA> | 지하2층 미화원실앞(3) |
352 | 부산교통공사 | 4호선 | 금사역 | 지하 | 2 | <NA> | 승강장 하선방향(5) |
353 | 부산교통공사 | 4호선 | 금사역 | 지하 | 2 | <NA> | 지하2층 신호통신실앞(4) |
354 | 부산교통공사 | 4호선 | 금사역 | 지하 | 2 | <NA> | 승강장 상선방향(6) |
355 | 부산교통공사 | 4호선 | 금사역 | 지하 | 1 | <NA> | 대합실 역무실옆(2) |
356 | 부산교통공사 | 4호선 | 반여농산물시장역 | 지하 | 2 | <NA> | 상선승강장(금사방면) |
357 | 부산교통공사 | 4호선 | 반여농산물시장역 | 지하 | 2 | <NA> | 상선승강장(석대방면) |
358 | 부산교통공사 | 4호선 | 반여농산물시장역 | 지하 | 2 | <NA> | 하선승강장(금사방면) |
359 | 부산교통공사 | 4호선 | 반여농산물시장역 | 지하 | 2 | <NA> | 하선승강장(석대방면) |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 지상지하 | 층 | 출입구번호 | 상세위치 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 부산교통공사 | 1호선 | 대티역 | 지하 | 2 | <NA> | (B2) 고객센터앞 | 2 |
1 | 부산교통공사 | 1호선 | 대티역 | 지하 | 3 | <NA> | (B3) 용역대기실 입구 E/S 1호기 우측 | 2 |
2 | 부산교통공사 | 1호선 | 대티역 | 지하 | 4 | <NA> | (B4) B환기실 앞 | 2 |
3 | 부산교통공사 | 1호선 | 범어사역 | 지하 | 1 | <NA> | (B1) 용역대기실 앞 | 2 |
4 | 부산교통공사 | 1호선 | 범어사역 | 지하 | 2 | <NA> | (B1) 고객안내실 | 2 |
5 | 부산교통공사 | 1호선 | 서대신역 | 지하 | 2 | <NA> | (B2) 역무실 | 2 |
6 | 부산교통공사 | 1호선 | 시청역 | 지하 | 1 | <NA> | (B1) 역무안전실 | 2 |
7 | 부산교통공사 | 1호선 | 신평역 | 지하 | 1 | <NA> | (B1) 역무안전실 내 | 2 |
8 | 부산교통공사 | 1호선 | 장림역 | 지하 | 1 | <NA> | (B1) 고객센터 내부 종합제어실 안 | 2 |
9 | 부산교통공사 | 3호선 | 거제역 | 지하 | 2 | <NA> | (B2)상선승강장 중앙 | 2 |