Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 202 |
Missing cells | 139 |
Missing cells (%) | 8.6% |
Duplicate rows | 10 |
Duplicate rows (%) | 5.0% |
Total size in memory | 13.0 KiB |
Average record size in memory | 65.7 B |
Variable types
Categorical | 6 |
---|---|
Numeric | 1 |
Text | 1 |
Dataset
Description | 부산2호선에 포함된 도시광역철도역들의 철도운영기관명, 선명, 역명, 상하행구분, 출입구번호, 상세위치, 시작층, 종료층의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041354/fileData.do |
철도운영기관 has constant value "" | Constant |
선명 has constant value "" | Constant |
Dataset has 10 (5.0%) duplicate rows | Duplicates |
출입구번호 is highly overall correlated with 역명 | High correlation |
역명 is highly overall correlated with 출입구번호 and 2 other fields | High correlation |
상하행구분 is highly overall correlated with 시작층 and 1 other fields | High correlation |
시작층 is highly overall correlated with 역명 and 2 other fields | High correlation |
종료층 is highly overall correlated with 역명 and 2 other fields | High correlation |
출입구번호 has 139 (68.8%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 12:55:10.112830 |
---|---|
Analysis finished | 2023-12-12 12:55:10.760593 |
Duration | 0.65 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
부산교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산교통공사 |
---|---|
2nd row | 부산교통공사 |
3rd row | 부산교통공사 |
4th row | 부산교통공사 |
5th row | 부산교통공사 |
Common Values
Value | Count | Frequency (%) |
부산교통공사 | 202 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부산교통공사 | 202 |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
2호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2호선 |
---|---|
2nd row | 2호선 |
3rd row | 2호선 |
4th row | 2호선 |
5th row | 2호선 |
Common Values
Value | Count | Frequency (%) |
2호선 | 202 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2호선 | 202 |
역명
Categorical
HIGH CORRELATION
 
Distinct | 29 |
---|---|
Distinct (%) | 14.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
센텀시티(BEXCO·신세계) | 14 |
---|---|
양산(시청·동원과학기술대학교) | 12 |
남양산(범어) | 10 |
민락 | 8 |
금련산 | 8 |
Other values (24) |
Length
Max length | 16 |
---|---|
Median length | 15 |
Mean length | 6.2673267 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 가야 |
---|---|
2nd row | 가야 |
3rd row | 가야 |
4th row | 가야 |
5th row | 가야 |
Common Values
Value | Count | Frequency (%) |
센텀시티(BEXCO·신세계) | 14 | 6.9% |
양산(시청·동원과학기술대학교) | 12 | 5.9% |
남양산(범어) | 10 | 5.0% |
민락 | 8 | 4.0% |
금련산 | 8 | 4.0% |
구명 | 8 | 4.0% |
구남 | 8 | 4.0% |
광안 | 8 | 4.0% |
남천(KBS·수영구청) | 8 | 4.0% |
대연(고려병원) | 8 | 4.0% |
Other values (19) | 110 |
Length
Value | Count | Frequency (%) |
센텀시티(bexco·신세계 | 14 | 6.9% |
양산(시청·동원과학기술대학교 | 12 | 5.9% |
남양산(범어 | 10 | 5.0% |
못골(남구청 | 8 | 4.0% |
가야 | 8 | 4.0% |
동의대 | 8 | 4.0% |
지게골 | 8 | 4.0% |
증산 | 8 | 4.0% |
개금 | 8 | 4.0% |
문현 | 8 | 4.0% |
Other values (19) | 110 |
상하행구분
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
상행 | |
---|---|
하행 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 상행 |
---|---|
2nd row | 하행 |
3rd row | 하행 |
4th row | 상행 |
5th row | 상행 |
Common Values
Value | Count | Frequency (%) |
상행 | 104 | |
하행 | 98 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
상행 | 104 | |
하행 | 98 |
출입구번호
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 15.9% |
Missing | 139 |
Missing (%) | 68.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.2539683 |
Minimum | 1 |
---|---|
Maximum | 15 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 3 |
Q3 | 7 |
95-th percentile | 9 |
Maximum | 15 |
Range | 14 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 3.3647521 |
---|---|
Coefficient of variation (CV) | 0.79096784 |
Kurtosis | 1.4841663 |
Mean | 4.2539683 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 1.2130849 |
Sum | 268 |
Variance | 11.321557 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 17 | 8.4% |
3 | 13 | 6.4% |
2 | 7 | 3.5% |
7 | 6 | 3.0% |
8 | 6 | 3.0% |
5 | 5 | 2.5% |
6 | 4 | 2.0% |
9 | 2 | 1.0% |
15 | 2 | 1.0% |
11 | 1 | 0.5% |
(Missing) | 139 |
Value | Count | Frequency (%) |
1 | 17 | |
2 | 7 | |
3 | 13 | |
5 | 5 | 2.5% |
6 | 4 | 2.0% |
7 | 6 | 3.0% |
8 | 6 | 3.0% |
9 | 2 | 1.0% |
11 | 1 | 0.5% |
15 | 2 | 1.0% |
Value | Count | Frequency (%) |
15 | 2 | 1.0% |
11 | 1 | 0.5% |
9 | 2 | 1.0% |
8 | 6 | 3.0% |
7 | 6 | 3.0% |
6 | 4 | 2.0% |
5 | 5 | 2.5% |
3 | 13 | |
2 | 7 | |
1 | 17 |
상세위치
Text
Distinct | 174 |
---|---|
Distinct (%) | 86.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
Length
Max length | 35 |
---|---|
Median length | 29.5 |
Mean length | 21.049505 |
Min length | 8 |
Characters and Unicode
Total characters | 4252 |
---|---|
Distinct characters | 134 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 151 ? |
---|---|
Unique (%) | 74.8% |
Sample
1st row | (B3) 부암역 방향 승강장 5-1 출입문 앞 |
---|---|
2nd row | (B1) 표내는 곳 내 1/3번 출입구 방향 |
3rd row | (B1) 표내는 곳 내 2/4번 출입구 방향 |
4th row | (B3) 동의대역 방향 승강장 6-4 출입문 앞 |
5th row | (B3) 부암역 방향 승강장 1-1 출입문 앞 |
Value | Count | Frequency (%) |
방향 | 121 | 10.1% |
앞 | 80 | 6.7% |
출입구 | 76 | 6.4% |
출입문 | 69 | 5.8% |
b1 | 62 | 5.2% |
곳 | 47 | 3.9% |
내 | 44 | 3.7% |
승강장 | 42 | 3.5% |
표 | 41 | 3.4% |
b3 | 37 | 3.1% |
Other values (142) | 574 |
Most occurring characters
Value | Count | Frequency (%) |
1013 | ||
( | 191 | 4.5% |
) | 191 | 4.5% |
1 | 186 | 4.4% |
출 | 158 | 3.7% |
입 | 157 | 3.7% |
B | 147 | 3.5% |
방 | 129 | 3.0% |
향 | 121 | 2.8% |
번 | 113 | 2.7% |
Other values (124) | 1846 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2017 | |
Space Separator | 1013 | |
Decimal Number | 529 | 12.4% |
Uppercase Letter | 203 | 4.8% |
Open Punctuation | 191 | 4.5% |
Close Punctuation | 191 | 4.5% |
Dash Punctuation | 82 | 1.9% |
Other Punctuation | 17 | 0.4% |
Math Symbol | 9 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
출 | 158 | 7.8% |
입 | 157 | 7.8% |
방 | 129 | 6.4% |
향 | 121 | 6.0% |
번 | 113 | 5.6% |
내 | 107 | 5.3% |
구 | 93 | 4.6% |
역 | 86 | 4.3% |
앞 | 82 | 4.1% |
문 | 80 | 4.0% |
Other values (100) | 891 |
Decimal Number
Value | Count | Frequency (%) |
1 | 186 | |
2 | 99 | |
3 | 88 | |
4 | 68 | 12.9% |
5 | 30 | 5.7% |
6 | 24 | 4.5% |
0 | 19 | 3.6% |
7 | 8 | 1.5% |
8 | 5 | 0.9% |
9 | 2 | 0.4% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 147 | |
F | 48 | 23.6% |
L | 3 | 1.5% |
E | 3 | 1.5% |
C | 1 | 0.5% |
I | 1 | 0.5% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 16 | |
. | 1 | 5.9% |
Math Symbol
Value | Count | Frequency (%) |
> | 5 | |
~ | 4 |
Space Separator
Value | Count | Frequency (%) |
1013 |
Open Punctuation
Value | Count | Frequency (%) |
( | 191 |
Close Punctuation
Value | Count | Frequency (%) |
) | 191 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 82 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 2032 | |
Hangul | 2017 | |
Latin | 203 | 4.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
출 | 158 | 7.8% |
입 | 157 | 7.8% |
방 | 129 | 6.4% |
향 | 121 | 6.0% |
번 | 113 | 5.6% |
내 | 107 | 5.3% |
구 | 93 | 4.6% |
역 | 86 | 4.3% |
앞 | 82 | 4.1% |
문 | 80 | 4.0% |
Other values (100) | 891 |
Common
Value | Count | Frequency (%) |
1013 | ||
( | 191 | 9.4% |
) | 191 | 9.4% |
1 | 186 | 9.2% |
2 | 99 | 4.9% |
3 | 88 | 4.3% |
- | 82 | 4.0% |
4 | 68 | 3.3% |
5 | 30 | 1.5% |
6 | 24 | 1.2% |
Other values (8) | 60 | 3.0% |
Latin
Value | Count | Frequency (%) |
B | 147 | |
F | 48 | 23.6% |
L | 3 | 1.5% |
E | 3 | 1.5% |
C | 1 | 0.5% |
I | 1 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2235 | |
Hangul | 2017 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1013 | ||
( | 191 | 8.5% |
) | 191 | 8.5% |
1 | 186 | 8.3% |
B | 147 | 6.6% |
2 | 99 | 4.4% |
3 | 88 | 3.9% |
- | 82 | 3.7% |
4 | 68 | 3.0% |
F | 48 | 2.1% |
Other values (14) | 122 | 5.5% |
Hangul
Value | Count | Frequency (%) |
출 | 158 | 7.8% |
입 | 157 | 7.8% |
방 | 129 | 6.4% |
향 | 121 | 6.0% |
번 | 113 | 5.6% |
내 | 107 | 5.3% |
구 | 93 | 4.6% |
역 | 86 | 4.3% |
앞 | 82 | 4.1% |
문 | 80 | 4.0% |
Other values (100) | 891 |
시작층
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
지하1 | |
---|---|
지하3 | |
지상1 | |
지하2 | |
지상2 | |
Other values (3) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | 지하3 |
---|---|
2nd row | 지하1 |
3rd row | 지하1 |
4th row | 지하3 |
5th row | 지하3 |
Common Values
Value | Count | Frequency (%) |
지하1 | 65 | |
지하3 | 50 | |
지상1 | 23 | 11.4% |
지하2 | 22 | 10.9% |
지상2 | 17 | 8.4% |
지하4 | 16 | 7.9% |
지상3 | 8 | 4.0% |
지상4 | 1 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하1 | 65 | |
지하3 | 50 | |
지상1 | 23 | 11.4% |
지하2 | 22 | 10.9% |
지상2 | 17 | 8.4% |
지하4 | 16 | 7.9% |
지상3 | 8 | 4.0% |
지상4 | 1 | 0.5% |
종료층
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
지하1 | |
---|---|
지하3 | |
지하2 | |
지상1 | |
지상2 | |
Other values (3) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | 지하1 |
---|---|
2nd row | 지하3 |
3rd row | 지하3 |
4th row | 지하1 |
5th row | 지하1 |
Common Values
Value | Count | Frequency (%) |
지하1 | 70 | |
지하3 | 40 | |
지하2 | 24 | 11.9% |
지상1 | 24 | 11.9% |
지상2 | 19 | 9.4% |
지하4 | 16 | 7.9% |
지상3 | 8 | 4.0% |
지상4 | 1 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하1 | 70 | |
지하3 | 40 | |
지하2 | 24 | 11.9% |
지상1 | 24 | 11.9% |
지상2 | 19 | 9.4% |
지하4 | 16 | 7.9% |
지상3 | 8 | 4.0% |
지상4 | 1 | 0.5% |
역명 | 상하행구분 | 출입구번호 | 시작층 | 종료층 | |
---|---|---|---|---|---|
역명 | 1.000 | 0.000 | 0.871 | 0.853 | 0.854 |
상하행구분 | 0.000 | 1.000 | 0.000 | 0.772 | 0.820 |
출입구번호 | 0.871 | 0.000 | 1.000 | 0.240 | 0.127 |
시작층 | 0.853 | 0.772 | 0.240 | 1.000 | 0.959 |
종료층 | 0.854 | 0.820 | 0.127 | 0.959 | 1.000 |
역명 | 시작층 | 상하행구분 | 종료층 | |
---|---|---|---|---|
역명 | 1.000 | 0.521 | 0.000 | 0.523 |
시작층 | 0.521 | 1.000 | 0.587 | 0.679 |
상하행구분 | 0.000 | 0.587 | 1.000 | 0.630 |
종료층 | 0.523 | 0.679 | 0.630 | 1.000 |
출입구번호 | 역명 | 상하행구분 | 시작층 | 종료층 | |
---|---|---|---|---|---|
출입구번호 | 1.000 | 0.626 | 0.000 | 0.170 | 0.127 |
역명 | 0.626 | 1.000 | 0.000 | 0.521 | 0.523 |
상하행구분 | 0.000 | 0.000 | 1.000 | 0.587 | 0.630 |
시작층 | 0.170 | 0.521 | 0.587 | 1.000 | 0.679 |
종료층 | 0.127 | 0.523 | 0.630 | 0.679 | 1.000 |
철도운영기관 | 선명 | 역명 | 상하행구분 | 출입구번호 | 상세위치 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|---|
0 | 부산교통공사 | 2호선 | 가야 | 상행 | <NA> | (B3) 부암역 방향 승강장 5-1 출입문 앞 | 지하3 | 지하1 |
1 | 부산교통공사 | 2호선 | 가야 | 하행 | <NA> | (B1) 표내는 곳 내 1/3번 출입구 방향 | 지하1 | 지하3 |
2 | 부산교통공사 | 2호선 | 가야 | 하행 | <NA> | (B1) 표내는 곳 내 2/4번 출입구 방향 | 지하1 | 지하3 |
3 | 부산교통공사 | 2호선 | 가야 | 상행 | <NA> | (B3) 동의대역 방향 승강장 6-4 출입문 앞 | 지하3 | 지하1 |
4 | 부산교통공사 | 2호선 | 가야 | 상행 | <NA> | (B3) 부암역 방향 승강장 1-1 출입문 앞 | 지하3 | 지하1 |
5 | 부산교통공사 | 2호선 | 가야 | 하행 | <NA> | (B1) 표내는 곳 내 3번 출입구 방향 | 지하1 | 지하3 |
6 | 부산교통공사 | 2호선 | 가야 | 하행 | <NA> | (B1) 표내는 곳 내 4번 출입구 방향 | 지하1 | 지하3 |
7 | 부산교통공사 | 2호선 | 가야 | 상행 | <NA> | (B3) 동의대역 방향 승강장 2-4 출입문 앞 | 지하3 | 지하1 |
8 | 부산교통공사 | 2호선 | 개금 | 상행 | <NA> | (B3) 동의대역 방향 4-3 출입문 앞 | 지하3 | 지하1 |
9 | 부산교통공사 | 2호선 | 개금 | 하행 | <NA> | (B1) 13번 출입구 쪽 표 내는 곳 내 | 지하1 | 지하3 |
철도운영기관 | 선명 | 역명 | 상하행구분 | 출입구번호 | 상세위치 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|---|
192 | 부산교통공사 | 2호선 | 지게골 | 상행 | <NA> | (B4) 못골역 방면 승강장 1-1출입문앞 | 지하4 | 지하2 |
193 | 부산교통공사 | 2호선 | 지게골 | 하행 | <NA> | (B2) 전기실 앞 | 지하2 | 지하4 |
194 | 부산교통공사 | 2호선 | 지게골 | 하행 | <NA> | (B2) 신호기기실 앞 | 지하2 | 지하4 |
195 | 부산교통공사 | 2호선 | 지게골 | 상행 | <NA> | (B4) 문현역 방면 승강장 2-4출입문 앞 | 지하4 | 지하2 |
196 | 부산교통공사 | 2호선 | 호포 | 상행 | 3 | (2F) 3번 출입구 근처 | 지상2 | 지상4 |
197 | 부산교통공사 | 2호선 | 호포 | 상행 | <NA> | (4F) 개찰구 | 지상4 | 지상2 |
198 | 부산교통공사 | 2호선 | 화명 | 상행 | 1 | (B1) 대합실 1번 출입구 방향 > (1F) 1번 출입구 앞 | 지하1 | 지상1 |
199 | 부산교통공사 | 2호선 | 화명 | 하행 | 1 | (1F) 1번 출입구 앞 > (B1) 대합실 1번 출입구 방향 | 지상1 | 지하1 |
200 | 부산교통공사 | 2호선 | 화명 | 상행 | 2 | (B1) 대합실 2번 출입구 방향 > (1F) 2번 출입구 앞 | 지하1 | 지상1 |
201 | 부산교통공사 | 2호선 | 화명 | 하행 | 2 | (1F) 2번 출입구 앞 > (B1) 대합실 2번 출입구 방향 | 지상1 | 지하1 |
Most frequently occurring
철도운영기관 | 선명 | 역명 | 상하행구분 | 출입구번호 | 상세위치 | 시작층 | 종료층 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
0 | 부산교통공사 | 2호선 | 구남 | 하행 | <NA> | (B1)표 내는 곳 내 | 지하1 | 지하3 | 4 |
7 | 부산교통공사 | 2호선 | 센텀시티(BEXCO·신세계) | 하행 | <NA> | (B1) 표 내는 곳 계단 옆 | 지하1 | 지하2 | 3 |
1 | 부산교통공사 | 2호선 | 남양산(범어) | 상행 | <NA> | (2F) 2층 대합실 10번대 표 내는 곳 | 지상2 | 지상3 | 2 |
2 | 부산교통공사 | 2호선 | 대연(고려병원) | 하행 | <NA> | (B1) 1~4 표내는 곳 안 | 지하1 | 지하3 | 2 |
3 | 부산교통공사 | 2호선 | 동의대 | 하행 | <NA> | (B2) 5번/7번 출입구 쪽 표내는 곳 내 | 지하2 | 지하4 | 2 |
4 | 부산교통공사 | 2호선 | 동의대 | 하행 | <NA> | (B2)1번 출입구 쪽 표 내는 곳 내 | 지하2 | 지하4 | 2 |
5 | 부산교통공사 | 2호선 | 민락 | 하행 | <NA> | (B1) 표 내는 곳 내 1번/2번 출입구 방향 | 지하1 | 지하3 | 2 |
6 | 부산교통공사 | 2호선 | 민락 | 하행 | <NA> | (B1) 표 내는 곳 내 3번/4번 출입구 방향 | 지하1 | 지하3 | 2 |
8 | 부산교통공사 | 2호선 | 증산 | 상행 | 1 | (1F) 1번 출입구 근처 | 지상1 | 지상2 | 2 |
9 | 부산교통공사 | 2호선 | 증산 | 하행 | 1 | (1F) 1번 출입구 근처 | 지상1 | 지상2 | 2 |