Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 194 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 45 |
Duplicate rows (%) | 23.2% |
Total size in memory | 14.1 KiB |
Average record size in memory | 74.7 B |
Variable types
Categorical | 8 |
---|---|
Numeric | 1 |
Dataset
Description | 부산교통공사에서 운영하는 역사들의 환승정보 데이터로 철도운영기관명, 선명, 역명, 환승철도운영기관, 환승선명, 환승이후역명, 환승기점역명, 차량순서, 차량출입문번호의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041091/fileData.do |
Dataset has 45 (23.2%) duplicate rows | Duplicates |
철도운영기관명 is highly overall correlated with 선명 and 2 other fields | High correlation |
환승철도운영기관 is highly overall correlated with 역명 and 3 other fields | High correlation |
환승기점역명 is highly overall correlated with 환승철도운영기관 and 2 other fields | High correlation |
선명 is highly overall correlated with 철도운영기관명 and 2 other fields | High correlation |
환승선명 is highly overall correlated with 역명 and 3 other fields | High correlation |
역명 is highly overall correlated with 철도운영기관명 and 4 other fields | High correlation |
환승이후역명 is highly overall correlated with 철도운영기관명 and 5 other fields | High correlation |
철도운영기관명 is highly imbalanced (53.5%) | Imbalance |
환승철도운영기관 is highly imbalanced (69.9%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 19:31:31.401375 |
---|---|
Analysis finished | 2023-12-12 19:31:32.564015 |
Duration | 1.16 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
부산교통공사 | |
---|---|
부산김해경전철 | 16 |
코레일 | 12 |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 5.8969072 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산교통공사 |
---|---|
2nd row | 부산교통공사 |
3rd row | 부산교통공사 |
4th row | 부산교통공사 |
5th row | 부산교통공사 |
Common Values
Value | Count | Frequency (%) |
부산교통공사 | 166 | |
부산김해경전철 | 16 | 8.2% |
코레일 | 12 | 6.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부산교통공사 | 166 | |
부산김해경전철 | 16 | 8.2% |
코레일 | 12 | 6.2% |
선명
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 3.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
3호선 | |
---|---|
4호선 | |
1호선 | |
2호선 | |
부산김해경전철 |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 3.2680412 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1호선 |
---|---|
2nd row | 1호선 |
3rd row | 1호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
3호선 | 80 | |
4호선 | 54 | |
1호선 | 16 | 8.2% |
2호선 | 16 | 8.2% |
부산김해경전철 | 16 | 8.2% |
동해 | 12 | 6.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
3호선 | 80 | |
4호선 | 54 | |
1호선 | 16 | 8.2% |
2호선 | 16 | 8.2% |
부산김해경전철 | 16 | 8.2% |
동해 | 12 | 6.2% |
역명
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 6.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
수영 | |
---|---|
미남 | |
사상(서부터미널) | |
대저 | |
서면 | |
Other values (7) |
Length
Max length | 10 |
---|---|
Median length | 2 |
Mean length | 3.1649485 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서면 |
---|---|
2nd row | 서면 |
3rd row | 서면 |
4th row | 서면 |
5th row | 연산 |
Common Values
Value | Count | Frequency (%) |
수영 | 66 | |
미남 | 52 | |
사상(서부터미널) | 10 | 5.2% |
대저 | 10 | 5.2% |
서면 | 8 | 4.1% |
연산 | 8 | 4.1% |
교대 | 8 | 4.1% |
동래 | 8 | 4.1% |
덕천(부산과기대) | 8 | 4.1% |
거제(법원·검찰청) | 8 | 4.1% |
Other values (2) | 8 | 4.1% |
Length
Value | Count | Frequency (%) |
수영 | 66 | |
미남 | 52 | |
사상(서부터미널 | 10 | 5.2% |
대저 | 10 | 5.2% |
서면 | 8 | 4.1% |
연산 | 8 | 4.1% |
교대 | 8 | 4.1% |
동래 | 8 | 4.1% |
덕천(부산과기대 | 8 | 4.1% |
거제(법원·검찰청 | 8 | 4.1% |
Other values (2) | 8 | 4.1% |
환승철도운영기관
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
부산교통공사 | |
---|---|
코레일 | 12 |
부산김해경전철 | 4 |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 5.8350515 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산교통공사 |
---|---|
2nd row | 부산교통공사 |
3rd row | 부산교통공사 |
4th row | 부산교통공사 |
5th row | 부산교통공사 |
Common Values
Value | Count | Frequency (%) |
부산교통공사 | 178 | |
코레일 | 12 | 6.2% |
부산김해경전철 | 4 | 2.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부산교통공사 | 178 | |
코레일 | 12 | 6.2% |
부산김해경전철 | 4 | 2.1% |
환승선명
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 3.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
2호선 | |
---|---|
3호선 | |
1호선 | |
동해 | |
4호선 | 6 |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 3.0206186 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2호선 |
---|---|
2nd row | 2호선 |
3rd row | 2호선 |
4th row | 2호선 |
5th row | 3호선 |
Common Values
Value | Count | Frequency (%) |
2호선 | 84 | |
3호선 | 72 | |
1호선 | 16 | 8.2% |
동해 | 12 | 6.2% |
4호선 | 6 | 3.1% |
부산김해경전철 | 4 | 2.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2호선 | 84 | |
3호선 | 72 | |
1호선 | 16 | 8.2% |
동해 | 12 | 6.2% |
4호선 | 6 | 3.1% |
부산김해경전철 | 4 | 2.1% |
환승이후역명
Categorical
HIGH CORRELATION
 
Distinct | 35 |
---|---|
Distinct (%) | 18.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
광안 | |
---|---|
민락 | |
만덕 | |
사직 | |
체육공원 | |
Other values (30) |
Length
Max length | 16 |
---|---|
Median length | 2 |
Mean length | 3.0721649 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | 부암(온종합병원) |
---|---|
2nd row | 전포 |
3rd row | 부암(온종합병원) |
4th row | 전포 |
5th row | 물만골 |
Common Values
Value | Count | Frequency (%) |
광안 | 32 | |
민락 | 32 | |
만덕 | 25 | |
사직 | 25 | |
체육공원 | 8 | 4.1% |
동래 | 6 | 3.1% |
교대 | 6 | 3.1% |
연산 | 4 | 2.1% |
덕포 | 4 | 2.1% |
감전(사상구청) | 4 | 2.1% |
Other values (25) | 48 |
Length
Value | Count | Frequency (%) |
광안 | 32 | |
민락 | 32 | |
만덕 | 25 | |
사직 | 25 | |
체육공원 | 8 | 4.1% |
동래 | 6 | 3.1% |
교대 | 6 | 3.1% |
연산 | 4 | 2.1% |
덕포 | 4 | 2.1% |
감전(사상구청 | 4 | 2.1% |
Other values (25) | 48 |
환승기점역명
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
양산(시청·동원과학기술대학교) | |
---|---|
장산(해운대백병원) | |
수영 | |
대저 | |
노포(종합버스터미널) | |
Other values (8) |
Length
Max length | 16 |
---|---|
Median length | 11 |
Mean length | 7.3865979 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | 양산(시청·동원과학기술대학교) |
---|---|
2nd row | 장산(해운대백병원) |
3rd row | 양산(시청·동원과학기술대학교) |
4th row | 장산(해운대백병원) |
5th row | 수영 |
Common Values
Value | Count | Frequency (%) |
양산(시청·동원과학기술대학교) | 42 | |
장산(해운대백병원) | 42 | |
수영 | 39 | |
대저 | 33 | |
노포(종합버스터미널) | 8 | 4.1% |
부전 | 6 | 3.1% |
일광 | 6 | 3.1% |
신평 | 6 | 3.1% |
안평(고촌주택단지) | 4 | 2.1% |
대사 | 3 | 1.5% |
Other values (3) | 5 | 2.6% |
Length
Value | Count | Frequency (%) |
양산(시청·동원과학기술대학교 | 42 | |
장산(해운대백병원 | 42 | |
수영 | 39 | |
대저 | 33 | |
노포(종합버스터미널 | 8 | 4.1% |
부전 | 6 | 3.1% |
일광 | 6 | 3.1% |
신평 | 6 | 3.1% |
안평(고촌주택단지 | 4 | 2.1% |
대사 | 3 | 1.5% |
Other values (3) | 5 | 2.6% |
차량순서
Real number (ℝ)
Distinct | 8 |
---|---|
Distinct (%) | 4.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.0154639 |
Minimum | 1 |
---|---|
Maximum | 8 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 3 |
Q3 | 4 |
95-th percentile | 6 |
Maximum | 8 |
Range | 7 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.7319814 |
---|---|
Coefficient of variation (CV) | 0.57436649 |
Kurtosis | -0.50153074 |
Mean | 3.0154639 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 0.59264507 |
Sum | 585 |
Variance | 2.9997596 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 47 | |
2 | 44 | |
4 | 35 | |
3 | 29 | |
6 | 18 | 9.3% |
5 | 17 | 8.8% |
7 | 2 | 1.0% |
8 | 2 | 1.0% |
Value | Count | Frequency (%) |
1 | 47 | |
2 | 44 | |
3 | 29 | |
4 | 35 | |
5 | 17 | 8.8% |
6 | 18 | 9.3% |
7 | 2 | 1.0% |
8 | 2 | 1.0% |
Value | Count | Frequency (%) |
8 | 2 | 1.0% |
7 | 2 | 1.0% |
6 | 18 | 9.3% |
5 | 17 | 8.8% |
4 | 35 | |
3 | 29 | |
2 | 44 | |
1 | 47 |
차량출입문번호
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 2.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
1 | |
---|---|
2 | |
4 | |
3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 64 | |
2 | 50 | |
4 | 45 | |
3 | 35 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 64 | |
2 | 50 | |
4 | 45 | |
3 | 35 |
철도운영기관명 | 선명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량순서 | 차량출입문번호 | |
---|---|---|---|---|---|---|---|---|---|
철도운영기관명 | 1.000 | 1.000 | 0.980 | 0.000 | 0.283 | 0.990 | 0.436 | 0.293 | 0.203 |
선명 | 1.000 | 1.000 | 0.981 | 0.544 | 0.838 | 0.995 | 0.735 | 0.524 | 0.296 |
역명 | 0.980 | 0.981 | 1.000 | 0.874 | 0.948 | 0.995 | 0.802 | 0.638 | 0.467 |
환승철도운영기관 | 0.000 | 0.544 | 0.874 | 1.000 | 1.000 | 0.980 | 1.000 | 0.425 | 0.128 |
환승선명 | 0.283 | 0.838 | 0.948 | 1.000 | 1.000 | 0.986 | 1.000 | 0.417 | 0.196 |
환승이후역명 | 0.990 | 0.995 | 0.995 | 0.980 | 0.986 | 1.000 | 0.987 | 0.700 | 0.316 |
환승기점역명 | 0.436 | 0.735 | 0.802 | 1.000 | 1.000 | 0.987 | 1.000 | 0.309 | 0.000 |
차량순서 | 0.293 | 0.524 | 0.638 | 0.425 | 0.417 | 0.700 | 0.309 | 1.000 | 0.247 |
차량출입문번호 | 0.203 | 0.296 | 0.467 | 0.128 | 0.196 | 0.316 | 0.000 | 0.247 | 1.000 |
차량출입문번호 | 철도운영기관명 | 환승철도운영기관 | 역명 | 환승기점역명 | 선명 | 환승선명 | 환승이후역명 | |
---|---|---|---|---|---|---|---|---|
차량출입문번호 | 1.000 | 0.192 | 0.120 | 0.226 | 0.000 | 0.193 | 0.126 | 0.150 |
철도운영기관명 | 0.192 | 1.000 | 0.000 | 0.813 | 0.267 | 0.992 | 0.121 | 0.879 |
환승철도운영기관 | 0.120 | 0.000 | 1.000 | 0.600 | 0.973 | 0.263 | 0.992 | 0.844 |
역명 | 0.226 | 0.813 | 0.600 | 1.000 | 0.463 | 0.784 | 0.669 | 0.885 |
환승기점역명 | 0.000 | 0.267 | 0.973 | 0.463 | 1.000 | 0.469 | 0.981 | 0.827 |
선명 | 0.193 | 0.992 | 0.263 | 0.784 | 0.469 | 1.000 | 0.455 | 0.891 |
환승선명 | 0.126 | 0.121 | 0.992 | 0.669 | 0.981 | 0.455 | 1.000 | 0.839 |
환승이후역명 | 0.150 | 0.879 | 0.844 | 0.885 | 0.827 | 0.891 | 0.839 | 1.000 |
차량순서 | 철도운영기관명 | 선명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량출입문번호 | |
---|---|---|---|---|---|---|---|---|---|
차량순서 | 1.000 | 0.191 | 0.322 | 0.328 | 0.295 | 0.245 | 0.331 | 0.142 | 0.111 |
철도운영기관명 | 0.191 | 1.000 | 0.992 | 0.813 | 0.000 | 0.121 | 0.879 | 0.267 | 0.192 |
선명 | 0.322 | 0.992 | 1.000 | 0.784 | 0.263 | 0.455 | 0.891 | 0.469 | 0.193 |
역명 | 0.328 | 0.813 | 0.784 | 1.000 | 0.600 | 0.669 | 0.885 | 0.463 | 0.226 |
환승철도운영기관 | 0.295 | 0.000 | 0.263 | 0.600 | 1.000 | 0.992 | 0.844 | 0.973 | 0.120 |
환승선명 | 0.245 | 0.121 | 0.455 | 0.669 | 0.992 | 1.000 | 0.839 | 0.981 | 0.126 |
환승이후역명 | 0.331 | 0.879 | 0.891 | 0.885 | 0.844 | 0.839 | 1.000 | 0.827 | 0.150 |
환승기점역명 | 0.142 | 0.267 | 0.469 | 0.463 | 0.973 | 0.981 | 0.827 | 1.000 | 0.000 |
차량출입문번호 | 0.111 | 0.192 | 0.193 | 0.226 | 0.120 | 0.126 | 0.150 | 0.000 | 1.000 |
철도운영기관명 | 선명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량순서 | 차량출입문번호 | |
---|---|---|---|---|---|---|---|---|---|
0 | 부산교통공사 | 1호선 | 서면 | 부산교통공사 | 2호선 | 부암(온종합병원) | 양산(시청·동원과학기술대학교) | 6 | 1 |
1 | 부산교통공사 | 1호선 | 서면 | 부산교통공사 | 2호선 | 전포 | 장산(해운대백병원) | 6 | 1 |
2 | 부산교통공사 | 1호선 | 서면 | 부산교통공사 | 2호선 | 부암(온종합병원) | 양산(시청·동원과학기술대학교) | 7 | 1 |
3 | 부산교통공사 | 1호선 | 서면 | 부산교통공사 | 2호선 | 전포 | 장산(해운대백병원) | 7 | 1 |
4 | 부산교통공사 | 1호선 | 연산 | 부산교통공사 | 3호선 | 물만골 | 수영 | 4 | 1 |
5 | 부산교통공사 | 1호선 | 연산 | 부산교통공사 | 3호선 | 거제 | 대저 | 4 | 1 |
6 | 부산교통공사 | 1호선 | 연산 | 부산교통공사 | 3호선 | 거제 | 대저 | 5 | 1 |
7 | 부산교통공사 | 1호선 | 연산 | 부산교통공사 | 3호선 | 물만골 | 수영 | 5 | 1 |
8 | 부산교통공사 | 1호선 | 교대 | 코레일 | 동해 | 거제(법원·검찰청) | 부전 | 6 | 2 |
9 | 부산교통공사 | 1호선 | 교대 | 코레일 | 동해 | 동래 | 일광 | 6 | 2 |
철도운영기관명 | 선명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량순서 | 차량출입문번호 | |
---|---|---|---|---|---|---|---|---|---|
184 | 코레일 | 동해 | 거제(법원·검찰청) | 부산교통공사 | 3호선 | 연산 | 수영 | 2 | 2 |
185 | 코레일 | 동해 | 거제(법원·검찰청) | 부산교통공사 | 3호선 | 종합운동장 | 대저 | 2 | 2 |
186 | 코레일 | 동해 | 교대 | 부산교통공사 | 1호선 | 연산 | 다대포해수욕장 | 4 | 4 |
187 | 코레일 | 동해 | 교대 | 부산교통공사 | 1호선 | 동래 | 노포(종합버스터미널) | 4 | 4 |
188 | 코레일 | 동해 | 교대 | 부산교통공사 | 1호선 | 동래 | 노포(종합버스터미널) | 1 | 1 |
189 | 코레일 | 동해 | 교대 | 부산교통공사 | 1호선 | 연산 | 다대포해수욕장 | 1 | 1 |
190 | 코레일 | 동해 | 벡스코 | 부산교통공사 | 2호선 | 동백 | 장산(해운대백병원) | 3 | 2 |
191 | 코레일 | 동해 | 벡스코 | 부산교통공사 | 2호선 | 동백 | 장산(해운대백병원) | 2 | 4 |
192 | 코레일 | 동해 | 벡스코 | 부산교통공사 | 2호선 | 센텀시티(BEXCO·신세계) | 양산(시청·동원과학기술대학교) | 3 | 2 |
193 | 코레일 | 동해 | 벡스코 | 부산교통공사 | 2호선 | 센텀시티(BEXCO·신세계) | 양산(시청·동원과학기술대학교) | 2 | 4 |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량순서 | 차량출입문번호 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 부산교통공사 | 2호선 | 사상(서부터미널) | 부산김해경전철 | 부산김해경전철 | 괘법르네시떼(강변공원) | 대사 | 3 | 3 | 2 |
1 | 부산교통공사 | 2호선 | 서면 | 부산교통공사 | 1호선 | 범내골 | 신평 | 5 | 4 | 2 |
2 | 부산교통공사 | 2호선 | 서면 | 부산교통공사 | 1호선 | 부전(부산시민공원·송상현광장) | 노포(종합버스터미널) | 6 | 4 | 2 |
3 | 부산교통공사 | 3호선 | 덕천(부산과기대) | 부산교통공사 | 2호선 | 구명 | 장산(해운대백병원) | 1 | 1 | 2 |
4 | 부산교통공사 | 3호선 | 덕천(부산과기대) | 부산교통공사 | 2호선 | 수정(방송통신대) | 양산(시청·동원과학기술대학교) | 2 | 4 | 2 |
5 | 부산교통공사 | 3호선 | 수영 | 부산교통공사 | 2호선 | 광안 | 양산(시청·동원과학기술대학교) | 1 | 1 | 2 |
6 | 부산교통공사 | 3호선 | 수영 | 부산교통공사 | 2호선 | 광안 | 양산(시청·동원과학기술대학교) | 1 | 2 | 2 |
7 | 부산교통공사 | 3호선 | 수영 | 부산교통공사 | 2호선 | 광안 | 양산(시청·동원과학기술대학교) | 1 | 3 | 2 |
8 | 부산교통공사 | 3호선 | 수영 | 부산교통공사 | 2호선 | 광안 | 양산(시청·동원과학기술대학교) | 1 | 4 | 2 |
9 | 부산교통공사 | 3호선 | 수영 | 부산교통공사 | 2호선 | 광안 | 양산(시청·동원과학기술대학교) | 2 | 1 | 2 |