Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 99 |
Missing cells | 13 |
Missing cells (%) | 1.5% |
Duplicate rows | 11 |
Duplicate rows (%) | 11.1% |
Total size in memory | 7.3 KiB |
Average record size in memory | 75.3 B |
Variable types
Categorical | 7 |
---|---|
Text | 1 |
Numeric | 1 |
Dataset
Description | 수도권 1호선 역사들의 환승정보 데이터로 철도운영기관명, 선명, 역명, 환승철도운영기관, 환승선명, 환승이후역명, 환승기점역명, 차량순서, 차량출입문번호의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041051/fileData.do |
선명 has constant value "" | Constant |
Dataset has 11 (11.1%) duplicate rows | Duplicates |
환승철도운영기관 is highly overall correlated with 역명 and 2 other fields | High correlation |
환승기점역명 is highly overall correlated with 역명 and 2 other fields | High correlation |
환승선명 is highly overall correlated with 역명 and 2 other fields | High correlation |
차량순서 is highly overall correlated with 역명 | High correlation |
철도운영기관명 is highly overall correlated with 역명 | High correlation |
역명 is highly overall correlated with 차량순서 and 5 other fields | High correlation |
차량출입문번호 is highly overall correlated with 역명 | High correlation |
환승이후역명 has 13 (13.1%) missing values | Missing |
차량순서 has 3 (3.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 20:19:57.963664 |
---|---|
Analysis finished | 2023-12-12 20:19:58.855828 |
Duration | 0.89 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 924.0 B |
코레일 | |
---|---|
서울교통공사 |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 4.0909091 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 코레일 |
---|---|
2nd row | 코레일 |
3rd row | 코레일 |
4th row | 코레일 |
5th row | 코레일 |
Common Values
Value | Count | Frequency (%) |
코레일 | 63 | |
서울교통공사 | 36 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
코레일 | 63 | |
서울교통공사 | 36 |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 924.0 B |
1호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1호선 |
---|---|
2nd row | 1호선 |
3rd row | 1호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
1호선 | 99 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1호선 | 99 |
역명
Categorical
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 24.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 924.0 B |
서울역 | |
---|---|
종로3가 | |
신도림 | 6 |
주안 | 4 |
창동 | 4 |
Other values (19) |
Length
Max length | 12 |
---|---|
Median length | 7 |
Mean length | 3.1313131 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | 회룡 |
---|---|
2nd row | 회룡 |
3rd row | 회룡 |
4th row | 회룡 |
5th row | 도봉산 |
Common Values
Value | Count | Frequency (%) |
서울역 | 8 | 8.1% |
종로3가 | 8 | 8.1% |
신도림 | 6 | 6.1% |
주안 | 4 | 4.0% |
창동 | 4 | 4.0% |
석계 | 4 | 4.0% |
회기 | 4 | 4.0% |
용산 | 4 | 4.0% |
노량진 | 4 | 4.0% |
신길 | 4 | 4.0% |
Other values (14) | 49 |
Length
Value | Count | Frequency (%) |
서울역 | 8 | 8.1% |
종로3가 | 8 | 8.1% |
신도림 | 6 | 6.1% |
도봉산 | 4 | 4.0% |
시청 | 4 | 4.0% |
동대문 | 4 | 4.0% |
동묘앞 | 4 | 4.0% |
신설동 | 4 | 4.0% |
청량리(서울시립대입구 | 4 | 4.0% |
금정 | 4 | 4.0% |
Other values (14) | 49 |
환승철도운영기관
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 7.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 924.0 B |
서울교통공사 | |
---|---|
코레일 | |
인천교통공사 | |
의정부경전철 | 4 |
서울9호선 | 4 |
Other values (2) | 4 |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 5.4040404 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 의정부경전철 |
---|---|
2nd row | 의정부경전철 |
3rd row | 의정부경전철 |
4th row | 의정부경전철 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 60 | |
코레일 | 19 | 19.2% |
인천교통공사 | 8 | 8.1% |
의정부경전철 | 4 | 4.0% |
서울9호선 | 4 | 4.0% |
우이신설경전철 | 2 | 2.0% |
인천공항철도 | 2 | 2.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 60 | |
코레일 | 19 | 19.2% |
인천교통공사 | 8 | 8.1% |
의정부경전철 | 4 | 4.0% |
서울9호선 | 4 | 4.0% |
우이신설경전철 | 2 | 2.0% |
인천공항철도 | 2 | 2.0% |
환승선명
Categorical
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 17.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 924.0 B |
4호선 | |
---|---|
경의중앙 | |
7호선 | |
2호선 | |
6호선 | |
Other values (12) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.4949495 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | 의정부경전철 |
---|---|
2nd row | 의정부경전철 |
3rd row | 의정부경전철 |
4th row | 의정부경전철 |
5th row | 7호선 |
Common Values
Value | Count | Frequency (%) |
4호선 | 16 | |
경의중앙 | 14 | |
7호선 | 12 | |
2호선 | 8 | |
6호선 | 8 | |
5호선 | 8 | |
의정부경전철 | 4 | 4.0% |
9호선 | 4 | 4.0% |
<NA> | 4 | 4.0% |
인천2호선 | 4 | 4.0% |
Other values (7) | 17 |
Length
Value | Count | Frequency (%) |
4호선 | 16 | |
경의중앙 | 14 | |
7호선 | 12 | |
2호선 | 8 | |
6호선 | 8 | |
5호선 | 8 | |
인천2호선 | 4 | 4.0% |
인천1호선 | 4 | 4.0% |
3호선 | 4 | 4.0% |
na | 4 | 4.0% |
Other values (7) | 17 |
환승이후역명
Text
MISSING
 
Distinct | 43 |
---|---|
Distinct (%) | 50.0% |
Missing | 13 |
Missing (%) | 13.1% |
Memory size | 924.0 B |
Value | Count | Frequency (%) |
발곡 | 2 | 2.3% |
동대문역사문화공원 | 2 | 2.3% |
시민공원 | 2 | 2.3% |
남구로 | 2 | 2.3% |
매교 | 2 | 2.3% |
왕십리 | 2 | 2.3% |
회기 | 2 | 2.3% |
보문 | 2 | 2.3% |
신당 | 2 | 2.3% |
창신 | 2 | 2.3% |
Other values (33) | 66 |
Most occurring characters
Value | Count | Frequency (%) |
문 | 16 | 5.0% |
구 | 14 | 4.3% |
로 | 12 | 3.7% |
( | 10 | 3.1% |
) | 10 | 3.1% |
대 | 10 | 3.1% |
시 | 8 | 2.5% |
입 | 8 | 2.5% |
원 | 8 | 2.5% |
공 | 8 | 2.5% |
Other values (79) | 218 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 298 | |
Open Punctuation | 10 | 3.1% |
Close Punctuation | 10 | 3.1% |
Decimal Number | 4 | 1.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
문 | 16 | 5.4% |
구 | 14 | 4.7% |
로 | 12 | 4.0% |
대 | 10 | 3.4% |
시 | 8 | 2.7% |
입 | 8 | 2.7% |
원 | 8 | 2.7% |
공 | 8 | 2.7% |
장 | 8 | 2.7% |
화 | 8 | 2.7% |
Other values (75) | 198 |
Decimal Number
Value | Count | Frequency (%) |
3 | 2 | |
4 | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 10 |
Close Punctuation
Value | Count | Frequency (%) |
) | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 298 | |
Common | 24 | 7.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
문 | 16 | 5.4% |
구 | 14 | 4.7% |
로 | 12 | 4.0% |
대 | 10 | 3.4% |
시 | 8 | 2.7% |
입 | 8 | 2.7% |
원 | 8 | 2.7% |
공 | 8 | 2.7% |
장 | 8 | 2.7% |
화 | 8 | 2.7% |
Other values (75) | 198 |
Common
Value | Count | Frequency (%) |
( | 10 | |
) | 10 | |
3 | 2 | 8.3% |
4 | 2 | 8.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 298 | |
ASCII | 24 | 7.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
문 | 16 | 5.4% |
구 | 14 | 4.7% |
로 | 12 | 4.0% |
대 | 10 | 3.4% |
시 | 8 | 2.7% |
입 | 8 | 2.7% |
원 | 8 | 2.7% |
공 | 8 | 2.7% |
장 | 8 | 2.7% |
화 | 8 | 2.7% |
Other values (75) | 198 |
ASCII
Value | Count | Frequency (%) |
( | 10 | |
) | 10 | |
3 | 2 | 8.3% |
4 | 2 | 8.3% |
환승기점역명
Categorical
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 24.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 924.0 B |
<NA> | |
---|---|
문산 | |
당고개 | |
남태령 | |
용산 | |
Other values (19) |
Length
Max length | 10 |
---|---|
Median length | 8 |
Mean length | 3.7171717 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 2.0% |
Sample
1st row | 발곡 |
---|---|
2nd row | 탑석 |
3rd row | 발곡 |
4th row | 탑석 |
5th row | 부평구청 |
Common Values
Value | Count | Frequency (%) |
<NA> | 13 | |
문산 | 8 | 8.1% |
당고개 | 8 | 8.1% |
남태령 | 8 | 8.1% |
용산 | 6 | 6.1% |
충정로(경기대입구) | 6 | 6.1% |
장암 | 6 | 6.1% |
부평구청 | 6 | 6.1% |
방화 | 4 | 4.0% |
응암 | 4 | 4.0% |
Other values (14) | 30 |
Length
Value | Count | Frequency (%) |
na | 13 | |
당고개 | 8 | 8.1% |
남태령 | 8 | 8.1% |
문산 | 8 | 8.1% |
용산 | 6 | 6.1% |
충정로(경기대입구 | 6 | 6.1% |
장암 | 6 | 6.1% |
부평구청 | 6 | 6.1% |
봉화산(서울의료원 | 4 | 4.0% |
마천 | 4 | 4.0% |
Other values (14) | 30 |
차량순서
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 9 |
---|---|
Distinct (%) | 9.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.2626263 |
Minimum | 0 |
---|---|
Maximum | 10 |
Zeros | 3 |
Zeros (%) | 3.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1023.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 6 |
Q3 | 9 |
95-th percentile | 10 |
Maximum | 10 |
Range | 10 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 3.671695 |
---|---|
Coefficient of variation (CV) | 0.69769252 |
Kurtosis | -1.614801 |
Mean | 5.2626263 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 0.028463124 |
Sum | 521 |
Variance | 13.481344 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 25 | |
10 | 21 | |
9 | 12 | |
2 | 11 | |
6 | 11 | |
5 | 8 | 8.1% |
7 | 6 | 6.1% |
0 | 3 | 3.0% |
4 | 2 | 2.0% |
Value | Count | Frequency (%) |
0 | 3 | 3.0% |
1 | 25 | |
2 | 11 | |
4 | 2 | 2.0% |
5 | 8 | 8.1% |
6 | 11 | |
7 | 6 | 6.1% |
9 | 12 | |
10 | 21 |
Value | Count | Frequency (%) |
10 | 21 | |
9 | 12 | |
7 | 6 | 6.1% |
6 | 11 | |
5 | 8 | 8.1% |
4 | 2 | 2.0% |
2 | 11 | |
1 | 25 | |
0 | 3 | 3.0% |
차량출입문번호
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 5.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 924.0 B |
1 | |
---|---|
4 | |
2 | |
3 | |
0 | 3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2 |
---|---|
2nd row | 2 |
3rd row | 3 |
4th row | 2 |
5th row | 3 |
Common Values
Value | Count | Frequency (%) |
1 | 32 | |
4 | 28 | |
2 | 21 | |
3 | 15 | |
0 | 3 | 3.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 32 | |
4 | 28 | |
2 | 21 | |
3 | 15 | |
0 | 3 | 3.0% |
철도운영기관명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량순서 | 차량출입문번호 | |
---|---|---|---|---|---|---|---|---|
철도운영기관명 | 1.000 | 1.000 | 0.330 | 0.651 | 1.000 | 0.475 | 0.276 | 0.180 |
역명 | 1.000 | 1.000 | 0.962 | 0.996 | 1.000 | 0.941 | 0.910 | 0.860 |
환승철도운영기관 | 0.330 | 0.962 | 1.000 | 1.000 | 1.000 | 1.000 | 0.431 | 0.373 |
환승선명 | 0.651 | 0.996 | 1.000 | 1.000 | 1.000 | 1.000 | 0.788 | 0.684 |
환승이후역명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.998 | 0.734 | 0.503 |
환승기점역명 | 0.475 | 0.941 | 1.000 | 1.000 | 0.998 | 1.000 | 0.661 | 0.255 |
차량순서 | 0.276 | 0.910 | 0.431 | 0.788 | 0.734 | 0.661 | 1.000 | 0.776 |
차량출입문번호 | 0.180 | 0.860 | 0.373 | 0.684 | 0.503 | 0.255 | 0.776 | 1.000 |
차량출입문번호 | 철도운영기관명 | 환승철도운영기관 | 역명 | 환승기점역명 | 환승선명 | |
---|---|---|---|---|---|---|
차량출입문번호 | 1.000 | 0.216 | 0.245 | 0.562 | 0.098 | 0.405 |
철도운영기관명 | 0.216 | 1.000 | 0.343 | 0.879 | 0.356 | 0.477 |
환승철도운영기관 | 0.245 | 0.343 | 1.000 | 0.755 | 0.887 | 0.947 |
역명 | 0.562 | 0.879 | 0.755 | 1.000 | 0.598 | 0.873 |
환승기점역명 | 0.098 | 0.356 | 0.887 | 0.598 | 1.000 | 0.929 |
환승선명 | 0.405 | 0.477 | 0.947 | 0.873 | 0.929 | 1.000 |
차량순서 | 철도운영기관명 | 역명 | 환승철도운영기관 | 환승선명 | 환승기점역명 | 차량출입문번호 | |
---|---|---|---|---|---|---|---|
차량순서 | 1.000 | 0.248 | 0.578 | 0.258 | 0.451 | 0.323 | 0.326 |
철도운영기관명 | 0.248 | 1.000 | 0.879 | 0.343 | 0.477 | 0.356 | 0.216 |
역명 | 0.578 | 0.879 | 1.000 | 0.755 | 0.873 | 0.598 | 0.562 |
환승철도운영기관 | 0.258 | 0.343 | 0.755 | 1.000 | 0.947 | 0.887 | 0.245 |
환승선명 | 0.451 | 0.477 | 0.873 | 0.947 | 1.000 | 0.929 | 0.405 |
환승기점역명 | 0.323 | 0.356 | 0.598 | 0.887 | 0.929 | 1.000 | 0.098 |
차량출입문번호 | 0.326 | 0.216 | 0.562 | 0.245 | 0.405 | 0.098 | 1.000 |
철도운영기관명 | 선명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량순서 | 차량출입문번호 | |
---|---|---|---|---|---|---|---|---|---|
0 | 코레일 | 1호선 | 회룡 | 의정부경전철 | 의정부경전철 | 발곡 | 발곡 | 2 | 2 |
1 | 코레일 | 1호선 | 회룡 | 의정부경전철 | 의정부경전철 | 범골 | 탑석 | 2 | 2 |
2 | 코레일 | 1호선 | 회룡 | 의정부경전철 | 의정부경전철 | 발곡 | 발곡 | 9 | 3 |
3 | 코레일 | 1호선 | 회룡 | 의정부경전철 | 의정부경전철 | 범골 | 탑석 | 2 | 2 |
4 | 코레일 | 1호선 | 도봉산 | 서울교통공사 | 7호선 | 수락산 | 부평구청 | 9 | 3 |
5 | 코레일 | 1호선 | 도봉산 | 서울교통공사 | 7호선 | 장암 | 장암 | 9 | 3 |
6 | 코레일 | 1호선 | 도봉산 | 서울교통공사 | 7호선 | 장암 | 장암 | 2 | 1 |
7 | 코레일 | 1호선 | 도봉산 | 서울교통공사 | 7호선 | 수락산 | 부평구청 | 2 | 1 |
8 | 코레일 | 1호선 | 창동 | 서울교통공사 | 4호선 | 노원 | 당고개 | 10 | 3 |
9 | 코레일 | 1호선 | 창동 | 서울교통공사 | 4호선 | 쌍문 | 남태령 | 10 | 3 |
철도운영기관명 | 선명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량순서 | 차량출입문번호 | |
---|---|---|---|---|---|---|---|---|---|
89 | 서울교통공사 | 1호선 | 시청 | 서울교통공사 | 2호선 | 충정로(경기대입구) | 충정로(경기대입구) | 1 | 1 |
90 | 서울교통공사 | 1호선 | 시청 | 서울교통공사 | 2호선 | 을지로입구 | 충정로(경기대입구) | 10 | 4 |
91 | 서울교통공사 | 1호선 | 서울역 | 코레일 | 경의중앙 | 신촌 | 문산 | 10 | 4 |
92 | 서울교통공사 | 1호선 | 서울역 | 서울교통공사 | 4호선 | 숙대입구(갈월) | 남태령 | 10 | 4 |
93 | 서울교통공사 | 1호선 | 서울역 | 서울교통공사 | 4호선 | 회현(남대문시장) | 당고개 | 10 | 4 |
94 | 서울교통공사 | 1호선 | 서울역 | 코레일 | 경의중앙 | 신촌 | 문산 | 1 | 2 |
95 | 서울교통공사 | 1호선 | 서울역 | 인천공항철도 | 공항철도 | 공덕 | 인천공항1터미널 | 1 | 2 |
96 | 서울교통공사 | 1호선 | 서울역 | 서울교통공사 | 4호선 | 숙대입구(갈월) | 남태령 | 1 | 2 |
97 | 서울교통공사 | 1호선 | 서울역 | 서울교통공사 | 4호선 | 회현(남대문시장) | 당고개 | 1 | 2 |
98 | 서울교통공사 | 1호선 | 서울역 | 인천공항철도 | 공항철도 | 공덕 | 인천공항1터미널 | 10 | 4 |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 환승철도운영기관 | 환승선명 | 환승이후역명 | 환승기점역명 | 차량순서 | 차량출입문번호 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 1호선 | 종로3가 | 서울교통공사 | 3호선 | 안국 | 구파발 | 6 | 1 | 2 |
1 | 서울교통공사 | 1호선 | 종로3가 | 서울교통공사 | 3호선 | 을지로3가 | 오금 | 6 | 1 | 2 |
2 | 서울교통공사 | 1호선 | 종로3가 | 서울교통공사 | 5호선 | 광화문(세종문화회관) | 방화 | 6 | 1 | 2 |
3 | 서울교통공사 | 1호선 | 종로3가 | 서울교통공사 | 5호선 | 을지로4가 | 마천 | 6 | 1 | 2 |
4 | 코레일 | 1호선 | 금정 | 서울교통공사 | 4호선 | <NA> | 남태령 | 0 | 0 | 2 |
5 | 코레일 | 1호선 | 금정 | 서울교통공사 | 4호선 | <NA> | 당고개 | 9 | 2 | 2 |
6 | 코레일 | 1호선 | 노량진 | 서울9호선 | 9호선 | <NA> | <NA> | 1 | 1 | 2 |
7 | 코레일 | 1호선 | 노량진 | 서울9호선 | 9호선 | <NA> | <NA> | 10 | 4 | 2 |
8 | 코레일 | 1호선 | 부평 | 인천교통공사 | 인천1호선 | 동수 | 국제업무지구 | 5 | 4 | 2 |
9 | 코레일 | 1호선 | 부평 | 인천교통공사 | 인천1호선 | 부평시장 | 계양 | 5 | 4 | 2 |