Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 302 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 24.3 KiB |
Average record size in memory | 82.4 B |
Variable types
Categorical | 5 |
---|---|
Text | 1 |
Numeric | 1 |
Boolean | 3 |
Dataset
Description | 서울교통공사에서 운영하는 노선(5호선~8호선)의 승강장 정보에 대한 데이터로 철도운영기관명, 선명, 역명, 승강장번호, 상하행구분, 지상구분, 역층, 승강장연결 여부, 스크린도어 유무, 안전발판 유무의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041197/fileData.do |
철도운영기관명 has constant value "" | Constant |
스크린도어 유무 has constant value "" | Constant |
상하행 is highly overall correlated with 승강장번호 | High correlation |
승강장번호 is highly overall correlated with 상하행 | High correlation |
역층 is highly overall correlated with 지상구분 | High correlation |
지상구분 is highly overall correlated with 역층 | High correlation |
지상구분 is highly imbalanced (85.9%) | Imbalance |
승강장연결 여부 is highly imbalanced (51.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 13:48:16.238992 |
---|---|
Analysis finished | 2023-12-12 13:48:17.152952 |
Duration | 0.91 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
서울교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 302 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 302 |
선명
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
5호선 | |
---|---|
7호선 | |
6호선 | |
8호선 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 5호선 |
---|---|
2nd row | 5호선 |
3rd row | 5호선 |
4th row | 5호선 |
5th row | 5호선 |
Common Values
Value | Count | Frequency (%) |
5호선 | 106 | |
7호선 | 84 | |
6호선 | 78 | |
8호선 | 34 | 11.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
5호선 | 106 | |
7호선 | 84 | |
6호선 | 78 | |
8호선 | 34 | 11.3% |
역명
Text
Distinct | 146 |
---|---|
Distinct (%) | 48.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
Value | Count | Frequency (%) |
천호(풍납토성 | 4 | 1.3% |
청구 | 4 | 1.3% |
태릉입구 | 4 | 1.3% |
공덕 | 4 | 1.3% |
군자(능동 | 4 | 1.3% |
논현 | 2 | 0.7% |
대림(구로구청 | 2 | 0.7% |
강동 | 2 | 0.7% |
남구로 | 2 | 0.7% |
남성 | 2 | 0.7% |
Other values (136) | 272 |
Most occurring characters
Value | Count | Frequency (%) |
( | 70 | 5.3% |
) | 70 | 5.3% |
대 | 48 | 3.6% |
구 | 46 | 3.5% |
산 | 36 | 2.7% |
동 | 30 | 2.3% |
원 | 28 | 2.1% |
신 | 26 | 2.0% |
장 | 22 | 1.7% |
공 | 22 | 1.7% |
Other values (188) | 922 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1174 | |
Open Punctuation | 70 | 5.3% |
Close Punctuation | 70 | 5.3% |
Decimal Number | 4 | 0.3% |
Other Punctuation | 2 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 48 | 4.1% |
구 | 46 | 3.9% |
산 | 36 | 3.1% |
동 | 30 | 2.6% |
원 | 28 | 2.4% |
신 | 26 | 2.2% |
장 | 22 | 1.9% |
공 | 22 | 1.9% |
청 | 22 | 1.9% |
화 | 20 | 1.7% |
Other values (183) | 874 |
Decimal Number
Value | Count | Frequency (%) |
4 | 2 | |
3 | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 70 |
Close Punctuation
Value | Count | Frequency (%) |
) | 70 |
Other Punctuation
Value | Count | Frequency (%) |
· | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1174 | |
Common | 146 | 11.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 48 | 4.1% |
구 | 46 | 3.9% |
산 | 36 | 3.1% |
동 | 30 | 2.6% |
원 | 28 | 2.4% |
신 | 26 | 2.2% |
장 | 22 | 1.9% |
공 | 22 | 1.9% |
청 | 22 | 1.9% |
화 | 20 | 1.7% |
Other values (183) | 874 |
Common
Value | Count | Frequency (%) |
( | 70 | |
) | 70 | |
· | 2 | 1.4% |
4 | 2 | 1.4% |
3 | 2 | 1.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1174 | |
ASCII | 144 | 10.9% |
None | 2 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 70 | |
) | 70 | |
4 | 2 | 1.4% |
3 | 2 | 1.4% |
Hangul
Value | Count | Frequency (%) |
대 | 48 | 4.1% |
구 | 46 | 3.9% |
산 | 36 | 3.1% |
동 | 30 | 2.6% |
원 | 28 | 2.4% |
신 | 26 | 2.2% |
장 | 22 | 1.9% |
공 | 22 | 1.9% |
청 | 22 | 1.9% |
화 | 20 | 1.7% |
Other values (183) | 874 |
None
Value | Count | Frequency (%) |
· | 2 |
승강장번호
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
1 | |
---|---|
2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 2 |
3rd row | 2 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 151 | |
2 | 151 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 151 | |
2 | 151 |
상하행
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
상행 | |
---|---|
하행 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 상행 |
---|---|
2nd row | 하행 |
3rd row | 하행 |
4th row | 상행 |
5th row | 상행 |
Common Values
Value | Count | Frequency (%) |
상행 | 151 | |
하행 | 151 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
상행 | 151 | |
하행 | 151 |
지상구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
지하 | |
---|---|
지상 | 6 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지하 |
---|---|
2nd row | 지하 |
3rd row | 지하 |
4th row | 지하 |
5th row | 지하 |
Common Values
Value | Count | Frequency (%) |
지하 | 296 | |
지상 | 6 | 2.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하 | 296 | |
지상 | 6 | 2.0% |
역층
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 2.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.2350993 |
Minimum | 1 |
---|---|
Maximum | 8 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 2.25 |
median | 3 |
Q3 | 4 |
95-th percentile | 5 |
Maximum | 8 |
Range | 7 |
Interquartile range (IQR) | 1.75 |
Descriptive statistics
Standard deviation | 1.0818772 |
---|---|
Coefficient of variation (CV) | 0.33441854 |
Kurtosis | 1.7323186 |
Mean | 3.2350993 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 0.99462238 |
Sum | 977 |
Variance | 1.1704583 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 128 | |
2 | 74 | |
4 | 59 | |
5 | 31 | 10.3% |
6 | 6 | 2.0% |
8 | 2 | 0.7% |
1 | 2 | 0.7% |
Value | Count | Frequency (%) |
1 | 2 | 0.7% |
2 | 74 | |
3 | 128 | |
4 | 59 | |
5 | 31 | 10.3% |
6 | 6 | 2.0% |
8 | 2 | 0.7% |
Value | Count | Frequency (%) |
8 | 2 | 0.7% |
6 | 6 | 2.0% |
5 | 31 | 10.3% |
4 | 59 | |
3 | 128 | |
2 | 74 | |
1 | 2 | 0.7% |
승강장연결 여부
Boolean
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 434.0 B |
True | |
---|---|
False |
Value | Count | Frequency (%) |
True | 270 | |
False | 32 | 10.6% |
스크린도어 유무
Boolean
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 434.0 B |
True |
---|
Value | Count | Frequency (%) |
True | 302 |
안전발판 유무
Boolean
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 434.0 B |
False | |
---|---|
True |
Value | Count | Frequency (%) |
False | 154 | |
True | 148 |
선명 | 승강장번호 | 상하행 | 지상구분 | 역층 | 승강장연결 여부 | 안전발판 유무 | |
---|---|---|---|---|---|---|---|
선명 | 1.000 | 0.000 | 0.000 | 0.311 | 0.343 | 0.121 | 0.462 |
승강장번호 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
상하행 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
지상구분 | 0.311 | 0.000 | 0.000 | 1.000 | 0.527 | 0.000 | 0.000 |
역층 | 0.343 | 0.000 | 0.000 | 0.527 | 1.000 | 0.125 | 0.319 |
승강장연결 여부 | 0.121 | 0.000 | 0.000 | 0.000 | 0.125 | 1.000 | 0.246 |
안전발판 유무 | 0.462 | 0.000 | 0.000 | 0.000 | 0.319 | 0.246 | 1.000 |
승강장연결 여부 | 선명 | 상하행 | 지상구분 | 안전발판 유무 | 승강장번호 | |
---|---|---|---|---|---|---|
승강장연결 여부 | 1.000 | 0.079 | 0.000 | 0.000 | 0.158 | 0.000 |
선명 | 0.079 | 1.000 | 0.000 | 0.207 | 0.311 | 0.000 |
상하행 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 | 0.993 |
지상구분 | 0.000 | 0.207 | 0.000 | 1.000 | 0.000 | 0.000 |
안전발판 유무 | 0.158 | 0.311 | 0.000 | 0.000 | 1.000 | 0.000 |
승강장번호 | 0.000 | 0.000 | 0.993 | 0.000 | 0.000 | 1.000 |
역층 | 선명 | 승강장번호 | 상하행 | 지상구분 | 승강장연결 여부 | 안전발판 유무 | |
---|---|---|---|---|---|---|---|
역층 | 1.000 | 0.240 | 0.000 | 0.000 | 0.562 | 0.133 | 0.338 |
선명 | 0.240 | 1.000 | 0.000 | 0.000 | 0.207 | 0.079 | 0.311 |
승강장번호 | 0.000 | 0.000 | 1.000 | 0.993 | 0.000 | 0.000 | 0.000 |
상하행 | 0.000 | 0.000 | 0.993 | 1.000 | 0.000 | 0.000 | 0.000 |
지상구분 | 0.562 | 0.207 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 |
승강장연결 여부 | 0.133 | 0.079 | 0.000 | 0.000 | 0.000 | 1.000 | 0.158 |
안전발판 유무 | 0.338 | 0.311 | 0.000 | 0.000 | 0.000 | 0.158 | 1.000 |
철도운영기관명 | 선명 | 역명 | 승강장번호 | 상하행 | 지상구분 | 역층 | 승강장연결 여부 | 스크린도어 유무 | 안전발판 유무 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 5호선 | 강동 | 1 | 상행 | 지하 | 4 | Y | Y | N |
1 | 서울교통공사 | 5호선 | 강동 | 2 | 하행 | 지하 | 4 | Y | Y | N |
2 | 서울교통공사 | 5호선 | 개롱 | 2 | 하행 | 지하 | 2 | Y | Y | N |
3 | 서울교통공사 | 5호선 | 개롱 | 1 | 상행 | 지하 | 2 | Y | Y | N |
4 | 서울교통공사 | 5호선 | 개화산 | 1 | 상행 | 지하 | 4 | Y | Y | Y |
5 | 서울교통공사 | 5호선 | 개화산 | 2 | 하행 | 지하 | 4 | Y | Y | Y |
6 | 서울교통공사 | 5호선 | 거여 | 1 | 상행 | 지하 | 3 | Y | Y | Y |
7 | 서울교통공사 | 5호선 | 거여 | 2 | 하행 | 지하 | 3 | Y | Y | Y |
8 | 서울교통공사 | 5호선 | 고덕 | 1 | 상행 | 지하 | 2 | Y | Y | N |
9 | 서울교통공사 | 5호선 | 고덕 | 2 | 하행 | 지하 | 2 | Y | Y | N |
철도운영기관명 | 선명 | 역명 | 승강장번호 | 상하행 | 지상구분 | 역층 | 승강장연결 여부 | 스크린도어 유무 | 안전발판 유무 | |
---|---|---|---|---|---|---|---|---|---|---|
292 | 서울교통공사 | 8호선 | 신흥 | 1 | 상행 | 지하 | 2 | Y | Y | N |
293 | 서울교통공사 | 8호선 | 신흥 | 2 | 하행 | 지하 | 2 | Y | Y | N |
294 | 서울교통공사 | 8호선 | 암사 | 1 | 상행 | 지하 | 2 | Y | Y | N |
295 | 서울교통공사 | 8호선 | 암사 | 2 | 하행 | 지하 | 2 | Y | Y | N |
296 | 서울교통공사 | 8호선 | 잠실(송파구청) | 2 | 하행 | 지하 | 3 | N | Y | Y |
297 | 서울교통공사 | 8호선 | 잠실(송파구청) | 1 | 상행 | 지하 | 3 | N | Y | Y |
298 | 서울교통공사 | 8호선 | 장지 | 2 | 하행 | 지하 | 2 | Y | Y | N |
299 | 서울교통공사 | 8호선 | 장지 | 1 | 상행 | 지하 | 2 | Y | Y | N |
300 | 서울교통공사 | 8호선 | 천호(풍납토성) | 2 | 하행 | 지하 | 2 | Y | Y | N |
301 | 서울교통공사 | 8호선 | 천호(풍납토성) | 1 | 상행 | 지하 | 2 | Y | Y | N |