Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 145 |
Missing cells | 1 |
Missing cells (%) | 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 9.5 KiB |
Average record size in memory | 66.9 B |
Variable types
Numeric | 2 |
---|---|
Text | 2 |
Categorical | 4 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울 교통공사 |
URL | https://data.seoul.go.kr/dataList/OA-13192/F/1/datasetView.do |
장비 has constant value "" | Constant |
연번 is highly overall correlated with 호선 | High correlation |
호선 is highly overall correlated with 연번 and 2 other fields | High correlation |
운행구간 is highly overall correlated with 호선 and 1 other fields | High correlation |
설치위치 is highly overall correlated with 호선 and 1 other fields | High correlation |
설치위치 is highly imbalanced (51.2%) | Imbalance |
연번 has unique values | Unique |
승강기번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-11 06:11:22.101083 |
---|---|
Analysis finished | 2023-12-11 06:11:23.383163 |
Duration | 1.28 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 145 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 73 |
Minimum | 1 |
---|---|
Maximum | 145 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 8.2 |
Q1 | 37 |
median | 73 |
Q3 | 109 |
95-th percentile | 137.8 |
Maximum | 145 |
Range | 144 |
Interquartile range (IQR) | 72 |
Descriptive statistics
Standard deviation | 42.001984 |
---|---|
Coefficient of variation (CV) | 0.57536964 |
Kurtosis | -1.2 |
Mean | 73 |
Median Absolute Deviation (MAD) | 36 |
Skewness | 0 |
Sum | 10585 |
Variance | 1764.1667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.7% |
110 | 1 | 0.7% |
94 | 1 | 0.7% |
95 | 1 | 0.7% |
96 | 1 | 0.7% |
97 | 1 | 0.7% |
98 | 1 | 0.7% |
99 | 1 | 0.7% |
100 | 1 | 0.7% |
101 | 1 | 0.7% |
Other values (135) | 135 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
145 | 1 | |
144 | 1 | |
143 | 1 | |
142 | 1 | |
141 | 1 | |
140 | 1 | |
139 | 1 | |
138 | 1 | |
137 | 1 | |
136 | 1 |
호선
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 5.6% |
Missing | 1 |
Missing (%) | 0.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.5138889 |
Minimum | 1 |
---|---|
Maximum | 8 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1.15 |
Q1 | 5 |
median | 6 |
Q3 | 7 |
95-th percentile | 8 |
Maximum | 8 |
Range | 7 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.9432008 |
---|---|
Coefficient of variation (CV) | 0.3524193 |
Kurtosis | 0.018416166 |
Mean | 5.5138889 |
Median Absolute Deviation (MAD) | 1 |
Skewness | -0.94326672 |
Sum | 794 |
Variance | 3.7760295 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
7 | 41 | |
6 | 33 | |
5 | 23 | |
8 | 14 | 9.7% |
2 | 12 | 8.3% |
4 | 11 | 7.6% |
1 | 8 | 5.5% |
3 | 2 | 1.4% |
(Missing) | 1 | 0.7% |
Value | Count | Frequency (%) |
1 | 8 | 5.5% |
2 | 12 | 8.3% |
3 | 2 | 1.4% |
4 | 11 | 7.6% |
5 | 23 | |
6 | 33 | |
7 | 41 | |
8 | 14 | 9.7% |
Value | Count | Frequency (%) |
8 | 14 | 9.7% |
7 | 41 | |
6 | 33 | |
5 | 23 | |
4 | 11 | 7.6% |
3 | 2 | 1.4% |
2 | 12 | 8.3% |
1 | 8 | 5.5% |
역명
Text
Distinct | 68 |
---|---|
Distinct (%) | 46.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
Value | Count | Frequency (%) |
남구로 | 11 | 7.6% |
신설동(2 | 6 | 4.1% |
신당 | 5 | 3.4% |
신설동(1 | 5 | 3.4% |
잠실 | 5 | 3.4% |
고속터미널 | 5 | 3.4% |
온수 | 5 | 3.4% |
가산디지털단지 | 4 | 2.8% |
마포구청 | 4 | 2.8% |
이수 | 4 | 2.8% |
Other values (58) | 91 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 24 | 4.7% |
동 | 24 | 4.7% |
( | 19 | 3.7% |
신 | 19 | 3.7% |
) | 19 | 3.7% |
남 | 14 | 2.8% |
산 | 14 | 2.8% |
지 | 13 | 2.6% |
로 | 13 | 2.6% |
수 | 13 | 2.6% |
Other values (98) | 337 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 451 | |
Decimal Number | 20 | 3.9% |
Open Punctuation | 19 | 3.7% |
Close Punctuation | 19 | 3.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 24 | 5.3% |
동 | 24 | 5.3% |
신 | 19 | 4.2% |
남 | 14 | 3.1% |
산 | 14 | 3.1% |
지 | 13 | 2.9% |
로 | 13 | 2.9% |
수 | 13 | 2.9% |
대 | 12 | 2.7% |
설 | 11 | 2.4% |
Other values (92) | 294 |
Decimal Number
Value | Count | Frequency (%) |
1 | 8 | |
2 | 6 | |
4 | 4 | |
3 | 2 | 10.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 19 |
Close Punctuation
Value | Count | Frequency (%) |
) | 19 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 451 | |
Common | 58 | 11.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 24 | 5.3% |
동 | 24 | 5.3% |
신 | 19 | 4.2% |
남 | 14 | 3.1% |
산 | 14 | 3.1% |
지 | 13 | 2.9% |
로 | 13 | 2.9% |
수 | 13 | 2.9% |
대 | 12 | 2.7% |
설 | 11 | 2.4% |
Other values (92) | 294 |
Common
Value | Count | Frequency (%) |
( | 19 | |
) | 19 | |
1 | 8 | |
2 | 6 | 10.3% |
4 | 4 | 6.9% |
3 | 2 | 3.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 451 | |
ASCII | 58 | 11.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 24 | 5.3% |
동 | 24 | 5.3% |
신 | 19 | 4.2% |
남 | 14 | 3.1% |
산 | 14 | 3.1% |
지 | 13 | 2.9% |
로 | 13 | 2.9% |
수 | 13 | 2.9% |
대 | 12 | 2.7% |
설 | 11 | 2.4% |
Other values (92) | 294 |
ASCII
Value | Count | Frequency (%) |
( | 19 | |
) | 19 | |
1 | 8 | |
2 | 6 | 10.3% |
4 | 4 | 6.9% |
3 | 2 | 3.4% |
장비
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
W/L |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | W/L |
---|---|
2nd row | W/L |
3rd row | W/L |
4th row | W/L |
5th row | W/L |
Common Values
Value | Count | Frequency (%) |
W/L | 145 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
w/l | 145 |
호기
Categorical
Distinct | 19 |
---|---|
Distinct (%) | 13.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
1 | |
---|---|
2 | |
3 | |
내부#1 | |
4 | |
Other values (14) |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.6965517 |
Min length | 1 |
Unique
Unique | 8 ? |
---|---|
Unique (%) | 5.5% |
Sample
1st row | 내부#1 |
---|---|
2nd row | 외부#2 |
3rd row | 내부#1 |
4th row | 내부#2 |
5th row | 내부#3 |
Common Values
Value | Count | Frequency (%) |
1 | 47 | |
2 | 27 | |
3 | 17 | 11.7% |
내부#1 | 15 | 10.3% |
4 | 11 | 7.6% |
내부#2 | 5 | 3.4% |
5 | 4 | 2.8% |
외부#1 | 3 | 2.1% |
내부#3 | 3 | 2.1% |
내부#4 | 3 | 2.1% |
Other values (9) | 10 | 6.9% |
Length
Value | Count | Frequency (%) |
1 | 47 | |
2 | 27 | |
3 | 17 | 11.7% |
내부#1 | 15 | 10.3% |
4 | 11 | 7.6% |
내부#2 | 5 | 3.4% |
5 | 4 | 2.8% |
내부#3 | 3 | 2.1% |
내부#4 | 3 | 2.1% |
외부#1 | 3 | 2.1% |
Other values (9) | 10 | 6.9% |
승강기번호
Text
UNIQUE
 
Distinct | 145 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
Value | Count | Frequency (%) |
1902-362 | 1 | 0.7% |
1900-246 | 1 | 0.7% |
1904-018 | 1 | 0.7% |
1901-957 | 1 | 0.7% |
1901-956 | 1 | 0.7% |
1901-913 | 1 | 0.7% |
1901-914 | 1 | 0.7% |
1901-555 | 1 | 0.7% |
1900-831 | 1 | 0.7% |
1901-785 | 1 | 0.7% |
Other values (135) | 135 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 250 | |
0 | 244 | |
9 | 176 | |
- | 145 | |
3 | 71 | 6.1% |
2 | 68 | 5.9% |
4 | 67 | 5.8% |
7 | 44 | 3.8% |
5 | 37 | 3.2% |
6 | 29 | 2.5% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1015 | |
Dash Punctuation | 145 | 12.5% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 250 | |
0 | 244 | |
9 | 176 | |
3 | 71 | 7.0% |
2 | 68 | 6.7% |
4 | 67 | 6.6% |
7 | 44 | 4.3% |
5 | 37 | 3.6% |
6 | 29 | 2.9% |
8 | 29 | 2.9% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 145 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1160 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 250 | |
0 | 244 | |
9 | 176 | |
- | 145 | |
3 | 71 | 6.1% |
2 | 68 | 5.9% |
4 | 67 | 5.8% |
7 | 44 | 3.8% |
5 | 37 | 3.2% |
6 | 29 | 2.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1160 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 250 | |
0 | 244 | |
9 | 176 | |
- | 145 | |
3 | 71 | 6.1% |
2 | 68 | 5.9% |
4 | 67 | 5.8% |
7 | 44 | 3.8% |
5 | 37 | 3.2% |
6 | 29 | 2.5% |
운행구간
Categorical
HIGH CORRELATION
 
Distinct | 36 |
---|---|
Distinct (%) | 24.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
B1-B2 | |
---|---|
B2-B3 | |
F1-B1 | |
<NA> | |
B3-B4 | 5 |
Other values (31) |
Length
Max length | 11 |
---|---|
Median length | 5 |
Mean length | 6.062069 |
Min length | 4 |
Unique
Unique | 15 ? |
---|---|
Unique (%) | 10.3% |
Sample
1st row | B2(승)~B1(대) |
---|---|
2nd row | 지상~B1(대) |
3rd row | B2(승)~B1(대) |
4th row | B2(승)~B1(대) |
5th row | B1(대)~B1(대) |
Common Values
Value | Count | Frequency (%) |
B1-B2 | 30 | |
B2-B3 | 25 | |
F1-B1 | 16 | 11.0% |
<NA> | 7 | 4.8% |
B3-B4 | 5 | 3.4% |
B1(대)⇔B1(대) | 5 | 3.4% |
B4-B5 | 5 | 3.4% |
BM1-B1 | 4 | 2.8% |
B5-B4 | 4 | 2.8% |
B2(승)~B1(대) | 3 | 2.1% |
Other values (26) | 41 |
Length
Value | Count | Frequency (%) |
b1-b2 | 30 | |
b2-b3 | 25 | |
f1-b1 | 16 | 11.0% |
na | 7 | 4.8% |
b3-b4 | 5 | 3.4% |
b1(대)⇔b1(대 | 5 | 3.4% |
b4-b5 | 5 | 3.4% |
bm1-b1 | 4 | 2.8% |
b5-b4 | 4 | 2.8% |
b2(승)~b1(대 | 3 | 2.1% |
Other values (26) | 41 |
설치위치
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 35 |
---|---|
Distinct (%) | 24.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
내부 | |
---|---|
외부 | |
대합실 연결통로 | 2 |
상선승강장 시점측 | 1 |
하선승강장 시점측 | 1 |
Other values (30) |
Length
Max length | 16 |
---|---|
Median length | 2 |
Mean length | 3.6965517 |
Min length | 2 |
Unique
Unique | 32 ? |
---|---|
Unique (%) | 22.1% |
Sample
1st row | 내부 C 계단 |
---|---|
2nd row | 6번 출입구 |
3rd row | 상선승강장 시점측 |
4th row | 하선승강장 시점측 |
5th row | 대합실 연결통로 |
Common Values
Value | Count | Frequency (%) |
내부 | 90 | |
외부 | 21 | 14.5% |
대합실 연결통로 | 2 | 1.4% |
상선승강장 시점측 | 1 | 0.7% |
하선승강장 시점측 | 1 | 0.7% |
제기동측 승강장 | 1 | 0.7% |
섬식(상)8-2 | 1 | 0.7% |
섬식(외) 8-2 | 1 | 0.7% |
성수측 승강장 | 1 | 0.7% |
6번 출입구 | 1 | 0.7% |
Other values (25) | 25 | 17.2% |
Length
Value | Count | Frequency (%) |
내부 | 91 | |
외부 | 21 | 11.3% |
연결통로 | 5 | 2.7% |
승강장 | 5 | 2.7% |
대합실 | 4 | 2.2% |
1호선 | 4 | 2.2% |
계단 | 3 | 1.6% |
시점측 | 2 | 1.1% |
연결계단 | 2 | 1.1% |
환승통로 | 2 | 1.1% |
Other values (47) | 47 |
연번 | 호선 | 역명 | 호기 | 운행구간 | 설치위치 | |
---|---|---|---|---|---|---|
연번 | 1.000 | 0.913 | 0.992 | 0.618 | 0.859 | 0.465 |
호선 | 0.913 | 1.000 | 0.992 | 0.629 | 0.925 | 0.915 |
역명 | 0.992 | 0.992 | 1.000 | 0.000 | 0.941 | 0.876 |
호기 | 0.618 | 0.629 | 0.000 | 1.000 | 0.895 | 0.916 |
운행구간 | 0.859 | 0.925 | 0.941 | 0.895 | 1.000 | 0.976 |
설치위치 | 0.465 | 0.915 | 0.876 | 0.916 | 0.976 | 1.000 |
운행구간 | 설치위치 | 호기 | |
---|---|---|---|
운행구간 | 1.000 | 0.652 | 0.442 |
설치위치 | 0.652 | 1.000 | 0.489 |
호기 | 0.442 | 0.489 | 1.000 |
연번 | 호선 | 호기 | 운행구간 | 설치위치 | |
---|---|---|---|---|---|
연번 | 1.000 | 0.979 | 0.273 | 0.451 | 0.162 |
호선 | 0.979 | 1.000 | 0.309 | 0.616 | 0.598 |
호기 | 0.273 | 0.309 | 1.000 | 0.442 | 0.489 |
운행구간 | 0.451 | 0.616 | 0.442 | 1.000 | 0.652 |
설치위치 | 0.162 | 0.598 | 0.489 | 0.652 | 1.000 |
연번 | 호선 | 역명 | 장비 | 호기 | 승강기번호 | 운행구간 | 설치위치 | |
---|---|---|---|---|---|---|---|---|
0 | 1 | 1 | 서울(1) | W/L | 내부#1 | 1902-362 | B2(승)~B1(대) | 내부 C 계단 |
1 | 2 | 1 | 신설동(1) | W/L | 외부#2 | 1903-467 | 지상~B1(대) | 6번 출입구 |
2 | 3 | 1 | 신설동(1) | W/L | 내부#1 | 1903-415 | B2(승)~B1(대) | 상선승강장 시점측 |
3 | 4 | 1 | 신설동(1) | W/L | 내부#2 | 1903-417 | B2(승)~B1(대) | 하선승강장 시점측 |
4 | 5 | 1 | 신설동(1) | W/L | 내부#3 | 1903-416 | B1(대)~B1(대) | 대합실 연결통로 |
5 | 6 | 1 | 신설동(1) | W/L | 내부#4 | 1903-414 | B1(대)~B1(대) | 대합실 연결통로 |
6 | 7 | 1 | 청량리(1) | W/L | 내부#1 | 1903-411 | B2(대)~B1(승) | 제기동측 승강장 |
7 | 8 | 1 | 청량리(1) | W/L | 내부#2 | 1901-053 | B2(대)~B1(승) | 섬식(상)8-2 |
8 | 9 | 2 | 한양대 | W/L | 내부#1 | 1900-169 | F1(승)~F2(대) | 섬식(외) 8-2 |
9 | 10 | 2 | 용답 | W/L | 내부#1 | 1900-276 | F1(대)⇔F2(승) | 성수측 승강장 |
연번 | 호선 | 역명 | 장비 | 호기 | 승강기번호 | 운행구간 | 설치위치 | |
---|---|---|---|---|---|---|---|---|
135 | 136 | 8 | 잠실 | W/L | 2 | 1900-790 | B2-B3 | 내부 |
136 | 137 | 8 | 잠실 | W/L | 3 | 1900-791 | B1-B2 | 내부 |
137 | 138 | 8 | 잠실 | W/L | 4 | 3904-584 | <NA> | <NA> |
138 | 139 | 8 | 복정 | W/L | 1 | 1900-771 | F1-B1 | 외부 |
139 | 140 | 8 | 남한산성입구 | W/L | 1 | 3903-032 | B1-B2 | 내부 |
140 | 141 | 8 | 남한산성입구 | W/L | 2 | 3903-033 | F1-B1 | 외부 |
141 | 142 | 8 | 수진 | W/L | 1 | 3903-007 | F1-B1 | 외부 |
142 | 143 | 8 | 모란 | W/L | 1 | 3900-941 | B2-B3 | 내부 |
143 | 144 | 8 | 모란 | W/L | 2 | 3900-942 | B2-B3 | 내부 |
144 | 145 | <NA> | 대공원어린이집 | W/L | 1 | 1902-175 | F1-F2 | 외부 |