Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 140 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.1 KiB |
Average record size in memory | 51.9 B |
Variable types
Numeric | 3 |
---|---|
Text | 1 |
Categorical | 1 |
Unsupported | 1 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울교통공사 |
URL | https://data.seoul.go.kr/dataList/OA-13290/F/1/datasetView.do |
연번 is highly overall correlated with 호선 | High correlation |
호선 is highly overall correlated with 연번 | High correlation |
연번 has unique values | Unique |
환승 소요시간(분,초) is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-04-29 16:48:53.804544 |
---|---|
Analysis finished | 2024-04-29 16:48:56.320141 |
Duration | 2.52 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 140 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 70.5 |
Minimum | 1 |
---|---|
Maximum | 140 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 7.95 |
Q1 | 35.75 |
median | 70.5 |
Q3 | 105.25 |
95-th percentile | 133.05 |
Maximum | 140 |
Range | 139 |
Interquartile range (IQR) | 69.5 |
Descriptive statistics
Standard deviation | 40.5586 |
---|---|
Coefficient of variation (CV) | 0.57529928 |
Kurtosis | -1.2 |
Mean | 70.5 |
Median Absolute Deviation (MAD) | 35 |
Skewness | 0 |
Sum | 9870 |
Variance | 1645 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.7% |
98 | 1 | 0.7% |
92 | 1 | 0.7% |
93 | 1 | 0.7% |
94 | 1 | 0.7% |
95 | 1 | 0.7% |
96 | 1 | 0.7% |
97 | 1 | 0.7% |
99 | 1 | 0.7% |
90 | 1 | 0.7% |
Other values (130) | 130 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
140 | 1 | |
139 | 1 | |
138 | 1 | |
137 | 1 | |
136 | 1 | |
135 | 1 | |
134 | 1 | |
133 | 1 | |
132 | 1 | |
131 | 1 |
호선
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 6.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.2785714 |
Minimum | 1 |
---|---|
Maximum | 9 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 4 |
Q3 | 6 |
95-th percentile | 8 |
Maximum | 9 |
Range | 8 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.1825596 |
---|---|
Coefficient of variation (CV) | 0.51011409 |
Kurtosis | -0.93873424 |
Mean | 4.2785714 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.21805266 |
Sum | 599 |
Variance | 4.7635663 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
2 | 28 | |
5 | 25 | |
6 | 18 | |
3 | 16 | |
4 | 15 | |
7 | 15 | |
1 | 13 | |
8 | 6 | 4.3% |
9 | 4 | 2.9% |
Value | Count | Frequency (%) |
1 | 13 | |
2 | 28 | |
3 | 16 | |
4 | 15 | |
5 | 25 | |
6 | 18 | |
7 | 15 | |
8 | 6 | 4.3% |
9 | 4 | 2.9% |
Value | Count | Frequency (%) |
9 | 4 | 2.9% |
8 | 6 | 4.3% |
7 | 15 | |
6 | 18 | |
5 | 25 | |
4 | 15 | |
3 | 16 | |
2 | 28 | |
1 | 13 |
환승역명
Text
Distinct | 72 |
---|---|
Distinct (%) | 51.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.2 KiB |
Value | Count | Frequency (%) |
서울 | 6 | 4.3% |
왕십리 | 6 | 4.3% |
공덕 | 6 | 4.3% |
종로3가 | 6 | 4.3% |
동대문역사문화공원 | 6 | 4.3% |
신설동 | 4 | 2.9% |
고속터미널 | 4 | 2.9% |
김포공항 | 3 | 2.1% |
청량리 | 3 | 2.1% |
노원 | 2 | 1.4% |
Other values (62) | 94 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 19 | 4.1% |
공 | 18 | 3.9% |
대 | 18 | 3.9% |
문 | 15 | 3.3% |
로 | 14 | 3.0% |
구 | 14 | 3.0% |
신 | 14 | 3.0% |
가 | 13 | 2.8% |
원 | 11 | 2.4% |
청 | 11 | 2.4% |
Other values (100) | 313 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 450 | |
Decimal Number | 10 | 2.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 19 | 4.2% |
공 | 18 | 4.0% |
대 | 18 | 4.0% |
문 | 15 | 3.3% |
로 | 14 | 3.1% |
구 | 14 | 3.1% |
신 | 14 | 3.1% |
가 | 13 | 2.9% |
원 | 11 | 2.4% |
청 | 11 | 2.4% |
Other values (98) | 303 |
Decimal Number
Value | Count | Frequency (%) |
3 | 8 | |
4 | 2 | 20.0% |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 450 | |
Common | 10 | 2.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 19 | 4.2% |
공 | 18 | 4.0% |
대 | 18 | 4.0% |
문 | 15 | 3.3% |
로 | 14 | 3.1% |
구 | 14 | 3.1% |
신 | 14 | 3.1% |
가 | 13 | 2.9% |
원 | 11 | 2.4% |
청 | 11 | 2.4% |
Other values (98) | 303 |
Common
Value | Count | Frequency (%) |
3 | 8 | |
4 | 2 | 20.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 450 | |
ASCII | 10 | 2.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 19 | 4.2% |
공 | 18 | 4.0% |
대 | 18 | 4.0% |
문 | 15 | 3.3% |
로 | 14 | 3.1% |
구 | 14 | 3.1% |
신 | 14 | 3.1% |
가 | 13 | 2.9% |
원 | 11 | 2.4% |
청 | 11 | 2.4% |
Other values (98) | 303 |
ASCII
Value | Count | Frequency (%) |
3 | 8 | |
4 | 2 | 20.0% |
환승노선
Categorical
Distinct | 19 |
---|---|
Distinct (%) | 13.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.2 KiB |
2호선 | |
---|---|
5호선 | |
1호선 | |
경의중앙선 | |
3호선 | |
Other values (14) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.3357143 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 2.9% |
Sample
1st row | 4호선 |
---|---|
2nd row | 공항철도 |
3rd row | 경의중앙선 |
4th row | 2호선 |
5th row | 3호선 |
Common Values
Value | Count | Frequency (%) |
2호선 | 20 | |
5호선 | 15 | |
1호선 | 13 | |
경의중앙선 | 13 | |
3호선 | 11 | |
6호선 | 10 | |
4호선 | 9 | 6.4% |
9호선 | 9 | 6.4% |
분당선 | 9 | 6.4% |
7호선 | 7 | 5.0% |
Other values (9) | 24 |
Length
Value | Count | Frequency (%) |
2호선 | 20 | |
5호선 | 15 | |
1호선 | 13 | |
경의중앙선 | 13 | |
3호선 | 11 | |
6호선 | 10 | |
4호선 | 9 | 6.4% |
9호선 | 9 | 6.4% |
분당선 | 9 | 6.4% |
공항철도 | 7 | 5.0% |
Other values (9) | 24 |
환승거리(m)
Real number (ℝ)
Distinct | 77 |
---|---|
Distinct (%) | 55.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 133.12143 |
Minimum | 7 |
---|---|
Maximum | 355 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.4 KiB |
Quantile statistics
Minimum | 7 |
---|---|
5-th percentile | 34.4 |
Q1 | 77.75 |
median | 107 |
Q3 | 181 |
95-th percentile | 279.35 |
Maximum | 355 |
Range | 348 |
Interquartile range (IQR) | 103.25 |
Descriptive statistics
Standard deviation | 78.918177 |
---|---|
Coefficient of variation (CV) | 0.5928285 |
Kurtosis | -0.10541884 |
Mean | 133.12143 |
Median Absolute Deviation (MAD) | 48 |
Skewness | 0.78442607 |
Sum | 18637 |
Variance | 6228.0787 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
110 | 5 | 3.6% |
159 | 4 | 2.9% |
77 | 4 | 2.9% |
35 | 4 | 2.9% |
155 | 4 | 2.9% |
100 | 4 | 2.9% |
82 | 4 | 2.9% |
75 | 4 | 2.9% |
93 | 3 | 2.1% |
81 | 3 | 2.1% |
Other values (67) | 101 |
Value | Count | Frequency (%) |
7 | 1 | 0.7% |
16 | 1 | 0.7% |
17 | 3 | |
19 | 1 | 0.7% |
23 | 1 | 0.7% |
35 | 4 | |
41 | 1 | 0.7% |
44 | 1 | 0.7% |
45 | 2 | |
46 | 2 |
Value | Count | Frequency (%) |
355 | 1 | |
323 | 1 | |
314 | 1 | |
312 | 2 | |
309 | 1 | |
305 | 1 | |
278 | 2 | |
276 | 2 | |
275 | 1 | |
273 | 1 |
환승 소요시간(분,초)
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 0 |
---|---|
Missing (%) | 0.0% |
Memory size | 1.2 KiB |
연번 | 호선 | 환승역명 | 환승노선 | 환승거리(m) | |
---|---|---|---|---|---|
연번 | 1.000 | 0.951 | 0.827 | 0.000 | 0.195 |
호선 | 0.951 | 1.000 | 0.820 | 0.000 | 0.230 |
환승역명 | 0.827 | 0.820 | 1.000 | 0.904 | 0.887 |
환승노선 | 0.000 | 0.000 | 0.904 | 1.000 | 0.037 |
환승거리(m) | 0.195 | 0.230 | 0.887 | 0.037 | 1.000 |
연번 | 호선 | 환승거리(m) | 환승노선 | |
---|---|---|---|---|
연번 | 1.000 | 0.990 | -0.160 | 0.000 |
호선 | 0.990 | 1.000 | -0.167 | 0.000 |
환승거리(m) | -0.160 | -0.167 | 1.000 | 0.000 |
환승노선 | 0.000 | 0.000 | 0.000 | 1.000 |
연번 | 호선 | 환승역명 | 환승노선 | 환승거리(m) | 환승 소요시간(분,초) | |
---|---|---|---|---|---|---|
0 | 1 | 1 | 서울 | 4호선 | 159 | 00:02:13 |
1 | 2 | 1 | 서울 | 공항철도 | 309 | 00:04:18 |
2 | 3 | 1 | 서울 | 경의중앙선 | 164 | 00:02:17 |
3 | 4 | 1 | 시청 | 2호선 | 101 | 00:01:24 |
4 | 5 | 1 | 종로3가 | 3호선 | 118 | 00:01:38 |
5 | 6 | 1 | 종로3가 | 5호선 | 312 | 00:04:20 |
6 | 7 | 1 | 동대문 | 4호선 | 194 | 00:02:42 |
7 | 8 | 1 | 동묘앞 | 6호선 | 96 | 00:01:20 |
8 | 9 | 1 | 신설동 | 2호선 | 159 | 00:02:13 |
9 | 10 | 1 | 신설동 | 우이신설선 | 129 | 00:01:48 |
연번 | 호선 | 환승역명 | 환승노선 | 환승거리(m) | 환승 소요시간(분,초) | |
---|---|---|---|---|---|---|
130 | 131 | 8 | 천호 | 5호선 | 35 | 00:00:29 |
131 | 132 | 8 | 석촌 | 9호선 | 82 | 00:01:08 |
132 | 133 | 8 | 잠실 | 2호선 | 190 | 00:02:38 |
133 | 134 | 8 | 가락시장 | 3호선 | 35 | 00:00:29 |
134 | 135 | 8 | 복정 | 분당선 | 16 | 00:00:13 |
135 | 136 | 8 | 모란 | 분당선 | 99 | 00:01:23 |
136 | 137 | 9 | 선정릉 | 분당선 | 110 | 00:01:32 |
137 | 138 | 9 | 종합운동장 | 2호선 | 94 | 00:01:18 |
138 | 139 | 9 | 석촌 | 8호선 | 82 | 00:01:08 |
139 | 140 | 9 | 올림픽공원 | 5호선 | 93 | 00:01:18 |