Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 472 |
Missing cells | 284 |
Missing cells (%) | 8.6% |
Duplicate rows | 95 |
Duplicate rows (%) | 20.1% |
Total size in memory | 27.3 KiB |
Average record size in memory | 59.3 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Numeric | 3 |
Dataset
Description | 서울교통공사에서 관리하는 도시광역철도역들의 엘리베이터 데이터로 철도운영기관명, 선명, 역명, 출입구번호, 상세위치, 정원인원, 정원중량의데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041388/fileData.do |
철도운영기관명 has constant value "" | Constant |
Dataset has 95 (20.1%) duplicate rows | Duplicates |
정원_인원 is highly overall correlated with 정원_중량(kg) | High correlation |
정원_중량(kg) is highly overall correlated with 정원_인원 | High correlation |
출입구번호 has 284 (60.2%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 18:42:20.719312 |
---|---|
Analysis finished | 2023-12-12 18:42:23.000063 |
Duration | 2.28 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
서울교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 472 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 472 |
선명
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
5호선 | |
---|---|
7호선 | |
6호선 | |
8호선 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 5호선 |
---|---|
2nd row | 5호선 |
3rd row | 5호선 |
4th row | 5호선 |
5th row | 5호선 |
Common Values
Value | Count | Frequency (%) |
5호선 | 175 | |
7호선 | 127 | |
6호선 | 113 | |
8호선 | 57 | 12.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
5호선 | 175 | |
7호선 | 127 | |
6호선 | 113 | |
8호선 | 57 | 12.1% |
역명
Text
Distinct | 149 |
---|---|
Distinct (%) | 31.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
Value | Count | Frequency (%) |
공덕 | 7 | 1.5% |
강일 | 7 | 1.5% |
천호(풍납토성 | 6 | 1.3% |
마곡 | 6 | 1.3% |
신길 | 6 | 1.3% |
가락시장 | 6 | 1.3% |
태릉입구 | 6 | 1.3% |
청구 | 5 | 1.1% |
애오개 | 5 | 1.1% |
하남풍산 | 5 | 1.1% |
Other values (139) | 413 |
Most occurring characters
Value | Count | Frequency (%) |
) | 105 | 5.2% |
( | 105 | 5.2% |
대 | 75 | 3.7% |
구 | 62 | 3.0% |
산 | 56 | 2.8% |
신 | 42 | 2.1% |
장 | 41 | 2.0% |
동 | 41 | 2.0% |
청 | 36 | 1.8% |
원 | 33 | 1.6% |
Other values (189) | 1440 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1818 | |
Close Punctuation | 105 | 5.2% |
Open Punctuation | 105 | 5.2% |
Other Punctuation | 6 | 0.3% |
Decimal Number | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 75 | 4.1% |
구 | 62 | 3.4% |
산 | 56 | 3.1% |
신 | 42 | 2.3% |
장 | 41 | 2.3% |
동 | 41 | 2.3% |
청 | 36 | 2.0% |
원 | 33 | 1.8% |
공 | 31 | 1.7% |
성 | 28 | 1.5% |
Other values (184) | 1373 |
Decimal Number
Value | Count | Frequency (%) |
3 | 1 | |
4 | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 105 |
Open Punctuation
Value | Count | Frequency (%) |
( | 105 |
Other Punctuation
Value | Count | Frequency (%) |
· | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1818 | |
Common | 218 | 10.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 75 | 4.1% |
구 | 62 | 3.4% |
산 | 56 | 3.1% |
신 | 42 | 2.3% |
장 | 41 | 2.3% |
동 | 41 | 2.3% |
청 | 36 | 2.0% |
원 | 33 | 1.8% |
공 | 31 | 1.7% |
성 | 28 | 1.5% |
Other values (184) | 1373 |
Common
Value | Count | Frequency (%) |
) | 105 | |
( | 105 | |
· | 6 | 2.8% |
3 | 1 | 0.5% |
4 | 1 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1818 | |
ASCII | 212 | 10.4% |
None | 6 | 0.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
) | 105 | |
( | 105 | |
3 | 1 | 0.5% |
4 | 1 | 0.5% |
Hangul
Value | Count | Frequency (%) |
대 | 75 | 4.1% |
구 | 62 | 3.4% |
산 | 56 | 3.1% |
신 | 42 | 2.3% |
장 | 41 | 2.3% |
동 | 41 | 2.3% |
청 | 36 | 2.0% |
원 | 33 | 1.8% |
공 | 31 | 1.7% |
성 | 28 | 1.5% |
Other values (184) | 1373 |
None
Value | Count | Frequency (%) |
· | 6 |
출입구번호
Real number (ℝ)
MISSING
 
Distinct | 12 |
---|---|
Distinct (%) | 6.4% |
Missing | 284 |
Missing (%) | 60.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.5691489 |
Minimum | 1 |
---|---|
Maximum | 12 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 3 |
Q3 | 5 |
95-th percentile | 8 |
Maximum | 12 |
Range | 11 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.4691693 |
---|---|
Coefficient of variation (CV) | 0.69180899 |
Kurtosis | 1.0478792 |
Mean | 3.5691489 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.1861738 |
Sum | 671 |
Variance | 6.0967971 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 41 | 8.7% |
3 | 37 | 7.8% |
2 | 36 | 7.6% |
4 | 22 | 4.7% |
6 | 15 | 3.2% |
5 | 14 | 3.0% |
8 | 8 | 1.7% |
7 | 6 | 1.3% |
11 | 3 | 0.6% |
10 | 3 | 0.6% |
Other values (2) | 3 | 0.6% |
(Missing) | 284 |
Value | Count | Frequency (%) |
1 | 41 | |
2 | 36 | |
3 | 37 | |
4 | 22 | |
5 | 14 | 3.0% |
6 | 15 | 3.2% |
7 | 6 | 1.3% |
8 | 8 | 1.7% |
9 | 2 | 0.4% |
10 | 3 | 0.6% |
Value | Count | Frequency (%) |
12 | 1 | 0.2% |
11 | 3 | 0.6% |
10 | 3 | 0.6% |
9 | 2 | 0.4% |
8 | 8 | 1.7% |
7 | 6 | 1.3% |
6 | 15 | |
5 | 14 | 3.0% |
4 | 22 | |
3 | 37 |
상세위치
Text
Distinct | 110 |
---|---|
Distinct (%) | 23.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
Length
Max length | 18 |
---|---|
Median length | 15 |
Mean length | 11.887712 |
Min length | 7 |
Characters and Unicode
Total characters | 5611 |
---|---|
Distinct characters | 44 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 57 ? |
---|---|
Unique (%) | 12.1% |
Sample
1st row | (B3-B4) 승강장 |
---|---|
2nd row | (F1-B3)1번 출입구 |
3rd row | (B3-B2) 승강장 |
4th row | (B3-B2) 승강장 |
5th row | (B3-B1) 승강장 |
Value | Count | Frequency (%) |
승강장 | 218 | |
출입구 | 174 | |
b2-b3 | 72 | 8.1% |
b1-b2 | 68 | 7.6% |
대합실 | 20 | 2.2% |
f1-b1)3번 | 20 | 2.2% |
b1-b3 | 18 | 2.0% |
f1-b1)2번 | 18 | 2.0% |
f1-b1)1번 | 14 | 1.6% |
b3-b4 | 14 | 1.6% |
Other values (103) | 254 |
Most occurring characters
Value | Count | Frequency (%) |
B | 735 | |
1 | 515 | 9.2% |
- | 474 | 8.4% |
) | 472 | 8.4% |
( | 472 | 8.4% |
418 | 7.4% | |
2 | 290 | 5.2% |
승 | 262 | 4.7% |
강 | 258 | 4.6% |
장 | 258 | 4.6% |
Other values (34) | 1457 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1655 | |
Decimal Number | 1162 | |
Uppercase Letter | 944 | |
Dash Punctuation | 474 | 8.4% |
Close Punctuation | 472 | 8.4% |
Open Punctuation | 472 | 8.4% |
Space Separator | 418 | 7.4% |
Other Punctuation | 14 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
승 | 262 | |
강 | 258 | |
장 | 258 | |
번 | 175 | |
출 | 175 | |
입 | 175 | |
구 | 175 | |
실 | 29 | 1.8% |
합 | 26 | 1.6% |
대 | 26 | 1.6% |
Other values (17) | 96 | 5.8% |
Decimal Number
Value | Count | Frequency (%) |
1 | 515 | |
2 | 290 | |
3 | 193 | 16.6% |
4 | 87 | 7.5% |
5 | 35 | 3.0% |
6 | 18 | 1.5% |
8 | 11 | 0.9% |
7 | 8 | 0.7% |
0 | 3 | 0.3% |
9 | 2 | 0.2% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 735 | |
F | 209 | 22.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 474 |
Close Punctuation
Value | Count | Frequency (%) |
) | 472 |
Open Punctuation
Value | Count | Frequency (%) |
( | 472 |
Space Separator
Value | Count | Frequency (%) |
418 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 14 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 3012 | |
Hangul | 1655 | |
Latin | 944 | 16.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
승 | 262 | |
강 | 258 | |
장 | 258 | |
번 | 175 | |
출 | 175 | |
입 | 175 | |
구 | 175 | |
실 | 29 | 1.8% |
합 | 26 | 1.6% |
대 | 26 | 1.6% |
Other values (17) | 96 | 5.8% |
Common
Value | Count | Frequency (%) |
1 | 515 | |
- | 474 | |
) | 472 | |
( | 472 | |
418 | ||
2 | 290 | |
3 | 193 | 6.4% |
4 | 87 | 2.9% |
5 | 35 | 1.2% |
6 | 18 | 0.6% |
Other values (5) | 38 | 1.3% |
Latin
Value | Count | Frequency (%) |
B | 735 | |
F | 209 | 22.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 3956 | |
Hangul | 1655 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
B | 735 | |
1 | 515 | |
- | 474 | |
) | 472 | |
( | 472 | |
418 | ||
2 | 290 | 7.3% |
F | 209 | 5.3% |
3 | 193 | 4.9% |
4 | 87 | 2.2% |
Other values (7) | 91 | 2.3% |
Hangul
Value | Count | Frequency (%) |
승 | 262 | |
강 | 258 | |
장 | 258 | |
번 | 175 | |
출 | 175 | |
입 | 175 | |
구 | 175 | |
실 | 29 | 1.8% |
합 | 26 | 1.6% |
대 | 26 | 1.6% |
Other values (17) | 96 | 5.8% |
정원_인원
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 15.548729 |
Minimum | 11 |
---|---|
Maximum | 24 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.3 KiB |
Quantile statistics
Minimum | 11 |
---|---|
5-th percentile | 11 |
Q1 | 15 |
median | 15 |
Q3 | 15 |
95-th percentile | 24 |
Maximum | 24 |
Range | 13 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 3.2052502 |
---|---|
Coefficient of variation (CV) | 0.20614227 |
Kurtosis | 2.5388406 |
Mean | 15.548729 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.6120925 |
Sum | 7339 |
Variance | 10.273629 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
15 | 356 | |
11 | 52 | 11.0% |
24 | 48 | 10.2% |
21 | 6 | 1.3% |
17 | 5 | 1.1% |
13 | 4 | 0.8% |
12 | 1 | 0.2% |
Value | Count | Frequency (%) |
11 | 52 | 11.0% |
12 | 1 | 0.2% |
13 | 4 | 0.8% |
15 | 356 | |
17 | 5 | 1.1% |
21 | 6 | 1.3% |
24 | 48 | 10.2% |
Value | Count | Frequency (%) |
24 | 48 | 10.2% |
21 | 6 | 1.3% |
17 | 5 | 1.1% |
15 | 356 | |
13 | 4 | 0.8% |
12 | 1 | 0.2% |
11 | 52 | 11.0% |
정원_중량(kg)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1044.9576 |
Minimum | 750 |
---|---|
Maximum | 1800 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.3 KiB |
Quantile statistics
Minimum | 750 |
---|---|
5-th percentile | 750 |
Q1 | 1000 |
median | 1000 |
Q3 | 1000 |
95-th percentile | 1600 |
Maximum | 1800 |
Range | 1050 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 221.24958 |
---|---|
Coefficient of variation (CV) | 0.21173067 |
Kurtosis | 2.7620745 |
Mean | 1044.9576 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.7536968 |
Sum | 493220 |
Variance | 48951.378 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1000 | 352 | |
750 | 52 | 11.0% |
1600 | 50 | 10.6% |
1150 | 8 | 1.7% |
1005 | 4 | 0.8% |
1800 | 4 | 0.8% |
900 | 2 | 0.4% |
Value | Count | Frequency (%) |
750 | 52 | 11.0% |
900 | 2 | 0.4% |
1000 | 352 | |
1005 | 4 | 0.8% |
1150 | 8 | 1.7% |
1600 | 50 | 10.6% |
1800 | 4 | 0.8% |
Value | Count | Frequency (%) |
1800 | 4 | 0.8% |
1600 | 50 | 10.6% |
1150 | 8 | 1.7% |
1005 | 4 | 0.8% |
1000 | 352 | |
900 | 2 | 0.4% |
750 | 52 | 11.0% |
선명 | 출입구번호 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|
선명 | 1.000 | 0.218 | 0.384 | 0.155 |
출입구번호 | 0.218 | 1.000 | 0.123 | 0.176 |
정원_인원 | 0.384 | 0.123 | 1.000 | 0.826 |
정원_중량(kg) | 0.155 | 0.176 | 0.826 | 1.000 |
출입구번호 | 정원_인원 | 정원_중량(kg) | 선명 | |
---|---|---|---|---|
출입구번호 | 1.000 | 0.114 | 0.099 | 0.129 |
정원_인원 | 0.114 | 1.000 | 0.960 | 0.256 |
정원_중량(kg) | 0.099 | 0.960 | 1.000 | 0.243 |
선명 | 0.129 | 0.256 | 0.243 | 1.000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 5호선 | 강동 | <NA> | (B3-B4) 승강장 | 15 | 1000 |
1 | 서울교통공사 | 5호선 | 강동 | 1 | (F1-B3)1번 출입구 | 15 | 1000 |
2 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B2) 승강장 | 24 | 1600 |
3 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B2) 승강장 | 24 | 1600 |
4 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B1) 승강장 | 24 | 1600 |
5 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B1) 승강장 | 24 | 1600 |
6 | 서울교통공사 | 5호선 | 강일 | 1 | (B2-F1)1번 출입구 | 24 | 1600 |
7 | 서울교통공사 | 5호선 | 강일 | 3 | (B2-F1)3번 출입구 | 24 | 1600 |
8 | 서울교통공사 | 5호선 | 강일 | 4 | (B2-F1)4번 출입구 | 24 | 1600 |
9 | 서울교통공사 | 5호선 | 개롱 | <NA> | (B1-B2) 승강장 | 15 | 1000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
462 | 서울교통공사 | 8호선 | 잠실(송파구청) | <NA> | (B1-B3) 승강장 | 15 | 1000 |
463 | 서울교통공사 | 8호선 | 잠실(송파구청) | <NA> | (B1-B3) 승강장 | 15 | 1000 |
464 | 서울교통공사 | 8호선 | 잠실(송파구청) | 9 | (F1-B1)9번 출입구 | 15 | 1000 |
465 | 서울교통공사 | 8호선 | 잠실(송파구청) | 10 | (B2-F1)10번 출입구 | 17 | 1150 |
466 | 서울교통공사 | 8호선 | 장지 | <NA> | (B1-B2) 승강장 | 11 | 750 |
467 | 서울교통공사 | 8호선 | 장지 | <NA> | (B1-B2) 승강장 | 11 | 750 |
468 | 서울교통공사 | 8호선 | 장지 | 1 | (F1-B1)1번 출입구 | 15 | 1000 |
469 | 서울교통공사 | 8호선 | 장지 | 3 | (F1-B1)3번 출입구 | 15 | 1000 |
470 | 서울교통공사 | 8호선 | 천호(풍납토성) | <NA> | (B1-B2) 승강장 | 15 | 1000 |
471 | 서울교통공사 | 8호선 | 천호(풍납토성) | <NA> | (B1-B2) 승강장 | 15 | 1000 |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B1) 승강장 | 24 | 1600 | 2 |
1 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B2) 승강장 | 24 | 1600 | 2 |
2 | 서울교통공사 | 5호선 | 개롱 | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
3 | 서울교통공사 | 5호선 | 거여 | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
4 | 서울교통공사 | 5호선 | 고덕 | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
5 | 서울교통공사 | 5호선 | 광나루(장신대) | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
6 | 서울교통공사 | 5호선 | 군자(능동) | <NA> | (B1-B3) 승강장 | 15 | 1000 | 2 |
7 | 서울교통공사 | 5호선 | 굽은다리(강동구민회관앞) | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
8 | 서울교통공사 | 5호선 | 길동 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
9 | 서울교통공사 | 5호선 | 김포공항 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |