Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 175 |
Missing cells | 107 |
Missing cells (%) | 8.7% |
Duplicate rows | 37 |
Duplicate rows (%) | 21.1% |
Total size in memory | 10.2 KiB |
Average record size in memory | 59.8 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Numeric | 3 |
Dataset
Description | 수도권5호선에 포함된 도시광역철도역들의 엘리베이터 데이터로 철도운영기관명, 선명, 역명, 출입구번호, 상세위치, 정원인원, 정원중량의데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041393/fileData.do |
Reproduction
Analysis started | 2023-12-12 16:24:17.235347 |
---|---|
Analysis finished | 2023-12-12 16:24:18.473387 |
Duration | 1.24 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
서울교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 175 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 175 |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
5호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 5호선 |
---|---|
2nd row | 5호선 |
3rd row | 5호선 |
4th row | 5호선 |
5th row | 5호선 |
Common Values
Value | Count | Frequency (%) |
5호선 | 175 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
5호선 | 175 |
역명
Text
Distinct | 55 |
---|---|
Distinct (%) | 31.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Value | Count | Frequency (%) |
강일 | 7 | 4.0% |
신길 | 6 | 3.4% |
마곡 | 6 | 3.4% |
애오개 | 5 | 2.9% |
오금 | 5 | 2.9% |
하남풍산 | 5 | 2.9% |
고덕 | 4 | 2.3% |
천호(풍납토성 | 4 | 2.3% |
미사 | 4 | 2.3% |
상일동 | 4 | 2.3% |
Other values (45) | 125 |
Most occurring characters
Value | Count | Frequency (%) |
( | 34 | 4.7% |
) | 34 | 4.7% |
동 | 29 | 4.0% |
장 | 23 | 3.2% |
산 | 21 | 2.9% |
신 | 19 | 2.6% |
대 | 17 | 2.3% |
문 | 14 | 1.9% |
공 | 14 | 1.9% |
일 | 14 | 1.9% |
Other values (101) | 511 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 656 | |
Open Punctuation | 34 | 4.7% |
Close Punctuation | 34 | 4.7% |
Other Punctuation | 4 | 0.5% |
Decimal Number | 2 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 29 | 4.4% |
장 | 23 | 3.5% |
산 | 21 | 3.2% |
신 | 19 | 2.9% |
대 | 17 | 2.6% |
문 | 14 | 2.1% |
공 | 14 | 2.1% |
일 | 14 | 2.1% |
오 | 13 | 2.0% |
하 | 13 | 2.0% |
Other values (96) | 479 |
Decimal Number
Value | Count | Frequency (%) |
4 | 1 | |
3 | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 34 |
Close Punctuation
Value | Count | Frequency (%) |
) | 34 |
Other Punctuation
Value | Count | Frequency (%) |
· | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 656 | |
Common | 74 | 10.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 29 | 4.4% |
장 | 23 | 3.5% |
산 | 21 | 3.2% |
신 | 19 | 2.9% |
대 | 17 | 2.6% |
문 | 14 | 2.1% |
공 | 14 | 2.1% |
일 | 14 | 2.1% |
오 | 13 | 2.0% |
하 | 13 | 2.0% |
Other values (96) | 479 |
Common
Value | Count | Frequency (%) |
( | 34 | |
) | 34 | |
· | 4 | 5.4% |
4 | 1 | 1.4% |
3 | 1 | 1.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 656 | |
ASCII | 70 | 9.6% |
None | 4 | 0.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 34 | |
) | 34 | |
4 | 1 | 1.4% |
3 | 1 | 1.4% |
Hangul
Value | Count | Frequency (%) |
동 | 29 | 4.4% |
장 | 23 | 3.5% |
산 | 21 | 3.2% |
신 | 19 | 2.9% |
대 | 17 | 2.6% |
문 | 14 | 2.1% |
공 | 14 | 2.1% |
일 | 14 | 2.1% |
오 | 13 | 2.0% |
하 | 13 | 2.0% |
Other values (96) | 479 |
None
Value | Count | Frequency (%) |
· | 4 |
출입구번호
Real number (ℝ)
MISSING
 
Distinct | 8 |
---|---|
Distinct (%) | 11.8% |
Missing | 107 |
Missing (%) | 61.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.1911765 |
Minimum | 1 |
---|---|
Maximum | 8 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 3 |
Q3 | 4 |
95-th percentile | 7 |
Maximum | 8 |
Range | 7 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.9642883 |
---|---|
Coefficient of variation (CV) | 0.61553734 |
Kurtosis | -0.22788994 |
Mean | 3.1911765 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 0.82022742 |
Sum | 217 |
Variance | 3.8584284 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 15 | 8.6% |
3 | 15 | 8.6% |
2 | 15 | 8.6% |
4 | 7 | 4.0% |
6 | 5 | 2.9% |
5 | 5 | 2.9% |
7 | 4 | 2.3% |
8 | 2 | 1.1% |
(Missing) | 107 |
Value | Count | Frequency (%) |
1 | 15 | |
2 | 15 | |
3 | 15 | |
4 | 7 | |
5 | 5 | 2.9% |
6 | 5 | 2.9% |
7 | 4 | 2.3% |
8 | 2 | 1.1% |
Value | Count | Frequency (%) |
8 | 2 | 1.1% |
7 | 4 | 2.3% |
6 | 5 | 2.9% |
5 | 5 | 2.9% |
4 | 7 | |
3 | 15 | |
2 | 15 | |
1 | 15 |
상세위치
Text
Distinct | 66 |
---|---|
Distinct (%) | 37.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Length
Max length | 18 |
---|---|
Median length | 15 |
Mean length | 11.914286 |
Min length | 9 |
Characters and Unicode
Total characters | 2085 |
---|---|
Distinct characters | 35 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 34 ? |
---|---|
Unique (%) | 19.4% |
Sample
1st row | (B3-B4) 승강장 |
---|---|
2nd row | (F1-B3)1번 출입구 |
3rd row | (B3-B2) 승강장 |
4th row | (B3-B2) 승강장 |
5th row | (B3-B1) 승강장 |
Value | Count | Frequency (%) |
승강장 | 78 | |
출입구 | 67 | |
b1-b2 | 26 | 7.9% |
b2-b3 | 20 | 6.1% |
f1-b1)2번 | 8 | 2.4% |
대합실 | 7 | 2.1% |
b1-b3 | 7 | 2.1% |
f1-b1)3번 | 6 | 1.8% |
b3-b4 | 5 | 1.5% |
b1-b5)승강장 | 5 | 1.5% |
Other values (59) | 99 |
Most occurring characters
Value | Count | Frequency (%) |
B | 280 | |
1 | 190 | 9.1% |
( | 175 | 8.4% |
- | 175 | 8.4% |
) | 175 | 8.4% |
153 | 7.3% | |
2 | 101 | 4.8% |
승 | 95 | 4.6% |
장 | 94 | 4.5% |
강 | 94 | 4.5% |
Other values (25) | 553 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 615 | |
Decimal Number | 433 | |
Uppercase Letter | 350 | |
Open Punctuation | 175 | 8.4% |
Dash Punctuation | 175 | 8.4% |
Close Punctuation | 175 | 8.4% |
Space Separator | 153 | 7.3% |
Other Punctuation | 9 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
승 | 95 | |
장 | 94 | |
강 | 94 | |
번 | 67 | |
출 | 67 | |
입 | 67 | |
구 | 67 | |
대 | 12 | 2.0% |
합 | 12 | 2.0% |
실 | 12 | 2.0% |
Other values (10) | 28 | 4.6% |
Decimal Number
Value | Count | Frequency (%) |
1 | 190 | |
2 | 101 | |
3 | 64 | 14.8% |
4 | 37 | 8.5% |
5 | 23 | 5.3% |
6 | 7 | 1.6% |
7 | 6 | 1.4% |
8 | 5 | 1.2% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 280 | |
F | 70 | 20.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 175 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 175 |
Close Punctuation
Value | Count | Frequency (%) |
) | 175 |
Space Separator
Value | Count | Frequency (%) |
153 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1120 | |
Hangul | 615 | |
Latin | 350 | 16.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
승 | 95 | |
장 | 94 | |
강 | 94 | |
번 | 67 | |
출 | 67 | |
입 | 67 | |
구 | 67 | |
대 | 12 | 2.0% |
합 | 12 | 2.0% |
실 | 12 | 2.0% |
Other values (10) | 28 | 4.6% |
Common
Value | Count | Frequency (%) |
1 | 190 | |
( | 175 | |
- | 175 | |
) | 175 | |
153 | ||
2 | 101 | |
3 | 64 | 5.7% |
4 | 37 | 3.3% |
5 | 23 | 2.1% |
/ | 9 | 0.8% |
Other values (3) | 18 | 1.6% |
Latin
Value | Count | Frequency (%) |
B | 280 | |
F | 70 | 20.0% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1470 | |
Hangul | 615 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
B | 280 | |
1 | 190 | |
( | 175 | |
- | 175 | |
) | 175 | |
153 | ||
2 | 101 | 6.9% |
F | 70 | 4.8% |
3 | 64 | 4.4% |
4 | 37 | 2.5% |
Other values (5) | 50 | 3.4% |
Hangul
Value | Count | Frequency (%) |
승 | 95 | |
장 | 94 | |
강 | 94 | |
번 | 67 | |
출 | 67 | |
입 | 67 | |
구 | 67 | |
대 | 12 | 2.0% |
합 | 12 | 2.0% |
실 | 12 | 2.0% |
Other values (10) | 28 | 4.6% |
정원_인원
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 16.628571 |
Minimum | 11 |
---|---|
Maximum | 24 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 11 |
---|---|
5-th percentile | 12.7 |
Q1 | 15 |
median | 15 |
Q3 | 15 |
95-th percentile | 24 |
Maximum | 24 |
Range | 13 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 3.8288508 |
---|---|
Coefficient of variation (CV) | 0.23025735 |
Kurtosis | 0.030262387 |
Mean | 16.628571 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.207672 |
Sum | 2910 |
Variance | 14.660099 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
15 | 125 | |
24 | 34 | 19.4% |
11 | 8 | 4.6% |
13 | 3 | 1.7% |
21 | 3 | 1.7% |
17 | 1 | 0.6% |
12 | 1 | 0.6% |
Value | Count | Frequency (%) |
11 | 8 | 4.6% |
12 | 1 | 0.6% |
13 | 3 | 1.7% |
15 | 125 | |
17 | 1 | 0.6% |
21 | 3 | 1.7% |
24 | 34 | 19.4% |
Value | Count | Frequency (%) |
24 | 34 | 19.4% |
21 | 3 | 1.7% |
17 | 1 | 0.6% |
15 | 125 | |
13 | 3 | 1.7% |
12 | 1 | 0.6% |
11 | 8 | 4.6% |
정원_중량(kg)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1120.6857 |
Minimum | 750 |
---|---|
Maximum | 1800 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 750 |
---|---|
5-th percentile | 900 |
Q1 | 1000 |
median | 1000 |
Q3 | 1000 |
95-th percentile | 1600 |
Maximum | 1800 |
Range | 1050 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 267.55833 |
---|---|
Coefficient of variation (CV) | 0.23874519 |
Kurtosis | 0.16990963 |
Mean | 1120.6857 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.2864009 |
Sum | 196120 |
Variance | 71587.458 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1000 | 122 | |
1600 | 33 | 18.9% |
750 | 8 | 4.6% |
1005 | 4 | 2.3% |
1800 | 4 | 2.3% |
900 | 2 | 1.1% |
1150 | 2 | 1.1% |
Value | Count | Frequency (%) |
750 | 8 | 4.6% |
900 | 2 | 1.1% |
1000 | 122 | |
1005 | 4 | 2.3% |
1150 | 2 | 1.1% |
1600 | 33 | 18.9% |
1800 | 4 | 2.3% |
Value | Count | Frequency (%) |
1800 | 4 | 2.3% |
1600 | 33 | 18.9% |
1150 | 2 | 1.1% |
1005 | 4 | 2.3% |
1000 | 122 | |
900 | 2 | 1.1% |
750 | 8 | 4.6% |
역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|
역명 | 1.000 | 0.000 | 0.899 | 0.772 | 0.847 |
출입구번호 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 |
상세위치 | 0.899 | 1.000 | 1.000 | 0.764 | 0.902 |
정원_인원 | 0.772 | 0.000 | 0.764 | 1.000 | 0.827 |
정원_중량(kg) | 0.847 | 0.000 | 0.902 | 0.827 | 1.000 |
출입구번호 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|
출입구번호 | 1.000 | 0.009 | 0.025 |
정원_인원 | 0.009 | 1.000 | 0.949 |
정원_중량(kg) | 0.025 | 0.949 | 1.000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 5호선 | 강동 | <NA> | (B3-B4) 승강장 | 15 | 1000 |
1 | 서울교통공사 | 5호선 | 강동 | 1 | (F1-B3)1번 출입구 | 15 | 1000 |
2 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B2) 승강장 | 24 | 1600 |
3 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B2) 승강장 | 24 | 1600 |
4 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B1) 승강장 | 24 | 1600 |
5 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B1) 승강장 | 24 | 1600 |
6 | 서울교통공사 | 5호선 | 강일 | 1 | (B2-F1)1번 출입구 | 24 | 1600 |
7 | 서울교통공사 | 5호선 | 강일 | 3 | (B2-F1)3번 출입구 | 24 | 1600 |
8 | 서울교통공사 | 5호선 | 강일 | 4 | (B2-F1)4번 출입구 | 24 | 1600 |
9 | 서울교통공사 | 5호선 | 개롱 | <NA> | (B1-B2) 승강장 | 15 | 1000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
165 | 서울교통공사 | 5호선 | 하남풍산 | <NA> | (B2-B1) 승강장 | 24 | 1600 |
166 | 서울교통공사 | 5호선 | 하남풍산 | <NA> | (B2-B1) 승강장 | 24 | 1600 |
167 | 서울교통공사 | 5호선 | 하남풍산 | 1 | (F1-F2)1번 출입구 | 24 | 1600 |
168 | 서울교통공사 | 5호선 | 하남풍산 | 5 | (B1-F1)5번 출입구 | 24 | 1600 |
169 | 서울교통공사 | 5호선 | 하남풍산 | 7 | (B1-F1)7번 출입구 | 24 | 1600 |
170 | 서울교통공사 | 5호선 | 행당 | <NA> | (B3-B5) 승강장 | 15 | 1000 |
171 | 서울교통공사 | 5호선 | 행당 | <NA> | (B4-B5) 승강장 | 15 | 1000 |
172 | 서울교통공사 | 5호선 | 행당 | 3 | (F1-B3)3번 출입구 | 15 | 1000 |
173 | 서울교통공사 | 5호선 | 화곡 | <NA> | (B1-B2)승강장 | 11 | 750 |
174 | 서울교통공사 | 5호선 | 화곡 | 1 | (F1-B1)1/2번 출입구 | 15 | 1000 |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B1) 승강장 | 24 | 1600 | 2 |
1 | 서울교통공사 | 5호선 | 강일 | <NA> | (B3-B2) 승강장 | 24 | 1600 | 2 |
2 | 서울교통공사 | 5호선 | 개롱 | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
3 | 서울교통공사 | 5호선 | 거여 | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
4 | 서울교통공사 | 5호선 | 고덕 | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
5 | 서울교통공사 | 5호선 | 광나루(장신대) | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
6 | 서울교통공사 | 5호선 | 군자(능동) | <NA> | (B1-B3) 승강장 | 15 | 1000 | 2 |
7 | 서울교통공사 | 5호선 | 굽은다리(강동구민회관앞) | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
8 | 서울교통공사 | 5호선 | 길동 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
9 | 서울교통공사 | 5호선 | 김포공항 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |