Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 354 |
Missing cells | 198 |
Missing cells (%) | 8.0% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.3% |
Total size in memory | 20.5 KiB |
Average record size in memory | 59.4 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Numeric | 3 |
Dataset
Description | 서울교통공사에서 관리하는 도시광역철도역들의 엘리베이터 데이터로 철도운영기관명, 선명, 역명, 출입구번호, 상세위치, 정원인원, 정원중량의데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041387/fileData.do |
철도운영기관명 has constant value "" | Constant |
Dataset has 1 (0.3%) duplicate rows | Duplicates |
정원_인원 is highly overall correlated with 정원_중량(kg) | High correlation |
정원_중량(kg) is highly overall correlated with 정원_인원 | High correlation |
출입구번호 has 198 (55.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 04:45:08.650948 |
---|---|
Analysis finished | 2023-12-12 04:45:10.870851 |
Duration | 2.22 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
서울교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 354 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 354 |
선명
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
2호선 | |
---|---|
3호선 | |
4호선 | |
1호선 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1호선 |
---|---|
2nd row | 1호선 |
3rd row | 1호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
2호선 | 150 | |
3호선 | 88 | |
4호선 | 80 | |
1호선 | 36 | 10.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2호선 | 150 | |
3호선 | 88 | |
4호선 | 80 | |
1호선 | 36 | 10.2% |
역명
Text
Distinct | 108 |
---|---|
Distinct (%) | 30.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
Value | Count | Frequency (%) |
신설동 | 7 | 2.0% |
동묘앞 | 7 | 2.0% |
창동 | 6 | 1.7% |
서울역 | 6 | 1.7% |
동대문 | 5 | 1.4% |
이촌(국립중앙박물관 | 5 | 1.4% |
삼각지 | 5 | 1.4% |
교대(법원·검찰청 | 5 | 1.4% |
삼성(무역센터 | 5 | 1.4% |
시청 | 5 | 1.4% |
Other values (98) | 298 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 76 | 5.2% |
대 | 67 | 4.6% |
) | 67 | 4.6% |
( | 67 | 4.6% |
동 | 48 | 3.3% |
신 | 46 | 3.2% |
청 | 46 | 3.2% |
로 | 32 | 2.2% |
입 | 31 | 2.1% |
문 | 28 | 1.9% |
Other values (152) | 949 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1303 | |
Close Punctuation | 67 | 4.6% |
Open Punctuation | 67 | 4.6% |
Decimal Number | 15 | 1.0% |
Other Punctuation | 5 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 76 | 5.8% |
대 | 67 | 5.1% |
동 | 48 | 3.7% |
신 | 46 | 3.5% |
청 | 46 | 3.5% |
로 | 32 | 2.5% |
입 | 31 | 2.4% |
문 | 28 | 2.1% |
원 | 26 | 2.0% |
서 | 26 | 2.0% |
Other values (146) | 877 |
Decimal Number
Value | Count | Frequency (%) |
3 | 9 | |
4 | 3 | 20.0% |
5 | 3 | 20.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 67 |
Open Punctuation
Value | Count | Frequency (%) |
( | 67 |
Other Punctuation
Value | Count | Frequency (%) |
· | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1303 | |
Common | 154 | 10.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 76 | 5.8% |
대 | 67 | 5.1% |
동 | 48 | 3.7% |
신 | 46 | 3.5% |
청 | 46 | 3.5% |
로 | 32 | 2.5% |
입 | 31 | 2.4% |
문 | 28 | 2.1% |
원 | 26 | 2.0% |
서 | 26 | 2.0% |
Other values (146) | 877 |
Common
Value | Count | Frequency (%) |
) | 67 | |
( | 67 | |
3 | 9 | 5.8% |
· | 5 | 3.2% |
4 | 3 | 1.9% |
5 | 3 | 1.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1303 | |
ASCII | 149 | 10.2% |
None | 5 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 76 | 5.8% |
대 | 67 | 5.1% |
동 | 48 | 3.7% |
신 | 46 | 3.5% |
청 | 46 | 3.5% |
로 | 32 | 2.5% |
입 | 31 | 2.4% |
문 | 28 | 2.1% |
원 | 26 | 2.0% |
서 | 26 | 2.0% |
Other values (146) | 877 |
ASCII
Value | Count | Frequency (%) |
) | 67 | |
( | 67 | |
3 | 9 | 6.0% |
4 | 3 | 2.0% |
5 | 3 | 2.0% |
None
Value | Count | Frequency (%) |
· | 5 |
출입구번호
Real number (ℝ)
MISSING
 
Distinct | 14 |
---|---|
Distinct (%) | 9.0% |
Missing | 198 |
Missing (%) | 55.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.9358974 |
Minimum | 1 |
---|---|
Maximum | 14 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 3 |
Q3 | 6 |
95-th percentile | 10 |
Maximum | 14 |
Range | 13 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 3.0726252 |
---|---|
Coefficient of variation (CV) | 0.78066699 |
Kurtosis | 0.94743475 |
Mean | 3.9358974 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 1.1641802 |
Sum | 614 |
Variance | 9.4410256 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 46 | 13.0% |
3 | 19 | 5.4% |
2 | 19 | 5.4% |
4 | 19 | 5.4% |
6 | 15 | 4.2% |
5 | 11 | 3.1% |
8 | 7 | 2.0% |
7 | 5 | 1.4% |
9 | 5 | 1.4% |
10 | 4 | 1.1% |
Other values (4) | 6 | 1.7% |
(Missing) | 198 |
Value | Count | Frequency (%) |
1 | 46 | |
2 | 19 | |
3 | 19 | |
4 | 19 | |
5 | 11 | 3.1% |
6 | 15 | 4.2% |
7 | 5 | 1.4% |
8 | 7 | 2.0% |
9 | 5 | 1.4% |
10 | 4 | 1.1% |
Value | Count | Frequency (%) |
14 | 2 | 0.6% |
13 | 1 | 0.3% |
12 | 2 | 0.6% |
11 | 1 | 0.3% |
10 | 4 | 1.1% |
9 | 5 | 1.4% |
8 | 7 | |
7 | 5 | 1.4% |
6 | 15 | |
5 | 11 |
상세위치
Text
Distinct | 183 |
---|---|
Distinct (%) | 51.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
Length
Max length | 25 |
---|---|
Median length | 23 |
Mean length | 13.20904 |
Min length | 7 |
Characters and Unicode
Total characters | 4676 |
---|---|
Distinct characters | 58 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 133 ? |
---|---|
Unique (%) | 37.6% |
Sample
1st row | (B1-B2) 10-4 |
---|---|
2nd row | (B1-B2) 2-1 |
3rd row | (B1-F1)6번 출입구측 |
4th row | (B1-F4)본관건물(상)6-2 |
5th row | (B1-B2) 10-3 |
Value | Count | Frequency (%) |
출입구측 | 118 | 16.7% |
b1-b2 | 96 | 13.6% |
b1-f1)1번 | 28 | 4.0% |
출입구 | 24 | 3.4% |
3-2 | 18 | 2.6% |
f2-f3 | 18 | 2.6% |
b3-b2 | 15 | 2.1% |
b1-f1)3번 | 15 | 2.1% |
8-3 | 13 | 1.8% |
b1-f1)2번 | 13 | 1.8% |
Other values (130) | 347 |
Most occurring characters
Value | Count | Frequency (%) |
- | 567 | |
1 | 538 | |
B | 466 | |
) | 399 | 8.5% |
( | 399 | 8.5% |
352 | 7.5% | |
2 | 295 | 6.3% |
F | 243 | 5.2% |
3 | 187 | 4.0% |
번 | 156 | 3.3% |
Other values (48) | 1074 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1299 | |
Other Letter | 941 | |
Uppercase Letter | 709 | |
Dash Punctuation | 567 | |
Close Punctuation | 399 | 8.5% |
Open Punctuation | 399 | 8.5% |
Space Separator | 352 | 7.5% |
Other Punctuation | 6 | 0.1% |
Math Symbol | 4 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
번 | 156 | |
입 | 156 | |
구 | 156 | |
출 | 156 | |
측 | 120 | |
식 | 39 | 4.1% |
섬 | 39 | 4.1% |
상 | 25 | 2.7% |
이 | 15 | 1.6% |
사 | 15 | 1.6% |
Other values (30) | 64 |
Decimal Number
Value | Count | Frequency (%) |
1 | 538 | |
2 | 295 | |
3 | 187 | 14.4% |
4 | 118 | 9.1% |
8 | 50 | 3.8% |
6 | 35 | 2.7% |
7 | 28 | 2.2% |
5 | 25 | 1.9% |
9 | 12 | 0.9% |
0 | 11 | 0.8% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 466 | |
F | 243 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 567 |
Close Punctuation
Value | Count | Frequency (%) |
) | 399 |
Open Punctuation
Value | Count | Frequency (%) |
( | 399 |
Space Separator
Value | Count | Frequency (%) |
352 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 6 |
Math Symbol
Value | Count | Frequency (%) |
~ | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 3026 | |
Hangul | 941 | 20.1% |
Latin | 709 | 15.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
번 | 156 | |
입 | 156 | |
구 | 156 | |
출 | 156 | |
측 | 120 | |
식 | 39 | 4.1% |
섬 | 39 | 4.1% |
상 | 25 | 2.7% |
이 | 15 | 1.6% |
사 | 15 | 1.6% |
Other values (30) | 64 |
Common
Value | Count | Frequency (%) |
- | 567 | |
1 | 538 | |
) | 399 | |
( | 399 | |
352 | ||
2 | 295 | |
3 | 187 | 6.2% |
4 | 118 | 3.9% |
8 | 50 | 1.7% |
6 | 35 | 1.2% |
Other values (6) | 86 | 2.8% |
Latin
Value | Count | Frequency (%) |
B | 466 | |
F | 243 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 3735 | |
Hangul | 941 | 20.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 567 | |
1 | 538 | |
B | 466 | |
) | 399 | |
( | 399 | |
352 | ||
2 | 295 | |
F | 243 | |
3 | 187 | 5.0% |
4 | 118 | 3.2% |
Other values (8) | 171 | 4.6% |
Hangul
Value | Count | Frequency (%) |
번 | 156 | |
입 | 156 | |
구 | 156 | |
출 | 156 | |
측 | 120 | |
식 | 39 | 4.1% |
섬 | 39 | 4.1% |
상 | 25 | 2.7% |
이 | 15 | 1.6% |
사 | 15 | 1.6% |
Other values (30) | 64 |
정원_인원
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.053672 |
Minimum | 8 |
---|---|
Maximum | 24 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.2 KiB |
Quantile statistics
Minimum | 8 |
---|---|
5-th percentile | 11 |
Q1 | 13 |
median | 15 |
Q3 | 15 |
95-th percentile | 15 |
Maximum | 24 |
Range | 16 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.9613693 |
---|---|
Coefficient of variation (CV) | 0.13956276 |
Kurtosis | 2.5938525 |
Mean | 14.053672 |
Median Absolute Deviation (MAD) | 0 |
Skewness | -0.41975927 |
Sum | 4975 |
Variance | 3.8469695 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
15 | 233 | |
11 | 54 | 15.3% |
13 | 42 | 11.9% |
17 | 7 | 2.0% |
9 | 6 | 1.7% |
10 | 3 | 0.8% |
8 | 3 | 0.8% |
20 | 2 | 0.6% |
24 | 1 | 0.3% |
16 | 1 | 0.3% |
Other values (2) | 2 | 0.6% |
Value | Count | Frequency (%) |
8 | 3 | 0.8% |
9 | 6 | 1.7% |
10 | 3 | 0.8% |
11 | 54 | 15.3% |
12 | 1 | 0.3% |
13 | 42 | 11.9% |
15 | 233 | |
16 | 1 | 0.3% |
17 | 7 | 2.0% |
20 | 2 | 0.6% |
Value | Count | Frequency (%) |
24 | 1 | 0.3% |
21 | 1 | 0.3% |
20 | 2 | 0.6% |
17 | 7 | 2.0% |
16 | 1 | 0.3% |
15 | 233 | |
13 | 42 | 11.9% |
12 | 1 | 0.3% |
11 | 54 | 15.3% |
10 | 3 | 0.8% |
정원_중량(kg)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 956.63842 |
Minimum | 600 |
---|---|
Maximum | 1600 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.2 KiB |
Quantile statistics
Minimum | 600 |
---|---|
5-th percentile | 750 |
Q1 | 1000 |
median | 1000 |
Q3 | 1000 |
95-th percentile | 1000 |
Maximum | 1600 |
Range | 1000 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 114.85796 |
---|---|
Coefficient of variation (CV) | 0.12006413 |
Kurtosis | 4.2355994 |
Mean | 956.63842 |
Median Absolute Deviation (MAD) | 0 |
Skewness | -0.62887201 |
Sum | 338650 |
Variance | 13192.35 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1000 | 270 | |
750 | 53 | 15.0% |
900 | 15 | 4.2% |
600 | 7 | 2.0% |
1150 | 6 | 1.7% |
1350 | 2 | 0.6% |
1600 | 1 | 0.3% |
Value | Count | Frequency (%) |
600 | 7 | 2.0% |
750 | 53 | 15.0% |
900 | 15 | 4.2% |
1000 | 270 | |
1150 | 6 | 1.7% |
1350 | 2 | 0.6% |
1600 | 1 | 0.3% |
Value | Count | Frequency (%) |
1600 | 1 | 0.3% |
1350 | 2 | 0.6% |
1150 | 6 | 1.7% |
1000 | 270 | |
900 | 15 | 4.2% |
750 | 53 | 15.0% |
600 | 7 | 2.0% |
선명 | 출입구번호 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|
선명 | 1.000 | 0.095 | 0.139 | 0.068 |
출입구번호 | 0.095 | 1.000 | 0.000 | 0.000 |
정원_인원 | 0.139 | 0.000 | 1.000 | 0.972 |
정원_중량(kg) | 0.068 | 0.000 | 0.972 | 1.000 |
출입구번호 | 정원_인원 | 정원_중량(kg) | 선명 | |
---|---|---|---|---|
출입구번호 | 1.000 | -0.080 | -0.082 | 0.052 |
정원_인원 | -0.080 | 1.000 | 0.808 | 0.076 |
정원_중량(kg) | -0.082 | 0.808 | 1.000 | 0.041 |
선명 | 0.052 | 0.076 | 0.041 | 1.000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 1호선 | 동대문 | <NA> | (B1-B2) 10-4 | 11 | 750 |
1 | 서울교통공사 | 1호선 | 동대문 | <NA> | (B1-B2) 2-1 | 11 | 750 |
2 | 서울교통공사 | 1호선 | 동대문 | 6 | (B1-F1)6번 출입구측 | 15 | 1000 |
3 | 서울교통공사 | 1호선 | 동묘앞 | <NA> | (B1-F4)본관건물(상)6-2 | 15 | 1000 |
4 | 서울교통공사 | 1호선 | 동묘앞 | <NA> | (B1-B2) 10-3 | 15 | 1000 |
5 | 서울교통공사 | 1호선 | 동묘앞 | <NA> | (B2-B1) 4-8 | 15 | 1000 |
6 | 서울교통공사 | 1호선 | 동묘앞 | <NA> | (B1-B2) 7-3 | 15 | 1000 |
7 | 서울교통공사 | 1호선 | 동묘앞 | <NA> | (B2-B1) 1-2 | 15 | 1000 |
8 | 서울교통공사 | 1호선 | 동묘앞 | 1 | (B1-F1)1-10번 출입구 사이 | 15 | 1000 |
9 | 서울교통공사 | 1호선 | 동묘앞 | 3 | (B1-F1)3번 출입구측 | 15 | 1000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
344 | 서울교통공사 | 4호선 | 충무로 | 7 | (B1-F1)7번 출입구 | 8 | 600 |
345 | 서울교통공사 | 4호선 | 한성대입구(삼선교) | <NA> | (B1-B2)섬식(상)6-1 | 15 | 1000 |
346 | 서울교통공사 | 4호선 | 한성대입구(삼선교) | 3 | (B1-F1)3-4번 출입구사이 | 15 | 1000 |
347 | 서울교통공사 | 4호선 | 한성대입구(삼선교) | 5 | (B1-F1)5번 출입구측 | 15 | 1000 |
348 | 서울교통공사 | 4호선 | 혜화 | <NA> | (B1-B2) 7-4 | 11 | 750 |
349 | 서울교통공사 | 4호선 | 혜화 | <NA> | (B1-B2) 3-4 | 11 | 750 |
350 | 서울교통공사 | 4호선 | 혜화 | 2 | (B1-F1)2번 출입구측 | 11 | 750 |
351 | 서울교통공사 | 4호선 | 혜화 | 3 | (B1-F1)3번 출입구측 | 11 | 750 |
352 | 서울교통공사 | 4호선 | 회현(남대문시장) | <NA> | (B4-B1)섬식(상)10-1 | 15 | 1000 |
353 | 서울교통공사 | 4호선 | 회현(남대문시장) | 3 | (B1-F1)지상도로 중앙 | 15 | 1000 |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 3호선 | 일원 | 1 | (B2-F1)1번 출입구측 | 17 | 1150 | 2 |