Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 304 |
Missing cells | 159 |
Missing cells (%) | 7.5% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 17.6 KiB |
Average record size in memory | 59.4 B |
Variable types
Categorical | 4 |
---|---|
Text | 2 |
Numeric | 1 |
Dataset
Description | 대구교통공사에서 운영하는 노선의 엘리베이터 데이터로 철도운영기관명, 선명, 역명, 출입구번호, 상세위치, 정원인원, 정원중량의데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041380/fileData.do |
철도운영기관명 has constant value "" | Constant |
정원_인원 is highly overall correlated with 정원_중량(kg) | High correlation |
정원_중량(kg) is highly overall correlated with 정원_인원 | High correlation |
정원_인원 is highly imbalanced (75.9%) | Imbalance |
정원_중량(kg) is highly imbalanced (78.6%) | Imbalance |
출입구번호 has 159 (52.3%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 16:55:31.128472 |
---|---|
Analysis finished | 2023-12-12 16:55:32.123824 |
Duration | 1 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
대구교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대구교통공사 |
---|---|
2nd row | 대구교통공사 |
3rd row | 대구교통공사 |
4th row | 대구교통공사 |
5th row | 대구교통공사 |
Common Values
Value | Count | Frequency (%) |
대구교통공사 | 304 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대구교통공사 | 304 |
선명
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
1호선 | |
---|---|
3호선 | |
2호선 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1호선 |
---|---|
2nd row | 1호선 |
3rd row | 1호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
1호선 | 117 | |
3호선 | 103 | |
2호선 | 84 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1호선 | 117 | |
3호선 | 103 | |
2호선 | 84 |
역명
Text
Distinct | 88 |
---|---|
Distinct (%) | 28.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
Value | Count | Frequency (%) |
청라언덕 | 10 | 3.3% |
명덕(2.28민주운동기념회관 | 10 | 3.3% |
반월당 | 6 | 2.0% |
대공원 | 6 | 2.0% |
율하 | 5 | 1.6% |
용지 | 4 | 1.3% |
강창 | 4 | 1.3% |
각산 | 4 | 1.3% |
수성시장 | 4 | 1.3% |
임당 | 4 | 1.3% |
Other values (78) | 247 |
Most occurring characters
Value | Count | Frequency (%) |
대 | 63 | 5.2% |
( | 42 | 3.5% |
) | 42 | 3.5% |
원 | 34 | 2.8% |
구 | 31 | 2.6% |
동 | 29 | 2.4% |
청 | 27 | 2.2% |
장 | 24 | 2.0% |
명 | 22 | 1.8% |
시 | 21 | 1.7% |
Other values (127) | 876 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1060 | |
Open Punctuation | 42 | 3.5% |
Close Punctuation | 42 | 3.5% |
Decimal Number | 30 | 2.5% |
Other Punctuation | 22 | 1.8% |
Uppercase Letter | 15 | 1.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 63 | 5.9% |
원 | 34 | 3.2% |
구 | 31 | 2.9% |
동 | 29 | 2.7% |
청 | 27 | 2.5% |
장 | 24 | 2.3% |
명 | 22 | 2.1% |
시 | 21 | 2.0% |
산 | 21 | 2.0% |
월 | 20 | 1.9% |
Other values (116) | 768 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 5 | |
C | 3 | |
T | 3 | |
S | 2 | 13.3% |
K | 2 | 13.3% |
Decimal Number
Value | Count | Frequency (%) |
2 | 20 | |
8 | 10 |
Other Punctuation
Value | Count | Frequency (%) |
· | 12 | |
. | 10 |
Open Punctuation
Value | Count | Frequency (%) |
( | 42 |
Close Punctuation
Value | Count | Frequency (%) |
) | 42 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1060 | |
Common | 136 | 11.2% |
Latin | 15 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 63 | 5.9% |
원 | 34 | 3.2% |
구 | 31 | 2.9% |
동 | 29 | 2.7% |
청 | 27 | 2.5% |
장 | 24 | 2.3% |
명 | 22 | 2.1% |
시 | 21 | 2.0% |
산 | 21 | 2.0% |
월 | 20 | 1.9% |
Other values (116) | 768 |
Common
Value | Count | Frequency (%) |
( | 42 | |
) | 42 | |
2 | 20 | |
· | 12 | 8.8% |
8 | 10 | 7.4% |
. | 10 | 7.4% |
Latin
Value | Count | Frequency (%) |
B | 5 | |
C | 3 | |
T | 3 | |
S | 2 | 13.3% |
K | 2 | 13.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1060 | |
ASCII | 139 | 11.5% |
None | 12 | 1.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
대 | 63 | 5.9% |
원 | 34 | 3.2% |
구 | 31 | 2.9% |
동 | 29 | 2.7% |
청 | 27 | 2.5% |
장 | 24 | 2.3% |
명 | 22 | 2.1% |
시 | 21 | 2.0% |
산 | 21 | 2.0% |
월 | 20 | 1.9% |
Other values (116) | 768 |
ASCII
Value | Count | Frequency (%) |
( | 42 | |
) | 42 | |
2 | 20 | |
8 | 10 | 7.2% |
. | 10 | 7.2% |
B | 5 | 3.6% |
C | 3 | 2.2% |
T | 3 | 2.2% |
S | 2 | 1.4% |
K | 2 | 1.4% |
None
Value | Count | Frequency (%) |
· | 12 |
출입구번호
Real number (ℝ)
MISSING
 
Distinct | 9 |
---|---|
Distinct (%) | 6.2% |
Missing | 159 |
Missing (%) | 52.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.9034483 |
Minimum | 1 |
---|---|
Maximum | 23 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 3 |
Q3 | 4 |
95-th percentile | 5.8 |
Maximum | 23 |
Range | 22 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.2831634 |
---|---|
Coefficient of variation (CV) | 0.7863627 |
Kurtosis | 41.165903 |
Mean | 2.9034483 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 4.976626 |
Sum | 421 |
Variance | 5.2128352 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 40 | 13.2% |
4 | 33 | 10.9% |
3 | 32 | 10.5% |
2 | 26 | 8.6% |
5 | 6 | 2.0% |
6 | 3 | 1.0% |
7 | 2 | 0.7% |
8 | 2 | 0.7% |
23 | 1 | 0.3% |
(Missing) | 159 |
Value | Count | Frequency (%) |
1 | 40 | |
2 | 26 | |
3 | 32 | |
4 | 33 | |
5 | 6 | 2.0% |
6 | 3 | 1.0% |
7 | 2 | 0.7% |
8 | 2 | 0.7% |
23 | 1 | 0.3% |
Value | Count | Frequency (%) |
23 | 1 | 0.3% |
8 | 2 | 0.7% |
7 | 2 | 0.7% |
6 | 3 | 1.0% |
5 | 6 | 2.0% |
4 | 33 | |
3 | 32 | |
2 | 26 | |
1 | 40 |
상세위치
Text
Distinct | 293 |
---|---|
Distinct (%) | 96.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
Length
Max length | 101 |
---|---|
Median length | 62 |
Mean length | 42.069079 |
Min length | 19 |
Characters and Unicode
Total characters | 12789 |
---|---|
Distinct characters | 275 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 284 ? |
---|---|
Unique (%) | 93.4% |
Sample
1st row | (1F) 1번 출입구 앞 (B1F) 발매기실 앞 |
---|---|
2nd row | (B1F) 설화명곡역 방향 표 내는 곳 (B2F) 설화명곡역 방향 6-2 출입문 앞 |
3rd row | (B1F) 안심역 방향 표 내는 곳 (B2F) 안심역 방향 3-3 출입문 앞 |
4th row | (1F) 2번/3번 출입구 사이 (B1F) 2번/3번 출입구 방향 |
5th row | (1F) 4번 출입구 앞 (B2F) 2코너 표 내는 곳 옆 |
Value | Count | Frequency (%) |
출입구 | 287 | 9.2% |
방향 | 247 | 7.9% |
앞 | 187 | 6.0% |
1f | 147 | 4.7% |
b1f | 142 | 4.5% |
옆 | 141 | 4.5% |
출입문 | 121 | 3.9% |
승강장 | 119 | 3.8% |
사이 | 87 | 2.8% |
b2f | 80 | 2.6% |
Other values (446) | 1573 |
Most occurring characters
Value | Count | Frequency (%) |
2848 | ||
( | 667 | 5.2% |
) | 667 | 5.2% |
F | 639 | 5.0% |
1 | 543 | 4.2% |
출 | 432 | 3.4% |
입 | 431 | 3.4% |
번 | 403 | 3.2% |
2 | 363 | 2.8% |
B | 340 | 2.7% |
Other values (265) | 5456 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5743 | |
Space Separator | 2848 | |
Decimal Number | 1472 | 11.5% |
Uppercase Letter | 1039 | 8.1% |
Open Punctuation | 667 | 5.2% |
Close Punctuation | 667 | 5.2% |
Other Punctuation | 173 | 1.4% |
Dash Punctuation | 165 | 1.3% |
Lowercase Letter | 14 | 0.1% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
출 | 432 | 7.5% |
입 | 431 | 7.5% |
번 | 403 | 7.0% |
구 | 336 | 5.9% |
방 | 312 | 5.4% |
향 | 268 | 4.7% |
앞 | 193 | 3.4% |
장 | 171 | 3.0% |
역 | 156 | 2.7% |
옆 | 149 | 2.6% |
Other values (231) | 2892 |
Uppercase Letter
Value | Count | Frequency (%) |
F | 639 | |
B | 340 | |
S | 19 | 1.8% |
E | 11 | 1.1% |
P | 9 | 0.9% |
D | 8 | 0.8% |
G | 2 | 0.2% |
A | 2 | 0.2% |
T | 2 | 0.2% |
M | 2 | 0.2% |
Other values (5) | 5 | 0.5% |
Decimal Number
Value | Count | Frequency (%) |
1 | 543 | |
2 | 363 | |
3 | 293 | |
4 | 137 | 9.3% |
5 | 52 | 3.5% |
6 | 40 | 2.7% |
8 | 19 | 1.3% |
7 | 18 | 1.2% |
0 | 6 | 0.4% |
9 | 1 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 168 | |
# | 3 | 1.7% |
" | 2 | 1.2% |
Space Separator
Value | Count | Frequency (%) |
2848 |
Open Punctuation
Value | Count | Frequency (%) |
( | 667 |
Close Punctuation
Value | Count | Frequency (%) |
) | 667 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 165 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 14 |
Math Symbol
Value | Count | Frequency (%) |
> | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 5993 | |
Hangul | 5743 | |
Latin | 1053 | 8.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
출 | 432 | 7.5% |
입 | 431 | 7.5% |
번 | 403 | 7.0% |
구 | 336 | 5.9% |
방 | 312 | 5.4% |
향 | 268 | 4.7% |
앞 | 193 | 3.4% |
장 | 171 | 3.0% |
역 | 156 | 2.7% |
옆 | 149 | 2.6% |
Other values (231) | 2892 |
Common
Value | Count | Frequency (%) |
2848 | ||
( | 667 | 11.1% |
) | 667 | 11.1% |
1 | 543 | 9.1% |
2 | 363 | 6.1% |
3 | 293 | 4.9% |
/ | 168 | 2.8% |
- | 165 | 2.8% |
4 | 137 | 2.3% |
5 | 52 | 0.9% |
Other values (8) | 90 | 1.5% |
Latin
Value | Count | Frequency (%) |
F | 639 | |
B | 340 | |
S | 19 | 1.8% |
m | 14 | 1.3% |
E | 11 | 1.0% |
P | 9 | 0.9% |
D | 8 | 0.8% |
G | 2 | 0.2% |
A | 2 | 0.2% |
T | 2 | 0.2% |
Other values (6) | 7 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 7046 | |
Hangul | 5743 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2848 | ||
( | 667 | 9.5% |
) | 667 | 9.5% |
F | 639 | 9.1% |
1 | 543 | 7.7% |
2 | 363 | 5.2% |
B | 340 | 4.8% |
3 | 293 | 4.2% |
/ | 168 | 2.4% |
- | 165 | 2.3% |
Other values (24) | 353 | 5.0% |
Hangul
Value | Count | Frequency (%) |
출 | 432 | 7.5% |
입 | 431 | 7.5% |
번 | 403 | 7.0% |
구 | 336 | 5.9% |
방 | 312 | 5.4% |
향 | 268 | 4.7% |
앞 | 193 | 3.4% |
장 | 171 | 3.0% |
역 | 156 | 2.7% |
옆 | 149 | 2.6% |
Other values (231) | 2892 |
정원_인원
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
13 | |
---|---|
15 | 11 |
18 | 7 |
21 | 4 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 13 |
---|---|
2nd row | 13 |
3rd row | 13 |
4th row | 13 |
5th row | 13 |
Common Values
Value | Count | Frequency (%) |
13 | 282 | |
15 | 11 | 3.6% |
18 | 7 | 2.3% |
21 | 4 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
13 | 282 | |
15 | 11 | 3.6% |
18 | 7 | 2.3% |
21 | 4 | 1.3% |
정원_중량(kg)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.5 KiB |
1000 | |
---|---|
1150 | 10 |
1350 | 7 |
1600 | 4 |
1100 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 1000 |
---|---|
2nd row | 1000 |
3rd row | 1000 |
4th row | 1000 |
5th row | 1000 |
Common Values
Value | Count | Frequency (%) |
1000 | 282 | |
1150 | 10 | 3.3% |
1350 | 7 | 2.3% |
1600 | 4 | 1.3% |
1100 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1000 | 282 | |
1150 | 10 | 3.3% |
1350 | 7 | 2.3% |
1600 | 4 | 1.3% |
1100 | 1 | 0.3% |
선명 | 역명 | 출입구번호 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|
선명 | 1.000 | 0.995 | 0.124 | 0.107 | 0.156 |
역명 | 0.995 | 1.000 | 0.000 | 0.957 | 0.893 |
출입구번호 | 0.124 | 0.000 | 1.000 | 0.069 | 0.069 |
정원_인원 | 0.107 | 0.957 | 0.069 | 1.000 | 1.000 |
정원_중량(kg) | 0.156 | 0.893 | 0.069 | 1.000 | 1.000 |
정원_인원 | 선명 | 정원_중량(kg) | |
---|---|---|---|
정원_인원 | 1.000 | 0.101 | 0.998 |
선명 | 0.101 | 1.000 | 0.118 |
정원_중량(kg) | 0.998 | 0.118 | 1.000 |
출입구번호 | 선명 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|
출입구번호 | 1.000 | 0.092 | 0.054 | 0.054 |
선명 | 0.092 | 1.000 | 0.101 | 0.118 |
정원_인원 | 0.054 | 0.101 | 1.000 | 0.998 |
정원_중량(kg) | 0.054 | 0.118 | 0.998 | 1.000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
0 | 대구교통공사 | 1호선 | 각산 | 1 | (1F) 1번 출입구 앞 (B1F) 발매기실 앞 | 13 | 1000 |
1 | 대구교통공사 | 1호선 | 각산 | <NA> | (B1F) 설화명곡역 방향 표 내는 곳 (B2F) 설화명곡역 방향 6-2 출입문 앞 | 13 | 1000 |
2 | 대구교통공사 | 1호선 | 각산 | <NA> | (B1F) 안심역 방향 표 내는 곳 (B2F) 안심역 방향 3-3 출입문 앞 | 13 | 1000 |
3 | 대구교통공사 | 1호선 | 각산 | 3 | (1F) 2번/3번 출입구 사이 (B1F) 2번/3번 출입구 방향 | 13 | 1000 |
4 | 대구교통공사 | 1호선 | 교대 | 4 | (1F) 4번 출입구 앞 (B2F) 2코너 표 내는 곳 옆 | 13 | 1000 |
5 | 대구교통공사 | 1호선 | 교대 | 3 | (1F) 3번 출입구 앞 (B2F) 2코너 표 사는 곳 옆 | 13 | 1000 |
6 | 대구교통공사 | 1호선 | 교대 | <NA> | (B2F) 2코너 표 내는 곳 옆 (B3F) 영대병원역 방향 승강장 6-4근처 비승차구간 | 13 | 1000 |
7 | 대구교통공사 | 1호선 | 교대 | <NA> | (B2F) 2코너 표 내는 곳 옆 (B3F) 명덕역 방향 승강장 2-3 출입문 앞 | 13 | 1000 |
8 | 대구교통공사 | 1호선 | 대곡(정부대구청사) | 4 | (1F) 4번 출입구 앞 (B2F) 대합실 고객안내센터 옆 (B3F) 화원역 방향승강장 4-1 출입문 앞 | 13 | 1000 |
9 | 대구교통공사 | 1호선 | 대곡(정부대구청사) | 3 | (1F) 3번 출입구 앞 (B2F) 대합실 발매기실 옆 (B3F) 화원역 방향 승강장 6-1출입문 앞 | 13 | 1000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
294 | 대구교통공사 | 3호선 | 팔달시장 | 1 | (1F) 1번 출입구 옆 (2F) 1번 출입구 대합실 표 내는 곳 옆 | 18 | 1350 |
295 | 대구교통공사 | 3호선 | 팔달시장 | <NA> | (2F) 1번 출입구 대합실 표 내는 곳 앞(칠곡경대병원방면) (3F) 만평역 방향 승강장 3-2 | 13 | 1000 |
296 | 대구교통공사 | 3호선 | 팔달시장 | <NA> | (2F) 1번 출입구 대합실 표 내는 곳 앞(용지방면) (3F) 원대역 방향 승강장 1-1 | 13 | 1000 |
297 | 대구교통공사 | 3호선 | 학정 | 1 | (1F) 1번/4번 출입구 사이 (2F)1발매기 옆 통로 | 13 | 1000 |
298 | 대구교통공사 | 3호선 | 학정 | 2 | (1F) 2번/3번 출입구 사이 (2F)2발매 옆 통로 | 13 | 1000 |
299 | 대구교통공사 | 3호선 | 학정 | <NA> | (2F)표내는 곳 근처 (3F)칠곡경대병원역 승강장 1-2 앞 | 13 | 1000 |
300 | 대구교통공사 | 3호선 | 학정 | <NA> | (2F)표내는 곳 근처 (3F)용지역 방향 승강장 3-1 앞 | 13 | 1000 |
301 | 대구교통공사 | 3호선 | 황금 | 1 | (1F) 1번 출입구 옆 (2F)대합실가는 통로 | 13 | 1000 |
302 | 대구교통공사 | 3호선 | 황금 | <NA> | (2F)대합실 (3F)어린이회관역 방향 3-1 출입문 | 13 | 1000 |
303 | 대구교통공사 | 3호선 | 황금 | <NA> | (2F)대합실 (3F)황금역 방향 1-1 출입문 | 13 | 1000 |