Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 179 |
Missing cells | 100 |
Missing cells (%) | 8.0% |
Duplicate rows | 25 |
Duplicate rows (%) | 14.0% |
Total size in memory | 10.4 KiB |
Average record size in memory | 59.7 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 수도권7호선에 포함된 도시광역철도역들의 엘리베이터 데이터로 철도운영기관명, 선명, 역명, 출입구번호, 상세위치, 정원인원, 정원중량의데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041395/fileData.do |
선명 has constant value "" | Constant |
Dataset has 25 (14.0%) duplicate rows | Duplicates |
정원_중량(kg) is highly overall correlated with 철도운영기관명 and 1 other fields | High correlation |
철도운영기관명 is highly overall correlated with 정원_중량(kg) and 1 other fields | High correlation |
정원_인원 is highly overall correlated with 정원_중량(kg) and 1 other fields | High correlation |
출입구번호 has 100 (55.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 18:44:08.822906 |
---|---|
Analysis finished | 2023-12-12 18:44:10.317133 |
Duration | 1.49 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
서울교통공사 | |
---|---|
인천교통공사 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 127 | |
인천교통공사 | 52 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 127 | |
인천교통공사 | 52 |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
7호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 7호선 |
---|---|
2nd row | 7호선 |
3rd row | 7호선 |
4th row | 7호선 |
5th row | 7호선 |
Common Values
Value | Count | Frequency (%) |
7호선 | 179 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
7호선 | 179 |
역명
Text
Distinct | 52 |
---|---|
Distinct (%) | 29.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Value | Count | Frequency (%) |
석남(거북시장 | 11 | 6.1% |
부평구청 | 9 | 5.0% |
내방 | 5 | 2.8% |
도봉산 | 5 | 2.8% |
상봉(시외버스터미널 | 5 | 2.8% |
산곡 | 4 | 2.2% |
굴포천 | 4 | 2.2% |
부천종합운동장 | 4 | 2.2% |
신대방삼거리 | 4 | 2.2% |
신풍 | 4 | 2.2% |
Other values (42) | 124 |
Most occurring characters
Value | Count | Frequency (%) |
( | 37 | 4.7% |
) | 37 | 4.7% |
구 | 31 | 3.9% |
대 | 30 | 3.8% |
산 | 25 | 3.2% |
장 | 20 | 2.5% |
시 | 19 | 2.4% |
청 | 19 | 2.4% |
거 | 17 | 2.2% |
남 | 17 | 2.2% |
Other values (105) | 534 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 712 | |
Open Punctuation | 37 | 4.7% |
Close Punctuation | 37 | 4.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 31 | 4.4% |
대 | 30 | 4.2% |
산 | 25 | 3.5% |
장 | 20 | 2.8% |
시 | 19 | 2.7% |
청 | 19 | 2.7% |
거 | 17 | 2.4% |
남 | 17 | 2.4% |
부 | 16 | 2.2% |
동 | 16 | 2.2% |
Other values (103) | 502 |
Open Punctuation
Value | Count | Frequency (%) |
( | 37 |
Close Punctuation
Value | Count | Frequency (%) |
) | 37 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 712 | |
Common | 74 | 9.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 31 | 4.4% |
대 | 30 | 4.2% |
산 | 25 | 3.5% |
장 | 20 | 2.8% |
시 | 19 | 2.7% |
청 | 19 | 2.7% |
거 | 17 | 2.4% |
남 | 17 | 2.4% |
부 | 16 | 2.2% |
동 | 16 | 2.2% |
Other values (103) | 502 |
Common
Value | Count | Frequency (%) |
( | 37 | |
) | 37 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 712 | |
ASCII | 74 | 9.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 37 | |
) | 37 |
Hangul
Value | Count | Frequency (%) |
구 | 31 | 4.4% |
대 | 30 | 4.2% |
산 | 25 | 3.5% |
장 | 20 | 2.8% |
시 | 19 | 2.7% |
청 | 19 | 2.7% |
거 | 17 | 2.4% |
남 | 17 | 2.4% |
부 | 16 | 2.2% |
동 | 16 | 2.2% |
Other values (103) | 502 |
출입구번호
Real number (ℝ)
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 12.7% |
Missing | 100 |
Missing (%) | 55.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.6329114 |
Minimum | 1 |
---|---|
Maximum | 11 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 3 |
Q3 | 5 |
95-th percentile | 7.1 |
Maximum | 11 |
Range | 10 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.3214563 |
---|---|
Coefficient of variation (CV) | 0.63900714 |
Kurtosis | 0.86230468 |
Mean | 3.6329114 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 1.0091471 |
Sum | 287 |
Variance | 5.3891594 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 19 | 10.6% |
1 | 16 | 8.9% |
2 | 12 | 6.7% |
5 | 10 | 5.6% |
6 | 7 | 3.9% |
4 | 6 | 3.4% |
7 | 5 | 2.8% |
10 | 2 | 1.1% |
8 | 1 | 0.6% |
11 | 1 | 0.6% |
(Missing) | 100 |
Value | Count | Frequency (%) |
1 | 16 | |
2 | 12 | |
3 | 19 | |
4 | 6 | 3.4% |
5 | 10 | |
6 | 7 | 3.9% |
7 | 5 | 2.8% |
8 | 1 | 0.6% |
10 | 2 | 1.1% |
11 | 1 | 0.6% |
Value | Count | Frequency (%) |
11 | 1 | 0.6% |
10 | 2 | 1.1% |
8 | 1 | 0.6% |
7 | 5 | 2.8% |
6 | 7 | 3.9% |
5 | 10 | |
4 | 6 | 3.4% |
3 | 19 | |
2 | 12 | |
1 | 16 |
상세위치
Text
Distinct | 91 |
---|---|
Distinct (%) | 50.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Length
Max length | 70 |
---|---|
Median length | 67 |
Mean length | 21.821229 |
Min length | 3 |
Characters and Unicode
Total characters | 3906 |
---|---|
Distinct characters | 132 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 70 ? |
---|---|
Unique (%) | 39.1% |
Sample
1st row | (B2-B4) 승강장 |
---|---|
2nd row | (B2-B4) 승강장 |
3rd row | (B1-B2)지하2층 대합실 |
4th row | (F1-B1)6번 출입구 |
5th row | (B2-B3) 승강장 |
Value | Count | Frequency (%) |
출입구 | 99 | 12.1% |
승강장 | 79 | 9.7% |
방향 | 44 | 5.4% |
b1 | 38 | 4.7% |
b2-b3 | 30 | 3.7% |
대합실 | 26 | 3.2% |
1f | 26 | 3.2% |
엘리베이터 | 24 | 2.9% |
앞 | 24 | 2.9% |
출입문 | 19 | 2.3% |
Other values (143) | 406 |
Most occurring characters
Value | Count | Frequency (%) |
641 | 16.4% | |
B | 260 | 6.7% |
( | 244 | 6.2% |
) | 244 | 6.2% |
1 | 223 | 5.7% |
- | 162 | 4.1% |
2 | 128 | 3.3% |
번 | 128 | 3.3% |
입 | 121 | 3.1% |
출 | 120 | 3.1% |
Other values (122) | 1635 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1627 | |
Space Separator | 641 | 16.4% |
Decimal Number | 575 | 14.7% |
Uppercase Letter | 357 | 9.1% |
Open Punctuation | 244 | 6.2% |
Close Punctuation | 244 | 6.2% |
Dash Punctuation | 162 | 4.1% |
Other Punctuation | 36 | 0.9% |
Math Symbol | 20 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
번 | 128 | 7.9% |
입 | 121 | 7.4% |
출 | 120 | 7.4% |
구 | 107 | 6.6% |
승 | 96 | 5.9% |
장 | 93 | 5.7% |
강 | 84 | 5.2% |
방 | 52 | 3.2% |
향 | 51 | 3.1% |
이 | 41 | 2.5% |
Other values (100) | 734 |
Decimal Number
Value | Count | Frequency (%) |
1 | 223 | |
2 | 128 | |
3 | 91 | |
4 | 58 | 10.1% |
5 | 29 | 5.0% |
7 | 24 | 4.2% |
6 | 13 | 2.3% |
8 | 5 | 0.9% |
0 | 3 | 0.5% |
9 | 1 | 0.2% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 260 | |
F | 94 | 26.3% |
M | 1 | 0.3% |
S | 1 | 0.3% |
G | 1 | 0.3% |
Math Symbol
Value | Count | Frequency (%) |
> | 10 | |
< | 10 |
Space Separator
Value | Count | Frequency (%) |
641 |
Open Punctuation
Value | Count | Frequency (%) |
( | 244 |
Close Punctuation
Value | Count | Frequency (%) |
) | 244 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 162 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 36 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1922 | |
Hangul | 1627 | |
Latin | 357 | 9.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
번 | 128 | 7.9% |
입 | 121 | 7.4% |
출 | 120 | 7.4% |
구 | 107 | 6.6% |
승 | 96 | 5.9% |
장 | 93 | 5.7% |
강 | 84 | 5.2% |
방 | 52 | 3.2% |
향 | 51 | 3.1% |
이 | 41 | 2.5% |
Other values (100) | 734 |
Common
Value | Count | Frequency (%) |
641 | ||
( | 244 | 12.7% |
) | 244 | 12.7% |
1 | 223 | 11.6% |
- | 162 | 8.4% |
2 | 128 | 6.7% |
3 | 91 | 4.7% |
4 | 58 | 3.0% |
/ | 36 | 1.9% |
5 | 29 | 1.5% |
Other values (7) | 66 | 3.4% |
Latin
Value | Count | Frequency (%) |
B | 260 | |
F | 94 | 26.3% |
M | 1 | 0.3% |
S | 1 | 0.3% |
G | 1 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2279 | |
Hangul | 1627 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
641 | ||
B | 260 | |
( | 244 | 10.7% |
) | 244 | 10.7% |
1 | 223 | 9.8% |
- | 162 | 7.1% |
2 | 128 | 5.6% |
F | 94 | 4.1% |
3 | 91 | 4.0% |
4 | 58 | 2.5% |
Other values (12) | 134 | 5.9% |
Hangul
Value | Count | Frequency (%) |
번 | 128 | 7.9% |
입 | 121 | 7.4% |
출 | 120 | 7.4% |
구 | 107 | 6.6% |
승 | 96 | 5.9% |
장 | 93 | 5.7% |
강 | 84 | 5.2% |
방 | 52 | 3.2% |
향 | 51 | 3.1% |
이 | 41 | 2.5% |
Other values (100) | 734 |
정원_인원
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
15 | |
---|---|
17 | |
24 | |
11 | 12 |
20 | 4 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 15 |
---|---|
2nd row | 15 |
3rd row | 15 |
4th row | 15 |
5th row | 15 |
Common Values
Value | Count | Frequency (%) |
15 | 132 | |
17 | 16 | 8.9% |
24 | 15 | 8.4% |
11 | 12 | 6.7% |
20 | 4 | 2.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
15 | 132 | |
17 | 16 | 8.9% |
24 | 15 | 8.4% |
11 | 12 | 6.7% |
20 | 4 | 2.2% |
정원_중량(kg)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 4.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1064.7486 |
Minimum | 750 |
---|---|
Maximum | 1600 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 750 |
---|---|
5-th percentile | 750 |
Q1 | 1000 |
median | 1000 |
Q3 | 1080 |
95-th percentile | 1600 |
Maximum | 1600 |
Range | 850 |
Interquartile range (IQR) | 80 |
Descriptive statistics
Standard deviation | 189.45536 |
---|---|
Coefficient of variation (CV) | 0.17793436 |
Kurtosis | 3.1646237 |
Mean | 1064.7486 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.6711247 |
Sum | 190590 |
Variance | 35893.335 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1000 | 107 | |
1150 | 16 | 8.9% |
1600 | 15 | 8.4% |
1080 | 13 | 7.3% |
750 | 12 | 6.7% |
1050 | 10 | 5.6% |
1350 | 4 | 2.2% |
1125 | 2 | 1.1% |
Value | Count | Frequency (%) |
750 | 12 | 6.7% |
1000 | 107 | |
1050 | 10 | 5.6% |
1080 | 13 | 7.3% |
1125 | 2 | 1.1% |
1150 | 16 | 8.9% |
1350 | 4 | 2.2% |
1600 | 15 | 8.4% |
Value | Count | Frequency (%) |
1600 | 15 | 8.4% |
1350 | 4 | 2.2% |
1150 | 16 | 8.9% |
1125 | 2 | 1.1% |
1080 | 13 | 7.3% |
1050 | 10 | 5.6% |
1000 | 107 | |
750 | 12 | 6.7% |
철도운영기관명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|
철도운영기관명 | 1.000 | 1.000 | 0.358 | 1.000 | 0.489 | 0.801 |
역명 | 1.000 | 1.000 | 0.733 | 0.000 | 0.849 | 0.898 |
출입구번호 | 0.358 | 0.733 | 1.000 | 1.000 | 0.333 | 0.000 |
상세위치 | 1.000 | 0.000 | 1.000 | 1.000 | 0.965 | 0.993 |
정원_인원 | 0.489 | 0.849 | 0.333 | 0.965 | 1.000 | 0.988 |
정원_중량(kg) | 0.801 | 0.898 | 0.000 | 0.993 | 0.988 | 1.000 |
철도운영기관명 | 정원_인원 | |
---|---|---|
철도운영기관명 | 1.000 | 0.588 |
정원_인원 | 0.588 | 1.000 |
출입구번호 | 정원_중량(kg) | 철도운영기관명 | 정원_인원 | |
---|---|---|---|---|
출입구번호 | 1.000 | 0.233 | 0.197 | 0.167 |
정원_중량(kg) | 0.233 | 1.000 | 0.922 | 0.958 |
철도운영기관명 | 0.197 | 0.922 | 1.000 | 0.588 |
정원_인원 | 0.167 | 0.958 | 0.588 | 1.000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 7호선 | 가산디지털단지 | <NA> | (B2-B4) 승강장 | 15 | 1000 |
1 | 서울교통공사 | 7호선 | 가산디지털단지 | <NA> | (B2-B4) 승강장 | 15 | 1000 |
2 | 서울교통공사 | 7호선 | 가산디지털단지 | <NA> | (B1-B2)지하2층 대합실 | 15 | 1000 |
3 | 서울교통공사 | 7호선 | 가산디지털단지 | 6 | (F1-B1)6번 출입구 | 15 | 1000 |
4 | 서울교통공사 | 7호선 | 강남구청 | <NA> | (B2-B3) 승강장 | 15 | 1000 |
5 | 서울교통공사 | 7호선 | 강남구청 | <NA> | (B2-B3) 승강장 | 15 | 1000 |
6 | 서울교통공사 | 7호선 | 건대입구 | <NA> | (B2-B3) 승강장 | 15 | 1000 |
7 | 서울교통공사 | 7호선 | 건대입구 | <NA> | (B2-B3) 승강장 | 15 | 1000 |
8 | 서울교통공사 | 7호선 | 고속터미널 | <NA> | (B2-B3) 승강장 | 15 | 1000 |
9 | 서울교통공사 | 7호선 | 고속터미널 | <NA> | (B2-B3) 승강장 | 15 | 1000 |
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | |
---|---|---|---|---|---|---|---|
169 | 인천교통공사 | 7호선 | 석남(거북시장) | 6 | (B1) 4번/7번 출입구 오른방향 안쪽 엘리베이터 (1F) 7번 출입구 뒷편 고가도로 밑(2호선 8번 출입구 앞) | 20 | 1350 |
170 | 인천교통공사 | 7호선 | 석남(거북시장) | 7 | (B1) 2번/3번 출입구 왼쪽 방향 엘리베이터 (1F) 2번 출입구 뒷편 고가도로 밑(2호선 3번 출입구 뒷편) | 20 | 1350 |
171 | 인천교통공사 | 7호선 | 석남(거북시장) | <NA> | (B4) 2호선<->7호선 환승통로 (B2) 2호선<->7호선 환승통로 | 15 | 1150 |
172 | 인천교통공사 | 7호선 | 신중동 | <NA> | (B2) 춘의역 방향 승강장 4-1/ 부천시청역 방향 승강장 5-3의 사이의 중앙 (B1) 표 내는 곳 내 대합실 중앙 | 15 | 1050 |
173 | 인천교통공사 | 7호선 | 신중동 | 1 | (B1) 대합실 1번/2번 출입구 (1F) 1번/2번 출입구 사이 | 15 | 1050 |
174 | 인천교통공사 | 7호선 | 신중동 | 7 | (B1) 대합실 7번 출입구 (1F) 7번 출입구 사이 | 15 | 1050 |
175 | 인천교통공사 | 7호선 | 신중동 | 3 | (B1) 대합실 3번 출입구 (1F) 3번 출입구 인근 | 15 | 1050 |
176 | 인천교통공사 | 7호선 | 춘의 | <NA> | (B2) 부천종합운동장역 방향 5-1/ 신중동 방향 4-4 (B1) 고객안내센터 앞 대합실 | 15 | 1080 |
177 | 인천교통공사 | 7호선 | 춘의 | 3 | (B1) 대합실 3번/4번 출입구 (1F) 3번/4번 출입구 사이 | 15 | 1080 |
178 | 인천교통공사 | 7호선 | 춘의 | 7 | (B1) 대합실 7번/8번 출입구 (1F) 3번/4번 출입구 사이 | 15 | 1080 |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 출입구번호 | 상세위치 | 정원_인원 | 정원_중량(kg) | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 7호선 | 가산디지털단지 | <NA> | (B2-B4) 승강장 | 15 | 1000 | 2 |
1 | 서울교통공사 | 7호선 | 강남구청 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
2 | 서울교통공사 | 7호선 | 건대입구 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
3 | 서울교통공사 | 7호선 | 고속터미널 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
4 | 서울교통공사 | 7호선 | 남성 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
5 | 서울교통공사 | 7호선 | 내방 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
6 | 서울교통공사 | 7호선 | 논현 | <NA> | (B2-B3) 승강장 | 15 | 1000 | 2 |
7 | 서울교통공사 | 7호선 | 대림(구로구청) | <NA> | (B1-B2) 승강장 | 15 | 1000 | 2 |
8 | 서울교통공사 | 7호선 | 도봉산 | 2 | (F2-F1) 승강장 | 11 | 750 | 2 |
9 | 서울교통공사 | 7호선 | 도봉산 | <NA> | (F2-F1) 승강장 | 15 | 1000 | 2 |