Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 474 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 26 |
Duplicate rows (%) | 5.5% |
Total size in memory | 29.8 KiB |
Average record size in memory | 64.3 B |
Variable types
Categorical | 6 |
---|---|
Text | 2 |
Dataset
Description | 수도권1호선에 포함된 도시광역철도역들의 철도운영기관명, 선명, 역명, 상하행구분, 출입구번호, 상세위치, 시작층, 종료층의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041367/fileData.do |
선명 has constant value "" | Constant |
Dataset has 26 (5.5%) duplicate rows | Duplicates |
상하행구분 is highly overall correlated with 시작층 and 1 other fields | High correlation |
시작층 is highly overall correlated with 상하행구분 | High correlation |
종료층 is highly overall correlated with 상하행구분 | High correlation |
철도운영기관 is highly imbalanced (63.5%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 13:13:00.857659 |
---|---|
Analysis finished | 2023-12-12 13:13:01.641124 |
Duration | 0.78 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
코레일 | |
---|---|
서울교통공사 | 33 |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.2088608 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 코레일 |
---|---|
2nd row | 코레일 |
3rd row | 코레일 |
4th row | 코레일 |
5th row | 코레일 |
Common Values
Value | Count | Frequency (%) |
코레일 | 441 | |
서울교통공사 | 33 | 7.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
코레일 | 441 | |
서울교통공사 | 33 | 7.0% |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
1호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1호선 |
---|---|
2nd row | 1호선 |
3rd row | 1호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
1호선 | 474 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1호선 | 474 |
역명
Text
Distinct | 77 |
---|---|
Distinct (%) | 16.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
Value | Count | Frequency (%) |
광명 | 28 | 5.9% |
아산 | 22 | 4.6% |
동묘앞 | 12 | 2.5% |
인천 | 12 | 2.5% |
영등포 | 12 | 2.5% |
도봉산 | 10 | 2.1% |
송내 | 10 | 2.1% |
의정부 | 10 | 2.1% |
대방 | 10 | 2.1% |
신도림 | 9 | 1.9% |
Other values (67) | 339 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 62 | 5.0% |
동 | 57 | 4.6% |
천 | 46 | 3.7% |
대 | 38 | 3.1% |
명 | 36 | 2.9% |
정 | 34 | 2.8% |
광 | 28 | 2.3% |
봉 | 26 | 2.1% |
서 | 26 | 2.1% |
부 | 26 | 2.1% |
Other values (97) | 852 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1199 | |
Open Punctuation | 14 | 1.1% |
Close Punctuation | 14 | 1.1% |
Decimal Number | 4 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 62 | 5.2% |
동 | 57 | 4.8% |
천 | 46 | 3.8% |
대 | 38 | 3.2% |
명 | 36 | 3.0% |
정 | 34 | 2.8% |
광 | 28 | 2.3% |
봉 | 26 | 2.2% |
서 | 26 | 2.2% |
부 | 26 | 2.2% |
Other values (94) | 820 |
Open Punctuation
Value | Count | Frequency (%) |
( | 14 |
Close Punctuation
Value | Count | Frequency (%) |
) | 14 |
Decimal Number
Value | Count | Frequency (%) |
3 | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1199 | |
Common | 32 | 2.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 62 | 5.2% |
동 | 57 | 4.8% |
천 | 46 | 3.8% |
대 | 38 | 3.2% |
명 | 36 | 3.0% |
정 | 34 | 2.8% |
광 | 28 | 2.3% |
봉 | 26 | 2.2% |
서 | 26 | 2.2% |
부 | 26 | 2.2% |
Other values (94) | 820 |
Common
Value | Count | Frequency (%) |
( | 14 | |
) | 14 | |
3 | 4 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1199 | |
ASCII | 32 | 2.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 62 | 5.2% |
동 | 57 | 4.8% |
천 | 46 | 3.8% |
대 | 38 | 3.2% |
명 | 36 | 3.0% |
정 | 34 | 2.8% |
광 | 28 | 2.3% |
봉 | 26 | 2.2% |
서 | 26 | 2.2% |
부 | 26 | 2.2% |
Other values (94) | 820 |
ASCII
Value | Count | Frequency (%) |
( | 14 | |
) | 14 | |
3 | 4 | 12.5% |
상하행구분
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
상행 | |
---|---|
하행 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 상행 |
---|---|
2nd row | 상행 |
3rd row | 상행 |
4th row | 상행 |
5th row | 상행 |
Common Values
Value | Count | Frequency (%) |
상행 | 270 | |
하행 | 204 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
상행 | 270 | |
하행 | 204 |
출입구번호
Categorical
Distinct | 22 |
---|---|
Distinct (%) | 4.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
<NA> | |
---|---|
1 | |
2 | |
3 | |
4 | 15 |
Other values (17) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 2.535865 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 1 |
---|---|
2nd row | 2 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 212 | |
1 | 98 | |
2 | 61 | 12.9% |
3 | 32 | 6.8% |
4 | 15 | 3.2% |
1/2 | 11 | 2.3% |
2/3 | 5 | 1.1% |
5/6 | 4 | 0.8% |
5 | 4 | 0.8% |
1/3 | 4 | 0.8% |
Other values (12) | 28 | 5.9% |
Length
Value | Count | Frequency (%) |
na | 212 | |
1 | 98 | |
2 | 61 | 12.9% |
3 | 32 | 6.8% |
4 | 15 | 3.2% |
1/2 | 11 | 2.3% |
2/3 | 5 | 1.1% |
5/6 | 4 | 0.8% |
5 | 4 | 0.8% |
1/3 | 4 | 0.8% |
Other values (12) | 28 | 5.9% |
상세위치
Text
Distinct | 398 |
---|---|
Distinct (%) | 84.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
Length
Max length | 79 |
---|---|
Median length | 41 |
Mean length | 17.563291 |
Min length | 3 |
Characters and Unicode
Total characters | 8325 |
---|---|
Distinct characters | 194 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 342 ? |
---|---|
Unique (%) | 72.2% |
Sample
1st row | (1층) 1번 출입구 계단옆 > (2층) 맞이방 |
---|---|
2nd row | (1층) 2번 출입구 계단옆 |
3rd row | (1층) 광운대방향 4-3 출입문 앞 |
4th row | (1층) 광운대방향 7-2 출입문 앞 |
5th row | (1층) 문산방향 6-2 출입문 앞 |
Value | Count | Frequency (%) |
앞 | 135 | 6.7% |
출입구 | 113 | 5.6% |
방향 | 106 | 5.2% |
출입문 | 80 | 3.9% |
1f | 76 | 3.7% |
승강장 | 71 | 3.5% |
맞이방 | 54 | 2.7% |
1층 | 45 | 2.2% |
45 | 2.2% | |
2f | 44 | 2.2% |
Other values (368) | 1258 |
Most occurring characters
Value | Count | Frequency (%) |
1625 | ||
( | 454 | 5.5% |
) | 454 | 5.5% |
1 | 417 | 5.0% |
F | 292 | 3.5% |
방 | 287 | 3.4% |
출 | 272 | 3.3% |
2 | 268 | 3.2% |
입 | 245 | 2.9% |
번 | 217 | 2.6% |
Other values (184) | 3794 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4185 | |
Space Separator | 1625 | 19.5% |
Decimal Number | 1013 | 12.2% |
Open Punctuation | 454 | 5.5% |
Close Punctuation | 454 | 5.5% |
Uppercase Letter | 359 | 4.3% |
Dash Punctuation | 122 | 1.5% |
Math Symbol | 81 | 1.0% |
Other Punctuation | 26 | 0.3% |
Lowercase Letter | 6 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
방 | 287 | 6.9% |
출 | 272 | 6.5% |
입 | 245 | 5.9% |
번 | 217 | 5.2% |
구 | 196 | 4.7% |
앞 | 147 | 3.5% |
이 | 143 | 3.4% |
향 | 138 | 3.3% |
승 | 135 | 3.2% |
역 | 126 | 3.0% |
Other values (160) | 2279 |
Decimal Number
Value | Count | Frequency (%) |
1 | 417 | |
2 | 268 | |
3 | 123 | 12.1% |
4 | 79 | 7.8% |
5 | 40 | 3.9% |
6 | 37 | 3.7% |
7 | 24 | 2.4% |
0 | 10 | 1.0% |
8 | 8 | 0.8% |
9 | 7 | 0.7% |
Uppercase Letter
Value | Count | Frequency (%) |
F | 292 | |
B | 62 | 17.3% |
A | 3 | 0.8% |
C | 2 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 15 | |
. | 10 | |
* | 1 | 3.8% |
Math Symbol
Value | Count | Frequency (%) |
> | 71 | |
→ | 10 | 12.3% |
Space Separator
Value | Count | Frequency (%) |
1625 |
Open Punctuation
Value | Count | Frequency (%) |
( | 454 |
Close Punctuation
Value | Count | Frequency (%) |
) | 454 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 122 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4185 | |
Common | 3775 | |
Latin | 365 | 4.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
방 | 287 | 6.9% |
출 | 272 | 6.5% |
입 | 245 | 5.9% |
번 | 217 | 5.2% |
구 | 196 | 4.7% |
앞 | 147 | 3.5% |
이 | 143 | 3.4% |
향 | 138 | 3.3% |
승 | 135 | 3.2% |
역 | 126 | 3.0% |
Other values (160) | 2279 |
Common
Value | Count | Frequency (%) |
1625 | ||
( | 454 | 12.0% |
) | 454 | 12.0% |
1 | 417 | 11.0% |
2 | 268 | 7.1% |
3 | 123 | 3.3% |
- | 122 | 3.2% |
4 | 79 | 2.1% |
> | 71 | 1.9% |
5 | 40 | 1.1% |
Other values (9) | 122 | 3.2% |
Latin
Value | Count | Frequency (%) |
F | 292 | |
B | 62 | 17.0% |
m | 6 | 1.6% |
A | 3 | 0.8% |
C | 2 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4185 | |
ASCII | 4130 | |
Arrows | 10 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1625 | ||
( | 454 | 11.0% |
) | 454 | 11.0% |
1 | 417 | 10.1% |
F | 292 | 7.1% |
2 | 268 | 6.5% |
3 | 123 | 3.0% |
- | 122 | 3.0% |
4 | 79 | 1.9% |
> | 71 | 1.7% |
Other values (13) | 225 | 5.4% |
Hangul
Value | Count | Frequency (%) |
방 | 287 | 6.9% |
출 | 272 | 6.5% |
입 | 245 | 5.9% |
번 | 217 | 5.2% |
구 | 196 | 4.7% |
앞 | 147 | 3.5% |
이 | 143 | 3.4% |
향 | 138 | 3.3% |
승 | 135 | 3.2% |
역 | 126 | 3.0% |
Other values (160) | 2279 |
Arrows
Value | Count | Frequency (%) |
→ | 10 |
시작층
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
지상1 | |
---|---|
지상2 | |
지하1 | |
지상3 | |
지하2 | 8 |
Other values (2) | 6 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지상1 |
---|---|
2nd row | 지상1 |
3rd row | 지상1 |
4th row | 지상1 |
5th row | 지상1 |
Common Values
Value | Count | Frequency (%) |
지상1 | 238 | |
지상2 | 127 | |
지하1 | 54 | 11.4% |
지상3 | 41 | 8.6% |
지하2 | 8 | 1.7% |
지상4 | 4 | 0.8% |
지하3 | 2 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지상1 | 238 | |
지상2 | 127 | |
지하1 | 54 | 11.4% |
지상3 | 41 | 8.6% |
지하2 | 8 | 1.7% |
지상4 | 4 | 0.8% |
지하3 | 2 | 0.4% |
종료층
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
지상1 | |
---|---|
지상2 | |
지상3 | |
지하1 | |
지하2 | |
Other values (3) | 7 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.9978903 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 지상2 |
---|---|
2nd row | 지상2 |
3rd row | 지상2 |
4th row | 지상2 |
5th row | 지상2 |
Common Values
Value | Count | Frequency (%) |
지상1 | 169 | |
지상2 | 166 | |
지상3 | 60 | 12.7% |
지하1 | 48 | 10.1% |
지하2 | 24 | 5.1% |
지상4 | 4 | 0.8% |
지하3 | 2 | 0.4% |
지상 | 1 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지상1 | 169 | |
지상2 | 166 | |
지상3 | 60 | 12.7% |
지하1 | 48 | 10.1% |
지하2 | 24 | 5.1% |
지상4 | 4 | 0.8% |
지하3 | 2 | 0.4% |
지상 | 1 | 0.2% |
철도운영기관 | 역명 | 상하행구분 | 출입구번호 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|
철도운영기관 | 1.000 | 1.000 | 0.000 | 0.368 | 0.422 | 0.489 |
역명 | 1.000 | 1.000 | 0.000 | 0.949 | 0.690 | 0.732 |
상하행구분 | 0.000 | 0.000 | 1.000 | 0.000 | 0.541 | 0.744 |
출입구번호 | 0.368 | 0.949 | 0.000 | 1.000 | 0.000 | 0.000 |
시작층 | 0.422 | 0.690 | 0.541 | 0.000 | 1.000 | 0.712 |
종료층 | 0.489 | 0.732 | 0.744 | 0.000 | 0.712 | 1.000 |
상하행구분 | 종료층 | 철도운영기관 | 출입구번호 | 시작층 | |
---|---|---|---|---|---|
상하행구분 | 1.000 | 0.567 | 0.000 | 0.000 | 0.578 |
종료층 | 0.567 | 1.000 | 0.366 | 0.000 | 0.484 |
철도운영기관 | 0.000 | 0.366 | 1.000 | 0.311 | 0.449 |
출입구번호 | 0.000 | 0.000 | 0.311 | 1.000 | 0.000 |
시작층 | 0.578 | 0.484 | 0.449 | 0.000 | 1.000 |
철도운영기관 | 상하행구분 | 출입구번호 | 시작층 | 종료층 | |
---|---|---|---|---|---|
철도운영기관 | 1.000 | 0.000 | 0.311 | 0.449 | 0.366 |
상하행구분 | 0.000 | 1.000 | 0.000 | 0.578 | 0.567 |
출입구번호 | 0.311 | 0.000 | 1.000 | 0.000 | 0.000 |
시작층 | 0.449 | 0.578 | 0.000 | 1.000 | 0.484 |
종료층 | 0.366 | 0.567 | 0.000 | 0.484 | 1.000 |
철도운영기관 | 선명 | 역명 | 상하행구분 | 출입구번호 | 상세위치 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|---|
0 | 코레일 | 1호선 | 회기 | 상행 | 1 | (1층) 1번 출입구 계단옆 > (2층) 맞이방 | 지상1 | 지상2 |
1 | 코레일 | 1호선 | 회기 | 상행 | 2 | (1층) 2번 출입구 계단옆 | 지상1 | 지상2 |
2 | 코레일 | 1호선 | 회기 | 상행 | <NA> | (1층) 광운대방향 4-3 출입문 앞 | 지상1 | 지상2 |
3 | 코레일 | 1호선 | 회기 | 상행 | <NA> | (1층) 광운대방향 7-2 출입문 앞 | 지상1 | 지상2 |
4 | 코레일 | 1호선 | 회기 | 상행 | <NA> | (1층) 문산방향 6-2 출입문 앞 | 지상1 | 지상2 |
5 | 코레일 | 1호선 | 회기 | 상행 | <NA> | (1층) 문산방향 3-3 츨입문 앞 | 지상1 | 지상2 |
6 | 코레일 | 1호선 | 회기 | 상행 | <NA> | (1층) 1번츨입구 계단 옆 | 지상1 | 지상2 |
7 | 코레일 | 1호선 | 화서 | 상행 | 6 | (1) 6번 출입구 계단 옆 | 지상1 | 지상2 |
8 | 코레일 | 1호선 | 화서 | 하행 | 4 | (1) 4번 출입구 계단 옆 | 지상1 | 지상2 |
9 | 코레일 | 1호선 | 덕정 | 하행 | 1 | (1F) 지행역 방향 승강장 7-3 | 지상2 | 지상1 |
철도운영기관 | 선명 | 역명 | 상하행구분 | 출입구번호 | 상세위치 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|---|
464 | 코레일 | 1호선 | 평택지제 | 상행 | <NA> | (1F)서정리역 방향 7-2 출입문 앞 | 지상1 | 지상2 |
465 | 코레일 | 1호선 | 평택지제 | 상행 | <NA> | (1F)평택역 방향 4-3 출입문 앞 | 지상1 | 지상2 |
466 | 코레일 | 1호선 | 회룡 | 상행 | <NA> | (1F)망월사역 방향 승강장 5-3 출입문 앞>(3F)맞이방 | 지상1 | 지상3 |
467 | 코레일 | 1호선 | 회룡 | 하행 | <NA> | (3F)맞이방>(1F)망월사역 방향 승강장 5-3 출입문 앞 | 지상3 | 지상1 |
468 | 코레일 | 1호선 | 회룡 | 상행 | <NA> | (1F)의정부역 방향 5-3 출입문 앞>(3F)맞이방 | 지상1 | 지상3 |
469 | 코레일 | 1호선 | 회룡 | 하행 | <NA> | (3F)맞이방>(1F)의정부역 방향 5-3 출입문 앞 | 지상3 | 지상1 |
470 | 코레일 | 1호선 | 회룡 | 상행 | 3 | (2F)3번출입구>(3F)맞이방 | 지상2 | 지상3 |
471 | 코레일 | 1호선 | 회룡 | 하행 | 3 | (3F)맞이방>(2F)3번출입구 | 지상3 | 지상2 |
472 | 코레일 | 1호선 | 회룡 | 상행 | 3 | (1F)3번출입구>(2F)중층 | 지상1 | 지상2 |
473 | 코레일 | 1호선 | 회룡 | 하행 | 3 | (2F)중층>(1F)3번출입구 | 지상2 | 지상 |
Most frequently occurring
철도운영기관 | 선명 | 역명 | 상하행구분 | 출입구번호 | 상세위치 | 시작층 | 종료층 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
22 | 코레일 | 1호선 | 의정부 | 하행 | <NA> | (3F)맞이방 | 지상3 | 지상1 | 3 |
0 | 코레일 | 1호선 | 개봉 | 하행 | <NA> | (2F) 표내는곳 옆 | 지상2 | 지상1 | 2 |
1 | 코레일 | 1호선 | 덕정 | 상행 | 1 | (1F) 맞이방(표 내는 곳 안쪽) | 지상1 | 지상2 | 2 |
2 | 코레일 | 1호선 | 동두천 | 하행 | <NA> | (3F) 맞이방 | 지상3 | 지상1 | 2 |
3 | 코레일 | 1호선 | 동암 | 상행 | <NA> | 맞이방→승강장 | 지상1 | 지상2 | 2 |
4 | 코레일 | 1호선 | 동암 | 하행 | <NA> | 승강장→맞이방 | 지상2 | 지상1 | 2 |
5 | 코레일 | 1호선 | 동인천 | 상행 | 4 | 4번 출입구 개집표구 앞 | 지상1 | 지상1 | 2 |
6 | 코레일 | 1호선 | 부천 | 상행 | <NA> | (B1) 지하 동부 맞이방 | 지상1 | 지상1 | 2 |
7 | 코레일 | 1호선 | 서정리 | 상행 | 1 | 서정리역 1층 1번출구 앞 | 지상1 | 지상3 | 2 |
8 | 코레일 | 1호선 | 서정리 | 하행 | 1 | 서정리역 3층 1번출구 앞 | 지상3 | 지상1 | 2 |