Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 1125 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 2 |
Duplicate rows (%) | 0.2% |
Total size in memory | 44.1 KiB |
Average record size in memory | 40.1 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Dataset
Description | 수도권1호선에 포함된 도시광역철도역들의 철도운영기관명,선명,역명,출구번호,출구별 주요시설명, 주소 등의 데이터 입니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15073464/fileData.do |
선명 has constant value "" | Constant |
Dataset has 2 (0.2%) duplicate rows | Duplicates |
철도운영기관명 is highly overall correlated with 출구번호 | High correlation |
출구번호 is highly overall correlated with 철도운영기관명 | High correlation |
Reproduction
Analysis started | 2023-12-12 17:30:23.785858 |
---|---|
Analysis finished | 2023-12-12 17:30:24.812720 |
Duration | 1.03 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.9 KiB |
코레일 | |
---|---|
서울교통공사 |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 4.272 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 코레일 |
---|---|
2nd row | 코레일 |
3rd row | 코레일 |
4th row | 코레일 |
5th row | 코레일 |
Common Values
Value | Count | Frequency (%) |
코레일 | 648 | |
서울교통공사 | 477 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
코레일 | 648 | |
서울교통공사 | 477 |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.9 KiB |
1호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1호선 |
---|---|
2nd row | 1호선 |
3rd row | 1호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
1호선 | 1125 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1호선 | 1125 |
역명
Text
Distinct | 62 |
---|---|
Distinct (%) | 5.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.9 KiB |
Value | Count | Frequency (%) |
시청 | 119 | 10.6% |
서울역 | 59 | 5.2% |
신설동 | 57 | 5.1% |
신도림 | 51 | 4.5% |
종로3가 | 51 | 4.5% |
동묘앞 | 47 | 4.2% |
종로5가 | 46 | 4.1% |
제기동 | 36 | 3.2% |
창동 | 33 | 2.9% |
의정부 | 32 | 2.8% |
Other values (52) | 594 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 249 | 8.2% |
시 | 131 | 4.3% |
청 | 131 | 4.3% |
신 | 131 | 4.3% |
종 | 122 | 4.0% |
가 | 107 | 3.5% |
로 | 105 | 3.4% |
도 | 88 | 2.9% |
부 | 79 | 2.6% |
서 | 71 | 2.3% |
Other values (78) | 1836 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2929 | |
Decimal Number | 97 | 3.2% |
Close Punctuation | 12 | 0.4% |
Open Punctuation | 12 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 249 | 8.5% |
시 | 131 | 4.5% |
청 | 131 | 4.5% |
신 | 131 | 4.5% |
종 | 122 | 4.2% |
가 | 107 | 3.7% |
로 | 105 | 3.6% |
도 | 88 | 3.0% |
부 | 79 | 2.7% |
서 | 71 | 2.4% |
Other values (74) | 1715 |
Decimal Number
Value | Count | Frequency (%) |
3 | 51 | |
5 | 46 |
Close Punctuation
Value | Count | Frequency (%) |
) | 12 |
Open Punctuation
Value | Count | Frequency (%) |
( | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2929 | |
Common | 121 | 4.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 249 | 8.5% |
시 | 131 | 4.5% |
청 | 131 | 4.5% |
신 | 131 | 4.5% |
종 | 122 | 4.2% |
가 | 107 | 3.7% |
로 | 105 | 3.6% |
도 | 88 | 3.0% |
부 | 79 | 2.7% |
서 | 71 | 2.4% |
Other values (74) | 1715 |
Common
Value | Count | Frequency (%) |
3 | 51 | |
5 | 46 | |
) | 12 | 9.9% |
( | 12 | 9.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2929 | |
ASCII | 121 | 4.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 249 | 8.5% |
시 | 131 | 4.5% |
청 | 131 | 4.5% |
신 | 131 | 4.5% |
종 | 122 | 4.2% |
가 | 107 | 3.7% |
로 | 105 | 3.6% |
도 | 88 | 3.0% |
부 | 79 | 2.7% |
서 | 71 | 2.4% |
Other values (74) | 1715 |
ASCII
Value | Count | Frequency (%) |
3 | 51 | |
5 | 46 | |
) | 12 | 9.9% |
( | 12 | 9.9% |
출구번호
Categorical
HIGH CORRELATION
 
Distinct | 18 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.9 KiB |
1 | |
---|---|
2 | |
3 | |
6 | |
4 | |
Other values (13) |
Length
Max length | 3 |
---|---|
Median length | 1 |
Mean length | 1.1004444 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 293 | |
2 | 251 | |
3 | 170 | |
6 | 77 | 6.8% |
4 | 69 | 6.1% |
5 | 68 | 6.0% |
8 | 36 | 3.2% |
7 | 34 | 3.0% |
10 | 33 | 2.9% |
9 | 23 | 2.0% |
Other values (8) | 71 | 6.3% |
Length
Value | Count | Frequency (%) |
1 | 293 | |
2 | 251 | |
3 | 170 | |
6 | 77 | 6.8% |
4 | 69 | 6.1% |
5 | 68 | 6.0% |
8 | 36 | 3.2% |
7 | 34 | 3.0% |
10 | 33 | 2.9% |
9 | 23 | 2.0% |
Other values (8) | 71 | 6.3% |
출구별 주요시설명
Text
Distinct | 938 |
---|---|
Distinct (%) | 83.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.9 KiB |
Value | Count | Frequency (%) |
방면 | 10 | 0.8% |
동대문 | 8 | 0.6% |
국민건강보험공단 | 6 | 0.5% |
신한은행 | 6 | 0.5% |
우리은행 | 5 | 0.4% |
서울특별시청 | 5 | 0.4% |
우체국 | 5 | 0.4% |
근로복지공단 | 4 | 0.3% |
고등학교 | 4 | 0.3% |
창덕궁 | 4 | 0.3% |
Other values (976) | 1178 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 251 | 3.6% |
학 | 221 | 3.1% |
교 | 217 | 3.1% |
소 | 146 | 2.1% |
등 | 133 | 1.9% |
대 | 132 | 1.9% |
서 | 128 | 1.8% |
사 | 118 | 1.7% |
110 | 1.6% | |
국 | 108 | 1.5% |
Other values (372) | 5506 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6683 | |
Decimal Number | 147 | 2.1% |
Space Separator | 110 | 1.6% |
Uppercase Letter | 58 | 0.8% |
Other Punctuation | 30 | 0.4% |
Open Punctuation | 19 | 0.3% |
Close Punctuation | 19 | 0.3% |
Dash Punctuation | 2 | < 0.1% |
Math Symbol | 1 | < 0.1% |
Other Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 251 | 3.8% |
학 | 221 | 3.3% |
교 | 217 | 3.2% |
소 | 146 | 2.2% |
등 | 133 | 2.0% |
대 | 132 | 2.0% |
서 | 128 | 1.9% |
사 | 118 | 1.8% |
국 | 108 | 1.6% |
원 | 104 | 1.6% |
Other values (336) | 5125 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 8 | |
C | 7 | |
S | 6 | |
G | 5 | |
T | 5 | |
L | 4 | |
V | 4 | |
A | 4 | |
I | 3 | 5.2% |
B | 3 | 5.2% |
Other values (7) | 9 |
Decimal Number
Value | Count | Frequency (%) |
1 | 53 | |
2 | 40 | |
3 | 23 | |
4 | 11 | 7.5% |
5 | 10 | 6.8% |
9 | 3 | 2.0% |
6 | 2 | 1.4% |
0 | 2 | 1.4% |
7 | 2 | 1.4% |
8 | 1 | 0.7% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 26 | |
· | 3 | 10.0% |
. | 1 | 3.3% |
Space Separator
Value | Count | Frequency (%) |
110 |
Open Punctuation
Value | Count | Frequency (%) |
( | 19 |
Close Punctuation
Value | Count | Frequency (%) |
) | 19 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6684 | |
Common | 328 | 4.6% |
Latin | 58 | 0.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 251 | 3.8% |
학 | 221 | 3.3% |
교 | 217 | 3.2% |
소 | 146 | 2.2% |
등 | 133 | 2.0% |
대 | 132 | 2.0% |
서 | 128 | 1.9% |
사 | 118 | 1.8% |
국 | 108 | 1.6% |
원 | 104 | 1.6% |
Other values (337) | 5126 |
Common
Value | Count | Frequency (%) |
110 | ||
1 | 53 | |
2 | 40 | 12.2% |
/ | 26 | 7.9% |
3 | 23 | 7.0% |
( | 19 | 5.8% |
) | 19 | 5.8% |
4 | 11 | 3.4% |
5 | 10 | 3.0% |
9 | 3 | 0.9% |
Other values (8) | 14 | 4.3% |
Latin
Value | Count | Frequency (%) |
K | 8 | |
C | 7 | |
S | 6 | |
G | 5 | |
T | 5 | |
L | 4 | |
V | 4 | |
A | 4 | |
I | 3 | 5.2% |
B | 3 | 5.2% |
Other values (7) | 9 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6683 | |
ASCII | 383 | 5.4% |
None | 4 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 251 | 3.8% |
학 | 221 | 3.3% |
교 | 217 | 3.2% |
소 | 146 | 2.2% |
등 | 133 | 2.0% |
대 | 132 | 2.0% |
서 | 128 | 1.9% |
사 | 118 | 1.8% |
국 | 108 | 1.6% |
원 | 104 | 1.6% |
Other values (336) | 5125 |
ASCII
Value | Count | Frequency (%) |
110 | ||
1 | 53 | |
2 | 40 | 10.4% |
/ | 26 | 6.8% |
3 | 23 | 6.0% |
( | 19 | 5.0% |
) | 19 | 5.0% |
4 | 11 | 2.9% |
5 | 10 | 2.6% |
K | 8 | 2.1% |
Other values (24) | 64 |
None
Value | Count | Frequency (%) |
· | 3 | |
㈜ | 1 | 25.0% |
철도운영기관명 | 역명 | 출구번호 | |
---|---|---|---|
철도운영기관명 | 1.000 | 1.000 | 0.635 |
역명 | 1.000 | 1.000 | 0.602 |
출구번호 | 0.635 | 0.602 | 1.000 |
출구번호 | 철도운영기관명 | |
---|---|---|
출구번호 | 1.000 | 0.503 |
철도운영기관명 | 0.503 | 1.000 |
철도운영기관명 | 출구번호 | |
---|---|---|
철도운영기관명 | 1.000 | 0.503 |
출구번호 | 0.503 | 1.000 |
철도운영기관명 | 선명 | 역명 | 출구번호 | 출구별 주요시설명 | |
---|---|---|---|---|---|
0 | 코레일 | 1호선 | 소요산 | 1 | 소요산사거리 |
1 | 코레일 | 1호선 | 소요산 | 1 | 소요소방파출소 |
2 | 코레일 | 1호선 | 소요산 | 1 | 소요산유원지 |
3 | 코레일 | 1호선 | 동두천 | 1 | 소요파출소 |
4 | 코레일 | 1호선 | 동두천 | 1 | 동안치안센터 |
5 | 코레일 | 1호선 | 동두천 | 1 | 소요동사무소 |
6 | 코레일 | 1호선 | 동두천 | 2 | 동보초등학교 |
7 | 코레일 | 1호선 | 동두천 | 2 | 신창비바페밀리아파트 |
8 | 코레일 | 1호선 | 보산 | 1 | 보산초등학교 |
9 | 코레일 | 1호선 | 보산 | 1 | 보영여자고등학교 |
철도운영기관명 | 선명 | 역명 | 출구번호 | 출구별 주요시설명 | |
---|---|---|---|---|---|
1115 | 코레일 | 1호선 | 동인천 | 2 | 우리은행 |
1116 | 코레일 | 1호선 | 동인천 | 3 | 축현파출소 |
1117 | 코레일 | 1호선 | 동인천 | 4 | 송현동 |
1118 | 코레일 | 1호선 | 동인천 | 4 | 화수동 |
1119 | 코레일 | 1호선 | 인천 | 1 | 중구청 |
1120 | 코레일 | 1호선 | 인천 | 1 | 연안부두 |
1121 | 코레일 | 1호선 | 인천 | 1 | 월미도 |
1122 | 코레일 | 1호선 | 인천 | 1 | 인천광역시종합관광안내소 |
1123 | 코레일 | 1호선 | 인천 | 1 | 자유공원 |
1124 | 코레일 | 1호선 | 인천 | 1 | 화교거리 |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 출구번호 | 출구별 주요시설명 | # duplicates | |
---|---|---|---|---|---|---|
0 | 서울교통공사 | 1호선 | 시청 | 4 | 서울글로벌센터 | 2 |
1 | 코레일 | 1호선 | 간석 | 2 | 인천남고등학교 | 2 |