Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 1513 |
Missing cells | 1263 |
Missing cells (%) | 13.9% |
Duplicate rows | 12 |
Duplicate rows (%) | 0.8% |
Total size in memory | 71.1 KiB |
Average record size in memory | 48.1 B |
Variable types
Categorical | 4 |
---|---|
Text | 2 |
Dataset
Description | 수도권2호선에 포함된 도시광역철도역들의 철도운영기관명,선명,역명,출구번호,출구별 주요시설명, 주소 등의 데이터 입니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15073461/fileData.do |
철도운영기관명 has constant value "" | Constant |
선명 has constant value "" | Constant |
Dataset has 12 (0.8%) duplicate rows | Duplicates |
주소 has 1263 (83.5%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 00:17:07.387220 |
---|---|
Analysis finished | 2023-12-12 00:17:07.953229 |
Duration | 0.57 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.9 KiB |
서울교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 1513 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 1513 |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.9 KiB |
2호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2호선 |
---|---|
2nd row | 2호선 |
3rd row | 2호선 |
4th row | 2호선 |
5th row | 2호선 |
Common Values
Value | Count | Frequency (%) |
2호선 | 1513 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2호선 | 1513 |
역명
Categorical
Distinct | 41 |
---|---|
Distinct (%) | 2.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.9 KiB |
서울대입구(관악구청) | 69 |
---|---|
사당 | 66 |
을지로입구 | 63 |
성수 | 62 |
을지로3가 | 56 |
Other values (36) |
Length
Max length | 11 |
---|---|
Median length | 10 |
Mean length | 4.5459352 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강남 |
---|---|
2nd row | 강남 |
3rd row | 강남 |
4th row | 강남 |
5th row | 강남 |
Common Values
Value | Count | Frequency (%) |
서울대입구(관악구청) | 69 | 4.6% |
사당 | 66 | 4.4% |
을지로입구 | 63 | 4.2% |
성수 | 62 | 4.1% |
을지로3가 | 56 | 3.7% |
대림(구로구청) | 52 | 3.4% |
신당 | 49 | 3.2% |
강남 | 49 | 3.2% |
교대(법원·검찰청) | 48 | 3.2% |
선릉 | 48 | 3.2% |
Other values (31) | 951 |
Length
Value | Count | Frequency (%) |
서울대입구(관악구청 | 69 | 4.6% |
사당 | 66 | 4.4% |
을지로입구 | 63 | 4.2% |
성수 | 62 | 4.1% |
을지로3가 | 56 | 3.7% |
대림(구로구청 | 52 | 3.4% |
신당 | 49 | 3.2% |
강남 | 49 | 3.2% |
교대(법원·검찰청 | 48 | 3.2% |
선릉 | 48 | 3.2% |
Other values (31) | 951 |
출구번호
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.9 KiB |
1 | |
---|---|
4 | |
3 | |
2 | |
5 | |
Other values (12) |
Length
Max length | 3 |
---|---|
Median length | 1 |
Mean length | 1.0938533 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 223 | |
4 | 219 | |
3 | 212 | |
2 | 179 | |
5 | 144 | |
6 | 121 | |
7 | 116 | |
8 | 105 | |
9 | 56 | 3.7% |
10 | 45 | 3.0% |
Other values (7) | 93 |
Length
Value | Count | Frequency (%) |
1 | 223 | |
4 | 219 | |
3 | 212 | |
2 | 179 | |
5 | 144 | |
6 | 121 | |
7 | 116 | |
8 | 105 | |
9 | 56 | 3.7% |
10 | 45 | 3.0% |
Other values (7) | 93 |
출구별 주요시설명
Text
Distinct | 1236 |
---|---|
Distinct (%) | 81.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.9 KiB |
Value | Count | Frequency (%) |
국민은행 | 13 | 0.8% |
우리은행 | 12 | 0.7% |
기업은행 | 10 | 0.6% |
신한은행 | 9 | 0.6% |
우체국 | 8 | 0.5% |
농협 | 7 | 0.4% |
현대아파트 | 7 | 0.4% |
외환은행 | 7 | 0.4% |
주민센터 | 7 | 0.4% |
우성아파트 | 6 | 0.4% |
Other values (1262) | 1519 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 264 | 2.9% |
교 | 255 | 2.8% |
아 | 224 | 2.4% |
학 | 221 | 2.4% |
서 | 216 | 2.3% |
파 | 203 | 2.2% |
트 | 180 | 2.0% |
대 | 162 | 1.8% |
원 | 142 | 1.5% |
국 | 141 | 1.5% |
Other values (427) | 7197 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8773 | |
Decimal Number | 124 | 1.3% |
Uppercase Letter | 119 | 1.3% |
Space Separator | 92 | 1.0% |
Close Punctuation | 47 | 0.5% |
Open Punctuation | 47 | 0.5% |
Other Punctuation | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 264 | 3.0% |
교 | 255 | 2.9% |
아 | 224 | 2.6% |
학 | 221 | 2.5% |
서 | 216 | 2.5% |
파 | 203 | 2.3% |
트 | 180 | 2.1% |
대 | 162 | 1.8% |
원 | 142 | 1.6% |
국 | 141 | 1.6% |
Other values (394) | 6765 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 16 | |
G | 13 | |
C | 12 | |
S | 12 | |
L | 10 | |
T | 10 | |
A | 7 | 5.9% |
Y | 6 | 5.0% |
M | 6 | 5.0% |
P | 5 | 4.2% |
Other values (9) | 22 |
Decimal Number
Value | Count | Frequency (%) |
1 | 46 | |
2 | 21 | |
3 | 17 | 13.7% |
4 | 11 | 8.9% |
5 | 9 | 7.3% |
6 | 9 | 7.3% |
7 | 4 | 3.2% |
9 | 3 | 2.4% |
8 | 2 | 1.6% |
0 | 2 | 1.6% |
Space Separator
Value | Count | Frequency (%) |
92 |
Close Punctuation
Value | Count | Frequency (%) |
) | 47 |
Open Punctuation
Value | Count | Frequency (%) |
( | 47 |
Other Punctuation
Value | Count | Frequency (%) |
. | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8773 | |
Common | 313 | 3.4% |
Latin | 119 | 1.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 264 | 3.0% |
교 | 255 | 2.9% |
아 | 224 | 2.6% |
학 | 221 | 2.5% |
서 | 216 | 2.5% |
파 | 203 | 2.3% |
트 | 180 | 2.1% |
대 | 162 | 1.8% |
원 | 142 | 1.6% |
국 | 141 | 1.6% |
Other values (394) | 6765 |
Latin
Value | Count | Frequency (%) |
K | 16 | |
G | 13 | |
C | 12 | |
S | 12 | |
L | 10 | |
T | 10 | |
A | 7 | 5.9% |
Y | 6 | 5.0% |
M | 6 | 5.0% |
P | 5 | 4.2% |
Other values (9) | 22 |
Common
Value | Count | Frequency (%) |
92 | ||
) | 47 | |
( | 47 | |
1 | 46 | |
2 | 21 | 6.7% |
3 | 17 | 5.4% |
4 | 11 | 3.5% |
5 | 9 | 2.9% |
6 | 9 | 2.9% |
7 | 4 | 1.3% |
Other values (4) | 10 | 3.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8773 | |
ASCII | 432 | 4.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 264 | 3.0% |
교 | 255 | 2.9% |
아 | 224 | 2.6% |
학 | 221 | 2.5% |
서 | 216 | 2.5% |
파 | 203 | 2.3% |
트 | 180 | 2.1% |
대 | 162 | 1.8% |
원 | 142 | 1.6% |
국 | 141 | 1.6% |
Other values (394) | 6765 |
ASCII
Value | Count | Frequency (%) |
92 | ||
) | 47 | |
( | 47 | |
1 | 46 | |
2 | 21 | 4.9% |
3 | 17 | 3.9% |
K | 16 | 3.7% |
G | 13 | 3.0% |
C | 12 | 2.8% |
S | 12 | 2.8% |
Other values (23) | 109 |
주소
Text
MISSING
 
Distinct | 210 |
---|---|
Distinct (%) | 84.0% |
Missing | 1263 |
Missing (%) | 83.5% |
Memory size | 11.9 KiB |
Length
Max length | 28 |
---|---|
Median length | 24 |
Mean length | 18.296 |
Min length | 13 |
Characters and Unicode
Total characters | 4574 |
---|---|
Distinct characters | 174 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 179 ? |
---|---|
Unique (%) | 71.6% |
Sample
1st row | 서울특별시 강남구 테헤란로 114 |
---|---|
2nd row | 서울특별시 서초구 서초대로 308 |
3rd row | 서울특별시 서초구 서초대로 305 |
4th row | 서울특별시 서초구 서초대로65길 13-10 |
5th row | 서울특별시 서초구 서초중앙로24길 43 |
Value | Count | Frequency (%) |
서울특별시 | 250 | |
영등포구 | 34 | 3.4% |
중구 | 34 | 3.4% |
서초구 | 31 | 3.1% |
강남구 | 29 | 2.9% |
송파구 | 27 | 2.7% |
성동구 | 26 | 2.6% |
관악구 | 23 | 2.3% |
광진구 | 15 | 1.5% |
마포구 | 13 | 1.3% |
Other values (313) | 516 |
Most occurring characters
Value | Count | Frequency (%) |
750 | ||
서 | 304 | 6.6% |
구 | 258 | 5.6% |
시 | 253 | 5.5% |
울 | 251 | 5.5% |
특 | 250 | 5.5% |
별 | 250 | 5.5% |
로 | 227 | 5.0% |
1 | 157 | 3.4% |
3 | 105 | 2.3% |
Other values (164) | 1769 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3049 | |
Space Separator | 750 | 16.4% |
Decimal Number | 745 | 16.3% |
Dash Punctuation | 17 | 0.4% |
Uppercase Letter | 13 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 304 | 10.0% |
구 | 258 | 8.5% |
시 | 253 | 8.3% |
울 | 251 | 8.2% |
특 | 250 | 8.2% |
별 | 250 | 8.2% |
로 | 227 | 7.4% |
길 | 84 | 2.8% |
동 | 63 | 2.1% |
포 | 54 | 1.8% |
Other values (144) | 1055 |
Decimal Number
Value | Count | Frequency (%) |
1 | 157 | |
3 | 105 | |
2 | 103 | |
6 | 68 | |
4 | 65 | |
0 | 55 | 7.4% |
7 | 54 | 7.2% |
9 | 53 | 7.1% |
5 | 52 | 7.0% |
8 | 33 | 4.4% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 3 | |
O | 2 | |
T | 2 | |
K | 2 | |
P | 1 | 7.7% |
W | 1 | 7.7% |
E | 1 | 7.7% |
R | 1 | 7.7% |
Space Separator
Value | Count | Frequency (%) |
750 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 17 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3049 | |
Common | 1512 | |
Latin | 13 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 304 | 10.0% |
구 | 258 | 8.5% |
시 | 253 | 8.3% |
울 | 251 | 8.2% |
특 | 250 | 8.2% |
별 | 250 | 8.2% |
로 | 227 | 7.4% |
길 | 84 | 2.8% |
동 | 63 | 2.1% |
포 | 54 | 1.8% |
Other values (144) | 1055 |
Common
Value | Count | Frequency (%) |
750 | ||
1 | 157 | 10.4% |
3 | 105 | 6.9% |
2 | 103 | 6.8% |
6 | 68 | 4.5% |
4 | 65 | 4.3% |
0 | 55 | 3.6% |
7 | 54 | 3.6% |
9 | 53 | 3.5% |
5 | 52 | 3.4% |
Other values (2) | 50 | 3.3% |
Latin
Value | Count | Frequency (%) |
S | 3 | |
O | 2 | |
T | 2 | |
K | 2 | |
P | 1 | 7.7% |
W | 1 | 7.7% |
E | 1 | 7.7% |
R | 1 | 7.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3049 | |
ASCII | 1525 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
750 | ||
1 | 157 | 10.3% |
3 | 105 | 6.9% |
2 | 103 | 6.8% |
6 | 68 | 4.5% |
4 | 65 | 4.3% |
0 | 55 | 3.6% |
7 | 54 | 3.5% |
9 | 53 | 3.5% |
5 | 52 | 3.4% |
Other values (10) | 63 | 4.1% |
Hangul
Value | Count | Frequency (%) |
서 | 304 | 10.0% |
구 | 258 | 8.5% |
시 | 253 | 8.3% |
울 | 251 | 8.2% |
특 | 250 | 8.2% |
별 | 250 | 8.2% |
로 | 227 | 7.4% |
길 | 84 | 2.8% |
동 | 63 | 2.1% |
포 | 54 | 1.8% |
Other values (144) | 1055 |
역명 | 출구번호 | |
---|---|---|
역명 | 1.000 | 0.614 |
출구번호 | 0.614 | 1.000 |
출구번호 | 역명 | |
---|---|---|
출구번호 | 1.000 | 0.208 |
역명 | 0.208 | 1.000 |
역명 | 출구번호 | |
---|---|---|
역명 | 1.000 | 0.208 |
출구번호 | 0.208 | 1.000 |
철도운영기관명 | 선명 | 역명 | 출구번호 | 출구별 주요시설명 | 주소 | |
---|---|---|---|---|---|---|
0 | 서울교통공사 | 2호선 | 강남 | 1 | 국민건강보험강남지사 | <NA> |
1 | 서울교통공사 | 2호선 | 강남 | 1 | 국세종합상담센터 | <NA> |
2 | 서울교통공사 | 2호선 | 강남 | 1 | 삼성세무서 | 서울특별시 강남구 테헤란로 114 |
3 | 서울교통공사 | 2호선 | 강남 | 1 | 서초 | <NA> |
4 | 서울교통공사 | 2호선 | 강남 | 1 | 역삼 | <NA> |
5 | 서울교통공사 | 2호선 | 강남 | 1 | 테헤란빌딩 | <NA> |
6 | 서울교통공사 | 2호선 | 강남 | 1 | 캠브리지빌딩 | <NA> |
7 | 서울교통공사 | 2호선 | 강남 | 1 | 특허청서울사무소 | <NA> |
8 | 서울교통공사 | 2호선 | 강남 | 2 | 메리츠타워 | <NA> |
9 | 서울교통공사 | 2호선 | 강남 | 2 | 푸르덴셜타워 | <NA> |
철도운영기관명 | 선명 | 역명 | 출구번호 | 출구별 주요시설명 | 주소 | |
---|---|---|---|---|---|---|
1503 | 서울교통공사 | 2호선 | 을지로입구 | 8 | 서울플라자호텔 | <NA> |
1504 | 서울교통공사 | 2호선 | 을지로입구 | 8 | 프레지던트호텔 | <NA> |
1505 | 서울교통공사 | 2호선 | 이대 | 1 | 신촌우체국 | <NA> |
1506 | 서울교통공사 | 2호선 | 이대 | 2 | 이화여대 | <NA> |
1507 | 서울교통공사 | 2호선 | 이대 | 2 | 이대사회복지관 | <NA> |
1508 | 서울교통공사 | 2호선 | 이대 | 3 | 이화여대 | <NA> |
1509 | 서울교통공사 | 2호선 | 이대 | 3 | 서부교육청 | <NA> |
1510 | 서울교통공사 | 2호선 | 이대 | 3 | 대신초등학교 | <NA> |
1511 | 서울교통공사 | 2호선 | 이대 | 3 | 서울과학종합대학원대학교 | 서울특별시 서대문구 이화여대2길 46 |
1512 | 서울교통공사 | 2호선 | 이대 | 4 | 북성초등학교 | <NA> |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 출구번호 | 출구별 주요시설명 | 주소 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 2호선 | 강남 | 10 | 교보타워 | <NA> | 2 |
1 | 서울교통공사 | 2호선 | 강남 | 10 | 한남대교방면 | <NA> | 2 |
2 | 서울교통공사 | 2호선 | 강변(동서울터미널) | 4 | 서울광진학교 | <NA> | 2 |
3 | 서울교통공사 | 2호선 | 건대입구 | 5 | 동자초등학교 | <NA> | 2 |
4 | 서울교통공사 | 2호선 | 건대입구 | 5 | 신양초등학교 | <NA> | 2 |
5 | 서울교통공사 | 2호선 | 방배 | 2 | 경남아파트 | <NA> | 2 |
6 | 서울교통공사 | 2호선 | 사당 | 1 | 예술의전당방면 | <NA> | 2 |
7 | 서울교통공사 | 2호선 | 잠실나루 | 2 | 진주아파트 | <NA> | 2 |
8 | 서울교통공사 | 2호선 | 잠실나루 | 3 | 잠동초등학교 | <NA> | 2 |
9 | 서울교통공사 | 2호선 | 잠실나루 | 3 | 장미아파트 | <NA> | 2 |