Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 26 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.3 KiB |
Average record size in memory | 89.1 B |
Variable types
Categorical | 8 |
---|---|
Text | 2 |
Dataset
Description | 수도권6호선에 포함된 도시광역철도역들의 철도운영기관명, 선명, 역명, 휠체어리프트의 관리번호, 출입구번호, 상세위치, 길이, 폭, 시작층, 종료층의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041433/fileData.do |
철도운영기관명 has constant value "" | Constant |
선명 has constant value "" | Constant |
길이 has constant value "" | Constant |
폭 is highly overall correlated with 출입구번호 | High correlation |
종료층 is highly overall correlated with 출입구번호 and 1 other fields | High correlation |
시작층 is highly overall correlated with 출입구번호 and 1 other fields | High correlation |
출입구번호 is highly overall correlated with 휠체어리프트의 관리번호 and 3 other fields | High correlation |
휠체어리프트의 관리번호 is highly overall correlated with 출입구번호 | High correlation |
출입구번호 is highly imbalanced (55.4%) | Imbalance |
폭 is highly imbalanced (76.5%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 15:02:28.586846 |
---|---|
Analysis finished | 2023-12-12 15:02:29.493614 |
Duration | 0.91 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
서울교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 26 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 26 |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
6호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 6호선 |
---|---|
2nd row | 6호선 |
3rd row | 6호선 |
4th row | 6호선 |
5th row | 6호선 |
Common Values
Value | Count | Frequency (%) |
6호선 | 26 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
6호선 | 26 |
역명
Text
Distinct | 14 |
---|---|
Distinct (%) | 53.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
Value | Count | Frequency (%) |
신당 | 5 | |
디지털미디어시티 | 3 | |
불광 | 2 | 7.7% |
삼각지 | 2 | 7.7% |
상월곡(한국과학기술연구원 | 2 | 7.7% |
석계 | 2 | 7.7% |
봉화산(서울의료원 | 2 | 7.7% |
동묘앞 | 2 | 7.7% |
구산 | 1 | 3.8% |
새절(신사 | 1 | 3.8% |
Other values (4) | 4 |
Most occurring characters
Value | Count | Frequency (%) |
( | 8 | 5.9% |
) | 8 | 5.9% |
신 | 6 | 4.4% |
디 | 6 | 4.4% |
지 | 5 | 3.7% |
당 | 5 | 3.7% |
서 | 4 | 3.0% |
원 | 4 | 3.0% |
티 | 3 | 2.2% |
광 | 3 | 2.2% |
Other values (40) | 83 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 119 | |
Open Punctuation | 8 | 5.9% |
Close Punctuation | 8 | 5.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
신 | 6 | 5.0% |
디 | 6 | 5.0% |
지 | 5 | 4.2% |
당 | 5 | 4.2% |
서 | 4 | 3.4% |
원 | 4 | 3.4% |
티 | 3 | 2.5% |
광 | 3 | 2.5% |
대 | 3 | 2.5% |
산 | 3 | 2.5% |
Other values (38) | 77 |
Open Punctuation
Value | Count | Frequency (%) |
( | 8 |
Close Punctuation
Value | Count | Frequency (%) |
) | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 119 | |
Common | 16 | 11.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
신 | 6 | 5.0% |
디 | 6 | 5.0% |
지 | 5 | 4.2% |
당 | 5 | 4.2% |
서 | 4 | 3.4% |
원 | 4 | 3.4% |
티 | 3 | 2.5% |
광 | 3 | 2.5% |
대 | 3 | 2.5% |
산 | 3 | 2.5% |
Other values (38) | 77 |
Common
Value | Count | Frequency (%) |
( | 8 | |
) | 8 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 119 | |
ASCII | 16 | 11.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 8 | |
) | 8 |
Hangul
Value | Count | Frequency (%) |
신 | 6 | 5.0% |
디 | 6 | 5.0% |
지 | 5 | 4.2% |
당 | 5 | 4.2% |
서 | 4 | 3.4% |
원 | 4 | 3.4% |
티 | 3 | 2.5% |
광 | 3 | 2.5% |
대 | 3 | 2.5% |
산 | 3 | 2.5% |
Other values (38) | 77 |
휠체어리프트의 관리번호
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 19.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
1 | |
---|---|
2 | |
3 | |
4 | 1 |
5 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 7.7% |
Sample
1st row | 1 |
---|---|
2nd row | 2 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 14 | |
2 | 8 | |
3 | 2 | 7.7% |
4 | 1 | 3.8% |
5 | 1 | 3.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 14 | |
2 | 8 | |
3 | 2 | 7.7% |
4 | 1 | 3.8% |
5 | 1 | 3.8% |
출입구번호
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 23.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
<NA> | |
---|---|
3 | 1 |
2 | 1 |
7 | 1 |
9 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.4230769 |
Min length | 1 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 19.2% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 21 | |
3 | 1 | 3.8% |
2 | 1 | 3.8% |
7 | 1 | 3.8% |
9 | 1 | 3.8% |
5 | 1 | 3.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 21 | |
3 | 1 | 3.8% |
2 | 1 | 3.8% |
7 | 1 | 3.8% |
9 | 1 | 3.8% |
5 | 1 | 3.8% |
상세위치
Text
Distinct | 25 |
---|---|
Distinct (%) | 96.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
Length
Max length | 30 |
---|---|
Median length | 22 |
Mean length | 20.769231 |
Min length | 14 |
Characters and Unicode
Total characters | 540 |
---|---|
Distinct characters | 56 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 24 ? |
---|---|
Unique (%) | 92.3% |
Sample
1st row | (B1)종점3환승통로(B4-B1)-종3가측 |
---|---|
2nd row | (B1)시점3환승통로(B2-B1)-연신내측 |
3rd row | (B2)승-대(B4-B1) |
4th row | (B1)하선 승/시-대(B2-B1) |
5th row | (B2)공항철도 환승 상선 승/종-대(B2-B1) |
Value | Count | Frequency (%) |
환승 | 6 | 11.3% |
b1)대-대(b2-b1 | 2 | 3.8% |
대(b3-b2 | 2 | 3.8% |
시/승-대(b3-b2 | 2 | 3.8% |
b2)1호선 | 2 | 3.8% |
시/승 | 2 | 3.8% |
2 | 3.8% | |
b1)2호선 | 2 | 3.8% |
하선 | 2 | 3.8% |
승/종-대(b2-b1 | 2 | 3.8% |
Other values (27) | 29 |
Most occurring characters
Value | Count | Frequency (%) |
B | 68 | |
( | 60 | |
) | 60 | |
- | 44 | 8.1% |
1 | 42 | 7.8% |
2 | 30 | 5.6% |
27 | 5.0% | |
승 | 25 | 4.6% |
대 | 23 | 4.3% |
3 | 13 | 2.4% |
Other values (46) | 148 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 170 | |
Decimal Number | 92 | |
Uppercase Letter | 77 | |
Open Punctuation | 60 | 11.1% |
Close Punctuation | 60 | 11.1% |
Dash Punctuation | 44 | 8.1% |
Space Separator | 27 | 5.0% |
Other Punctuation | 10 | 1.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
승 | 25 | 14.7% |
대 | 23 | 13.5% |
환 | 11 | 6.5% |
선 | 10 | 5.9% |
종 | 8 | 4.7% |
시 | 7 | 4.1% |
향 | 5 | 2.9% |
호 | 5 | 2.9% |
방 | 5 | 2.9% |
입 | 4 | 2.4% |
Other values (33) | 67 |
Decimal Number
Value | Count | Frequency (%) |
1 | 42 | |
2 | 30 | |
3 | 13 | 14.1% |
4 | 4 | 4.3% |
5 | 2 | 2.2% |
9 | 1 | 1.1% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 68 | |
F | 9 | 11.7% |
Open Punctuation
Value | Count | Frequency (%) |
( | 60 |
Close Punctuation
Value | Count | Frequency (%) |
) | 60 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 44 |
Space Separator
Value | Count | Frequency (%) |
27 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 293 | |
Hangul | 170 | |
Latin | 77 | 14.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
승 | 25 | 14.7% |
대 | 23 | 13.5% |
환 | 11 | 6.5% |
선 | 10 | 5.9% |
종 | 8 | 4.7% |
시 | 7 | 4.1% |
향 | 5 | 2.9% |
호 | 5 | 2.9% |
방 | 5 | 2.9% |
입 | 4 | 2.4% |
Other values (33) | 67 |
Common
Value | Count | Frequency (%) |
( | 60 | |
) | 60 | |
- | 44 | |
1 | 42 | |
2 | 30 | |
27 | ||
3 | 13 | 4.4% |
/ | 10 | 3.4% |
4 | 4 | 1.4% |
5 | 2 | 0.7% |
Latin
Value | Count | Frequency (%) |
B | 68 | |
F | 9 | 11.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 370 | |
Hangul | 170 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
B | 68 | |
( | 60 | |
) | 60 | |
- | 44 | |
1 | 42 | |
2 | 30 | |
27 | 7.3% | |
3 | 13 | 3.5% |
/ | 10 | 2.7% |
F | 9 | 2.4% |
Other values (3) | 7 | 1.9% |
Hangul
Value | Count | Frequency (%) |
승 | 25 | 14.7% |
대 | 23 | 13.5% |
환 | 11 | 6.5% |
선 | 10 | 5.9% |
종 | 8 | 4.7% |
시 | 7 | 4.1% |
향 | 5 | 2.9% |
호 | 5 | 2.9% |
방 | 5 | 2.9% |
입 | 4 | 2.4% |
Other values (33) | 67 |
길이
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
125 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 125 |
---|---|
2nd row | 125 |
3rd row | 125 |
4th row | 125 |
5th row | 125 |
Common Values
Value | Count | Frequency (%) |
125 | 26 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
125 | 26 |
폭
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 7.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
80 | |
---|---|
90 | 1 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 3.8% |
Sample
1st row | 80 |
---|---|
2nd row | 80 |
3rd row | 80 |
4th row | 80 |
5th row | 80 |
Common Values
Value | Count | Frequency (%) |
80 | 25 | |
90 | 1 | 3.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
80 | 25 | |
90 | 1 | 3.8% |
시작층
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 15.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
지하1 | |
---|---|
지하2 | |
지상1 | |
지하3 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 3.8% |
Sample
1st row | 지하1 |
---|---|
2nd row | 지하1 |
3rd row | 지하2 |
4th row | 지하1 |
5th row | 지하2 |
Common Values
Value | Count | Frequency (%) |
지하1 | 12 | |
지하2 | 8 | |
지상1 | 5 | |
지하3 | 1 | 3.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하1 | 12 | |
지하2 | 8 | |
지상1 | 5 | |
지하3 | 1 | 3.8% |
종료층
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 15.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 340.0 B |
지하2 | |
---|---|
지하3 | |
지하1 | |
지하4 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 3.8% |
Sample
1st row | 지하2 |
---|---|
2nd row | 지하2 |
3rd row | 지하3 |
4th row | 지하2 |
5th row | 지하3 |
Common Values
Value | Count | Frequency (%) |
지하2 | 11 | |
지하3 | 9 | |
지하1 | 5 | |
지하4 | 1 | 3.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하2 | 11 | |
지하3 | 9 | |
지하1 | 5 | |
지하4 | 1 | 3.8% |
역명 | 휠체어리프트의 관리번호 | 출입구번호 | 상세위치 | 폭 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|
역명 | 1.000 | 0.000 | 1.000 | 0.872 | 1.000 | 0.445 | 0.645 |
휠체어리프트의 관리번호 | 0.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.084 |
출입구번호 | 1.000 | 1.000 | 1.000 | 1.000 | NaN | NaN | 1.000 |
상세위치 | 0.872 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
폭 | 1.000 | 0.000 | NaN | 1.000 | 1.000 | 0.000 | 0.000 |
시작층 | 0.445 | 0.000 | NaN | 1.000 | 0.000 | 1.000 | 0.936 |
종료층 | 0.645 | 0.084 | 1.000 | 1.000 | 0.000 | 0.936 | 1.000 |
폭 | 종료층 | 시작층 | 출입구번호 | 휠체어리프트의 관리번호 | |
---|---|---|---|---|---|
폭 | 1.000 | 0.000 | 0.000 | 1.000 | 0.000 |
종료층 | 0.000 | 1.000 | 0.662 | 1.000 | 0.000 |
시작층 | 0.000 | 0.662 | 1.000 | 1.000 | 0.000 |
출입구번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
휠체어리프트의 관리번호 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 |
휠체어리프트의 관리번호 | 출입구번호 | 폭 | 시작층 | 종료층 | |
---|---|---|---|---|---|
휠체어리프트의 관리번호 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
출입구번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
폭 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 |
시작층 | 0.000 | 1.000 | 0.000 | 1.000 | 0.662 |
종료층 | 0.000 | 1.000 | 0.000 | 0.662 | 1.000 |
철도운영기관명 | 선명 | 역명 | 휠체어리프트의 관리번호 | 출입구번호 | 상세위치 | 길이 | 폭 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 6호선 | 불광 | 1 | <NA> | (B1)종점3환승통로(B4-B1)-종3가측 | 125 | 80 | 지하1 | 지하2 |
1 | 서울교통공사 | 6호선 | 불광 | 2 | <NA> | (B1)시점3환승통로(B2-B1)-연신내측 | 125 | 80 | 지하1 | 지하2 |
2 | 서울교통공사 | 6호선 | 구산 | 1 | <NA> | (B2)승-대(B4-B1) | 125 | 80 | 지하2 | 지하3 |
3 | 서울교통공사 | 6호선 | 새절(신사) | 1 | <NA> | (B1)하선 승/시-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
4 | 서울교통공사 | 6호선 | 디지털미디어시티 | 1 | <NA> | (B2)공항철도 환승 상선 승/종-대(B2-B1) | 125 | 80 | 지하2 | 지하3 |
5 | 서울교통공사 | 6호선 | 디지털미디어시티 | 2 | <NA> | (B3)공항철도 환승 하선 승/종-대(B2-B1) | 125 | 80 | 지하3 | 지하3 |
6 | 서울교통공사 | 6호선 | 디지털미디어시티 | 3 | 3 | (F1)3출입구(종점측)(B1-F1) | 125 | 80 | 지상1 | 지하2 |
7 | 서울교통공사 | 6호선 | 합정 | 1 | <NA> | (B2)대합실-대합실 (B1층) | 125 | 90 | 지하2 | 지하3 |
8 | 서울교통공사 | 6호선 | 광흥창(서강) | 1 | <NA> | (B2)승/종-대(B3-B2) | 125 | 80 | 지하2 | 지하3 |
9 | 서울교통공사 | 6호선 | 대흥(서강대앞) | 1 | 2 | (F1)2번 출입구(B1-1F) | 125 | 80 | 지상1 | 지하1 |
철도운영기관명 | 선명 | 역명 | 휠체어리프트의 관리번호 | 출입구번호 | 상세위치 | 길이 | 폭 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|---|---|---|
16 | 서울교통공사 | 6호선 | 신당 | 5 | 9 | (F1)9번출입구(B1-F1) | 125 | 80 | 지상1 | 지하1 |
17 | 서울교통공사 | 6호선 | 월곡(동덕여대) | 1 | <NA> | (B1)대-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
18 | 서울교통공사 | 6호선 | 상월곡(한국과학기술연구원) | 1 | <NA> | (B2)월곡방향 시/승-대(B3-B2) | 125 | 80 | 지하2 | 지하3 |
19 | 서울교통공사 | 6호선 | 상월곡(한국과학기술연구원) | 2 | <NA> | (B2)돌곶이방향 시/승-대(B3-B2) | 125 | 80 | 지하2 | 지하3 |
20 | 서울교통공사 | 6호선 | 석계 | 1 | <NA> | (B2)1호선 환승 상선 시/승 - 대(B3-B2) | 125 | 80 | 지하2 | 지하3 |
21 | 서울교통공사 | 6호선 | 석계 | 2 | <NA> | (B2)1호선 환승 하선 시/승 - 대(B3-B2) | 125 | 80 | 지하2 | 지하3 |
22 | 서울교통공사 | 6호선 | 봉화산(서울의료원) | 1 | <NA> | (B1)화랑대방향 종/승-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
23 | 서울교통공사 | 6호선 | 봉화산(서울의료원) | 2 | <NA> | (B1)신내방향 종/승-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
24 | 서울교통공사 | 6호선 | 동묘앞 | 1 | <NA> | (B1)대-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
25 | 서울교통공사 | 6호선 | 동묘앞 | 2 | 5 | (F1)5출입구(B1-F1) | 125 | 80 | 지상1 | 지하1 |