Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 40 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.4 KiB |
Average record size in memory | 87.3 B |
Variable types
Categorical | 8 |
---|---|
Numeric | 1 |
Text | 1 |
Dataset
Description | 수도권7호선에 포함된 도시광역철도역들의 철도운영기관명, 선명, 역명, 휠체어리프트의 관리번호, 출입구번호, 상세위치, 길이, 폭, 시작층, 종료층의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041434/fileData.do |
철도운영기관명 has constant value "" | Constant |
선명 has constant value "" | Constant |
길이 has constant value "" | Constant |
폭 has constant value "" | Constant |
종료층 is highly overall correlated with 역명 and 2 other fields | High correlation |
출입구번호 is highly overall correlated with 휠체어리프트의 관리번호 and 3 other fields | High correlation |
시작층 is highly overall correlated with 출입구번호 and 1 other fields | High correlation |
역명 is highly overall correlated with 출입구번호 and 1 other fields | High correlation |
휠체어리프트의 관리번호 is highly overall correlated with 출입구번호 | High correlation |
출입구번호 is highly imbalanced (67.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 18:07:41.824156 |
---|---|
Analysis finished | 2023-12-12 18:07:42.630446 |
Duration | 0.81 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
서울교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 40 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울교통공사 | 40 |
선명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
7호선 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 7호선 |
---|---|
2nd row | 7호선 |
3rd row | 7호선 |
4th row | 7호선 |
5th row | 7호선 |
Common Values
Value | Count | Frequency (%) |
7호선 | 40 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
7호선 | 40 |
역명
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 35.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
남구로 | |
---|---|
온수(성공회대입구) | |
고속터미널 | |
가산디지털단지 | |
건대입구 | |
Other values (9) |
Length
Max length | 11 |
---|---|
Median length | 9 |
Mean length | 5.25 |
Min length | 2 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 15.0% |
Sample
1st row | 수락산 |
---|---|
2nd row | 수락산 |
3rd row | 마들 |
4th row | 건대입구 |
5th row | 건대입구 |
Common Values
Value | Count | Frequency (%) |
남구로 | 11 | |
온수(성공회대입구) | 5 | |
고속터미널 | 4 | 10.0% |
가산디지털단지 | 4 | 10.0% |
건대입구 | 3 | 7.5% |
총신대입구(이수) | 3 | 7.5% |
수락산 | 2 | 5.0% |
청담 | 2 | 5.0% |
마들 | 1 | 2.5% |
논현 | 1 | 2.5% |
Other values (4) | 4 | 10.0% |
Length
Value | Count | Frequency (%) |
남구로 | 11 | |
온수(성공회대입구 | 5 | |
고속터미널 | 4 | 10.0% |
가산디지털단지 | 4 | 10.0% |
건대입구 | 3 | 7.5% |
총신대입구(이수 | 3 | 7.5% |
수락산 | 2 | 5.0% |
청담 | 2 | 5.0% |
마들 | 1 | 2.5% |
논현 | 1 | 2.5% |
Other values (4) | 4 | 10.0% |
휠체어리프트의 관리번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 27.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.125 |
Minimum | 1 |
---|---|
Maximum | 11 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 492.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 4 |
95-th percentile | 9.05 |
Maximum | 11 |
Range | 10 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.6524058 |
---|---|
Coefficient of variation (CV) | 0.84876985 |
Kurtosis | 1.8639137 |
Mean | 3.125 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.5679554 |
Sum | 125 |
Variance | 7.0352564 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 14 | |
2 | 8 | |
3 | 6 | |
4 | 4 | 10.0% |
5 | 2 | 5.0% |
6 | 1 | 2.5% |
7 | 1 | 2.5% |
8 | 1 | 2.5% |
9 | 1 | 2.5% |
10 | 1 | 2.5% |
Value | Count | Frequency (%) |
1 | 14 | |
2 | 8 | |
3 | 6 | |
4 | 4 | 10.0% |
5 | 2 | 5.0% |
6 | 1 | 2.5% |
7 | 1 | 2.5% |
8 | 1 | 2.5% |
9 | 1 | 2.5% |
10 | 1 | 2.5% |
Value | Count | Frequency (%) |
11 | 1 | 2.5% |
10 | 1 | 2.5% |
9 | 1 | 2.5% |
8 | 1 | 2.5% |
7 | 1 | 2.5% |
6 | 1 | 2.5% |
5 | 2 | 5.0% |
4 | 4 | |
3 | 6 | |
2 | 8 |
출입구번호
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 15.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
<NA> | |
---|---|
3 | 1 |
2 | 1 |
1 | 1 |
4 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.625 |
Min length | 1 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 12.5% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 35 | |
3 | 1 | 2.5% |
2 | 1 | 2.5% |
1 | 1 | 2.5% |
4 | 1 | 2.5% |
6 | 1 | 2.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 35 | |
3 | 1 | 2.5% |
2 | 1 | 2.5% |
1 | 1 | 2.5% |
4 | 1 | 2.5% |
6 | 1 | 2.5% |
상세위치
Text
Distinct | 38 |
---|---|
Distinct (%) | 95.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
Length
Max length | 26 |
---|---|
Median length | 22.5 |
Mean length | 19.45 |
Min length | 8 |
Characters and Unicode
Total characters | 778 |
---|---|
Distinct characters | 70 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 36 ? |
---|---|
Unique (%) | 90.0% |
Sample
1st row | (B2)도봉산방향 시/승-대(B3-B2) |
---|---|
2nd row | (B2)마들방향 시/승-대(B3-B2) |
3rd row | (B1)대합실-대합실(B2-B1) |
4th row | (F2)2환승계단(E/S56호기)(B1-2F) |
5th row | (B1)3출구전 지하계단(B2-B1) |
Value | Count | Frequency (%) |
b5)대림방향 | 3 | 4.7% |
시/승-대(b2-b1 | 2 | 3.1% |
f2)국철환승 | 2 | 3.1% |
시/승-대(b5-b4 | 2 | 3.1% |
b1)시점측 | 2 | 3.1% |
대-대(b4-b2 | 2 | 3.1% |
b1)국철환승 | 2 | 3.1% |
시/승-대(b3-b2 | 2 | 3.1% |
종/승-대(b5-b4 | 2 | 3.1% |
승/종-대(b4-b3 | 2 | 3.1% |
Other values (42) | 43 |
Most occurring characters
Value | Count | Frequency (%) |
B | 92 | 11.8% |
( | 88 | 11.3% |
) | 87 | 11.2% |
- | 64 | 8.2% |
1 | 62 | 8.0% |
2 | 36 | 4.6% |
대 | 34 | 4.4% |
승 | 30 | 3.9% |
25 | 3.2% | |
F | 23 | 3.0% |
Other values (60) | 237 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 240 | |
Decimal Number | 139 | |
Uppercase Letter | 122 | |
Open Punctuation | 88 | 11.3% |
Close Punctuation | 87 | 11.2% |
Dash Punctuation | 64 | 8.2% |
Space Separator | 25 | 3.2% |
Other Punctuation | 13 | 1.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 34 | 14.2% |
승 | 30 | 12.5% |
시 | 12 | 5.0% |
구 | 11 | 4.6% |
환 | 11 | 4.6% |
출 | 9 | 3.8% |
단 | 8 | 3.3% |
향 | 8 | 3.3% |
방 | 8 | 3.3% |
입 | 7 | 2.9% |
Other values (43) | 102 |
Decimal Number
Value | Count | Frequency (%) |
1 | 62 | |
2 | 36 | |
4 | 16 | 11.5% |
3 | 11 | 7.9% |
5 | 10 | 7.2% |
6 | 3 | 2.2% |
9 | 1 | 0.7% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 92 | |
F | 23 | 18.9% |
M | 3 | 2.5% |
S | 2 | 1.6% |
E | 2 | 1.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 88 |
Close Punctuation
Value | Count | Frequency (%) |
) | 87 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 64 |
Space Separator
Value | Count | Frequency (%) |
25 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 13 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 416 | |
Hangul | 240 | |
Latin | 122 | 15.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 34 | 14.2% |
승 | 30 | 12.5% |
시 | 12 | 5.0% |
구 | 11 | 4.6% |
환 | 11 | 4.6% |
출 | 9 | 3.8% |
단 | 8 | 3.3% |
향 | 8 | 3.3% |
방 | 8 | 3.3% |
입 | 7 | 2.9% |
Other values (43) | 102 |
Common
Value | Count | Frequency (%) |
( | 88 | |
) | 87 | |
- | 64 | |
1 | 62 | |
2 | 36 | |
25 | 6.0% | |
4 | 16 | 3.8% |
/ | 13 | 3.1% |
3 | 11 | 2.6% |
5 | 10 | 2.4% |
Other values (2) | 4 | 1.0% |
Latin
Value | Count | Frequency (%) |
B | 92 | |
F | 23 | 18.9% |
M | 3 | 2.5% |
S | 2 | 1.6% |
E | 2 | 1.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 538 | |
Hangul | 240 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
B | 92 | |
( | 88 | |
) | 87 | |
- | 64 | |
1 | 62 | |
2 | 36 | 6.7% |
25 | 4.6% | |
F | 23 | 4.3% |
4 | 16 | 3.0% |
/ | 13 | 2.4% |
Other values (7) | 32 | 5.9% |
Hangul
Value | Count | Frequency (%) |
대 | 34 | 14.2% |
승 | 30 | 12.5% |
시 | 12 | 5.0% |
구 | 11 | 4.6% |
환 | 11 | 4.6% |
출 | 9 | 3.8% |
단 | 8 | 3.3% |
향 | 8 | 3.3% |
방 | 8 | 3.3% |
입 | 7 | 2.9% |
Other values (43) | 102 |
길이
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
125 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 125 |
---|---|
2nd row | 125 |
3rd row | 125 |
4th row | 125 |
5th row | 125 |
Common Values
Value | Count | Frequency (%) |
125 | 40 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
125 | 40 |
폭
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
80 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 80 |
---|---|
2nd row | 80 |
3rd row | 80 |
4th row | 80 |
5th row | 80 |
Common Values
Value | Count | Frequency (%) |
80 | 40 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
80 | 40 |
시작층
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 17.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
지하1 | |
---|---|
지상1 | |
지하2 | |
지상2 | |
지하5 | |
Other values (2) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지하2 |
---|---|
2nd row | 지하2 |
3rd row | 지하1 |
4th row | 지상2 |
5th row | 지하1 |
Common Values
Value | Count | Frequency (%) |
지하1 | 13 | |
지상1 | 9 | |
지하2 | 6 | |
지상2 | 4 | 10.0% |
지하5 | 4 | 10.0% |
지하3 | 2 | 5.0% |
지하4 | 2 | 5.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하1 | 13 | |
지상1 | 9 | |
지하2 | 6 | |
지상2 | 4 | 10.0% |
지하5 | 4 | 10.0% |
지하3 | 2 | 5.0% |
지하4 | 2 | 5.0% |
종료층
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 12.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 452.0 B |
지하1 | |
---|---|
지하2 | |
지하3 | |
지하4 | |
지상2 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 2.5% |
Sample
1st row | 지하3 |
---|---|
2nd row | 지하3 |
3rd row | 지하2 |
4th row | 지하1 |
5th row | 지하2 |
Common Values
Value | Count | Frequency (%) |
지하1 | 15 | |
지하2 | 11 | |
지하3 | 7 | |
지하4 | 6 | 15.0% |
지상2 | 1 | 2.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하1 | 15 | |
지하2 | 11 | |
지하3 | 7 | |
지하4 | 6 | 15.0% |
지상2 | 1 | 2.5% |
역명 | 휠체어리프트의 관리번호 | 출입구번호 | 상세위치 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|
역명 | 1.000 | 0.000 | 1.000 | 0.000 | 0.843 | 0.866 |
휠체어리프트의 관리번호 | 0.000 | 1.000 | 1.000 | 0.979 | 0.398 | 0.000 |
출입구번호 | 1.000 | 1.000 | 1.000 | 1.000 | NaN | NaN |
상세위치 | 0.000 | 0.979 | 1.000 | 1.000 | 1.000 | 1.000 |
시작층 | 0.843 | 0.398 | NaN | 1.000 | 1.000 | 0.822 |
종료층 | 0.866 | 0.000 | NaN | 1.000 | 0.822 | 1.000 |
종료층 | 출입구번호 | 시작층 | 역명 | |
---|---|---|---|---|
종료층 | 1.000 | 1.000 | 0.693 | 0.582 |
출입구번호 | 1.000 | 1.000 | 1.000 | 1.000 |
시작층 | 0.693 | 1.000 | 1.000 | 0.420 |
역명 | 0.582 | 1.000 | 0.420 | 1.000 |
휠체어리프트의 관리번호 | 역명 | 출입구번호 | 시작층 | 종료층 | |
---|---|---|---|---|---|
휠체어리프트의 관리번호 | 1.000 | 0.000 | 1.000 | 0.151 | 0.000 |
역명 | 0.000 | 1.000 | 1.000 | 0.420 | 0.582 |
출입구번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시작층 | 0.151 | 0.420 | 1.000 | 1.000 | 0.693 |
종료층 | 0.000 | 0.582 | 1.000 | 0.693 | 1.000 |
철도운영기관명 | 선명 | 역명 | 휠체어리프트의 관리번호 | 출입구번호 | 상세위치 | 길이 | 폭 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 서울교통공사 | 7호선 | 수락산 | 1 | <NA> | (B2)도봉산방향 시/승-대(B3-B2) | 125 | 80 | 지하2 | 지하3 |
1 | 서울교통공사 | 7호선 | 수락산 | 2 | <NA> | (B2)마들방향 시/승-대(B3-B2) | 125 | 80 | 지하2 | 지하3 |
2 | 서울교통공사 | 7호선 | 마들 | 1 | <NA> | (B1)대합실-대합실(B2-B1) | 125 | 80 | 지하1 | 지하2 |
3 | 서울교통공사 | 7호선 | 건대입구 | 1 | <NA> | (F2)2환승계단(E/S56호기)(B1-2F) | 125 | 80 | 지상2 | 지하1 |
4 | 서울교통공사 | 7호선 | 건대입구 | 2 | <NA> | (B1)3출구전 지하계단(B2-B1) | 125 | 80 | 지하1 | 지하2 |
5 | 서울교통공사 | 7호선 | 건대입구 | 3 | 3 | (F1)3출구(B1-F1)(병원입구) | 125 | 80 | 지상1 | 지하1 |
6 | 서울교통공사 | 7호선 | 청담 | 1 | <NA> | (B3)뚝섬유원지방향 승/종-대(B4-B3) | 125 | 80 | 지하3 | 지하4 |
7 | 서울교통공사 | 7호선 | 청담 | 2 | <NA> | (B3)강남구청방향 승/종-대(B4-B3) | 125 | 80 | 지하3 | 지하4 |
8 | 서울교통공사 | 7호선 | 논현 | 1 | <NA> | (B1)대-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
9 | 서울교통공사 | 7호선 | 반포 | 1 | <NA> | (B1)대-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
철도운영기관명 | 선명 | 역명 | 휠체어리프트의 관리번호 | 출입구번호 | 상세위치 | 길이 | 폭 | 시작층 | 종료층 | |
---|---|---|---|---|---|---|---|---|---|---|
30 | 서울교통공사 | 7호선 | 가산디지털단지 | 2 | <NA> | (B1)23출입구 전 계단(B1-BM1) | 125 | 80 | 지하1 | 지하1 |
31 | 서울교통공사 | 7호선 | 가산디지털단지 | 3 | <NA> | (F2)국철환승 하행(승-승)(B1-F2) | 125 | 80 | 지상2 | 지하1 |
32 | 서울교통공사 | 7호선 | 가산디지털단지 | 4 | <NA> | (F2)국철환승 상행(승-승)(B1-F2) | 125 | 80 | 지상2 | 지하1 |
33 | 서울교통공사 | 7호선 | 광명사거리 | 1 | <NA> | (B2)상선 종/승(B3-B2) | 125 | 80 | 지하2 | 지하3 |
34 | 서울교통공사 | 7호선 | 온수(성공회대입구) | 1 | <NA> | (B1)국철환승 하선 시/승-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
35 | 서울교통공사 | 7호선 | 온수(성공회대입구) | 2 | <NA> | (B1)국철환승 상선 시/승-대(B2-B1) | 125 | 80 | 지하1 | 지하2 |
36 | 서울교통공사 | 7호선 | 온수(성공회대입구) | 3 | <NA> | (F1)국철환승(인천)(B1-F1) | 125 | 80 | 지상1 | 지하1 |
37 | 서울교통공사 | 7호선 | 온수(성공회대입구) | 4 | <NA> | (F1)국철환승(서울)(B1-F1) | 125 | 80 | 지상1 | 지하1 |
38 | 서울교통공사 | 7호선 | 온수(성공회대입구) | 5 | 6 | (F1)6출입구(B1-F1) | 125 | 80 | 지상1 | 지하1 |
39 | 서울교통공사 | 7호선 | 어린이대공원(세종대) | 1 | <NA> | (F1-F2) | 125 | 80 | 지상1 | 지상2 |