Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 71 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 7 |
Duplicate rows (%) | 9.9% |
Total size in memory | 4.2 KiB |
Average record size in memory | 59.9 B |
Variable types
Categorical | 5 |
---|---|
Numeric | 1 |
Text | 1 |
Dataset
Description | 부산3호선에 포함된 도시광역철도역들의 철도운영기관명, 선명, 역명, 공기호흡기의 역층, 출구번호, 상세위치의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15041449/fileData.do |
철도운영기관명 has constant value "" | Constant |
지상지하 has constant value "" | Constant |
Dataset has 7 (9.9%) duplicate rows | Duplicates |
선명 is highly overall correlated with 층 and 2 other fields | High correlation |
출입구번호 is highly overall correlated with 층 and 2 other fields | High correlation |
층 is highly overall correlated with 선명 and 2 other fields | High correlation |
역명 is highly overall correlated with 층 and 2 other fields | High correlation |
선명 is highly imbalanced (63.3%) | Imbalance |
출입구번호 is highly imbalanced (71.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 15:58:41.242793 |
---|---|
Analysis finished | 2023-12-12 15:58:41.979584 |
Duration | 0.74 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
부산교통공사 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산교통공사 |
---|---|
2nd row | 부산교통공사 |
3rd row | 부산교통공사 |
4th row | 부산교통공사 |
5th row | 부산교통공사 |
Common Values
Value | Count | Frequency (%) |
부산교통공사 | 71 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부산교통공사 | 71 |
선명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
3호선 | |
---|---|
3호선 | 5 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0704225 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 3호선 |
---|---|
2nd row | 3호선 |
3rd row | 3호선 |
4th row | 3호선 |
5th row | 3호선 |
Common Values
Value | Count | Frequency (%) |
3호선 | 66 | |
3호선 | 5 | 7.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
3호선 | 71 |
역명
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 18.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
배산역 | |
---|---|
물만골역 | |
종합운동장역 | |
만덕역 | |
망미역 | |
Other values (8) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.5211268 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 2.8% |
Sample
1st row | 연산역 |
---|---|
2nd row | 연산역 |
3rd row | 연산역 |
4th row | 연산역 |
5th row | 수영역 |
Common Values
Value | Count | Frequency (%) |
배산역 | 10 | |
물만골역 | 8 | |
종합운동장역 | 8 | |
만덕역 | 8 | |
망미역 | 7 | |
거제역 | 6 | |
사직역 | 5 | |
남산정역 | 5 | |
연산역 | 4 | 5.6% |
미남역 | 4 | 5.6% |
Other values (3) | 6 |
Length
Value | Count | Frequency (%) |
배산역 | 10 | |
물만골역 | 8 | |
종합운동장역 | 8 | |
만덕역 | 8 | |
망미역 | 7 | |
거제역 | 6 | |
사직역 | 5 | |
남산정역 | 5 | |
연산역 | 4 | 5.6% |
미남역 | 4 | 5.6% |
Other values (3) | 6 |
지상지하
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
지하 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지하 |
---|---|
2nd row | 지하 |
3rd row | 지하 |
4th row | 지하 |
5th row | 지하 |
Common Values
Value | Count | Frequency (%) |
지하 | 71 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하 | 71 |
층
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 12.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.5633803 |
Minimum | 1 |
---|---|
Maximum | 9 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 771.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 3 |
Q3 | 5 |
95-th percentile | 8.5 |
Maximum | 9 |
Range | 8 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.4126594 |
---|---|
Coefficient of variation (CV) | 0.67707043 |
Kurtosis | -0.25992961 |
Mean | 3.5633803 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.87151696 |
Sum | 253 |
Variance | 5.8209256 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2 | 18 | |
1 | 15 | |
4 | 8 | |
3 | 8 | |
5 | 8 | |
6 | 4 | 5.6% |
8 | 4 | 5.6% |
9 | 4 | 5.6% |
7 | 2 | 2.8% |
Value | Count | Frequency (%) |
1 | 15 | |
2 | 18 | |
3 | 8 | |
4 | 8 | |
5 | 8 | |
6 | 4 | 5.6% |
7 | 2 | 2.8% |
8 | 4 | 5.6% |
9 | 4 | 5.6% |
Value | Count | Frequency (%) |
9 | 4 | 5.6% |
8 | 4 | 5.6% |
7 | 2 | 2.8% |
6 | 4 | 5.6% |
5 | 8 | |
4 | 8 | |
3 | 8 | |
2 | 18 | |
1 | 15 |
출입구번호
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 7.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
<NA> | |
---|---|
1 | 2 |
2 | 2 |
4 | 2 |
5 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.7042254 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.4% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 64 | |
1 | 2 | 2.8% |
2 | 2 | 2.8% |
4 | 2 | 2.8% |
5 | 1 | 1.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 64 | |
1 | 2 | 2.8% |
2 | 2 | 2.8% |
4 | 2 | 2.8% |
5 | 1 | 1.4% |
상세위치
Text
Distinct | 62 |
---|---|
Distinct (%) | 87.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
Length
Max length | 29 |
---|---|
Median length | 23 |
Mean length | 16.295775 |
Min length | 5 |
Characters and Unicode
Total characters | 1157 |
---|---|
Distinct characters | 102 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 55 ? |
---|---|
Unique (%) | 77.5% |
Sample
1st row | (B4) 수영행 승강장 앞 |
---|---|
2nd row | (B4) 수영행 승강장 sos 비상구급 구역내 |
3rd row | (B4) 대저행 승강장 앞 |
4th row | (B4) 대저행 승강장 뒤 |
5th row | 상선 미화원실 앞 / 하선 4번 창고 앞 |
Value | Count | Frequency (%) |
승강장 | 26 | 9.5% |
앞 | 24 | 8.7% |
출입문 | 16 | 5.8% |
방향 | 16 | 5.8% |
b2 | 10 | 3.6% |
역무안전실 | 8 | 2.9% |
하선 | 7 | 2.5% |
b1 | 7 | 2.5% |
근처 | 6 | 2.2% |
b5 | 6 | 2.2% |
Other values (77) | 149 |
Most occurring characters
Value | Count | Frequency (%) |
210 | 18.2% | |
) | 64 | 5.5% |
( | 64 | 5.5% |
B | 57 | 4.9% |
역 | 38 | 3.3% |
장 | 38 | 3.3% |
강 | 37 | 3.2% |
승 | 37 | 3.2% |
1 | 33 | 2.9% |
앞 | 28 | 2.4% |
Other values (92) | 551 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 597 | |
Space Separator | 210 | 18.2% |
Decimal Number | 119 | 10.3% |
Uppercase Letter | 70 | 6.1% |
Close Punctuation | 64 | 5.5% |
Open Punctuation | 64 | 5.5% |
Dash Punctuation | 23 | 2.0% |
Other Punctuation | 7 | 0.6% |
Lowercase Letter | 3 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
역 | 38 | 6.4% |
장 | 38 | 6.4% |
강 | 37 | 6.2% |
승 | 37 | 6.2% |
앞 | 28 | 4.7% |
출 | 26 | 4.4% |
선 | 25 | 4.2% |
방 | 24 | 4.0% |
입 | 21 | 3.5% |
문 | 20 | 3.4% |
Other values (69) | 303 |
Decimal Number
Value | Count | Frequency (%) |
1 | 33 | |
2 | 28 | |
4 | 22 | |
3 | 16 | |
5 | 8 | 6.7% |
8 | 5 | 4.2% |
9 | 5 | 4.2% |
6 | 1 | 0.8% |
7 | 1 | 0.8% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 57 | |
L | 4 | 5.7% |
E | 4 | 5.7% |
A | 2 | 2.9% |
P | 1 | 1.4% |
D | 1 | 1.4% |
S | 1 | 1.4% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 2 | |
o | 1 |
Space Separator
Value | Count | Frequency (%) |
210 |
Close Punctuation
Value | Count | Frequency (%) |
) | 64 |
Open Punctuation
Value | Count | Frequency (%) |
( | 64 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 23 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 597 | |
Common | 487 | |
Latin | 73 | 6.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
역 | 38 | 6.4% |
장 | 38 | 6.4% |
강 | 37 | 6.2% |
승 | 37 | 6.2% |
앞 | 28 | 4.7% |
출 | 26 | 4.4% |
선 | 25 | 4.2% |
방 | 24 | 4.0% |
입 | 21 | 3.5% |
문 | 20 | 3.4% |
Other values (69) | 303 |
Common
Value | Count | Frequency (%) |
210 | ||
) | 64 | 13.1% |
( | 64 | 13.1% |
1 | 33 | 6.8% |
2 | 28 | 5.7% |
- | 23 | 4.7% |
4 | 22 | 4.5% |
3 | 16 | 3.3% |
5 | 8 | 1.6% |
/ | 7 | 1.4% |
Other values (4) | 12 | 2.5% |
Latin
Value | Count | Frequency (%) |
B | 57 | |
L | 4 | 5.5% |
E | 4 | 5.5% |
s | 2 | 2.7% |
A | 2 | 2.7% |
P | 1 | 1.4% |
o | 1 | 1.4% |
D | 1 | 1.4% |
S | 1 | 1.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 597 | |
ASCII | 560 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
210 | ||
) | 64 | 11.4% |
( | 64 | 11.4% |
B | 57 | 10.2% |
1 | 33 | 5.9% |
2 | 28 | 5.0% |
- | 23 | 4.1% |
4 | 22 | 3.9% |
3 | 16 | 2.9% |
5 | 8 | 1.4% |
Other values (13) | 35 | 6.2% |
Hangul
Value | Count | Frequency (%) |
역 | 38 | 6.4% |
장 | 38 | 6.4% |
강 | 37 | 6.2% |
승 | 37 | 6.2% |
앞 | 28 | 4.7% |
출 | 26 | 4.4% |
선 | 25 | 4.2% |
방 | 24 | 4.0% |
입 | 21 | 3.5% |
문 | 20 | 3.4% |
Other values (69) | 303 |
선명 | 역명 | 층 | 출입구번호 | 상세위치 | |
---|---|---|---|---|---|
선명 | 1.000 | 0.819 | 0.856 | NaN | 1.000 |
역명 | 0.819 | 1.000 | 0.810 | 0.817 | 0.988 |
층 | 0.856 | 0.810 | 1.000 | NaN | 1.000 |
출입구번호 | NaN | 0.817 | NaN | 1.000 | 0.817 |
상세위치 | 1.000 | 0.988 | 1.000 | 0.817 | 1.000 |
역명 | 선명 | 출입구번호 | |
---|---|---|---|
역명 | 1.000 | 0.727 | 0.612 |
선명 | 0.727 | 1.000 | 1.000 |
출입구번호 | 0.612 | 1.000 | 1.000 |
층 | 선명 | 역명 | 출입구번호 | |
---|---|---|---|---|
층 | 1.000 | 0.841 | 0.503 | 1.000 |
선명 | 0.841 | 1.000 | 0.727 | 1.000 |
역명 | 0.503 | 0.727 | 1.000 | 0.612 |
출입구번호 | 1.000 | 1.000 | 0.612 | 1.000 |
철도운영기관명 | 선명 | 역명 | 지상지하 | 층 | 출입구번호 | 상세위치 | |
---|---|---|---|---|---|---|---|
0 | 부산교통공사 | 3호선 | 연산역 | 지하 | 4 | <NA> | (B4) 수영행 승강장 앞 |
1 | 부산교통공사 | 3호선 | 연산역 | 지하 | 4 | <NA> | (B4) 수영행 승강장 sos 비상구급 구역내 |
2 | 부산교통공사 | 3호선 | 연산역 | 지하 | 4 | <NA> | (B4) 대저행 승강장 앞 |
3 | 부산교통공사 | 3호선 | 연산역 | 지하 | 4 | <NA> | (B4) 대저행 승강장 뒤 |
4 | 부산교통공사 | 3호선 | 수영역 | 지하 | 3 | <NA> | 상선 미화원실 앞 / 하선 4번 창고 앞 |
5 | 부산교통공사 | 3호선 | 덕천역 | 지하 | 3 | <NA> | 상선 4-3 앞 / 하선 1-1 앞 |
6 | 부산교통공사 | 3호선 | 망미역 | 지하 | 1 | 5 | 역무안전실 내 |
7 | 부산교통공사 | 3호선 | 망미역 | 지하 | 5 | <NA> | 지하 5층 상측 |
8 | 부산교통공사 | 3호선 | 망미역 | 지하 | 5 | <NA> | 지하 5층 하측 |
9 | 부산교통공사 | 3호선 | 망미역 | 지하 | 6 | <NA> | 하선 앞쪽 |
철도운영기관명 | 선명 | 역명 | 지상지하 | 층 | 출입구번호 | 상세위치 | |
---|---|---|---|---|---|---|---|
61 | 부산교통공사 | 3호선 | 만덕역 | 지하 | 9 | <NA> | (B9)남산정방면(하선)승강장 3-2 출입문 앞 |
62 | 부산교통공사 | 3호선 | 남산정역 | 지하 | 1 | 2 | (B1) 2번출구 인근 역무안전실 |
63 | 부산교통공사 | 3호선 | 남산정역 | 지하 | 2 | <NA> | (B2) 만덕역 방향 상선 승강장 2-1 출입문 근처 |
64 | 부산교통공사 | 3호선 | 남산정역 | 지하 | 2 | <NA> | (B3) 만덕역 방향 상선 승강장 3-4 출입문 근처 |
65 | 부산교통공사 | 3호선 | 남산정역 | 지하 | 2 | <NA> | (B2) 숙등역 방향 하선 승강장 1-3 출입문 근처 |
66 | 부산교통공사 | 3호선 | 남산정역 | 지하 | 2 | <NA> | (B2) 숙등역 방향 하선 승강장 4-1 출입문 근처 |
67 | 부산교통공사 | 3호선 | 숙등역 | 지하 | 1 | <NA> | (B1)역무안전실 |
68 | 부산교통공사 | 3호선 | 숙등역 | 지하 | 2 | <NA> | (B2)A/B 환기실 |
69 | 부산교통공사 | 3호선 | 숙등역 | 지하 | 3 | <NA> | (B3)수영행 승강장 |
70 | 부산교통공사 | 3호선 | 숙등역 | 지하 | 3 | <NA> | (B3)대저행 승강장 |
Most frequently occurring
철도운영기관명 | 선명 | 역명 | 지상지하 | 층 | 출입구번호 | 상세위치 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 부산교통공사 | 3호선 | 거제역 | 지하 | 2 | <NA> | (B2)상선승강장 중앙 | 2 |
1 | 부산교통공사 | 3호선 | 거제역 | 지하 | 2 | <NA> | (B2)하선승강장 중앙 | 2 |
2 | 부산교통공사 | 3호선 | 만덕역 | 지하 | 1 | 4 | (B1) 4번출구 역무안전실 | 2 |
3 | 부산교통공사 | 3호선 | 미남역 | 지하 | 1 | <NA> | (B1)역무안전실 내 | 2 |
4 | 부산교통공사 | 3호선 | 배산역 | 지하 | 1 | <NA> | 역무안전실 | 2 |
5 | 부산교통공사 | 3호선 | 종합운동장역 | 지하 | 2 | <NA> | (B2) 역무실 | 2 |
6 | 부산교통공사 | 3호선 | 망미역 | 지하 | 6 | <NA> | 하선 뒤쪽 | 2 |