Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 1093 |
Missing cells | 1029 |
Missing cells (%) | 15.7% |
Duplicate rows | 4 |
Duplicate rows (%) | 0.4% |
Total size in memory | 54.6 KiB |
Average record size in memory | 51.1 B |
Variable types
Categorical | 3 |
---|---|
Text | 1 |
Numeric | 2 |
Dataset
Description | 부산교통공사의 1~4호선 역사 내 승강기(에스컬레이터) 대수 및 에스컬레이터 호기별 설치연도, 개량년도에 관한 자료 (호선,역명,호기,설치년도,교체주기(개량년도)) |
---|---|
URL | https://www.data.go.kr/data/15052663/fileData.do |
Dataset has 4 (0.4%) duplicate rows | Duplicates |
설치년도 is highly overall correlated with 교체주기(개량년도) and 1 other fields | High correlation |
교체주기(개량년도) is highly overall correlated with 설치년도 and 1 other fields | High correlation |
호선 is highly overall correlated with 설치년도 and 1 other fields | High correlation |
교체주기(개량년도) has 1029 (94.1%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 18:24:53.553423 |
---|---|
Analysis finished | 2023-12-12 18:24:54.404958 |
Duration | 0.85 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
호선
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.7 KiB |
2 | |
---|---|
1 | |
3 | |
4 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
2 | 376 | |
1 | 297 | |
3 | 242 | |
4 | 178 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2 | 376 | |
1 | 297 | |
3 | 242 | |
4 | 178 |
역명
Text
Distinct | 114 |
---|---|
Distinct (%) | 10.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.7 KiB |
Value | Count | Frequency (%) |
동래 | 32 | 2.9% |
서면 | 27 | 2.5% |
만덕 | 27 | 2.5% |
다대포항 | 26 | 2.4% |
배산 | 22 | 2.0% |
수안 | 21 | 1.9% |
동매 | 21 | 1.9% |
연산동 | 20 | 1.8% |
센텀시티 | 20 | 1.8% |
다대포해수욕장 | 19 | 1.7% |
Other values (104) | 858 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 175 | 6.1% |
대 | 159 | 5.5% |
동 | 143 | 5.0% |
장 | 103 | 3.6% |
포 | 88 | 3.1% |
남 | 79 | 2.7% |
서 | 70 | 2.4% |
수 | 64 | 2.2% |
부 | 63 | 2.2% |
구 | 53 | 1.8% |
Other values (125) | 1881 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2870 | |
Close Punctuation | 4 | 0.1% |
Open Punctuation | 4 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 175 | 6.1% |
대 | 159 | 5.5% |
동 | 143 | 5.0% |
장 | 103 | 3.6% |
포 | 88 | 3.1% |
남 | 79 | 2.8% |
서 | 70 | 2.4% |
수 | 64 | 2.2% |
부 | 63 | 2.2% |
구 | 53 | 1.8% |
Other values (123) | 1873 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2870 | |
Common | 8 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 175 | 6.1% |
대 | 159 | 5.5% |
동 | 143 | 5.0% |
장 | 103 | 3.6% |
포 | 88 | 3.1% |
남 | 79 | 2.8% |
서 | 70 | 2.4% |
수 | 64 | 2.2% |
부 | 63 | 2.2% |
구 | 53 | 1.8% |
Other values (123) | 1873 |
Common
Value | Count | Frequency (%) |
) | 4 | |
( | 4 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2870 | |
ASCII | 8 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 175 | 6.1% |
대 | 159 | 5.5% |
동 | 143 | 5.0% |
장 | 103 | 3.6% |
포 | 88 | 3.1% |
남 | 79 | 2.8% |
서 | 70 | 2.4% |
수 | 64 | 2.2% |
부 | 63 | 2.2% |
구 | 53 | 1.8% |
Other values (123) | 1873 |
ASCII
Value | Count | Frequency (%) |
) | 4 | |
( | 4 |
구분
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.7 KiB |
에스컬레이터 | |
---|---|
엘리베이터 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.5937786 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 에스컬레이터 |
---|---|
2nd row | 에스컬레이터 |
3rd row | 에스컬레이터 |
4th row | 에스컬레이터 |
5th row | 에스컬레이터 |
Common Values
Value | Count | Frequency (%) |
에스컬레이터 | 649 | |
엘리베이터 | 444 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
에스컬레이터 | 649 | |
엘리베이터 | 444 |
호기
Categorical
Distinct | 27 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.7 KiB |
1 | |
---|---|
2 | |
3 | |
4 | |
5 | |
Other values (22) |
Length
Max length | 3 |
---|---|
Median length | 1 |
Mean length | 1.1143641 |
Min length | 1 |
Unique
Unique | 7 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | 1 |
---|---|
2nd row | 2 |
3rd row | 3 |
4th row | 4 |
5th row | 5 |
Common Values
Value | Count | Frequency (%) |
1 | 192 | |
2 | 187 | |
3 | 168 | |
4 | 149 | |
5 | 83 | |
6 | 69 | 6.3% |
7 | 53 | 4.8% |
8 | 45 | 4.1% |
9 | 28 | 2.6% |
10 | 26 | 2.4% |
Other values (17) | 93 |
Length
Value | Count | Frequency (%) |
1 | 192 | |
2 | 187 | |
3 | 168 | |
4 | 149 | |
5 | 83 | |
6 | 69 | 6.3% |
7 | 53 | 4.8% |
8 | 45 | 4.1% |
9 | 28 | 2.6% |
10 | 26 | 2.4% |
Other values (17) | 93 |
설치년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 27 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2007.9003 |
Minimum | 1985 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.7 KiB |
Quantile statistics
Minimum | 1985 |
---|---|
5-th percentile | 1998 |
Q1 | 2005 |
median | 2009 |
Q3 | 2011 |
95-th percentile | 2017 |
Maximum | 2023 |
Range | 38 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 6.398126 |
---|---|
Coefficient of variation (CV) | 0.003186476 |
Kurtosis | 1.9583401 |
Mean | 2007.9003 |
Median Absolute Deviation (MAD) | 4 |
Skewness | -0.94482953 |
Sum | 2194635 |
Variance | 40.936016 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2011 | 270 | |
2005 | 256 | |
2017 | 104 | 9.5% |
2012 | 68 | 6.2% |
2001 | 64 | 5.9% |
1998 | 54 | 4.9% |
2007 | 52 | 4.8% |
2008 | 35 | 3.2% |
2010 | 28 | 2.6% |
2016 | 25 | 2.3% |
Other values (17) | 137 |
Value | Count | Frequency (%) |
1985 | 13 | 1.2% |
1987 | 6 | 0.5% |
1988 | 8 | 0.7% |
1989 | 7 | 0.6% |
1994 | 3 | 0.3% |
1998 | 54 | |
2001 | 64 | |
2002 | 22 | 2.0% |
2003 | 2 | 0.2% |
2004 | 1 | 0.1% |
Value | Count | Frequency (%) |
2023 | 1 | 0.1% |
2022 | 4 | 0.4% |
2021 | 6 | 0.5% |
2018 | 6 | 0.5% |
2017 | 104 | |
2016 | 25 | 2.3% |
2015 | 9 | 0.8% |
2014 | 5 | 0.5% |
2013 | 6 | 0.5% |
2012 | 68 |
교체주기(개량년도)
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 19 |
---|---|
Distinct (%) | 29.7% |
Missing | 1029 |
Missing (%) | 94.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2010.4062 |
Minimum | 1998 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.7 KiB |
Quantile statistics
Minimum | 1998 |
---|---|
5-th percentile | 2004 |
Q1 | 2005 |
median | 2011 |
Q3 | 2016 |
95-th percentile | 2019 |
Maximum | 2022 |
Range | 24 |
Interquartile range (IQR) | 11 |
Descriptive statistics
Standard deviation | 5.9939619 |
---|---|
Coefficient of variation (CV) | 0.002981468 |
Kurtosis | -1.3519612 |
Mean | 2010.4062 |
Median Absolute Deviation (MAD) | 6 |
Skewness | 0.10356429 |
Sum | 128666 |
Variance | 35.927579 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2004 | 11 | 1.0% |
2016 | 10 | 0.9% |
2005 | 10 | 0.9% |
2015 | 5 | 0.5% |
2011 | 4 | 0.4% |
2006 | 4 | 0.4% |
2017 | 3 | 0.3% |
2018 | 2 | 0.2% |
2019 | 2 | 0.2% |
2003 | 2 | 0.2% |
Other values (9) | 11 | 1.0% |
(Missing) | 1029 |
Value | Count | Frequency (%) |
1998 | 1 | 0.1% |
2003 | 2 | 0.2% |
2004 | 11 | |
2005 | 10 | |
2006 | 4 | 0.4% |
2008 | 1 | 0.1% |
2009 | 1 | 0.1% |
2010 | 1 | 0.1% |
2011 | 4 | 0.4% |
2012 | 2 | 0.2% |
Value | Count | Frequency (%) |
2022 | 1 | 0.1% |
2021 | 1 | 0.1% |
2020 | 1 | 0.1% |
2019 | 2 | 0.2% |
2018 | 2 | 0.2% |
2017 | 3 | 0.3% |
2016 | 10 | |
2015 | 5 | |
2013 | 2 | 0.2% |
2012 | 2 | 0.2% |
호선 | 구분 | 호기 | 설치년도 | 교체주기(개량년도) | |
---|---|---|---|---|---|
호선 | 1.000 | 0.326 | 0.201 | 0.842 | 0.744 |
구분 | 0.326 | 1.000 | 0.542 | 0.560 | 0.091 |
호기 | 0.201 | 0.542 | 1.000 | 0.000 | 0.000 |
설치년도 | 0.842 | 0.560 | 0.000 | 1.000 | 0.743 |
교체주기(개량년도) | 0.744 | 0.091 | 0.000 | 0.743 | 1.000 |
호선 | 구분 | 호기 | |
---|---|---|---|
호선 | 1.000 | 0.217 | 0.106 |
구분 | 0.217 | 1.000 | 0.463 |
호기 | 0.106 | 0.463 | 1.000 |
설치년도 | 교체주기(개량년도) | 호선 | 구분 | 호기 | |
---|---|---|---|---|---|
설치년도 | 1.000 | 0.706 | 0.687 | 0.438 | 0.000 |
교체주기(개량년도) | 0.706 | 1.000 | 0.604 | 0.000 | 0.000 |
호선 | 0.687 | 0.604 | 1.000 | 0.217 | 0.106 |
구분 | 0.438 | 0.000 | 0.217 | 1.000 | 0.463 |
호기 | 0.000 | 0.000 | 0.106 | 0.463 | 1.000 |
호선 | 역명 | 구분 | 호기 | 설치년도 | 교체주기(개량년도) | |
---|---|---|---|---|---|---|
0 | 1 | 서면 | 에스컬레이터 | 1 | 1985 | 2004 |
1 | 1 | 서면 | 에스컬레이터 | 2 | 1985 | 2004 |
2 | 1 | 서면 | 에스컬레이터 | 3 | 1985 | 2004 |
3 | 1 | 서면 | 에스컬레이터 | 4 | 1985 | 2004 |
4 | 1 | 서면 | 에스컬레이터 | 5 | 1985 | 2004 |
5 | 1 | 서면 | 에스컬레이터 | 6 | 1985 | 2004 |
6 | 1 | 서면 | 에스컬레이터 | 7 | 1985 | 2004 |
7 | 1 | 서면 | 에스컬레이터 | 8 | 1985 | 2004 |
8 | 1 | 서면 | 에스컬레이터 | 9 | 1985 | 2004 |
9 | 1 | 서면 | 에스컬레이터 | 10 | 1985 | 2004 |
호선 | 역명 | 구분 | 호기 | 설치년도 | 교체주기(개량년도) | |
---|---|---|---|---|---|---|
1083 | 4 | 고촌 | 에스컬레이터 | 5 | 2011 | <NA> |
1084 | 4 | 고촌 | 에스컬레이터 | 6 | 2011 | <NA> |
1085 | 4 | 고촌 | 엘리베이터 | 1 | 2011 | <NA> |
1086 | 4 | 고촌 | 엘리베이터 | 2 | 2011 | <NA> |
1087 | 4 | 고촌 | 엘리베이터 | 3 | 2011 | <NA> |
1088 | 4 | 수안 | 엘리베이터 | 2 | 2011 | <NA> |
1089 | 4 | 수안 | 엘리베이터 | 3 | 2011 | <NA> |
1090 | 4 | 수안 | 엘리베이터 | 4 | 2011 | <NA> |
1091 | 4 | 반여 | 엘리베이터 | 1 | 2011 | <NA> |
1092 | 4 | 반여 | 엘리베이터 | 2 | 2011 | <NA> |
Most frequently occurring
호선 | 역명 | 구분 | 호기 | 설치년도 | 교체주기(개량년도) | # duplicates | |
---|---|---|---|---|---|---|---|
0 | 1 | 남포 | 에스컬레이터 | 7 | 2017 | <NA> | 2 |
1 | 4 | 윗반송 | 엘리베이터 | 1 | 2011 | <NA> | 2 |
2 | 4 | 윗반송 | 엘리베이터 | 2 | 2011 | <NA> | 2 |
3 | 4 | 윗반송 | 엘리베이터 | 3 | 2011 | <NA> | 2 |