Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 282 |
Missing cells | 3 |
Missing cells (%) | 0.2% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.4% |
Total size in memory | 15.6 KiB |
Average record size in memory | 56.5 B |
Variable types
Unsupported | 1 |
---|---|
Categorical | 5 |
Text | 1 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울교통공사 |
URL | https://data.seoul.go.kr/dataList/OA-13293/F/1/datasetView.do |
Dataset has 1 (0.4%) duplicate rows | Duplicates |
Unnamed: 1 is highly overall correlated with Unnamed: 2 and 3 other fields | High correlation |
Unnamed: 2 is highly overall correlated with Unnamed: 1 and 3 other fields | High correlation |
Unnamed: 4 is highly overall correlated with Unnamed: 1 and 3 other fields | High correlation |
Unnamed: 5 is highly overall correlated with Unnamed: 1 and 3 other fields | High correlation |
Unnamed: 6 is highly overall correlated with Unnamed: 1 and 3 other fields | High correlation |
Unnamed: 4 is highly imbalanced (74.3%) | Imbalance |
역사별 승강장안전문(PSD) 설치현황 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-04-17 04:25:43.062487 |
---|---|
Analysis finished | 2024-04-17 04:25:43.881483 |
Duration | 0.82 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
역사별 승강장안전문(PSD) 설치현황
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 1 |
---|---|
Missing (%) | 0.4% |
Memory size | 2.3 KiB |
Unnamed: 1
Categorical
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
2호선 | |
---|---|
5호선 | |
7호선 | |
6호선 | |
3호선 | |
Other values (5) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0035461 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
2호선 | 52 | |
5호선 | 51 | |
7호선 | 51 | |
6호선 | 38 | |
3호선 | 34 | |
4호선 | 26 | |
8호선 | 17 | 6.0% |
1호선 | 10 | 3.5% |
<NA> | 2 | 0.7% |
호선 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2호선 | 52 | |
5호선 | 51 | |
7호선 | 51 | |
6호선 | 38 | |
3호선 | 34 | |
4호선 | 26 | |
8호선 | 17 | 6.0% |
1호선 | 10 | 3.5% |
na | 2 | 0.7% |
호선 | 1 | 0.4% |
Unnamed: 2
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
ATO+RF+센서 방식 | |
---|---|
RF+센서 방식 | |
센서 방식 | |
<NA> | 2 |
개폐방식 | 1 |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 9.5460993 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 개폐방식 |
4th row | RF+센서 방식 |
5th row | RF+센서 방식 |
Common Values
Value | Count | Frequency (%) |
ATO+RF+센서 방식 | 157 | |
RF+센서 방식 | 62 | 22.0% |
센서 방식 | 60 | 21.3% |
<NA> | 2 | 0.7% |
개폐방식 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
방식 | 279 | |
ato+rf+센서 | 157 | |
rf+센서 | 62 | 11.1% |
센서 | 60 | 10.7% |
na | 2 | 0.4% |
개폐방식 | 1 | 0.2% |
Unnamed: 3
Text
Distinct | 256 |
---|---|
Distinct (%) | 91.4% |
Missing | 2 |
Missing (%) | 0.7% |
Memory size | 2.3 KiB |
Value | Count | Frequency (%) |
신 | 10 | 2.5% |
수 | 8 | 2.0% |
대 | 8 | 2.0% |
동 | 8 | 2.0% |
당 | 6 | 1.5% |
청 | 6 | 1.5% |
마 | 5 | 1.2% |
곡 | 5 | 1.2% |
원 | 5 | 1.2% |
계 | 4 | 1.0% |
Other values (246) | 343 |
Most occurring characters
Value | Count | Frequency (%) |
260 | ||
대 | 32 | 3.0% |
구 | 28 | 2.6% |
동 | 25 | 2.3% |
신 | 25 | 2.3% |
산 | 19 | 1.8% |
문 | 15 | 1.4% |
청 | 15 | 1.4% |
로 | 15 | 1.4% |
지 | 14 | 1.3% |
Other values (207) | 632 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 805 | |
Space Separator | 260 | 24.1% |
Decimal Number | 8 | 0.7% |
Uppercase Letter | 3 | 0.3% |
Open Punctuation | 2 | 0.2% |
Close Punctuation | 2 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 32 | 4.0% |
구 | 28 | 3.5% |
동 | 25 | 3.1% |
신 | 25 | 3.1% |
산 | 19 | 2.4% |
문 | 15 | 1.9% |
청 | 15 | 1.9% |
로 | 15 | 1.9% |
지 | 14 | 1.7% |
원 | 14 | 1.7% |
Other values (198) | 603 |
Decimal Number
Value | Count | Frequency (%) |
3 | 5 | |
4 | 2 | 25.0% |
5 | 1 | 12.5% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 1 | |
M | 1 | |
D | 1 |
Space Separator
Value | Count | Frequency (%) |
260 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 805 | |
Common | 272 | 25.2% |
Latin | 3 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 32 | 4.0% |
구 | 28 | 3.5% |
동 | 25 | 3.1% |
신 | 25 | 3.1% |
산 | 19 | 2.4% |
문 | 15 | 1.9% |
청 | 15 | 1.9% |
로 | 15 | 1.9% |
지 | 14 | 1.7% |
원 | 14 | 1.7% |
Other values (198) | 603 |
Common
Value | Count | Frequency (%) |
260 | ||
3 | 5 | 1.8% |
4 | 2 | 0.7% |
( | 2 | 0.7% |
) | 2 | 0.7% |
5 | 1 | 0.4% |
Latin
Value | Count | Frequency (%) |
C | 1 | |
M | 1 | |
D | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 805 | |
ASCII | 275 | 25.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
260 | ||
3 | 5 | 1.8% |
4 | 2 | 0.7% |
( | 2 | 0.7% |
) | 2 | 0.7% |
C | 1 | 0.4% |
M | 1 | 0.4% |
5 | 1 | 0.4% |
D | 1 | 0.4% |
Hangul
Value | Count | Frequency (%) |
대 | 32 | 4.0% |
구 | 28 | 3.5% |
동 | 25 | 3.1% |
신 | 25 | 3.1% |
산 | 19 | 2.4% |
문 | 15 | 1.9% |
청 | 15 | 1.9% |
로 | 15 | 1.9% |
지 | 14 | 1.7% |
원 | 14 | 1.7% |
Other values (198) | 603 |
Unnamed: 4
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
자체 | |
---|---|
민자 | 24 |
서울시(신설역) | 3 |
<NA> | 2 |
사업방식 | 1 |
Length
Max length | 8 |
---|---|
Median length | 2 |
Mean length | 2.0851064 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 사업방식 |
4th row | 민자 |
5th row | 민자 |
Common Values
Value | Count | Frequency (%) |
자체 | 252 | |
민자 | 24 | 8.5% |
서울시(신설역) | 3 | 1.1% |
<NA> | 2 | 0.7% |
사업방식 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
자체 | 252 | |
민자 | 24 | 8.5% |
서울시(신설역 | 3 | 1.1% |
na | 2 | 0.7% |
사업방식 | 1 | 0.4% |
Unnamed: 5
Categorical
HIGH CORRELATION
 
Distinct | 45 |
---|---|
Distinct (%) | 16.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
2009.12 | |
---|---|
’09.12.29 | |
2009.10 | |
2008.12 | |
2008.9 | |
Other values (40) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 7.7553191 |
Min length | 3 |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 6.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 설치일 |
4th row | ’07.11.01 |
5th row | ’0712.03 |
Common Values
Value | Count | Frequency (%) |
2009.12 | 58 | |
’09.12.29 | 39 | |
2009.10 | 38 | |
2008.12 | 27 | |
2008.9 | 20 | 7.1% |
’09.12.30 | 18 | 6.4% |
2013.01 | 9 | 3.2% |
’09.11.30 | 8 | 2.8% |
2007.10 | 4 | 1.4% |
’09.06.24 | 4 | 1.4% |
Other values (35) | 57 |
Length
Value | Count | Frequency (%) |
2009.12 | 58 | |
’09.12.29 | 39 | |
2009.10 | 38 | |
2008.12 | 27 | |
2008.9 | 20 | 7.1% |
’09.12.30 | 18 | 6.4% |
2013.01 | 9 | 3.2% |
’09.11.30 | 8 | 2.8% |
2007.10 | 4 | 1.4% |
’09.06.24 | 4 | 1.4% |
Other values (35) | 57 |
Unnamed: 6
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 4.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
현대E/L | |
---|---|
현대E/V | |
GS네오텍 | |
삼중테크 | |
삼성SDS | |
Other values (8) |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 4.7553191 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.7% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 공사업체 |
4th row | 현대E/L |
5th row | 현대E/L |
Common Values
Value | Count | Frequency (%) |
현대E/L | 68 | |
현대E/V | 45 | |
GS네오텍 | 40 | |
삼중테크 | 36 | |
삼성SDS | 27 | 9.6% |
도철PSD | 20 | 7.1% |
포스콘 | 20 | 7.1% |
피에쓰에쓰텍 | 14 | 5.0% |
서윤산업 | 4 | 1.4% |
DUANI | 4 | 1.4% |
Other values (3) | 4 | 1.4% |
Length
Value | Count | Frequency (%) |
현대e/l | 68 | |
현대e/v | 45 | |
gs네오텍 | 40 | |
삼중테크 | 36 | |
삼성sds | 27 | 9.6% |
도철psd | 20 | 7.1% |
포스콘 | 20 | 7.1% |
피에쓰에쓰텍 | 14 | 5.0% |
서윤산업 | 4 | 1.4% |
duani | 4 | 1.4% |
Other values (3) | 4 | 1.4% |
Unnamed: 1 | Unnamed: 2 | Unnamed: 4 | Unnamed: 5 | Unnamed: 6 | |
---|---|---|---|---|---|
Unnamed: 1 | 1.000 | 1.000 | 0.792 | 0.941 | 0.920 |
Unnamed: 2 | 1.000 | 1.000 | 0.929 | 0.987 | 0.981 |
Unnamed: 4 | 0.792 | 0.929 | 1.000 | 0.971 | 0.908 |
Unnamed: 5 | 0.941 | 0.987 | 0.971 | 1.000 | 0.993 |
Unnamed: 6 | 0.920 | 0.981 | 0.908 | 0.993 | 1.000 |
Unnamed: 4 | Unnamed: 1 | Unnamed: 5 | Unnamed: 2 | Unnamed: 6 | |
---|---|---|---|---|---|
Unnamed: 4 | 1.000 | 0.644 | 0.756 | 0.647 | 0.625 |
Unnamed: 1 | 0.644 | 1.000 | 0.658 | 0.991 | 0.715 |
Unnamed: 5 | 0.756 | 0.658 | 1.000 | 0.808 | 0.859 |
Unnamed: 2 | 0.647 | 0.991 | 0.808 | 1.000 | 0.805 |
Unnamed: 6 | 0.625 | 0.715 | 0.859 | 0.805 | 1.000 |
Unnamed: 1 | Unnamed: 2 | Unnamed: 4 | Unnamed: 5 | Unnamed: 6 | |
---|---|---|---|---|---|
Unnamed: 1 | 1.000 | 0.991 | 0.644 | 0.658 | 0.715 |
Unnamed: 2 | 0.991 | 1.000 | 0.647 | 0.808 | 0.805 |
Unnamed: 4 | 0.644 | 0.647 | 1.000 | 0.756 | 0.625 |
Unnamed: 5 | 0.658 | 0.808 | 0.756 | 1.000 | 0.859 |
Unnamed: 6 | 0.715 | 0.805 | 0.625 | 0.859 | 1.000 |
역사별 승강장안전문(PSD) 설치현황 | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | Unnamed: 6 | |
---|---|---|---|---|---|---|---|
0 | NaN | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | □ 승강장안전문관리단 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
2 | 연번 | 호선 | 개폐방식 | 역사명 | 사업방식 | 설치일 | 공사업체 |
3 | 1 | 1호선 | RF+센서 방식 | 서 울 | 민자 | ’07.11.01 | 현대E/L |
4 | 2 | 1호선 | RF+센서 방식 | 시 청 | 민자 | ’0712.03 | 현대E/L |
5 | 3 | 1호선 | RF+센서 방식 | 종 각 | 자체 | ’09.12.29 | 현대E/L |
6 | 4 | 1호선 | RF+센서 방식 | 종로3가 | 민자 | ’08.01.03 | 현대E/L |
7 | 5 | 1호선 | RF+센서 방식 | 종로5가 | 자체 | ’09.12.29 | 현대E/L |
8 | 6 | 1호선 | RF+센서 방식 | 동대문 | 자체 | ’08.06.18 | 서윤산업 |
9 | 7 | 1호선 | RF+센서 방식 | 동 묘 | 자체 | ’06.01.10 | 현대E/L |
역사별 승강장안전문(PSD) 설치현황 | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | Unnamed: 6 | |
---|---|---|---|---|---|---|---|
272 | 270 | 8호선 | ATO+RF+센서 방식 | 가락시장 | 자체 | 2009.12 | 도철PSD |
273 | 271 | 8호선 | ATO+RF+센서 방식 | 문정 | 자체 | 2009.12 | 도철PSD |
274 | 272 | 8호선 | ATO+RF+센서 방식 | 장지 | 자체 | 2009.12 | 도철PSD |
275 | 273 | 8호선 | ATO+RF+센서 방식 | 복정 | 자체 | 2009.12 | 도철PSD |
276 | 274 | 8호선 | ATO+RF+센서 방식 | 산성 | 자체 | 2009.12 | 도철PSD |
277 | 275 | 8호선 | ATO+RF+센서 방식 | 남한산성입구 | 자체 | 2009.12 | 도철PSD |
278 | 276 | 8호선 | ATO+RF+센서 방식 | 단대오거리 | 자체 | 2009.12 | 도철PSD |
279 | 277 | 8호선 | ATO+RF+센서 방식 | 신흥 | 자체 | 2009.12 | 도철PSD |
280 | 278 | 8호선 | ATO+RF+센서 방식 | 수진 | 자체 | 2009.12 | 도철PSD |
281 | 279 | 8호선 | ATO+RF+센서 방식 | 모란 | 자체 | 2009.12 | 도철PSD |
Most frequently occurring
Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | Unnamed: 6 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |