Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 120 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.2 KiB |
Average record size in memory | 27.1 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울 교통공사 |
URL | https://data.seoul.go.kr/dataList/OA-13192/F/1/datasetView.do |
설치현황 is highly imbalanced (55.8%) | Imbalance |
Reproduction
Analysis started | 2023-12-11 06:11:18.763931 |
---|---|
Analysis finished | 2023-12-11 06:11:19.397611 |
Duration | 0.63 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
호선
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
2 | |
---|---|
3 | |
4 | |
1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
2 | 50 | |
3 | 34 | |
4 | 26 | |
1 | 10 | 8.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2 | 50 | |
3 | 34 | |
4 | 26 | |
1 | 10 | 8.3% |
역명
Text
Distinct | 110 |
---|---|
Distinct (%) | 91.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
Value | Count | Frequency (%) |
서울 | 2 | 1.7% |
충무로 | 2 | 1.7% |
동대문역사문화공원 | 2 | 1.7% |
을지로3가 | 2 | 1.7% |
교대 | 2 | 1.7% |
시청 | 2 | 1.7% |
동대문 | 2 | 1.7% |
종로3가 | 2 | 1.7% |
신설동 | 2 | 1.7% |
사당 | 2 | 1.7% |
Other values (100) | 100 |
Most occurring characters
Value | Count | Frequency (%) |
대 | 21 | 5.9% |
신 | 15 | 4.2% |
구 | 15 | 4.2% |
동 | 13 | 3.7% |
로 | 11 | 3.1% |
입 | 9 | 2.5% |
문 | 9 | 2.5% |
지 | 8 | 2.3% |
가 | 7 | 2.0% |
청 | 6 | 1.7% |
Other values (131) | 239 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 347 | |
Decimal Number | 6 | 1.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 21 | 6.1% |
신 | 15 | 4.3% |
구 | 15 | 4.3% |
동 | 13 | 3.7% |
로 | 11 | 3.2% |
입 | 9 | 2.6% |
문 | 9 | 2.6% |
지 | 8 | 2.3% |
가 | 7 | 2.0% |
청 | 6 | 1.7% |
Other values (128) | 233 |
Decimal Number
Value | Count | Frequency (%) |
3 | 4 | |
5 | 1 | 16.7% |
4 | 1 | 16.7% |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 347 | |
Common | 6 | 1.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 21 | 6.1% |
신 | 15 | 4.3% |
구 | 15 | 4.3% |
동 | 13 | 3.7% |
로 | 11 | 3.2% |
입 | 9 | 2.6% |
문 | 9 | 2.6% |
지 | 8 | 2.3% |
가 | 7 | 2.0% |
청 | 6 | 1.7% |
Other values (128) | 233 |
Common
Value | Count | Frequency (%) |
3 | 4 | |
5 | 1 | 16.7% |
4 | 1 | 16.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 347 | |
ASCII | 6 | 1.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
대 | 21 | 6.1% |
신 | 15 | 4.3% |
구 | 15 | 4.3% |
동 | 13 | 3.7% |
로 | 11 | 3.2% |
입 | 9 | 2.6% |
문 | 9 | 2.6% |
지 | 8 | 2.3% |
가 | 7 | 2.0% |
청 | 6 | 1.7% |
Other values (128) | 233 |
ASCII
Value | Count | Frequency (%) |
3 | 4 | |
5 | 1 | 16.7% |
4 | 1 | 16.7% |
설치현황
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
<NA> | |
---|---|
1 | |
2 | 5 |
6 | 3 |
5 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.3 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.7% |
Sample
1st row | 2 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 1 |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 92 | |
1 | 18 | 15.0% |
2 | 5 | 4.2% |
6 | 3 | 2.5% |
5 | 1 | 0.8% |
3 | 1 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 92 | |
1 | 18 | 15.0% |
2 | 5 | 4.2% |
6 | 3 | 2.5% |
5 | 1 | 0.8% |
3 | 1 | 0.8% |
호선 | 설치현황 | |
---|---|---|
호선 | 1.000 | 0.000 |
설치현황 | 0.000 | 1.000 |
호선 | 설치현황 | |
---|---|---|
호선 | 1.000 | 0.000 |
설치현황 | 0.000 | 1.000 |
호선 | 설치현황 | |
---|---|---|
호선 | 1.000 | 0.000 |
설치현황 | 0.000 | 1.000 |
호선 | 역명 | 설치현황 | |
---|---|---|---|
0 | 1 | 서울 | 2 |
1 | 1 | 시청 | <NA> |
2 | 1 | 종각 | <NA> |
3 | 1 | 종로3가 | 1 |
4 | 1 | 종로5가 | <NA> |
5 | 1 | 동대문 | <NA> |
6 | 1 | 동묘앞 | <NA> |
7 | 1 | 신설동 | 6 |
8 | 1 | 제기동 | <NA> |
9 | 1 | 청량리 | 1 |
호선 | 역명 | 설치현황 | |
---|---|---|---|
110 | 4 | 회현 | 1 |
111 | 4 | 서울 | 2 |
112 | 4 | 숙대입구 | <NA> |
113 | 4 | 삼각지 | <NA> |
114 | 4 | 신용산 | 1 |
115 | 4 | 이촌 | 1 |
116 | 4 | 동작 | <NA> |
117 | 4 | 총신대입구 | <NA> |
118 | 4 | 사당 | 1 |
119 | 4 | 남태령 | <NA> |