Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 2285 |
Missing cells | 3 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 165.3 KiB |
Average record size in memory | 74.1 B |
Variable types
Numeric | 2 |
---|---|
Text | 2 |
Categorical | 5 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울교통공사 |
URL | https://data.seoul.go.kr/dataList/OA-12926/F/1/datasetView.do |
기능 is highly overall correlated with 용도 and 2 other fields | High correlation |
필터유무 is highly overall correlated with 기능 | High correlation |
용도 is highly overall correlated with 기능 and 1 other fields | High correlation |
위치 is highly overall correlated with 용도 and 1 other fields | High correlation |
용도 is highly imbalanced (57.9%) | Imbalance |
구조물형태 is highly imbalanced (56.9%) | Imbalance |
높이(m) has 26 (1.1%) zeros | Zeros |
Reproduction
Analysis started | 2024-04-29 16:38:34.534917 |
---|---|
Analysis finished | 2024-04-29 16:38:35.634549 |
Duration | 1.1 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
호선
Real number (ℝ)
Distinct | 8 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.5698031 |
Minimum | 1 |
---|---|
Maximum | 8 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 20.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 3 |
median | 5 |
Q3 | 6 |
95-th percentile | 7 |
Maximum | 8 |
Range | 7 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.052306 |
---|---|
Coefficient of variation (CV) | 0.44910163 |
Kurtosis | -1.2458931 |
Mean | 4.5698031 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.09314761 |
Sum | 10442 |
Variance | 4.2119599 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
5 | 459 | |
7 | 442 | |
2 | 439 | |
6 | 273 | |
3 | 270 | |
4 | 178 | 7.8% |
8 | 113 | 4.9% |
1 | 111 | 4.9% |
Value | Count | Frequency (%) |
1 | 111 | 4.9% |
2 | 439 | |
3 | 270 | |
4 | 178 | 7.8% |
5 | 459 | |
6 | 273 | |
7 | 442 | |
8 | 113 | 4.9% |
Value | Count | Frequency (%) |
8 | 113 | 4.9% |
7 | 442 | |
6 | 273 | |
5 | 459 | |
4 | 178 | 7.8% |
3 | 270 | |
2 | 439 | |
1 | 111 | 4.9% |
번호
Text
Distinct | 527 |
---|---|
Distinct (%) | 23.1% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 18.0 KiB |
Value | Count | Frequency (%) |
3 | 8 | 0.4% |
56 | 8 | 0.4% |
92 | 8 | 0.4% |
81 | 8 | 0.4% |
79 | 8 | 0.4% |
78 | 8 | 0.4% |
77 | 8 | 0.4% |
76 | 8 | 0.4% |
75 | 8 | 0.4% |
74 | 8 | 0.4% |
Other values (517) | 2204 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 1150 | |
2 | 916 | |
3 | 781 | |
4 | 581 | |
5 | 465 | |
6 | 460 | 7.5% |
7 | 448 | 7.3% |
0 | 436 | 7.1% |
9 | 425 | 6.9% |
8 | 415 | 6.8% |
Other values (2) | 69 | 1.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 6077 | |
Dash Punctuation | 67 | 1.1% |
Other Punctuation | 2 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 1150 | |
2 | 916 | |
3 | 781 | |
4 | 581 | |
5 | 465 | |
6 | 460 | 7.6% |
7 | 448 | 7.4% |
0 | 436 | 7.2% |
9 | 425 | 7.0% |
8 | 415 | 6.8% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 67 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 6146 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 1150 | |
2 | 916 | |
3 | 781 | |
4 | 581 | |
5 | 465 | |
6 | 460 | 7.5% |
7 | 448 | 7.3% |
0 | 436 | 7.1% |
9 | 425 | 6.9% |
8 | 415 | 6.8% |
Other values (2) | 69 | 1.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 6146 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 1150 | |
2 | 916 | |
3 | 781 | |
4 | 581 | |
5 | 465 | |
6 | 460 | 7.5% |
7 | 448 | 7.3% |
0 | 436 | 7.1% |
9 | 425 | 6.9% |
8 | 415 | 6.8% |
Other values (2) | 69 | 1.1% |
구간
Text
Distinct | 502 |
---|---|
Distinct (%) | 22.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.0 KiB |
Value | Count | Frequency (%) |
종로3가 | 20 | 0.9% |
영등포구청 | 18 | 0.8% |
충정로 | 17 | 0.7% |
사당 | 14 | 0.6% |
신설동~용두 | 14 | 0.6% |
시청 | 13 | 0.6% |
합정 | 12 | 0.5% |
삼각지 | 12 | 0.5% |
신설동 | 12 | 0.5% |
잠원~고속터미널 | 12 | 0.5% |
Other values (492) | 2141 |
Most occurring characters
Value | Count | Frequency (%) |
~ | 857 | 8.3% |
대 | 378 | 3.7% |
신 | 329 | 3.2% |
동 | 317 | 3.1% |
구 | 252 | 2.4% |
청 | 215 | 2.1% |
로 | 177 | 1.7% |
산 | 169 | 1.6% |
문 | 164 | 1.6% |
장 | 148 | 1.4% |
Other values (206) | 7297 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9196 | |
Math Symbol | 970 | 9.4% |
Decimal Number | 100 | 1.0% |
Dash Punctuation | 27 | 0.3% |
Uppercase Letter | 6 | 0.1% |
Open Punctuation | 2 | < 0.1% |
Close Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 378 | 4.1% |
신 | 329 | 3.6% |
동 | 317 | 3.4% |
구 | 252 | 2.7% |
청 | 215 | 2.3% |
로 | 177 | 1.9% |
산 | 169 | 1.8% |
문 | 164 | 1.8% |
장 | 148 | 1.6% |
가 | 145 | 1.6% |
Other values (197) | 6902 |
Decimal Number
Value | Count | Frequency (%) |
3 | 57 | |
4 | 24 | |
5 | 19 | 19.0% |
Math Symbol
Value | Count | Frequency (%) |
~ | 857 | |
∼ | 113 | 11.6% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 27 |
Uppercase Letter
Value | Count | Frequency (%) |
U | 6 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9196 | |
Common | 1101 | 10.7% |
Latin | 6 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 378 | 4.1% |
신 | 329 | 3.6% |
동 | 317 | 3.4% |
구 | 252 | 2.7% |
청 | 215 | 2.3% |
로 | 177 | 1.9% |
산 | 169 | 1.8% |
문 | 164 | 1.8% |
장 | 148 | 1.6% |
가 | 145 | 1.6% |
Other values (197) | 6902 |
Common
Value | Count | Frequency (%) |
~ | 857 | |
∼ | 113 | 10.3% |
3 | 57 | 5.2% |
- | 27 | 2.5% |
4 | 24 | 2.2% |
5 | 19 | 1.7% |
( | 2 | 0.2% |
) | 2 | 0.2% |
Latin
Value | Count | Frequency (%) |
U | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9196 | |
ASCII | 994 | 9.6% |
Math Operators | 113 | 1.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
~ | 857 | |
3 | 57 | 5.7% |
- | 27 | 2.7% |
4 | 24 | 2.4% |
5 | 19 | 1.9% |
U | 6 | 0.6% |
( | 2 | 0.2% |
) | 2 | 0.2% |
Hangul
Value | Count | Frequency (%) |
대 | 378 | 4.1% |
신 | 329 | 3.6% |
동 | 317 | 3.4% |
구 | 252 | 2.7% |
청 | 215 | 2.3% |
로 | 177 | 1.9% |
산 | 169 | 1.8% |
문 | 164 | 1.8% |
장 | 148 | 1.6% |
가 | 145 | 1.6% |
Other values (197) | 6902 |
Math Operators
Value | Count | Frequency (%) |
∼ | 113 |
용도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.0 KiB |
역사 | |
---|---|
본선 | |
역사(변전실) | 53 |
본선(변전실) | 7 |
본선(유치선) | 4 |
Other values (2) | 2 |
Length
Max length | 7 |
---|---|
Median length | 2 |
Mean length | 2.1417943 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 역사 |
---|---|
2nd row | 역사 |
3rd row | 역사 |
4th row | 역사 |
5th row | 본선 |
Common Values
Value | Count | Frequency (%) |
역사 | 1229 | |
본선 | 990 | |
역사(변전실) | 53 | 2.3% |
본선(변전실) | 7 | 0.3% |
본선(유치선) | 4 | 0.2% |
본선(폐) | 1 | < 0.1% |
출고선 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
역사 | 1229 | |
본선 | 990 | |
역사(변전실 | 53 | 2.3% |
본선(변전실 | 7 | 0.3% |
본선(유치선 | 4 | 0.2% |
본선(폐 | 1 | < 0.1% |
출고선 | 1 | < 0.1% |
기능
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.0 KiB |
배기 | |
---|---|
급기 | |
자연 | |
배기(폐) | 1 |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.0013129 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 급기 |
---|---|
2nd row | 배기 |
3rd row | 배기 |
4th row | 급기 |
5th row | 자연 |
Common Values
Value | Count | Frequency (%) |
배기 | 1058 | |
급기 | 913 | |
자연 | 313 | 13.7% |
배기(폐) | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
배기 | 1058 | |
급기 | 913 | |
자연 | 313 | 13.7% |
배기(폐 | 1 | < 0.1% |
위치
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.0 KiB |
보도 | |
---|---|
녹지 | |
차도 | |
기타 | 85 |
기타(폐) | 1 |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.0013129 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 기타 |
---|---|
2nd row | 기타 |
3rd row | 녹지 |
4th row | 녹지 |
5th row | 보도 |
Common Values
Value | Count | Frequency (%) |
보도 | 1696 | |
녹지 | 332 | 14.5% |
차도 | 171 | 7.5% |
기타 | 85 | 3.7% |
기타(폐) | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
보도 | 1696 | |
녹지 | 332 | 14.5% |
차도 | 171 | 7.5% |
기타 | 85 | 3.7% |
기타(폐 | 1 | < 0.1% |
높이(m)
Real number (ℝ)
ZEROS
 
Distinct | 282 |
---|---|
Distinct (%) | 12.4% |
Missing | 2 |
Missing (%) | 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.2554446 |
Minimum | 0 |
---|---|
Maximum | 13 |
Zeros | 26 |
Zeros (%) | 1.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 20.2 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0.15 |
Q1 | 0.6 |
median | 1.3 |
Q3 | 1.66 |
95-th percentile | 2.279 |
Maximum | 13 |
Range | 13 |
Interquartile range (IQR) | 1.06 |
Descriptive statistics
Standard deviation | 0.8279135 |
---|---|
Coefficient of variation (CV) | 0.65945842 |
Kurtosis | 25.670949 |
Mean | 1.2554446 |
Median Absolute Deviation (MAD) | 0.52 |
Skewness | 2.8228095 |
Sum | 2866.18 |
Variance | 0.68544076 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.6 | 140 | 6.1% |
1.5 | 106 | 4.6% |
1.6 | 75 | 3.3% |
1.2 | 56 | 2.5% |
2.0 | 53 | 2.3% |
1.4 | 51 | 2.2% |
1.7 | 50 | 2.2% |
1.3 | 48 | 2.1% |
0.7 | 45 | 2.0% |
0.5 | 38 | 1.7% |
Other values (272) | 1621 |
Value | Count | Frequency (%) |
0.0 | 26 | |
0.02 | 2 | 0.1% |
0.03 | 1 | < 0.1% |
0.04 | 4 | 0.2% |
0.05 | 2 | 0.1% |
0.06 | 1 | < 0.1% |
0.07 | 3 | 0.1% |
0.08 | 8 | 0.4% |
0.09 | 3 | 0.1% |
0.1 | 30 |
Value | Count | Frequency (%) |
13.0 | 1 | < 0.1% |
7.6 | 4 | |
7.0 | 1 | < 0.1% |
5.8 | 1 | < 0.1% |
5.5 | 1 | < 0.1% |
5.0 | 5 | |
4.89 | 1 | < 0.1% |
4.4 | 1 | < 0.1% |
4.36 | 1 | < 0.1% |
4.3 | 2 | 0.1% |
구조물형태
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.0 KiB |
탑형 | |
---|---|
지면형 | 202 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.0884026 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 탑형 |
---|---|
2nd row | 탑형 |
3rd row | 지면형 |
4th row | 탑형 |
5th row | 탑형 |
Common Values
Value | Count | Frequency (%) |
탑형 | 2083 | |
지면형 | 202 | 8.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
탑형 | 2083 | |
지면형 | 202 | 8.8% |
필터유무
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 18.0 KiB |
무 | |
---|---|
유 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 유 |
---|---|
2nd row | 무 |
3rd row | 무 |
4th row | 유 |
5th row | 무 |
Common Values
Value | Count | Frequency (%) |
무 | 1372 | |
유 | 913 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
무 | 1372 | |
유 | 913 |
호선 | 용도 | 기능 | 위치 | 높이(m) | 구조물형태 | 필터유무 | |
---|---|---|---|---|---|---|---|
호선 | 1.000 | 0.194 | 0.614 | 0.319 | 0.249 | 0.331 | 0.250 |
용도 | 0.194 | 1.000 | 0.753 | 0.665 | 0.294 | 0.092 | 0.227 |
기능 | 0.614 | 0.753 | 1.000 | 0.665 | 0.289 | 0.132 | 1.000 |
위치 | 0.319 | 0.665 | 0.665 | 1.000 | 0.199 | 0.094 | 0.080 |
높이(m) | 0.249 | 0.294 | 0.289 | 0.199 | 1.000 | 0.293 | 0.301 |
구조물형태 | 0.331 | 0.092 | 0.132 | 0.094 | 0.293 | 1.000 | 0.140 |
필터유무 | 0.250 | 0.227 | 1.000 | 0.080 | 0.301 | 0.140 | 1.000 |
기능 | 위치 | 구조물형태 | 필터유무 | 용도 | |
---|---|---|---|---|---|
기능 | 1.000 | 0.596 | 0.087 | 1.000 | 0.633 |
위치 | 0.596 | 1.000 | 0.115 | 0.098 | 0.508 |
구조물형태 | 0.087 | 0.115 | 1.000 | 0.090 | 0.098 |
필터유무 | 1.000 | 0.098 | 0.090 | 1.000 | 0.242 |
용도 | 0.633 | 0.508 | 0.098 | 0.242 | 1.000 |
호선 | 높이(m) | 용도 | 기능 | 위치 | 구조물형태 | 필터유무 | |
---|---|---|---|---|---|---|---|
호선 | 1.000 | 0.227 | 0.105 | 0.312 | 0.202 | 0.248 | 0.187 |
높이(m) | 0.227 | 1.000 | 0.106 | 0.193 | 0.126 | 0.300 | 0.310 |
용도 | 0.105 | 0.106 | 1.000 | 0.633 | 0.508 | 0.098 | 0.242 |
기능 | 0.312 | 0.193 | 0.633 | 1.000 | 0.596 | 0.087 | 1.000 |
위치 | 0.202 | 0.126 | 0.508 | 0.596 | 1.000 | 0.115 | 0.098 |
구조물형태 | 0.248 | 0.300 | 0.098 | 0.087 | 0.115 | 1.000 | 0.090 |
필터유무 | 0.187 | 0.310 | 0.242 | 1.000 | 0.098 | 0.090 | 1.000 |
호선 | 번호 | 구간 | 용도 | 기능 | 위치 | 높이(m) | 구조물형태 | 필터유무 | |
---|---|---|---|---|---|---|---|---|---|
0 | 1 | 3 | 서울역 | 역사 | 급기 | 기타 | 0.48 | 탑형 | 유 |
1 | 1 | 4 | 서울역 | 역사 | 배기 | 기타 | 0.5 | 탑형 | 무 |
2 | 1 | 5 | 서울역 | 역사 | 배기 | 녹지 | 0.24 | 지면형 | 무 |
3 | 1 | 6 | 서울역 | 역사 | 급기 | 녹지 | 0.55 | 탑형 | 유 |
4 | 1 | 7 | 서울역~시청 | 본선 | 자연 | 보도 | 0.64 | 탑형 | 무 |
5 | 1 | 8 | 서울역~시청 | 본선 | 자연 | 보도 | 1.74 | 탑형 | 무 |
6 | 1 | 9 | 서울역~시청 | 본선 | 자연 | 보도 | 0.67 | 탑형 | 무 |
7 | 1 | 10 | 서울역~시청 | 본선 | 자연 | 녹지 | 1.1 | 탑형 | 무 |
8 | 1 | 11 | 서울역~시청 | 본선 | 자연 | 보도 | 1.53 | 탑형 | 무 |
9 | 1 | 12 | 서울역~시청 | 본선 | 자연 | 차도 | 0.02 | 지면형 | 무 |
호선 | 번호 | 구간 | 용도 | 기능 | 위치 | 높이(m) | 구조물형태 | 필터유무 | |
---|---|---|---|---|---|---|---|---|---|
2275 | 8 | 104 | 강동구청∼토성 | 본선 | 배기 | 녹지 | 0.6 | 탑형 | 무 |
2276 | 8 | 105 | 강동구청∼토성 | 본선 | 급기 | 녹지 | 1.14 | 탑형 | 유 |
2277 | 8 | 106 | 강동구청∼토성 | 본선 | 배기 | 보도 | 0.74 | 탑형 | 무 |
2278 | 8 | 107 | 몽촌토성 | 역사 | 배기 | 녹지 | 0.59 | 탑형 | 무 |
2279 | 8 | 108 | 몽촌토성 | 역사 | 급기 | 녹지 | 1.62 | 탑형 | 유 |
2280 | 8 | 109 | 몽촌토성 | 역사 | 배기 | 보도 | 0.6 | 탑형 | 무 |
2281 | 8 | 110 | 몽촌토성 | 역사 | 급기 | 보도 | 1.55 | 탑형 | 유 |
2282 | 8 | 111 | 몽촌토성∼잠실 | 본선 | 배기 | 보도 | 0.63 | 탑형 | 무 |
2283 | 8 | 026-1 | 가락시장 | 역사 | 자연 | 보도 | 1.76 | 탑형 | 무 |
2284 | 8 | 026-2 | 가락시장 | 역사 | 자연 | 보도 | 1.76 | 탑형 | 무 |