Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 126 |
Missing cells | 130 |
Missing cells (%) | 14.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.1 KiB |
Average record size in memory | 58.0 B |
Variable types
Text | 2 |
---|---|
Categorical | 2 |
Unsupported | 2 |
Numeric | 1 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울교통공사 |
URL | https://data.seoul.go.kr/dataList/OA-11572/S/1/datasetView.do |
시 설 개 요 is highly overall correlated with Unnamed: 4 | High correlation |
Unnamed: 4 is highly overall correlated with 시 설 개 요 | High correlation |
시 설 명 has 118 (93.7%) missing values | Missing |
Unnamed: 3 has 5 (4.0%) missing values | Missing |
준공년도 has 6 (4.8%) missing values | Missing |
Unnamed: 3 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 5 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-04-29 15:52:18.094300 |
---|---|
Analysis finished | 2024-04-29 15:52:19.034643 |
Duration | 0.94 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시 설 명
Text
MISSING
 
Distinct | 6 |
---|---|
Distinct (%) | 75.0% |
Missing | 118 |
Missing (%) | 93.7% |
Memory size | 1.1 KiB |
Value | Count | Frequency (%) |
2호선 | 2 | |
3호선 | 2 | |
호 | 1 | |
선 | 1 | |
총 | 1 | |
계 | 1 | |
120역 | 1 | |
1호선 | 1 | |
4호선 | 1 |
Most occurring characters
Value | Count | Frequency (%) |
호 | 7 | |
선 | 7 | |
2 | 3 | |
3 | ||
3 | 2 | 6.9% |
1 | 2 | 6.9% |
총 | 1 | 3.4% |
계 | 1 | 3.4% |
0 | 1 | 3.4% |
역 | 1 | 3.4% |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 17 | |
Decimal Number | 9 | |
Space Separator | 3 | 10.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
호 | 7 | |
선 | 7 | |
총 | 1 | 5.9% |
계 | 1 | 5.9% |
역 | 1 | 5.9% |
Decimal Number
Value | Count | Frequency (%) |
2 | 3 | |
3 | 2 | |
1 | 2 | |
0 | 1 | 11.1% |
4 | 1 | 11.1% |
Space Separator
Value | Count | Frequency (%) |
3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 17 | |
Common | 12 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
2 | 3 | |
3 | ||
3 | 2 | |
1 | 2 | |
0 | 1 | 8.3% |
4 | 1 | 8.3% |
Hangul
Value | Count | Frequency (%) |
호 | 7 | |
선 | 7 | |
총 | 1 | 5.9% |
계 | 1 | 5.9% |
역 | 1 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 17 | |
ASCII | 12 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
호 | 7 | |
선 | 7 | |
총 | 1 | 5.9% |
계 | 1 | 5.9% |
역 | 1 | 5.9% |
ASCII
Value | Count | Frequency (%) |
2 | 3 | |
3 | ||
3 | 2 | |
1 | 2 | |
0 | 1 | 8.3% |
4 | 1 | 8.3% |
Unnamed: 1
Text
Distinct | 116 |
---|---|
Distinct (%) | 92.8% |
Missing | 1 |
Missing (%) | 0.8% |
Memory size | 1.1 KiB |
Value | Count | Frequency (%) |
대 | 15 | 5.4% |
신 | 12 | 4.3% |
동 | 10 | 3.6% |
구 | 8 | 2.9% |
로 | 6 | 2.2% |
수 | 5 | 1.8% |
당 | 5 | 1.8% |
문 | 5 | 1.8% |
역 | 4 | 1.4% |
천 | 4 | 1.4% |
Other values (133) | 204 |
Most occurring characters
Value | Count | Frequency (%) |
159 | ||
대 | 21 | 3.9% |
신 | 15 | 2.8% |
구 | 15 | 2.8% |
동 | 13 | 2.4% |
로 | 11 | 2.1% |
역 | 11 | 2.1% |
입 | 9 | 1.7% |
문 | 9 | 1.7% |
지 | 8 | 1.5% |
Other values (136) | 262 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 360 | |
Space Separator | 159 | |
Decimal Number | 14 | 2.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 21 | 5.8% |
신 | 15 | 4.2% |
구 | 15 | 4.2% |
동 | 13 | 3.6% |
로 | 11 | 3.1% |
역 | 11 | 3.1% |
입 | 9 | 2.5% |
문 | 9 | 2.5% |
지 | 8 | 2.2% |
가 | 7 | 1.9% |
Other values (128) | 241 |
Decimal Number
Value | Count | Frequency (%) |
3 | 5 | |
4 | 2 | 14.3% |
5 | 2 | 14.3% |
0 | 2 | 14.3% |
6 | 1 | 7.1% |
2 | 1 | 7.1% |
1 | 1 | 7.1% |
Space Separator
Value | Count | Frequency (%) |
159 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 360 | |
Common | 173 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 21 | 5.8% |
신 | 15 | 4.2% |
구 | 15 | 4.2% |
동 | 13 | 3.6% |
로 | 11 | 3.1% |
역 | 11 | 3.1% |
입 | 9 | 2.5% |
문 | 9 | 2.5% |
지 | 8 | 2.2% |
가 | 7 | 1.9% |
Other values (128) | 241 |
Common
Value | Count | Frequency (%) |
159 | ||
3 | 5 | 2.9% |
4 | 2 | 1.2% |
5 | 2 | 1.2% |
0 | 2 | 1.2% |
6 | 1 | 0.6% |
2 | 1 | 0.6% |
1 | 1 | 0.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 360 | |
ASCII | 173 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
159 | ||
3 | 5 | 2.9% |
4 | 2 | 1.2% |
5 | 2 | 1.2% |
0 | 2 | 1.2% |
6 | 1 | 0.6% |
2 | 1 | 0.6% |
1 | 1 | 0.6% |
Hangul
Value | Count | Frequency (%) |
대 | 21 | 5.8% |
신 | 15 | 4.2% |
구 | 15 | 4.2% |
동 | 13 | 3.6% |
로 | 11 | 3.1% |
역 | 11 | 3.1% |
입 | 9 | 2.5% |
문 | 9 | 2.5% |
지 | 8 | 2.2% |
가 | 7 | 1.9% |
Other values (128) | 241 |
시 설 개 요
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
상대식 | |
---|---|
섬식 | |
<NA> | 5 |
섬 식 | 5 |
형 식 | 1 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.7777778 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.8% |
Sample
1st row | 형 식 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 섬 식 |
5th row | 상대식 |
Common Values
Value | Count | Frequency (%) |
상대식 | 82 | |
섬식 | 33 | |
<NA> | 5 | 4.0% |
섬 식 | 5 | 4.0% |
형 식 | 1 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
상대식 | 82 | |
섬식 | 33 | |
식 | 6 | 4.5% |
na | 5 | 3.8% |
섬 | 5 | 3.8% |
형 | 1 | 0.8% |
Unnamed: 3
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 5 |
---|---|
Missing (%) | 4.0% |
Memory size | 1.1 KiB |
Unnamed: 4
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 6.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
2층 | |
---|---|
3층 | |
4층 | |
<NA> | 5 |
층 수 | 1 |
Other values (3) | 3 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0873016 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 3.2% |
Sample
1st row | 층 수 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 2층 |
5th row | 2층 |
Common Values
Value | Count | Frequency (%) |
2층 | 79 | |
3층 | 27 | 21.4% |
4층 | 11 | 8.7% |
<NA> | 5 | 4.0% |
층 수 | 1 | 0.8% |
6층 | 1 | 0.8% |
1층 | 1 | 0.8% |
5층 | 1 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2층 | 79 | |
3층 | 27 | 21.3% |
4층 | 11 | 8.7% |
na | 5 | 3.9% |
층 | 1 | 0.8% |
수 | 1 | 0.8% |
6층 | 1 | 0.8% |
1층 | 1 | 0.8% |
5층 | 1 | 0.8% |
Unnamed: 5
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 0 |
---|---|
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
준공년도
Real number (ℝ)
MISSING
 
Distinct | 13 |
---|---|
Distinct (%) | 10.8% |
Missing | 6 |
Missing (%) | 4.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1985.0583 |
Minimum | 1974 |
---|---|
Maximum | 2010 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.2 KiB |
Quantile statistics
Minimum | 1974 |
---|---|
5-th percentile | 1974 |
Q1 | 1983 |
median | 1985 |
Q3 | 1985 |
95-th percentile | 1994.1 |
Maximum | 2010 |
Range | 36 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 6.4720418 |
---|---|
Coefficient of variation (CV) | 0.0032603786 |
Kurtosis | 5.372497 |
Mean | 1985.0583 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.7457051 |
Sum | 238207 |
Variance | 41.887325 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1985 | 47 | |
1984 | 17 | 13.5% |
1983 | 14 | 11.1% |
1980 | 11 | 8.7% |
1974 | 9 | 7.1% |
1993 | 8 | 6.3% |
1982 | 4 | 3.2% |
2010 | 3 | 2.4% |
2005 | 2 | 1.6% |
1992 | 2 | 1.6% |
Other values (3) | 3 | 2.4% |
(Missing) | 6 | 4.8% |
Value | Count | Frequency (%) |
1974 | 9 | 7.1% |
1980 | 11 | 8.7% |
1982 | 4 | 3.2% |
1983 | 14 | 11.1% |
1984 | 17 | 13.5% |
1985 | 47 | |
1990 | 1 | 0.8% |
1992 | 2 | 1.6% |
1993 | 8 | 6.3% |
1994 | 1 | 0.8% |
Value | Count | Frequency (%) |
2010 | 3 | 2.4% |
2005 | 2 | 1.6% |
1996 | 1 | 0.8% |
1994 | 1 | 0.8% |
1993 | 8 | 6.3% |
1992 | 2 | 1.6% |
1990 | 1 | 0.8% |
1985 | 47 | |
1984 | 17 | 13.5% |
1983 | 14 | 11.1% |
시 설 명 | 시 설 개 요 | Unnamed: 4 | 준공년도 | |
---|---|---|---|---|
시 설 명 | 1.000 | 1.000 | 1.000 | 0.000 |
시 설 개 요 | 1.000 | 1.000 | 0.713 | 0.236 |
Unnamed: 4 | 1.000 | 0.713 | 1.000 | 0.708 |
준공년도 | 0.000 | 0.236 | 0.708 | 1.000 |
Unnamed: 4 | 시 설 개 요 | |
---|---|---|
Unnamed: 4 | 1.000 | 0.575 |
시 설 개 요 | 0.575 | 1.000 |
준공년도 | 시 설 개 요 | Unnamed: 4 | |
---|---|---|---|
준공년도 | 1.000 | 0.229 | 0.490 |
시 설 개 요 | 0.229 | 1.000 | 0.575 |
Unnamed: 4 | 0.490 | 0.575 | 1.000 |
시 설 명 | Unnamed: 1 | 시 설 개 요 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | 준공년도 | |
---|---|---|---|---|---|---|---|
0 | 호 선 | 역 명 | 형 식 | 길이(M) | 층 수 | 면적(㎡) | <NA> |
1 | 총 계 120역 | <NA> | <NA> | NaN | <NA> | 996371 | <NA> |
2 | 1호선 | 소계 10역 | <NA> | NaN | <NA> | 87594 | <NA> |
3 | <NA> | 서 울 역 | 섬 식 | 210 | 2층 | 10335 | 1974 |
4 | <NA> | 시 청 | 상대식 | 210 | 2층 | 10421 | 1974 |
5 | <NA> | 종 각 | 상대식 | 210 | 2층 | 9072 | 1974 |
6 | <NA> | 종 로 3 가 | 상대식 | 210 | 2층 | 9311 | 1974 |
7 | <NA> | 종 로 5 가 | 상대식 | 210 | 2층 | 10465 | 1974 |
8 | <NA> | 동 대 문 | 상대식 | 210 | 2층 | 5490 | 1974 |
9 | <NA> | 동 묘 앞 | 상대식 | 210 | 6층 | 9473 | 2005 |
시 설 명 | Unnamed: 1 | 시 설 개 요 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | 준공년도 | |
---|---|---|---|---|---|---|---|
116 | <NA> | 회 현 | 섬식 | 205 | 4층 | 11073 | 1985 |
117 | <NA> | 서 울 역 | 섬식 | 205 | 2층 | 9564 | 1985 |
118 | <NA> | 숙 대 입 구 | 상대식 | 205 | 2층 | 7027 | 1985 |
119 | <NA> | 삼 각 지 | 상대식 | 205 | 2층 | 9164 | 1985 |
120 | <NA> | 신 용 산 | 상대식 | 205 | 2층 | 6439 | 1985 |
121 | <NA> | 이 촌 | 상대식 | 205 | 2층 | 7523 | 1985 |
122 | <NA> | 동 작 | 상대식 | 205 | 3층 | 14139 | 1985 |
123 | <NA> | 총신대입구 | 상대식 | 205 | 2층 | 7596 | 1985 |
124 | <NA> | 사 당 | 섬식 | 205 | 3층 | 15490 | 1985 |
125 | <NA> | 남 태 령 | 섬식 | 205 | 3층 | 6120 | 1994 |