Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 329 |
Missing cells | 335 |
Missing cells (%) | 12.7% |
Duplicate rows | 11 |
Duplicate rows (%) | 3.3% |
Total size in memory | 21.7 KiB |
Average record size in memory | 67.4 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Numeric | 1 |
DateTime | 2 |
Dataset
Description | 부산도시철도 역사내 등 임대시설물 시설명, 면적, 계약현황 등(호선, 역사명, 상가명, 업종, 면적, 수량, 계약시작일, 계약종료일) |
---|---|
Author | 부산교통공사 |
URL | https://www.data.go.kr/data/3057656/fileData.do |
Reproduction
Analysis started | 2024-03-23 05:37:03.059457 |
---|---|
Analysis finished | 2024-03-23 05:37:04.401425 |
Duration | 1.34 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
호선
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
2 | |
---|---|
1 | |
4 | 15 |
3 | 13 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
2 | 176 | |
1 | 125 | |
4 | 15 | 4.6% |
3 | 13 | 4.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2 | 176 | |
1 | 125 | |
4 | 15 | 4.6% |
3 | 13 | 4.0% |
역사명
Text
Distinct | 85 |
---|---|
Distinct (%) | 25.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
Value | Count | Frequency (%) |
수영역 | 37 | 11.2% |
전포역 | 29 | 8.8% |
양산역 | 19 | 5.7% |
중앙역 | 16 | 4.8% |
금련산역 | 14 | 4.2% |
광안역 | 13 | 3.9% |
연산역 | 11 | 3.3% |
자갈치역 | 10 | 3.0% |
센텀시티역 | 9 | 2.7% |
중동역 | 9 | 2.7% |
Other values (74) | 164 |
Most occurring characters
Value | Count | Frequency (%) |
역 | 331 | |
산 | 66 | 6.0% |
수 | 38 | 3.4% |
영 | 38 | 3.4% |
전 | 35 | 3.2% |
포 | 32 | 2.9% |
동 | 26 | 2.3% |
양 | 26 | 2.3% |
중 | 25 | 2.3% |
장 | 21 | 1.9% |
Other values (106) | 471 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1103 | |
Space Separator | 2 | 0.2% |
Other Punctuation | 2 | 0.2% |
Open Punctuation | 1 | 0.1% |
Close Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
역 | 331 | |
산 | 66 | 6.0% |
수 | 38 | 3.4% |
영 | 38 | 3.4% |
전 | 35 | 3.2% |
포 | 32 | 2.9% |
동 | 26 | 2.4% |
양 | 26 | 2.4% |
중 | 25 | 2.3% |
장 | 21 | 1.9% |
Other values (102) | 465 |
Space Separator
Value | Count | Frequency (%) |
2 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1103 | |
Common | 6 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
역 | 331 | |
산 | 66 | 6.0% |
수 | 38 | 3.4% |
영 | 38 | 3.4% |
전 | 35 | 3.2% |
포 | 32 | 2.9% |
동 | 26 | 2.4% |
양 | 26 | 2.4% |
중 | 25 | 2.3% |
장 | 21 | 1.9% |
Other values (102) | 465 |
Common
Value | Count | Frequency (%) |
2 | ||
, | 2 | |
( | 1 | |
) | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1103 | |
ASCII | 6 | 0.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
역 | 331 | |
산 | 66 | 6.0% |
수 | 38 | 3.4% |
영 | 38 | 3.4% |
전 | 35 | 3.2% |
포 | 32 | 2.9% |
동 | 26 | 2.4% |
양 | 26 | 2.4% |
중 | 25 | 2.3% |
장 | 21 | 1.9% |
Other values (102) | 465 |
ASCII
Value | Count | Frequency (%) |
2 | ||
, | 2 | |
( | 1 | |
) | 1 |
시설명
Categorical
IMBALANCE
 
Distinct | 20 |
---|---|
Distinct (%) | 6.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
상가 | |
---|---|
개발상가 | |
전문상가(화장품) | |
전문상가(편의점) | |
통로상가 | 15 |
Other values (15) |
Length
Max length | 12 |
---|---|
Median length | 2 |
Mean length | 3.7659574 |
Min length | 2 |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 2.7% |
Sample
1st row | 상가 |
---|---|
2nd row | 상가 |
3rd row | 상가 |
4th row | 상가 |
5th row | 상가 |
Common Values
Value | Count | Frequency (%) |
상가 | 206 | |
개발상가 | 28 | 8.5% |
전문상가(화장품) | 25 | 7.6% |
전문상가(편의점) | 21 | 6.4% |
통로상가 | 15 | 4.6% |
전문상가(디저트카페) | 10 | 3.0% |
커피전문점 | 5 | 1.5% |
사무실 | 4 | 1.2% |
약국 | 2 | 0.6% |
소극장 | 2 | 0.6% |
Other values (10) | 11 | 3.3% |
Length
Value | Count | Frequency (%) |
상가 | 207 | |
개발상가 | 28 | 8.5% |
전문상가(화장품 | 25 | 7.6% |
전문상가(편의점 | 21 | 6.4% |
통로상가 | 15 | 4.6% |
전문상가(디저트카페 | 10 | 3.0% |
커피전문점 | 5 | 1.5% |
사무실 | 4 | 1.2% |
전문상가(건강식품 | 2 | 0.6% |
소극장 | 2 | 0.6% |
Other values (9) | 10 | 3.0% |
면적(제곱미터)
Real number (ℝ)
Distinct | 251 |
---|---|
Distinct (%) | 76.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 132.01535 |
Minimum | 6.05 |
---|---|
Maximum | 12258 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.0 KiB |
Quantile statistics
Minimum | 6.05 |
---|---|
5-th percentile | 9.958 |
Q1 | 20 |
median | 30 |
Q3 | 45.13 |
95-th percentile | 311.9 |
Maximum | 12258 |
Range | 12251.95 |
Interquartile range (IQR) | 25.13 |
Descriptive statistics
Standard deviation | 867.25542 |
---|---|
Coefficient of variation (CV) | 6.5693529 |
Kurtosis | 161.48685 |
Mean | 132.01535 |
Median Absolute Deviation (MAD) | 12.19 |
Skewness | 12.506922 |
Sum | 43433.05 |
Variance | 752131.96 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
30.0 | 24 | 7.3% |
27.36 | 9 | 2.7% |
20.0 | 7 | 2.1% |
27.0 | 6 | 1.8% |
10.0 | 5 | 1.5% |
29.4 | 4 | 1.2% |
16.49 | 3 | 0.9% |
60.0 | 3 | 0.9% |
32.4 | 3 | 0.9% |
28.0 | 3 | 0.9% |
Other values (241) | 262 |
Value | Count | Frequency (%) |
6.05 | 1 | |
7.0 | 1 | |
7.59 | 1 | |
7.82 | 1 | |
8.0 | 1 | |
8.05 | 1 | |
8.14 | 1 | |
8.58 | 1 | |
8.59 | 1 | |
9.0 | 1 |
Value | Count | Frequency (%) |
12258.0 | 1 | |
9691.0 | 1 | |
1025.33 | 1 | |
948.57 | 1 | |
927.29 | 1 | |
821.8 | 1 | |
820.9 | 1 | |
775.18 | 1 | |
731.85 | 1 | |
691.46 | 1 |
수량
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
1 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 329 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 329 |
계약시작일
Date
MISSING
 
Distinct | 191 |
---|---|
Distinct (%) | 59.1% |
Missing | 6 |
Missing (%) | 1.8% |
Memory size | 2.7 KiB |
Minimum | 2010-06-01 00:00:00 |
---|---|
Maximum | 2024-03-05 00:00:00 |
계약종료일
Date
MISSING
 
Distinct | 196 |
---|---|
Distinct (%) | 60.7% |
Missing | 6 |
Missing (%) | 1.8% |
Memory size | 2.7 KiB |
Minimum | 2023-07-02 00:00:00 |
---|---|
Maximum | 2040-11-30 00:00:00 |
사업진행단계
Text
MISSING
 
Distinct | 5 |
---|---|
Distinct (%) | 83.3% |
Missing | 323 |
Missing (%) | 98.2% |
Memory size | 2.7 KiB |
Length
Max length | 11 |
---|---|
Median length | 10 |
Mean length | 7.8333333 |
Min length | 2 |
Characters and Unicode
Total characters | 47 |
---|---|
Distinct characters | 21 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 66.7% |
Sample
1st row | 소송 진행 중 |
---|---|
2nd row | 개장 준비 중 |
3rd row | 상가 정상화 추진 중 |
4th row | 공실(계약진행 중) |
5th row | 공실(계약진행 중) |
Value | Count | Frequency (%) |
중 | 5 | |
공실(계약진행 | 2 | 13.3% |
소송 | 1 | 6.7% |
진행 | 1 | 6.7% |
개장 | 1 | 6.7% |
준비 | 1 | 6.7% |
상가 | 1 | 6.7% |
정상화 | 1 | 6.7% |
추진 | 1 | 6.7% |
공실 | 1 | 6.7% |
Most occurring characters
Value | Count | Frequency (%) |
9 | ||
중 | 5 | |
진 | 4 | 8.5% |
공 | 3 | 6.4% |
행 | 3 | 6.4% |
실 | 3 | 6.4% |
( | 2 | 4.3% |
계 | 2 | 4.3% |
약 | 2 | 4.3% |
) | 2 | 4.3% |
Other values (11) | 12 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 34 | |
Space Separator | 9 | 19.1% |
Open Punctuation | 2 | 4.3% |
Close Punctuation | 2 | 4.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
중 | 5 | |
진 | 4 | |
공 | 3 | 8.8% |
행 | 3 | 8.8% |
실 | 3 | 8.8% |
계 | 2 | 5.9% |
약 | 2 | 5.9% |
상 | 2 | 5.9% |
비 | 1 | 2.9% |
화 | 1 | 2.9% |
Other values (8) | 8 |
Space Separator
Value | Count | Frequency (%) |
9 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 34 | |
Common | 13 | 27.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
중 | 5 | |
진 | 4 | |
공 | 3 | 8.8% |
행 | 3 | 8.8% |
실 | 3 | 8.8% |
계 | 2 | 5.9% |
약 | 2 | 5.9% |
상 | 2 | 5.9% |
비 | 1 | 2.9% |
화 | 1 | 2.9% |
Other values (8) | 8 |
Common
Value | Count | Frequency (%) |
9 | ||
( | 2 | 15.4% |
) | 2 | 15.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 34 | |
ASCII | 13 | 27.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
9 | ||
( | 2 | 15.4% |
) | 2 | 15.4% |
Hangul
Value | Count | Frequency (%) |
중 | 5 | |
진 | 4 | |
공 | 3 | 8.8% |
행 | 3 | 8.8% |
실 | 3 | 8.8% |
계 | 2 | 5.9% |
약 | 2 | 5.9% |
상 | 2 | 5.9% |
비 | 1 | 2.9% |
화 | 1 | 2.9% |
Other values (8) | 8 |
호선 | 역사명 | 시설명 | 면적(제곱미터) | 사업진행단계 | |
---|---|---|---|---|---|
호선 | 1.000 | 0.994 | 0.659 | 0.000 | 1.000 |
역사명 | 0.994 | 1.000 | 0.895 | 1.000 | 1.000 |
시설명 | 0.659 | 0.895 | 1.000 | 0.000 | NaN |
면적(제곱미터) | 0.000 | 1.000 | 0.000 | 1.000 | 1.000 |
사업진행단계 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
시설명 | 호선 | |
---|---|---|
시설명 | 1.000 | 0.359 |
호선 | 0.359 | 1.000 |
면적(제곱미터) | 호선 | 시설명 | |
---|---|---|---|
면적(제곱미터) | 1.000 | 0.000 | 0.000 |
호선 | 0.000 | 1.000 | 0.359 |
시설명 | 0.000 | 0.359 | 1.000 |
호선 | 역사명 | 시설명 | 면적(제곱미터) | 수량 | 계약시작일 | 계약종료일 | 사업진행단계 | |
---|---|---|---|---|---|---|---|---|
0 | 1 | 장림역 | 상가 | 23.6 | 1 | 2022-04-27 | 2027-04-26 | <NA> |
1 | 1 | 신평역 | 상가 | 55.89 | 1 | 2020-05-15 | 2025-05-14 | <NA> |
2 | 1 | 신평역 | 상가 | 75.02 | 1 | 2023-04-02 | 2028-04-01 | <NA> |
3 | 1 | 신평역 | 상가 | 820.9 | 1 | 2024-02-01 | 2029-01-31 | <NA> |
4 | 1 | 하단역 | 상가 | 65.6 | 1 | 2020-07-18 | 2025-07-17 | <NA> |
5 | 1 | 하단역 | 상가 | 23.45 | 1 | 2023-09-22 | 2028-09-21 | <NA> |
6 | 1 | 당리역 | 상가 | 14.17 | 1 | 2021-11-24 | 2026-11-23 | <NA> |
7 | 1 | 당리역 | 상가 | 14.18 | 1 | 2021-11-27 | 2026-11-26 | <NA> |
8 | 1 | 괴정역 | 상가 | 28.0 | 1 | 2021-06-07 | 2026-06-06 | <NA> |
9 | 1 | 동대신역 | 상가 | 9.12 | 1 | 2022-02-24 | 2027-02-23 | <NA> |
호선 | 역사명 | 시설명 | 면적(제곱미터) | 수량 | 계약시작일 | 계약종료일 | 사업진행단계 | |
---|---|---|---|---|---|---|---|---|
319 | 4 | 동래역 | 상가 | 60.59 | 1 | 2020-06-18 | 2025-06-17 | <NA> |
320 | 4 | 수안역 | 상가 | 61.66 | 1 | 2021-09-17 | 2026-09-16 | <NA> |
321 | 4 | 낙민역 | 상가 | 12.63 | 1 | 2024-02-19 | 2029-02-18 | <NA> |
322 | 4 | 충렬사역 | 상가 | 9.93 | 1 | 2020-03-28 | 2025-03-27 | <NA> |
323 | 4 | 명장역 | 상가 | 10.92 | 1 | 2022-06-26 | 2027-06-25 | <NA> |
324 | 4 | 서동역 | 상가 | 12.35 | 1 | 2021-05-06 | 2026-05-05 | <NA> |
325 | 4 | 금사역 | 상가 | 16.49 | 1 | 2023-01-15 | 2028-01-14 | <NA> |
326 | 4 | 반여농산물시장역 | 상가 | 41.91 | 1 | 2022-09-11 | 2024-09-10 | <NA> |
327 | 4 | 석대역 | 상가 | 10.36 | 1 | 2021-11-02 | 2026-11-01 | <NA> |
328 | 4 | 영산대역 | 상가 | 9.41 | 1 | 2021-08-13 | 2026-08-12 | <NA> |
Most frequently occurring
호선 | 역사명 | 시설명 | 면적(제곱미터) | 수량 | 계약시작일 | 계약종료일 | 사업진행단계 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
8 | 2 | 전포역 | 상가 | 30.0 | 1 | 2024-01-01 | 2024-12-31 | <NA> | 6 |
3 | 2 | 수영역 | 상가 | 27.36 | 1 | 2023-06-03 | 2028-06-02 | <NA> | 3 |
4 | 2 | 수영역 | 상가 | 27.36 | 1 | 2023-07-08 | 2028-07-07 | <NA> | 3 |
6 | 2 | 전포역 | 상가 | 29.4 | 1 | 2023-09-25 | 2025-09-24 | <NA> | 3 |
0 | 1 | 중앙역 | 통로상가 | 20.0 | 1 | 2023-06-16 | 2028-06-15 | <NA> | 2 |
1 | 1 | 중앙역 | 통로상가 | 20.0 | 1 | 2023-06-21 | 2028-06-20 | <NA> | 2 |
2 | 2 | 수영역 | 상가 | 27.36 | 1 | 2021-07-08 | 2026-07-07 | <NA> | 2 |
5 | 2 | 전포역 | 상가 | 23.1 | 1 | 2023-10-12 | 2028-10-11 | <NA> | 2 |
7 | 2 | 전포역 | 상가 | 30.0 | 1 | 2023-09-26 | 2028-09-25 | <NA> | 2 |
9 | 2 | 전포역 | 상가 | 47.52 | 1 | 2024-01-01 | 2024-12-31 | <NA> | 2 |