Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 124 |
Missing cells | 3 |
Missing cells (%) | 0.3% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 8.1 KiB |
Average record size in memory | 67.1 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 5 |
Text | 1 |
DateTime | 1 |
Dataset
Description | 2021-05-01 |
---|---|
Author | 부산시공공데이터포털 |
URL | https://bigdata.busan.go.kr/data/bigDataDetailView.do?menuCode=M00000000007&hdfs_file_sn=20230901054201121000 |
last_load_dttm has constant value "" | Constant |
gugun is highly overall correlated with idx and 3 other fields | High correlation |
instt_code is highly overall correlated with idx and 3 other fields | High correlation |
idx is highly overall correlated with gugun and 2 other fields | High correlation |
pumpgubun is highly overall correlated with gugun and 2 other fields | High correlation |
pumpcnt is highly overall correlated with pumpsetcost | High correlation |
pumpsetcost is highly overall correlated with idx and 4 other fields | High correlation |
pumpcnt is highly imbalanced (88.1%) | Imbalance |
idx has 3 (2.4%) missing values | Missing |
Reproduction
Analysis started | 2024-04-17 00:40:52.598132 |
---|---|
Analysis finished | 2024-04-17 00:40:53.278016 |
Duration | 0.68 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
idx
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 70 |
---|---|
Distinct (%) | 57.9% |
Missing | 3 |
Missing (%) | 2.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 45.586777 |
Minimum | 1 |
---|---|
Maximum | 80 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 13 |
Q1 | 25 |
median | 47 |
Q3 | 65 |
95-th percentile | 77 |
Maximum | 80 |
Range | 79 |
Interquartile range (IQR) | 40 |
Descriptive statistics
Standard deviation | 21.628557 |
---|---|
Coefficient of variation (CV) | 0.47444805 |
Kurtosis | -1.1806334 |
Mean | 45.586777 |
Median Absolute Deviation (MAD) | 20 |
Skewness | -0.11489239 |
Sum | 5516 |
Variance | 467.79449 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
46 | 5 | 4.0% |
48 | 4 | 3.2% |
47 | 4 | 3.2% |
15 | 3 | 2.4% |
17 | 3 | 2.4% |
76 | 2 | 1.6% |
58 | 2 | 1.6% |
80 | 2 | 1.6% |
79 | 2 | 1.6% |
52 | 2 | 1.6% |
Other values (60) | 92 | |
(Missing) | 3 | 2.4% |
Value | Count | Frequency (%) |
1 | 1 | 0.8% |
3 | 1 | 0.8% |
11 | 2 | |
12 | 2 | |
13 | 1 | 0.8% |
14 | 1 | 0.8% |
15 | 3 | |
16 | 2 | |
17 | 3 | |
18 | 2 |
Value | Count | Frequency (%) |
80 | 2 | |
79 | 2 | |
78 | 2 | |
77 | 2 | |
76 | 2 | |
75 | 2 | |
74 | 2 | |
73 | 2 | |
72 | 2 | |
71 | 2 |
gugun
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 11.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
부산광역시 연제구 | |
---|---|
부산광역시 부산진구 | |
부산광역시 수영구 | |
부산광역시 강서구 | |
부산광역시 기장군 | |
Other values (9) |
Length
Max length | 10 |
---|---|
Median length | 9 |
Mean length | 9.0403226 |
Min length | 7 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.8% |
Sample
1st row | 낙동강관리본부 |
---|---|
2nd row | 낙동강관리본부 |
3rd row | 낙동강관리본부 |
4th row | 낙동강관리본부 |
5th row | 낙동강관리본부 |
Common Values
Value | Count | Frequency (%) |
부산광역시 연제구 | 30 | |
부산광역시 부산진구 | 18 | |
부산광역시 수영구 | 16 | |
부산광역시 강서구 | 11 | 8.9% |
부산광역시 기장군 | 9 | 7.3% |
부산광역시 해운대구 | 7 | 5.6% |
부산광역시 사상구 | 6 | 4.8% |
부산광역시 동래구 | 6 | 4.8% |
부산광역시 북구 | 6 | 4.8% |
낙동강관리본부 | 5 | 4.0% |
Other values (4) | 10 | 8.1% |
Length
Value | Count | Frequency (%) |
부산광역시 | 119 | |
연제구 | 30 | 12.3% |
부산진구 | 18 | 7.4% |
수영구 | 16 | 6.6% |
강서구 | 11 | 4.5% |
기장군 | 9 | 3.7% |
해운대구 | 7 | 2.9% |
사상구 | 6 | 2.5% |
동래구 | 6 | 2.5% |
북구 | 6 | 2.5% |
Other values (5) | 15 | 6.2% |
spot
Text
Distinct | 96 |
---|---|
Distinct (%) | 77.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
Length
Max length | 38 |
---|---|
Median length | 24 |
Mean length | 14.379032 |
Min length | 4 |
Characters and Unicode
Total characters | 1783 |
---|---|
Distinct characters | 201 |
Distinct categories | 8 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 74 ? |
---|---|
Unique (%) | 59.7% |
Sample
1st row | 삼락자전거대여소 |
---|---|
2nd row | 화명 자전거대여소 앞 |
3rd row | 대저 자전거대여소 |
4th row | 맥도 자전거무료대여소 |
5th row | 맥도 철새태마공원 |
Value | Count | Frequency (%) |
앞 | 29 | 7.4% |
인근 | 23 | 5.8% |
자전거보관대 | 21 | 5.3% |
지하철 | 19 | 4.8% |
출구 | 18 | 4.6% |
자전거대여소 | 9 | 2.3% |
자전거 | 7 | 1.8% |
민락동 | 6 | 1.5% |
하부 | 5 | 1.3% |
수영강변 | 5 | 1.3% |
Other values (166) | 252 |
Most occurring characters
Value | Count | Frequency (%) |
270 | 15.1% | |
대 | 64 | 3.6% |
구 | 50 | 2.8% |
동 | 48 | 2.7% |
전 | 47 | 2.6% |
거 | 45 | 2.5% |
자 | 42 | 2.4% |
역 | 39 | 2.2% |
번 | 35 | 2.0% |
관 | 32 | 1.8% |
Other values (191) | 1111 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1377 | |
Space Separator | 270 | 15.1% |
Decimal Number | 99 | 5.6% |
Close Punctuation | 16 | 0.9% |
Open Punctuation | 15 | 0.8% |
Dash Punctuation | 2 | 0.1% |
Uppercase Letter | 2 | 0.1% |
Lowercase Letter | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 64 | 4.6% |
구 | 50 | 3.6% |
동 | 48 | 3.5% |
전 | 47 | 3.4% |
거 | 45 | 3.3% |
자 | 42 | 3.1% |
역 | 39 | 2.8% |
번 | 35 | 2.5% |
관 | 32 | 2.3% |
출 | 31 | 2.3% |
Other values (173) | 944 |
Decimal Number
Value | Count | Frequency (%) |
3 | 17 | |
2 | 17 | |
1 | 14 | |
4 | 11 | |
0 | 10 | |
7 | 8 | |
6 | 7 | |
5 | 6 | 6.1% |
9 | 6 | 6.1% |
8 | 3 | 3.0% |
Uppercase Letter
Value | Count | Frequency (%) |
U | 1 | |
N | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 1 | |
k | 1 |
Space Separator
Value | Count | Frequency (%) |
270 |
Close Punctuation
Value | Count | Frequency (%) |
) | 16 |
Open Punctuation
Value | Count | Frequency (%) |
( | 15 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1376 | |
Common | 402 | 22.5% |
Latin | 4 | 0.2% |
Han | 1 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 64 | 4.7% |
구 | 50 | 3.6% |
동 | 48 | 3.5% |
전 | 47 | 3.4% |
거 | 45 | 3.3% |
자 | 42 | 3.1% |
역 | 39 | 2.8% |
번 | 35 | 2.5% |
관 | 32 | 2.3% |
출 | 31 | 2.3% |
Other values (172) | 943 |
Common
Value | Count | Frequency (%) |
270 | ||
3 | 17 | 4.2% |
2 | 17 | 4.2% |
) | 16 | 4.0% |
( | 15 | 3.7% |
1 | 14 | 3.5% |
4 | 11 | 2.7% |
0 | 10 | 2.5% |
7 | 8 | 2.0% |
6 | 7 | 1.7% |
Other values (4) | 17 | 4.2% |
Latin
Value | Count | Frequency (%) |
U | 1 | |
N | 1 | |
s | 1 | |
k | 1 |
Han
Value | Count | Frequency (%) |
舊 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1376 | |
ASCII | 406 | 22.8% |
CJK | 1 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
270 | ||
3 | 17 | 4.2% |
2 | 17 | 4.2% |
) | 16 | 3.9% |
( | 15 | 3.7% |
1 | 14 | 3.4% |
4 | 11 | 2.7% |
0 | 10 | 2.5% |
7 | 8 | 2.0% |
6 | 7 | 1.7% |
Other values (8) | 21 | 5.2% |
Hangul
Value | Count | Frequency (%) |
대 | 64 | 4.7% |
구 | 50 | 3.6% |
동 | 48 | 3.5% |
전 | 47 | 3.4% |
거 | 45 | 3.3% |
자 | 42 | 3.1% |
역 | 39 | 2.8% |
번 | 35 | 2.5% |
관 | 32 | 2.3% |
출 | 31 | 2.3% |
Other values (172) | 943 |
CJK
Value | Count | Frequency (%) |
舊 | 1 |
pumpgubun
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 5.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
태양광 | |
---|---|
수동식 | |
태양광(소형) | 7 |
전기식 | 4 |
태양광(중형) | 4 |
Other values (2) | 2 |
Length
Max length | 9 |
---|---|
Median length | 3 |
Mean length | 3.4354839 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.6% |
Sample
1st row | 수동식 |
---|---|
2nd row | 전기식(콤프레샤) |
3rd row | 수동식 |
4th row | 수동식 |
5th row | 수동식 |
Common Values
Value | Count | Frequency (%) |
태양광 | 88 | |
수동식 | 19 | 15.3% |
태양광(소형) | 7 | 5.6% |
전기식 | 4 | 3.2% |
태양광(중형) | 4 | 3.2% |
전기식(콤프레샤) | 1 | 0.8% |
전기식,수동식 | 1 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
태양광 | 88 | |
수동식 | 19 | 15.3% |
태양광(소형 | 7 | 5.6% |
전기식 | 4 | 3.2% |
태양광(중형 | 4 | 3.2% |
전기식(콤프레샤 | 1 | 0.8% |
전기식,수동식 | 1 | 0.8% |
pumpcnt
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
1 | |
---|---|
2 | 2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 122 | |
2 | 2 | 1.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 122 | |
2 | 2 | 1.6% |
pumpsetcost
Categorical
HIGH CORRELATION
 
Distinct | 33 |
---|---|
Distinct (%) | 26.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
1799000 | |
---|---|
1650000 | |
1730000 | |
544500 | 6 |
1894000 | 6 |
Other values (28) |
Length
Max length | 10 |
---|---|
Median length | 7 |
Mean length | 7.0403226 |
Min length | 5 |
Unique
Unique | 8 ? |
---|---|
Unique (%) | 6.5% |
Sample
1st row | 10000 |
---|---|
2nd row | 150000 |
3rd row | 10000 |
4th row | 10000 |
5th row | 10000 |
Common Values
Value | Count | Frequency (%) |
1799000 | 30 | |
1650000 | 8 | 6.5% |
1730000 | 7 | 5.6% |
544500 | 6 | 4.8% |
1894000 | 6 | 4.8% |
10000 | 5 | 4.0% |
2200000 | 5 | 4.0% |
600000 | 4 | 3.2% |
3,300,000 | 4 | 3.2% |
2125000 | 4 | 3.2% |
Other values (23) | 45 |
Length
Value | Count | Frequency (%) |
1799000 | 30 | |
1650000 | 8 | 6.5% |
1730000 | 7 | 5.6% |
544500 | 6 | 4.8% |
1894000 | 6 | 4.8% |
10000 | 5 | 4.0% |
2200000 | 5 | 4.0% |
2125000 | 4 | 3.2% |
1990000 | 4 | 3.2% |
3,300,000 | 4 | 3.2% |
Other values (23) | 45 |
instt_code
Categorical
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 7.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
<NA> | |
---|---|
3370000 | |
3360000 | |
3380000 | |
3330000 | |
Other values (4) |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 5.4354839 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.8% |
Sample
1st row | e-낙동강관리본부 |
---|---|
2nd row | e-낙동강관리본부 |
3rd row | e-낙동강관리본부 |
4th row | e-낙동강관리본부 |
5th row | e-낙동강관리본부 |
Common Values
Value | Count | Frequency (%) |
<NA> | 68 | |
3370000 | 15 | 12.1% |
3360000 | 11 | 8.9% |
3380000 | 8 | 6.5% |
3330000 | 7 | 5.6% |
3390000 | 6 | 4.8% |
e-낙동강관리본부 | 5 | 4.0% |
3280000 | 3 | 2.4% |
3350000 | 1 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 68 | |
3370000 | 15 | 12.1% |
3360000 | 11 | 8.9% |
3380000 | 8 | 6.5% |
3330000 | 7 | 5.6% |
3390000 | 6 | 4.8% |
e-낙동강관리본부 | 5 | 4.0% |
3280000 | 3 | 2.4% |
3350000 | 1 | 0.8% |
last_load_dttm
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.1 KiB |
Minimum | 2021-05-01 05:42:03 |
---|---|
Maximum | 2021-05-01 05:42:03 |
idx | gugun | spot | pumpgubun | pumpcnt | pumpsetcost | instt_code | |
---|---|---|---|---|---|---|---|
idx | 1.000 | 0.893 | 0.999 | 0.605 | 0.000 | 0.947 | 0.974 |
gugun | 0.893 | 1.000 | 1.000 | 0.880 | 0.297 | 0.994 | 1.000 |
spot | 0.999 | 1.000 | 1.000 | 0.981 | 1.000 | 0.995 | 1.000 |
pumpgubun | 0.605 | 0.880 | 0.981 | 1.000 | 0.197 | 0.987 | 0.784 |
pumpcnt | 0.000 | 0.297 | 1.000 | 0.197 | 1.000 | 0.792 | 0.232 |
pumpsetcost | 0.947 | 0.994 | 0.995 | 0.987 | 0.792 | 1.000 | 0.977 |
instt_code | 0.974 | 1.000 | 1.000 | 0.784 | 0.232 | 0.977 | 1.000 |
gugun | instt_code | pumpgubun | pumpsetcost | pumpcnt | |
---|---|---|---|---|---|
gugun | 1.000 | 1.000 | 0.520 | 0.853 | 0.218 |
instt_code | 1.000 | 1.000 | 0.575 | 0.835 | 0.157 |
pumpgubun | 0.520 | 0.575 | 1.000 | 0.817 | 0.205 |
pumpsetcost | 0.853 | 0.835 | 0.817 | 1.000 | 0.601 |
pumpcnt | 0.218 | 0.157 | 0.205 | 0.601 | 1.000 |
idx | gugun | pumpgubun | pumpcnt | pumpsetcost | instt_code | |
---|---|---|---|---|---|---|
idx | 1.000 | 0.647 | 0.356 | 0.000 | 0.652 | 0.750 |
gugun | 0.647 | 1.000 | 0.520 | 0.218 | 0.853 | 1.000 |
pumpgubun | 0.356 | 0.520 | 1.000 | 0.205 | 0.817 | 0.575 |
pumpcnt | 0.000 | 0.218 | 0.205 | 1.000 | 0.601 | 0.157 |
pumpsetcost | 0.652 | 0.853 | 0.817 | 0.601 | 1.000 | 0.835 |
instt_code | 0.750 | 1.000 | 0.575 | 0.157 | 0.835 | 1.000 |
idx | gugun | spot | pumpgubun | pumpcnt | pumpsetcost | instt_code | last_load_dttm | |
---|---|---|---|---|---|---|---|---|
0 | 16 | 낙동강관리본부 | 삼락자전거대여소 | 수동식 | 1 | 10000 | e-낙동강관리본부 | 2021-05-01 05:42:03 |
1 | 17 | 낙동강관리본부 | 화명 자전거대여소 앞 | 전기식(콤프레샤) | 1 | 150000 | e-낙동강관리본부 | 2021-05-01 05:42:03 |
2 | 18 | 낙동강관리본부 | 대저 자전거대여소 | 수동식 | 1 | 10000 | e-낙동강관리본부 | 2021-05-01 05:42:03 |
3 | 19 | 낙동강관리본부 | 맥도 자전거무료대여소 | 수동식 | 1 | 10000 | e-낙동강관리본부 | 2021-05-01 05:42:03 |
4 | 20 | 낙동강관리본부 | 맥도 철새태마공원 | 수동식 | 1 | 10000 | e-낙동강관리본부 | 2021-05-01 05:42:03 |
5 | 36 | 부산광역시 사상구 | 감전역 3번 출구 | 전기식 | 1 | 5600000 | 3390000 | 2021-05-01 05:42:03 |
6 | 37 | 부산광역시 사상구 | 주례역 1번 출구 | 전기식 | 1 | 5600000 | 3390000 | 2021-05-01 05:42:03 |
7 | 38 | 부산광역시 사상구 | 사상달리미 자전거대여소 | 수동식 | 1 | 600000 | 3390000 | 2021-05-01 05:42:03 |
8 | 39 | 부산광역시 사상구 | 르네시떼역 경전철 아래 | 수동식 | 1 | 600000 | 3390000 | 2021-05-01 05:42:03 |
9 | 40 | 부산광역시 사상구 | 국토종주자전거길 전망대쉼터 | 수동식 | 1 | 600000 | 3390000 | 2021-05-01 05:42:03 |
idx | gugun | spot | pumpgubun | pumpcnt | pumpsetcost | instt_code | last_load_dttm | |
---|---|---|---|---|---|---|---|---|
114 | 71 | 부산광역시 연제구 | 온천천 안락교(연산9동) 자전거보관대 인근 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
115 | 72 | 부산광역시 연제구 | 연산9동 망미주공아파트 자전거보관대 인근 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
116 | 73 | 부산광역시 연제구 | 지하철 배산역 3번 출구 자전거보관대 인근 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
117 | 74 | 부산광역시 연제구 | 지하철 물만골역 4번 출구 자전거보관대 인근 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
118 | 75 | 부산광역시 연제구 | 연산2동 이마트 연제점 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
119 | 76 | 부산광역시 연제구 | 거제1동 홈플러스 아시아드점 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
120 | 77 | 부산광역시 연제구 | 연산1동 홈플러스 연산점 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
121 | 78 | 부산광역시 연제구 | 지하철 연산역 14번출구 자전거보관대 인근 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
122 | 79 | 부산광역시 연제구 | 지하철 교대역 3번출구 국제신문 앞 자전거보관대 인근 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |
123 | 80 | 부산광역시 연제구 | 부산교대 후문 입구 | 태양광 | 1 | 1799000 | <NA> | 2021-05-01 05:42:03 |