Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 76 |
Missing cells | 12 |
Missing cells (%) | 2.6% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.3% |
Total size in memory | 3.8 KiB |
Average record size in memory | 51.7 B |
Variable types
Text | 2 |
---|---|
Numeric | 2 |
Categorical | 2 |
Dataset
Description | 부산광역시_사상구_민방위비상급수시설현황_20230717 |
---|---|
Author | 부산광역시 사상구 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=3078758 |
Dataset has 1 (1.3%) duplicate rows | Duplicates |
용도 is highly overall correlated with 데이터기준일자 | High correlation |
데이터기준일자 is highly overall correlated with 규모(일_톤) and 2 other fields | High correlation |
규모(일_톤) is highly overall correlated with 데이터기준일자 | High correlation |
심도(m) is highly overall correlated with 데이터기준일자 | High correlation |
데이터기준일자 is highly imbalanced (82.6%) | Imbalance |
민방위 비상급수시설명 has 3 (3.9%) missing values | Missing |
소재지 주소 has 3 (3.9%) missing values | Missing |
규모(일_톤) has 3 (3.9%) missing values | Missing |
심도(m) has 3 (3.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-10 16:56:43.252632 |
---|---|
Analysis finished | 2023-12-10 16:56:45.259129 |
Duration | 2.01 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
민방위 비상급수시설명
Text
MISSING
 
Distinct | 73 |
---|---|
Distinct (%) | 100.0% |
Missing | 3 |
Missing (%) | 3.9% |
Memory size | 740.0 B |
Value | Count | Frequency (%) |
동일2차아파트 | 1 | 1.4% |
주례여자고등학교 | 1 | 1.4% |
주감중학교 | 1 | 1.4% |
우신아파트 | 1 | 1.4% |
우성아파트 | 1 | 1.4% |
우리주유소 | 1 | 1.4% |
우리사우나 | 1 | 1.4% |
엘지신주례아파트2단지 | 1 | 1.4% |
엘지신주례아파트1단지 | 1 | 1.4% |
엄궁한신2차아파트 | 1 | 1.4% |
Other values (64) | 64 |
Most occurring characters
Value | Count | Frequency (%) |
아 | 36 | 7.7% |
파 | 34 | 7.3% |
트 | 33 | 7.1% |
주 | 15 | 3.2% |
학 | 14 | 3.0% |
원 | 10 | 2.1% |
동 | 10 | 2.1% |
지 | 10 | 2.1% |
공 | 9 | 1.9% |
우 | 9 | 1.9% |
Other values (127) | 286 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 448 | |
Decimal Number | 10 | 2.1% |
Uppercase Letter | 3 | 0.6% |
Close Punctuation | 2 | 0.4% |
Open Punctuation | 2 | 0.4% |
Space Separator | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
아 | 36 | 8.0% |
파 | 34 | 7.6% |
트 | 33 | 7.4% |
주 | 15 | 3.3% |
학 | 14 | 3.1% |
원 | 10 | 2.2% |
동 | 10 | 2.2% |
지 | 10 | 2.2% |
공 | 9 | 2.0% |
우 | 9 | 2.0% |
Other values (117) | 268 |
Decimal Number
Value | Count | Frequency (%) |
2 | 4 | |
1 | 3 | |
4 | 2 | |
3 | 1 | 10.0% |
Uppercase Letter
Value | Count | Frequency (%) |
K | 1 | |
S | 1 | |
W | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 448 | |
Common | 15 | 3.2% |
Latin | 3 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
아 | 36 | 8.0% |
파 | 34 | 7.6% |
트 | 33 | 7.4% |
주 | 15 | 3.3% |
학 | 14 | 3.1% |
원 | 10 | 2.2% |
동 | 10 | 2.2% |
지 | 10 | 2.2% |
공 | 9 | 2.0% |
우 | 9 | 2.0% |
Other values (117) | 268 |
Common
Value | Count | Frequency (%) |
2 | 4 | |
1 | 3 | |
4 | 2 | |
) | 2 | |
( | 2 | |
1 | 6.7% | |
3 | 1 | 6.7% |
Latin
Value | Count | Frequency (%) |
K | 1 | |
S | 1 | |
W | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 448 | |
ASCII | 18 | 3.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
아 | 36 | 8.0% |
파 | 34 | 7.6% |
트 | 33 | 7.4% |
주 | 15 | 3.3% |
학 | 14 | 3.1% |
원 | 10 | 2.2% |
동 | 10 | 2.2% |
지 | 10 | 2.2% |
공 | 9 | 2.0% |
우 | 9 | 2.0% |
Other values (117) | 268 |
ASCII
Value | Count | Frequency (%) |
2 | 4 | |
1 | 3 | |
4 | 2 | |
) | 2 | |
( | 2 | |
1 | 5.6% | |
K | 1 | 5.6% |
S | 1 | 5.6% |
W | 1 | 5.6% |
3 | 1 | 5.6% |
소재지 주소
Text
MISSING
 
Distinct | 73 |
---|---|
Distinct (%) | 100.0% |
Missing | 3 |
Missing (%) | 3.9% |
Memory size | 740.0 B |
Length
Max length | 36 |
---|---|
Median length | 30 |
Mean length | 26.178082 |
Min length | 16 |
Characters and Unicode
Total characters | 1911 |
---|---|
Distinct characters | 67 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 73 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 부산광역시 사상구 운산로 77-3 (덕포동) |
---|---|
2nd row | 부산광역시 사상구 백양대로 566 (감전동) |
3rd row | 부산광역시 사상구 광장로 93번길 6 (괘법동) |
4th row | 부산광역시 사상구 백양대로 366 (주례동) |
5th row | 부산광역시 사상구 동주로 2-11 (주례동) |
Value | Count | Frequency (%) |
부산광역시 | 73 | |
사상구 | 73 | |
모라동 | 18 | 4.9% |
주례동 | 15 | 4.1% |
학장동 | 12 | 3.3% |
엄궁동 | 11 | 3.0% |
백양대로 | 11 | 3.0% |
모라로192번길 | 6 | 1.6% |
대동로 | 6 | 1.6% |
엄궁로 | 6 | 1.6% |
Other values (108) | 135 |
Most occurring characters
Value | Count | Frequency (%) |
293 | 15.3% | |
동 | 82 | 4.3% |
광 | 76 | 4.0% |
상 | 75 | 3.9% |
사 | 74 | 3.9% |
구 | 74 | 3.9% |
산 | 74 | 3.9% |
부 | 73 | 3.8% |
역 | 73 | 3.8% |
시 | 73 | 3.8% |
Other values (57) | 944 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1153 | |
Decimal Number | 302 | 15.8% |
Space Separator | 293 | 15.3% |
Open Punctuation | 71 | 3.7% |
Close Punctuation | 70 | 3.7% |
Dash Punctuation | 17 | 0.9% |
Other Punctuation | 5 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 82 | 7.1% |
광 | 76 | 6.6% |
상 | 75 | 6.5% |
사 | 74 | 6.4% |
구 | 74 | 6.4% |
산 | 74 | 6.4% |
부 | 73 | 6.3% |
역 | 73 | 6.3% |
시 | 73 | 6.3% |
로 | 71 | 6.2% |
Other values (42) | 408 |
Decimal Number
Value | Count | Frequency (%) |
1 | 56 | |
2 | 38 | |
4 | 35 | |
6 | 30 | |
3 | 30 | |
0 | 29 | |
5 | 27 | |
9 | 25 | |
8 | 19 | 6.3% |
7 | 13 | 4.3% |
Space Separator
Value | Count | Frequency (%) |
293 |
Open Punctuation
Value | Count | Frequency (%) |
( | 71 |
Close Punctuation
Value | Count | Frequency (%) |
) | 70 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 17 |
Other Punctuation
Value | Count | Frequency (%) |
, | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1153 | |
Common | 758 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 82 | 7.1% |
광 | 76 | 6.6% |
상 | 75 | 6.5% |
사 | 74 | 6.4% |
구 | 74 | 6.4% |
산 | 74 | 6.4% |
부 | 73 | 6.3% |
역 | 73 | 6.3% |
시 | 73 | 6.3% |
로 | 71 | 6.2% |
Other values (42) | 408 |
Common
Value | Count | Frequency (%) |
293 | ||
( | 71 | 9.4% |
) | 70 | 9.2% |
1 | 56 | 7.4% |
2 | 38 | 5.0% |
4 | 35 | 4.6% |
6 | 30 | 4.0% |
3 | 30 | 4.0% |
0 | 29 | 3.8% |
5 | 27 | 3.6% |
Other values (5) | 79 | 10.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1153 | |
ASCII | 758 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
293 | ||
( | 71 | 9.4% |
) | 70 | 9.2% |
1 | 56 | 7.4% |
2 | 38 | 5.0% |
4 | 35 | 4.6% |
6 | 30 | 4.0% |
3 | 30 | 4.0% |
0 | 29 | 3.8% |
5 | 27 | 3.6% |
Other values (5) | 79 | 10.4% |
Hangul
Value | Count | Frequency (%) |
동 | 82 | 7.1% |
광 | 76 | 6.6% |
상 | 75 | 6.5% |
사 | 74 | 6.4% |
구 | 74 | 6.4% |
산 | 74 | 6.4% |
부 | 73 | 6.3% |
역 | 73 | 6.3% |
시 | 73 | 6.3% |
로 | 71 | 6.2% |
Other values (42) | 408 |
규모(일_톤)
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 31 |
---|---|
Distinct (%) | 42.5% |
Missing | 3 |
Missing (%) | 3.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 82.493151 |
Minimum | 25 |
---|---|
Maximum | 300 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 816.0 B |
Quantile statistics
Minimum | 25 |
---|---|
5-th percentile | 30 |
Q1 | 59 |
median | 70 |
Q3 | 88 |
95-th percentile | 227 |
Maximum | 300 |
Range | 275 |
Interquartile range (IQR) | 29 |
Descriptive statistics
Standard deviation | 54.243055 |
---|---|
Coefficient of variation (CV) | 0.65754616 |
Kurtosis | 7.721536 |
Mean | 82.493151 |
Median Absolute Deviation (MAD) | 16 |
Skewness | 2.7296159 |
Sum | 6022 |
Variance | 2942.309 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
70 | 8 | 10.5% |
50 | 7 | 9.2% |
60 | 6 | 7.9% |
69 | 5 | 6.6% |
30 | 5 | 6.6% |
80 | 4 | 5.3% |
65 | 4 | 5.3% |
95 | 4 | 5.3% |
100 | 4 | 5.3% |
59 | 2 | 2.6% |
Other values (21) | 24 | |
(Missing) | 3 | 3.9% |
Value | Count | Frequency (%) |
25 | 1 | 1.3% |
30 | 5 | |
40 | 2 | 2.6% |
48 | 1 | 1.3% |
50 | 7 | |
55 | 1 | 1.3% |
59 | 2 | 2.6% |
60 | 6 | |
65 | 4 | |
68 | 1 | 1.3% |
Value | Count | Frequency (%) |
300 | 1 | 1.3% |
280 | 1 | 1.3% |
267 | 1 | 1.3% |
260 | 1 | 1.3% |
205 | 1 | 1.3% |
146 | 1 | 1.3% |
113 | 1 | 1.3% |
100 | 4 | |
95 | 4 | |
92 | 1 | 1.3% |
심도(m)
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 22 |
---|---|
Distinct (%) | 30.1% |
Missing | 3 |
Missing (%) | 3.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 136.32877 |
Minimum | 20 |
---|---|
Maximum | 500 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 816.0 B |
Quantile statistics
Minimum | 20 |
---|---|
5-th percentile | 56 |
Q1 | 100 |
median | 130 |
Q3 | 150 |
95-th percentile | 212 |
Maximum | 500 |
Range | 480 |
Interquartile range (IQR) | 50 |
Descriptive statistics
Standard deviation | 66.027783 |
---|---|
Coefficient of variation (CV) | 0.48432759 |
Kurtosis | 12.534565 |
Mean | 136.32877 |
Median Absolute Deviation (MAD) | 28 |
Skewness | 2.6171296 |
Sum | 9952 |
Variance | 4359.6682 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
150 | 18 | |
100 | 14 | |
120 | 9 | |
200 | 6 | 7.9% |
130 | 6 | 7.9% |
180 | 2 | 2.6% |
300 | 2 | 2.6% |
110 | 2 | 2.6% |
102 | 1 | 1.3% |
74 | 1 | 1.3% |
Other values (12) | 12 | |
(Missing) | 3 | 3.9% |
Value | Count | Frequency (%) |
20 | 1 | 1.3% |
25 | 1 | 1.3% |
35 | 1 | 1.3% |
50 | 1 | 1.3% |
60 | 1 | 1.3% |
67 | 1 | 1.3% |
74 | 1 | 1.3% |
80 | 1 | 1.3% |
95 | 1 | 1.3% |
100 | 14 |
Value | Count | Frequency (%) |
500 | 1 | 1.3% |
300 | 2 | 2.6% |
230 | 1 | 1.3% |
200 | 6 | 7.9% |
180 | 2 | 2.6% |
160 | 1 | 1.3% |
150 | 18 | |
130 | 6 | 7.9% |
120 | 9 | |
114 | 1 | 1.3% |
용도
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 740.0 B |
비음용 | |
---|---|
음용 | |
<NA> | 3 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.7105263 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 비음용 |
---|---|
2nd row | 비음용 |
3rd row | 비음용 |
4th row | 비음용 |
5th row | 비음용 |
Common Values
Value | Count | Frequency (%) |
비음용 | 48 | |
음용 | 25 | |
<NA> | 3 | 3.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
비음용 | 48 | |
음용 | 25 | |
na | 3 | 3.9% |
데이터기준일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 3.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 740.0 B |
2023-07-17 | |
---|---|
<NA> | 2 |
1 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.7236842 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.3% |
Sample
1st row | 2023-07-17 |
---|---|
2nd row | 2023-07-17 |
3rd row | 2023-07-17 |
4th row | 2023-07-17 |
5th row | 2023-07-17 |
Common Values
Value | Count | Frequency (%) |
2023-07-17 | 73 | |
<NA> | 2 | 2.6% |
1 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-07-17 | 73 | |
na | 2 | 2.7% |
민방위 비상급수시설명 | 소재지 주소 | 규모(일_톤) | 심도(m) | 용도 | 데이터기준일자 | |
---|---|---|---|---|---|---|
민방위 비상급수시설명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | NaN |
소재지 주소 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | NaN |
규모(일_톤) | 1.000 | 1.000 | 1.000 | 0.590 | 0.000 | NaN |
심도(m) | 1.000 | 1.000 | 0.590 | 1.000 | 0.263 | NaN |
용도 | 1.000 | 1.000 | 0.000 | 0.263 | 1.000 | NaN |
데이터기준일자 | NaN | NaN | NaN | NaN | NaN | 1.000 |
용도 | 데이터기준일자 | |
---|---|---|
용도 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 |
규모(일_톤) | 심도(m) | 용도 | 데이터기준일자 | |
---|---|---|---|---|
규모(일_톤) | 1.000 | -0.025 | 0.000 | 1.000 |
심도(m) | -0.025 | 1.000 | 0.269 | 1.000 |
용도 | 0.000 | 0.269 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 | 1.000 |
민방위 비상급수시설명 | 소재지 주소 | 규모(일_톤) | 심도(m) | 용도 | 데이터기준일자 | |
---|---|---|---|---|---|---|
0 | (구)사상구보건소 | 부산광역시 사상구 운산로 77-3 (덕포동) | 205 | 20 | 비음용 | 2023-07-17 |
1 | SK사상공원 셀프주유소 | 부산광역시 사상구 백양대로 566 (감전동) | 60 | 150 | 비음용 | 2023-07-17 |
2 | W모텔 | 부산광역시 사상구 광장로 93번길 6 (괘법동) | 70 | 100 | 비음용 | 2023-07-17 |
3 | 강변허브사우나 | 부산광역시 사상구 백양대로 366 (주례동) | 300 | 500 | 비음용 | 2023-07-17 |
4 | 고운어린이집 | 부산광역시 사상구 동주로 2-11 (주례동) | 267 | 25 | 비음용 | 2023-07-17 |
5 | 광우맨션 | 부산광역시 사상구 가야대로366번길 104 (주례동) | 95 | 110 | 비음용 | 2023-07-17 |
6 | 구덕고등학교 | 부산광역시 사상구 학감대로 81 (학장동) | 100 | 102 | 음용 | 2023-07-17 |
7 | 구덕농원 | 부산광역시 사상구 학감대로 2 (학장동, 구덕농원) | 50 | 180 | 음용 | 2023-07-17 |
8 | 구덕대림아파트 | 부산광역시 사상구 학감대로49번길 62 (학장동) | 48 | 180 | 비음용 | 2023-07-17 |
9 | 학장극동아파트 | 부산광역시 사상구 학감대로 109-43 (학장동) | 80 | 130 | 비음용 | 2023-07-17 |
민방위 비상급수시설명 | 소재지 주소 | 규모(일_톤) | 심도(m) | 용도 | 데이터기준일자 | |
---|---|---|---|---|---|---|
66 | 한효아파트 | 부산광역시 사상구 백양대로342번길 40 (주례동) | 70 | 200 | 음용 | 2023-07-17 |
67 | 협성아파트 | 부산광역시 사상구 백양대로950번나길 14 (모라동) | 79 | 150 | 비음용 | 2023-07-17 |
68 | 화인아파트 | 부산광역시 사상구 백양대로934번길 52-6 (모라동) | 59 | 130 | 비음용 | 2023-07-17 |
69 | 아름스파 | 부산광역시 사상구 대동로 304(감전동) | 260 | 300 | 비음용 | 2023-07-17 |
70 | 양지어린이공원옆 | 부산광역시 사상구 양지로8번길 5-22(주례동) | 86 | 100 | 비음용 | 2023-07-17 |
71 | 야시곡공원앞 | 부산광역시 사상구 백양대로950번나길 93(모라동) | 100 | 50 | 비음용 | 2023-07-17 |
72 | 미트피아 | 부산광역시 사상구 백양대로 507(주례동) | 70 | 100 | 비음용 | 2023-07-17 |
73 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
74 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
75 | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
민방위 비상급수시설명 | 소재지 주소 | 규모(일_톤) | 심도(m) | 용도 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |