Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2067 |
Missing cells | 2 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 125.3 KiB |
Average record size in memory | 62.1 B |
Variable types
Numeric | 5 |
---|---|
Categorical | 2 |
Dataset
Description | 부산광역시상수도사업본부_수용가정보시스템_민원신청정보_급수공사(신청승낙)_20210601 |
---|---|
Author | 부산광역시 상수도사업본부 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15083686 |
사업소코드 is highly overall correlated with 사업소명 | High correlation |
월사용량 is highly overall correlated with 상수도업종 | High correlation |
사업소명 is highly overall correlated with 사업소코드 | High correlation |
상수도업종 is highly overall correlated with 월사용량 | High correlation |
상수도업종 is highly imbalanced (78.3%) | Imbalance |
월사용량 is highly skewed (γ1 = 44.48573781) | Skewed |
연번 has unique values | Unique |
월사용량 has 226 (10.9%) zeros | Zeros |
전수 has 25 (1.2%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 16:51:16.352831 |
---|---|
Analysis finished | 2023-12-10 16:51:20.883509 |
Duration | 4.53 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 2067 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1034 |
Minimum | 1 |
---|---|
Maximum | 2067 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 18.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 104.3 |
Q1 | 517.5 |
median | 1034 |
Q3 | 1550.5 |
95-th percentile | 1963.7 |
Maximum | 2067 |
Range | 2066 |
Interquartile range (IQR) | 1033 |
Descriptive statistics
Standard deviation | 596.83582 |
---|---|
Coefficient of variation (CV) | 0.57721066 |
Kurtosis | -1.2 |
Mean | 1034 |
Median Absolute Deviation (MAD) | 517 |
Skewness | 0 |
Sum | 2137278 |
Variance | 356213 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
1359 | 1 | < 0.1% |
1389 | 1 | < 0.1% |
1388 | 1 | < 0.1% |
1387 | 1 | < 0.1% |
1386 | 1 | < 0.1% |
1385 | 1 | < 0.1% |
1384 | 1 | < 0.1% |
1383 | 1 | < 0.1% |
1382 | 1 | < 0.1% |
Other values (2057) | 2057 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
2067 | 1 | |
2066 | 1 | |
2065 | 1 | |
2064 | 1 | |
2063 | 1 | |
2062 | 1 | |
2061 | 1 | |
2060 | 1 | |
2059 | 1 | |
2058 | 1 |
사업소코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 295.5075 |
Minimum | 201 |
---|---|
Maximum | 312 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 18.3 KiB |
Quantile statistics
Minimum | 201 |
---|---|
5-th percentile | 244 |
Q1 | 302 |
median | 307 |
Q3 | 311 |
95-th percentile | 312 |
Maximum | 312 |
Range | 111 |
Interquartile range (IQR) | 9 |
Descriptive statistics
Standard deviation | 26.03011 |
---|---|
Coefficient of variation (CV) | 0.088086123 |
Kurtosis | 0.85003457 |
Mean | 295.5075 |
Median Absolute Deviation (MAD) | 4 |
Skewness | -1.591574 |
Sum | 610814 |
Variance | 677.56662 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
244 | 385 | |
311 | 371 | |
312 | 311 | |
307 | 227 | |
306 | 185 | |
304 | 165 | |
308 | 119 | 5.8% |
309 | 97 | 4.7% |
301 | 87 | 4.2% |
303 | 61 | 3.0% |
Other values (2) | 59 | 2.9% |
Value | Count | Frequency (%) |
201 | 11 | 0.5% |
244 | 385 | |
301 | 87 | 4.2% |
302 | 48 | 2.3% |
303 | 61 | 3.0% |
304 | 165 | |
306 | 185 | |
307 | 227 | |
308 | 119 | 5.8% |
309 | 97 | 4.7% |
Value | Count | Frequency (%) |
312 | 311 | |
311 | 371 | |
309 | 97 | 4.7% |
308 | 119 | 5.8% |
307 | 227 | |
306 | 185 | |
304 | 165 | |
303 | 61 | 3.0% |
302 | 48 | 2.3% |
301 | 87 | 4.2% |
사업소명
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 16.3 KiB |
북부통합사업소 | |
---|---|
강서 사업소 | |
기장 사업소 | |
북부 사업소 | |
남부 사업소 | |
Other values (7) |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 8.4373488 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강서 사업소 |
---|---|
2nd row | 부산진 사업소 |
3rd row | 부산진 사업소 |
4th row | 강서 사업소 |
5th row | 기장 사업소 |
Common Values
Value | Count | Frequency (%) |
북부통합사업소 | 385 | |
강서 사업소 | 371 | |
기장 사업소 | 311 | |
북부 사업소 | 227 | |
남부 사업소 | 185 | |
부산진 사업소 | 165 | |
해운대 사업소 | 119 | 5.8% |
사하 사업소 | 97 | 4.7% |
중동부 사업소 | 87 | 4.2% |
영도 사업소 | 61 | 3.0% |
Other values (2) | 59 | 2.9% |
Length
Value | Count | Frequency (%) |
사업소 | 1671 | |
북부통합사업소 | 385 | 10.3% |
강서 | 371 | 9.9% |
기장 | 311 | 8.3% |
북부 | 227 | 6.1% |
남부 | 185 | 4.9% |
부산진 | 165 | 4.4% |
해운대 | 119 | 3.2% |
사하 | 97 | 2.6% |
중동부 | 87 | 2.3% |
Other values (3) | 120 | 3.2% |
상수도업종
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 16.3 KiB |
<NA> | |
---|---|
3 | 100 |
1 | 71 |
2 | 1 |
8 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.7489115 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 1894 | |
3 | 100 | 4.8% |
1 | 71 | 3.4% |
2 | 1 | < 0.1% |
8 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 1894 | |
3 | 100 | 4.8% |
1 | 71 | 3.4% |
2 | 1 | < 0.1% |
8 | 1 | < 0.1% |
월사용량
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 70 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 92.706821 |
Minimum | 0 |
---|---|
Maximum | 100000 |
Zeros | 226 |
Zeros (%) | 10.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 18.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1 |
median | 10 |
Q3 | 20 |
95-th percentile | 100 |
Maximum | 100000 |
Range | 100000 |
Interquartile range (IQR) | 19 |
Descriptive statistics
Standard deviation | 2215.3937 |
---|---|
Coefficient of variation (CV) | 23.896771 |
Kurtosis | 2004.9832 |
Mean | 92.706821 |
Median Absolute Deviation (MAD) | 9 |
Skewness | 44.485738 |
Sum | 191625 |
Variance | 4907969.1 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10 | 901 | |
1 | 298 | 14.4% |
100 | 236 | 11.4% |
0 | 226 | 10.9% |
15 | 93 | 4.5% |
50 | 57 | 2.8% |
20 | 43 | 2.1% |
40 | 28 | 1.4% |
30 | 25 | 1.2% |
25 | 13 | 0.6% |
Other values (60) | 147 | 7.1% |
Value | Count | Frequency (%) |
0 | 226 | 10.9% |
1 | 298 | 14.4% |
2 | 4 | 0.2% |
3 | 2 | 0.1% |
5 | 2 | 0.1% |
6 | 1 | < 0.1% |
7 | 1 | < 0.1% |
8 | 1 | < 0.1% |
10 | 901 | |
11 | 4 | 0.2% |
Value | Count | Frequency (%) |
100000 | 1 | < 0.1% |
10000 | 1 | < 0.1% |
5000 | 1 | < 0.1% |
3120 | 1 | < 0.1% |
1500 | 1 | < 0.1% |
1000 | 11 | |
800 | 1 | < 0.1% |
713 | 1 | < 0.1% |
600 | 1 | < 0.1% |
510 | 1 | < 0.1% |
구경
Real number (ℝ)
Distinct | 14 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 33.707305 |
Minimum | 13 |
---|---|
Maximum | 400 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 18.3 KiB |
Quantile statistics
Minimum | 13 |
---|---|
5-th percentile | 15 |
Q1 | 15 |
median | 15 |
Q3 | 25 |
95-th percentile | 100 |
Maximum | 400 |
Range | 387 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 44.164328 |
---|---|
Coefficient of variation (CV) | 1.3102302 |
Kurtosis | 29.331605 |
Mean | 33.707305 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 4.6585068 |
Sum | 69673 |
Variance | 1950.4879 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
15 | 1089 | |
25 | 286 | 13.8% |
20 | 224 | 10.8% |
100 | 201 | 9.7% |
40 | 72 | 3.5% |
32 | 66 | 3.2% |
50 | 52 | 2.5% |
80 | 28 | 1.4% |
200 | 13 | 0.6% |
150 | 13 | 0.6% |
Other values (4) | 23 | 1.1% |
Value | Count | Frequency (%) |
13 | 2 | 0.1% |
15 | 1089 | |
20 | 224 | 10.8% |
25 | 286 | 13.8% |
32 | 66 | 3.2% |
40 | 72 | 3.5% |
50 | 52 | 2.5% |
80 | 28 | 1.4% |
100 | 201 | 9.7% |
150 | 13 | 0.6% |
Value | Count | Frequency (%) |
400 | 11 | 0.5% |
300 | 6 | 0.3% |
250 | 4 | 0.2% |
200 | 13 | 0.6% |
150 | 13 | 0.6% |
100 | 201 | |
80 | 28 | 1.4% |
50 | 52 | 2.5% |
40 | 72 | 3.5% |
32 | 66 | 3.2% |
전수
Real number (ℝ)
ZEROS
 
Distinct | 37 |
---|---|
Distinct (%) | 1.8% |
Missing | 2 |
Missing (%) | 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.9719128 |
Minimum | 0 |
---|---|
Maximum | 115 |
Zeros | 25 |
Zeros (%) | 1.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 18.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 8 |
Maximum | 115 |
Range | 115 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 4.6972474 |
---|---|
Coefficient of variation (CV) | 2.3820766 |
Kurtosis | 185.8225 |
Mean | 1.9719128 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 10.505005 |
Sum | 4072 |
Variance | 22.064133 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1851 | |
8 | 36 | 1.7% |
0 | 25 | 1.2% |
2 | 17 | 0.8% |
12 | 16 | 0.8% |
3 | 16 | 0.8% |
10 | 10 | 0.5% |
16 | 9 | 0.4% |
5 | 8 | 0.4% |
4 | 8 | 0.4% |
Other values (27) | 69 | 3.3% |
Value | Count | Frequency (%) |
0 | 25 | 1.2% |
1 | 1851 | |
2 | 17 | 0.8% |
3 | 16 | 0.8% |
4 | 8 | 0.4% |
5 | 8 | 0.4% |
6 | 5 | 0.2% |
7 | 8 | 0.4% |
8 | 36 | 1.7% |
9 | 7 | 0.3% |
Value | Count | Frequency (%) |
115 | 1 | |
49 | 1 | |
47 | 1 | |
42 | 1 | |
41 | 2 | |
35 | 1 | |
33 | 1 | |
32 | 2 | |
30 | 2 | |
29 | 1 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.000 | 0.090 | 0.000 | 0.000 | 0.000 | 0.026 |
사업소코드 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.069 | 0.101 |
사업소명 | 0.090 | 1.000 | 1.000 | 0.000 | 0.000 | 0.623 | 0.196 |
상수도업종 | 0.000 | 0.000 | 0.000 | 1.000 | NaN | 0.000 | 0.000 |
월사용량 | 0.000 | 0.000 | 0.000 | NaN | 1.000 | 0.654 | 0.000 |
구경 | 0.000 | 0.069 | 0.623 | 0.000 | 0.654 | 1.000 | 0.000 |
전수 | 0.026 | 0.101 | 0.196 | 0.000 | 0.000 | 0.000 | 1.000 |
상수도업종 | 사업소명 | |
---|---|---|
상수도업종 | 1.000 | 0.000 |
사업소명 | 0.000 | 1.000 |
연번 | 사업소코드 | 월사용량 | 구경 | 전수 | 사업소명 | 상수도업종 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.002 | 0.045 | -0.002 | -0.029 | 0.038 | 0.000 |
사업소코드 | 0.002 | 1.000 | -0.174 | -0.150 | -0.091 | 0.998 | 0.000 |
월사용량 | 0.045 | -0.174 | 1.000 | 0.109 | 0.126 | 0.000 | 1.000 |
구경 | -0.002 | -0.150 | 0.109 | 1.000 | -0.261 | 0.320 | 0.000 |
전수 | -0.029 | -0.091 | 0.126 | -0.261 | 1.000 | 0.078 | 0.000 |
사업소명 | 0.038 | 0.998 | 0.000 | 0.320 | 0.078 | 1.000 | 0.000 |
상수도업종 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 | 1.000 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
0 | 1 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
1 | 2 | 304 | 부산진 사업소 | <NA> | 1 | 15 | 1 |
2 | 3 | 304 | 부산진 사업소 | <NA> | 1 | 25 | 1 |
3 | 4 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
4 | 5 | 312 | 기장 사업소 | <NA> | 10 | 15 | 1 |
5 | 6 | 244 | 북부통합사업소 | <NA> | 10 | 15 | 1 |
6 | 7 | 312 | 기장 사업소 | 3 | 15 | 20 | 1 |
7 | 8 | 312 | 기장 사업소 | 1 | 15 | 15 | 1 |
8 | 9 | 312 | 기장 사업소 | <NA> | 10 | 15 | 1 |
9 | 10 | 307 | 북부 사업소 | <NA> | 30 | 15 | 1 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
2057 | 2058 | 307 | 북부 사업소 | <NA> | 20 | 25 | 1 |
2058 | 2059 | 308 | 해운대 사업소 | <NA> | 15 | 15 | 1 |
2059 | 2060 | 244 | 북부통합사업소 | <NA> | 11 | 25 | 1 |
2060 | 2061 | 244 | 북부통합사업소 | <NA> | 10 | 40 | 1 |
2061 | 2062 | 307 | 북부 사업소 | <NA> | 10 | 20 | 1 |
2062 | 2063 | 307 | 북부 사업소 | <NA> | 10 | 20 | 1 |
2063 | 2064 | 304 | 부산진 사업소 | <NA> | 1 | 15 | 1 |
2064 | 2065 | 311 | 강서 사업소 | <NA> | 0 | 15 | 1 |
2065 | 2066 | 303 | 영도 사업소 | <NA> | 0 | 200 | 0 |
2066 | 2067 | 312 | 기장 사업소 | <NA> | 100 | 100 | 1 |