Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 4802 |
Missing cells | 8 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 286.2 KiB |
Average record size in memory | 61.0 B |
Variable types
Numeric | 5 |
---|---|
Categorical | 2 |
Dataset
Description | 부산광역시상수도사업본부_수용가정보시스템_민원신청정보_급수공사(신청승낙)_20220131 |
---|---|
Author | 부산광역시 상수도사업본부 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15083686 |
사업소코드 is highly overall correlated with 사업소명 | High correlation |
월사용량 is highly overall correlated with 상수도업종 | High correlation |
사업소명 is highly overall correlated with 사업소코드 | High correlation |
상수도업종 is highly overall correlated with 월사용량 | High correlation |
상수도업종 is highly imbalanced (81.6%) | Imbalance |
월사용량 is highly skewed (γ1 = 66.19852167) | Skewed |
연번 has unique values | Unique |
월사용량 has 466 (9.7%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 16:51:06.201274 |
---|---|
Analysis finished | 2023-12-10 16:51:11.587346 |
Duration | 5.39 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 4802 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2401.5 |
Minimum | 1 |
---|---|
Maximum | 4802 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 42.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 241.05 |
Q1 | 1201.25 |
median | 2401.5 |
Q3 | 3601.75 |
95-th percentile | 4561.95 |
Maximum | 4802 |
Range | 4801 |
Interquartile range (IQR) | 2400.5 |
Descriptive statistics
Standard deviation | 1386.3623 |
---|---|
Coefficient of variation (CV) | 0.57729016 |
Kurtosis | -1.2 |
Mean | 2401.5 |
Median Absolute Deviation (MAD) | 1200.5 |
Skewness | 0 |
Sum | 11532003 |
Variance | 1922000.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
3209 | 1 | < 0.1% |
3207 | 1 | < 0.1% |
3206 | 1 | < 0.1% |
3205 | 1 | < 0.1% |
3204 | 1 | < 0.1% |
3203 | 1 | < 0.1% |
3202 | 1 | < 0.1% |
3201 | 1 | < 0.1% |
3200 | 1 | < 0.1% |
Other values (4792) | 4792 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
4802 | 1 | |
4801 | 1 | |
4800 | 1 | |
4799 | 1 | |
4798 | 1 | |
4797 | 1 | |
4796 | 1 | |
4795 | 1 | |
4794 | 1 | |
4793 | 1 |
사업소코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 296.3586 |
Minimum | 101 |
---|---|
Maximum | 312 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 42.3 KiB |
Quantile statistics
Minimum | 101 |
---|---|
5-th percentile | 244 |
Q1 | 303 |
median | 307 |
Q3 | 311 |
95-th percentile | 312 |
Maximum | 312 |
Range | 211 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 25.782382 |
---|---|
Coefficient of variation (CV) | 0.086997244 |
Kurtosis | 3.0739613 |
Mean | 296.3586 |
Median Absolute Deviation (MAD) | 4 |
Skewness | -1.892807 |
Sum | 1423114 |
Variance | 664.7312 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
311 | 857 | |
244 | 820 | |
312 | 755 | |
307 | 527 | |
306 | 463 | |
304 | 374 | |
308 | 281 | 5.9% |
309 | 238 | 5.0% |
301 | 183 | 3.8% |
302 | 141 | 2.9% |
Other values (3) | 163 | 3.4% |
Value | Count | Frequency (%) |
101 | 3 | 0.1% |
201 | 27 | 0.6% |
244 | 820 | |
301 | 183 | 3.8% |
302 | 141 | 2.9% |
303 | 133 | 2.8% |
304 | 374 | |
306 | 463 | |
307 | 527 | |
308 | 281 | 5.9% |
Value | Count | Frequency (%) |
312 | 755 | |
311 | 857 | |
309 | 238 | 5.0% |
308 | 281 | 5.9% |
307 | 527 | |
306 | 463 | |
304 | 374 | |
303 | 133 | 2.8% |
302 | 141 | 2.9% |
301 | 183 | 3.8% |
사업소명
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.6 KiB |
강서 사업소 | |
---|---|
동래통합사업소 | |
기장 사업소 | |
북부 사업소 | |
남부 사업소 | |
Other values (8) |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 8.4702207 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강서 사업소 |
---|---|
2nd row | 기장 사업소 |
3rd row | 남부 사업소 |
4th row | 부산진 사업소 |
5th row | 부산진 사업소 |
Common Values
Value | Count | Frequency (%) |
강서 사업소 | 857 | |
동래통합사업소 | 820 | |
기장 사업소 | 755 | |
북부 사업소 | 527 | |
남부 사업소 | 463 | |
부산진 사업소 | 374 | |
해운대 사업소 | 281 | 5.9% |
사하 사업소 | 238 | 5.0% |
중동부 사업소 | 183 | 3.8% |
서부 사업소 | 141 | 2.9% |
Other values (3) | 163 | 3.4% |
Length
Value | Count | Frequency (%) |
사업소 | 3952 | |
강서 | 857 | 9.8% |
동래통합사업소 | 820 | 9.4% |
기장 | 755 | 8.6% |
북부 | 527 | 6.0% |
남부 | 463 | 5.3% |
부산진 | 374 | 4.3% |
해운대 | 281 | 3.2% |
사하 | 238 | 2.7% |
중동부 | 183 | 2.1% |
Other values (4) | 304 | 3.5% |
상수도업종
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.6 KiB |
<NA> | |
---|---|
일반용 | 197 |
가정용 | 128 |
공업용수 | 1 |
사회복지 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9323199 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | 가정용 |
3rd row | 가정용 |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 4475 | |
일반용 | 197 | 4.1% |
가정용 | 128 | 2.7% |
공업용수 | 1 | < 0.1% |
사회복지 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 4475 | |
일반용 | 197 | 4.1% |
가정용 | 128 | 2.7% |
공업용수 | 1 | < 0.1% |
사회복지 | 1 | < 0.1% |
월사용량
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 107 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 63.55581 |
Minimum | 0 |
---|---|
Maximum | 100000 |
Zeros | 466 |
Zeros (%) | 9.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 42.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 5 |
median | 10 |
Q3 | 20 |
95-th percentile | 100 |
Maximum | 100000 |
Range | 100000 |
Interquartile range (IQR) | 15 |
Descriptive statistics
Standard deviation | 1465.7565 |
---|---|
Coefficient of variation (CV) | 23.062509 |
Kurtosis | 4504.654 |
Mean | 63.55581 |
Median Absolute Deviation (MAD) | 7 |
Skewness | 66.198522 |
Sum | 305195 |
Variance | 2148442 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10 | 2156 | |
1 | 716 | 14.9% |
0 | 466 | 9.7% |
100 | 458 | 9.5% |
15 | 200 | 4.2% |
50 | 175 | 3.6% |
30 | 116 | 2.4% |
20 | 76 | 1.6% |
40 | 55 | 1.1% |
60 | 33 | 0.7% |
Other values (97) | 351 | 7.3% |
Value | Count | Frequency (%) |
0 | 466 | 9.7% |
1 | 716 | 14.9% |
2 | 7 | 0.1% |
3 | 7 | 0.1% |
5 | 6 | 0.1% |
6 | 1 | < 0.1% |
7 | 1 | < 0.1% |
8 | 6 | 0.1% |
10 | 2156 | |
11 | 4 | 0.1% |
Value | Count | Frequency (%) |
100000 | 1 | < 0.1% |
10000 | 2 | < 0.1% |
5000 | 2 | < 0.1% |
3120 | 1 | < 0.1% |
3000 | 2 | < 0.1% |
2316 | 2 | < 0.1% |
1500 | 2 | < 0.1% |
1000 | 19 | |
900 | 1 | < 0.1% |
800 | 2 | < 0.1% |
구경
Real number (ℝ)
Distinct | 14 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 31.304456 |
Minimum | 13 |
---|---|
Maximum | 400 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 42.3 KiB |
Quantile statistics
Minimum | 13 |
---|---|
5-th percentile | 15 |
Q1 | 15 |
median | 15 |
Q3 | 25 |
95-th percentile | 100 |
Maximum | 400 |
Range | 387 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 41.686786 |
---|---|
Coefficient of variation (CV) | 1.3316566 |
Kurtosis | 37.840023 |
Mean | 31.304456 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 5.3480935 |
Sum | 150324 |
Variance | 1737.7881 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
15 | 2576 | |
25 | 697 | 14.5% |
20 | 550 | 11.5% |
100 | 351 | 7.3% |
40 | 175 | 3.6% |
32 | 150 | 3.1% |
50 | 141 | 2.9% |
80 | 64 | 1.3% |
200 | 28 | 0.6% |
150 | 27 | 0.6% |
Other values (4) | 43 | 0.9% |
Value | Count | Frequency (%) |
13 | 3 | 0.1% |
15 | 2576 | |
20 | 550 | 11.5% |
25 | 697 | 14.5% |
32 | 150 | 3.1% |
40 | 175 | 3.6% |
50 | 141 | 2.9% |
80 | 64 | 1.3% |
100 | 351 | 7.3% |
150 | 27 | 0.6% |
Value | Count | Frequency (%) |
400 | 27 | 0.6% |
300 | 9 | 0.2% |
250 | 4 | 0.1% |
200 | 28 | 0.6% |
150 | 27 | 0.6% |
100 | 351 | |
80 | 64 | 1.3% |
50 | 141 | |
40 | 175 | |
32 | 150 |
전수
Real number (ℝ)
Distinct | 42 |
---|---|
Distinct (%) | 0.9% |
Missing | 8 |
Missing (%) | 0.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.8224864 |
Minimum | 0 |
---|---|
Maximum | 115 |
Zeros | 47 |
Zeros (%) | 1.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 42.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 8 |
Maximum | 115 |
Range | 115 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 4.0136928 |
---|---|
Coefficient of variation (CV) | 2.202317 |
Kurtosis | 174.50908 |
Mean | 1.8224864 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 9.8938747 |
Sum | 8737 |
Variance | 16.10973 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 4353 | |
8 | 79 | 1.6% |
0 | 47 | 1.0% |
12 | 37 | 0.8% |
2 | 36 | 0.7% |
3 | 31 | 0.6% |
10 | 22 | 0.5% |
5 | 20 | 0.4% |
16 | 20 | 0.4% |
6 | 17 | 0.4% |
Other values (32) | 132 | 2.7% |
Value | Count | Frequency (%) |
0 | 47 | 1.0% |
1 | 4353 | |
2 | 36 | 0.7% |
3 | 31 | 0.6% |
4 | 16 | 0.3% |
5 | 20 | 0.4% |
6 | 17 | 0.4% |
7 | 12 | 0.2% |
8 | 79 | 1.6% |
9 | 8 | 0.2% |
Value | Count | Frequency (%) |
115 | 1 | |
62 | 1 | |
49 | 1 | |
48 | 1 | |
47 | 1 | |
42 | 2 | |
41 | 2 | |
40 | 1 | |
35 | 1 | |
33 | 1 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.019 | 0.000 | 0.149 | 0.000 | 0.000 | 0.000 |
사업소코드 | 0.019 | 1.000 | 1.000 | 0.000 | 0.030 | 0.857 | 0.063 |
사업소명 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.635 | 0.140 |
상수도업종 | 0.149 | 0.000 | 0.000 | 1.000 | NaN | 0.292 | 0.000 |
월사용량 | 0.000 | 0.030 | 0.000 | NaN | 1.000 | 0.656 | 0.000 |
구경 | 0.000 | 0.857 | 0.635 | 0.292 | 0.656 | 1.000 | 0.000 |
전수 | 0.000 | 0.063 | 0.140 | 0.000 | 0.000 | 0.000 | 1.000 |
상수도업종 | 사업소명 | |
---|---|---|
상수도업종 | 1.000 | 0.000 |
사업소명 | 0.000 | 1.000 |
연번 | 사업소코드 | 월사용량 | 구경 | 전수 | 사업소명 | 상수도업종 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | -0.001 | 0.029 | -0.011 | -0.003 | 0.000 | 0.088 |
사업소코드 | -0.001 | 1.000 | -0.153 | -0.132 | -0.091 | 0.999 | 0.000 |
월사용량 | 0.029 | -0.153 | 1.000 | 0.087 | 0.134 | 0.000 | 1.000 |
구경 | -0.011 | -0.132 | 0.087 | 1.000 | -0.249 | 0.352 | 0.191 |
전수 | -0.003 | -0.091 | 0.134 | -0.249 | 1.000 | 0.065 | 0.000 |
사업소명 | 0.000 | 0.999 | 0.000 | 0.352 | 0.065 | 1.000 | 0.000 |
상수도업종 | 0.088 | 0.000 | 1.000 | 0.191 | 0.000 | 0.000 | 1.000 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
0 | 1 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
1 | 2 | 312 | 기장 사업소 | 가정용 | 42 | 20 | 1 |
2 | 3 | 306 | 남부 사업소 | 가정용 | 21 | 15 | 1 |
3 | 4 | 304 | 부산진 사업소 | <NA> | 1 | 15 | 1 |
4 | 5 | 304 | 부산진 사업소 | <NA> | 1 | 25 | 1 |
5 | 6 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
6 | 7 | 312 | 기장 사업소 | <NA> | 10 | 15 | 1 |
7 | 8 | 244 | 동래통합사업소 | <NA> | 10 | 15 | 1 |
8 | 9 | 312 | 기장 사업소 | 일반용 | 15 | 20 | 1 |
9 | 10 | 312 | 기장 사업소 | 가정용 | 15 | 15 | 1 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
4792 | 4793 | 302 | 서부 사업소 | <NA> | 100 | 15 | 8 |
4793 | 4794 | 306 | 남부 사업소 | <NA> | 10 | 25 | 1 |
4794 | 4795 | 312 | 기장 사업소 | 일반용 | 60 | 32 | 1 |
4795 | 4796 | 244 | 동래통합사업소 | <NA> | 1 | 25 | 1 |
4796 | 4797 | 309 | 사하 사업소 | <NA> | 100 | 20 | 3 |
4797 | 4798 | 311 | 강서 사업소 | <NA> | 10 | 80 | 1 |
4798 | 4799 | 201 | 시설관리사업소 | <NA> | 1 | 200 | 1 |
4799 | 4800 | 306 | 남부 사업소 | <NA> | 26 | 15 | 16 |
4800 | 4801 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
4801 | 4802 | 244 | 동래통합사업소 | <NA> | 1 | 25 | 1 |