Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 3656 |
Missing cells | 4 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 217.9 KiB |
Average record size in memory | 61.0 B |
Variable types
Numeric | 5 |
---|---|
Categorical | 2 |
Dataset
Description | 부산광역시상수도사업본부_수용가정보시스템_민원신청정보_급수공사(신청승낙)_20230126 |
---|---|
Author | 부산광역시 상수도사업본부 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15083686 |
사업소코드 is highly overall correlated with 사업소명 | High correlation |
월사용량 is highly overall correlated with 상수도업종 | High correlation |
사업소명 is highly overall correlated with 사업소코드 | High correlation |
상수도업종 is highly overall correlated with 월사용량 | High correlation |
상수도업종 is highly imbalanced (82.0%) | Imbalance |
월사용량 is highly skewed (γ1 = 52.82985869) | Skewed |
연번 has unique values | Unique |
월사용량 has 38 (1.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 16:50:55.255613 |
---|---|
Analysis finished | 2023-12-10 16:51:00.191402 |
Duration | 4.94 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 3656 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1828.5 |
Minimum | 1 |
---|---|
Maximum | 3656 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 32.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 183.75 |
Q1 | 914.75 |
median | 1828.5 |
Q3 | 2742.25 |
95-th percentile | 3473.25 |
Maximum | 3656 |
Range | 3655 |
Interquartile range (IQR) | 1827.5 |
Descriptive statistics
Standard deviation | 1055.5406 |
---|---|
Coefficient of variation (CV) | 0.57727133 |
Kurtosis | -1.2 |
Mean | 1828.5 |
Median Absolute Deviation (MAD) | 914 |
Skewness | 0 |
Sum | 6684996 |
Variance | 1114166 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
2430 | 1 | < 0.1% |
2432 | 1 | < 0.1% |
2433 | 1 | < 0.1% |
2434 | 1 | < 0.1% |
2435 | 1 | < 0.1% |
2436 | 1 | < 0.1% |
2437 | 1 | < 0.1% |
2438 | 1 | < 0.1% |
2439 | 1 | < 0.1% |
Other values (3646) | 3646 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
3656 | 1 | |
3655 | 1 | |
3654 | 1 | |
3653 | 1 | |
3652 | 1 | |
3651 | 1 | |
3650 | 1 | |
3649 | 1 | |
3648 | 1 | |
3647 | 1 |
사업소코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 297.84382 |
Minimum | 101 |
---|---|
Maximum | 312 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 32.3 KiB |
Quantile statistics
Minimum | 101 |
---|---|
5-th percentile | 244 |
Q1 | 304 |
median | 307 |
Q3 | 311 |
95-th percentile | 312 |
Maximum | 312 |
Range | 211 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 25.169585 |
---|---|
Coefficient of variation (CV) | 0.084505985 |
Kurtosis | 4.8026857 |
Mean | 297.84382 |
Median Absolute Deviation (MAD) | 4 |
Skewness | -2.1798632 |
Sum | 1088917 |
Variance | 633.50802 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
311 | 730 | |
312 | 667 | |
244 | 545 | |
306 | 382 | |
307 | 341 | |
304 | 298 | |
309 | 212 | 5.8% |
308 | 183 | 5.0% |
301 | 94 | 2.6% |
302 | 88 | 2.4% |
Other values (3) | 116 | 3.2% |
Value | Count | Frequency (%) |
101 | 3 | 0.1% |
201 | 26 | 0.7% |
244 | 545 | |
301 | 94 | 2.6% |
302 | 88 | 2.4% |
303 | 87 | 2.4% |
304 | 298 | |
306 | 382 | |
307 | 341 | |
308 | 183 | 5.0% |
Value | Count | Frequency (%) |
312 | 667 | |
311 | 730 | |
309 | 212 | 5.8% |
308 | 183 | 5.0% |
307 | 341 | |
306 | 382 | |
304 | 298 | |
303 | 87 | 2.4% |
302 | 88 | 2.4% |
301 | 94 | 2.6% |
사업소명
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 28.7 KiB |
강서 사업소 | |
---|---|
기장 사업소 | |
동래통합사업소 | |
남부 사업소 | |
북부 사업소 | |
Other values (8) |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 8.5270788 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 북부 사업소 |
---|---|
2nd row | 강서 사업소 |
3rd row | 기장 사업소 |
4th row | 강서 사업소 |
5th row | 강서 사업소 |
Common Values
Value | Count | Frequency (%) |
강서 사업소 | 730 | |
기장 사업소 | 667 | |
동래통합사업소 | 545 | |
남부 사업소 | 382 | |
북부 사업소 | 341 | |
부산진 사업소 | 298 | |
사하 사업소 | 212 | 5.8% |
해운대 사업소 | 183 | 5.0% |
중동부 사업소 | 94 | 2.6% |
서부 사업소 | 88 | 2.4% |
Other values (3) | 116 | 3.2% |
Length
Value | Count | Frequency (%) |
사업소 | 3082 | |
강서 | 730 | 10.8% |
기장 | 667 | 9.9% |
동래통합사업소 | 545 | 8.1% |
남부 | 382 | 5.7% |
북부 | 341 | 5.1% |
부산진 | 298 | 4.4% |
사하 | 212 | 3.1% |
해운대 | 183 | 2.7% |
중동부 | 94 | 1.4% |
Other values (4) | 204 | 3.0% |
상수도업종
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 28.7 KiB |
<NA> | |
---|---|
일반용 | 130 |
가정용 | 107 |
욕탕용 | 1 |
공동수도 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9349015 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | 일반용 |
Common Values
Value | Count | Frequency (%) |
<NA> | 3417 | |
일반용 | 130 | 3.6% |
가정용 | 107 | 2.9% |
욕탕용 | 1 | < 0.1% |
공동수도 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 3417 | |
일반용 | 130 | 3.6% |
가정용 | 107 | 2.9% |
욕탕용 | 1 | < 0.1% |
공동수도 | 1 | < 0.1% |
월사용량
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 83 |
---|---|
Distinct (%) | 2.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 164.52817 |
Minimum | 0 |
---|---|
Maximum | 270000 |
Zeros | 38 |
Zeros (%) | 1.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 32.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 10 |
median | 10 |
Q3 | 12.75 |
95-th percentile | 100 |
Maximum | 270000 |
Range | 270000 |
Interquartile range (IQR) | 2.75 |
Descriptive statistics
Standard deviation | 4718.7392 |
---|---|
Coefficient of variation (CV) | 28.680433 |
Kurtosis | 2956.1663 |
Mean | 164.52817 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 52.829859 |
Sum | 601515 |
Variance | 22266500 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10 | 1991 | |
1 | 695 | 19.0% |
100 | 228 | 6.2% |
30 | 176 | 4.8% |
50 | 112 | 3.1% |
20 | 77 | 2.1% |
15 | 62 | 1.7% |
0 | 38 | 1.0% |
40 | 29 | 0.8% |
500 | 25 | 0.7% |
Other values (73) | 223 | 6.1% |
Value | Count | Frequency (%) |
0 | 38 | 1.0% |
1 | 695 | 19.0% |
2 | 3 | 0.1% |
3 | 1 | < 0.1% |
4 | 1 | < 0.1% |
5 | 8 | 0.2% |
6 | 2 | 0.1% |
10 | 1991 | |
11 | 1 | < 0.1% |
12 | 2 | 0.1% |
Value | Count | Frequency (%) |
270000 | 1 | < 0.1% |
85000 | 1 | < 0.1% |
22900 | 1 | < 0.1% |
15900 | 1 | < 0.1% |
10000 | 1 | < 0.1% |
8825 | 1 | < 0.1% |
8600 | 3 | |
5000 | 3 | |
4500 | 1 | < 0.1% |
2580 | 1 | < 0.1% |
구경
Real number (ℝ)
Distinct | 13 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 29.740153 |
Minimum | 15 |
---|---|
Maximum | 400 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 32.3 KiB |
Quantile statistics
Minimum | 15 |
---|---|
5-th percentile | 15 |
Q1 | 15 |
median | 15 |
Q3 | 25 |
95-th percentile | 100 |
Maximum | 400 |
Range | 385 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 37.060099 |
---|---|
Coefficient of variation (CV) | 1.2461301 |
Kurtosis | 42.602399 |
Mean | 29.740153 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 5.5673095 |
Sum | 108730 |
Variance | 1373.4509 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
15 | 1978 | |
25 | 560 | 15.3% |
20 | 359 | 9.8% |
100 | 193 | 5.3% |
50 | 177 | 4.8% |
40 | 158 | 4.3% |
32 | 115 | 3.1% |
80 | 46 | 1.3% |
150 | 26 | 0.7% |
200 | 23 | 0.6% |
Other values (3) | 21 | 0.6% |
Value | Count | Frequency (%) |
15 | 1978 | |
20 | 359 | 9.8% |
25 | 560 | 15.3% |
32 | 115 | 3.1% |
40 | 158 | 4.3% |
50 | 177 | 4.8% |
80 | 46 | 1.3% |
100 | 193 | 5.3% |
150 | 26 | 0.7% |
200 | 23 | 0.6% |
Value | Count | Frequency (%) |
400 | 13 | 0.4% |
300 | 7 | 0.2% |
250 | 1 | < 0.1% |
200 | 23 | 0.6% |
150 | 26 | 0.7% |
100 | 193 | |
80 | 46 | 1.3% |
50 | 177 | |
40 | 158 | |
32 | 115 |
전수
Real number (ℝ)
Distinct | 39 |
---|---|
Distinct (%) | 1.1% |
Missing | 4 |
Missing (%) | 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.7779299 |
Minimum | 0 |
---|---|
Maximum | 52 |
Zeros | 35 |
Zeros (%) | 1.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 32.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 7 |
Maximum | 52 |
Range | 52 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 3.6143488 |
---|---|
Coefficient of variation (CV) | 2.0328972 |
Kurtosis | 66.525133 |
Mean | 1.7779299 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 7.1944066 |
Sum | 6493 |
Variance | 13.063517 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 3291 | |
8 | 53 | 1.4% |
2 | 37 | 1.0% |
0 | 35 | 1.0% |
4 | 31 | 0.8% |
5 | 30 | 0.8% |
3 | 25 | 0.7% |
7 | 19 | 0.5% |
12 | 15 | 0.4% |
16 | 14 | 0.4% |
Other values (29) | 102 | 2.8% |
Value | Count | Frequency (%) |
0 | 35 | 1.0% |
1 | 3291 | |
2 | 37 | 1.0% |
3 | 25 | 0.7% |
4 | 31 | 0.8% |
5 | 30 | 0.8% |
6 | 11 | 0.3% |
7 | 19 | 0.5% |
8 | 53 | 1.4% |
9 | 6 | 0.2% |
Value | Count | Frequency (%) |
52 | 1 | |
49 | 1 | |
48 | 2 | |
45 | 1 | |
42 | 1 | |
39 | 1 | |
38 | 1 | |
37 | 1 | |
36 | 2 | |
32 | 1 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.000 | 0.076 | 0.174 | 0.002 | 0.028 | 0.036 |
사업소코드 | 0.000 | 1.000 | 1.000 | 0.122 | 0.000 | 0.757 | 0.113 |
사업소명 | 0.076 | 1.000 | 1.000 | 0.465 | 0.000 | 0.545 | 0.143 |
상수도업종 | 0.174 | 0.122 | 0.465 | 1.000 | NaN | 0.233 | 0.310 |
월사용량 | 0.002 | 0.000 | 0.000 | NaN | 1.000 | 0.388 | 0.000 |
구경 | 0.028 | 0.757 | 0.545 | 0.233 | 0.388 | 1.000 | 0.000 |
전수 | 0.036 | 0.113 | 0.143 | 0.310 | 0.000 | 0.000 | 1.000 |
상수도업종 | 사업소명 | |
---|---|---|
상수도업종 | 1.000 | 0.292 |
사업소명 | 0.292 | 1.000 |
연번 | 사업소코드 | 월사용량 | 구경 | 전수 | 사업소명 | 상수도업종 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | -0.016 | -0.013 | 0.007 | -0.007 | 0.031 | 0.102 |
사업소코드 | -0.016 | 1.000 | -0.024 | -0.169 | -0.112 | 0.999 | 0.080 |
월사용량 | -0.013 | -0.024 | 1.000 | 0.040 | 0.105 | 0.000 | 1.000 |
구경 | 0.007 | -0.169 | 0.040 | 1.000 | -0.276 | 0.283 | 0.222 |
전수 | -0.007 | -0.112 | 0.105 | -0.276 | 1.000 | 0.058 | 0.125 |
사업소명 | 0.031 | 0.999 | 0.000 | 0.283 | 0.058 | 1.000 | 0.292 |
상수도업종 | 0.102 | 0.080 | 1.000 | 0.222 | 0.125 | 0.292 | 1.000 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
0 | 1 | 307 | 북부 사업소 | <NA> | 10 | 15 | 1 |
1 | 2 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
2 | 3 | 312 | 기장 사업소 | <NA> | 10 | 15 | 3 |
3 | 4 | 311 | 강서 사업소 | <NA> | 10 | 15 | 5 |
4 | 5 | 311 | 강서 사업소 | 일반용 | 170 | 80 | 1 |
5 | 6 | 244 | 동래통합사업소 | <NA> | 10 | 25 | 1 |
6 | 7 | 306 | 남부 사업소 | <NA> | 10 | 15 | 18 |
7 | 8 | 304 | 부산진 사업소 | <NA> | 500 | 25 | 1 |
8 | 9 | 311 | 강서 사업소 | <NA> | 0 | 100 | 0 |
9 | 10 | 309 | 사하 사업소 | <NA> | 50 | 15 | 1 |
연번 | 사업소코드 | 사업소명 | 상수도업종 | 월사용량 | 구경 | 전수 | |
---|---|---|---|---|---|---|---|
3646 | 3647 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
3647 | 3648 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
3648 | 3649 | 312 | 기장 사업소 | <NA> | 10 | 50 | 1 |
3649 | 3650 | 311 | 강서 사업소 | <NA> | 10 | 15 | 1 |
3650 | 3651 | 244 | 동래통합사업소 | <NA> | 10 | 15 | 1 |
3651 | 3652 | 304 | 부산진 사업소 | <NA> | 150 | 25 | 1 |
3652 | 3653 | 304 | 부산진 사업소 | <NA> | 1 | 15 | 1 |
3653 | 3654 | 244 | 동래통합사업소 | <NA> | 30 | 25 | 1 |
3654 | 3655 | 312 | 기장 사업소 | <NA> | 10 | 20 | 1 |
3655 | 3656 | 244 | 동래통합사업소 | <NA> | 100 | 100 | 1 |