Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2593 |
Missing cells | 2 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 152.1 KiB |
Average record size in memory | 60.1 B |
Variable types
Numeric | 4 |
---|---|
Categorical | 3 |
Dataset
Description | 부산광역시상수도사업본부_수용가정보시스템_민원신청정보_누수탐지비_20220131 |
---|---|
Author | 부산광역시 상수도사업본부 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15083449 |
사업소코드 is highly overall correlated with 사업소명 and 1 other fields | High correlation |
사업소명 is highly overall correlated with 사업소코드 and 2 other fields | High correlation |
신청부서명 is highly overall correlated with 사업소코드 and 1 other fields | High correlation |
건물형태 is highly overall correlated with 사업소명 | High correlation |
건물형태 is highly imbalanced (60.4%) | Imbalance |
누수탐지지급액 is highly skewed (γ1 = 35.07234848) | Skewed |
연번 has unique values | Unique |
누수탐지소요액 has 28 (1.1%) zeros | Zeros |
누수탐지지급액 has 27 (1.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 16:56:38.954178 |
---|---|
Analysis finished | 2023-12-10 16:56:43.607695 |
Duration | 4.65 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 2593 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1297 |
Minimum | 1 |
---|---|
Maximum | 2593 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 22.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 130.6 |
Q1 | 649 |
median | 1297 |
Q3 | 1945 |
95-th percentile | 2463.4 |
Maximum | 2593 |
Range | 2592 |
Interquartile range (IQR) | 1296 |
Descriptive statistics
Standard deviation | 748.67895 |
---|---|
Coefficient of variation (CV) | 0.57723897 |
Kurtosis | -1.2 |
Mean | 1297 |
Median Absolute Deviation (MAD) | 648 |
Skewness | 0 |
Sum | 3363121 |
Variance | 560520.17 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
1743 | 1 | < 0.1% |
1725 | 1 | < 0.1% |
1726 | 1 | < 0.1% |
1727 | 1 | < 0.1% |
1728 | 1 | < 0.1% |
1729 | 1 | < 0.1% |
1730 | 1 | < 0.1% |
1731 | 1 | < 0.1% |
1732 | 1 | < 0.1% |
Other values (2583) | 2583 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
2593 | 1 | |
2592 | 1 | |
2591 | 1 | |
2590 | 1 | |
2589 | 1 | |
2588 | 1 | |
2587 | 1 | |
2586 | 1 | |
2585 | 1 | |
2584 | 1 |
사업소코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 289.69148 |
Minimum | 244 |
---|---|
Maximum | 312 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 22.9 KiB |
Quantile statistics
Minimum | 244 |
---|---|
5-th percentile | 244 |
Q1 | 244 |
median | 304 |
Q3 | 307 |
95-th percentile | 311 |
Maximum | 312 |
Range | 68 |
Interquartile range (IQR) | 63 |
Descriptive statistics
Standard deviation | 26.968941 |
---|---|
Coefficient of variation (CV) | 0.093095389 |
Kurtosis | -0.77714593 |
Mean | 289.69148 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -1.0829919 |
Sum | 751170 |
Variance | 727.32376 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
244 | 665 | |
306 | 336 | |
304 | 271 | |
301 | 226 | 8.7% |
307 | 222 | 8.6% |
303 | 197 | 7.6% |
302 | 181 | 7.0% |
308 | 173 | 6.7% |
309 | 165 | 6.4% |
312 | 81 | 3.1% |
Value | Count | Frequency (%) |
244 | 665 | |
301 | 226 | 8.7% |
302 | 181 | 7.0% |
303 | 197 | 7.6% |
304 | 271 | |
306 | 336 | |
307 | 222 | 8.6% |
308 | 173 | 6.7% |
309 | 165 | 6.4% |
311 | 76 | 2.9% |
Value | Count | Frequency (%) |
312 | 81 | 3.1% |
311 | 76 | 2.9% |
309 | 165 | |
308 | 173 | |
307 | 222 | |
306 | 336 | |
304 | 271 | |
303 | 197 | |
302 | 181 | |
301 | 226 |
사업소명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
동래통합사업소 | |
---|---|
남부 사업소 | |
부산진 사업소 | |
중동부 사업소 | |
북부 사업소 | |
Other values (6) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 8.2286926 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남부 사업소 |
---|---|
2nd row | 남부 사업소 |
3rd row | 남부 사업소 |
4th row | 남부 사업소 |
5th row | 남부 사업소 |
Common Values
Value | Count | Frequency (%) |
동래통합사업소 | 665 | |
남부 사업소 | 336 | |
부산진 사업소 | 271 | |
중동부 사업소 | 226 | 8.7% |
북부 사업소 | 222 | 8.6% |
영도 사업소 | 197 | 7.6% |
서부 사업소 | 181 | 7.0% |
해운대 사업소 | 173 | 6.7% |
사하 사업소 | 165 | 6.4% |
기장 사업소 | 81 | 3.1% |
Length
Value | Count | Frequency (%) |
사업소 | 1928 | |
동래통합사업소 | 665 | 14.7% |
남부 | 336 | 7.4% |
부산진 | 271 | 6.0% |
중동부 | 226 | 5.0% |
북부 | 222 | 4.9% |
영도 | 197 | 4.4% |
서부 | 181 | 4.0% |
해운대 | 173 | 3.8% |
사하 | 165 | 3.6% |
Other values (2) | 157 | 3.5% |
신청부서명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
급수운영팀 | |
---|---|
요금1 | |
요금 | |
요금2 | |
공무 | |
Other values (6) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.2398766 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 요금2 |
---|---|
2nd row | 요금2 |
3rd row | 요금2 |
4th row | 요금2 |
5th row | 요금2 |
Common Values
Value | Count | Frequency (%) |
급수운영팀 | 657 | |
요금1 | 497 | |
요금 | 424 | |
요금2 | 384 | |
공무 | 192 | 7.4% |
공무1 | 170 | 6.6% |
공무2 | 144 | 5.6% |
업무 | 74 | 2.9% |
서무 | 26 | 1.0% |
<NA> | 24 | 0.9% |
Length
Value | Count | Frequency (%) |
급수운영팀 | 657 | |
요금1 | 497 | |
요금 | 424 | |
요금2 | 384 | |
공무 | 192 | 7.4% |
공무1 | 170 | 6.6% |
공무2 | 144 | 5.6% |
업무 | 74 | 2.9% |
서무 | 26 | 1.0% |
na | 24 | 0.9% |
건물형태
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
단독주택 | |
---|---|
기타 | |
공동주택 | 176 |
<NA> | 25 |
근린생활시설(상가 등) | 2 |
Length
Max length | 12 |
---|---|
Median length | 4 |
Mean length | 3.7932896 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 단독주택 |
---|---|
2nd row | 단독주택 |
3rd row | 단독주택 |
4th row | 단독주택 |
5th row | 단독주택 |
Common Values
Value | Count | Frequency (%) |
단독주택 | 2114 | |
기타 | 276 | 10.6% |
공동주택 | 176 | 6.8% |
<NA> | 25 | 1.0% |
근린생활시설(상가 등) | 2 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단독주택 | 2114 | |
기타 | 276 | 10.6% |
공동주택 | 176 | 6.8% |
na | 25 | 1.0% |
근린생활시설(상가 | 2 | 0.1% |
등 | 2 | 0.1% |
누수탐지소요액
Real number (ℝ)
ZEROS
 
Distinct | 59 |
---|---|
Distinct (%) | 2.3% |
Missing | 1 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 244266.59 |
Minimum | 0 |
---|---|
Maximum | 2500000 |
Zeros | 28 |
Zeros (%) | 1.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 22.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 90000 |
Q1 | 120000 |
median | 200000 |
Q3 | 300000 |
95-th percentile | 550000 |
Maximum | 2500000 |
Range | 2500000 |
Interquartile range (IQR) | 180000 |
Descriptive statistics
Standard deviation | 188978.67 |
---|---|
Coefficient of variation (CV) | 0.77365746 |
Kurtosis | 27.429373 |
Mean | 244266.59 |
Median Absolute Deviation (MAD) | 100000 |
Skewness | 3.8231064 |
Sum | 6.33139 × 108 |
Variance | 3.5712937 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100000 | 490 | |
150000 | 428 | |
200000 | 405 | |
300000 | 399 | |
250000 | 213 | |
400000 | 131 | 5.1% |
500000 | 90 | 3.5% |
350000 | 89 | 3.4% |
80000 | 78 | 3.0% |
600000 | 43 | 1.7% |
Other values (49) | 226 |
Value | Count | Frequency (%) |
0 | 28 | 1.1% |
20000 | 1 | < 0.1% |
30000 | 1 | < 0.1% |
40000 | 12 | 0.5% |
50000 | 4 | 0.2% |
60000 | 1 | < 0.1% |
70000 | 3 | 0.1% |
80000 | 78 | |
90000 | 26 | 1.0% |
95000 | 1 | < 0.1% |
Value | Count | Frequency (%) |
2500000 | 1 | < 0.1% |
2400000 | 1 | < 0.1% |
2000000 | 1 | < 0.1% |
1800000 | 1 | < 0.1% |
1705000 | 1 | < 0.1% |
1700000 | 1 | < 0.1% |
1600000 | 1 | < 0.1% |
1500000 | 4 | |
1300000 | 2 | |
1200000 | 4 |
누수탐지지급액
Real number (ℝ)
SKEWED
  ZEROS
 
Distinct | 7 |
---|---|
Distinct (%) | 0.3% |
Missing | 1 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 39706.79 |
Minimum | 0 |
---|---|
Maximum | 450000 |
Zeros | 27 |
Zeros (%) | 1.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 22.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 40000 |
Q1 | 40000 |
median | 40000 |
Q3 | 40000 |
95-th percentile | 40000 |
Maximum | 450000 |
Range | 450000 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 9052.5112 |
---|---|
Coefficient of variation (CV) | 0.22798396 |
Kurtosis | 1633.328 |
Mean | 39706.79 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 35.072348 |
Sum | 1.0292 × 108 |
Variance | 81947959 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
40000 | 2556 | |
0 | 27 | 1.0% |
25000 | 3 | 0.1% |
35000 | 3 | 0.1% |
20000 | 1 | < 0.1% |
450000 | 1 | < 0.1% |
30000 | 1 | < 0.1% |
(Missing) | 1 | < 0.1% |
Value | Count | Frequency (%) |
0 | 27 | 1.0% |
20000 | 1 | < 0.1% |
25000 | 3 | 0.1% |
30000 | 1 | < 0.1% |
35000 | 3 | 0.1% |
40000 | 2556 | |
450000 | 1 | < 0.1% |
Value | Count | Frequency (%) |
450000 | 1 | < 0.1% |
40000 | 2556 | |
35000 | 3 | 0.1% |
30000 | 1 | < 0.1% |
25000 | 3 | 0.1% |
20000 | 1 | < 0.1% |
0 | 27 | 1.0% |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.182 | 0.221 | 0.290 | 0.106 | 0.000 | 0.003 |
사업소코드 | 0.182 | 1.000 | 1.000 | 0.820 | 0.657 | 0.109 | 0.000 |
사업소명 | 0.221 | 1.000 | 1.000 | 0.930 | 0.841 | 0.218 | 0.017 |
신청부서명 | 0.290 | 0.820 | 0.930 | 1.000 | 0.662 | 0.205 | 0.058 |
건물형태 | 0.106 | 0.657 | 0.841 | 0.662 | 1.000 | 0.000 | 0.000 |
누수탐지소요액 | 0.000 | 0.109 | 0.218 | 0.205 | 0.000 | 1.000 | 0.000 |
누수탐지지급액 | 0.003 | 0.000 | 0.017 | 0.058 | 0.000 | 0.000 | 1.000 |
신청부서명 | 사업소명 | 건물형태 | |
---|---|---|---|
신청부서명 | 1.000 | 0.748 | 0.462 |
사업소명 | 0.748 | 1.000 | 0.692 |
건물형태 | 0.462 | 0.692 | 1.000 |
연번 | 사업소코드 | 누수탐지소요액 | 누수탐지지급액 | 사업소명 | 신청부서명 | 건물형태 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | -0.031 | -0.028 | -0.092 | 0.096 | 0.093 | 0.064 |
사업소코드 | -0.031 | 1.000 | 0.001 | 0.007 | 0.998 | 0.839 | 0.366 |
누수탐지소요액 | -0.028 | 0.001 | 1.000 | 0.203 | 0.100 | 0.094 | 0.000 |
누수탐지지급액 | -0.092 | 0.007 | 0.203 | 1.000 | 0.016 | 0.045 | 0.000 |
사업소명 | 0.096 | 0.998 | 0.100 | 0.016 | 1.000 | 0.748 | 0.692 |
신청부서명 | 0.093 | 0.839 | 0.094 | 0.045 | 0.748 | 1.000 | 0.462 |
건물형태 | 0.064 | 0.366 | 0.000 | 0.000 | 0.692 | 0.462 | 1.000 |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
0 | 1 | 306 | 남부 사업소 | 요금2 | 단독주택 | 150000 | 40000 |
1 | 2 | 306 | 남부 사업소 | 요금2 | 단독주택 | 100000 | 40000 |
2 | 3 | 306 | 남부 사업소 | 요금2 | 단독주택 | 600000 | 40000 |
3 | 4 | 306 | 남부 사업소 | 요금2 | 단독주택 | 500000 | 40000 |
4 | 5 | 306 | 남부 사업소 | 요금2 | 단독주택 | 1200000 | 40000 |
5 | 6 | 306 | 남부 사업소 | 요금2 | 단독주택 | 350000 | 40000 |
6 | 7 | 306 | 남부 사업소 | 요금2 | 단독주택 | 300000 | 40000 |
7 | 8 | 308 | 해운대 사업소 | 공무 | 단독주택 | 300000 | 40000 |
8 | 9 | 304 | 부산진 사업소 | 요금2 | 기타 | 800000 | 40000 |
9 | 10 | 304 | 부산진 사업소 | 요금1 | 기타 | 200000 | 40000 |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
2583 | 2584 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 300000 | 40000 |
2584 | 2585 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 1000000 | 40000 |
2585 | 2586 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 150000 | 40000 |
2586 | 2587 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 200000 | 40000 |
2587 | 2588 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 500000 | 40000 |
2588 | 2589 | 244 | 동래통합사업소 | <NA> | <NA> | 0 | 0 |
2589 | 2590 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 700000 | 40000 |
2590 | 2591 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 300000 | 40000 |
2591 | 2592 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 150000 | 40000 |
2592 | 2593 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 150000 | 40000 |