Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2230 |
Missing cells | 6 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 130.8 KiB |
Average record size in memory | 60.1 B |
Variable types
Numeric | 4 |
---|---|
Categorical | 3 |
Dataset
Description | 부산광역시상수도사업본부_수용가정보시스템_민원신청정보_누수탐지비_20230126 |
---|---|
Author | 부산광역시 상수도사업본부 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15083449 |
사업소코드 is highly overall correlated with 사업소명 and 1 other fields | High correlation |
사업소명 is highly overall correlated with 사업소코드 and 2 other fields | High correlation |
신청부서명 is highly overall correlated with 사업소코드 and 1 other fields | High correlation |
건물형태 is highly overall correlated with 사업소명 | High correlation |
건물형태 is highly imbalanced (66.9%) | Imbalance |
누수탐지지급액 is highly skewed (γ1 = 39.27539373) | Skewed |
연번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 16:56:29.786356 |
---|---|
Analysis finished | 2023-12-10 16:56:33.084715 |
Duration | 3.3 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 2230 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1115.5 |
Minimum | 1 |
---|---|
Maximum | 2230 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 19.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 112.45 |
Q1 | 558.25 |
median | 1115.5 |
Q3 | 1672.75 |
95-th percentile | 2118.55 |
Maximum | 2230 |
Range | 2229 |
Interquartile range (IQR) | 1114.5 |
Descriptive statistics
Standard deviation | 643.88987 |
---|---|
Coefficient of variation (CV) | 0.57722086 |
Kurtosis | -1.2 |
Mean | 1115.5 |
Median Absolute Deviation (MAD) | 557.5 |
Skewness | 0 |
Sum | 2487565 |
Variance | 414594.17 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
1491 | 1 | < 0.1% |
1485 | 1 | < 0.1% |
1486 | 1 | < 0.1% |
1487 | 1 | < 0.1% |
1488 | 1 | < 0.1% |
1489 | 1 | < 0.1% |
1490 | 1 | < 0.1% |
1492 | 1 | < 0.1% |
1500 | 1 | < 0.1% |
Other values (2220) | 2220 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
2230 | 1 | |
2229 | 1 | |
2228 | 1 | |
2227 | 1 | |
2226 | 1 | |
2225 | 1 | |
2224 | 1 | |
2223 | 1 | |
2222 | 1 | |
2221 | 1 |
사업소코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 289.71883 |
Minimum | 244 |
---|---|
Maximum | 312 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 19.7 KiB |
Quantile statistics
Minimum | 244 |
---|---|
5-th percentile | 244 |
Q1 | 244 |
median | 304 |
Q3 | 307 |
95-th percentile | 311 |
Maximum | 312 |
Range | 68 |
Interquartile range (IQR) | 63 |
Descriptive statistics
Standard deviation | 27.270464 |
---|---|
Coefficient of variation (CV) | 0.094127342 |
Kurtosis | -0.82903864 |
Mean | 289.71883 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -1.0601262 |
Sum | 646073 |
Variance | 743.6782 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
244 | 581 | |
307 | 288 | |
306 | 236 | |
304 | 212 | 9.5% |
303 | 170 | 7.6% |
301 | 165 | 7.4% |
309 | 160 | 7.2% |
308 | 149 | 6.7% |
302 | 113 | 5.1% |
312 | 80 | 3.6% |
Value | Count | Frequency (%) |
244 | 581 | |
301 | 165 | 7.4% |
302 | 113 | 5.1% |
303 | 170 | 7.6% |
304 | 212 | 9.5% |
306 | 236 | |
307 | 288 | |
308 | 149 | 6.7% |
309 | 160 | 7.2% |
311 | 76 | 3.4% |
Value | Count | Frequency (%) |
312 | 80 | 3.6% |
311 | 76 | 3.4% |
309 | 160 | |
308 | 149 | |
307 | 288 | |
306 | 236 | |
304 | 212 | |
303 | 170 | |
302 | 113 | 5.1% |
301 | 165 |
사업소명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 17.6 KiB |
동래통합사업소 | |
---|---|
북부 사업소 | |
남부 사업소 | |
부산진 사업소 | |
영도 사업소 | |
Other values (6) |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 8.2430493 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 동래통합사업소 |
---|---|
2nd row | 강서 사업소 |
3rd row | 강서 사업소 |
4th row | 해운대 사업소 |
5th row | 동래통합사업소 |
Common Values
Value | Count | Frequency (%) |
동래통합사업소 | 581 | |
북부 사업소 | 288 | |
남부 사업소 | 236 | |
부산진 사업소 | 212 | 9.5% |
영도 사업소 | 170 | 7.6% |
중동부 사업소 | 165 | 7.4% |
사하 사업소 | 160 | 7.2% |
해운대 사업소 | 149 | 6.7% |
서부 사업소 | 113 | 5.1% |
기장 사업소 | 80 | 3.6% |
Length
Value | Count | Frequency (%) |
사업소 | 1649 | |
동래통합사업소 | 581 | 15.0% |
북부 | 288 | 7.4% |
남부 | 236 | 6.1% |
부산진 | 212 | 5.5% |
영도 | 170 | 4.4% |
중동부 | 165 | 4.3% |
사하 | 160 | 4.1% |
해운대 | 149 | 3.8% |
서부 | 113 | 2.9% |
Other values (2) | 156 | 4.0% |
신청부서명
Categorical
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 17.6 KiB |
급수운영팀 | |
---|---|
요금1 | |
요금 | |
공무1 | |
공무 | |
Other values (4) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.2609865 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 급수운영팀 |
---|---|
2nd row | 요금 |
3rd row | 요금 |
4th row | 공무 |
5th row | 급수운영팀 |
Common Values
Value | Count | Frequency (%) |
급수운영팀 | 581 | |
요금1 | 419 | |
요금 | 358 | |
공무1 | 238 | |
공무 | 228 | 10.2% |
요금2 | 211 | 9.5% |
공무2 | 185 | 8.3% |
<NA> | 8 | 0.4% |
업무 | 2 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
급수운영팀 | 581 | |
요금1 | 419 | |
요금 | 358 | |
공무1 | 238 | |
공무 | 228 | 10.2% |
요금2 | 211 | 9.5% |
공무2 | 185 | 8.3% |
na | 8 | 0.4% |
업무 | 2 | 0.1% |
건물형태
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 17.6 KiB |
단독주택 | |
---|---|
기타 | |
공동주택 | 82 |
<NA> | 8 |
근린생활시설(상가 등) | 3 |
Length
Max length | 12 |
---|---|
Median length | 4 |
Mean length | 3.7910314 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 단독주택 |
---|---|
2nd row | 단독주택 |
3rd row | 단독주택 |
4th row | 단독주택 |
5th row | 단독주택 |
Common Values
Value | Count | Frequency (%) |
단독주택 | 1892 | |
기타 | 245 | 11.0% |
공동주택 | 82 | 3.7% |
<NA> | 8 | 0.4% |
근린생활시설(상가 등) | 3 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단독주택 | 1892 | |
기타 | 245 | 11.0% |
공동주택 | 82 | 3.7% |
na | 8 | 0.4% |
근린생활시설(상가 | 3 | 0.1% |
등 | 3 | 0.1% |
누수탐지소요액
Real number (ℝ)
Distinct | 65 |
---|---|
Distinct (%) | 2.9% |
Missing | 3 |
Missing (%) | 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 255423.44 |
Minimum | 0 |
---|---|
Maximum | 3000000 |
Zeros | 8 |
Zeros (%) | 0.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 19.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 100000 |
Q1 | 150000 |
median | 200000 |
Q3 | 300000 |
95-th percentile | 585000 |
Maximum | 3000000 |
Range | 3000000 |
Interquartile range (IQR) | 150000 |
Descriptive statistics
Standard deviation | 207049.72 |
---|---|
Coefficient of variation (CV) | 0.81061362 |
Kurtosis | 39.385186 |
Mean | 255423.44 |
Median Absolute Deviation (MAD) | 100000 |
Skewness | 4.7080641 |
Sum | 5.68828 × 108 |
Variance | 4.2869587 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100000 | 466 | |
300000 | 393 | |
200000 | 360 | |
150000 | 284 | |
250000 | 200 | |
400000 | 107 | 4.8% |
500000 | 77 | 3.5% |
350000 | 71 | 3.2% |
80000 | 40 | 1.8% |
450000 | 35 | 1.6% |
Other values (55) | 194 |
Value | Count | Frequency (%) |
0 | 8 | 0.4% |
10000 | 1 | < 0.1% |
30000 | 1 | < 0.1% |
40000 | 2 | 0.1% |
50000 | 4 | 0.2% |
60000 | 1 | < 0.1% |
70000 | 3 | 0.1% |
80000 | 40 | 1.8% |
90000 | 19 | 0.9% |
100000 | 466 |
Value | Count | Frequency (%) |
3000000 | 1 | < 0.1% |
2500000 | 2 | |
2020000 | 1 | < 0.1% |
2000000 | 3 | |
1800000 | 1 | < 0.1% |
1500000 | 2 | |
1430000 | 1 | < 0.1% |
1400000 | 1 | < 0.1% |
1300000 | 1 | < 0.1% |
1250000 | 1 | < 0.1% |
누수탐지지급액
Real number (ℝ)
SKEWED
 
Distinct | 9 |
---|---|
Distinct (%) | 0.4% |
Missing | 3 |
Missing (%) | 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 39956.893 |
Minimum | 0 |
---|---|
Maximum | 400000 |
Zeros | 8 |
Zeros (%) | 0.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 19.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 40000 |
Q1 | 40000 |
median | 40000 |
Q3 | 40000 |
95-th percentile | 40000 |
Maximum | 400000 |
Range | 400000 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 8080.3985 |
---|---|
Coefficient of variation (CV) | 0.2022279 |
Kurtosis | 1774.9444 |
Mean | 39956.893 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 39.275394 |
Sum | 88984000 |
Variance | 65292840 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
40000 | 2209 | |
0 | 8 | 0.4% |
35000 | 3 | 0.1% |
25000 | 2 | 0.1% |
400000 | 1 | < 0.1% |
4000 | 1 | < 0.1% |
15000 | 1 | < 0.1% |
20000 | 1 | < 0.1% |
30000 | 1 | < 0.1% |
(Missing) | 3 | 0.1% |
Value | Count | Frequency (%) |
0 | 8 | 0.4% |
4000 | 1 | < 0.1% |
15000 | 1 | < 0.1% |
20000 | 1 | < 0.1% |
25000 | 2 | 0.1% |
30000 | 1 | < 0.1% |
35000 | 3 | 0.1% |
40000 | 2209 | |
400000 | 1 | < 0.1% |
Value | Count | Frequency (%) |
400000 | 1 | < 0.1% |
40000 | 2209 | |
35000 | 3 | 0.1% |
30000 | 1 | < 0.1% |
25000 | 2 | 0.1% |
20000 | 1 | < 0.1% |
15000 | 1 | < 0.1% |
4000 | 1 | < 0.1% |
0 | 8 | 0.4% |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.060 | 0.223 | 0.203 | 0.073 | 0.065 | 0.000 |
사업소코드 | 0.060 | 1.000 | 1.000 | 0.504 | 0.464 | 0.041 | 0.000 |
사업소명 | 0.223 | 1.000 | 1.000 | 0.925 | 0.721 | 0.116 | 0.000 |
신청부서명 | 0.203 | 0.504 | 0.925 | 1.000 | 0.628 | 0.133 | 0.057 |
건물형태 | 0.073 | 0.464 | 0.721 | 0.628 | 1.000 | 0.084 | 0.000 |
누수탐지소요액 | 0.065 | 0.041 | 0.116 | 0.133 | 0.084 | 1.000 | 0.000 |
누수탐지지급액 | 0.000 | 0.000 | 0.000 | 0.057 | 0.000 | 0.000 | 1.000 |
신청부서명 | 사업소명 | 건물형태 | |
---|---|---|---|
신청부서명 | 1.000 | 0.784 | 0.321 |
사업소명 | 0.784 | 1.000 | 0.531 |
건물형태 | 0.321 | 0.531 | 1.000 |
연번 | 사업소코드 | 누수탐지소요액 | 누수탐지지급액 | 사업소명 | 신청부서명 | 건물형태 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.047 | -0.007 | -0.020 | 0.097 | 0.098 | 0.044 |
사업소코드 | 0.047 | 1.000 | -0.018 | -0.025 | 0.998 | 0.803 | 0.279 |
누수탐지소요액 | -0.007 | -0.018 | 1.000 | 0.135 | 0.052 | 0.065 | 0.054 |
누수탐지지급액 | -0.020 | -0.025 | 0.135 | 1.000 | 0.000 | 0.042 | 0.000 |
사업소명 | 0.097 | 0.998 | 0.052 | 0.000 | 1.000 | 0.784 | 0.531 |
신청부서명 | 0.098 | 0.803 | 0.065 | 0.042 | 0.784 | 1.000 | 0.321 |
건물형태 | 0.044 | 0.279 | 0.054 | 0.000 | 0.531 | 0.321 | 1.000 |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
0 | 1 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 200000 | 40000 |
1 | 2 | 311 | 강서 사업소 | 요금 | 단독주택 | 150000 | 40000 |
2 | 3 | 311 | 강서 사업소 | 요금 | 단독주택 | 150000 | 40000 |
3 | 4 | 308 | 해운대 사업소 | 공무 | 단독주택 | 300000 | 40000 |
4 | 5 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 100000 | 40000 |
5 | 6 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 250000 | 40000 |
6 | 7 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 400000 | 40000 |
7 | 8 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 300000 | 40000 |
8 | 9 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 150000 | 40000 |
9 | 10 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 500000 | 40000 |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
2220 | 2221 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 300000 | 40000 |
2221 | 2222 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 800000 | 40000 |
2222 | 2223 | 244 | 동래통합사업소 | 급수운영팀 | 단독주택 | 100000 | 40000 |
2223 | 2224 | 307 | 북부 사업소 | 공무1 | 단독주택 | 200000 | 40000 |
2224 | 2225 | 307 | 북부 사업소 | 공무1 | 단독주택 | 200000 | 40000 |
2225 | 2226 | 304 | 부산진 사업소 | 요금1 | 기타 | 2000000 | 40000 |
2226 | 2227 | 304 | 부산진 사업소 | 요금2 | 기타 | 400000 | 40000 |
2227 | 2228 | 304 | 부산진 사업소 | 요금1 | 기타 | 300000 | 40000 |
2228 | 2229 | 311 | 강서 사업소 | 요금 | 단독주택 | 300000 | 40000 |
2229 | 2230 | 301 | 중동부 사업소 | 공무1 | 공동주택 | 150000 | 40000 |