Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2238 |
Missing cells | 1 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 131.3 KiB |
Average record size in memory | 60.1 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 4 |
Dataset
Description | 부산광역시 상수도사업본부에서 상하수도 요금 계산 및 징수를 위해 운영하는 수용가정보시스템에 사용되는 민원신청 정보(누수탐지비) 자료입니다. |
---|---|
Author | 부산광역시 상수도사업본부 |
URL | https://www.data.go.kr/data/15083449/fileData.do |
사업소코드 is highly overall correlated with 사업소명 and 1 other fields | High correlation |
사업소명 is highly overall correlated with 사업소코드 and 2 other fields | High correlation |
신청부서명 is highly overall correlated with 사업소코드 and 1 other fields | High correlation |
건물형태 is highly overall correlated with 사업소명 | High correlation |
건물형태 is highly imbalanced (51.5%) | Imbalance |
누수탐지지급액 is highly imbalanced (96.4%) | Imbalance |
연번 has unique values | Unique |
Reproduction
Analysis started | 2024-03-14 18:48:17.134720 |
---|---|
Analysis finished | 2024-03-14 18:48:20.740912 |
Duration | 3.61 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 2238 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1119.5 |
Minimum | 1 |
---|---|
Maximum | 2238 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 19.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 112.85 |
Q1 | 560.25 |
median | 1119.5 |
Q3 | 1678.75 |
95-th percentile | 2126.15 |
Maximum | 2238 |
Range | 2237 |
Interquartile range (IQR) | 1118.5 |
Descriptive statistics
Standard deviation | 646.19927 |
---|---|
Coefficient of variation (CV) | 0.57722132 |
Kurtosis | -1.2 |
Mean | 1119.5 |
Median Absolute Deviation (MAD) | 559.5 |
Skewness | 0 |
Sum | 2505441 |
Variance | 417573.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
1496 | 1 | < 0.1% |
1490 | 1 | < 0.1% |
1491 | 1 | < 0.1% |
1492 | 1 | < 0.1% |
1493 | 1 | < 0.1% |
1494 | 1 | < 0.1% |
1495 | 1 | < 0.1% |
1497 | 1 | < 0.1% |
1505 | 1 | < 0.1% |
Other values (2228) | 2228 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
2238 | 1 | |
2237 | 1 | |
2236 | 1 | |
2235 | 1 | |
2234 | 1 | |
2233 | 1 | |
2232 | 1 | |
2231 | 1 | |
2230 | 1 | |
2229 | 1 |
사업소코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 289.06122 |
Minimum | 244 |
---|---|
Maximum | 312 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 19.8 KiB |
Quantile statistics
Minimum | 244 |
---|---|
5-th percentile | 244 |
Q1 | 244 |
median | 304 |
Q3 | 307 |
95-th percentile | 311 |
Maximum | 312 |
Range | 68 |
Interquartile range (IQR) | 63 |
Descriptive statistics
Standard deviation | 27.711963 |
---|---|
Coefficient of variation (CV) | 0.095868838 |
Kurtosis | -0.97162848 |
Mean | 289.06122 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.99235789 |
Sum | 646919 |
Variance | 767.95289 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
244 | 610 | |
304 | 272 | |
306 | 260 | |
307 | 235 | 10.5% |
309 | 179 | 8.0% |
301 | 147 | 6.6% |
308 | 136 | 6.1% |
303 | 117 | 5.2% |
302 | 111 | 5.0% |
312 | 86 | 3.8% |
Value | Count | Frequency (%) |
244 | 610 | |
301 | 147 | 6.6% |
302 | 111 | 5.0% |
303 | 117 | 5.2% |
304 | 272 | |
306 | 260 | |
307 | 235 | 10.5% |
308 | 136 | 6.1% |
309 | 179 | 8.0% |
311 | 85 | 3.8% |
Value | Count | Frequency (%) |
312 | 86 | 3.8% |
311 | 85 | 3.8% |
309 | 179 | |
308 | 136 | |
307 | 235 | |
306 | 260 | |
304 | 272 | |
303 | 117 | |
302 | 111 | |
301 | 147 |
사업소명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 17.6 KiB |
동래통합사업소 | |
---|---|
부산진 사업소 | |
남부사업소 | |
북부사업소 | |
사하사업소 | |
Other values (6) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 6.2345845 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산진 사업소 |
---|---|
2nd row | 남부사업소 |
3rd row | 남부사업소 |
4th row | 남부사업소 |
5th row | 강서사업소 |
Common Values
Value | Count | Frequency (%) |
동래통합사업소 | 610 | |
부산진 사업소 | 272 | |
남부사업소 | 260 | |
북부사업소 | 235 | 10.5% |
사하사업소 | 179 | 8.0% |
중동부사업소 | 147 | 6.6% |
해운대사업소 | 136 | 6.1% |
영도사업소 | 117 | 5.2% |
서부 사업소 | 111 | 5.0% |
기장사업소 | 86 | 3.8% |
Length
Value | Count | Frequency (%) |
동래통합사업소 | 610 | |
사업소 | 383 | |
부산진 | 272 | |
남부사업소 | 260 | |
북부사업소 | 235 | 9.0% |
사하사업소 | 179 | 6.8% |
중동부사업소 | 147 | 5.6% |
해운대사업소 | 136 | 5.2% |
영도사업소 | 117 | 4.5% |
서부 | 111 | 4.2% |
Other values (2) | 171 | 6.5% |
신청부서명
Categorical
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 17.6 KiB |
급수운영팀 | |
---|---|
요금1 | |
공무1 | |
요금 | |
공무 | |
Other values (5) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.3087578 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 요금1 |
---|---|
2nd row | 요금2 |
3rd row | 요금2 |
4th row | 요금2 |
5th row | 공무 |
Common Values
Value | Count | Frequency (%) |
급수운영팀 | 603 | |
요금1 | 449 | |
공무1 | 282 | |
요금 | 270 | |
공무 | 259 | |
요금2 | 257 | |
공무2 | 99 | 4.4% |
<NA> | 15 | 0.7% |
업무 | 3 | 0.1% |
행정지원팀 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
급수운영팀 | 603 | |
요금1 | 449 | |
공무1 | 282 | |
요금 | 270 | |
공무 | 259 | |
요금2 | 257 | |
공무2 | 99 | 4.4% |
na | 15 | 0.7% |
업무 | 3 | 0.1% |
행정지원팀 | 1 | < 0.1% |
건물형태
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 17.6 KiB |
단독주택 | |
---|---|
기타 | |
공동주택 | 127 |
<NA> | 15 |
근린생활시설(상가 등) | 8 |
Length
Max length | 12 |
---|---|
Median length | 4 |
Mean length | 3.6067918 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기타 |
---|---|
2nd row | 단독주택 |
3rd row | 단독주택 |
4th row | 공동주택 |
5th row | 단독주택 |
Common Values
Value | Count | Frequency (%) |
단독주택 | 1616 | |
기타 | 472 | 21.1% |
공동주택 | 127 | 5.7% |
<NA> | 15 | 0.7% |
근린생활시설(상가 등) | 8 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단독주택 | 1616 | |
기타 | 472 | 21.0% |
공동주택 | 127 | 5.7% |
na | 15 | 0.7% |
근린생활시설(상가 | 8 | 0.4% |
등 | 8 | 0.4% |
누수탐지소요액
Real number (ℝ)
Distinct | 53 |
---|---|
Distinct (%) | 2.4% |
Missing | 1 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 252241.39 |
Minimum | 0 |
---|---|
Maximum | 2100000 |
Zeros | 16 |
Zeros (%) | 0.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 19.8 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 100000 |
Q1 | 100000 |
median | 200000 |
Q3 | 300000 |
95-th percentile | 500000 |
Maximum | 2100000 |
Range | 2100000 |
Interquartile range (IQR) | 200000 |
Descriptive statistics
Standard deviation | 179018 |
---|---|
Coefficient of variation (CV) | 0.70970906 |
Kurtosis | 16.350013 |
Mean | 252241.39 |
Median Absolute Deviation (MAD) | 100000 |
Skewness | 2.9538575 |
Sum | 5.64264 × 108 |
Variance | 3.2047445 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100000 | 508 | |
300000 | 445 | |
200000 | 346 | |
150000 | 202 | 9.0% |
250000 | 174 | 7.8% |
400000 | 135 | 6.0% |
500000 | 86 | 3.8% |
350000 | 80 | 3.6% |
80000 | 44 | 2.0% |
600000 | 35 | 1.6% |
Other values (43) | 182 | 8.1% |
Value | Count | Frequency (%) |
0 | 16 | 0.7% |
40000 | 1 | < 0.1% |
50000 | 3 | 0.1% |
60000 | 2 | 0.1% |
70000 | 2 | 0.1% |
80000 | 44 | 2.0% |
90000 | 29 | 1.3% |
100000 | 508 | |
110000 | 1 | < 0.1% |
120000 | 3 | 0.1% |
Value | Count | Frequency (%) |
2100000 | 1 | < 0.1% |
1700000 | 1 | < 0.1% |
1680000 | 1 | < 0.1% |
1540000 | 1 | < 0.1% |
1500000 | 2 | 0.1% |
1320000 | 3 | 0.1% |
1300000 | 3 | 0.1% |
1200000 | 1 | < 0.1% |
1100000 | 1 | < 0.1% |
1000000 | 9 |
누수탐지지급액
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 17.6 KiB |
40000 | |
---|---|
0 | 16 |
25000 | 3 |
20000 | 1 |
<NA> | 1 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9709562 |
Min length | 1 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 40000 |
---|---|
2nd row | 40000 |
3rd row | 40000 |
4th row | 40000 |
5th row | 40000 |
Common Values
Value | Count | Frequency (%) |
40000 | 2216 | |
0 | 16 | 0.7% |
25000 | 3 | 0.1% |
20000 | 1 | < 0.1% |
<NA> | 1 | < 0.1% |
30000 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
40000 | 2216 | |
0 | 16 | 0.7% |
25000 | 3 | 0.1% |
20000 | 1 | < 0.1% |
na | 1 | < 0.1% |
30000 | 1 | < 0.1% |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.146 | 0.220 | 0.165 | 0.126 | 0.078 | 0.182 |
사업소코드 | 0.146 | 1.000 | 1.000 | 0.573 | 0.489 | 0.000 | 0.000 |
사업소명 | 0.220 | 1.000 | 1.000 | 0.919 | 0.807 | 0.175 | 0.000 |
신청부서명 | 0.165 | 0.573 | 0.919 | 1.000 | 0.637 | 0.133 | 0.034 |
건물형태 | 0.126 | 0.489 | 0.807 | 0.637 | 1.000 | 0.084 | 0.000 |
누수탐지소요액 | 0.078 | 0.000 | 0.175 | 0.133 | 0.084 | 1.000 | 0.000 |
누수탐지지급액 | 0.182 | 0.000 | 0.000 | 0.034 | 0.000 | 0.000 | 1.000 |
건물형태 | 신청부서명 | 사업소명 | 누수탐지지급액 | |
---|---|---|---|---|
건물형태 | 1.000 | 0.466 | 0.641 | 0.000 |
신청부서명 | 0.466 | 1.000 | 0.754 | 0.019 |
사업소명 | 0.641 | 0.754 | 1.000 | 0.000 |
누수탐지지급액 | 0.000 | 0.019 | 0.000 | 1.000 |
연번 | 사업소코드 | 누수탐지소요액 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.024 | -0.019 | 0.095 | 0.075 | 0.076 | 0.076 |
사업소코드 | 0.024 | 1.000 | 0.013 | 0.998 | 0.830 | 0.325 | 0.000 |
누수탐지소요액 | -0.019 | 0.013 | 1.000 | 0.075 | 0.060 | 0.050 | 0.000 |
사업소명 | 0.095 | 0.998 | 0.075 | 1.000 | 0.754 | 0.641 | 0.000 |
신청부서명 | 0.075 | 0.830 | 0.060 | 0.754 | 1.000 | 0.466 | 0.019 |
건물형태 | 0.076 | 0.325 | 0.050 | 0.641 | 0.466 | 1.000 | 0.000 |
누수탐지지급액 | 0.076 | 0.000 | 0.000 | 0.000 | 0.019 | 0.000 | 1.000 |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
0 | 1 | 304 | 부산진 사업소 | 요금1 | 기타 | 500000 | 40000 |
1 | 2 | 306 | 남부사업소 | 요금2 | 단독주택 | 150000 | 40000 |
2 | 3 | 306 | 남부사업소 | 요금2 | 단독주택 | 200000 | 40000 |
3 | 4 | 306 | 남부사업소 | 요금2 | 공동주택 | 200000 | 40000 |
4 | 5 | 311 | 강서사업소 | 공무 | 단독주택 | 250000 | 40000 |
5 | 6 | 311 | 강서사업소 | 공무 | 단독주택 | 600000 | 40000 |
6 | 7 | 311 | 강서사업소 | 공무 | 단독주택 | 300000 | 40000 |
7 | 8 | 311 | 강서사업소 | 공무 | 단독주택 | 200000 | 40000 |
8 | 9 | 309 | 사하사업소 | 요금1 | 단독주택 | 100000 | 40000 |
9 | 10 | 309 | 사하사업소 | 요금1 | 단독주택 | 80000 | 40000 |
연번 | 사업소코드 | 사업소명 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|
2228 | 2229 | 307 | 북부사업소 | 공무1 | 단독주택 | 200000 | 40000 |
2229 | 2230 | 307 | 북부사업소 | 공무1 | 단독주택 | 300000 | 40000 |
2230 | 2231 | 307 | 북부사업소 | 공무1 | 단독주택 | 200000 | 40000 |
2231 | 2232 | 307 | 북부사업소 | 공무1 | 단독주택 | 150000 | 40000 |
2232 | 2233 | 311 | 강서사업소 | 요금 | 단독주택 | 150000 | 40000 |
2233 | 2234 | 311 | 강서사업소 | 요금 | 단독주택 | 250000 | 40000 |
2234 | 2235 | 311 | 강서사업소 | 요금 | 단독주택 | 300000 | 40000 |
2235 | 2236 | 307 | 북부사업소 | 공무1 | 단독주택 | 350000 | 40000 |
2236 | 2237 | 301 | 중동부사업소 | 공무2 | 단독주택 | 80000 | 40000 |
2237 | 2238 | 309 | 사하사업소 | 요금1 | 단독주택 | 120000 | 40000 |