Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 1087 |
Missing cells | 12 |
Missing cells (%) | 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 74.4 KiB |
Average record size in memory | 70.1 B |
Variable types
Numeric | 5 |
---|---|
Categorical | 3 |
Dataset
Description | 부산광역시상수도사업본부_수용가정보시스템_민원신청정보_누수탐지비_20210601 |
---|---|
Author | 부산광역시 상수도사업본부 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15083449 |
사업소코드 is highly overall correlated with 신청부서 and 2 other fields | High correlation |
신청부서 is highly overall correlated with 사업소코드 and 2 other fields | High correlation |
사업소명 is highly overall correlated with 사업소코드 and 3 other fields | High correlation |
신청부서명 is highly overall correlated with 사업소코드 and 2 other fields | High correlation |
건물형태 is highly overall correlated with 사업소명 | High correlation |
건물형태 is highly imbalanced (57.9%) | Imbalance |
신청부서 has 12 (1.1%) missing values | Missing |
누수탐지지급액 is highly skewed (γ1 = 26.52450838) | Skewed |
연번 has unique values | Unique |
누수탐지소요액 has 15 (1.4%) zeros | Zeros |
누수탐지지급액 has 15 (1.4%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 16:56:48.392013 |
---|---|
Analysis finished | 2023-12-10 16:56:53.853332 |
Duration | 5.46 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 1087 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 544 |
Minimum | 1 |
---|---|
Maximum | 1087 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 55.3 |
Q1 | 272.5 |
median | 544 |
Q3 | 815.5 |
95-th percentile | 1032.7 |
Maximum | 1087 |
Range | 1086 |
Interquartile range (IQR) | 543 |
Descriptive statistics
Standard deviation | 313.93418 |
---|---|
Coefficient of variation (CV) | 0.57708488 |
Kurtosis | -1.2 |
Mean | 544 |
Median Absolute Deviation (MAD) | 272 |
Skewness | 0 |
Sum | 591328 |
Variance | 98554.667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
724 | 1 | 0.1% |
730 | 1 | 0.1% |
729 | 1 | 0.1% |
728 | 1 | 0.1% |
727 | 1 | 0.1% |
726 | 1 | 0.1% |
725 | 1 | 0.1% |
723 | 1 | 0.1% |
2 | 1 | 0.1% |
Other values (1077) | 1077 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
1087 | 1 | |
1086 | 1 | |
1085 | 1 | |
1084 | 1 | |
1083 | 1 | |
1082 | 1 | |
1081 | 1 | |
1080 | 1 | |
1079 | 1 | |
1078 | 1 |
사업소코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 289.18767 |
Minimum | 244 |
---|---|
Maximum | 312 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.7 KiB |
Quantile statistics
Minimum | 244 |
---|---|
5-th percentile | 244 |
Q1 | 244 |
median | 304 |
Q3 | 307 |
95-th percentile | 311 |
Maximum | 312 |
Range | 68 |
Interquartile range (IQR) | 63 |
Descriptive statistics
Standard deviation | 27.270585 |
---|---|
Coefficient of variation (CV) | 0.094300649 |
Kurtosis | -0.88245399 |
Mean | 289.18767 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -1.0344637 |
Sum | 314347 |
Variance | 743.68482 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
244 | 288 | |
306 | 156 | |
304 | 114 | 10.5% |
301 | 85 | 7.8% |
303 | 83 | 7.6% |
302 | 82 | 7.5% |
308 | 78 | 7.2% |
309 | 68 | 6.3% |
307 | 64 | 5.9% |
312 | 42 | 3.9% |
Value | Count | Frequency (%) |
244 | 288 | |
301 | 85 | 7.8% |
302 | 82 | 7.5% |
303 | 83 | 7.6% |
304 | 114 | 10.5% |
306 | 156 | |
307 | 64 | 5.9% |
308 | 78 | 7.2% |
309 | 68 | 6.3% |
311 | 27 | 2.5% |
Value | Count | Frequency (%) |
312 | 42 | 3.9% |
311 | 27 | 2.5% |
309 | 68 | |
308 | 78 | |
307 | 64 | |
306 | 156 | |
304 | 114 | |
303 | 83 | |
302 | 82 | |
301 | 85 |
사업소명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.6 KiB |
북부통합사업소 | |
---|---|
남부 사업소 | |
부산진 사업소 | |
중동부 사업소 | |
영도 사업소 | |
Other values (6) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 8.2152714 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남부 사업소 |
---|---|
2nd row | 남부 사업소 |
3rd row | 남부 사업소 |
4th row | 남부 사업소 |
5th row | 남부 사업소 |
Common Values
Value | Count | Frequency (%) |
북부통합사업소 | 288 | |
남부 사업소 | 156 | |
부산진 사업소 | 114 | 10.5% |
중동부 사업소 | 85 | 7.8% |
영도 사업소 | 83 | 7.6% |
서부 사업소 | 82 | 7.5% |
해운대 사업소 | 78 | 7.2% |
사하 사업소 | 68 | 6.3% |
북부 사업소 | 64 | 5.9% |
기장 사업소 | 42 | 3.9% |
Length
Value | Count | Frequency (%) |
사업소 | 799 | |
북부통합사업소 | 288 | 15.3% |
남부 | 156 | 8.3% |
부산진 | 114 | 6.0% |
중동부 | 85 | 4.5% |
영도 | 83 | 4.4% |
서부 | 82 | 4.3% |
해운대 | 78 | 4.1% |
사하 | 68 | 3.6% |
북부 | 64 | 3.4% |
Other values (2) | 69 | 3.7% |
신청부서
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 22 |
---|---|
Distinct (%) | 2.0% |
Missing | 12 |
Missing (%) | 1.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2889942.6 |
Minimum | 2440020 |
---|---|
Maximum | 3120010 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.7 KiB |
Quantile statistics
Minimum | 2440020 |
---|---|
5-th percentile | 2440030 |
Q1 | 2440030 |
median | 3040020 |
Q3 | 3070010 |
95-th percentile | 3110020 |
Maximum | 3120010 |
Range | 679990 |
Interquartile range (IQR) | 629980 |
Descriptive statistics
Standard deviation | 273561.29 |
---|---|
Coefficient of variation (CV) | 0.094659768 |
Kurtosis | -0.91748038 |
Mean | 2889942.6 |
Median Absolute Deviation (MAD) | 30000 |
Skewness | -1.0180205 |
Sum | 3.1066883 × 109 |
Variance | 7.4835781 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2440030 | 287 | |
3060030 | 89 | 8.2% |
3010040 | 83 | 7.6% |
3030020 | 82 | 7.5% |
3020020 | 80 | 7.4% |
3080030 | 75 | 6.9% |
3090020 | 68 | 6.3% |
3060020 | 64 | 5.9% |
3040030 | 59 | 5.4% |
3040020 | 52 | 4.8% |
Other values (12) | 136 |
Value | Count | Frequency (%) |
2440020 | 1 | 0.1% |
2440030 | 287 | |
3010040 | 83 | 7.6% |
3010050 | 1 | 0.1% |
3020010 | 1 | 0.1% |
3020020 | 80 | 7.4% |
3020030 | 1 | 0.1% |
3030020 | 82 | 7.5% |
3040020 | 52 | 4.8% |
3040030 | 59 | 5.4% |
Value | Count | Frequency (%) |
3120010 | 40 | |
3110020 | 25 | 2.3% |
3110010 | 1 | 0.1% |
3090020 | 68 | |
3080030 | 75 | |
3070040 | 15 | 1.4% |
3070030 | 20 | 1.8% |
3070020 | 13 | 1.2% |
3070010 | 16 | 1.5% |
3060040 | 2 | 0.2% |
신청부서명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.6 KiB |
급수운영팀 | |
---|---|
요금1 | |
요금 | |
요금2 | |
공무1 | |
Other values (6) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.2437902 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 요금2 |
---|---|
2nd row | 요금2 |
3rd row | 요금2 |
4th row | 요금2 |
5th row | 요금2 |
Common Values
Value | Count | Frequency (%) |
급수운영팀 | 287 | |
요금1 | 197 | |
요금 | 187 | |
요금2 | 168 | |
공무1 | 100 | 9.2% |
공무 | 76 | 7.0% |
업무 | 57 | 5.2% |
<NA> | 12 | 1.1% |
요금팀 | 1 | 0.1% |
공무2 | 1 | 0.1% |
Length
Value | Count | Frequency (%) |
급수운영팀 | 287 | |
요금1 | 197 | |
요금 | 187 | |
요금2 | 168 | |
공무1 | 100 | 9.2% |
공무 | 76 | 7.0% |
업무 | 57 | 5.2% |
na | 12 | 1.1% |
요금팀 | 1 | 0.1% |
공무2 | 1 | 0.1% |
건물형태
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.6 KiB |
1 | |
---|---|
4 | |
2 | 82 |
<NA> | 13 |
3 | 2 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.0358786 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 872 | |
4 | 118 | 10.9% |
2 | 82 | 7.5% |
<NA> | 13 | 1.2% |
3 | 2 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 872 | |
4 | 118 | 10.9% |
2 | 82 | 7.5% |
na | 13 | 1.2% |
3 | 2 | 0.2% |
누수탐지소요액
Real number (ℝ)
ZEROS
 
Distinct | 45 |
---|---|
Distinct (%) | 4.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 251226.31 |
Minimum | 0 |
---|---|
Maximum | 2000000 |
Zeros | 15 |
Zeros (%) | 1.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 80000 |
Q1 | 100000 |
median | 200000 |
Q3 | 300000 |
95-th percentile | 600000 |
Maximum | 2000000 |
Range | 2000000 |
Interquartile range (IQR) | 200000 |
Descriptive statistics
Standard deviation | 197240.67 |
---|---|
Coefficient of variation (CV) | 0.7851115 |
Kurtosis | 17.549875 |
Mean | 251226.31 |
Median Absolute Deviation (MAD) | 100000 |
Skewness | 3.1959382 |
Sum | 2.73083 × 108 |
Variance | 3.8903881 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100000 | 204 | |
150000 | 173 | |
300000 | 159 | |
200000 | 147 | |
250000 | 83 | |
400000 | 61 | 5.6% |
500000 | 45 | 4.1% |
80000 | 43 | 4.0% |
350000 | 41 | 3.8% |
600000 | 23 | 2.1% |
Other values (35) | 108 |
Value | Count | Frequency (%) |
0 | 15 | 1.4% |
40000 | 1 | 0.1% |
50000 | 3 | 0.3% |
70000 | 1 | 0.1% |
80000 | 43 | 4.0% |
90000 | 12 | 1.1% |
95000 | 1 | 0.1% |
100000 | 204 | |
110000 | 1 | 0.1% |
120000 | 3 | 0.3% |
Value | Count | Frequency (%) |
2000000 | 1 | 0.1% |
1800000 | 1 | 0.1% |
1700000 | 1 | 0.1% |
1500000 | 3 | |
1300000 | 1 | 0.1% |
1200000 | 2 | 0.2% |
1000000 | 5 | |
900000 | 2 | 0.2% |
800000 | 6 | |
750000 | 2 | 0.2% |
누수탐지지급액
Real number (ℝ)
SKEWED
  ZEROS
 
Distinct | 6 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 39774.609 |
Minimum | 0 |
---|---|
Maximum | 450000 |
Zeros | 15 |
Zeros (%) | 1.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 40000 |
Q1 | 40000 |
median | 40000 |
Q3 | 40000 |
95-th percentile | 40000 |
Maximum | 450000 |
Range | 450000 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 13328.26 |
---|---|
Coefficient of variation (CV) | 0.33509469 |
Kurtosis | 829.03327 |
Mean | 39774.609 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 26.524508 |
Sum | 43235000 |
Variance | 1.7764252 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
40000 | 1067 | |
0 | 15 | 1.4% |
25000 | 2 | 0.2% |
20000 | 1 | 0.1% |
450000 | 1 | 0.1% |
35000 | 1 | 0.1% |
Value | Count | Frequency (%) |
0 | 15 | 1.4% |
20000 | 1 | 0.1% |
25000 | 2 | 0.2% |
35000 | 1 | 0.1% |
40000 | 1067 | |
450000 | 1 | 0.1% |
Value | Count | Frequency (%) |
450000 | 1 | 0.1% |
40000 | 1067 | |
35000 | 1 | 0.1% |
25000 | 2 | 0.2% |
20000 | 1 | 0.1% |
0 | 15 | 1.4% |
연번 | 사업소코드 | 사업소명 | 신청부서 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.138 | 0.386 | 0.250 | 0.388 | 0.100 | 0.073 | 0.000 |
사업소코드 | 0.138 | 1.000 | 1.000 | 1.000 | 0.820 | 0.651 | 0.188 | 0.000 |
사업소명 | 0.386 | 1.000 | 1.000 | 1.000 | 0.922 | 0.834 | 0.282 | 0.078 |
신청부서 | 0.250 | 1.000 | 1.000 | 1.000 | 0.982 | 0.372 | 0.235 | 0.000 |
신청부서명 | 0.388 | 0.820 | 0.922 | 0.982 | 1.000 | 0.663 | 0.342 | 0.035 |
건물형태 | 0.100 | 0.651 | 0.834 | 0.372 | 0.663 | 1.000 | 0.040 | 0.000 |
누수탐지소요액 | 0.073 | 0.188 | 0.282 | 0.235 | 0.342 | 0.040 | 1.000 | 0.063 |
누수탐지지급액 | 0.000 | 0.000 | 0.078 | 0.000 | 0.035 | 0.000 | 0.063 | 1.000 |
신청부서명 | 사업소명 | 건물형태 | |
---|---|---|---|
신청부서명 | 1.000 | 0.726 | 0.462 |
사업소명 | 0.726 | 1.000 | 0.681 |
건물형태 | 0.462 | 0.681 | 1.000 |
연번 | 사업소코드 | 신청부서 | 누수탐지소요액 | 누수탐지지급액 | 사업소명 | 신청부서명 | 건물형태 | |
---|---|---|---|---|---|---|---|---|
연번 | 1.000 | -0.030 | -0.042 | -0.069 | -0.103 | 0.175 | 0.128 | 0.060 |
사업소코드 | -0.030 | 1.000 | 0.998 | 0.013 | -0.062 | 0.996 | 0.837 | 0.362 |
신청부서 | -0.042 | 0.998 | 1.000 | 0.026 | -0.007 | 0.996 | 0.837 | 0.362 |
누수탐지소요액 | -0.069 | 0.013 | 0.026 | 1.000 | 0.232 | 0.124 | 0.111 | 0.023 |
누수탐지지급액 | -0.103 | -0.062 | -0.007 | 0.232 | 1.000 | 0.074 | 0.026 | 0.000 |
사업소명 | 0.175 | 0.996 | 0.996 | 0.124 | 0.074 | 1.000 | 0.726 | 0.681 |
신청부서명 | 0.128 | 0.837 | 0.837 | 0.111 | 0.026 | 0.726 | 1.000 | 0.462 |
건물형태 | 0.060 | 0.362 | 0.362 | 0.023 | 0.000 | 0.681 | 0.462 | 1.000 |
연번 | 사업소코드 | 사업소명 | 신청부서 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|---|
0 | 1 | 306 | 남부 사업소 | 3060030 | 요금2 | 1 | 150000 | 40000 |
1 | 2 | 306 | 남부 사업소 | 3060030 | 요금2 | 1 | 100000 | 40000 |
2 | 3 | 306 | 남부 사업소 | 3060030 | 요금2 | 1 | 600000 | 40000 |
3 | 4 | 306 | 남부 사업소 | 3060030 | 요금2 | 1 | 500000 | 40000 |
4 | 5 | 306 | 남부 사업소 | 3060030 | 요금2 | 1 | 1200000 | 40000 |
5 | 6 | 306 | 남부 사업소 | 3060030 | 요금2 | 1 | 350000 | 40000 |
6 | 7 | 306 | 남부 사업소 | 3060030 | 요금2 | 1 | 300000 | 40000 |
7 | 8 | 308 | 해운대 사업소 | 3080030 | 공무 | 1 | 300000 | 40000 |
8 | 9 | 304 | 부산진 사업소 | 3040030 | 요금2 | 4 | 800000 | 40000 |
9 | 10 | 304 | 부산진 사업소 | 3040020 | 요금1 | 4 | 200000 | 40000 |
연번 | 사업소코드 | 사업소명 | 신청부서 | 신청부서명 | 건물형태 | 누수탐지소요액 | 누수탐지지급액 | |
---|---|---|---|---|---|---|---|---|
1077 | 1078 | 312 | 기장 사업소 | 3120010 | 업무 | 2 | 100000 | 40000 |
1078 | 1079 | 312 | 기장 사업소 | 3120010 | 업무 | 1 | 1000000 | 40000 |
1079 | 1080 | 302 | 서부 사업소 | 3020020 | 요금 | 1 | 80000 | 40000 |
1080 | 1081 | 302 | 서부 사업소 | 3020020 | 요금 | 1 | 150000 | 40000 |
1081 | 1082 | 302 | 서부 사업소 | 3020020 | 요금 | 1 | 150000 | 40000 |
1082 | 1083 | 301 | 중동부 사업소 | 3010040 | 공무1 | 1 | 300000 | 40000 |
1083 | 1084 | 301 | 중동부 사업소 | 3010040 | 공무1 | 1 | 100000 | 40000 |
1084 | 1085 | 304 | 부산진 사업소 | 3040020 | 요금1 | 4 | 100000 | 40000 |
1085 | 1086 | 302 | 서부 사업소 | 3020020 | 요금 | 1 | 150000 | 40000 |
1086 | 1087 | 312 | 기장 사업소 | <NA> | <NA> | <NA> | 0 | 0 |