Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 643 |
Missing cells | 1 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 31.5 KiB |
Average record size in memory | 50.2 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 2 |
Text | 2 |
Dataset
Description | 경상남도 하수처리시설 현황으로, 일 사용량, 시군명, 하수처리장명, 시설용량, 소재지에 관한 데이터를 제공합니다. |
---|---|
Author | 경상남도 |
URL | https://bigdata.gyeongnam.go.kr/index.gn?menuCd=DOM_000000114002001000&publicdatapk=3076631 |
연번 is highly overall correlated with 일 사용량 구분 and 1 other fields | High correlation |
시설용량 is highly overall correlated with 일 사용량 구분 | High correlation |
일 사용량 구분 is highly overall correlated with 연번 and 1 other fields | High correlation |
시군 is highly overall correlated with 연번 | High correlation |
일 사용량 구분 is highly imbalanced (65.9%) | Imbalance |
연번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 23:42:09.993001 |
---|---|
Analysis finished | 2023-12-10 23:42:11.139615 |
Duration | 1.15 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 643 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 322 |
Minimum | 1 |
---|---|
Maximum | 643 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 33.1 |
Q1 | 161.5 |
median | 322 |
Q3 | 482.5 |
95-th percentile | 610.9 |
Maximum | 643 |
Range | 642 |
Interquartile range (IQR) | 321 |
Descriptive statistics
Standard deviation | 185.76239 |
---|---|
Coefficient of variation (CV) | 0.57690184 |
Kurtosis | -1.2 |
Mean | 322 |
Median Absolute Deviation (MAD) | 161 |
Skewness | 0 |
Sum | 207046 |
Variance | 34507.667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.2% |
404 | 1 | 0.2% |
426 | 1 | 0.2% |
427 | 1 | 0.2% |
428 | 1 | 0.2% |
429 | 1 | 0.2% |
430 | 1 | 0.2% |
431 | 1 | 0.2% |
432 | 1 | 0.2% |
433 | 1 | 0.2% |
Other values (633) | 633 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
643 | 1 | |
642 | 1 | |
641 | 1 | |
640 | 1 | |
639 | 1 | |
638 | 1 | |
637 | 1 | |
636 | 1 | |
635 | 1 | |
634 | 1 |
일 사용량 구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.2 KiB |
500㎥/일 미만 | |
---|---|
500㎥/일 이상 | |
500㎥/일 이상 | 2 |
Length
Max length | 10 |
---|---|
Median length | 9 |
Mean length | 9.0031104 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 500㎥/일 이상 |
---|---|
2nd row | 500㎥/일 이상 |
3rd row | 500㎥/일 이상 |
4th row | 500㎥/일 이상 |
5th row | 500㎥/일 이상 |
Common Values
Value | Count | Frequency (%) |
500㎥/일 미만 | 568 | |
500㎥/일 이상 | 73 | 11.4% |
500㎥/일 이상 | 2 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
500㎥/일 | 643 | |
미만 | 568 | |
이상 | 75 | 5.8% |
시군
Categorical
HIGH CORRELATION
 
Distinct | 18 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.2 KiB |
하동군 | |
---|---|
남해군 | |
함양군 | |
산청군 | |
진주시 | |
Other values (13) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 창원시 |
---|---|
2nd row | 창원시 |
3rd row | 창원시 |
4th row | 창원시 |
5th row | 창원시 |
Common Values
Value | Count | Frequency (%) |
하동군 | 67 | 10.4% |
남해군 | 65 | 10.1% |
함양군 | 54 | 8.4% |
산청군 | 51 | 7.9% |
진주시 | 43 | 6.7% |
창녕군 | 42 | 6.5% |
거제시 | 40 | 6.2% |
밀양시 | 37 | 5.8% |
사천시 | 32 | 5.0% |
고성군 | 31 | 4.8% |
Other values (8) | 181 |
Length
Value | Count | Frequency (%) |
하동군 | 67 | 10.4% |
남해군 | 65 | 10.1% |
함양군 | 54 | 8.4% |
산청군 | 51 | 7.9% |
진주시 | 43 | 6.7% |
창녕군 | 42 | 6.5% |
거제시 | 40 | 6.2% |
밀양시 | 37 | 5.8% |
사천시 | 32 | 5.0% |
고성군 | 31 | 4.8% |
Other values (8) | 181 |
처리장명
Text
Distinct | 597 |
---|---|
Distinct (%) | 92.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.2 KiB |
Value | Count | Frequency (%) |
평촌 | 4 | 0.6% |
신촌 | 4 | 0.6% |
신기 | 3 | 0.5% |
갈전 | 3 | 0.5% |
입석 | 3 | 0.5% |
대산 | 3 | 0.5% |
소규모 | 3 | 0.5% |
동촌 | 2 | 0.3% |
당산 | 2 | 0.3% |
신안 | 2 | 0.3% |
Other values (589) | 620 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 48 | 3.3% |
대 | 43 | 2.9% |
동 | 37 | 2.5% |
촌 | 36 | 2.5% |
신 | 34 | 2.3% |
곡 | 34 | 2.3% |
천 | 32 | 2.2% |
평 | 26 | 1.8% |
정 | 26 | 1.8% |
리 | 26 | 1.8% |
Other values (240) | 1126 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1434 | |
Decimal Number | 12 | 0.8% |
Close Punctuation | 7 | 0.5% |
Open Punctuation | 7 | 0.5% |
Space Separator | 6 | 0.4% |
Other Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 48 | 3.3% |
대 | 43 | 3.0% |
동 | 37 | 2.6% |
촌 | 36 | 2.5% |
신 | 34 | 2.4% |
곡 | 34 | 2.4% |
천 | 32 | 2.2% |
평 | 26 | 1.8% |
정 | 26 | 1.8% |
리 | 26 | 1.8% |
Other values (231) | 1092 |
Decimal Number
Value | Count | Frequency (%) |
2 | 5 | |
1 | 4 | |
3 | 1 | 8.3% |
5 | 1 | 8.3% |
4 | 1 | 8.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 7 |
Open Punctuation
Value | Count | Frequency (%) |
( | 7 |
Space Separator
Value | Count | Frequency (%) |
6 |
Other Punctuation
Value | Count | Frequency (%) |
· | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1434 | |
Common | 34 | 2.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 48 | 3.3% |
대 | 43 | 3.0% |
동 | 37 | 2.6% |
촌 | 36 | 2.5% |
신 | 34 | 2.4% |
곡 | 34 | 2.4% |
천 | 32 | 2.2% |
평 | 26 | 1.8% |
정 | 26 | 1.8% |
리 | 26 | 1.8% |
Other values (231) | 1092 |
Common
Value | Count | Frequency (%) |
) | 7 | |
( | 7 | |
6 | ||
2 | 5 | |
1 | 4 | |
· | 2 | 5.9% |
3 | 1 | 2.9% |
5 | 1 | 2.9% |
4 | 1 | 2.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1434 | |
ASCII | 32 | 2.2% |
None | 2 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 48 | 3.3% |
대 | 43 | 3.0% |
동 | 37 | 2.6% |
촌 | 36 | 2.5% |
신 | 34 | 2.4% |
곡 | 34 | 2.4% |
천 | 32 | 2.2% |
평 | 26 | 1.8% |
정 | 26 | 1.8% |
리 | 26 | 1.8% |
Other values (231) | 1092 |
ASCII
Value | Count | Frequency (%) |
) | 7 | |
( | 7 | |
6 | ||
2 | 5 | |
1 | 4 | |
3 | 1 | 3.1% |
5 | 1 | 3.1% |
4 | 1 | 3.1% |
None
Value | Count | Frequency (%) |
· | 2 |
시설용량
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 126 |
---|---|
Distinct (%) | 19.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2567.6719 |
Minimum | 10 |
---|---|
Maximum | 500000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.8 KiB |
Quantile statistics
Minimum | 10 |
---|---|
5-th percentile | 30 |
Q1 | 46 |
median | 68 |
Q3 | 145 |
95-th percentile | 3980 |
Maximum | 500000 |
Range | 499990 |
Interquartile range (IQR) | 99 |
Descriptive statistics
Standard deviation | 23274.061 |
---|---|
Coefficient of variation (CV) | 9.0642662 |
Kurtosis | 336.69328 |
Mean | 2567.6719 |
Median Absolute Deviation (MAD) | 28 |
Skewness | 16.957488 |
Sum | 1651013 |
Variance | 5.4168192 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
50 | 72 | 11.2% |
60 | 50 | 7.8% |
30 | 46 | 7.2% |
40 | 42 | 6.5% |
45 | 34 | 5.3% |
70 | 30 | 4.7% |
100 | 29 | 4.5% |
80 | 24 | 3.7% |
120 | 15 | 2.3% |
110 | 14 | 2.2% |
Other values (116) | 287 |
Value | Count | Frequency (%) |
10 | 2 | 0.3% |
12 | 1 | 0.2% |
15 | 2 | 0.3% |
16 | 1 | 0.2% |
20 | 10 | 1.6% |
25 | 7 | 1.1% |
28 | 1 | 0.2% |
30 | 46 | |
32 | 1 | 0.2% |
35 | 10 | 1.6% |
Value | Count | Frequency (%) |
500000 | 1 | |
190000 | 1 | |
146000 | 1 | |
145000 | 1 | |
97000 | 1 | |
60000 | 1 | |
54000 | 1 | |
43000 | 1 | |
30000 | 2 | |
26000 | 1 |
소재지
Text
Distinct | 639 |
---|---|
Distinct (%) | 99.5% |
Missing | 1 |
Missing (%) | 0.2% |
Memory size | 5.2 KiB |
Length
Max length | 43 |
---|---|
Median length | 32.5 |
Mean length | 18.238318 |
Min length | 1 |
Characters and Unicode
Total characters | 11709 |
---|---|
Distinct characters | 240 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 636 ? |
---|---|
Unique (%) | 99.1% |
Sample
1st row | 경상남도 창원시 마산합포구 가포로 739 |
---|---|
2nd row | 진해구 천자로 101(덕산동) |
3rd row | 의창구 신촌본포로 333번길 42(월계리) |
4th row | 경상남도 창원시 진해구 남양동 403 |
5th row | 의창구 유등로332번길 86-20(유등리) |
Value | Count | Frequency (%) |
경상남도 | 155 | 6.1% |
경남 | 141 | 5.5% |
남해군 | 65 | 2.5% |
산청군 | 50 | 2.0% |
함양군 | 32 | 1.3% |
통영시 | 27 | 1.1% |
거창군 | 23 | 0.9% |
합천군 | 22 | 0.9% |
창녕군 | 21 | 0.8% |
하동군 | 17 | 0.7% |
Other values (1339) | 2001 |
Most occurring characters
Value | Count | Frequency (%) |
2520 | ||
리 | 606 | 5.2% |
1 | 594 | 5.1% |
면 | 565 | 4.8% |
- | 441 | 3.8% |
남 | 438 | 3.7% |
2 | 336 | 2.9% |
경 | 299 | 2.6% |
3 | 271 | 2.3% |
군 | 259 | 2.2% |
Other values (230) | 5380 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6101 | |
Decimal Number | 2590 | |
Space Separator | 2520 | |
Dash Punctuation | 441 | 3.8% |
Open Punctuation | 22 | 0.2% |
Close Punctuation | 22 | 0.2% |
Other Punctuation | 13 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 606 | 9.9% |
면 | 565 | 9.3% |
남 | 438 | 7.2% |
경 | 299 | 4.9% |
군 | 259 | 4.2% |
상 | 205 | 3.4% |
산 | 197 | 3.2% |
도 | 183 | 3.0% |
동 | 130 | 2.1% |
시 | 122 | 2.0% |
Other values (214) | 3097 |
Decimal Number
Value | Count | Frequency (%) |
1 | 594 | |
2 | 336 | |
3 | 271 | |
4 | 238 | |
6 | 224 | 8.6% |
5 | 214 | 8.3% |
8 | 194 | 7.5% |
9 | 179 | 6.9% |
7 | 174 | 6.7% |
0 | 166 | 6.4% |
Other Punctuation
Value | Count | Frequency (%) |
, | 12 | |
. | 1 | 7.7% |
Space Separator
Value | Count | Frequency (%) |
2520 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 441 |
Open Punctuation
Value | Count | Frequency (%) |
( | 22 |
Close Punctuation
Value | Count | Frequency (%) |
) | 22 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6101 | |
Common | 5608 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 606 | 9.9% |
면 | 565 | 9.3% |
남 | 438 | 7.2% |
경 | 299 | 4.9% |
군 | 259 | 4.2% |
상 | 205 | 3.4% |
산 | 197 | 3.2% |
도 | 183 | 3.0% |
동 | 130 | 2.1% |
시 | 122 | 2.0% |
Other values (214) | 3097 |
Common
Value | Count | Frequency (%) |
2520 | ||
1 | 594 | 10.6% |
- | 441 | 7.9% |
2 | 336 | 6.0% |
3 | 271 | 4.8% |
4 | 238 | 4.2% |
6 | 224 | 4.0% |
5 | 214 | 3.8% |
8 | 194 | 3.5% |
9 | 179 | 3.2% |
Other values (6) | 397 | 7.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6101 | |
ASCII | 5608 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2520 | ||
1 | 594 | 10.6% |
- | 441 | 7.9% |
2 | 336 | 6.0% |
3 | 271 | 4.8% |
4 | 238 | 4.2% |
6 | 224 | 4.0% |
5 | 214 | 3.8% |
8 | 194 | 3.5% |
9 | 179 | 3.2% |
Other values (6) | 397 | 7.1% |
Hangul
Value | Count | Frequency (%) |
리 | 606 | 9.9% |
면 | 565 | 9.3% |
남 | 438 | 7.2% |
경 | 299 | 4.9% |
군 | 259 | 4.2% |
상 | 205 | 3.4% |
산 | 197 | 3.2% |
도 | 183 | 3.0% |
동 | 130 | 2.1% |
시 | 122 | 2.0% |
Other values (214) | 3097 |
연번 | 일 사용량 구분 | 시군 | 시설용량 | |
---|---|---|---|---|
연번 | 1.000 | 0.775 | 0.945 | 0.243 |
일 사용량 구분 | 0.775 | 1.000 | 0.519 | 0.634 |
시군 | 0.945 | 0.519 | 1.000 | 0.288 |
시설용량 | 0.243 | 0.634 | 0.288 | 1.000 |
시군 | 일 사용량 구분 | |
---|---|---|
시군 | 1.000 | 0.276 |
일 사용량 구분 | 0.276 | 1.000 |
연번 | 시설용량 | 일 사용량 구분 | 시군 | |
---|---|---|---|---|
연번 | 1.000 | -0.360 | 0.651 | 0.753 |
시설용량 | -0.360 | 1.000 | 0.595 | 0.149 |
일 사용량 구분 | 0.651 | 0.595 | 1.000 | 0.276 |
시군 | 0.753 | 0.149 | 0.276 | 1.000 |
연번 | 일 사용량 구분 | 시군 | 처리장명 | 시설용량 | 소재지 | |
---|---|---|---|---|---|---|
0 | 1 | 500㎥/일 이상 | 창원시 | 덕동 | 500000 | 경상남도 창원시 마산합포구 가포로 739 |
1 | 2 | 500㎥/일 이상 | 창원시 | 진해 | 60000 | 진해구 천자로 101(덕산동) |
2 | 3 | 500㎥/일 이상 | 창원시 | 북면 | 24000 | 의창구 신촌본포로 333번길 42(월계리) |
3 | 4 | 500㎥/일 이상 | 창원시 | 웅동 | 20000 | 경상남도 창원시 진해구 남양동 403 |
4 | 5 | 500㎥/일 이상 | 창원시 | 대산 | 13000 | 의창구 유등로332번길 86-20(유등리) |
5 | 6 | 500㎥/일 이상 | 창원시 | 진동물재생센터 | 4000 | 마산합포구 진동면 미더덕로 406-158(고현리) |
6 | 7 | 500㎥/일 이상 | 진주시 | 진주 | 190000 | 경상남도 진주시 남강로 1607 (초전동) |
7 | 8 | 500㎥/일 이상 | 진주시 | 문산 | 7100 | 경상남도 진주시 문산읍 소문리 1842 |
8 | 9 | 500㎥/일 이상 | 진주시 | 사봉 | 2400 | 경상남도 진주시 일반성면 운천리 335-1 |
9 | 10 | 500㎥/일 이상 | 진주시 | 대곡 | 1900 | 경상남도 진주시 대곡면 가정리 94 |
연번 | 일 사용량 구분 | 시군 | 처리장명 | 시설용량 | 소재지 | |
---|---|---|---|---|---|---|
633 | 634 | 500㎥/일 미만 | 합천군 | 매안 | 110 | 경상남도 합천군 가야면 매안리 253 |
634 | 635 | 500㎥/일 미만 | 합천군 | 유전 | 85 | 경남 합천군 대병면 유전리 922-2 |
635 | 636 | 500㎥/일 미만 | 합천군 | 덕곡 | 75 | 경상남도 합천군 덕곡면 율지리 314-1번지 |
636 | 637 | 500㎥/일 미만 | 합천군 | 권빈 | 70 | 경남 합천군 봉산면 권빈리 884-1 |
637 | 638 | 500㎥/일 미만 | 합천군 | 두심 | 70 | 가회면 둔내리 40-1번지 |
638 | 639 | 500㎥/일 미만 | 합천군 | 봉계 | 68 | 경상남도 합천군 봉산면 봉계리 914-2 |
639 | 640 | 500㎥/일 미만 | 합천군 | 계산 | 50 | 경남 합천군 봉산면 계산리 712 |
640 | 641 | 500㎥/일 미만 | 합천군 | 마장 | 50 | 가야면 치인리 242-4 |
641 | 642 | 500㎥/일 미만 | 합천군 | 용주 | 50 | 경상남도 합천군 용주면 용지리 370-1번지 |
642 | 643 | 500㎥/일 미만 | 합천군 | 구평 | 46 | 경상남도 합천군 가회면 함방리 689-1 |