Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 50 |
Missing cells | 21 |
Missing cells (%) | 6.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.1 KiB |
Average record size in memory | 62.6 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Numeric | 4 |
Dataset
Description | 부산광역시_하천현황_20230324 |
---|---|
Author | 부산광역시 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=3076446 |
하천연장(km) is highly overall correlated with 요개수연장 양안(km) and 3 other fields | High correlation |
요개수연장 양안(km) is highly overall correlated with 하천연장(km) and 3 other fields | High correlation |
개수연장 양안(km) is highly overall correlated with 하천연장(km) and 1 other fields | High correlation |
미개수연장 양안(km) is highly overall correlated with 하천연장(km) and 2 other fields | High correlation |
구분 is highly overall correlated with 하천연장(km) and 3 other fields | High correlation |
비고(담당구역별) is highly overall correlated with 구분 | High correlation |
구분 is highly imbalanced (53.1%) | Imbalance |
개수연장 양안(km) has 3 (6.0%) missing values | Missing |
미개수연장 양안(km) has 18 (36.0%) missing values | Missing |
Reproduction
Analysis started | 2023-12-10 16:07:36.861680 |
---|---|
Analysis finished | 2023-12-10 16:07:39.409250 |
Duration | 2.55 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 532.0 B |
지방하천 | |
---|---|
국가하천 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 국가하천 |
---|---|
2nd row | 국가하천 |
3rd row | 국가하천 |
4th row | 국가하천 |
5th row | 국가하천 |
Common Values
Value | Count | Frequency (%) |
지방하천 | 45 | |
국가하천 | 5 | 10.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지방하천 | 45 | |
국가하천 | 5 | 10.0% |
하천명
Text
Distinct | 46 |
---|---|
Distinct (%) | 92.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 532.0 B |
Value | Count | Frequency (%) |
송정천 | 3 | 5.7% |
천 | 3 | 5.7% |
수영강 | 2 | 3.8% |
호계천 | 2 | 3.8% |
용소천 | 1 | 1.9% |
좌광천 | 1 | 1.9% |
낙동강(본류 | 1 | 1.9% |
덕선천 | 1 | 1.9% |
지사천 | 1 | 1.9% |
해반천 | 1 | 1.9% |
Other values (37) | 37 |
Most occurring characters
Value | Count | Frequency (%) |
천 | 47 | |
강 | 7 | 4.5% |
동 | 6 | 3.9% |
정 | 4 | 2.6% |
송 | 3 | 1.9% |
부 | 3 | 1.9% |
3 | 1.9% | |
덕 | 3 | 1.9% |
대 | 3 | 1.9% |
전 | 3 | 1.9% |
Other values (62) | 73 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 150 | |
Space Separator | 3 | 1.9% |
Close Punctuation | 1 | 0.6% |
Open Punctuation | 1 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
천 | 47 | |
강 | 7 | 4.7% |
동 | 6 | 4.0% |
정 | 4 | 2.7% |
송 | 3 | 2.0% |
부 | 3 | 2.0% |
덕 | 3 | 2.0% |
대 | 3 | 2.0% |
전 | 3 | 2.0% |
수 | 3 | 2.0% |
Other values (59) | 68 |
Space Separator
Value | Count | Frequency (%) |
3 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 150 | |
Common | 5 | 3.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
천 | 47 | |
강 | 7 | 4.7% |
동 | 6 | 4.0% |
정 | 4 | 2.7% |
송 | 3 | 2.0% |
부 | 3 | 2.0% |
덕 | 3 | 2.0% |
대 | 3 | 2.0% |
전 | 3 | 2.0% |
수 | 3 | 2.0% |
Other values (59) | 68 |
Common
Value | Count | Frequency (%) |
3 | ||
) | 1 | 20.0% |
( | 1 | 20.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 150 | |
ASCII | 5 | 3.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
천 | 47 | |
강 | 7 | 4.7% |
동 | 6 | 4.0% |
정 | 4 | 2.7% |
송 | 3 | 2.0% |
부 | 3 | 2.0% |
덕 | 3 | 2.0% |
대 | 3 | 2.0% |
전 | 3 | 2.0% |
수 | 3 | 2.0% |
Other values (59) | 68 |
ASCII
Value | Count | Frequency (%) |
3 | ||
) | 1 | 20.0% |
( | 1 | 20.0% |
하천연장(km)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 47 |
---|---|
Distinct (%) | 94.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.486 |
Minimum | 0.69 |
---|---|
Maximum | 20.26 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 582.0 B |
Quantile statistics
Minimum | 0.69 |
---|---|
5-th percentile | 0.97 |
Q1 | 2.5725 |
median | 4.02 |
Q3 | 6.62 |
95-th percentile | 16.062 |
Maximum | 20.26 |
Range | 19.57 |
Interquartile range (IQR) | 4.0475 |
Descriptive statistics
Standard deviation | 4.626181 |
---|---|
Coefficient of variation (CV) | 0.84327033 |
Kurtosis | 2.519101 |
Mean | 5.486 |
Median Absolute Deviation (MAD) | 1.755 |
Skewness | 1.6917596 |
Sum | 274.3 |
Variance | 21.401551 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1.61 | 2 | 4.0% |
0.97 | 2 | 4.0% |
2.9 | 2 | 4.0% |
6.68 | 1 | 2.0% |
3.57 | 1 | 2.0% |
3.65 | 1 | 2.0% |
0.85 | 1 | 2.0% |
4.53 | 1 | 2.0% |
8.7 | 1 | 2.0% |
4.34 | 1 | 2.0% |
Other values (37) | 37 |
Value | Count | Frequency (%) |
0.69 | 1 | |
0.85 | 1 | |
0.97 | 2 | |
1.61 | 2 | |
1.69 | 1 | |
1.8 | 1 | |
1.99 | 1 | |
2.07 | 1 | |
2.35 | 1 | |
2.52 | 1 |
Value | Count | Frequency (%) |
20.26 | 1 | |
18.55 | 1 | |
17.34 | 1 | |
14.5 | 1 | |
13.24 | 1 | |
12.54 | 1 | |
9.0 | 1 | |
8.9 | 1 | |
8.7 | 1 | |
8.27 | 1 |
요개수연장 양안(km)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 48 |
---|---|
Distinct (%) | 96.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9.9832 |
Minimum | 0.85 |
---|---|
Maximum | 44.28 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 582.0 B |
Quantile statistics
Minimum | 0.85 |
---|---|
5-th percentile | 1.544 |
Q1 | 3.655 |
median | 7.67 |
Q3 | 11.545 |
95-th percentile | 27.437 |
Maximum | 44.28 |
Range | 43.43 |
Interquartile range (IQR) | 7.89 |
Descriptive statistics
Standard deviation | 9.0477259 |
---|---|
Coefficient of variation (CV) | 0.90629517 |
Kurtosis | 3.9249024 |
Mean | 9.9832 |
Median Absolute Deviation (MAD) | 4.035 |
Skewness | 1.867474 |
Sum | 499.16 |
Variance | 81.861345 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3.22 | 2 | 4.0% |
3.6 | 2 | 4.0% |
0.97 | 1 | 2.0% |
3.65 | 1 | 2.0% |
0.85 | 1 | 2.0% |
9.06 | 1 | 2.0% |
15.06 | 1 | 2.0% |
8.68 | 1 | 2.0% |
18.47 | 1 | 2.0% |
4.94 | 1 | 2.0% |
Other values (38) | 38 |
Value | Count | Frequency (%) |
0.85 | 1 | |
0.97 | 1 | |
1.22 | 1 | |
1.94 | 1 | |
2.1 | 1 | |
2.3 | 1 | |
3.22 | 2 | |
3.38 | 1 | |
3.4 | 1 | |
3.6 | 2 |
Value | Count | Frequency (%) |
44.28 | 1 | |
34.74 | 1 | |
28.22 | 1 | |
26.48 | 1 | |
24.86 | 1 | |
19.87 | 1 | |
18.47 | 1 | |
17.8 | 1 | |
16.54 | 1 | |
16.38 | 1 |
개수연장 양안(km)
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 46 |
---|---|
Distinct (%) | 97.9% |
Missing | 3 |
Missing (%) | 6.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.9657447 |
Minimum | 0.26 |
---|---|
Maximum | 34.44 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 582.0 B |
Quantile statistics
Minimum | 0.26 |
---|---|
5-th percentile | 0.605 |
Q1 | 2.99 |
median | 4.62 |
Q3 | 7.755 |
95-th percentile | 19.296 |
Maximum | 34.44 |
Range | 34.18 |
Interquartile range (IQR) | 4.765 |
Descriptive statistics
Standard deviation | 7.0724935 |
---|---|
Coefficient of variation (CV) | 1.0153248 |
Kurtosis | 4.6971826 |
Mean | 6.9657447 |
Median Absolute Deviation (MAD) | 2.02 |
Skewness | 2.049013 |
Sum | 327.39 |
Variance | 50.020164 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3.67 | 2 | 4.0% |
2.6 | 1 | 2.0% |
0.5 | 1 | 2.0% |
0.97 | 1 | 2.0% |
3.65 | 1 | 2.0% |
0.85 | 1 | 2.0% |
1.8 | 1 | 2.0% |
10.96 | 1 | 2.0% |
6.13 | 1 | 2.0% |
16.87 | 1 | 2.0% |
Other values (36) | 36 | |
(Missing) | 3 | 6.0% |
Value | Count | Frequency (%) |
0.26 | 1 | |
0.31 | 1 | |
0.5 | 1 | |
0.85 | 1 | |
0.97 | 1 | |
1.0 | 1 | |
1.22 | 1 | |
1.8 | 1 | |
1.94 | 1 | |
2.6 | 1 |
Value | Count | Frequency (%) |
34.44 | 1 | |
26.48 | 1 | |
20.28 | 1 | |
17.0 | 1 | |
16.87 | 1 | |
16.54 | 1 | |
15.68 | 1 | |
14.2 | 1 | |
11.72 | 1 | |
10.96 | 1 |
미개수연장 양안(km)
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 32 |
---|---|
Distinct (%) | 100.0% |
Missing | 18 |
Missing (%) | 36.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.3678125 |
Minimum | 0.2 |
---|---|
Maximum | 24.98 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 582.0 B |
Quantile statistics
Minimum | 0.2 |
---|---|
5-th percentile | 0.629 |
Q1 | 2.03 |
median | 3.515 |
Q3 | 4.83 |
95-th percentile | 19.023 |
Maximum | 24.98 |
Range | 24.78 |
Interquartile range (IQR) | 2.8 |
Descriptive statistics
Standard deviation | 6.133356 |
---|---|
Coefficient of variation (CV) | 1.1426174 |
Kurtosis | 5.0281499 |
Mean | 5.3678125 |
Median Absolute Deviation (MAD) | 1.455 |
Skewness | 2.2936898 |
Sum | 171.77 |
Variance | 37.618056 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4.1 | 1 | 2.0% |
2.17 | 1 | 2.0% |
2.2 | 1 | 2.0% |
2.1 | 1 | 2.0% |
2.6 | 1 | 2.0% |
3.09 | 1 | 2.0% |
0.8 | 1 | 2.0% |
5.01 | 1 | 2.0% |
1.38 | 1 | 2.0% |
1.5 | 1 | 2.0% |
Other values (22) | 22 | |
(Missing) | 18 |
Value | Count | Frequency (%) |
0.2 | 1 | |
0.42 | 1 | |
0.8 | 1 | |
1.38 | 1 | |
1.5 | 1 | |
1.6 | 1 | |
1.8 | 1 | |
1.82 | 1 | |
2.1 | 1 | |
2.17 | 1 |
Value | Count | Frequency (%) |
24.98 | 1 | |
24.6 | 1 | |
14.46 | 1 | |
14.2 | 1 | |
9.84 | 1 | |
7.98 | 1 | |
7.26 | 1 | |
5.01 | 1 | |
4.77 | 1 | |
4.7 | 1 |
비고(담당구역별)
Categorical
HIGH CORRELATION
 
Distinct | 23 |
---|---|
Distinct (%) | 46.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 532.0 B |
기장군 | |
---|---|
강서구 | |
강서구(좌안) | |
부산진구 | |
사상구 | |
Other values (18) |
Length
Max length | 11 |
---|---|
Median length | 10 |
Mean length | 4.48 |
Min length | 2 |
Unique
Unique | 15 ? |
---|---|
Unique (%) | 30.0% |
Sample
1st row | 낙동강관리본부 |
---|---|
2nd row | 강서구 |
3rd row | 강서구 |
4th row | 강서구 |
5th row | 금정,수영,해운대구 |
Common Values
Value | Count | Frequency (%) |
기장군 | 14 | |
강서구 | 5 | 10.0% |
강서구(좌안) | 4 | 8.0% |
부산진구 | 3 | 6.0% |
사상구 | 3 | 6.0% |
해운대구 | 2 | 4.0% |
북구 | 2 | 4.0% |
동구 | 2 | 4.0% |
동구,부산진구 | 1 | 2.0% |
금정,수영,해운대구 | 1 | 2.0% |
Other values (13) | 13 |
Length
Value | Count | Frequency (%) |
기장군 | 16 | |
강서구 | 5 | 9.6% |
강서구(좌안 | 4 | 7.7% |
부산진구 | 3 | 5.8% |
사상구 | 3 | 5.8% |
해운대구 | 3 | 5.8% |
북구 | 2 | 3.8% |
동구 | 2 | 3.8% |
금정구 | 2 | 3.8% |
동구,부산진구,남구 | 1 | 1.9% |
Other values (11) | 11 |
구분 | 하천명 | 하천연장(km) | 요개수연장 양안(km) | 개수연장 양안(km) | 미개수연장 양안(km) | 비고(담당구역별) | |
---|---|---|---|---|---|---|---|
구분 | 1.000 | 0.000 | 0.692 | 0.712 | 0.539 | 0.977 | 0.800 |
하천명 | 0.000 | 1.000 | 0.000 | 0.000 | 0.622 | 0.781 | 0.000 |
하천연장(km) | 0.692 | 0.000 | 1.000 | 0.982 | 0.840 | 0.728 | 0.703 |
요개수연장 양안(km) | 0.712 | 0.000 | 0.982 | 1.000 | 0.874 | 0.825 | 0.854 |
개수연장 양안(km) | 0.539 | 0.622 | 0.840 | 0.874 | 1.000 | 0.654 | 0.885 |
미개수연장 양안(km) | 0.977 | 0.781 | 0.728 | 0.825 | 0.654 | 1.000 | 0.653 |
비고(담당구역별) | 0.800 | 0.000 | 0.703 | 0.854 | 0.885 | 0.653 | 1.000 |
구분 | 비고(담당구역별) | |
---|---|---|
구분 | 1.000 | 0.539 |
비고(담당구역별) | 0.539 | 1.000 |
하천연장(km) | 요개수연장 양안(km) | 개수연장 양안(km) | 미개수연장 양안(km) | 구분 | 비고(담당구역별) | |
---|---|---|---|---|---|---|
하천연장(km) | 1.000 | 0.953 | 0.688 | 0.603 | 0.648 | 0.277 |
요개수연장 양안(km) | 0.953 | 1.000 | 0.720 | 0.617 | 0.668 | 0.435 |
개수연장 양안(km) | 0.688 | 0.720 | 1.000 | 0.080 | 0.375 | 0.475 |
미개수연장 양안(km) | 0.603 | 0.617 | 0.080 | 1.000 | 0.802 | 0.278 |
구분 | 0.648 | 0.668 | 0.375 | 0.802 | 1.000 | 0.539 |
비고(담당구역별) | 0.277 | 0.435 | 0.475 | 0.278 | 0.539 | 1.000 |
구분 | 하천명 | 하천연장(km) | 요개수연장 양안(km) | 개수연장 양안(km) | 미개수연장 양안(km) | 비고(담당구역별) | |
---|---|---|---|---|---|---|---|
0 | 국가하천 | 낙동강(본류) | 20.26 | 34.74 | 20.28 | 14.46 | 낙동강관리본부 |
1 | 국가하천 | 서낙동강 | 18.55 | 28.22 | 3.24 | 24.98 | 강서구 |
2 | 국가하천 | 평강천 | 12.54 | 24.86 | 0.26 | 24.6 | 강서구 |
3 | 국가하천 | 맥도강 | 7.84 | 14.2 | <NA> | 14.2 | 강서구 |
4 | 국가하천 | 수영강 | 9.0 | 19.87 | 15.68 | 4.19 | 금정,수영,해운대구 |
5 | 지방하천 | 괴정천 | 5.37 | 10.74 | 5.97 | 4.77 | 사하구 |
6 | 지방하천 | 학장천 | 5.86 | 11.72 | 11.72 | <NA> | 사상구 |
7 | 지방하천 | 덕천천 | 3.7 | 7.4 | 3.67 | 3.73 | 북구 |
8 | 지방하천 | 대리천 | 1.69 | 3.38 | 2.96 | 0.42 | 북구 |
9 | 지방하천 | 대천천 | 5.44 | 10.88 | 2.9 | 7.98 | 북구,금정구 |
구분 | 하천명 | 하천연장(km) | 요개수연장 양안(km) | 개수연장 양안(km) | 미개수연장 양안(km) | 비고(담당구역별) | |
---|---|---|---|---|---|---|---|
40 | 지방하천 | 만화천 | 2.9 | 5.19 | 3.69 | 1.5 | 기장군 |
41 | 지방하천 | 서부천 | 3.29 | 4.53 | 3.15 | 1.38 | 기장군 |
42 | 지방하천 | 송정천 | 5.6 | 11.02 | 6.01 | 5.01 | 기장군, 해운대구 |
43 | 지방하천 | 철마천 | 8.9 | 17.8 | 17.0 | 0.8 | 기장군 |
44 | 지방하천 | 구칠천 | 2.07 | 3.4 | 0.31 | 3.09 | 기장군 |
45 | 지방하천 | 이곡천 | 2.66 | 3.6 | 1.0 | 2.6 | 기장군 |
46 | 지방하천 | 송정천 | 2.35 | 3.67 | 3.67 | <NA> | 금정구, 기장군 |
47 | 지방하천 | 임기천 | 2.58 | 2.1 | <NA> | 2.1 | 기장군 |
48 | 지방하천 | 삼락천 | 4.6 | 9.2 | 7.0 | 2.2 | 사상구 |
49 | 지방하천 | 감전천 | 2.9 | 5.8 | 3.63 | 2.17 | 사상구 |