Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 220 |
Missing cells | 11 |
Missing cells (%) | 0.8% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.5% |
Total size in memory | 10.7 KiB |
Average record size in memory | 49.6 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Numeric | 1 |
Dataset
Description | 김포시 녹지(녹지구분, 사업지구, 녹지등록명, 주소, 면적, 데이터기준일자 등)의 데이터를 제공하고 있습니다. |
---|---|
Author | 경기도 김포시 |
URL | https://www.data.go.kr/data/15113607/fileData.do |
Dataset has 1 (0.5%) duplicate rows | Duplicates |
사업지구 is highly overall correlated with 데이터기준일자 | High correlation |
녹지구분 is highly overall correlated with 데이터기준일자 | High correlation |
데이터기준일자 is highly overall correlated with 면적(제곱미터) and 2 other fields | High correlation |
면적(제곱미터) is highly overall correlated with 데이터기준일자 | High correlation |
녹지구분 is highly imbalanced (51.4%) | Imbalance |
데이터기준일자 is highly imbalanced (86.9%) | Imbalance |
녹지등록명 has 3 (1.4%) missing values | Missing |
주소 has 4 (1.8%) missing values | Missing |
면적(제곱미터) has 4 (1.8%) missing values | Missing |
Reproduction
Analysis started | 2024-04-29 23:10:05.213660 |
---|---|
Analysis finished | 2024-04-29 23:10:07.207654 |
Duration | 1.99 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
녹지구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.8 KiB |
완충녹지 | |
---|---|
경관녹지 | |
연결녹지 | 6 |
<NA> | 4 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 완충녹지 |
---|---|
2nd row | 완충녹지 |
3rd row | 완충녹지 |
4th row | 완충녹지 |
5th row | 완충녹지 |
Common Values
Value | Count | Frequency (%) |
완충녹지 | 171 | |
경관녹지 | 39 | 17.7% |
연결녹지 | 6 | 2.7% |
<NA> | 4 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
완충녹지 | 171 | |
경관녹지 | 39 | 17.7% |
연결녹지 | 6 | 2.7% |
na | 4 | 1.8% |
사업지구
Categorical
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 10.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.8 KiB |
마송 | |
---|---|
양곡 | |
학운 | |
신곡 | |
김포한강 | |
Other values (19) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.2409091 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 1.8% |
Sample
1st row | 고촌 |
---|---|
2nd row | 고촌 |
3rd row | 청송 |
4th row | 걸포 |
5th row | 걸포 |
Common Values
Value | Count | Frequency (%) |
마송 | 48 | |
양곡 | 44 | |
학운 | 25 | |
신곡 | 21 | |
김포한강 | 10 | 4.5% |
걸포 | 9 | 4.1% |
고촌물류 | 9 | 4.1% |
향산 | 8 | 3.6% |
고촌 | 7 | 3.2% |
대포 | 5 | 2.3% |
Other values (14) | 34 |
Length
Value | Count | Frequency (%) |
마송 | 48 | |
양곡 | 44 | |
학운 | 25 | |
신곡 | 21 | |
김포한강 | 10 | 4.5% |
걸포 | 9 | 4.1% |
고촌물류 | 9 | 4.1% |
향산 | 8 | 3.6% |
고촌 | 7 | 3.2% |
대포 | 5 | 2.3% |
Other values (14) | 34 |
녹지등록명
Text
MISSING
 
Distinct | 217 |
---|---|
Distinct (%) | 100.0% |
Missing | 3 |
Missing (%) | 1.4% |
Memory size | 1.8 KiB |
Length
Max length | 20 |
---|---|
Median length | 18 |
Mean length | 13.857143 |
Min length | 1 |
Characters and Unicode
Total characters | 3007 |
---|---|
Distinct characters | 75 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 217 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 고촌수기 (완충녹지 제25호) |
---|---|
2nd row | 고촌수기 (완충녹지 제26호) |
3rd row | 청송현대 (완충녹지95호) |
4th row | 걸포지구 (완충녹지27호) |
5th row | 걸포지구 (완충녹지28호) |
Value | Count | Frequency (%) |
마송택지 | 37 | 8.7% |
완충녹지 | 28 | 6.6% |
양곡택지 | 24 | 5.7% |
신곡6지구 | 18 | 4.2% |
학운3산업단지 | 10 | 2.4% |
고촌물류단지 | 9 | 2.1% |
향산지구 | 8 | 1.9% |
완충녹지4호 | 7 | 1.7% |
완충녹지5호 | 7 | 1.7% |
걸포지구 | 6 | 1.4% |
Other values (178) | 270 |
Most occurring characters
Value | Count | Frequency (%) |
지 | 404 | 13.4% |
호 | 215 | 7.1% |
녹 | 215 | 7.1% |
209 | 7.0% | |
완 | 171 | 5.7% |
충 | 171 | 5.7% |
) | 169 | 5.6% |
( | 169 | 5.6% |
택 | 107 | 3.6% |
1 | 84 | 2.8% |
Other values (65) | 1093 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2036 | |
Decimal Number | 420 | 14.0% |
Space Separator | 209 | 7.0% |
Close Punctuation | 169 | 5.6% |
Open Punctuation | 169 | 5.6% |
Dash Punctuation | 2 | 0.1% |
Other Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 404 | |
호 | 215 | 10.6% |
녹 | 215 | 10.6% |
완 | 171 | 8.4% |
충 | 171 | 8.4% |
택 | 107 | 5.3% |
곡 | 59 | 2.9% |
송 | 49 | 2.4% |
마 | 48 | 2.4% |
구 | 48 | 2.4% |
Other values (50) | 549 |
Decimal Number
Value | Count | Frequency (%) |
1 | 84 | |
2 | 68 | |
3 | 62 | |
4 | 55 | |
6 | 45 | |
5 | 36 | |
7 | 25 | 6.0% |
8 | 19 | 4.5% |
0 | 14 | 3.3% |
9 | 12 | 2.9% |
Space Separator
Value | Count | Frequency (%) |
209 |
Close Punctuation
Value | Count | Frequency (%) |
) | 169 |
Open Punctuation
Value | Count | Frequency (%) |
( | 169 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2036 | |
Common | 971 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 404 | |
호 | 215 | 10.6% |
녹 | 215 | 10.6% |
완 | 171 | 8.4% |
충 | 171 | 8.4% |
택 | 107 | 5.3% |
곡 | 59 | 2.9% |
송 | 49 | 2.4% |
마 | 48 | 2.4% |
구 | 48 | 2.4% |
Other values (50) | 549 |
Common
Value | Count | Frequency (%) |
209 | ||
) | 169 | |
( | 169 | |
1 | 84 | |
2 | 68 | 7.0% |
3 | 62 | 6.4% |
4 | 55 | 5.7% |
6 | 45 | 4.6% |
5 | 36 | 3.7% |
7 | 25 | 2.6% |
Other values (5) | 49 | 5.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2036 | |
ASCII | 971 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
지 | 404 | |
호 | 215 | 10.6% |
녹 | 215 | 10.6% |
완 | 171 | 8.4% |
충 | 171 | 8.4% |
택 | 107 | 5.3% |
곡 | 59 | 2.9% |
송 | 49 | 2.4% |
마 | 48 | 2.4% |
구 | 48 | 2.4% |
Other values (50) | 549 |
ASCII
Value | Count | Frequency (%) |
209 | ||
) | 169 | |
( | 169 | |
1 | 84 | |
2 | 68 | 7.0% |
3 | 62 | 6.4% |
4 | 55 | 5.7% |
6 | 45 | 4.6% |
5 | 36 | 3.7% |
7 | 25 | 2.6% |
Other values (5) | 49 | 5.0% |
주소
Text
MISSING
 
Distinct | 214 |
---|---|
Distinct (%) | 99.1% |
Missing | 4 |
Missing (%) | 1.8% |
Memory size | 1.8 KiB |
Length
Max length | 38 |
---|---|
Median length | 29 |
Mean length | 13.930556 |
Min length | 6 |
Characters and Unicode
Total characters | 3009 |
---|---|
Distinct characters | 63 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 212 ? |
---|---|
Unique (%) | 98.1% |
Sample
1st row | 고촌읍 신곡리 1193 외8필 |
---|---|
2nd row | 고촌읍 신곡리 1257 외4필 |
3rd row | 장기동 1316 외12필지 |
4th row | 걸포동 1559 공 |
5th row | 걸포동 1556 공 |
Value | Count | Frequency (%) |
양촌읍 | 62 | 8.8% |
통진읍 | 53 | 7.5% |
마송리 | 49 | 7.0% |
고촌읍 | 45 | 6.4% |
양곡리 | 37 | 5.3% |
일원 | 34 | 4.8% |
학운리 | 30 | 4.3% |
신곡리 | 24 | 3.4% |
공 | 24 | 3.4% |
김포시 | 18 | 2.6% |
Other values (254) | 326 |
Most occurring characters
Value | Count | Frequency (%) |
488 | 16.2% | |
1 | 197 | 6.5% |
리 | 174 | 5.8% |
읍 | 160 | 5.3% |
3 | 119 | 4.0% |
5 | 116 | 3.9% |
촌 | 109 | 3.6% |
2 | 106 | 3.5% |
공 | 104 | 3.5% |
양 | 100 | 3.3% |
Other values (53) | 1336 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1441 | |
Decimal Number | 955 | |
Space Separator | 488 | 16.2% |
Dash Punctuation | 92 | 3.1% |
Other Punctuation | 19 | 0.6% |
Open Punctuation | 7 | 0.2% |
Close Punctuation | 7 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 174 | 12.1% |
읍 | 160 | 11.1% |
촌 | 109 | 7.6% |
공 | 104 | 7.2% |
양 | 100 | 6.9% |
곡 | 61 | 4.2% |
통 | 54 | 3.7% |
진 | 54 | 3.7% |
마 | 50 | 3.5% |
송 | 49 | 3.4% |
Other values (38) | 526 |
Decimal Number
Value | Count | Frequency (%) |
1 | 197 | |
3 | 119 | |
5 | 116 | |
2 | 106 | |
6 | 95 | |
0 | 77 | 8.1% |
4 | 70 | 7.3% |
8 | 70 | 7.3% |
9 | 62 | 6.5% |
7 | 43 | 4.5% |
Space Separator
Value | Count | Frequency (%) |
488 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 92 |
Other Punctuation
Value | Count | Frequency (%) |
, | 19 |
Open Punctuation
Value | Count | Frequency (%) |
( | 7 |
Close Punctuation
Value | Count | Frequency (%) |
) | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1568 | |
Hangul | 1441 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 174 | 12.1% |
읍 | 160 | 11.1% |
촌 | 109 | 7.6% |
공 | 104 | 7.2% |
양 | 100 | 6.9% |
곡 | 61 | 4.2% |
통 | 54 | 3.7% |
진 | 54 | 3.7% |
마 | 50 | 3.5% |
송 | 49 | 3.4% |
Other values (38) | 526 |
Common
Value | Count | Frequency (%) |
488 | ||
1 | 197 | |
3 | 119 | 7.6% |
5 | 116 | 7.4% |
2 | 106 | 6.8% |
6 | 95 | 6.1% |
- | 92 | 5.9% |
0 | 77 | 4.9% |
4 | 70 | 4.5% |
8 | 70 | 4.5% |
Other values (5) | 138 | 8.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1568 | |
Hangul | 1441 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
488 | ||
1 | 197 | |
3 | 119 | 7.6% |
5 | 116 | 7.4% |
2 | 106 | 6.8% |
6 | 95 | 6.1% |
- | 92 | 5.9% |
0 | 77 | 4.9% |
4 | 70 | 4.5% |
8 | 70 | 4.5% |
Other values (5) | 138 | 8.8% |
Hangul
Value | Count | Frequency (%) |
리 | 174 | 12.1% |
읍 | 160 | 11.1% |
촌 | 109 | 7.6% |
공 | 104 | 7.2% |
양 | 100 | 6.9% |
곡 | 61 | 4.2% |
통 | 54 | 3.7% |
진 | 54 | 3.7% |
마 | 50 | 3.5% |
송 | 49 | 3.4% |
Other values (38) | 526 |
면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 212 |
---|---|
Distinct (%) | 98.1% |
Missing | 4 |
Missing (%) | 1.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4440.037 |
Minimum | 27 |
---|---|
Maximum | 88033 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.1 KiB |
Quantile statistics
Minimum | 27 |
---|---|
5-th percentile | 306.25 |
Q1 | 995.75 |
median | 1868 |
Q3 | 3363.5 |
95-th percentile | 16626.25 |
Maximum | 88033 |
Range | 88006 |
Interquartile range (IQR) | 2367.75 |
Descriptive statistics
Standard deviation | 8995.8472 |
---|---|
Coefficient of variation (CV) | 2.0260748 |
Kurtosis | 39.17314 |
Mean | 4440.037 |
Median Absolute Deviation (MAD) | 1148.5 |
Skewness | 5.4565923 |
Sum | 959048 |
Variance | 80925267 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1638 | 2 | 0.9% |
3300 | 2 | 0.9% |
1868 | 2 | 0.9% |
2512 | 2 | 0.9% |
1339 | 1 | 0.5% |
1501 | 1 | 0.5% |
5717 | 1 | 0.5% |
1743 | 1 | 0.5% |
321 | 1 | 0.5% |
557 | 1 | 0.5% |
Other values (202) | 202 | |
(Missing) | 4 | 1.8% |
Value | Count | Frequency (%) |
27 | 1 | |
135 | 1 | |
150 | 1 | |
180 | 1 | |
190 | 1 | |
226 | 1 | |
229 | 1 | |
251 | 1 | |
258 | 1 | |
267 | 1 |
Value | Count | Frequency (%) |
88033 | 1 | |
48013 | 1 | |
38589 | 1 | |
36312 | 1 | |
36297 | 1 | |
32448 | 1 | |
31548 | 1 | |
31058 | 1 | |
22836 | 1 | |
20697 | 1 |
데이터기준일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.8 KiB |
2024-04-18 | |
---|---|
<NA> | 4 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.8909091 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2024-04-18 |
---|---|
2nd row | 2024-04-18 |
3rd row | 2024-04-18 |
4th row | 2024-04-18 |
5th row | 2024-04-18 |
Common Values
Value | Count | Frequency (%) |
2024-04-18 | 216 | |
<NA> | 4 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2024-04-18 | 216 | |
na | 4 | 1.8% |
녹지구분 | 사업지구 | 면적(제곱미터) | |
---|---|---|---|
녹지구분 | 1.000 | 0.590 | 0.000 |
사업지구 | 0.590 | 1.000 | 0.756 |
면적(제곱미터) | 0.000 | 0.756 | 1.000 |
사업지구 | 녹지구분 | 데이터기준일자 | |
---|---|---|---|
사업지구 | 1.000 | 0.359 | 1.000 |
녹지구분 | 0.359 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 |
면적(제곱미터) | 녹지구분 | 사업지구 | 데이터기준일자 | |
---|---|---|---|---|
면적(제곱미터) | 1.000 | 0.000 | 0.434 | 1.000 |
녹지구분 | 0.000 | 1.000 | 0.359 | 1.000 |
사업지구 | 0.434 | 0.359 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 | 1.000 |
녹지구분 | 사업지구 | 녹지등록명 | 주소 | 면적(제곱미터) | 데이터기준일자 | |
---|---|---|---|---|---|---|
0 | 완충녹지 | 고촌 | 고촌수기 (완충녹지 제25호) | 고촌읍 신곡리 1193 외8필 | 6065 | 2024-04-18 |
1 | 완충녹지 | 고촌 | 고촌수기 (완충녹지 제26호) | 고촌읍 신곡리 1257 외4필 | 3079 | 2024-04-18 |
2 | 완충녹지 | 청송 | 청송현대 (완충녹지95호) | 장기동 1316 외12필지 | 6645 | 2024-04-18 |
3 | 완충녹지 | 걸포 | 걸포지구 (완충녹지27호) | 걸포동 1559 공 | 844 | 2024-04-18 |
4 | 완충녹지 | 걸포 | 걸포지구 (완충녹지28호) | 걸포동 1556 공 | 998 | 2024-04-18 |
5 | 완충녹지 | 걸포 | 걸포지구 (완충녹지29호) | 걸포동 1562 공 | 1367 | 2024-04-18 |
6 | 완충녹지 | 걸포 | 걸포지구 (완충녹지30호) | 걸포동 1564 공 | 430 | 2024-04-18 |
7 | 완충녹지 | 걸포 | 걸포지구 (완충녹지32호) | 걸포동 909-6 공 | 969 | 2024-04-18 |
8 | 완충녹지 | 걸포 | 걸포지구 (완충녹지33호) | 걸포동 910-4, 1583 공 | 1671 | 2024-04-18 |
9 | 완충녹지 | 북변 | 북변동양 (완충녹지31호) | 북변동 431-52 외6필 | 479 | 2024-04-18 |
녹지구분 | 사업지구 | 녹지등록명 | 주소 | 면적(제곱미터) | 데이터기준일자 | |
---|---|---|---|---|---|---|
210 | 연결녹지 | 양곡 | 양곡택지(연결녹지30호) | 양촌읍 양곡리 1250 공 | 1928 | 2024-04-18 |
211 | 연결녹지 | 양곡 | 양곡택지(연결녹지31호) | 양촌읍 양곡리 1255 공 | 1638 | 2024-04-18 |
212 | 연결녹지 | 고촌 | 고촌행정타운(고촌1호) | 고촌읍 신곡리 1293 | 1150 | 2024-04-18 |
213 | 연결녹지 | 풍무 | 풍무2지구(연결녹지 4호) | 풍무동 1100, 1099 | 1533 | 2024-04-18 |
214 | 연결녹지 | 풍무 | 풍무2지구(연결녹지 5호) | 풍무동 938, 937, 939 | 10146 | 2024-04-18 |
215 | 연결녹지 | 걸포 | 걸포3지 연결녹지 1호 | 걸포동 1607 | 8347 | 2024-04-18 |
216 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
217 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
218 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
219 | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
녹지구분 | 사업지구 | 녹지등록명 | 주소 | 면적(제곱미터) | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 3 |