Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 22 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.4 KiB |
Average record size in memory | 64.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 경기도 평택시 내 지구별 주택공급 예정량 데이터로 지구명, 공급구분(민간/공공), 준공(예정), 수용인구수, 전체세대수, 담당부서 항목을 제공합니다. ※ 문의 : 미래첨단산업과(031-8024-3451), 도시개발과(031-8024-4011), 도시계획과(031-8024-3929) |
---|---|
URL | https://www.data.go.kr/data/15114718/fileData.do |
시군구 has constant value "" | Constant |
수용인구수 is highly overall correlated with 전체세대수 and 1 other fields | High correlation |
전체세대수 is highly overall correlated with 수용인구수 and 1 other fields | High correlation |
담당부서 is highly overall correlated with 수용인구수 and 1 other fields | High correlation |
공급구분 is highly imbalanced (55.8%) | Imbalance |
지구명 has unique values | Unique |
수용인구수 has unique values | Unique |
전체세대수 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 22:31:14.643215 |
---|---|
Analysis finished | 2023-12-12 22:31:15.397288 |
Duration | 0.75 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군구
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 4.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
평택시 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 평택시 |
---|---|
2nd row | 평택시 |
3rd row | 평택시 |
4th row | 평택시 |
5th row | 평택시 |
Common Values
Value | Count | Frequency (%) |
평택시 | 22 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
평택시 | 22 |
지구명
Text
UNIQUE
 
Distinct | 22 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
Value | Count | Frequency (%) |
브레인시티 | 1 | 4.3% |
소사3 | 1 | 4.3% |
갈곶지구 | 1 | 4.3% |
도곡2지구 | 1 | 4.3% |
신촌지구 | 1 | 4.3% |
가곡2 | 1 | 4.3% |
현곡 | 1 | 4.3% |
죽백1 | 1 | 4.3% |
학현 | 1 | 4.3% |
송화 | 1 | 4.3% |
Other values (13) | 13 |
Most occurring characters
Value | Count | Frequency (%) |
지 | 15 | 16.3% |
구 | 14 | 15.2% |
2 | 4 | 4.3% |
화 | 3 | 3.3% |
송 | 3 | 3.3% |
곡 | 3 | 3.3% |
신 | 3 | 3.3% |
교 | 2 | 2.2% |
세 | 2 | 2.2% |
가 | 2 | 2.2% |
Other values (35) | 41 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 85 | |
Decimal Number | 6 | 6.5% |
Space Separator | 1 | 1.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
지 | 15 | |
구 | 14 | 16.5% |
화 | 3 | 3.5% |
송 | 3 | 3.5% |
곡 | 3 | 3.5% |
신 | 3 | 3.5% |
교 | 2 | 2.4% |
세 | 2 | 2.4% |
가 | 2 | 2.4% |
사 | 2 | 2.4% |
Other values (31) | 36 |
Decimal Number
Value | Count | Frequency (%) |
2 | 4 | |
3 | 1 | 16.7% |
1 | 1 | 16.7% |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 85 | |
Common | 7 | 7.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
지 | 15 | |
구 | 14 | 16.5% |
화 | 3 | 3.5% |
송 | 3 | 3.5% |
곡 | 3 | 3.5% |
신 | 3 | 3.5% |
교 | 2 | 2.4% |
세 | 2 | 2.4% |
가 | 2 | 2.4% |
사 | 2 | 2.4% |
Other values (31) | 36 |
Common
Value | Count | Frequency (%) |
2 | 4 | |
3 | 1 | 14.3% |
1 | 1 | 14.3% |
1 | 14.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 85 | |
ASCII | 7 | 7.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
지 | 15 | |
구 | 14 | 16.5% |
화 | 3 | 3.5% |
송 | 3 | 3.5% |
곡 | 3 | 3.5% |
신 | 3 | 3.5% |
교 | 2 | 2.4% |
세 | 2 | 2.4% |
가 | 2 | 2.4% |
사 | 2 | 2.4% |
Other values (31) | 36 |
ASCII
Value | Count | Frequency (%) |
2 | 4 | |
3 | 1 | 14.3% |
1 | 1 | 14.3% |
1 | 14.3% |
공급구분
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 13.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
민간 | |
---|---|
민간+공공 | |
공공 | 1 |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.2727273 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 4.5% |
Sample
1st row | 민간 |
---|---|
2nd row | 민간 |
3rd row | 민간 |
4th row | 민간 |
5th row | 민간 |
Common Values
Value | Count | Frequency (%) |
민간 | 19 | |
민간+공공 | 2 | 9.1% |
공공 | 1 | 4.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
민간 | 19 | |
민간+공공 | 2 | 9.1% |
공공 | 1 | 4.5% |
준공(예정)
Text
Distinct | 14 |
---|---|
Distinct (%) | 63.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
Value | Count | Frequency (%) |
미정(주택건설사업계획 | 3 | |
승인 | 3 | |
2024 | 2 | 8.0% |
2026-12 | 2 | 8.0% |
2024-12 | 2 | 8.0% |
2030-12 | 2 | 8.0% |
2026-02 | 2 | 8.0% |
2027-12 | 2 | 8.0% |
2028-12 | 1 | 4.0% |
2024-06 | 1 | 4.0% |
Other values (5) | 5 |
Most occurring characters
Value | Count | Frequency (%) |
2 | 49 | |
0 | 28 | |
- | 17 | 9.9% |
1 | 12 | 7.0% |
4 | 6 | 3.5% |
6 | 5 | 2.9% |
3 | 4 | 2.3% |
미 | 3 | 1.7% |
정 | 3 | 1.7% |
) | 3 | 1.7% |
Other values (15) | 42 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 110 | |
Other Letter | 36 | 20.9% |
Dash Punctuation | 17 | 9.9% |
Close Punctuation | 3 | 1.7% |
Space Separator | 3 | 1.7% |
Open Punctuation | 3 | 1.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
미 | 3 | |
정 | 3 | |
인 | 3 | |
승 | 3 | |
획 | 3 | |
계 | 3 | |
업 | 3 | |
사 | 3 | |
설 | 3 | |
건 | 3 | |
Other values (2) | 6 |
Decimal Number
Value | Count | Frequency (%) |
2 | 49 | |
0 | 28 | |
1 | 12 | 10.9% |
4 | 6 | 5.5% |
6 | 5 | 4.5% |
3 | 4 | 3.6% |
7 | 2 | 1.8% |
8 | 2 | 1.8% |
5 | 2 | 1.8% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 17 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 |
Space Separator
Value | Count | Frequency (%) |
3 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 136 | |
Hangul | 36 | 20.9% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
2 | 49 | |
0 | 28 | |
- | 17 | 12.5% |
1 | 12 | 8.8% |
4 | 6 | 4.4% |
6 | 5 | 3.7% |
3 | 4 | 2.9% |
) | 3 | 2.2% |
3 | 2.2% | |
( | 3 | 2.2% |
Other values (3) | 6 | 4.4% |
Hangul
Value | Count | Frequency (%) |
미 | 3 | |
정 | 3 | |
인 | 3 | |
승 | 3 | |
획 | 3 | |
계 | 3 | |
업 | 3 | |
사 | 3 | |
설 | 3 | |
건 | 3 | |
Other values (2) | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 136 | |
Hangul | 36 | 20.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2 | 49 | |
0 | 28 | |
- | 17 | 12.5% |
1 | 12 | 8.8% |
4 | 6 | 4.4% |
6 | 5 | 3.7% |
3 | 4 | 2.9% |
) | 3 | 2.2% |
3 | 2.2% | |
( | 3 | 2.2% |
Other values (3) | 6 | 4.4% |
Hangul
Value | Count | Frequency (%) |
미 | 3 | |
정 | 3 | |
인 | 3 | |
승 | 3 | |
획 | 3 | |
계 | 3 | |
업 | 3 | |
사 | 3 | |
설 | 3 | |
건 | 3 | |
Other values (2) | 6 |
수용인구수
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 22 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 11882.091 |
Minimum | 2168 |
---|---|
Maximum | 53277 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 330.0 B |
Quantile statistics
Minimum | 2168 |
---|---|
5-th percentile | 2312.6 |
Q1 | 4178.75 |
median | 9314 |
Q3 | 13043 |
95-th percentile | 39696.1 |
Maximum | 53277 |
Range | 51109 |
Interquartile range (IQR) | 8864.25 |
Descriptive statistics
Standard deviation | 12530.74 |
---|---|
Coefficient of variation (CV) | 1.0545905 |
Kurtosis | 6.0056996 |
Mean | 11882.091 |
Median Absolute Deviation (MAD) | 5049.5 |
Skewness | 2.3970982 |
Sum | 261406 |
Variance | 1.5701944 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
40831 | 1 | 4.5% |
53277 | 1 | 4.5% |
2590 | 1 | 4.5% |
5739 | 1 | 4.5% |
4436 | 1 | 4.5% |
11976 | 1 | 4.5% |
5490 | 1 | 4.5% |
18133 | 1 | 4.5% |
9998 | 1 | 4.5% |
2168 | 1 | 4.5% |
Other values (12) | 12 |
Value | Count | Frequency (%) |
2168 | 1 | |
2298 | 1 | |
2590 | 1 | |
2780 | 1 | |
2999 | 1 | |
4093 | 1 | |
4436 | 1 | |
5490 | 1 | |
5739 | 1 | |
7668 | 1 |
Value | Count | Frequency (%) |
53277 | 1 | |
40831 | 1 | |
18133 | 1 | |
16448 | 1 | |
15911 | 1 | |
13146 | 1 | |
12734 | 1 | |
11976 | 1 | |
10063 | 1 | |
9998 | 1 |
전체세대수
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 22 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4633.2273 |
Minimum | 867 |
---|---|
Maximum | 20388 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 330.0 B |
Quantile statistics
Minimum | 867 |
---|---|
5-th percentile | 922.85 |
Q1 | 1606.25 |
median | 3567 |
Q3 | 5016.5 |
95-th percentile | 15878.05 |
Maximum | 20388 |
Range | 19521 |
Interquartile range (IQR) | 3410.25 |
Descriptive statistics
Standard deviation | 4871.1808 |
---|---|
Coefficient of variation (CV) | 1.051358 |
Kurtosis | 5.6977552 |
Mean | 4633.2273 |
Median Absolute Deviation (MAD) | 1927.5 |
Skewness | 2.3609888 |
Sum | 101931 |
Variance | 23728402 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
16332 | 1 | 4.5% |
20388 | 1 | 4.5% |
996 | 1 | 4.5% |
2207 | 1 | 4.5% |
1706 | 1 | 4.5% |
4606 | 1 | 4.5% |
2196 | 1 | 4.5% |
7253 | 1 | 4.5% |
3999 | 1 | 4.5% |
867 | 1 | 4.5% |
Other values (12) | 12 |
Value | Count | Frequency (%) |
867 | 1 | |
919 | 1 | |
996 | 1 | |
1112 | 1 | |
1154 | 1 | |
1573 | 1 | |
1706 | 1 | |
2196 | 1 | |
2207 | 1 | |
3066 | 1 |
Value | Count | Frequency (%) |
20388 | 1 | |
16332 | 1 | |
7253 | 1 | |
6325 | 1 | |
6119 | 1 | |
5056 | 1 | |
4898 | 1 | |
4606 | 1 | |
4025 | 1 | |
3999 | 1 |
담당부서
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 13.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
도시개발과 | |
---|---|
도시계획과 | |
미래첨단산업과 | 1 |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 5.0909091 |
Min length | 5 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 4.5% |
Sample
1st row | 미래첨단산업과 |
---|---|
2nd row | 도시개발과 |
3rd row | 도시개발과 |
4th row | 도시개발과 |
5th row | 도시개발과 |
Common Values
Value | Count | Frequency (%) |
도시개발과 | 17 | |
도시계획과 | 4 | 18.2% |
미래첨단산업과 | 1 | 4.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
도시개발과 | 17 | |
도시계획과 | 4 | 18.2% |
미래첨단산업과 | 1 | 4.5% |
지구명 | 공급구분 | 준공(예정) | 수용인구수 | 전체세대수 | 담당부서 | |
---|---|---|---|---|---|---|
지구명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
공급구분 | 1.000 | 1.000 | 1.000 | 0.800 | 0.800 | 0.000 |
준공(예정) | 1.000 | 1.000 | 1.000 | 0.699 | 0.699 | 0.669 |
수용인구수 | 1.000 | 0.800 | 0.699 | 1.000 | 1.000 | 0.923 |
전체세대수 | 1.000 | 0.800 | 0.699 | 1.000 | 1.000 | 0.923 |
담당부서 | 1.000 | 0.000 | 0.669 | 0.923 | 0.923 | 1.000 |
담당부서 | 공급구분 | |
---|---|---|
담당부서 | 1.000 | 0.000 |
공급구분 | 0.000 | 1.000 |
수용인구수 | 전체세대수 | 공급구분 | 담당부서 | |
---|---|---|---|---|
수용인구수 | 1.000 | 1.000 | 0.245 | 0.599 |
전체세대수 | 1.000 | 1.000 | 0.245 | 0.599 |
공급구분 | 0.245 | 0.245 | 1.000 | 0.000 |
담당부서 | 0.599 | 0.599 | 0.000 | 1.000 |
시군구 | 지구명 | 공급구분 | 준공(예정) | 수용인구수 | 전체세대수 | 담당부서 | |
---|---|---|---|---|---|---|---|
0 | 평택시 | 브레인시티 일반산업단지 | 민간 | 2024 | 40831 | 16332 | 미래첨단산업과 |
1 | 평택시 | 지제세교지구 | 민간 | 2026-12 | 16448 | 6325 | 도시개발과 |
2 | 평택시 | 동삭세교지구 | 민간 | 2024-12 | 2999 | 1154 | 도시개발과 |
3 | 평택시 | 수촌지구 | 민간 | 2028-12 | 9818 | 3746 | 도시개발과 |
4 | 평택시 | 영신지구 | 민간 | 2024-12 | 13146 | 5056 | 도시개발과 |
5 | 평택시 | 모산영신지구 | 민간 | 2024-06 | 15911 | 6119 | 도시개발과 |
6 | 평택시 | 송화2지구 | 민간 | 2030-12 | 10063 | 4025 | 도시개발과 |
7 | 평택시 | 가재지구 | 민간 | 2026-02 | 12734 | 4898 | 도시개발과 |
8 | 평택시 | 구룡지구 | 민간 | 2030-12 | 7668 | 3066 | 도시개발과 |
9 | 평택시 | 송북지구 | 민간 | 2026-02 | 2298 | 919 | 도시개발과 |
시군구 | 지구명 | 공급구분 | 준공(예정) | 수용인구수 | 전체세대수 | 담당부서 | |
---|---|---|---|---|---|---|---|
12 | 평택시 | 화양 | 민간 | 2025-08 | 53277 | 20388 | 도시개발과 |
13 | 평택시 | 송화 | 민간 | 2024-10 | 2780 | 1112 | 도시개발과 |
14 | 평택시 | 학현 | 공공 | 2023-10 | 2168 | 867 | 도시개발과 |
15 | 평택시 | 죽백1 | 민간 | 2026-12 | 9998 | 3999 | 도시개발과 |
16 | 평택시 | 현곡 | 민간+공공 | 2027-12 | 18133 | 7253 | 도시개발과 |
17 | 평택시 | 가곡2 | 민간+공공 | 2027-12 | 5490 | 2196 | 도시개발과 |
18 | 평택시 | 신촌지구 | 민간 | 2024 | 11976 | 4606 | 도시계획과 |
19 | 평택시 | 도곡2지구 | 민간 | 미정(주택건설사업계획 승인) | 4436 | 1706 | 도시계획과 |
20 | 평택시 | 갈곶지구 | 민간 | 미정(주택건설사업계획 승인) | 5739 | 2207 | 도시계획과 |
21 | 평택시 | 비전지구 | 민간 | 미정(주택건설사업계획 승인) | 2590 | 996 | 도시계획과 |