Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 27 |
Missing cells | 3 |
Missing cells (%) | 1.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.4 KiB |
Average record size in memory | 53.9 B |
Variable types
Text | 2 |
---|---|
Numeric | 1 |
DateTime | 1 |
Categorical | 2 |
Dataset
Description | 경기주택도시공사 경기도 행복주택 현황 |
---|---|
Author | 경기주택도시공사 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=QTK09GUQ7B70TW8QCWRV30324653&infSeq=1 |
Reproduction
Analysis started | 2024-03-23 02:37:12.622745 |
---|---|
Analysis finished | 2024-03-23 02:37:13.951364 |
Duration | 1.33 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
사업지구명
Text
UNIQUE
 
Distinct | 27 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 348.0 B |
Value | Count | Frequency (%) |
화성 | 2 | 4.2% |
광교 | 2 | 4.2% |
bix | 2 | 4.2% |
양평 | 2 | 4.2% |
수원 | 2 | 4.2% |
고덕 | 1 | 2.1% |
남한강 | 1 | 2.1% |
연천 | 1 | 2.1% |
용인영덕(중고층 | 1 | 2.1% |
모듈러 | 1 | 2.1% |
Other values (33) | 33 |
Most occurring characters
Value | Count | Frequency (%) |
21 | 13.0% | |
원 | 6 | 3.7% |
평 | 4 | 2.5% |
성 | 4 | 2.5% |
안 | 4 | 2.5% |
2 | 4 | 2.5% |
역 | 4 | 2.5% |
산 | 4 | 2.5% |
남 | 4 | 2.5% |
양 | 4 | 2.5% |
Other values (68) | 102 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 120 | |
Space Separator | 21 | 13.0% |
Decimal Number | 9 | 5.6% |
Uppercase Letter | 9 | 5.6% |
Close Punctuation | 1 | 0.6% |
Open Punctuation | 1 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
원 | 6 | 5.0% |
평 | 4 | 3.3% |
성 | 4 | 3.3% |
안 | 4 | 3.3% |
역 | 4 | 3.3% |
산 | 4 | 3.3% |
남 | 4 | 3.3% |
양 | 4 | 3.3% |
교 | 4 | 3.3% |
광 | 3 | 2.5% |
Other values (57) | 79 |
Decimal Number
Value | Count | Frequency (%) |
2 | 4 | |
1 | 2 | |
5 | 2 | |
0 | 1 | 11.1% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 3 | |
B | 2 | |
I | 2 | |
X | 2 |
Space Separator
Value | Count | Frequency (%) |
21 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 120 | |
Common | 32 | 19.9% |
Latin | 9 | 5.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
원 | 6 | 5.0% |
평 | 4 | 3.3% |
성 | 4 | 3.3% |
안 | 4 | 3.3% |
역 | 4 | 3.3% |
산 | 4 | 3.3% |
남 | 4 | 3.3% |
양 | 4 | 3.3% |
교 | 4 | 3.3% |
광 | 3 | 2.5% |
Other values (57) | 79 |
Common
Value | Count | Frequency (%) |
21 | ||
2 | 4 | 12.5% |
1 | 2 | 6.2% |
5 | 2 | 6.2% |
) | 1 | 3.1% |
( | 1 | 3.1% |
0 | 1 | 3.1% |
Latin
Value | Count | Frequency (%) |
A | 3 | |
B | 2 | |
I | 2 | |
X | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 120 | |
ASCII | 41 | 25.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
21 | ||
2 | 4 | 9.8% |
A | 3 | 7.3% |
1 | 2 | 4.9% |
B | 2 | 4.9% |
5 | 2 | 4.9% |
I | 2 | 4.9% |
X | 2 | 4.9% |
) | 1 | 2.4% |
( | 1 | 2.4% |
Hangul
Value | Count | Frequency (%) |
원 | 6 | 5.0% |
평 | 4 | 3.3% |
성 | 4 | 3.3% |
안 | 4 | 3.3% |
역 | 4 | 3.3% |
산 | 4 | 3.3% |
남 | 4 | 3.3% |
양 | 4 | 3.3% |
교 | 4 | 3.3% |
광 | 3 | 2.5% |
Other values (57) | 79 |
위치정보
Text
UNIQUE
 
Distinct | 27 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 348.0 B |
Length
Max length | 31 |
---|---|
Median length | 24 |
Mean length | 20.333333 |
Min length | 14 |
Characters and Unicode
Total characters | 549 |
---|---|
Distinct characters | 106 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 27 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 경기도 평택시 포승읍 황해희곡6로 36 |
---|---|
2nd row | 경기도 수원시 영통구 광교중앙로49번길 40 |
3rd row | 경기도 화성시 동탄순환대로10길 20 |
4th row | 경기도 성남시 분당구 판교로319번길 14 |
5th row | 경기도 오산시 가장산업동로 38 |
Value | Count | Frequency (%) |
경기도 | 27 | 21.4% |
화성시 | 4 | 3.2% |
성남시 | 3 | 2.4% |
수원시 | 3 | 2.4% |
영통구 | 3 | 2.4% |
38 | 2 | 1.6% |
남양주시 | 2 | 1.6% |
평택시 | 2 | 1.6% |
40 | 2 | 1.6% |
용인시 | 2 | 1.6% |
Other values (73) | 76 |
Most occurring characters
Value | Count | Frequency (%) |
99 | 18.0% | |
도 | 28 | 5.1% |
기 | 28 | 5.1% |
경 | 27 | 4.9% |
시 | 25 | 4.6% |
1 | 24 | 4.4% |
로 | 18 | 3.3% |
0 | 15 | 2.7% |
4 | 15 | 2.7% |
구 | 11 | 2.0% |
Other values (96) | 259 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 333 | |
Decimal Number | 103 | 18.8% |
Space Separator | 99 | 18.0% |
Uppercase Letter | 6 | 1.1% |
Dash Punctuation | 5 | 0.9% |
Open Punctuation | 1 | 0.2% |
Close Punctuation | 1 | 0.2% |
Other Punctuation | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 28 | 8.4% |
기 | 28 | 8.4% |
경 | 27 | 8.1% |
시 | 25 | 7.5% |
로 | 18 | 5.4% |
구 | 11 | 3.3% |
동 | 11 | 3.3% |
길 | 9 | 2.7% |
평 | 8 | 2.4% |
성 | 8 | 2.4% |
Other values (76) | 160 |
Decimal Number
Value | Count | Frequency (%) |
1 | 24 | |
0 | 15 | |
4 | 15 | |
3 | 10 | |
9 | 9 | 8.7% |
7 | 7 | 6.8% |
2 | 7 | 6.8% |
8 | 6 | 5.8% |
6 | 6 | 5.8% |
5 | 4 | 3.9% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 2 | |
I | 1 | |
X | 1 | |
A | 1 | |
L | 1 |
Space Separator
Value | Count | Frequency (%) |
99 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 333 | |
Common | 210 | |
Latin | 6 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 28 | 8.4% |
기 | 28 | 8.4% |
경 | 27 | 8.1% |
시 | 25 | 7.5% |
로 | 18 | 5.4% |
구 | 11 | 3.3% |
동 | 11 | 3.3% |
길 | 9 | 2.7% |
평 | 8 | 2.4% |
성 | 8 | 2.4% |
Other values (76) | 160 |
Common
Value | Count | Frequency (%) |
99 | ||
1 | 24 | 11.4% |
0 | 15 | 7.1% |
4 | 15 | 7.1% |
3 | 10 | 4.8% |
9 | 9 | 4.3% |
7 | 7 | 3.3% |
2 | 7 | 3.3% |
8 | 6 | 2.9% |
6 | 6 | 2.9% |
Other values (5) | 12 | 5.7% |
Latin
Value | Count | Frequency (%) |
B | 2 | |
I | 1 | |
X | 1 | |
A | 1 | |
L | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 333 | |
ASCII | 216 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
99 | ||
1 | 24 | 11.1% |
0 | 15 | 6.9% |
4 | 15 | 6.9% |
3 | 10 | 4.6% |
9 | 9 | 4.2% |
7 | 7 | 3.2% |
2 | 7 | 3.2% |
8 | 6 | 2.8% |
6 | 6 | 2.8% |
Other values (10) | 18 | 8.3% |
Hangul
Value | Count | Frequency (%) |
도 | 28 | 8.4% |
기 | 28 | 8.4% |
경 | 27 | 8.1% |
시 | 25 | 7.5% |
로 | 18 | 5.4% |
구 | 11 | 3.3% |
동 | 11 | 3.3% |
길 | 9 | 2.7% |
평 | 8 | 2.4% |
성 | 8 | 2.4% |
Other values (76) | 160 |
공급세대수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 81.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 348.62963 |
Minimum | 14 |
---|---|
Maximum | 2078 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 375.0 B |
Quantile statistics
Minimum | 14 |
---|---|
5-th percentile | 15.3 |
Q1 | 50 |
median | 106 |
Q3 | 315 |
95-th percentile | 1348.5 |
Maximum | 2078 |
Range | 2064 |
Interquartile range (IQR) | 265 |
Descriptive statistics
Standard deviation | 505.90354 |
---|---|
Coefficient of variation (CV) | 1.4511203 |
Kurtosis | 4.8916296 |
Mean | 348.62963 |
Median Absolute Deviation (MAD) | 91 |
Skewness | 2.2211786 |
Sum | 9413 |
Variance | 255938.4 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
50 | 3 | 11.1% |
300 | 3 | 11.1% |
100 | 2 | 7.4% |
330 | 1 | 3.7% |
1500 | 1 | 3.7% |
232 | 1 | 3.7% |
500 | 1 | 3.7% |
131 | 1 | 3.7% |
2078 | 1 | 3.7% |
800 | 1 | 3.7% |
Other values (12) | 12 |
Value | Count | Frequency (%) |
14 | 1 | 3.7% |
15 | 1 | 3.7% |
16 | 1 | 3.7% |
40 | 1 | 3.7% |
42 | 1 | 3.7% |
49 | 1 | 3.7% |
50 | 3 | |
56 | 1 | 3.7% |
85 | 1 | 3.7% |
100 | 2 |
Value | Count | Frequency (%) |
2078 | 1 | 3.7% |
1500 | 1 | 3.7% |
995 | 1 | 3.7% |
970 | 1 | 3.7% |
800 | 1 | 3.7% |
500 | 1 | 3.7% |
330 | 1 | 3.7% |
300 | 3 | |
232 | 1 | 3.7% |
204 | 1 | 3.7% |
준공일자
Date
MISSING
 
Distinct | 23 |
---|---|
Distinct (%) | 95.8% |
Missing | 3 |
Missing (%) | 11.1% |
Memory size | 348.0 B |
Minimum | 2017-12-21 00:00:00 |
---|---|
Maximum | 2023-05-04 00:00:00 |
유형
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 18.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 348.0 B |
청년 | |
---|---|
신혼부부 | |
산업단지형 | |
실버형 | 1 |
청년, 대학생, 신혼부부 등 | 1 |
Length
Max length | 15 |
---|---|
Median length | 5 |
Mean length | 3.8518519 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 7.4% |
Sample
1st row | 산업단지형 |
---|---|
2nd row | 청년 |
3rd row | 신혼부부 |
4th row | 산업단지형 |
5th row | 산업단지형 |
Common Values
Value | Count | Frequency (%) |
청년 | 10 | |
신혼부부 | 9 | |
산업단지형 | 6 | |
실버형 | 1 | 3.7% |
청년, 대학생, 신혼부부 등 | 1 | 3.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
청년 | 11 | |
신혼부부 | 10 | |
산업단지형 | 6 | |
실버형 | 1 | 3.3% |
대학생 | 1 | 3.3% |
등 | 1 | 3.3% |
데이터기준일자
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 348.0 B |
2024-03-05 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2024-03-05 |
---|---|
2nd row | 2024-03-05 |
3rd row | 2024-03-05 |
4th row | 2024-03-05 |
5th row | 2024-03-05 |
Common Values
Value | Count | Frequency (%) |
2024-03-05 | 27 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2024-03-05 | 27 |
사업지구명 | 위치정보 | 공급세대수 | 준공일자 | 유형 | |
---|---|---|---|---|---|
사업지구명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
위치정보 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
공급세대수 | 1.000 | 1.000 | 1.000 | 1.000 | 0.701 |
준공일자 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
유형 | 1.000 | 1.000 | 0.701 | 1.000 | 1.000 |
공급세대수 | 유형 | |
---|---|---|
공급세대수 | 1.000 | 0.518 |
유형 | 0.518 | 1.000 |
사업지구명 | 위치정보 | 공급세대수 | 준공일자 | 유형 | 데이터기준일자 | |
---|---|---|---|---|---|---|
0 | 평택 BIX | 경기도 평택시 포승읍 황해희곡6로 36 | 330 | 2021-04-30 | 산업단지형 | 2024-03-05 |
1 | 광교 원천 | 경기도 수원시 영통구 광교중앙로49번길 40 | 300 | 2020-10-27 | 청년 | 2024-03-05 |
2 | 동탄 호수공원 | 경기도 화성시 동탄순환대로10길 20 | 995 | 2020-10-16 | 신혼부부 | 2024-03-05 |
3 | 성남 판교 | 경기도 성남시 분당구 판교로319번길 14 | 300 | 2020-08-10 | 산업단지형 | 2024-03-05 |
4 | 오산 가장 | 경기도 오산시 가장산업동로 38 | 50 | 2020-02-04 | 산업단지형 | 2024-03-05 |
5 | 의왕역 | 경기도 의왕시 부곡시장1길 38 | 50 | 2020-01-22 | 청년 | 2024-03-05 |
6 | 다산역A2 | 경기도 남양주시 다산중앙로145번길 36 | 970 | 2019-09-02 | 신혼부부 | 2024-03-05 |
7 | 파주병원복합 | 경기도 파주시 황골로 90 | 50 | 2019-08-22 | 실버형 | 2024-03-05 |
8 | 성남하대원 | 경기도 성남시 중원구 둔촌대로217번길 4 | 14 | 2019-06-26 | 청년 | 2024-03-05 |
9 | 가평청사복합 | 경기도 가평군 가평읍 석봉로191번길 10 | 42 | 2019-06-17 | 청년 | 2024-03-05 |
사업지구명 | 위치정보 | 공급세대수 | 준공일자 | 유형 | 데이터기준일자 | |
---|---|---|---|---|---|---|
17 | 양평 남한강 | 경기도 양평군 창대리 701, 700-3 | 49 | <NA> | 신혼부부 | 2024-03-05 |
18 | 연천 BIX | 경기도 연천군 통현리 812번지(연천BIX 주거1) | 100 | <NA> | 산업단지형 | 2024-03-05 |
19 | 용인영덕(중고층 모듈러) | 경기도 용인시 기흥구 흥덕2로 13 | 106 | 2023-05-04 | 청년 | 2024-03-05 |
20 | 용인 죽전 | 경기도 용인시 수지구 죽전동 494-5 | 85 | 2022-08-01 | 청년 | 2024-03-05 |
21 | 고덕 서정리역 | 경기도 평택시 고덕갈평3로 40 | 800 | 2022-05-31 | 신혼부부 | 2024-03-05 |
22 | 다산지금 A5 | 경기도 남양주시 다산동 6110 | 2078 | 2022-04-01 | 신혼부부 | 2024-03-05 |
23 | 판교2밸리 | 경기도 성남시 수정구 금토동 411-6 | 300 | 2022-01-01 | 산업단지형 | 2024-03-05 |
24 | 하남 덕풍 | 경기도 하남시 덕풍동로 35 | 131 | 2021-12-01 | 신혼부부 | 2024-03-05 |
25 | 경기 광주역 | 경기도 광주시 역동 169-11 | 500 | 2021-11-01 | 신혼부부 | 2024-03-05 |
26 | 안산 스마트허브 | 경기도 안산시 단원구 산단로 94 | 232 | 2021-04-30 | 산업단지형 | 2024-03-05 |