Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 7 |
Duplicate rows (%) | 0.1% |
Total size in memory | 654.3 KiB |
Average record size in memory | 67.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 1 |
Numeric | 3 |
Dataset
Description | 대전광역시 동구 개별주택가격정보에 관한 데이터로서,지번, 대지면적, 건물연면적, 건물구조 및 주택가격 등에 관한 정보를 포함하고 있습니다. |
---|---|
Author | 대전광역시 동구 |
URL | https://www.data.go.kr/data/15013449/fileData.do |
Dataset has 7 (0.1%) duplicate rows | Duplicates |
건물연면적 is highly overall correlated with 개별주택가격 | High correlation |
개별주택가격 is highly overall correlated with 건물연면적 | High correlation |
주택소재지 is highly overall correlated with 용도지역 | High correlation |
용도지역 is highly overall correlated with 주택소재지 | High correlation |
용도지역 is highly imbalanced (67.7%) | Imbalance |
대지면적 is highly skewed (γ1 = 50.82520388) | Skewed |
Reproduction
Analysis started | 2023-12-12 11:24:37.033405 |
---|---|
Analysis finished | 2023-12-12 11:24:39.822370 |
Duration | 2.79 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
주택소재지
Categorical
HIGH CORRELATION
 
Distinct | 43 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
가양동 | |
---|---|
삼성동 | |
자양동 | |
용운동 | |
대동 | |
Other values (38) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.8733 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 가양동 |
---|---|
2nd row | 자양동 |
3rd row | 장척동 |
4th row | 소제동 |
5th row | 삼성동 |
Common Values
Value | Count | Frequency (%) |
가양동 | 2074 | |
삼성동 | 916 | |
자양동 | 884 | |
용운동 | 796 | 8.0% |
대동 | 698 | 7.0% |
용전동 | 672 | 6.7% |
성남동 | 625 | 6.2% |
판암동 | 424 | 4.2% |
홍도동 | 394 | 3.9% |
소제동 | 351 | 3.5% |
Other values (33) | 2166 |
Length
Value | Count | Frequency (%) |
가양동 | 2074 | |
삼성동 | 916 | |
자양동 | 884 | |
용운동 | 796 | 8.0% |
대동 | 698 | 7.0% |
용전동 | 672 | 6.7% |
성남동 | 625 | 6.2% |
판암동 | 424 | 4.2% |
홍도동 | 394 | 3.9% |
소제동 | 351 | 3.5% |
Other values (33) | 2166 |
지번
Text
Distinct | 8156 |
---|---|
Distinct (%) | 81.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
10-4 | 14 | 0.1% |
104-1 | 11 | 0.1% |
10-19 | 9 | 0.1% |
389-1 | 8 | 0.1% |
60-1 | 8 | 0.1% |
97-3 | 7 | 0.1% |
40-1 | 6 | 0.1% |
14-4 | 6 | 0.1% |
142-1 | 5 | < 0.1% |
299-47 | 5 | < 0.1% |
Other values (8146) | 9921 |
Most occurring characters
Value | Count | Frequency (%) |
- | 10000 | |
1 | 8124 | |
2 | 5762 | |
3 | 5337 | |
4 | 4424 | |
5 | 3989 | 7.5% |
0 | 3652 | 6.9% |
9 | 3056 | 5.7% |
7 | 2978 | 5.6% |
6 | 2974 | 5.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 43209 | |
Dash Punctuation | 10000 | 18.8% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 8124 | |
2 | 5762 | |
3 | 5337 | |
4 | 4424 | |
5 | 3989 | |
0 | 3652 | |
9 | 3056 | 7.1% |
7 | 2978 | 6.9% |
6 | 2974 | 6.9% |
8 | 2913 | 6.7% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 53209 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 10000 | |
1 | 8124 | |
2 | 5762 | |
3 | 5337 | |
4 | 4424 | |
5 | 3989 | 7.5% |
0 | 3652 | 6.9% |
9 | 3056 | 5.7% |
7 | 2978 | 5.6% |
6 | 2974 | 5.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 53209 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 10000 | |
1 | 8124 | |
2 | 5762 | |
3 | 5337 | |
4 | 4424 | |
5 | 3989 | 7.5% |
0 | 3652 | 6.9% |
9 | 3056 | 5.7% |
7 | 2978 | 5.6% |
6 | 2974 | 5.6% |
대지면적
Real number (ℝ)
SKEWED
 
Distinct | 3029 |
---|---|
Distinct (%) | 30.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 792.00183 |
Minimum | 10.6 |
---|---|
Maximum | 1334568 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 10.6 |
---|---|
5-th percentile | 88.2 |
Q1 | 147.8 |
median | 193.7 |
Q3 | 265.4 |
95-th percentile | 621.81 |
Maximum | 1334568 |
Range | 1334557.4 |
Interquartile range (IQR) | 117.6 |
Descriptive statistics
Standard deviation | 18341.234 |
---|---|
Coefficient of variation (CV) | 23.158071 |
Kurtosis | 3137.6474 |
Mean | 792.00183 |
Median Absolute Deviation (MAD) | 53.7 |
Skewness | 50.825204 |
Sum | 7920018.3 |
Variance | 3.3640088 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
165.0 | 45 | 0.4% |
132.0 | 45 | 0.4% |
119.0 | 42 | 0.4% |
109.0 | 38 | 0.4% |
129.0 | 38 | 0.4% |
122.0 | 37 | 0.4% |
116.0 | 37 | 0.4% |
195.0 | 35 | 0.4% |
152.0 | 35 | 0.4% |
136.0 | 35 | 0.4% |
Other values (3019) | 9613 |
Value | Count | Frequency (%) |
10.6 | 1 | < 0.1% |
13.0 | 1 | < 0.1% |
13.2 | 4 | |
15.5 | 1 | < 0.1% |
16.8 | 1 | < 0.1% |
17.5 | 1 | < 0.1% |
18.5 | 1 | < 0.1% |
19.8 | 1 | < 0.1% |
20.0 | 3 | |
20.8 | 2 |
Value | Count | Frequency (%) |
1334568.0 | 1 | < 0.1% |
600992.0 | 1 | < 0.1% |
513119.0 | 3 | < 0.1% |
393168.0 | 1 | < 0.1% |
339405.0 | 2 | < 0.1% |
139185.0 | 1 | < 0.1% |
77885.0 | 1 | < 0.1% |
73062.0 | 3 | < 0.1% |
56459.0 | 1 | < 0.1% |
24119.0 | 8 |
건물연면적
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7996 |
---|---|
Distinct (%) | 80.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 195.46797 |
Minimum | 5 |
---|---|
Maximum | 3193.59 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 5 |
---|---|
5-th percentile | 38.7745 |
Q1 | 79.9575 |
median | 126.565 |
Q3 | 216.085 |
95-th percentile | 606.7915 |
Maximum | 3193.59 |
Range | 3188.59 |
Interquartile range (IQR) | 136.1275 |
Descriptive statistics
Standard deviation | 198.28586 |
---|---|
Coefficient of variation (CV) | 1.0144161 |
Kurtosis | 17.429879 |
Mean | 195.46797 |
Median Absolute Deviation (MAD) | 56.885 |
Skewness | 2.9947942 |
Sum | 1954679.7 |
Variance | 39317.282 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
26.45 | 18 | 0.2% |
26.4 | 15 | 0.1% |
45.61 | 12 | 0.1% |
42.98 | 9 | 0.1% |
49.59 | 9 | 0.1% |
33.06 | 9 | 0.1% |
66.12 | 9 | 0.1% |
46.28 | 9 | 0.1% |
59.5 | 8 | 0.1% |
56.2 | 8 | 0.1% |
Other values (7986) | 9894 |
Value | Count | Frequency (%) |
5.0 | 1 | |
5.6 | 1 | |
8.4 | 2 | |
9.5 | 1 | |
9.92 | 1 | |
10.45 | 1 | |
10.7 | 1 | |
11.0 | 2 | |
11.01 | 1 | |
11.4 | 1 |
Value | Count | Frequency (%) |
3193.59 | 1 | |
3149.16 | 1 | |
2142.24 | 1 | |
1844.53 | 1 | |
1621.74 | 1 | |
1612.4 | 1 | |
1497.84 | 1 | |
1478.13 | 1 | |
1471.11 | 1 | |
1468.23 | 1 |
용도지역
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
주거지역 | |
---|---|
자연환경보전지역 | 803 |
상업지역 | 402 |
개발제한구역 | 151 |
관리지역 | 107 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.3514 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 주거지역 |
---|---|
2nd row | 주거지역 |
3rd row | 개발제한구역 |
4th row | 주거지역 |
5th row | 주거지역 |
Common Values
Value | Count | Frequency (%) |
주거지역 | 8536 | |
자연환경보전지역 | 803 | 8.0% |
상업지역 | 402 | 4.0% |
개발제한구역 | 151 | 1.5% |
관리지역 | 107 | 1.1% |
녹지지역 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
주거지역 | 8536 | |
자연환경보전지역 | 803 | 8.0% |
상업지역 | 402 | 4.0% |
개발제한구역 | 151 | 1.5% |
관리지역 | 107 | 1.1% |
녹지지역 | 1 | < 0.1% |
건물구조
Categorical
Distinct | 20 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
연와 | |
---|---|
철근 | |
벽돌 | |
블록 | |
목 | |
Other values (15) |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 1.9264 |
Min length | 1 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 연와 |
---|---|
2nd row | 연와 |
3rd row | 경철 |
4th row | 벽돌 |
5th row | 연와 |
Common Values
Value | Count | Frequency (%) |
연와 | 3900 | |
철근 | 2303 | |
벽돌 | 1760 | |
블록 | 764 | 7.6% |
목 | 743 | 7.4% |
경철 | 234 | 2.3% |
석회 | 177 | 1.8% |
철골 | 46 | 0.5% |
목구 | 31 | 0.3% |
조판 | 14 | 0.1% |
Other values (10) | 28 | 0.3% |
Length
Value | Count | Frequency (%) |
연와 | 3900 | |
철근 | 2303 | |
벽돌 | 1760 | |
블록 | 764 | 7.6% |
목 | 743 | 7.4% |
경철 | 234 | 2.3% |
석회 | 177 | 1.8% |
철골 | 46 | 0.5% |
목구 | 31 | 0.3% |
조판 | 14 | 0.1% |
Other values (10) | 28 | 0.3% |
개별주택가격
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 1557 |
---|---|
Distinct (%) | 15.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.6621418 × 108 |
Minimum | 992000 |
---|---|
Maximum | 1.177 × 109 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 992000 |
---|---|
5-th percentile | 36000000 |
Q1 | 82600000 |
median | 1.18 × 108 |
Q3 | 1.81 × 108 |
95-th percentile | 4.65 × 108 |
Maximum | 1.177 × 109 |
Range | 1.176008 × 109 |
Interquartile range (IQR) | 98400000 |
Descriptive statistics
Standard deviation | 1.4799819 × 108 |
---|---|
Coefficient of variation (CV) | 0.89040652 |
Kurtosis | 6.932132 |
Mean | 1.6621418 × 108 |
Median Absolute Deviation (MAD) | 42700000 |
Skewness | 2.41107 |
Sum | 1.6621418 × 1012 |
Variance | 2.1903463 × 1016 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
107000000 | 82 | 0.8% |
104000000 | 79 | 0.8% |
103000000 | 78 | 0.8% |
118000000 | 77 | 0.8% |
102000000 | 77 | 0.8% |
114000000 | 73 | 0.7% |
110000000 | 73 | 0.7% |
111000000 | 72 | 0.7% |
100000000 | 71 | 0.7% |
124000000 | 70 | 0.7% |
Other values (1547) | 9248 |
Value | Count | Frequency (%) |
992000 | 1 | |
1000000 | 1 | |
1010000 | 1 | |
1070000 | 2 | |
1200000 | 1 | |
1390000 | 1 | |
1410000 | 1 | |
1520000 | 1 | |
1670000 | 1 | |
1690000 | 1 |
Value | Count | Frequency (%) |
1177000000 | 1 | |
1106000000 | 1 | |
1071000000 | 1 | |
1070000000 | 1 | |
1054000000 | 1 | |
1040000000 | 1 | |
1028000000 | 1 | |
1022000000 | 1 | |
1007000000 | 1 | |
1006000000 | 1 |
주택소재지 | 대지면적 | 건물연면적 | 용도지역 | 건물구조 | 개별주택가격 | |
---|---|---|---|---|---|---|
주택소재지 | 1.000 | 0.309 | 0.305 | 0.923 | 0.580 | 0.401 |
대지면적 | 0.309 | 1.000 | 0.000 | 0.242 | 0.085 | 0.000 |
건물연면적 | 0.305 | 0.000 | 1.000 | 0.131 | 0.577 | 0.614 |
용도지역 | 0.923 | 0.242 | 0.131 | 1.000 | 0.409 | 0.152 |
건물구조 | 0.580 | 0.085 | 0.577 | 0.409 | 1.000 | 0.663 |
개별주택가격 | 0.401 | 0.000 | 0.614 | 0.152 | 0.663 | 1.000 |
주택소재지 | 용도지역 | 건물구조 | |
---|---|---|---|
주택소재지 | 1.000 | 0.705 | 0.178 |
용도지역 | 0.705 | 1.000 | 0.203 |
건물구조 | 0.178 | 0.203 | 1.000 |
대지면적 | 건물연면적 | 개별주택가격 | 주택소재지 | 용도지역 | 건물구조 | |
---|---|---|---|---|---|---|
대지면적 | 1.000 | 0.402 | 0.475 | 0.137 | 0.090 | 0.039 |
건물연면적 | 0.402 | 1.000 | 0.619 | 0.121 | 0.073 | 0.272 |
개별주택가격 | 0.475 | 0.619 | 1.000 | 0.149 | 0.080 | 0.270 |
주택소재지 | 0.137 | 0.121 | 0.149 | 1.000 | 0.705 | 0.178 |
용도지역 | 0.090 | 0.073 | 0.080 | 0.705 | 1.000 | 0.203 |
건물구조 | 0.039 | 0.272 | 0.270 | 0.178 | 0.203 | 1.000 |
주택소재지 | 지번 | 대지면적 | 건물연면적 | 용도지역 | 건물구조 | 개별주택가격 | |
---|---|---|---|---|---|---|---|
9801 | 가양동 | 445-27 | 198.0 | 99.09 | 주거지역 | 연와 | 116000000 |
5509 | 자양동 | 188-14 | 118.5 | 136.01 | 주거지역 | 연와 | 103000000 |
17111 | 장척동 | 35-0 | 579.0 | 38.24 | 개발제한구역 | 경철 | 41000000 |
6430 | 소제동 | 299-151 | 228.0 | 51.5 | 주거지역 | 벽돌 | 199000000 |
14141 | 삼성동 | 314-10 | 252.9 | 225.43 | 주거지역 | 연와 | 193000000 |
15099 | 삼성동 | 396-17 | 153.4 | 80.32 | 주거지역 | 연와 | 137000000 |
17373 | 삼괴동 | 688-0 | 294.0 | 81.86 | 자연환경보전지역 | 목구 | 36000000 |
3233 | 용운동 | 700-0 | 244.0 | 451.49 | 주거지역 | 철근 | 369000000 |
5674 | 자양동 | 199-6 | 313.7 | 597.45 | 주거지역 | 철근 | 445000000 |
8638 | 가양동 | 317-21 | 173.7 | 172.23 | 주거지역 | 연와 | 134000000 |
주택소재지 | 지번 | 대지면적 | 건물연면적 | 용도지역 | 건물구조 | 개별주택가격 | |
---|---|---|---|---|---|---|---|
6630 | 소제동 | 305-209 | 99.0 | 58.48 | 주거지역 | 블록 | 74800000 |
154 | 인동 | 101-14 | 198.3 | 264.27 | 주거지역 | 벽돌 | 153000000 |
762 | 신흥동 | 12-1 | 165.4 | 143.4 | 주거지역 | 연와 | 110000000 |
6099 | 신안동 | 254-6 | 102.0 | 25.32 | 주거지역 | 목 | 93600000 |
13499 | 삼성동 | 100-12 | 218.0 | 119.6 | 주거지역 | 벽돌 | 241000000 |
7271 | 가양동 | 47-15 | 191.7 | 148.69 | 주거지역 | 연와 | 122000000 |
1794 | 용운동 | 178-6 | 222.1 | 548.18 | 주거지역 | 철근 | 326000000 |
13797 | 삼성동 | 282-6 | 106.4 | 136.72 | 상업지역 | 벽돌 | 29200000 |
3285 | 대동 | 1-458 | 83.0 | 102.6 | 주거지역 | 연와 | 61700000 |
1612 | 판암동 | 630-6 | 615.0 | 47.58 | 자연환경보전지역 | 철골 | 206000000 |
Most frequently occurring
주택소재지 | 지번 | 대지면적 | 건물연면적 | 용도지역 | 건물구조 | 개별주택가격 | # duplicates | |
---|---|---|---|---|---|---|---|---|
1 | 삼성동 | 389-1 | 310.7 | 50.0 | 주거지역 | 철근 | 20800000 | 4 |
2 | 삼성동 | 389-1 | 310.7 | 53.6 | 주거지역 | 철근 | 21100000 | 3 |
6 | 자양동 | 97-3 | 479.1 | 22.3 | 주거지역 | 블록 | 37100000 | 3 |
0 | 대별동 | 284-1 | 1884.0 | 29.75 | 자연환경보전지역 | 목 | 42100000 | 2 |
3 | 신안동 | 245-15 | 109.0 | 28.8 | 주거지역 | 블록 | 92800000 | 2 |
4 | 인동 | 40-1 | 162.6 | 66.12 | 상업지역 | 목 | 29200000 | 2 |
5 | 자양동 | 281-41 | 218.0 | 70.72 | 주거지역 | 벽돌 | 81900000 | 2 |