Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2859 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 9 |
Duplicate rows (%) | 0.3% |
Total size in memory | 162.1 KiB |
Average record size in memory | 58.0 B |
Variable types
Numeric | 2 |
---|---|
Text | 2 |
Categorical | 2 |
DateTime | 1 |
Dataset
Description | 대구광역시 달서구 다가구(원룸 등) 및 오피스텔에 대한 정보가 담겨져 있음. (건물위치, 건물명, 주택유형구분 등) |
---|---|
URL | https://www.data.go.kr/data/15083651/fileData.do |
관리부서 has constant value "" | Constant |
기준일자 has constant value "" | Constant |
Dataset has 9 (0.3%) duplicate rows | Duplicates |
주택유형구분 is highly imbalanced (80.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 06:22:30.254091 |
---|---|
Analysis finished | 2023-12-12 06:22:31.309842 |
Duration | 1.06 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
위도
Real number (ℝ)
Distinct | 2842 |
---|---|
Distinct (%) | 99.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 35.839743 |
Minimum | 35.795295 |
---|---|
Maximum | 35.86237 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.3 KiB |
Quantile statistics
Minimum | 35.795295 |
---|---|
5-th percentile | 35.810778 |
Q1 | 35.825754 |
median | 35.847092 |
Q3 | 35.854701 |
95-th percentile | 35.858711 |
Maximum | 35.86237 |
Range | 0.0670752 |
Interquartile range (IQR) | 0.02894697 |
Descriptive statistics
Standard deviation | 0.01727279 |
---|---|
Coefficient of variation (CV) | 0.00048194514 |
Kurtosis | -1.1045649 |
Mean | 35.839743 |
Median Absolute Deviation (MAD) | 0.01057398 |
Skewness | -0.56380801 |
Sum | 102465.83 |
Variance | 0.00029834927 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
35.81414772 | 4 | 0.1% |
35.85237557 | 2 | 0.1% |
35.8082206 | 2 | 0.1% |
35.85786245 | 2 | 0.1% |
35.84742143 | 2 | 0.1% |
35.80834461 | 2 | 0.1% |
35.84266783 | 2 | 0.1% |
35.84415123 | 2 | 0.1% |
35.84751293 | 2 | 0.1% |
35.84335415 | 2 | 0.1% |
Other values (2832) | 2837 |
Value | Count | Frequency (%) |
35.79529475 | 1 | |
35.7953767 | 1 | |
35.79567408 | 1 | |
35.79580085 | 1 | |
35.79582701 | 1 | |
35.79601721 | 1 | |
35.79617881 | 1 | |
35.79635006 | 1 | |
35.79635075 | 1 | |
35.79650392 | 1 |
Value | Count | Frequency (%) |
35.86236995 | 1 | |
35.86224035 | 1 | |
35.8618726 | 1 | |
35.86183268 | 1 | |
35.86182437 | 1 | |
35.86178888 | 1 | |
35.86178038 | 1 | |
35.86171778 | 1 | |
35.86164593 | 1 | |
35.86161632 | 1 |
경도
Real number (ℝ)
Distinct | 2840 |
---|---|
Distinct (%) | 99.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 128.5333 |
Minimum | 128.47579 |
---|---|
Maximum | 128.57371 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.3 KiB |
Quantile statistics
Minimum | 128.47579 |
---|---|
5-th percentile | 128.49283 |
Q1 | 128.52191 |
median | 128.53777 |
Q3 | 128.55035 |
95-th percentile | 128.56332 |
Maximum | 128.57371 |
Range | 0.0979276 |
Interquartile range (IQR) | 0.02844535 |
Descriptive statistics
Standard deviation | 0.022881447 |
---|---|
Coefficient of variation (CV) | 0.0001780196 |
Kurtosis | -0.36571344 |
Mean | 128.5333 |
Median Absolute Deviation (MAD) | 0.013252 |
Skewness | -0.716305 |
Sum | 367476.7 |
Variance | 0.0005235606 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
128.5189692 | 4 | 0.1% |
128.4898478 | 2 | 0.1% |
128.5418486 | 2 | 0.1% |
128.5057673 | 2 | 0.1% |
128.5118268 | 2 | 0.1% |
128.5536263 | 2 | 0.1% |
128.4994467 | 2 | 0.1% |
128.5544732 | 2 | 0.1% |
128.4976865 | 2 | 0.1% |
128.5123366 | 2 | 0.1% |
Other values (2830) | 2837 |
Value | Count | Frequency (%) |
128.475786 | 1 | |
128.4763038 | 1 | |
128.4764707 | 1 | |
128.4766956 | 1 | |
128.476768 | 1 | |
128.476778 | 1 | |
128.4768245 | 1 | |
128.4768395 | 1 | |
128.4769436 | 1 | |
128.4769814 | 1 |
Value | Count | Frequency (%) |
128.5737136 | 1 | |
128.5735008 | 1 | |
128.573494 | 1 | |
128.57347 | 1 | |
128.5734581 | 1 | |
128.5734564 | 1 | |
128.5734407 | 1 | |
128.5733649 | 1 | |
128.5732246 | 1 | |
128.5731269 | 1 |
건물위치
Text
Distinct | 2842 |
---|---|
Distinct (%) | 99.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.5 KiB |
Length
Max length | 25 |
---|---|
Median length | 24 |
Mean length | 19.710738 |
Min length | 16 |
Characters and Unicode
Total characters | 56353 |
---|---|
Distinct characters | 53 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 2827 ? |
---|---|
Unique (%) | 98.9% |
Sample
1st row | 대구광역시 달서구 성당동 54-19 |
---|---|
2nd row | 대구광역시 달서구 성당동 55-3 |
3rd row | 대구광역시 달서구 성당동 55-13 |
4th row | 대구광역시 달서구 성당동 56-21 |
5th row | 대구광역시 달서구 성당동 384-6 |
Value | Count | Frequency (%) |
대구광역시 | 2859 | |
달서구 | 2859 | |
송현동 | 504 | 4.4% |
신당동 | 334 | 2.9% |
두류동 | 317 | 2.8% |
상인동 | 305 | 2.7% |
감삼동 | 301 | 2.6% |
진천동 | 202 | 1.8% |
성당동 | 170 | 1.5% |
이곡동 | 141 | 1.2% |
Other values (2787) | 3448 |
Most occurring characters
Value | Count | Frequency (%) |
8581 | ||
구 | 5718 | 10.1% |
1 | 3186 | 5.7% |
대 | 2926 | 5.2% |
광 | 2859 | 5.1% |
역 | 2859 | 5.1% |
시 | 2859 | 5.1% |
달 | 2859 | 5.1% |
서 | 2859 | 5.1% |
동 | 2859 | 5.1% |
Other values (43) | 18788 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31409 | |
Decimal Number | 13507 | |
Space Separator | 8581 | 15.2% |
Dash Punctuation | 2856 | 5.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 5718 | |
대 | 2926 | |
광 | 2859 | |
역 | 2859 | |
시 | 2859 | |
달 | 2859 | |
서 | 2859 | |
동 | 2859 | |
현 | 504 | 1.6% |
송 | 504 | 1.6% |
Other values (31) | 4603 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3186 | |
2 | 1507 | |
0 | 1254 | 9.3% |
3 | 1230 | 9.1% |
4 | 1172 | 8.7% |
7 | 1089 | 8.1% |
8 | 1073 | 7.9% |
6 | 1015 | 7.5% |
5 | 1012 | 7.5% |
9 | 969 | 7.2% |
Space Separator
Value | Count | Frequency (%) |
8581 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2856 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31409 | |
Common | 24944 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 5718 | |
대 | 2926 | |
광 | 2859 | |
역 | 2859 | |
시 | 2859 | |
달 | 2859 | |
서 | 2859 | |
동 | 2859 | |
현 | 504 | 1.6% |
송 | 504 | 1.6% |
Other values (31) | 4603 |
Common
Value | Count | Frequency (%) |
8581 | ||
1 | 3186 | 12.8% |
- | 2856 | 11.4% |
2 | 1507 | 6.0% |
0 | 1254 | 5.0% |
3 | 1230 | 4.9% |
4 | 1172 | 4.7% |
7 | 1089 | 4.4% |
8 | 1073 | 4.3% |
6 | 1015 | 4.1% |
Other values (2) | 1981 | 7.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31409 | |
ASCII | 24944 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
8581 | ||
1 | 3186 | 12.8% |
- | 2856 | 11.4% |
2 | 1507 | 6.0% |
0 | 1254 | 5.0% |
3 | 1230 | 4.9% |
4 | 1172 | 4.7% |
7 | 1089 | 4.4% |
8 | 1073 | 4.3% |
6 | 1015 | 4.1% |
Other values (2) | 1981 | 7.9% |
Hangul
Value | Count | Frequency (%) |
구 | 5718 | |
대 | 2926 | |
광 | 2859 | |
역 | 2859 | |
시 | 2859 | |
달 | 2859 | |
서 | 2859 | |
동 | 2859 | |
현 | 504 | 1.6% |
송 | 504 | 1.6% |
Other values (31) | 4603 |
건물명
Text
Distinct | 1707 |
---|---|
Distinct (%) | 59.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.5 KiB |
Value | Count | Frequency (%) |
무명 | 680 | 23.1% |
단독주택 | 17 | 0.6% |
리치빌 | 12 | 0.4% |
해피하우스 | 11 | 0.4% |
로즈빌 | 8 | 0.3% |
베네치아 | 8 | 0.3% |
행복빌 | 7 | 0.2% |
다온빌 | 7 | 0.2% |
아이파크 | 7 | 0.2% |
에이스빌 | 7 | 0.2% |
Other values (1736) | 2175 |
Most occurring characters
Value | Count | Frequency (%) |
빌 | 956 | 7.8% |
명 | 731 | 5.9% |
( | 695 | 5.6% |
) | 695 | 5.6% |
무 | 689 | 5.6% |
스 | 511 | 4.1% |
라 | 350 | 2.8% |
하 | 320 | 2.6% |
리 | 274 | 2.2% |
이 | 251 | 2.0% |
Other values (503) | 6853 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 10498 | |
Open Punctuation | 695 | 5.6% |
Close Punctuation | 695 | 5.6% |
Uppercase Letter | 181 | 1.5% |
Decimal Number | 120 | 1.0% |
Space Separator | 83 | 0.7% |
Lowercase Letter | 28 | 0.2% |
Dash Punctuation | 16 | 0.1% |
Other Punctuation | 9 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
빌 | 956 | 9.1% |
명 | 731 | 7.0% |
무 | 689 | 6.6% |
스 | 511 | 4.9% |
라 | 350 | 3.3% |
하 | 320 | 3.0% |
리 | 274 | 2.6% |
이 | 251 | 2.4% |
우 | 212 | 2.0% |
아 | 188 | 1.8% |
Other values (451) | 6016 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 36 | |
S | 22 | |
A | 16 | 8.8% |
B | 14 | 7.7% |
E | 10 | 5.5% |
H | 10 | 5.5% |
L | 9 | 5.0% |
J | 9 | 5.0% |
T | 8 | 4.4% |
K | 7 | 3.9% |
Other values (12) | 40 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 6 | |
s | 4 | |
o | 3 | |
b | 2 | 7.1% |
t | 2 | 7.1% |
k | 2 | 7.1% |
h | 2 | 7.1% |
c | 1 | 3.6% |
u | 1 | 3.6% |
i | 1 | 3.6% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
1 | 29 | |
2 | 25 | |
3 | 14 | |
0 | 11 | 9.2% |
4 | 9 | 7.5% |
8 | 8 | 6.7% |
5 | 8 | 6.7% |
6 | 7 | 5.8% |
9 | 6 | 5.0% |
7 | 3 | 2.5% |
Other Punctuation
Value | Count | Frequency (%) |
. | 5 | |
& | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 695 |
Close Punctuation
Value | Count | Frequency (%) |
) | 695 |
Space Separator
Value | Count | Frequency (%) |
83 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 16 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 10498 | |
Common | 1618 | 13.1% |
Latin | 209 | 1.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
빌 | 956 | 9.1% |
명 | 731 | 7.0% |
무 | 689 | 6.6% |
스 | 511 | 4.9% |
라 | 350 | 3.3% |
하 | 320 | 3.0% |
리 | 274 | 2.6% |
이 | 251 | 2.4% |
우 | 212 | 2.0% |
아 | 188 | 1.8% |
Other values (451) | 6016 |
Latin
Value | Count | Frequency (%) |
I | 36 | |
S | 22 | 10.5% |
A | 16 | 7.7% |
B | 14 | 6.7% |
E | 10 | 4.8% |
H | 10 | 4.8% |
L | 9 | 4.3% |
J | 9 | 4.3% |
T | 8 | 3.8% |
K | 7 | 3.3% |
Other values (26) | 68 |
Common
Value | Count | Frequency (%) |
( | 695 | |
) | 695 | |
83 | 5.1% | |
1 | 29 | 1.8% |
2 | 25 | 1.5% |
- | 16 | 1.0% |
3 | 14 | 0.9% |
0 | 11 | 0.7% |
4 | 9 | 0.6% |
8 | 8 | 0.5% |
Other values (6) | 33 | 2.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 10498 | |
ASCII | 1827 | 14.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
빌 | 956 | 9.1% |
명 | 731 | 7.0% |
무 | 689 | 6.6% |
스 | 511 | 4.9% |
라 | 350 | 3.3% |
하 | 320 | 3.0% |
리 | 274 | 2.6% |
이 | 251 | 2.4% |
우 | 212 | 2.0% |
아 | 188 | 1.8% |
Other values (451) | 6016 |
ASCII
Value | Count | Frequency (%) |
( | 695 | |
) | 695 | |
83 | 4.5% | |
I | 36 | 2.0% |
1 | 29 | 1.6% |
2 | 25 | 1.4% |
S | 22 | 1.2% |
- | 16 | 0.9% |
A | 16 | 0.9% |
3 | 14 | 0.8% |
Other values (42) | 196 | 10.7% |
주택유형구분
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.5 KiB |
다가구주택 | |
---|---|
오피스텔 | 88 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.96922 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 다가구주택 |
---|---|
2nd row | 다가구주택 |
3rd row | 다가구주택 |
4th row | 다가구주택 |
5th row | 다가구주택 |
Common Values
Value | Count | Frequency (%) |
다가구주택 | 2771 | |
오피스텔 | 88 | 3.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
다가구주택 | 2771 | |
오피스텔 | 88 | 3.1% |
관리부서
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.5 KiB |
건축과 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 건축과 |
---|---|
2nd row | 건축과 |
3rd row | 건축과 |
4th row | 건축과 |
5th row | 건축과 |
Common Values
Value | Count | Frequency (%) |
건축과 | 2859 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
건축과 | 2859 |
기준일자
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.5 KiB |
Minimum | 2022-12-31 00:00:00 |
---|---|
Maximum | 2022-12-31 00:00:00 |
위도 | 경도 | 주택유형구분 | |
---|---|---|---|
위도 | 1.000 | 0.795 | 0.344 |
경도 | 0.795 | 1.000 | 0.210 |
주택유형구분 | 0.344 | 0.210 | 1.000 |
위도 | 경도 | 주택유형구분 | |
---|---|---|---|
위도 | 1.000 | -0.096 | 0.264 |
경도 | -0.096 | 1.000 | 0.161 |
주택유형구분 | 0.264 | 0.161 | 1.000 |
위도 | 경도 | 건물위치 | 건물명 | 주택유형구분 | 관리부서 | 기준일자 | |
---|---|---|---|---|---|---|---|
0 | 35.85052 | 128.571661 | 대구광역시 달서구 성당동 54-19 | 양지빌 | 다가구주택 | 건축과 | 2022-12-31 |
1 | 35.850818 | 128.571519 | 대구광역시 달서구 성당동 55-3 | 미정빌라 | 다가구주택 | 건축과 | 2022-12-31 |
2 | 35.850925 | 128.571775 | 대구광역시 달서구 성당동 55-13 | (무명) | 다가구주택 | 건축과 | 2022-12-31 |
3 | 35.851253 | 128.57098 | 대구광역시 달서구 성당동 56-21 | (무명) | 다가구주택 | 건축과 | 2022-12-31 |
4 | 35.840343 | 128.554596 | 대구광역시 달서구 성당동 384-6 | (무명) | 다가구주택 | 건축과 | 2022-12-31 |
5 | 35.839919 | 128.554792 | 대구광역시 달서구 성당동 385-1 | (무명) | 다가구주택 | 건축과 | 2022-12-31 |
6 | 35.849416 | 128.568719 | 대구광역시 달서구 성당동 81-65 | 남진빌 | 다가구주택 | 건축과 | 2022-12-31 |
7 | 35.848633 | 128.568481 | 대구광역시 달서구 성당동 81-89 | 위드 | 다가구주택 | 건축과 | 2022-12-31 |
8 | 35.837804 | 128.554125 | 대구광역시 달서구 성당동 275-0 | 썬하우스 | 다가구주택 | 건축과 | 2022-12-31 |
9 | 35.838625 | 128.553942 | 대구광역시 달서구 성당동 348-0 | (무명) | 다가구주택 | 건축과 | 2022-12-31 |
위도 | 경도 | 건물위치 | 건물명 | 주택유형구분 | 관리부서 | 기준일자 | |
---|---|---|---|---|---|---|---|
2849 | 35.843864 | 128.489075 | 대구광역시 달서구 호산동 716-5 | (무명) | 오피스텔 | 건축과 | 2022-12-31 |
2850 | 35.859684 | 128.564519 | 대구광역시 달서구 두류동 100-8 | 대경오피스텔 | 오피스텔 | 건축과 | 2022-12-31 |
2851 | 35.842775 | 128.486434 | 대구광역시 달서구 호산동 708-15 | 꿈에그린오피스텔 | 오피스텔 | 건축과 | 2022-12-31 |
2852 | 35.842464 | 128.487527 | 대구광역시 달서구 호산동 709-8 | 아이파크 | 오피스텔 | 건축과 | 2022-12-31 |
2853 | 35.842668 | 128.532904 | 대구광역시 달서구 장기동 552-4 | 코지하우스 | 오피스텔 | 건축과 | 2022-12-31 |
2854 | 35.844226 | 128.488867 | 대구광역시 달서구 호산동 716-31 | 노블오피스텔 | 오피스텔 | 건축과 | 2022-12-31 |
2855 | 35.844224 | 128.489155 | 대구광역시 달서구 호산동 716-32 | 플로라오피스텔 | 오피스텔 | 건축과 | 2022-12-31 |
2856 | 35.843365 | 128.490024 | 대구광역시 달서구 호산동 715-7 | 태림오피스텔 | 오피스텔 | 건축과 | 2022-12-31 |
2857 | 35.842658 | 128.533026 | 대구광역시 달서구 장기동 552-5 | 로뎀빌 | 오피스텔 | 건축과 | 2022-12-31 |
2858 | 35.835849 | 128.555893 | 대구광역시 달서구 송현동 1033-4 외1필지 | 루지움 | 오피스텔 | 건축과 | 2022-12-31 |
Most frequently occurring
위도 | 경도 | 건물위치 | 건물명 | 주택유형구분 | 관리부서 | 기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|---|
2 | 35.814148 | 128.518969 | 대구광역시 달서구 유천동 120-1 | 진천역 화성파크 리젠시 2단지 | 오피스텔 | 건축과 | 2022-12-31 | 3 |
0 | 35.808345 | 128.512337 | 대구광역시 달서구 대곡동 37-0 | (무명) | 다가구주택 | 건축과 | 2022-12-31 | 2 |
1 | 35.812898 | 128.520333 | 대구광역시 달서구 진천동 670-0 | (무명) | 다가구주택 | 건축과 | 2022-12-31 | 2 |
3 | 35.843354 | 128.554473 | 대구광역시 달서구 성당동 645-2 | (무명) | 다가구주택 | 건축과 | 2022-12-31 | 2 |
4 | 35.844151 | 128.553626 | 대구광역시 달서구 성당동 541-2 | (무명) | 다가구주택 | 건축과 | 2022-12-31 | 2 |
5 | 35.847421 | 128.546121 | 대구광역시 달서구 성당동 695-140 | (무명) | 다가구주택 | 건축과 | 2022-12-31 | 2 |
6 | 35.847513 | 128.541849 | 대구광역시 달서구 감삼동 188-22 | (무명) | 다가구주택 | 건축과 | 2022-12-31 | 2 |
7 | 35.848423 | 128.515341 | 대구광역시 달서구 장기동 180-26 | (무명) | 다가구주택 | 건축과 | 2022-12-31 | 2 |
8 | 35.857862 | 128.497686 | 대구광역시 달서구 신당동 156-0 | (무명) | 다가구주택 | 건축과 | 2022-12-31 | 2 |