Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 39 |
Missing cells | 24 |
Missing cells (%) | 12.3% |
Duplicate rows | 1 |
Duplicate rows (%) | 2.6% |
Total size in memory | 1.7 KiB |
Average record size in memory | 45.4 B |
Variable types
Text | 2 |
---|---|
Categorical | 2 |
Numeric | 1 |
Dataset
Description | 대구광역시 동구 관내 다가구주택,다세대주택,숙박시설 공사현황 데이터입니다. 대지위치, 용도, 세대수, 가구수 등의 항목을 포함합니다. |
---|---|
Author | 대구광역시 동구 |
URL | https://www.data.go.kr/data/3055355/fileData.do |
Dataset has 1 (2.6%) duplicate rows | Duplicates |
세대수 is highly overall correlated with 주용도 | High correlation |
주용도 is highly overall correlated with 가구수 and 1 other fields | High correlation |
가구수 is highly overall correlated with 주용도 | High correlation |
주용도 is highly imbalanced (82.8%) | Imbalance |
세대수 is highly imbalanced (63.6%) | Imbalance |
부속용도 has 19 (48.7%) missing values | Missing |
가구수 has 5 (12.8%) missing values | Missing |
Reproduction
Analysis started | 2024-03-16 04:13:19.568213 |
---|---|
Analysis finished | 2024-03-16 04:13:20.534540 |
Duration | 0.97 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
대지위치
Text
Distinct | 38 |
---|---|
Distinct (%) | 97.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 444.0 B |
Length
Max length | 33 |
---|---|
Median length | 23 |
Mean length | 20.230769 |
Min length | 15 |
Characters and Unicode
Total characters | 789 |
---|---|
Distinct characters | 61 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 37 ? |
---|---|
Unique (%) | 94.9% |
Sample
1st row | 대구광역시 동구 상매동 506 |
---|---|
2nd row | 대구광역시 동구 율암동 1312 |
3rd row | 대구광역시 동구 도동 445 |
4th row | 대구광역시 동구 진인동 산 203-7 |
5th row | 대구광역시 동구 봉무동 1042 |
Value | Count | Frequency (%) |
대구광역시 | 39 | |
동구 | 39 | |
외1필지 | 8 | 4.5% |
지묘동 | 6 | 3.4% |
중대동 | 5 | 2.8% |
숙천동 | 4 | 2.2% |
각산동 | 4 | 2.2% |
453-11 | 2 | 1.1% |
신암동 | 2 | 1.1% |
율암동 | 2 | 1.1% |
Other values (62) | 67 |
Most occurring characters
Value | Count | Frequency (%) |
139 | ||
구 | 85 | 10.8% |
동 | 78 | 9.9% |
대 | 47 | 6.0% |
1 | 40 | 5.1% |
시 | 39 | 4.9% |
역 | 39 | 4.9% |
광 | 39 | 4.9% |
- | 27 | 3.4% |
2 | 24 | 3.0% |
Other values (51) | 232 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 452 | |
Decimal Number | 168 | 21.3% |
Space Separator | 139 | 17.6% |
Dash Punctuation | 27 | 3.4% |
Uppercase Letter | 3 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 85 | |
동 | 78 | |
대 | 47 | |
시 | 39 | |
역 | 39 | |
광 | 39 | |
지 | 21 | 4.6% |
필 | 11 | 2.4% |
외 | 11 | 2.4% |
묘 | 6 | 1.3% |
Other values (38) | 76 |
Decimal Number
Value | Count | Frequency (%) |
1 | 40 | |
2 | 24 | |
3 | 21 | |
5 | 18 | |
4 | 16 | 9.5% |
7 | 14 | 8.3% |
0 | 14 | 8.3% |
6 | 10 | 6.0% |
8 | 7 | 4.2% |
9 | 4 | 2.4% |
Space Separator
Value | Count | Frequency (%) |
139 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 27 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 452 | |
Common | 334 | |
Latin | 3 | 0.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 85 | |
동 | 78 | |
대 | 47 | |
시 | 39 | |
역 | 39 | |
광 | 39 | |
지 | 21 | 4.6% |
필 | 11 | 2.4% |
외 | 11 | 2.4% |
묘 | 6 | 1.3% |
Other values (38) | 76 |
Common
Value | Count | Frequency (%) |
139 | ||
1 | 40 | 12.0% |
- | 27 | 8.1% |
2 | 24 | 7.2% |
3 | 21 | 6.3% |
5 | 18 | 5.4% |
4 | 16 | 4.8% |
7 | 14 | 4.2% |
0 | 14 | 4.2% |
6 | 10 | 3.0% |
Other values (2) | 11 | 3.3% |
Latin
Value | Count | Frequency (%) |
A | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 452 | |
ASCII | 337 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
139 | ||
1 | 40 | 11.9% |
- | 27 | 8.0% |
2 | 24 | 7.1% |
3 | 21 | 6.2% |
5 | 18 | 5.3% |
4 | 16 | 4.7% |
7 | 14 | 4.2% |
0 | 14 | 4.2% |
6 | 10 | 3.0% |
Other values (3) | 14 | 4.2% |
Hangul
Value | Count | Frequency (%) |
구 | 85 | |
동 | 78 | |
대 | 47 | |
시 | 39 | |
역 | 39 | |
광 | 39 | |
지 | 21 | 4.6% |
필 | 11 | 2.4% |
외 | 11 | 2.4% |
묘 | 6 | 1.3% |
Other values (38) | 76 |
주용도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 5.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 444.0 B |
단독주택 | |
---|---|
숙박시설 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 2.6% |
Sample
1st row | 숙박시설 |
---|---|
2nd row | 단독주택 |
3rd row | 단독주택 |
4th row | 단독주택 |
5th row | 단독주택 |
Common Values
Value | Count | Frequency (%) |
단독주택 | 38 | |
숙박시설 | 1 | 2.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단독주택 | 38 | |
숙박시설 | 1 | 2.6% |
부속용도
Text
MISSING
 
Distinct | 15 |
---|---|
Distinct (%) | 75.0% |
Missing | 19 |
Missing (%) | 48.7% |
Memory size | 444.0 B |
Length
Max length | 26 |
---|---|
Median length | 21 |
Mean length | 9.8 |
Min length | 2 |
Characters and Unicode
Total characters | 196 |
---|---|
Distinct characters | 39 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 11 ? |
---|---|
Unique (%) | 55.0% |
Sample
1st row | 관광호텔 |
---|---|
2nd row | 다가구주택,제1종근린생활시설(소매점,휴게음식점) |
3rd row | 다가구(10가구), 제2종근린생활시설(사무소) |
4th row | 사무소 |
5th row | 1가구 |
Value | Count | Frequency (%) |
다가구주택 | 6 | |
1가구 | 2 | 7.4% |
단독주택 | 2 | 7.4% |
제1종근린생활시설 | 2 | 7.4% |
및 | 2 | 7.4% |
제1종근린생활시설(소매점 | 2 | 7.4% |
근린생활시설 | 2 | 7.4% |
관광호텔 | 1 | 3.7% |
다가구주택,제1종근린생활시설(소매점,휴게음식점 | 1 | 3.7% |
다가구(10가구 | 1 | 3.7% |
Other values (6) | 6 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 14 | 7.1% |
구 | 13 | 6.6% |
주 | 12 | 6.1% |
다 | 11 | 5.6% |
택 | 11 | 5.6% |
1 | 9 | 4.6% |
생 | 9 | 4.6% |
근 | 9 | 4.6% |
린 | 8 | 4.1% |
시 | 8 | 4.1% |
Other values (29) | 92 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 162 | |
Decimal Number | 11 | 5.6% |
Space Separator | 7 | 3.6% |
Other Punctuation | 6 | 3.1% |
Close Punctuation | 5 | 2.6% |
Open Punctuation | 5 | 2.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 14 | 8.6% |
구 | 13 | 8.0% |
주 | 12 | 7.4% |
다 | 11 | 6.8% |
택 | 11 | 6.8% |
생 | 9 | 5.6% |
근 | 9 | 5.6% |
린 | 8 | 4.9% |
시 | 8 | 4.9% |
활 | 8 | 4.9% |
Other values (21) | 59 |
Decimal Number
Value | Count | Frequency (%) |
1 | 9 | |
2 | 1 | 9.1% |
0 | 1 | 9.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 5 | |
/ | 1 | 16.7% |
Space Separator
Value | Count | Frequency (%) |
7 |
Close Punctuation
Value | Count | Frequency (%) |
) | 5 |
Open Punctuation
Value | Count | Frequency (%) |
( | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 162 | |
Common | 34 | 17.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 14 | 8.6% |
구 | 13 | 8.0% |
주 | 12 | 7.4% |
다 | 11 | 6.8% |
택 | 11 | 6.8% |
생 | 9 | 5.6% |
근 | 9 | 5.6% |
린 | 8 | 4.9% |
시 | 8 | 4.9% |
활 | 8 | 4.9% |
Other values (21) | 59 |
Common
Value | Count | Frequency (%) |
1 | 9 | |
7 | ||
, | 5 | |
) | 5 | |
( | 5 | |
2 | 1 | 2.9% |
0 | 1 | 2.9% |
/ | 1 | 2.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 162 | |
ASCII | 34 | 17.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 14 | 8.6% |
구 | 13 | 8.0% |
주 | 12 | 7.4% |
다 | 11 | 6.8% |
택 | 11 | 6.8% |
생 | 9 | 5.6% |
근 | 9 | 5.6% |
린 | 8 | 4.9% |
시 | 8 | 4.9% |
활 | 8 | 4.9% |
Other values (21) | 59 |
ASCII
Value | Count | Frequency (%) |
1 | 9 | |
7 | ||
, | 5 | |
) | 5 | |
( | 5 | |
2 | 1 | 2.9% |
0 | 1 | 2.9% |
/ | 1 | 2.9% |
세대수
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 10.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 444.0 B |
<NA> | |
---|---|
1 | 3 |
0 | 1 |
13 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.6410256 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 5.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 34 | |
1 | 3 | 7.7% |
0 | 1 | 2.6% |
13 | 1 | 2.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 34 | |
1 | 3 | 7.7% |
0 | 1 | 2.6% |
13 | 1 | 2.6% |
가구수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 6 |
---|---|
Distinct (%) | 17.6% |
Missing | 5 |
Missing (%) | 12.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.7058824 |
Minimum | 1 |
---|---|
Maximum | 12 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 483.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 3 |
95-th percentile | 10 |
Maximum | 12 |
Range | 11 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 2.9800286 |
---|---|
Coefficient of variation (CV) | 1.1013149 |
Kurtosis | 3.5582826 |
Mean | 2.7058824 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 2.1065062 |
Sum | 92 |
Variance | 8.8805704 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 20 | |
3 | 9 | |
10 | 2 | 5.1% |
12 | 1 | 2.6% |
4 | 1 | 2.6% |
9 | 1 | 2.6% |
(Missing) | 5 | 12.8% |
Value | Count | Frequency (%) |
1 | 20 | |
3 | 9 | |
4 | 1 | 2.6% |
9 | 1 | 2.6% |
10 | 2 | 5.1% |
12 | 1 | 2.6% |
Value | Count | Frequency (%) |
12 | 1 | 2.6% |
10 | 2 | 5.1% |
9 | 1 | 2.6% |
4 | 1 | 2.6% |
3 | 9 | |
1 | 20 |
대지위치 | 주용도 | 부속용도 | 세대수 | 가구수 | |
---|---|---|---|---|---|
대지위치 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
주용도 | 1.000 | 1.000 | 1.000 | NaN | NaN |
부속용도 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 |
세대수 | 1.000 | NaN | 0.000 | 1.000 | NaN |
가구수 | 1.000 | NaN | 0.000 | NaN | 1.000 |
세대수 | 주용도 | |
---|---|---|
세대수 | 1.000 | 1.000 |
주용도 | 1.000 | 1.000 |
가구수 | 주용도 | 세대수 | |
---|---|---|---|
가구수 | 1.000 | 1.000 | NaN |
주용도 | 1.000 | 1.000 | 1.000 |
세대수 | NaN | 1.000 | 1.000 |
대지위치 | 주용도 | 부속용도 | 세대수 | 가구수 | |
---|---|---|---|---|---|
0 | 대구광역시 동구 상매동 506 | 숙박시설 | 관광호텔 | <NA> | <NA> |
1 | 대구광역시 동구 율암동 1312 | 단독주택 | 다가구주택,제1종근린생활시설(소매점,휴게음식점) | <NA> | 3 |
2 | 대구광역시 동구 도동 445 | 단독주택 | <NA> | <NA> | 1 |
3 | 대구광역시 동구 진인동 산 203-7 | 단독주택 | <NA> | <NA> | 1 |
4 | 대구광역시 동구 봉무동 1042 | 단독주택 | <NA> | <NA> | 1 |
5 | 대구광역시 동구 신암동 603-405 | 단독주택 | 다가구(10가구), 제2종근린생활시설(사무소) | <NA> | 10 |
6 | 대구광역시 동구 각산동 921-11 | 단독주택 | 사무소 | 0 | 1 |
7 | 대구광역시 동구 신평동 760-38 외1필지 | 단독주택 | <NA> | <NA> | 12 |
8 | 대구광역시 동구 능성동 160-1 | 단독주택 | <NA> | <NA> | 1 |
9 | 대구광역시 동구 미곡동 215-16 | 단독주택 | <NA> | <NA> | 1 |
대지위치 | 주용도 | 부속용도 | 세대수 | 가구수 | |
---|---|---|---|---|---|
29 | 대구광역시 동구 지묘동 대구연경 공공주택지구 A1블록 9로트 | 단독주택 | 다가구주택,일반음식점 | <NA> | 3 |
30 | 대구광역시 동구 신암동 183-42 | 단독주택 | 1가구 | <NA> | 1 |
31 | 대구광역시 동구 각산동 1102-7 | 단독주택 | 다가구주택, 제1종근린생활시설(소매점) | <NA> | 3 |
32 | 대구광역시 동구 숙천동 380-2 | 단독주택 | 다가구및 근린생활시설 | <NA> | 3 |
33 | 대구광역시 동구 각산동 370-24 | 단독주택 | 다가구주택 | <NA> | 9 |
34 | 대구광역시 동구 덕곡동 217 외1필지 | 단독주택 | 단독주택 | 13 | <NA> |
35 | 대구광역시 동구 중대동 655-2 외1필지 | 단독주택 | <NA> | 1 | <NA> |
36 | 대구광역시 동구 숙천동 362-5 | 단독주택 | 단독 | <NA> | 1 |
37 | 대구광역시 동구 송정동 730 외1필지 | 단독주택 | <NA> | <NA> | 1 |
38 | 대구광역시 동구 숙천동 376-7 | 단독주택 | 다가주주택/1종근생 | <NA> | 3 |
Most frequently occurring
대지위치 | 주용도 | 부속용도 | 세대수 | 가구수 | # duplicates | |
---|---|---|---|---|---|---|
0 | 대구광역시 동구 중대동 453-11 | 단독주택 | <NA> | <NA> | 1 | 2 |