Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 153 |
Missing cells | 298 |
Missing cells (%) | 27.8% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 9.1 KiB |
Average record size in memory | 60.9 B |
Variable types
Numeric | 4 |
---|---|
Text | 1 |
Categorical | 2 |
Dataset
Description | 대구광역시 남구_공동주택 공사현황_20190703 |
---|---|
Author | 대구광역시 남구 |
URL | http://data.daegu.go.kr/open/data/dataView.do?dataSetId=15012482&dataSetDetailId=150124821966538a6bdaf_201907031025&provdMethod=FILE |
세대수 is highly overall correlated with 호수 | High correlation |
호수 is highly overall correlated with 세대수 and 2 other fields | High correlation |
가구수 is highly overall correlated with 호수 and 1 other fields | High correlation |
주용도 is highly overall correlated with 가구수 and 1 other fields | High correlation |
부속용도 is highly overall correlated with 호수 and 1 other fields | High correlation |
세대수 has 134 (87.6%) missing values | Missing |
호수 has 145 (94.8%) missing values | Missing |
가구수 has 19 (12.4%) missing values | Missing |
연번 has unique values | Unique |
Reproduction
Analysis started | 2024-04-19 05:19:11.468629 |
---|---|
Analysis finished | 2024-04-19 05:19:13.180224 |
Duration | 1.71 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 153 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 77 |
Minimum | 1 |
---|---|
Maximum | 153 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 8.6 |
Q1 | 39 |
median | 77 |
Q3 | 115 |
95-th percentile | 145.4 |
Maximum | 153 |
Range | 152 |
Interquartile range (IQR) | 76 |
Descriptive statistics
Standard deviation | 44.311398 |
---|---|
Coefficient of variation (CV) | 0.5754727 |
Kurtosis | -1.2 |
Mean | 77 |
Median Absolute Deviation (MAD) | 38 |
Skewness | 0 |
Sum | 11781 |
Variance | 1963.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.7% |
106 | 1 | 0.7% |
99 | 1 | 0.7% |
100 | 1 | 0.7% |
101 | 1 | 0.7% |
102 | 1 | 0.7% |
103 | 1 | 0.7% |
104 | 1 | 0.7% |
105 | 1 | 0.7% |
107 | 1 | 0.7% |
Other values (143) | 143 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
153 | 1 | |
152 | 1 | |
151 | 1 | |
150 | 1 | |
149 | 1 | |
148 | 1 | |
147 | 1 | |
146 | 1 | |
145 | 1 | |
144 | 1 |
대지위치
Text
Distinct | 147 |
---|---|
Distinct (%) | 96.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
Length
Max length | 26 |
---|---|
Median length | 24 |
Mean length | 20.738562 |
Min length | 16 |
Characters and Unicode
Total characters | 3173 |
---|---|
Distinct characters | 27 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 142 ? |
---|---|
Unique (%) | 92.8% |
Sample
1st row | 대구광역시 남구 대명동 917-3 외1필지 |
---|---|
2nd row | 대구광역시 남구 대명동 790-13 외1필지 |
3rd row | 대구광역시 남구 대명동 2768-114 외1필지 |
4th row | 대구광역시 남구 대명동 1497-22 외1필지 |
5th row | 대구광역시 남구 대명동 1888-9 |
Value | Count | Frequency (%) |
대구광역시 | 153 | |
남구 | 153 | |
대명동 | 134 | |
외1필지 | 42 | 6.3% |
봉덕동 | 14 | 2.1% |
외2필지 | 10 | 1.5% |
이천동 | 5 | 0.8% |
1888-9 | 3 | 0.5% |
1020-3 | 2 | 0.3% |
581-1 | 2 | 0.3% |
Other values (144) | 147 |
Most occurring characters
Value | Count | Frequency (%) |
512 | ||
구 | 306 | 9.6% |
대 | 287 | 9.0% |
1 | 219 | 6.9% |
광 | 153 | 4.8% |
역 | 153 | 4.8% |
시 | 153 | 4.8% |
남 | 153 | 4.8% |
동 | 153 | 4.8% |
- | 149 | 4.7% |
Other values (17) | 935 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1689 | |
Decimal Number | 823 | |
Space Separator | 512 | 16.1% |
Dash Punctuation | 149 | 4.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 306 | |
대 | 287 | |
광 | 153 | |
역 | 153 | |
시 | 153 | |
남 | 153 | |
동 | 153 | |
명 | 134 | |
외 | 53 | 3.1% |
필 | 53 | 3.1% |
Other values (5) | 91 | 5.4% |
Decimal Number
Value | Count | Frequency (%) |
1 | 219 | |
2 | 86 | 10.4% |
4 | 80 | 9.7% |
3 | 78 | 9.5% |
6 | 75 | 9.1% |
5 | 67 | 8.1% |
0 | 59 | 7.2% |
9 | 56 | 6.8% |
8 | 56 | 6.8% |
7 | 47 | 5.7% |
Space Separator
Value | Count | Frequency (%) |
512 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 149 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1689 | |
Common | 1484 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 306 | |
대 | 287 | |
광 | 153 | |
역 | 153 | |
시 | 153 | |
남 | 153 | |
동 | 153 | |
명 | 134 | |
외 | 53 | 3.1% |
필 | 53 | 3.1% |
Other values (5) | 91 | 5.4% |
Common
Value | Count | Frequency (%) |
512 | ||
1 | 219 | |
- | 149 | 10.0% |
2 | 86 | 5.8% |
4 | 80 | 5.4% |
3 | 78 | 5.3% |
6 | 75 | 5.1% |
5 | 67 | 4.5% |
0 | 59 | 4.0% |
9 | 56 | 3.8% |
Other values (2) | 103 | 6.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1689 | |
ASCII | 1484 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
512 | ||
1 | 219 | |
- | 149 | 10.0% |
2 | 86 | 5.8% |
4 | 80 | 5.4% |
3 | 78 | 5.3% |
6 | 75 | 5.1% |
5 | 67 | 4.5% |
0 | 59 | 4.0% |
9 | 56 | 3.8% |
Other values (2) | 103 | 6.9% |
Hangul
Value | Count | Frequency (%) |
구 | 306 | |
대 | 287 | |
광 | 153 | |
역 | 153 | |
시 | 153 | |
남 | 153 | |
동 | 153 | |
명 | 134 | |
외 | 53 | 3.1% |
필 | 53 | 3.1% |
Other values (5) | 91 | 5.4% |
주용도
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
단독주택 | |
---|---|
공동주택 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 단독주택 |
---|---|
2nd row | 단독주택 |
3rd row | 단독주택 |
4th row | 단독주택 |
5th row | 단독주택 |
Common Values
Value | Count | Frequency (%) |
단독주택 | 135 | |
공동주택 | 18 | 11.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단독주택 | 135 | |
공동주택 | 18 | 11.8% |
부속용도
Categorical
HIGH CORRELATION
 
Distinct | 34 |
---|---|
Distinct (%) | 22.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
다가구주택 | |
---|---|
<NA> | |
다가구 | |
다세대주택 | 7 |
제1종근린생활시설 | 2 |
Other values (29) |
Length
Max length | 19 |
---|---|
Median length | 5 |
Mean length | 5.7320261 |
Min length | 3 |
Unique
Unique | 25 ? |
---|---|
Unique (%) | 16.3% |
Sample
1st row | 다가구주택 |
---|---|
2nd row | 다가구주택 |
3rd row | 다가구주택 |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
다가구주택 | 75 | |
<NA> | 25 | 16.3% |
다가구 | 11 | 7.2% |
다세대주택 | 7 | 4.6% |
제1종근린생활시설 | 2 | 1.3% |
다세대 | 2 | 1.3% |
다가구주택, 소매점 | 2 | 1.3% |
다가구주택,소매점 | 2 | 1.3% |
다가구,사무소 | 2 | 1.3% |
다가구/소매점 | 1 | 0.7% |
Other values (24) | 24 | 15.7% |
Length
Value | Count | Frequency (%) |
다가구주택 | 80 | |
na | 25 | 15.2% |
다가구 | 11 | 6.7% |
다세대주택 | 8 | 4.9% |
소매점 | 3 | 1.8% |
및 | 3 | 1.8% |
근린생활시설 | 2 | 1.2% |
제1종근린생활시설 | 2 | 1.2% |
다세대 | 2 | 1.2% |
다가구주택,소매점 | 2 | 1.2% |
Other values (24) | 26 | 15.9% |
세대수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 12 |
---|---|
Distinct (%) | 63.2% |
Missing | 134 |
Missing (%) | 87.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.263158 |
Minimum | 6 |
---|---|
Maximum | 29 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.5 KiB |
Quantile statistics
Minimum | 6 |
---|---|
5-th percentile | 6.9 |
Q1 | 9 |
median | 14 |
Q3 | 16 |
95-th percentile | 27.2 |
Maximum | 29 |
Range | 23 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 6.8055705 |
---|---|
Coefficient of variation (CV) | 0.47714332 |
Kurtosis | -0.049540504 |
Mean | 14.263158 |
Median Absolute Deviation (MAD) | 5 |
Skewness | 0.90544929 |
Sum | 271 |
Variance | 46.315789 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
16 | 4 | 2.6% |
8 | 2 | 1.3% |
14 | 2 | 1.3% |
10 | 2 | 1.3% |
9 | 2 | 1.3% |
21 | 1 | 0.7% |
29 | 1 | 0.7% |
7 | 1 | 0.7% |
6 | 1 | 0.7% |
27 | 1 | 0.7% |
Other values (2) | 2 | 1.3% |
(Missing) | 134 |
Value | Count | Frequency (%) |
6 | 1 | 0.7% |
7 | 1 | 0.7% |
8 | 2 | |
9 | 2 | |
10 | 2 | |
11 | 1 | 0.7% |
14 | 2 | |
16 | 4 | |
21 | 1 | 0.7% |
24 | 1 | 0.7% |
Value | Count | Frequency (%) |
29 | 1 | 0.7% |
27 | 1 | 0.7% |
24 | 1 | 0.7% |
21 | 1 | 0.7% |
16 | 4 | |
14 | 2 | |
11 | 1 | 0.7% |
10 | 2 | |
9 | 2 | |
8 | 2 |
호수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 6 |
---|---|
Distinct (%) | 75.0% |
Missing | 145 |
Missing (%) | 94.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9.375 |
Minimum | 2 |
---|---|
Maximum | 24 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.5 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 2.35 |
Q1 | 3 |
median | 6 |
Q3 | 14.75 |
95-th percentile | 21.55 |
Maximum | 24 |
Range | 22 |
Interquartile range (IQR) | 11.75 |
Descriptive statistics
Standard deviation | 8.0345237 |
---|---|
Coefficient of variation (CV) | 0.85701586 |
Kurtosis | -0.2836436 |
Mean | 9.375 |
Median Absolute Deviation (MAD) | 3.5 |
Skewness | 0.9821034 |
Sum | 75 |
Variance | 64.553571 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
6 | 2 | 1.3% |
3 | 2 | 1.3% |
24 | 1 | 0.7% |
2 | 1 | 0.7% |
14 | 1 | 0.7% |
17 | 1 | 0.7% |
(Missing) | 145 |
Value | Count | Frequency (%) |
2 | 1 | |
3 | 2 | |
6 | 2 | |
14 | 1 | |
17 | 1 | |
24 | 1 |
Value | Count | Frequency (%) |
24 | 1 | |
17 | 1 | |
14 | 1 | |
6 | 2 | |
3 | 2 | |
2 | 1 |
가구수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 17 |
---|---|
Distinct (%) | 12.7% |
Missing | 19 |
Missing (%) | 12.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10.671642 |
Minimum | 2 |
---|---|
Maximum | 19 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.5 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 5.65 |
Q1 | 9 |
median | 10 |
Q3 | 13 |
95-th percentile | 16.7 |
Maximum | 19 |
Range | 17 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 3.439654 |
---|---|
Coefficient of variation (CV) | 0.32231723 |
Kurtosis | 0.042263685 |
Mean | 10.671642 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.27998812 |
Sum | 1430 |
Variance | 11.83122 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
9 | 24 | |
12 | 15 | |
10 | 15 | |
11 | 15 | |
7 | 13 | |
13 | 10 | |
15 | 9 | 5.9% |
6 | 5 | 3.3% |
16 | 5 | 3.3% |
8 | 5 | 3.3% |
Other values (7) | 18 | |
(Missing) | 19 |
Value | Count | Frequency (%) |
2 | 1 | 0.7% |
3 | 1 | 0.7% |
4 | 2 | 1.3% |
5 | 3 | 2.0% |
6 | 5 | 3.3% |
7 | 13 | |
8 | 5 | 3.3% |
9 | 24 | |
10 | 15 | |
11 | 15 |
Value | Count | Frequency (%) |
19 | 3 | 2.0% |
18 | 4 | 2.6% |
16 | 5 | 3.3% |
15 | 9 | 5.9% |
14 | 4 | 2.6% |
13 | 10 | |
12 | 15 | |
11 | 15 | |
10 | 15 | |
9 | 24 |
연번 | 주용도 | 부속용도 | 세대수 | 호수 | 가구수 | |
---|---|---|---|---|---|---|
연번 | 1.000 | 0.328 | 0.349 | 0.862 | 0.840 | 0.424 |
주용도 | 0.328 | 1.000 | 1.000 | 0.537 | 0.565 | NaN |
부속용도 | 0.349 | 1.000 | 1.000 | 0.735 | 0.964 | 0.000 |
세대수 | 0.862 | 0.537 | 0.735 | 1.000 | 0.925 | NaN |
호수 | 0.840 | 0.565 | 0.964 | 0.925 | 1.000 | 0.000 |
가구수 | 0.424 | NaN | 0.000 | NaN | 0.000 | 1.000 |
부속용도 | 주용도 | |
---|---|---|
부속용도 | 1.000 | 0.868 |
주용도 | 0.868 | 1.000 |
연번 | 세대수 | 호수 | 가구수 | 주용도 | 부속용도 | |
---|---|---|---|---|---|---|
연번 | 1.000 | 0.132 | 0.120 | -0.220 | 0.239 | 0.112 |
세대수 | 0.132 | 1.000 | 1.000 | NaN | 0.297 | 0.399 |
호수 | 0.120 | 1.000 | 1.000 | 1.000 | 0.435 | 0.667 |
가구수 | -0.220 | NaN | 1.000 | 1.000 | 1.000 | 0.000 |
주용도 | 0.239 | 0.297 | 0.435 | 1.000 | 1.000 | 0.868 |
부속용도 | 0.112 | 0.399 | 0.667 | 0.000 | 0.868 | 1.000 |
연번 | 대지위치 | 주용도 | 부속용도 | 세대수 | 호수 | 가구수 | |
---|---|---|---|---|---|---|---|
0 | 1 | 대구광역시 남구 대명동 917-3 외1필지 | 단독주택 | 다가구주택 | <NA> | <NA> | 18 |
1 | 2 | 대구광역시 남구 대명동 790-13 외1필지 | 단독주택 | 다가구주택 | <NA> | <NA> | 11 |
2 | 3 | 대구광역시 남구 대명동 2768-114 외1필지 | 단독주택 | 다가구주택 | <NA> | <NA> | 12 |
3 | 4 | 대구광역시 남구 대명동 1497-22 외1필지 | 단독주택 | <NA> | <NA> | <NA> | 10 |
4 | 5 | 대구광역시 남구 대명동 1888-9 | 단독주택 | <NA> | <NA> | <NA> | 11 |
5 | 6 | 대구광역시 남구 대명동 1888-9 | 단독주택 | <NA> | <NA> | <NA> | 11 |
6 | 7 | 대구광역시 남구 대명동 1888-9 | 단독주택 | <NA> | <NA> | <NA> | 11 |
7 | 8 | 대구광역시 남구 대명동 915-1 | 단독주택 | 다가구주택 | <NA> | <NA> | 9 |
8 | 9 | 대구광역시 남구 대명동 1077-15 외1필지 | 단독주택 | <NA> | <NA> | <NA> | 12 |
9 | 10 | 대구광역시 남구 대명동 1596-9 외1필지 | 단독주택 | <NA> | <NA> | <NA> | 10 |
연번 | 대지위치 | 주용도 | 부속용도 | 세대수 | 호수 | 가구수 | |
---|---|---|---|---|---|---|---|
143 | 144 | 대구광역시 남구 이천동 517-25 외1필지 | 단독주택 | 다가구주택(8가구) | <NA> | <NA> | 8 |
144 | 145 | 대구광역시 남구 대명동 1604-27 | 단독주택 | <NA> | <NA> | <NA> | 9 |
145 | 146 | 대구광역시 남구 이천동 517-33 | 단독주택 | 다가구주택(6가구) | <NA> | <NA> | 6 |
146 | 147 | 대구광역시 남구 대명동 1592-28 | 단독주택 | 다가구 | <NA> | <NA> | 7 |
147 | 148 | 대구광역시 남구 대명동 378-4 | 단독주택 | <NA> | <NA> | <NA> | 10 |
148 | 149 | 대구광역시 남구 봉덕동 739-3 | 단독주택 | <NA> | <NA> | <NA> | 10 |
149 | 150 | 대구광역시 남구 대명동 3040-10 | 단독주택 | 다가구주택 | <NA> | <NA> | 6 |
150 | 151 | 대구광역시 남구 대명동 919-1 | 단독주택 | 다가구주택 및 제2종근린새왈시설 | <NA> | <NA> | 9 |
151 | 152 | 대구광역시 남구 대명동 634-3 | 단독주택 | 다가구주택 | <NA> | <NA> | 10 |
152 | 153 | 대구광역시 남구 이천동 645-12 | 단독주택 | <NA> | <NA> | 17 | <NA> |