Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 54 |
Missing cells | 54 |
Missing cells (%) | 16.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.8 KiB |
Average record size in memory | 53.4 B |
Variable types
Numeric | 3 |
---|---|
Text | 2 |
Categorical | 1 |
Dataset
Description | 대구광역시 서구_기계설비유지관리자 선임 대상 건축물 현황_20231228 |
---|---|
Author | 대구광역시 서구 |
URL | http://data.daegu.go.kr/open/data/dataView.do?dataSetId=15107600&dataSetDetailId=15107600198c8bec40466&provdMethod=FILE |
연번 is highly overall correlated with 연면적(제곱미터) and 1 other fields | High correlation |
연면적(제곱미터) is highly overall correlated with 연번 | High correlation |
세대수 is highly overall correlated with 연번 and 1 other fields | High correlation |
용도 is highly overall correlated with 세대수 | High correlation |
연면적(제곱미터) has 12 (22.2%) missing values | Missing |
세대수 has 42 (77.8%) missing values | Missing |
연번 has unique values | Unique |
건물명 has unique values | Unique |
주소 has unique values | Unique |
Reproduction
Analysis started | 2023-12-29 21:34:02.816350 |
---|---|
Analysis finished | 2023-12-29 21:34:11.668508 |
Duration | 8.85 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 54 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 27.5 |
Minimum | 1 |
---|---|
Maximum | 54 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 618.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 3.65 |
Q1 | 14.25 |
median | 27.5 |
Q3 | 40.75 |
95-th percentile | 51.35 |
Maximum | 54 |
Range | 53 |
Interquartile range (IQR) | 26.5 |
Descriptive statistics
Standard deviation | 15.732133 |
---|---|
Coefficient of variation (CV) | 0.57207755 |
Kurtosis | -1.2 |
Mean | 27.5 |
Median Absolute Deviation (MAD) | 13.5 |
Skewness | 0 |
Sum | 1485 |
Variance | 247.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 1.9% |
42 | 1 | 1.9% |
31 | 1 | 1.9% |
32 | 1 | 1.9% |
33 | 1 | 1.9% |
34 | 1 | 1.9% |
35 | 1 | 1.9% |
36 | 1 | 1.9% |
37 | 1 | 1.9% |
38 | 1 | 1.9% |
Other values (44) | 44 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
54 | 1 | |
53 | 1 | |
52 | 1 | |
51 | 1 | |
50 | 1 | |
49 | 1 | |
48 | 1 | |
47 | 1 | |
46 | 1 | |
45 | 1 |
건물명
Text
UNIQUE
 
Distinct | 54 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
Value | Count | Frequency (%) |
m-월드 | 1 | 1.3% |
sk텔레콤 | 1 | 1.3% |
광장코아 | 1 | 1.3% |
중리중학교 | 1 | 1.3% |
평리중학교 | 1 | 1.3% |
경운중학교 | 1 | 1.3% |
대구서부경찰서 | 1 | 1.3% |
제일고등학교 | 1 | 1.3% |
대구지사 | 1 | 1.3% |
달성초등학교 | 1 | 1.3% |
Other values (66) | 66 |
Most occurring characters
Value | Count | Frequency (%) |
대 | 22 | 4.8% |
22 | 4.8% | |
구 | 20 | 4.4% |
학 | 15 | 3.3% |
서 | 14 | 3.1% |
교 | 13 | 2.8% |
리 | 12 | 2.6% |
중 | 8 | 1.8% |
등 | 8 | 1.8% |
지 | 7 | 1.5% |
Other values (157) | 316 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 411 | |
Space Separator | 22 | 4.8% |
Uppercase Letter | 12 | 2.6% |
Decimal Number | 5 | 1.1% |
Open Punctuation | 2 | 0.4% |
Close Punctuation | 2 | 0.4% |
Lowercase Letter | 1 | 0.2% |
Other Symbol | 1 | 0.2% |
Dash Punctuation | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 22 | 5.4% |
구 | 20 | 4.9% |
학 | 15 | 3.6% |
서 | 14 | 3.4% |
교 | 13 | 3.2% |
리 | 12 | 2.9% |
중 | 8 | 1.9% |
등 | 8 | 1.9% |
지 | 7 | 1.7% |
사 | 7 | 1.7% |
Other values (140) | 285 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 3 | |
S | 2 | |
T | 2 | |
M | 2 | |
X | 1 | 8.3% |
B | 1 | 8.3% |
D | 1 | 8.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 2 | |
6 | 1 | |
9 | 1 | |
7 | 1 |
Space Separator
Value | Count | Frequency (%) |
22 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 412 | |
Common | 32 | 7.0% |
Latin | 13 | 2.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 22 | 5.3% |
구 | 20 | 4.9% |
학 | 15 | 3.6% |
서 | 14 | 3.4% |
교 | 13 | 3.2% |
리 | 12 | 2.9% |
중 | 8 | 1.9% |
등 | 8 | 1.9% |
지 | 7 | 1.7% |
사 | 7 | 1.7% |
Other values (141) | 286 |
Common
Value | Count | Frequency (%) |
22 | ||
( | 2 | 6.2% |
) | 2 | 6.2% |
1 | 2 | 6.2% |
6 | 1 | 3.1% |
9 | 1 | 3.1% |
7 | 1 | 3.1% |
- | 1 | 3.1% |
Latin
Value | Count | Frequency (%) |
K | 3 | |
S | 2 | |
T | 2 | |
M | 2 | |
e | 1 | 7.7% |
X | 1 | 7.7% |
B | 1 | 7.7% |
D | 1 | 7.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 411 | |
ASCII | 45 | 9.8% |
None | 1 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
대 | 22 | 5.4% |
구 | 20 | 4.9% |
학 | 15 | 3.6% |
서 | 14 | 3.4% |
교 | 13 | 3.2% |
리 | 12 | 2.9% |
중 | 8 | 1.9% |
등 | 8 | 1.9% |
지 | 7 | 1.7% |
사 | 7 | 1.7% |
Other values (140) | 285 |
ASCII
Value | Count | Frequency (%) |
22 | ||
K | 3 | 6.7% |
S | 2 | 4.4% |
( | 2 | 4.4% |
T | 2 | 4.4% |
) | 2 | 4.4% |
1 | 2 | 4.4% |
M | 2 | 4.4% |
6 | 1 | 2.2% |
9 | 1 | 2.2% |
Other values (6) | 6 | 13.3% |
None
Value | Count | Frequency (%) |
㈜ | 1 |
용도
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 25.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
교육연구시설 | |
---|---|
공동주택 | |
공장 | |
판매시설 | |
교육연구및복지시설 | |
Other values (9) |
Length
Max length | 10 |
---|---|
Median length | 9 |
Mean length | 5.1851852 |
Min length | 2 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 9.3% |
Sample
1st row | 자동차관련시설 |
---|---|
2nd row | 공장 |
3rd row | 의료시설 |
4th row | 교육연구시설 |
5th row | 공장 |
Common Values
Value | Count | Frequency (%) |
교육연구시설 | 13 | |
공동주택 | 12 | |
공장 | 7 | |
판매시설 | 4 | 7.4% |
교육연구및복지시설 | 3 | 5.6% |
제1종근린생활시설 | 3 | 5.6% |
업무시설 | 3 | 5.6% |
자동차관련시설 | 2 | 3.7% |
의료시설 | 2 | 3.7% |
위험물저장및처리시설 | 1 | 1.9% |
Other values (4) | 4 | 7.4% |
Length
Value | Count | Frequency (%) |
교육연구시설 | 13 | |
공동주택 | 12 | |
공장 | 7 | |
판매시설 | 4 | 7.4% |
교육연구및복지시설 | 3 | 5.6% |
제1종근린생활시설 | 3 | 5.6% |
업무시설 | 3 | 5.6% |
자동차관련시설 | 2 | 3.7% |
의료시설 | 2 | 3.7% |
위험물저장및처리시설 | 1 | 1.9% |
Other values (4) | 4 | 7.4% |
연면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 42 |
---|---|
Distinct (%) | 100.0% |
Missing | 12 |
Missing (%) | 22.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 22462.185 |
Minimum | 10031.735 |
---|---|
Maximum | 105101.65 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 618.0 B |
Quantile statistics
Minimum | 10031.735 |
---|---|
5-th percentile | 10743.623 |
Q1 | 12222.903 |
median | 15795.212 |
Q3 | 25812.285 |
95-th percentile | 48712.784 |
Maximum | 105101.65 |
Range | 95069.911 |
Interquartile range (IQR) | 13589.382 |
Descriptive statistics
Standard deviation | 18875.394 |
---|---|
Coefficient of variation (CV) | 0.84031871 |
Kurtosis | 10.14583 |
Mean | 22462.185 |
Median Absolute Deviation (MAD) | 4293.2075 |
Skewness | 2.9890054 |
Sum | 943411.77 |
Variance | 3.5628051 × 108 |
Monotonicity | Strictly decreasing |
Value | Count | Frequency (%) |
11918.03 | 1 | 1.9% |
13960.86 | 1 | 1.9% |
13157.38 | 1 | 1.9% |
13073.56 | 1 | 1.9% |
12726.604 | 1 | 1.9% |
12369.211 | 1 | 1.9% |
12349.3 | 1 | 1.9% |
12313.27 | 1 | 1.9% |
12192.78 | 1 | 1.9% |
11884.6 | 1 | 1.9% |
Other values (32) | 32 | |
(Missing) | 12 | 22.2% |
Value | Count | Frequency (%) |
10031.735 | 1 | |
10112.8 | 1 | |
10731.77 | 1 | |
10968.84 | 1 | |
11109.96 | 1 | |
11253.02 | 1 | |
11477.7 | 1 | |
11526.31 | 1 | |
11884.6 | 1 | |
11918.03 | 1 |
Value | Count | Frequency (%) |
105101.646 | 1 | |
81858.15 | 1 | |
49020.37 | 1 | |
42868.66 | 1 | |
40101.01 | 1 | |
33661.73 | 1 | |
30697.24 | 1 | |
30580.63 | 1 | |
30049.83 | 1 | |
27838.68 | 1 |
세대수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 12 |
---|---|
Distinct (%) | 100.0% |
Missing | 42 |
Missing (%) | 77.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1332.75 |
Minimum | 503 |
---|---|
Maximum | 1968 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 618.0 B |
Quantile statistics
Minimum | 503 |
---|---|
5-th percentile | 595.95 |
Q1 | 890.5 |
median | 1472 |
Q3 | 1702.5 |
95-th percentile | 1886.05 |
Maximum | 1968 |
Range | 1465 |
Interquartile range (IQR) | 812 |
Descriptive statistics
Standard deviation | 487.02289 |
---|---|
Coefficient of variation (CV) | 0.36542704 |
Kurtosis | -1.1529735 |
Mean | 1332.75 |
Median Absolute Deviation (MAD) | 325.5 |
Skewness | -0.49385259 |
Sum | 15993 |
Variance | 237191.3 |
Monotonicity | Strictly decreasing |
Value | Count | Frequency (%) |
1968 | 1 | 1.9% |
1819 | 1 | 1.9% |
1776 | 1 | 1.9% |
1678 | 1 | 1.9% |
1594 | 1 | 1.9% |
1526 | 1 | 1.9% |
1418 | 1 | 1.9% |
1281 | 1 | 1.9% |
902 | 1 | 1.9% |
856 | 1 | 1.9% |
Other values (2) | 2 | 3.7% |
(Missing) | 42 |
Value | Count | Frequency (%) |
503 | 1 | |
672 | 1 | |
856 | 1 | |
902 | 1 | |
1281 | 1 | |
1418 | 1 | |
1526 | 1 | |
1594 | 1 | |
1678 | 1 | |
1776 | 1 |
Value | Count | Frequency (%) |
1968 | 1 | |
1819 | 1 | |
1776 | 1 | |
1678 | 1 | |
1594 | 1 | |
1526 | 1 | |
1418 | 1 | |
1281 | 1 | |
902 | 1 | |
856 | 1 |
주소
Text
UNIQUE
 
Distinct | 54 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
Length
Max length | 22 |
---|---|
Median length | 20 |
Mean length | 17.888889 |
Min length | 13 |
Characters and Unicode
Total characters | 966 |
---|---|
Distinct characters | 57 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 54 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 대구광역시 서구 문화로 37 |
---|---|
2nd row | 대구광역시 서구 와룡로 307 |
3rd row | 대구광역시 서구 평리로 157 |
4th row | 대구광역시 서구 국채보상로43길 15 |
5th row | 대구광역시 서구 염색공단로 26 |
Value | Count | Frequency (%) |
서구 | 54 | |
대구광역시 | 53 | |
국채보상로 | 7 | 3.2% |
달구벌대로 | 6 | 2.8% |
33 | 3 | 1.4% |
국채보상로34길 | 3 | 1.4% |
41 | 2 | 0.9% |
국채보상로53길 | 2 | 0.9% |
32 | 2 | 0.9% |
와룡로 | 2 | 0.9% |
Other values (73) | 82 |
Most occurring characters
Value | Count | Frequency (%) |
162 | ||
구 | 119 | |
대 | 66 | 6.8% |
서 | 59 | 6.1% |
시 | 54 | 5.6% |
로 | 53 | 5.5% |
역 | 53 | 5.5% |
광 | 53 | 5.5% |
3 | 34 | 3.5% |
1 | 30 | 3.1% |
Other values (47) | 283 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 630 | |
Decimal Number | 173 | 17.9% |
Space Separator | 162 | 16.8% |
Dash Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 119 | |
대 | 66 | |
서 | 59 | |
시 | 54 | |
로 | 53 | |
역 | 53 | |
광 | 53 | |
길 | 17 | 2.7% |
상 | 16 | 2.5% |
보 | 16 | 2.5% |
Other values (35) | 124 |
Decimal Number
Value | Count | Frequency (%) |
3 | 34 | |
1 | 30 | |
2 | 26 | |
5 | 17 | |
7 | 16 | |
4 | 14 | |
0 | 12 | 6.9% |
6 | 10 | 5.8% |
9 | 9 | 5.2% |
8 | 5 | 2.9% |
Space Separator
Value | Count | Frequency (%) |
162 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 630 | |
Common | 336 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 119 | |
대 | 66 | |
서 | 59 | |
시 | 54 | |
로 | 53 | |
역 | 53 | |
광 | 53 | |
길 | 17 | 2.7% |
상 | 16 | 2.5% |
보 | 16 | 2.5% |
Other values (35) | 124 |
Common
Value | Count | Frequency (%) |
162 | ||
3 | 34 | 10.1% |
1 | 30 | 8.9% |
2 | 26 | 7.7% |
5 | 17 | 5.1% |
7 | 16 | 4.8% |
4 | 14 | 4.2% |
0 | 12 | 3.6% |
6 | 10 | 3.0% |
9 | 9 | 2.7% |
Other values (2) | 6 | 1.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 630 | |
ASCII | 336 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
162 | ||
3 | 34 | 10.1% |
1 | 30 | 8.9% |
2 | 26 | 7.7% |
5 | 17 | 5.1% |
7 | 16 | 4.8% |
4 | 14 | 4.2% |
0 | 12 | 3.6% |
6 | 10 | 3.0% |
9 | 9 | 2.7% |
Other values (2) | 6 | 1.8% |
Hangul
Value | Count | Frequency (%) |
구 | 119 | |
대 | 66 | |
서 | 59 | |
시 | 54 | |
로 | 53 | |
역 | 53 | |
광 | 53 | |
길 | 17 | 2.7% |
상 | 16 | 2.5% |
보 | 16 | 2.5% |
Other values (35) | 124 |
연번 | 건물명 | 용도 | 연면적(제곱미터) | 세대수 | 주소 | |
---|---|---|---|---|---|---|
연번 | 1.000 | 1.000 | 0.695 | 0.622 | 0.887 | 1.000 |
건물명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
용도 | 0.695 | 1.000 | 1.000 | 0.064 | NaN | 1.000 |
연면적(제곱미터) | 0.622 | 1.000 | 0.064 | 1.000 | NaN | 1.000 |
세대수 | 0.887 | 1.000 | NaN | NaN | 1.000 | 1.000 |
주소 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
연번 | 연면적(제곱미터) | 세대수 | 용도 | |
---|---|---|---|---|
연번 | 1.000 | -1.000 | -1.000 | 0.344 |
연면적(제곱미터) | -1.000 | 1.000 | NaN | 0.023 |
세대수 | -1.000 | NaN | 1.000 | 1.000 |
용도 | 0.344 | 0.023 | 1.000 | 1.000 |
연번 | 건물명 | 용도 | 연면적(제곱미터) | 세대수 | 주소 | |
---|---|---|---|---|---|---|
0 | 1 | M-월드 | 자동차관련시설 | 105101.646 | <NA> | 대구광역시 서구 문화로 37 |
1 | 2 | 디센터 1976 지식산업센터 | 공장 | 81858.15 | <NA> | 대구광역시 서구 와룡로 307 |
2 | 3 | 대구의료원 | 의료시설 | 49020.37 | <NA> | 대구광역시 서구 평리로 157 |
3 | 4 | 한국폴리텍대학 대구캠퍼스 | 교육연구시설 | 42868.66 | <NA> | 대구광역시 서구 국채보상로43길 15 |
4 | 5 | 대한방직 | 공장 | 40101.01 | <NA> | 대구광역시 서구 염색공단로 26 |
5 | 6 | 서대구 복합지식산업센터 | 공장 | 33661.73 | <NA> | 대구광역시 서구 와룡로90길 41 |
6 | 7 | 상리동음식물쓰레기처리장 | 위험물저장및처리시설 | 30697.24 | <NA> | 대구광역시 서구 가르뱅이로10길 31 |
7 | 8 | 이마트 트레이더스 홀세일클럽 비산점 | 판매시설 | 30580.63 | <NA> | 대구광역시 서구 팔달로 54 |
8 | 9 | 대구과학기술고등학교 | 교육연구및복지시설 | 30049.83 | <NA> | 대구광역시 서구 당산로 228 |
9 | 10 | 한국섬유개발연구원 | 교육연구시설 | 27838.68 | <NA> | 대구광역시 서구 국채보상로 136 |
연번 | 건물명 | 용도 | 연면적(제곱미터) | 세대수 | 주소 | |
---|---|---|---|---|---|---|
44 | 45 | 삼익뉴타운 | 공동주택 | <NA> | 1776 | 대구광역시 서구 평리로 236 |
45 | 46 | 서대구역반도유보라센텀 | 공동주택 | <NA> | 1678 | 대구광역시 서구 문화로 230 |
46 | 47 | 서대구역화성파크드림 | 공동주택 | <NA> | 1594 | 대구광역시 서구 서대구로29길 30 |
47 | 48 | 서대구센트럴자이 | 공동주택 | <NA> | 1526 | 대구시 서구 고성로 33 |
48 | 49 | 서대구KTX영무예다음 | 공동주택 | <NA> | 1418 | 대구광역시 서구 당산로 446 |
49 | 50 | 평리롯데캐슬 | 공동주택 | <NA> | 1281 | 대구광역시 서구 국채보상로 316 |
50 | 51 | e편한세상 두류역 | 공동주택 | <NA> | 902 | 대구광역시 서구 달구벌대로361길 41 |
51 | 52 | 서대구역서한이다음 더 퍼스트 | 공동주택 | <NA> | 856 | 대구광역시 서구 국채보상로37길 38 |
52 | 53 | 내당광장1차아파트 | 공동주택 | <NA> | 672 | 대구광역시 서구 달구벌대로 1707 |
53 | 54 | 삼익맨션 | 공동주택 | <NA> | 503 | 대구광역시 서구 서대구로 25 |