Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 249 |
Missing cells | 494 |
Missing cells (%) | 39.7% |
Duplicate rows | 60 |
Duplicate rows (%) | 24.1% |
Total size in memory | 10.1 KiB |
Average record size in memory | 41.5 B |
Variable types
Text | 4 |
---|---|
Numeric | 1 |
Dataset
Description | 광주광역시 서구에 위치한 건축물 중 기계설비 법에 해당되는 건축물에 대한 정보로 건축물명, 도로명주소, 연면적, 세대수 등에 대한 공공데이터입니다. |
---|---|
Author | 광주광역시 서구 |
URL | https://www.data.go.kr/data/15125453/fileData.do |
Dataset has 60 (24.1%) duplicate rows | Duplicates |
연면적 has 76 (30.5%) missing values | Missing |
세대수 has 173 (69.5%) missing values | Missing |
비고 has 245 (98.4%) missing values | Missing |
Reproduction
Analysis started | 2023-12-23 07:55:39.051184 |
---|---|
Analysis finished | 2023-12-23 07:55:43.657754 |
Duration | 4.61 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
건축물명
Text
Distinct | 188 |
---|---|
Distinct (%) | 75.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
Length
Max length | 15 |
---|---|
Median length | 12 |
Mean length | 7.9196787 |
Min length | 3 |
Characters and Unicode
Total characters | 1972 |
---|---|
Distinct characters | 262 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 128 ? |
---|---|
Unique (%) | 51.4% |
Sample
1st row | 동천마을주공아파트6단지 |
---|---|
2nd row | 쌍촌주공아파트 |
3rd row | 빛고을파크 |
4th row | 상무중흥아파트2단지 |
5th row | 광천E편한세상 |
Value | Count | Frequency (%) |
광주광역시 | 5 | 1.7% |
건물 | 4 | 1.4% |
유탑유블레스 | 4 | 1.4% |
상무병원 | 3 | 1.0% |
상무영무예다음(상가 | 2 | 0.7% |
모아엘가비즈니스센터 | 2 | 0.7% |
한국토지주택공사 | 2 | 0.7% |
치평동 | 2 | 0.7% |
현대해상화재보험㈜ | 2 | 0.7% |
광덕중고등학교 | 2 | 0.7% |
Other values (206) | 266 |
Most occurring characters
Value | Count | Frequency (%) |
아 | 77 | 3.9% |
트 | 76 | 3.9% |
파 | 66 | 3.3% |
주 | 55 | 2.8% |
광 | 47 | 2.4% |
스 | 46 | 2.3% |
45 | 2.3% | |
상 | 33 | 1.7% |
교 | 29 | 1.5% |
무 | 27 | 1.4% |
Other values (252) | 1471 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1824 | |
Space Separator | 45 | 2.3% |
Uppercase Letter | 43 | 2.2% |
Decimal Number | 38 | 1.9% |
Open Punctuation | 6 | 0.3% |
Close Punctuation | 6 | 0.3% |
Other Symbol | 4 | 0.2% |
Other Punctuation | 3 | 0.2% |
Lowercase Letter | 2 | 0.1% |
Dash Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
아 | 77 | 4.2% |
트 | 76 | 4.2% |
파 | 66 | 3.6% |
주 | 55 | 3.0% |
광 | 47 | 2.6% |
스 | 46 | 2.5% |
상 | 33 | 1.8% |
교 | 29 | 1.6% |
무 | 27 | 1.5% |
시 | 26 | 1.4% |
Other values (223) | 1342 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 7 | |
K | 6 | |
S | 6 | |
C | 5 | |
L | 4 | |
G | 3 | |
T | 3 | |
E | 2 | 4.7% |
Y | 2 | 4.7% |
M | 2 | 4.7% |
Other values (3) | 3 |
Decimal Number
Value | Count | Frequency (%) |
1 | 15 | |
2 | 11 | |
3 | 5 | 13.2% |
5 | 4 | 10.5% |
6 | 2 | 5.3% |
8 | 1 | 2.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 | |
& | 1 | |
. | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
k | 1 | |
t | 1 |
Space Separator
Value | Count | Frequency (%) |
45 |
Open Punctuation
Value | Count | Frequency (%) |
( | 6 |
Close Punctuation
Value | Count | Frequency (%) |
) | 6 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 4 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1828 | |
Common | 99 | 5.0% |
Latin | 45 | 2.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
아 | 77 | 4.2% |
트 | 76 | 4.2% |
파 | 66 | 3.6% |
주 | 55 | 3.0% |
광 | 47 | 2.6% |
스 | 46 | 2.5% |
상 | 33 | 1.8% |
교 | 29 | 1.6% |
무 | 27 | 1.5% |
시 | 26 | 1.4% |
Other values (224) | 1346 |
Latin
Value | Count | Frequency (%) |
B | 7 | |
K | 6 | |
S | 6 | |
C | 5 | |
L | 4 | |
G | 3 | |
T | 3 | |
E | 2 | 4.4% |
Y | 2 | 4.4% |
M | 2 | 4.4% |
Other values (5) | 5 |
Common
Value | Count | Frequency (%) |
45 | ||
1 | 15 | 15.2% |
2 | 11 | 11.1% |
( | 6 | 6.1% |
) | 6 | 6.1% |
3 | 5 | 5.1% |
5 | 4 | 4.0% |
6 | 2 | 2.0% |
, | 1 | 1.0% |
- | 1 | 1.0% |
Other values (3) | 3 | 3.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1824 | |
ASCII | 144 | 7.3% |
None | 4 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
아 | 77 | 4.2% |
트 | 76 | 4.2% |
파 | 66 | 3.6% |
주 | 55 | 3.0% |
광 | 47 | 2.6% |
스 | 46 | 2.5% |
상 | 33 | 1.8% |
교 | 29 | 1.6% |
무 | 27 | 1.5% |
시 | 26 | 1.4% |
Other values (223) | 1342 |
ASCII
Value | Count | Frequency (%) |
45 | ||
1 | 15 | 10.4% |
2 | 11 | 7.6% |
B | 7 | 4.9% |
( | 6 | 4.2% |
) | 6 | 4.2% |
K | 6 | 4.2% |
S | 6 | 4.2% |
C | 5 | 3.5% |
3 | 5 | 3.5% |
Other values (18) | 32 |
None
Value | Count | Frequency (%) |
㈜ | 4 |
도로명주소
Text
Distinct | 188 |
---|---|
Distinct (%) | 75.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
Length
Max length | 30 |
---|---|
Median length | 26 |
Mean length | 19.662651 |
Min length | 15 |
Characters and Unicode
Total characters | 4896 |
---|---|
Distinct characters | 95 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 127 ? |
---|---|
Unique (%) | 51.0% |
Sample
1st row | 광주광역시 서구 하남대로710번길 5 |
---|---|
2nd row | 광주광역시 서구 쌍학로 47 |
3rd row | 광주광역시 서구 화정로 105 |
4th row | 광주광역시 서구 치평로 77 |
5th row | 광주광역시 서구 화운로 278 |
Value | Count | Frequency (%) |
광주광역시 | 249 | |
서구 | 249 | |
치평동 | 24 | 2.2% |
시청로 | 19 | 1.7% |
상무중앙로 | 16 | 1.5% |
쌍촌동 | 14 | 1.3% |
풍암동 | 14 | 1.3% |
죽봉대로 | 13 | 1.2% |
화정동 | 11 | 1.0% |
무진대로 | 9 | 0.8% |
Other values (207) | 475 |
Most occurring characters
Value | Count | Frequency (%) |
846 | ||
광 | 502 | 10.3% |
시 | 275 | 5.6% |
주 | 255 | 5.2% |
역 | 249 | 5.1% |
서 | 249 | 5.1% |
구 | 249 | 5.1% |
로 | 247 | 5.0% |
1 | 149 | 3.0% |
2 | 108 | 2.2% |
Other values (85) | 1767 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3101 | |
Space Separator | 846 | 17.3% |
Decimal Number | 744 | 15.2% |
Close Punctuation | 98 | 2.0% |
Open Punctuation | 98 | 2.0% |
Dash Punctuation | 9 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
광 | 502 | |
시 | 275 | 8.9% |
주 | 255 | 8.2% |
역 | 249 | 8.0% |
서 | 249 | 8.0% |
구 | 249 | 8.0% |
로 | 247 | 8.0% |
동 | 106 | 3.4% |
무 | 70 | 2.3% |
상 | 61 | 2.0% |
Other values (71) | 838 |
Decimal Number
Value | Count | Frequency (%) |
1 | 149 | |
2 | 108 | |
3 | 75 | |
7 | 71 | |
4 | 70 | |
5 | 59 | 7.9% |
9 | 56 | 7.5% |
0 | 55 | 7.4% |
6 | 55 | 7.4% |
8 | 46 | 6.2% |
Space Separator
Value | Count | Frequency (%) |
846 |
Close Punctuation
Value | Count | Frequency (%) |
) | 98 |
Open Punctuation
Value | Count | Frequency (%) |
( | 98 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3101 | |
Common | 1795 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
광 | 502 | |
시 | 275 | 8.9% |
주 | 255 | 8.2% |
역 | 249 | 8.0% |
서 | 249 | 8.0% |
구 | 249 | 8.0% |
로 | 247 | 8.0% |
동 | 106 | 3.4% |
무 | 70 | 2.3% |
상 | 61 | 2.0% |
Other values (71) | 838 |
Common
Value | Count | Frequency (%) |
846 | ||
1 | 149 | 8.3% |
2 | 108 | 6.0% |
) | 98 | 5.5% |
( | 98 | 5.5% |
3 | 75 | 4.2% |
7 | 71 | 4.0% |
4 | 70 | 3.9% |
5 | 59 | 3.3% |
9 | 56 | 3.1% |
Other values (4) | 165 | 9.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3101 | |
ASCII | 1795 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
846 | ||
1 | 149 | 8.3% |
2 | 108 | 6.0% |
) | 98 | 5.5% |
( | 98 | 5.5% |
3 | 75 | 4.2% |
7 | 71 | 4.0% |
4 | 70 | 3.9% |
5 | 59 | 3.3% |
9 | 56 | 3.1% |
Other values (4) | 165 | 9.2% |
Hangul
Value | Count | Frequency (%) |
광 | 502 | |
시 | 275 | 8.9% |
주 | 255 | 8.2% |
역 | 249 | 8.0% |
서 | 249 | 8.0% |
구 | 249 | 8.0% |
로 | 247 | 8.0% |
동 | 106 | 3.4% |
무 | 70 | 2.3% |
상 | 61 | 2.0% |
Other values (71) | 838 |
연면적
Text
MISSING
 
Distinct | 129 |
---|---|
Distinct (%) | 74.6% |
Missing | 76 |
Missing (%) | 30.5% |
Memory size | 2.1 KiB |
Value | Count | Frequency (%) |
21816.88 | 2 | 1.2% |
16111.43 | 2 | 1.2% |
23489.67 | 2 | 1.2% |
21975.5 | 2 | 1.2% |
15159.25 | 2 | 1.2% |
23410.24 | 2 | 1.2% |
24745.18 | 2 | 1.2% |
17464.97 | 2 | 1.2% |
25206.26 | 2 | 1.2% |
20795.39 | 2 | 1.2% |
Other values (119) | 153 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 213 | |
. | 160 | |
2 | 147 | |
5 | 126 | |
4 | 108 | |
3 | 105 | |
0 | 105 | |
8 | 103 | |
9 | 102 | |
7 | 95 | |
Other values (2) | 82 | 6.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1184 | |
Other Punctuation | 162 | 12.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 213 | |
2 | 147 | |
5 | 126 | |
4 | 108 | |
3 | 105 | |
0 | 105 | |
8 | 103 | |
9 | 102 | |
7 | 95 | |
6 | 80 | 6.8% |
Other Punctuation
Value | Count | Frequency (%) |
. | 160 | |
, | 2 | 1.2% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1346 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 213 | |
. | 160 | |
2 | 147 | |
5 | 126 | |
4 | 108 | |
3 | 105 | |
0 | 105 | |
8 | 103 | |
9 | 102 | |
7 | 95 | |
Other values (2) | 82 | 6.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1346 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 213 | |
. | 160 | |
2 | 147 | |
5 | 126 | |
4 | 108 | |
3 | 105 | |
0 | 105 | |
8 | 103 | |
9 | 102 | |
7 | 95 | |
Other values (2) | 82 | 6.1% |
세대수
Real number (ℝ)
MISSING
 
Distinct | 60 |
---|---|
Distinct (%) | 78.9% |
Missing | 173 |
Missing (%) | 69.5% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 990.28947 |
Minimum | 276 |
---|---|
Maximum | 2185 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.3 KiB |
Quantile statistics
Minimum | 276 |
---|---|
5-th percentile | 519 |
Q1 | 639.25 |
median | 874 |
Q3 | 1283 |
95-th percentile | 1734 |
Maximum | 2185 |
Range | 1909 |
Interquartile range (IQR) | 643.75 |
Descriptive statistics
Standard deviation | 412.93063 |
---|---|
Coefficient of variation (CV) | 0.41697972 |
Kurtosis | -0.0060529718 |
Mean | 990.28947 |
Median Absolute Deviation (MAD) | 267.5 |
Skewness | 0.73510039 |
Sum | 75262 |
Variance | 170511.7 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1210 | 2 | 0.8% |
1435 | 2 | 0.8% |
1976 | 2 | 0.8% |
1600 | 2 | 0.8% |
1298 | 2 | 0.8% |
1734 | 2 | 0.8% |
1278 | 2 | 0.8% |
1233 | 2 | 0.8% |
1308 | 2 | 0.8% |
1060 | 2 | 0.8% |
Other values (50) | 56 | 22.5% |
(Missing) | 173 |
Value | Count | Frequency (%) |
276 | 1 | |
374 | 1 | |
500 | 1 | |
510 | 1 | |
522 | 1 | |
525 | 1 | |
536 | 1 | |
564 | 1 | |
570 | 1 | |
571 | 1 |
Value | Count | Frequency (%) |
2185 | 1 | |
1976 | 2 | |
1734 | 2 | |
1600 | 2 | |
1500 | 2 | |
1442 | 2 | |
1437 | 2 | |
1435 | 2 | |
1308 | 2 | |
1298 | 2 |
비고
Text
MISSING
 
Distinct | 3 |
---|---|
Distinct (%) | 75.0% |
Missing | 245 |
Missing (%) | 98.4% |
Memory size | 2.1 KiB |
Value | Count | Frequency (%) |
중앙집중 | 2 | |
공동주택제외 | 1 | |
상가 | 1 | |
제외 | 1 |
Most occurring characters
Value | Count | Frequency (%) |
중 | 4 | |
앙 | 2 | |
집 | 2 | |
제 | 2 | |
외 | 2 | |
공 | 1 | 5.3% |
동 | 1 | 5.3% |
주 | 1 | 5.3% |
택 | 1 | 5.3% |
상 | 1 | 5.3% |
Other values (2) | 2 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 18 | |
Space Separator | 1 | 5.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
중 | 4 | |
앙 | 2 | |
집 | 2 | |
제 | 2 | |
외 | 2 | |
공 | 1 | 5.6% |
동 | 1 | 5.6% |
주 | 1 | 5.6% |
택 | 1 | 5.6% |
상 | 1 | 5.6% |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 18 | |
Common | 1 | 5.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
중 | 4 | |
앙 | 2 | |
집 | 2 | |
제 | 2 | |
외 | 2 | |
공 | 1 | 5.6% |
동 | 1 | 5.6% |
주 | 1 | 5.6% |
택 | 1 | 5.6% |
상 | 1 | 5.6% |
Common
Value | Count | Frequency (%) |
1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 18 | |
ASCII | 1 | 5.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
중 | 4 | |
앙 | 2 | |
집 | 2 | |
제 | 2 | |
외 | 2 | |
공 | 1 | 5.6% |
동 | 1 | 5.6% |
주 | 1 | 5.6% |
택 | 1 | 5.6% |
상 | 1 | 5.6% |
ASCII
Value | Count | Frequency (%) |
1 |
세대수 | 비고 | |
---|---|---|
세대수 | 1.000 | NaN |
비고 | NaN | 1.000 |
건축물명 | 도로명주소 | 연면적 | 세대수 | 비고 | |
---|---|---|---|---|---|
0 | 동천마을주공아파트6단지 | 광주광역시 서구 하남대로710번길 5 | <NA> | 1308 | <NA> |
1 | 쌍촌주공아파트 | 광주광역시 서구 쌍학로 47 | <NA> | 1435 | <NA> |
2 | 빛고을파크 | 광주광역시 서구 화정로 105 | <NA> | 1100 | <NA> |
3 | 상무중흥아파트2단지 | 광주광역시 서구 치평로 77 | <NA> | 1108 | <NA> |
4 | 광천E편한세상 | 광주광역시 서구 화운로 278 | <NA> | 1096 | <NA> |
5 | 금호빛여울채아파트 | 광주광역시 서구 운천로32번길 23 | <NA> | 1500 | <NA> |
6 | 동천마을1단지아파트 | 광주광역시 서구 동천로 25 | <NA> | 1442 | <NA> |
7 | 풍암중흥아파트 | 광주광역시 서구 마재로 21 | <NA> | 1437 | <NA> |
8 | 화정라인동산아파트 | 광주광역시 서구 염화로45번길 17 | <NA> | 1060 | <NA> |
9 | 내방마을주공아파트 | 광주광역시 서구 화운로193번길 25 | <NA> | 1210 | <NA> |
건축물명 | 도로명주소 | 연면적 | 세대수 | 비고 | |
---|---|---|---|---|---|
239 | 디오빌 | 광주광역시 서구 시청로 41 | 37112.93 | <NA> | <NA> |
240 | 광주광역시도시공사 | 광주광역시 서구 시청로 26 | 32840.77 | <NA> | <NA> |
241 | 기아1,3공장 | 광주광역시 서구 화운로 277 | 298002.1 | <NA> | <NA> |
242 | 기아2-1공장 | 광주광역시 서구 월드컵4강로 277 | 35889.53 | <NA> | <NA> |
243 | 기아2공장 | 광주광역시 서구 화운로 211 | 202592.05 | <NA> | <NA> |
244 | 유스퀘어터미널 | 광주광역시 서구 무진대로 904 | 81277.79 | <NA> | <NA> |
245 | 광주신세계백화점 | 광주광역시 서구 무진대로 932 | 58432 | <NA> | <NA> |
246 | 이마트 신세계점 | 광주광역시 서구 죽봉대로 61 | 76386 | <NA> | <NA> |
247 | 서부농수산물도매시장 | 광주광역시 서구 매월2로 16 | 59702.56 | <NA> | <NA> |
248 | 금호월드 | 광주광역시 서구 군분2로 54 | 58019.67 | <NA> | <NA> |
Most frequently occurring
건축물명 | 도로명주소 | 연면적 | 세대수 | 비고 | # duplicates | |
---|---|---|---|---|---|---|
0 | BM타워 | 광주광역시 서구 상무중앙로 98 | 15579.24 | <NA> | <NA> | 2 |
1 | BYC주식회사 | 광주광역시 서구 상무중앙로 43 | 21935.23 | <NA> | <NA> | 2 |
2 | KBC플러스(호반써밋상가) | 광주광역시 서구 무진대로 919 | 27484.85 | <NA> | <NA> | 2 |
3 | LST주식회사 | 광주광역시 서구 매월2로15번길 15 | 20795.39 | <NA> | <NA> | 2 |
4 | 골든빌오피스텔 | 광주광역시 서구 시청로96번길 12 | 22898.58 | <NA> | <NA> | 2 |
5 | 골든힐스타워 | 광주광역시 서구 죽봉대로78번길 10 | 21975.5 | <NA> | <NA> | 2 |
6 | 광덕중고등학교 | 광주광역시 서구 화정로 202 | 23147.51 | <NA> | <NA> | 2 |
7 | 광주광역시 도시철도공사 | 광주광역시 서구 상무대로 760 | 27849.18 | <NA> | <NA> | 2 |
8 | 광주광역시 서구청 | 광주광역시 서구 경열로 33 | 23489.67 | <NA> | <NA> | 2 |
9 | 광주서석중고등학교 | 광주광역시 서구 화정로253번길 27 | 18811.23 | <NA> | <NA> | 2 |