Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 494 |
Missing cells | 490 |
Missing cells (%) | 19.8% |
Duplicate rows | 3 |
Duplicate rows (%) | 0.6% |
Total size in memory | 20.9 KiB |
Average record size in memory | 43.3 B |
Variable types
Text | 2 |
---|---|
Numeric | 3 |
Dataset
Description | 경기도 평택시 기계설비 성능점검 대상(건축물 연면적 1만㎡ 이상 일반건축물과 500세대 이상 공동주택 )현황에 대한 정보로 건물명, 도로명주소, 우편번호, 연면적 m2, 세대수 등에 대한 항목을 제공합니다.※ 문의 : 평택시 건축허가과(031-8024-4182) |
---|---|
Author | 경기도 평택시 |
URL | https://www.data.go.kr/data/15124643/fileData.do |
Dataset has 3 (0.6%) duplicate rows | Duplicates |
연면적 has 151 (30.6%) missing values | Missing |
세대수 has 339 (68.6%) missing values | Missing |
Reproduction
Analysis started | 2024-03-14 10:46:38.015610 |
---|---|
Analysis finished | 2024-03-14 10:46:40.455044 |
Duration | 2.44 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
건물명
Text
Distinct | 429 |
---|---|
Distinct (%) | 86.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
아파트 | 35 | 5.1% |
평택공장 | 25 | 3.7% |
엘지전자㈜ | 15 | 2.2% |
입주자대표회의 | 11 | 1.6% |
쌍용자동차㈜ | 8 | 1.2% |
한국토지주택공사 | 6 | 0.9% |
평택발전본부 | 6 | 0.9% |
한국서부발전㈜ | 6 | 0.9% |
동우화인켐㈜ | 5 | 0.7% |
평택 | 4 | 0.6% |
Other values (498) | 563 |
Most occurring characters
Value | Count | Frequency (%) |
㈜ | 216 | 4.2% |
192 | 3.8% | |
트 | 155 | 3.0% |
아 | 144 | 2.8% |
스 | 139 | 2.7% |
택 | 138 | 2.7% |
평 | 133 | 2.6% |
이 | 131 | 2.6% |
지 | 123 | 2.4% |
파 | 113 | 2.2% |
Other values (373) | 3635 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4364 | |
Other Symbol | 216 | 4.2% |
Space Separator | 192 | 3.8% |
Decimal Number | 91 | 1.8% |
Uppercase Letter | 85 | 1.7% |
Open Punctuation | 80 | 1.6% |
Close Punctuation | 78 | 1.5% |
Lowercase Letter | 5 | 0.1% |
Dash Punctuation | 4 | 0.1% |
Other Punctuation | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
트 | 155 | 3.6% |
아 | 144 | 3.3% |
스 | 139 | 3.2% |
택 | 138 | 3.2% |
평 | 133 | 3.0% |
이 | 131 | 3.0% |
지 | 123 | 2.8% |
파 | 113 | 2.6% |
자 | 81 | 1.9% |
공 | 66 | 1.5% |
Other values (337) | 3141 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 12 | |
L | 11 | |
S | 8 | 9.4% |
E | 7 | 8.2% |
A | 5 | 5.9% |
I | 5 | 5.9% |
G | 5 | 5.9% |
R | 4 | 4.7% |
O | 4 | 4.7% |
P | 4 | 4.7% |
Other values (9) | 20 |
Decimal Number
Value | Count | Frequency (%) |
2 | 28 | |
1 | 27 | |
3 | 16 | |
5 | 8 | 8.8% |
4 | 5 | 5.5% |
6 | 3 | 3.3% |
7 | 3 | 3.3% |
0 | 1 | 1.1% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 2 | |
& | 1 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 216 |
Space Separator
Value | Count | Frequency (%) |
192 |
Open Punctuation
Value | Count | Frequency (%) |
( | 80 |
Close Punctuation
Value | Count | Frequency (%) |
) | 78 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 5 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4580 | |
Common | 448 | 8.8% |
Latin | 91 | 1.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
㈜ | 216 | 4.7% |
트 | 155 | 3.4% |
아 | 144 | 3.1% |
스 | 139 | 3.0% |
택 | 138 | 3.0% |
평 | 133 | 2.9% |
이 | 131 | 2.9% |
지 | 123 | 2.7% |
파 | 113 | 2.5% |
자 | 81 | 1.8% |
Other values (338) | 3207 |
Latin
Value | Count | Frequency (%) |
K | 12 | |
L | 11 | |
S | 8 | 8.8% |
E | 7 | 7.7% |
e | 5 | 5.5% |
A | 5 | 5.5% |
I | 5 | 5.5% |
G | 5 | 5.5% |
R | 4 | 4.4% |
O | 4 | 4.4% |
Other values (11) | 25 |
Common
Value | Count | Frequency (%) |
192 | ||
( | 80 | |
) | 78 | |
2 | 28 | 6.2% |
1 | 27 | 6.0% |
3 | 16 | 3.6% |
5 | 8 | 1.8% |
4 | 5 | 1.1% |
- | 4 | 0.9% |
6 | 3 | 0.7% |
Other values (4) | 7 | 1.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4364 | |
ASCII | 538 | 10.5% |
None | 216 | 4.2% |
Number Forms | 1 | < 0.1% |
Most frequent character per block
None
Value | Count | Frequency (%) |
㈜ | 216 |
ASCII
Value | Count | Frequency (%) |
192 | ||
( | 80 | |
) | 78 | |
2 | 28 | 5.2% |
1 | 27 | 5.0% |
3 | 16 | 3.0% |
K | 12 | 2.2% |
L | 11 | 2.0% |
S | 8 | 1.5% |
5 | 8 | 1.5% |
Other values (24) | 78 |
Hangul
Value | Count | Frequency (%) |
트 | 155 | 3.6% |
아 | 144 | 3.3% |
스 | 139 | 3.2% |
택 | 138 | 3.2% |
평 | 133 | 3.0% |
이 | 131 | 3.0% |
지 | 123 | 2.8% |
파 | 113 | 2.6% |
자 | 81 | 1.9% |
공 | 66 | 1.5% |
Other values (337) | 3141 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 |
도로명주소
Text
Distinct | 434 |
---|---|
Distinct (%) | 87.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
Length
Max length | 32 |
---|---|
Median length | 29 |
Mean length | 21.495951 |
Min length | 15 |
Characters and Unicode
Total characters | 10619 |
---|---|
Distinct characters | 160 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 404 ? |
---|---|
Unique (%) | 81.8% |
Sample
1st row | 경기도 평택시 서동대로 3825 (용이동) |
---|---|
2nd row | 경기도 평택시 포승읍 평택항로156번길 36 |
3rd row | 경기도 평택시 산단로16번길 43(모곡동) |
4th row | 경기도 평택시 포승읍 포승공단로118번길 103 |
5th row | 경기도 평택시 포승읍 평택항만길 246 |
Value | Count | Frequency (%) |
경기도 | 494 | |
평택시 | 494 | |
포승읍 | 75 | 3.3% |
진위면 | 48 | 2.1% |
청북읍 | 44 | 1.9% |
고덕동 | 33 | 1.4% |
안중읍 | 22 | 1.0% |
경기대로 | 18 | 0.8% |
엘지로 | 15 | 0.7% |
222외 | 15 | 0.7% |
Other values (569) | 1044 |
Most occurring characters
Value | Count | Frequency (%) |
1808 | 17.0% | |
평 | 564 | 5.3% |
택 | 541 | 5.1% |
경 | 512 | 4.8% |
기 | 512 | 4.8% |
도 | 505 | 4.8% |
시 | 502 | 4.7% |
로 | 424 | 4.0% |
1 | 357 | 3.4% |
동 | 303 | 2.9% |
Other values (150) | 4591 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6560 | |
Space Separator | 1808 | 17.0% |
Decimal Number | 1672 | 15.7% |
Close Punctuation | 254 | 2.4% |
Open Punctuation | 254 | 2.4% |
Dash Punctuation | 58 | 0.5% |
Other Punctuation | 10 | 0.1% |
Uppercase Letter | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
평 | 564 | 8.6% |
택 | 541 | 8.2% |
경 | 512 | 7.8% |
기 | 512 | 7.8% |
도 | 505 | 7.7% |
시 | 502 | 7.7% |
로 | 424 | 6.5% |
동 | 303 | 4.6% |
길 | 164 | 2.5% |
읍 | 155 | 2.4% |
Other values (132) | 2378 |
Decimal Number
Value | Count | Frequency (%) |
1 | 357 | |
2 | 281 | |
5 | 180 | |
3 | 175 | |
4 | 131 | 7.8% |
6 | 127 | 7.6% |
7 | 112 | 6.7% |
0 | 111 | 6.6% |
9 | 103 | 6.2% |
8 | 95 | 5.7% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 1 | |
I | 1 | |
G | 1 |
Space Separator
Value | Count | Frequency (%) |
1808 |
Close Punctuation
Value | Count | Frequency (%) |
) | 254 |
Open Punctuation
Value | Count | Frequency (%) |
( | 254 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 58 |
Other Punctuation
Value | Count | Frequency (%) |
, | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6560 | |
Common | 4056 | |
Latin | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
평 | 564 | 8.6% |
택 | 541 | 8.2% |
경 | 512 | 7.8% |
기 | 512 | 7.8% |
도 | 505 | 7.7% |
시 | 502 | 7.7% |
로 | 424 | 6.5% |
동 | 303 | 4.6% |
길 | 164 | 2.5% |
읍 | 155 | 2.4% |
Other values (132) | 2378 |
Common
Value | Count | Frequency (%) |
1808 | ||
1 | 357 | 8.8% |
2 | 281 | 6.9% |
) | 254 | 6.3% |
( | 254 | 6.3% |
5 | 180 | 4.4% |
3 | 175 | 4.3% |
4 | 131 | 3.2% |
6 | 127 | 3.1% |
7 | 112 | 2.8% |
Other values (5) | 377 | 9.3% |
Latin
Value | Count | Frequency (%) |
L | 1 | |
I | 1 | |
G | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6560 | |
ASCII | 4059 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1808 | ||
1 | 357 | 8.8% |
2 | 281 | 6.9% |
) | 254 | 6.3% |
( | 254 | 6.3% |
5 | 180 | 4.4% |
3 | 175 | 4.3% |
4 | 131 | 3.2% |
6 | 127 | 3.1% |
7 | 112 | 2.8% |
Other values (8) | 380 | 9.4% |
Hangul
Value | Count | Frequency (%) |
평 | 564 | 8.6% |
택 | 541 | 8.2% |
경 | 512 | 7.8% |
기 | 512 | 7.8% |
도 | 505 | 7.7% |
시 | 502 | 7.7% |
로 | 424 | 6.5% |
동 | 303 | 4.6% |
길 | 164 | 2.5% |
읍 | 155 | 2.4% |
Other values (132) | 2378 |
우편번호
Real number (ℝ)
Distinct | 169 |
---|---|
Distinct (%) | 34.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 17869.166 |
Minimum | 17700 |
---|---|
Maximum | 18034 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 17700 |
---|---|
5-th percentile | 17709 |
Q1 | 17780.5 |
median | 17858 |
Q3 | 17960 |
95-th percentile | 18021 |
Maximum | 18034 |
Range | 334 |
Interquartile range (IQR) | 179.5 |
Descriptive statistics
Standard deviation | 107.05556 |
---|---|
Coefficient of variation (CV) | 0.0059910777 |
Kurtosis | -1.3714919 |
Mean | 17869.166 |
Median Absolute Deviation (MAD) | 101 |
Skewness | -0.0070986801 |
Sum | 8827368 |
Variance | 11460.893 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
18014 | 23 | 4.7% |
17709 | 20 | 4.0% |
17959 | 16 | 3.2% |
17960 | 14 | 2.8% |
18008 | 12 | 2.4% |
17956 | 12 | 2.4% |
17749 | 9 | 1.8% |
17812 | 9 | 1.8% |
17792 | 8 | 1.6% |
18021 | 8 | 1.6% |
Other values (159) | 363 |
Value | Count | Frequency (%) |
17700 | 1 | 0.2% |
17703 | 1 | 0.2% |
17704 | 5 | 1.0% |
17706 | 2 | 0.4% |
17708 | 6 | 1.2% |
17709 | 20 | |
17712 | 6 | 1.2% |
17713 | 2 | 0.4% |
17714 | 3 | 0.6% |
17715 | 1 | 0.2% |
Value | Count | Frequency (%) |
18034 | 1 | 0.2% |
18033 | 2 | 0.4% |
18032 | 6 | |
18031 | 3 | |
18030 | 1 | 0.2% |
18029 | 1 | 0.2% |
18028 | 2 | 0.4% |
18027 | 1 | 0.2% |
18026 | 1 | 0.2% |
18025 | 5 |
연면적
Real number (ℝ)
MISSING
 
Distinct | 336 |
---|---|
Distinct (%) | 98.0% |
Missing | 151 |
Missing (%) | 30.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20435.729 |
Minimum | 730 |
---|---|
Maximum | 101671.15 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 730 |
---|---|
5-th percentile | 10357.384 |
Q1 | 12150.22 |
median | 14908.79 |
Q3 | 22811.99 |
95-th percentile | 49210.114 |
Maximum | 101671.15 |
Range | 100941.15 |
Interquartile range (IQR) | 10661.77 |
Descriptive statistics
Standard deviation | 13985.095 |
---|---|
Coefficient of variation (CV) | 0.68434529 |
Kurtosis | 7.7337391 |
Mean | 20435.729 |
Median Absolute Deviation (MAD) | 3736.77 |
Skewness | 2.5084178 |
Sum | 7009455.2 |
Variance | 1.9558289 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
17483.16 | 4 | 0.8% |
38128.8 | 2 | 0.4% |
13723.77 | 2 | 0.4% |
12894.62 | 2 | 0.4% |
11337.23 | 2 | 0.4% |
24106.24 | 1 | 0.2% |
22682.35 | 1 | 0.2% |
19061.5 | 1 | 0.2% |
22941.63 | 1 | 0.2% |
23675.29 | 1 | 0.2% |
Other values (326) | 326 | |
(Missing) | 151 |
Value | Count | Frequency (%) |
730.0 | 1 | |
3266.33 | 1 | |
10034.42 | 1 | |
10121.24 | 1 | |
10132.55 | 1 | |
10134.47 | 1 | |
10172.56 | 1 | |
10175.09 | 1 | |
10225.0 | 1 | |
10236.29 | 1 |
Value | Count | Frequency (%) |
101671.15 | 1 | |
88750.9 | 1 | |
84669.36 | 1 | |
81264.73 | 1 | |
73580.41 | 1 | |
71421.44 | 1 | |
66560.64 | 1 | |
61415.76 | 1 | |
59627.71 | 1 | |
57806.13 | 1 |
세대수
Real number (ℝ)
MISSING
 
Distinct | 138 |
---|---|
Distinct (%) | 89.0% |
Missing | 339 |
Missing (%) | 68.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 837.43226 |
Minimum | 13 |
---|---|
Maximum | 2530 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 13 |
---|---|
5-th percentile | 394.2 |
Q1 | 612.5 |
median | 737 |
Q3 | 946.5 |
95-th percentile | 1593.7 |
Maximum | 2530 |
Range | 2517 |
Interquartile range (IQR) | 334 |
Descriptive statistics
Standard deviation | 401.1253 |
---|---|
Coefficient of variation (CV) | 0.47899433 |
Kurtosis | 3.6085066 |
Mean | 837.43226 |
Median Absolute Deviation (MAD) | 154 |
Skewness | 1.540428 |
Sum | 129802 |
Variance | 160901.51 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
715 | 3 | 0.6% |
550 | 3 | 0.6% |
632 | 2 | 0.4% |
1035 | 2 | 0.4% |
690 | 2 | 0.4% |
684 | 2 | 0.4% |
761 | 2 | 0.4% |
383 | 2 | 0.4% |
650 | 2 | 0.4% |
29 | 2 | 0.4% |
Other values (128) | 133 | 26.9% |
(Missing) | 339 |
Value | Count | Frequency (%) |
13 | 1 | |
29 | 2 | |
48 | 1 | |
291 | 1 | |
350 | 1 | |
383 | 2 | |
399 | 1 | |
447 | 1 | |
500 | 1 | |
506 | 1 |
Value | Count | Frequency (%) |
2530 | 1 | |
2324 | 1 | |
2124 | 1 | |
1999 | 1 | |
1943 | 1 | |
1884 | 1 | |
1674 | 1 | |
1600 | 1 | |
1591 | 1 | |
1590 | 1 |
우편번호 | 연면적 | 세대수 | |
---|---|---|---|
우편번호 | 1.000 | 0.000 | 0.296 |
연면적 | 0.000 | 1.000 | NaN |
세대수 | 0.296 | NaN | 1.000 |
우편번호 | 연면적 | 세대수 | |
---|---|---|---|
우편번호 | 1.000 | 0.044 | 0.214 |
연면적 | 0.044 | 1.000 | 0.051 |
세대수 | 0.214 | 0.051 | 1.000 |
건물명 | 도로명주소 | 우편번호 | 연면적 | 세대수 | |
---|---|---|---|---|---|
0 | 평택대학교 | 경기도 평택시 서동대로 3825 (용이동) | 17869 | 10461.48 | <NA> |
1 | 한국단자공업㈜ | 경기도 평택시 포승읍 평택항로156번길 36 | 17960 | 10617.23 | <NA> |
2 | 롯데알미늄㈜ 평택공장 | 경기도 평택시 산단로16번길 43(모곡동) | 17746 | 10421.99 | <NA> |
3 | ㈜새한산업 | 경기도 평택시 포승읍 포승공단로118번길 103 | 17960 | 13618.77 | <NA> |
4 | 율촌화학㈜ 평택공장 | 경기도 평택시 포승읍 평택항만길 246 | 17958 | 11163.9 | <NA> |
5 | EPS KOREA㈜ | 경기도 평택시 포승읍 평택항로 294 | 17956 | 13154.62 | <NA> |
6 | LG전자㈜ 평택칠러공장 | 경기도 평택시 진위면 동부대로 120 | 17712 | 12919.54 | <NA> |
7 | (주)경동나비엔(㈜경동나비엔 서탄공장) | 경기도 평택시 서탄면 수월암길 95 | 17704 | 14948.12 | <NA> |
8 | 롯데제과㈜ 평택공장 | 경기도 평택시 진위면 경기대로 1952 | 17713 | 12629.87 | <NA> |
9 | 한국서부발전㈜ 평택발전본부 | 경기도 평택시 포승읍 남양만로 227 | 17949 | 11159.46 | <NA> |
건물명 | 도로명주소 | 우편번호 | 연면적 | 세대수 | |
---|---|---|---|---|---|
484 | 동우화인켐㈜ 평택공장 | 경기도 평택시 포승읍 포승공단로117번길 35 | 17956 | 52497.12 | <NA> |
485 | AKS&D㈜ AK평택점 | 경기도 평택시 평택로 51(평택동) | 17917 | 81264.73 | <NA> |
486 | 삼성전자㈜ 평택캠퍼스 | 경기도 평택시 삼성로 114 (고덕동) | 17786 | <NA> | <NA> |
487 | 마제스트타워 | 경기도 평택시 산단로16번길 12 (모곡동) | 17746 | 55555.76 | <NA> |
488 | (주)경동나비엔(㈜경동나비엔 서탄공장) | 경기도 평택시 서탄면 수월암길 95 | 17704 | 40353.33 | <NA> |
489 | ㈜코람코자산신탁(고덕지식공작소아이타워) | 경기도 평택시 고덕면 도시지원로 121 | 18021 | 30814.81 | <NA> |
490 | 우리자산신탁㈜(G1지식산업센터) | 경기도 평택시 고덕면 도시지원1길 116 | 18021 | 54458.74 | <NA> |
491 | ㈜아이엠코퍼레이션(고덕헤리움시그니어) | 경기도 평택시 고덕여염9길 51 (고덕동) | 18014 | 84669.36 | <NA> |
492 | LG전자㈜ 평택칠러공장 | 경기도 평택시 진위면 동부대로 120 | 17712 | 39432.47 | <NA> |
493 | 삼아알미늄㈜ | 경기도 평택시 포승읍 평택항로 92 | 17960 | 38347.18 | <NA> |
Most frequently occurring
건물명 | 도로명주소 | 우편번호 | 연면적 | 세대수 | # duplicates | |
---|---|---|---|---|---|---|
2 | 한국서부발전㈜ 평택발전본부 | 경기도 평택시 포승읍 남양만로 227 | 17949 | 17483.16 | <NA> | 4 |
0 | ㈜베스트원(평택고덕아이파크) | 경기도 평택시 경기대로 945(장당동) | 17787 | 38128.8 | <NA> | 2 |
1 | 고덕국제신도시금호어울림 | 경기도 평택시 고덕로 191 (고덕동) | 18019 | <NA> | 1582 | 2 |