Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 832 |
Missing cells | 48 |
Missing cells (%) | 1.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 34.3 KiB |
Average record size in memory | 42.2 B |
Variable types
Categorical | 1 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 경기도 화성시 기계설비 성능점검 대상 현황 데이터로 건축물용도, 건물명(소유자명), 도로명주소, 우편번호, 건축물연면적을 포함합니다. |
---|---|
Author | 경기도 화성시 |
URL | https://www.data.go.kr/data/15124797/fileData.do |
Reproduction
Analysis started | 2023-12-12 17:28:00.013482 |
---|---|
Analysis finished | 2023-12-12 17:28:01.210776 |
Duration | 1.2 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
건축물용도
Categorical
Distinct | 44 |
---|---|
Distinct (%) | 5.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.6 KiB |
공동주택 | |
---|---|
공장 | |
교육연구시설 | |
업무시설 | |
제1종근린생활시설 | |
Other values (39) |
Length
Max length | 28 |
---|---|
Median length | 4 |
Mean length | 4.7644231 |
Min length | 2 |
Unique
Unique | 25 ? |
---|---|
Unique (%) | 3.0% |
Sample
1st row | 공장 |
---|---|
2nd row | 교육연구시설 |
3rd row | 공장 |
4th row | 공장 |
5th row | 공장 |
Common Values
Value | Count | Frequency (%) |
공동주택 | 332 | |
공장 | 147 | |
교육연구시설 | 125 | 15.0% |
업무시설 | 57 | 6.9% |
제1종근린생활시설 | 35 | 4.2% |
제2종근린생활시설 | 28 | 3.4% |
판매시설 | 21 | 2.5% |
자동차관련시설 | 16 | 1.9% |
숙박시설 | 9 | 1.1% |
업무시설, 판매시설 | 8 | 1.0% |
Other values (34) | 54 | 6.5% |
Length
Value | Count | Frequency (%) |
공동주택 | 332 | |
공장 | 151 | |
교육연구시설 | 128 | 14.7% |
업무시설 | 76 | 8.8% |
제1종근린생활시설 | 35 | 4.0% |
판매시설 | 31 | 3.6% |
제2종근린생활시설 | 29 | 3.3% |
자동차관련시설 | 16 | 1.8% |
숙박시설 | 9 | 1.0% |
문화및집회시설 | 7 | 0.8% |
Other values (23) | 54 | 6.2% |
건물명(소유자명)
Text
MISSING
 
Distinct | 746 |
---|---|
Distinct (%) | 95.2% |
Missing | 48 |
Missing (%) | 5.8% |
Memory size | 6.6 KiB |
Length
Max length | 31 |
---|---|
Median length | 22 |
Mean length | 9.7704082 |
Min length | 2 |
Characters and Unicode
Total characters | 7660 |
---|---|
Distinct characters | 445 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 715 ? |
---|---|
Unique (%) | 91.2% |
Sample
1st row | 삼성전자(주) |
---|---|
2nd row | 현대.기아자동차(주)연구개발본부 |
3rd row | 기아자동차 화성공장 |
4th row | 기아자동차 화성공장 |
5th row | 금강펜테리움 IX타워 |
Value | Count | Frequency (%) |
동탄역 | 52 | 4.1% |
동탄 | 35 | 2.8% |
아파트 | 15 | 1.2% |
향남시범 | 12 | 0.9% |
반도유보라 | 11 | 0.9% |
더 | 9 | 0.7% |
화성 | 9 | 0.7% |
오피스텔 | 8 | 0.6% |
화성공장 | 8 | 0.6% |
롯데캐슬 | 8 | 0.6% |
Other values (883) | 1098 |
Most occurring characters
Value | Count | Frequency (%) |
490 | 6.4% | |
동 | 303 | 4.0% |
탄 | 244 | 3.2% |
아 | 178 | 2.3% |
스 | 178 | 2.3% |
이 | 170 | 2.2% |
트 | 166 | 2.2% |
파 | 155 | 2.0% |
마 | 128 | 1.7% |
시 | 116 | 1.5% |
Other values (435) | 5532 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6569 | |
Space Separator | 490 | 6.4% |
Decimal Number | 218 | 2.8% |
Uppercase Letter | 194 | 2.5% |
Lowercase Letter | 46 | 0.6% |
Open Punctuation | 36 | 0.5% |
Close Punctuation | 36 | 0.5% |
Other Symbol | 32 | 0.4% |
Other Punctuation | 22 | 0.3% |
Letter Number | 10 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 303 | 4.6% |
탄 | 244 | 3.7% |
아 | 178 | 2.7% |
스 | 178 | 2.7% |
이 | 170 | 2.6% |
트 | 166 | 2.5% |
파 | 155 | 2.4% |
마 | 128 | 1.9% |
시 | 116 | 1.8% |
지 | 116 | 1.8% |
Other values (373) | 4815 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 20 | 10.3% |
I | 18 | 9.3% |
A | 17 | 8.8% |
L | 15 | 7.7% |
E | 15 | 7.7% |
S | 15 | 7.7% |
M | 13 | 6.7% |
H | 11 | 5.7% |
O | 10 | 5.2% |
G | 8 | 4.1% |
Other values (14) | 52 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 9 | |
n | 5 | |
c | 4 | |
a | 4 | |
l | 4 | |
o | 3 | 6.5% |
r | 3 | 6.5% |
t | 3 | 6.5% |
b | 2 | 4.3% |
d | 2 | 4.3% |
Other values (6) | 7 |
Decimal Number
Value | Count | Frequency (%) |
2 | 77 | |
1 | 46 | |
3 | 23 | 10.6% |
0 | 20 | 9.2% |
5 | 13 | 6.0% |
4 | 11 | 5.0% |
6 | 9 | 4.1% |
8 | 8 | 3.7% |
7 | 6 | 2.8% |
9 | 5 | 2.3% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 7 | |
Ⅳ | 1 | 10.0% |
Ⅲ | 1 | 10.0% |
Ⅰ | 1 | 10.0% |
Other Punctuation
Value | Count | Frequency (%) |
. | 18 | |
, | 3 | 13.6% |
& | 1 | 4.5% |
Space Separator
Value | Count | Frequency (%) |
490 |
Open Punctuation
Value | Count | Frequency (%) |
( | 36 |
Close Punctuation
Value | Count | Frequency (%) |
) | 36 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 32 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6600 | |
Common | 809 | 10.6% |
Latin | 250 | 3.3% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 303 | 4.6% |
탄 | 244 | 3.7% |
아 | 178 | 2.7% |
스 | 178 | 2.7% |
이 | 170 | 2.6% |
트 | 166 | 2.5% |
파 | 155 | 2.3% |
마 | 128 | 1.9% |
시 | 116 | 1.8% |
지 | 116 | 1.8% |
Other values (373) | 4846 |
Latin
Value | Count | Frequency (%) |
T | 20 | 8.0% |
I | 18 | 7.2% |
A | 17 | 6.8% |
L | 15 | 6.0% |
E | 15 | 6.0% |
S | 15 | 6.0% |
M | 13 | 5.2% |
H | 11 | 4.4% |
O | 10 | 4.0% |
e | 9 | 3.6% |
Other values (34) | 107 |
Common
Value | Count | Frequency (%) |
490 | ||
2 | 77 | 9.5% |
1 | 46 | 5.7% |
( | 36 | 4.4% |
) | 36 | 4.4% |
3 | 23 | 2.8% |
0 | 20 | 2.5% |
. | 18 | 2.2% |
5 | 13 | 1.6% |
4 | 11 | 1.4% |
Other values (7) | 39 | 4.8% |
Han
Value | Count | Frequency (%) |
家 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6568 | |
ASCII | 1049 | 13.7% |
None | 32 | 0.4% |
Number Forms | 10 | 0.1% |
CJK | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
490 | ||
2 | 77 | 7.3% |
1 | 46 | 4.4% |
( | 36 | 3.4% |
) | 36 | 3.4% |
3 | 23 | 2.2% |
0 | 20 | 1.9% |
T | 20 | 1.9% |
I | 18 | 1.7% |
. | 18 | 1.7% |
Other values (47) | 265 |
Hangul
Value | Count | Frequency (%) |
동 | 303 | 4.6% |
탄 | 244 | 3.7% |
아 | 178 | 2.7% |
스 | 178 | 2.7% |
이 | 170 | 2.6% |
트 | 166 | 2.5% |
파 | 155 | 2.4% |
마 | 128 | 1.9% |
시 | 116 | 1.8% |
지 | 116 | 1.8% |
Other values (372) | 4814 |
None
Value | Count | Frequency (%) |
㈜ | 32 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 7 | |
Ⅳ | 1 | 10.0% |
Ⅲ | 1 | 10.0% |
Ⅰ | 1 | 10.0% |
CJK
Value | Count | Frequency (%) |
家 | 1 |
도로명주소
Text
Distinct | 814 |
---|---|
Distinct (%) | 97.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.6 KiB |
Length
Max length | 35 |
---|---|
Median length | 26 |
Mean length | 18.877404 |
Min length | 13 |
Characters and Unicode
Total characters | 15706 |
---|---|
Distinct characters | 181 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 799 ? |
---|---|
Unique (%) | 96.0% |
Sample
1st row | 경기도 화성시 삼성전자로 1 |
---|---|
2nd row | 경기도 화성시 남양읍 현대연구소로 150 |
3rd row | 경기도 화성시 우정읍 기아자동차로 95 |
4th row | 경기도 화성시 우정읍 기아자동차로 95 |
5th row | 경기도 화성시 동탄첨단산업1로 27 |
Value | Count | Frequency (%) |
화성시 | 834 | |
경기도 | 833 | |
향남읍 | 80 | 2.2% |
봉담읍 | 60 | 1.7% |
남양읍 | 37 | 1.0% |
동탄대로 | 31 | 0.9% |
동탄기흥로 | 29 | 0.8% |
동탄반석로 | 26 | 0.7% |
동탄순환대로 | 20 | 0.6% |
동탄대로시범길 | 19 | 0.5% |
Other values (734) | 1635 |
Most occurring characters
Value | Count | Frequency (%) |
2772 | ||
성 | 883 | 5.6% |
시 | 876 | 5.6% |
기 | 873 | 5.6% |
화 | 861 | 5.5% |
도 | 853 | 5.4% |
경 | 836 | 5.3% |
로 | 722 | 4.6% |
1 | 643 | 4.1% |
동 | 441 | 2.8% |
Other values (171) | 5946 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9838 | |
Decimal Number | 2885 | 18.4% |
Space Separator | 2772 | 17.6% |
Dash Punctuation | 190 | 1.2% |
Close Punctuation | 7 | < 0.1% |
Open Punctuation | 7 | < 0.1% |
Other Punctuation | 7 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
성 | 883 | 9.0% |
시 | 876 | 8.9% |
기 | 873 | 8.9% |
화 | 861 | 8.8% |
도 | 853 | 8.7% |
경 | 836 | 8.5% |
로 | 722 | 7.3% |
동 | 441 | 4.5% |
탄 | 414 | 4.2% |
길 | 370 | 3.8% |
Other values (155) | 2709 |
Decimal Number
Value | Count | Frequency (%) |
1 | 643 | |
2 | 424 | |
3 | 304 | |
4 | 266 | |
6 | 250 | 8.7% |
5 | 242 | 8.4% |
7 | 217 | 7.5% |
0 | 203 | 7.0% |
8 | 169 | 5.9% |
9 | 167 | 5.8% |
Other Punctuation
Value | Count | Frequency (%) |
. | 4 | |
, | 3 |
Space Separator
Value | Count | Frequency (%) |
2772 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 190 |
Close Punctuation
Value | Count | Frequency (%) |
) | 7 |
Open Punctuation
Value | Count | Frequency (%) |
( | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9838 | |
Common | 5868 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
성 | 883 | 9.0% |
시 | 876 | 8.9% |
기 | 873 | 8.9% |
화 | 861 | 8.8% |
도 | 853 | 8.7% |
경 | 836 | 8.5% |
로 | 722 | 7.3% |
동 | 441 | 4.5% |
탄 | 414 | 4.2% |
길 | 370 | 3.8% |
Other values (155) | 2709 |
Common
Value | Count | Frequency (%) |
2772 | ||
1 | 643 | 11.0% |
2 | 424 | 7.2% |
3 | 304 | 5.2% |
4 | 266 | 4.5% |
6 | 250 | 4.3% |
5 | 242 | 4.1% |
7 | 217 | 3.7% |
0 | 203 | 3.5% |
- | 190 | 3.2% |
Other values (6) | 357 | 6.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9838 | |
ASCII | 5868 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2772 | ||
1 | 643 | 11.0% |
2 | 424 | 7.2% |
3 | 304 | 5.2% |
4 | 266 | 4.5% |
6 | 250 | 4.3% |
5 | 242 | 4.1% |
7 | 217 | 3.7% |
0 | 203 | 3.5% |
- | 190 | 3.2% |
Other values (6) | 357 | 6.1% |
Hangul
Value | Count | Frequency (%) |
성 | 883 | 9.0% |
시 | 876 | 8.9% |
기 | 873 | 8.9% |
화 | 861 | 8.8% |
도 | 853 | 8.7% |
경 | 836 | 8.5% |
로 | 722 | 7.3% |
동 | 441 | 4.5% |
탄 | 414 | 4.2% |
길 | 370 | 3.8% |
Other values (155) | 2709 |
우편번호
Real number (ℝ)
Distinct | 253 |
---|---|
Distinct (%) | 30.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 18452.528 |
Minimum | 18221 |
---|---|
Maximum | 18635 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 7.4 KiB |
Quantile statistics
Minimum | 18221 |
---|---|
5-th percentile | 18268 |
Q1 | 18406.75 |
median | 18469 |
Q3 | 18499 |
95-th percentile | 18610 |
Maximum | 18635 |
Range | 414 |
Interquartile range (IQR) | 92.25 |
Descriptive statistics
Standard deviation | 94.768953 |
---|---|
Coefficient of variation (CV) | 0.005135825 |
Kurtosis | -0.16141331 |
Mean | 18452.528 |
Median Absolute Deviation (MAD) | 41 |
Skewness | -0.39636949 |
Sum | 15352503 |
Variance | 8981.1545 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
18478 | 25 | 3.0% |
18479 | 25 | 3.0% |
18469 | 24 | 2.9% |
18487 | 20 | 2.4% |
18450 | 14 | 1.7% |
18449 | 12 | 1.4% |
18476 | 12 | 1.4% |
18454 | 12 | 1.4% |
18468 | 12 | 1.4% |
18484 | 11 | 1.3% |
Other values (243) | 665 |
Value | Count | Frequency (%) |
18221 | 2 | 0.2% |
18236 | 2 | 0.2% |
18237 | 7 | |
18238 | 3 | |
18239 | 2 | 0.2% |
18241 | 1 | 0.1% |
18242 | 2 | 0.2% |
18244 | 4 | |
18247 | 1 | 0.1% |
18256 | 1 | 0.1% |
Value | Count | Frequency (%) |
18635 | 1 | 0.1% |
18631 | 1 | 0.1% |
18629 | 1 | 0.1% |
18627 | 2 | 0.2% |
18626 | 1 | 0.1% |
18623 | 8 | |
18622 | 8 | |
18621 | 1 | 0.1% |
18617 | 1 | 0.1% |
18616 | 1 | 0.1% |
건축물연면적
Real number (ℝ)
SKEWED
 
Distinct | 775 |
---|---|
Distinct (%) | 93.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20313.228 |
Minimum | 312 |
---|---|
Maximum | 2724340.3 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 7.4 KiB |
Quantile statistics
Minimum | 312 |
---|---|
5-th percentile | 473.85 |
Q1 | 849.25 |
median | 11502.425 |
Q3 | 17192.143 |
95-th percentile | 50761.03 |
Maximum | 2724340.3 |
Range | 2724028.3 |
Interquartile range (IQR) | 16342.893 |
Descriptive statistics
Standard deviation | 105134.18 |
---|---|
Coefficient of variation (CV) | 5.175651 |
Kurtosis | 535.3868 |
Mean | 20313.228 |
Median Absolute Deviation (MAD) | 10497.925 |
Skewness | 21.648363 |
Sum | 16900605 |
Variance | 1.1053195 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
872.0 | 3 | 0.4% |
608.0 | 3 | 0.4% |
470.0 | 3 | 0.4% |
498.0 | 3 | 0.4% |
1005.0 | 3 | 0.4% |
545.0 | 3 | 0.4% |
622.0 | 3 | 0.4% |
514.0 | 3 | 0.4% |
536.0 | 2 | 0.2% |
534.0 | 2 | 0.2% |
Other values (765) | 804 |
Value | Count | Frequency (%) |
312.0 | 1 | |
326.0 | 1 | |
330.0 | 1 | |
344.0 | 1 | |
352.0 | 1 | |
357.0 | 1 | |
361.0 | 1 | |
365.0 | 1 | |
367.0 | 1 | |
376.0 | 1 |
Value | Count | Frequency (%) |
2724340.32 | 1 | |
843922.76 | 1 | |
772228.76 | 1 | |
333571.89 | 1 | |
287024.48 | 1 | |
277416.07 | 1 | |
276457.0 | 1 | |
238551.15 | 1 | |
142799.07 | 1 | |
123177.01 | 1 |
건축물용도 | 우편번호 | 건축물연면적 | |
---|---|---|---|
건축물용도 | 1.000 | 0.418 | 0.000 |
우편번호 | 0.418 | 1.000 | 0.112 |
건축물연면적 | 0.000 | 0.112 | 1.000 |
우편번호 | 건축물연면적 | 건축물용도 | |
---|---|---|---|
우편번호 | 1.000 | 0.194 | 0.155 |
건축물연면적 | 0.194 | 1.000 | 0.000 |
건축물용도 | 0.155 | 0.000 | 1.000 |
건축물용도 | 건물명(소유자명) | 도로명주소 | 우편번호 | 건축물연면적 | |
---|---|---|---|---|---|
0 | 공장 | 삼성전자(주) | 경기도 화성시 삼성전자로 1 | 18448 | 2724340.32 |
1 | 교육연구시설 | 현대.기아자동차(주)연구개발본부 | 경기도 화성시 남양읍 현대연구소로 150 | 18280 | 843922.76 |
2 | 공장 | 기아자동차 화성공장 | 경기도 화성시 우정읍 기아자동차로 95 | 18571 | 772228.76 |
3 | 공장 | 기아자동차 화성공장 | 경기도 화성시 우정읍 기아자동차로 95 | 18571 | 333571.89 |
4 | 공장 | 금강펜테리움 IX타워 | 경기도 화성시 동탄첨단산업1로 27 | 18469 | 287024.48 |
5 | 교육연구시설 | 수원대학교 | 경기도 화성시 봉담읍 와우안길 17 | 18323 | 277416.07 |
6 | 판매시설 | 동탄역 롯데캐슬(롯데백화점) | 경기도 화성시 동탄역로 160 | 18478 | 276457.0 |
7 | 교육연구시설 | 장안대학교 | 경기도 화성시 봉담읍 삼천병마로 1182 | 18331 | 142799.07 |
8 | 교육연구시설 | 수원과학대학교 | 경기도 화성시 정남면 세자로 288 | 18516 | 111353.01 |
9 | 의료시설 | 한림대학교의료원 | 경기도 화성시 큰재봉길 7 | 18450 | 101795.47 |
건축물용도 | 건물명(소유자명) | 도로명주소 | 우편번호 | 건축물연면적 | |
---|---|---|---|---|---|
822 | 공동주택 | 시티프라디움4차아파트 | 경기도 화성시 남양읍 남양로862번길 13 | 18264 | 556.0 |
823 | 공동주택 | 우미린 센트포레1단지 | 경기도 화성시 장조4로 13 | 18354 | 650.0 |
824 | 공동주택 | 남양리젠시빌란트아파트 | 경기도 화성시 남양읍 시청로102번길 52 | 18268 | 380.0 |
825 | 공동주택 | 동탄역헤리엇 | 경기도 화성시 동탄역로 54 | 18481 | 428.0 |
826 | 공동주택 | 에듀시티파라곤 | 경기도 화성시 봉담읍 동화서북안길 10 | 18298 | 600.0 |
827 | 공동주택 | 화성시청역 센트럴파크 서희스타힐스3단지 | 경기도 화성시 남양읍 화성시청역로 14 | 18269 | 847.0 |
828 | 공동주택 | 화성동탄2 LH행복주택 38단지 | 경기도 화성시 동탄신리천로5길 90 | 18492 | 700.0 |
829 | 공동주택 | 향남언덕마을15단지 | 경기도 화성시 향남읍 향남로39번길 22 | 18621 | 922.0 |
830 | 공동주택 | 증흥에스클래스 더 센트럴 | 경기도 화성시 봉담읍 상리3길 160 | 18311 | 824.0 |
831 | 공동주택 | 우미린 센트포레2단지 | 경기도 화성시 장조4로 33 | 18352 | 650.0 |