Dataset statistics
Number of variables | 17 |
---|---|
Number of observations | 106 |
Missing cells | 311 |
Missing cells (%) | 17.3% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 14.8 KiB |
Average record size in memory | 143.2 B |
Variable types
Categorical | 7 |
---|---|
DateTime | 3 |
Text | 3 |
Numeric | 4 |
Dataset
Description | 본 데이터는 사천시 관내 미준공 신축 건축물에 대한 정보(건축구분, 허가일, 착공일(예정일), 준공일(예정일), 대지위치, 연면적, 최대지상층수, 최대지하층수, 주용도, 부속용도, 총주차대수, 세대수, 가구수, 시공자명)를 제공하고 있습니다. |
---|---|
Author | 경상남도 사천시 |
URL | https://www.data.go.kr/data/15121500/fileData.do |
시행사 has constant value "" | Constant |
연면적(제곱미터) is highly overall correlated with 지상층수 and 5 other fields | High correlation |
지상층수 is highly overall correlated with 연면적(제곱미터) and 3 other fields | High correlation |
총주차대수 is highly overall correlated with 연면적(제곱미터) and 5 other fields | High correlation |
세대수 is highly overall correlated with 연면적(제곱미터) and 4 other fields | High correlation |
지하층수 is highly overall correlated with 연면적(제곱미터) and 3 other fields | High correlation |
주용도 is highly overall correlated with 가구수 and 2 other fields | High correlation |
가구수 is highly overall correlated with 연면적(제곱미터) and 2 other fields | High correlation |
시공사 is highly overall correlated with 연면적(제곱미터) and 3 other fields | High correlation |
데이터기준일자 is highly overall correlated with 세대수 and 2 other fields | High correlation |
가구수 is highly imbalanced (70.8%) | Imbalance |
시공사 is highly imbalanced (52.3%) | Imbalance |
착공일(예정일) has 74 (69.8%) missing values | Missing |
준공일(예정일) has 90 (84.9%) missing values | Missing |
부속용도 has 30 (28.3%) missing values | Missing |
총주차대수 has 24 (22.6%) missing values | Missing |
세대수 has 92 (86.8%) missing values | Missing |
총주차대수 has 14 (13.2%) zeros | Zeros |
Reproduction
Analysis started | 2024-04-17 13:32:30.606055 |
---|---|
Analysis finished | 2024-04-17 13:32:33.515840 |
Duration | 2.91 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
건축구분
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 3.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
신축 | |
---|---|
용도변경 | |
증축 | |
대수선 | 2 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.6415094 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 신축 |
---|---|
2nd row | 증축 |
3rd row | 신축 |
4th row | 증축 |
5th row | 신축 |
Common Values
Value | Count | Frequency (%) |
신축 | 58 | |
용도변경 | 33 | |
증축 | 13 | 12.3% |
대수선 | 2 | 1.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
신축 | 58 | |
용도변경 | 33 | |
증축 | 13 | 12.3% |
대수선 | 2 | 1.9% |
허가일
Date
Distinct | 98 |
---|---|
Distinct (%) | 92.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
Minimum | 2018-01-05 00:00:00 |
---|---|
Maximum | 2023-10-31 00:00:00 |
착공일(예정일)
Date
MISSING
 
Distinct | 31 |
---|---|
Distinct (%) | 96.9% |
Missing | 74 |
Missing (%) | 69.8% |
Memory size | 980.0 B |
Minimum | 2018-05-03 00:00:00 |
---|---|
Maximum | 2024-02-04 00:00:00 |
준공일(예정일)
Date
MISSING
 
Distinct | 14 |
---|---|
Distinct (%) | 87.5% |
Missing | 90 |
Missing (%) | 84.9% |
Memory size | 980.0 B |
Minimum | 2022-11-30 00:00:00 |
---|---|
Maximum | 2026-02-28 00:00:00 |
대지위치
Text
Distinct | 104 |
---|---|
Distinct (%) | 98.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
Length
Max length | 34 |
---|---|
Median length | 27 |
Mean length | 21.839623 |
Min length | 16 |
Characters and Unicode
Total characters | 2315 |
---|---|
Distinct characters | 95 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 102 ? |
---|---|
Unique (%) | 96.2% |
Sample
1st row | 경상남도 사천시 벌리동 54-11 |
---|---|
2nd row | 경상남도 사천시 백천동 108-1 외2필지 |
3rd row | 경상남도 사천시 동금동 330-9 외1필지 |
4th row | 경상남도 사천시 곤양면 환덕리 1360-1 외2필지 |
5th row | 경상남도 사천시 사천읍 정의리 1-11 |
Value | Count | Frequency (%) |
경상남도 | 106 | |
사천시 | 106 | |
사천읍 | 19 | 3.6% |
외1필지 | 18 | 3.4% |
외2필지 | 11 | 2.1% |
용현면 | 11 | 2.1% |
수석리 | 9 | 1.7% |
사남면 | 9 | 1.7% |
축동면 | 8 | 1.5% |
산 | 8 | 1.5% |
Other values (158) | 227 |
Most occurring characters
Value | Count | Frequency (%) |
426 | ||
사 | 139 | 6.0% |
천 | 132 | 5.7% |
남 | 115 | 5.0% |
도 | 107 | 4.6% |
경 | 106 | 4.6% |
시 | 106 | 4.6% |
상 | 106 | 4.6% |
1 | 100 | 4.3% |
- | 81 | 3.5% |
Other values (85) | 897 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1372 | |
Decimal Number | 434 | 18.7% |
Space Separator | 426 | 18.4% |
Dash Punctuation | 81 | 3.5% |
Uppercase Letter | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 139 | 10.1% |
천 | 132 | 9.6% |
남 | 115 | 8.4% |
도 | 107 | 7.8% |
경 | 106 | 7.7% |
시 | 106 | 7.7% |
상 | 106 | 7.7% |
리 | 67 | 4.9% |
동 | 66 | 4.8% |
면 | 42 | 3.1% |
Other values (71) | 386 |
Decimal Number
Value | Count | Frequency (%) |
1 | 100 | |
2 | 55 | |
3 | 46 | |
5 | 43 | |
4 | 41 | |
8 | 39 | 9.0% |
6 | 34 | 7.8% |
7 | 28 | 6.5% |
0 | 24 | 5.5% |
9 | 24 | 5.5% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 1 | |
B | 1 |
Space Separator
Value | Count | Frequency (%) |
426 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 81 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1372 | |
Common | 941 | |
Latin | 2 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 139 | 10.1% |
천 | 132 | 9.6% |
남 | 115 | 8.4% |
도 | 107 | 7.8% |
경 | 106 | 7.7% |
시 | 106 | 7.7% |
상 | 106 | 7.7% |
리 | 67 | 4.9% |
동 | 66 | 4.8% |
면 | 42 | 3.1% |
Other values (71) | 386 |
Common
Value | Count | Frequency (%) |
426 | ||
1 | 100 | 10.6% |
- | 81 | 8.6% |
2 | 55 | 5.8% |
3 | 46 | 4.9% |
5 | 43 | 4.6% |
4 | 41 | 4.4% |
8 | 39 | 4.1% |
6 | 34 | 3.6% |
7 | 28 | 3.0% |
Other values (2) | 48 | 5.1% |
Latin
Value | Count | Frequency (%) |
L | 1 | |
B | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1372 | |
ASCII | 943 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
426 | ||
1 | 100 | 10.6% |
- | 81 | 8.6% |
2 | 55 | 5.8% |
3 | 46 | 4.9% |
5 | 43 | 4.6% |
4 | 41 | 4.3% |
8 | 39 | 4.1% |
6 | 34 | 3.6% |
7 | 28 | 3.0% |
Other values (4) | 50 | 5.3% |
Hangul
Value | Count | Frequency (%) |
사 | 139 | 10.1% |
천 | 132 | 9.6% |
남 | 115 | 8.4% |
도 | 107 | 7.8% |
경 | 106 | 7.7% |
시 | 106 | 7.7% |
상 | 106 | 7.7% |
리 | 67 | 4.9% |
동 | 66 | 4.8% |
면 | 42 | 3.1% |
Other values (71) | 386 |
연면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 103 |
---|---|
Distinct (%) | 97.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10278.943 |
Minimum | 32.37 |
---|---|
Maximum | 173946.39 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.1 KiB |
Quantile statistics
Minimum | 32.37 |
---|---|
5-th percentile | 78.8475 |
Q1 | 197.23 |
median | 502.77 |
Q3 | 2464.845 |
95-th percentile | 71895.143 |
Maximum | 173946.39 |
Range | 173914.02 |
Interquartile range (IQR) | 2267.615 |
Descriptive statistics
Standard deviation | 29468.978 |
---|---|
Coefficient of variation (CV) | 2.866927 |
Kurtosis | 14.010985 |
Mean | 10278.943 |
Median Absolute Deviation (MAD) | 384.535 |
Skewness | 3.6451854 |
Sum | 1089567.9 |
Variance | 8.6842067 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
197.23 | 2 | 1.9% |
139.31 | 2 | 1.9% |
3887.9 | 2 | 1.9% |
919.69 | 1 | 0.9% |
463.06 | 1 | 0.9% |
70.8 | 1 | 0.9% |
369.64 | 1 | 0.9% |
218.3 | 1 | 0.9% |
132.49 | 1 | 0.9% |
168.0 | 1 | 0.9% |
Other values (93) | 93 |
Value | Count | Frequency (%) |
32.37 | 1 | |
51.94 | 1 | |
56.2 | 1 | |
70.8 | 1 | |
74.38 | 1 | |
77.05 | 1 | |
84.24 | 1 | |
98.98 | 1 | |
101.88 | 1 | |
114.16 | 1 |
Value | Count | Frequency (%) |
173946.39 | 1 | |
146888.65 | 1 | |
99262.43 | 1 | |
97094.22 | 1 | |
91790.02 | 1 | |
71925.91 | 1 | |
71802.84 | 1 | |
68307.61 | 1 | |
55968.8 | 1 | |
54814.71 | 1 |
지상층수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 16.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.6509434 |
Minimum | 1 |
---|---|
Maximum | 49 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.1 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 4 |
95-th percentile | 20 |
Maximum | 49 |
Range | 48 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 7.8340435 |
---|---|
Coefficient of variation (CV) | 1.6843988 |
Kurtosis | 13.206316 |
Mean | 4.6509434 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 3.4754499 |
Sum | 493 |
Variance | 61.372237 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 38 | |
2 | 26 | |
3 | 13 | 12.3% |
4 | 9 | 8.5% |
6 | 4 | 3.8% |
5 | 3 | 2.8% |
18 | 2 | 1.9% |
20 | 2 | 1.9% |
16 | 1 | 0.9% |
25 | 1 | 0.9% |
Other values (7) | 7 | 6.6% |
Value | Count | Frequency (%) |
1 | 38 | |
2 | 26 | |
3 | 13 | 12.3% |
4 | 9 | 8.5% |
5 | 3 | 2.8% |
6 | 4 | 3.8% |
7 | 1 | 0.9% |
9 | 1 | 0.9% |
10 | 1 | 0.9% |
16 | 1 | 0.9% |
Value | Count | Frequency (%) |
49 | 1 | |
35 | 1 | |
33 | 1 | |
29 | 1 | |
25 | 1 | |
20 | 2 | |
18 | 2 | |
16 | 1 | |
10 | 1 | |
9 | 1 |
지하층수
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 5.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
0 | |
---|---|
<NA> | |
1 | |
2 | |
3 | 1 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 2.1320755 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 0 |
---|---|
2nd row | <NA> |
3rd row | 0 |
4th row | <NA> |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 44 | |
<NA> | 40 | |
1 | 14 | 13.2% |
2 | 6 | 5.7% |
3 | 1 | 0.9% |
4 | 1 | 0.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 44 | |
na | 40 | |
1 | 14 | 13.2% |
2 | 6 | 5.7% |
3 | 1 | 0.9% |
4 | 1 | 0.9% |
주용도
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 10.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
제2종근린생활시설 | |
---|---|
공동주택 | |
숙박시설 | |
공장 | |
제1종근린생활시설 | 5 |
Other values (6) |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 7.0188679 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.9% |
Sample
1st row | 제2종근린생활시설 |
---|---|
2nd row | 창고시설 |
3rd row | 제2종근린생활시설 |
4th row | 동물및식물관련시설 |
5th row | 노유자시설 |
Common Values
Value | Count | Frequency (%) |
제2종근린생활시설 | 58 | |
공동주택 | 13 | 12.3% |
숙박시설 | 12 | 11.3% |
공장 | 6 | 5.7% |
제1종근린생활시설 | 5 | 4.7% |
동물및식물관련시설 | 3 | 2.8% |
창고시설 | 2 | 1.9% |
노유자시설 | 2 | 1.9% |
단독주택 | 2 | 1.9% |
운동시설 | 2 | 1.9% |
Length
Value | Count | Frequency (%) |
제2종근린생활시설 | 58 | |
공동주택 | 13 | 12.3% |
숙박시설 | 12 | 11.3% |
공장 | 6 | 5.7% |
제1종근린생활시설 | 5 | 4.7% |
동물및식물관련시설 | 3 | 2.8% |
창고시설 | 2 | 1.9% |
노유자시설 | 2 | 1.9% |
단독주택 | 2 | 1.9% |
운동시설 | 2 | 1.9% |
부속용도
Text
MISSING
 
Distinct | 50 |
---|---|
Distinct (%) | 65.8% |
Missing | 30 |
Missing (%) | 28.3% |
Memory size | 980.0 B |
Value | Count | Frequency (%) |
일반음식점 | 16 | 13.7% |
및 | 13 | 11.1% |
사무소 | 10 | 8.5% |
아파트 | 9 | 7.7% |
단독주택 | 7 | 6.0% |
소매점 | 3 | 2.6% |
제조업소 | 2 | 1.7% |
휴게음식점 | 2 | 1.7% |
근린생활시설 | 2 | 1.7% |
제1종근린생활시설 | 2 | 1.7% |
Other values (48) | 51 |
Most occurring characters
Value | Count | Frequency (%) |
46 | 8.3% | |
점 | 24 | 4.3% |
소 | 20 | 3.6% |
음 | 20 | 3.6% |
식 | 20 | 3.6% |
반 | 19 | 3.4% |
설 | 19 | 3.4% |
시 | 19 | 3.4% |
일 | 19 | 3.4% |
사 | 16 | 2.9% |
Other values (101) | 334 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 470 | |
Space Separator | 46 | 8.3% |
Decimal Number | 17 | 3.1% |
Close Punctuation | 9 | 1.6% |
Open Punctuation | 9 | 1.6% |
Other Punctuation | 2 | 0.4% |
Dash Punctuation | 2 | 0.4% |
Math Symbol | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
점 | 24 | 5.1% |
소 | 20 | 4.3% |
음 | 20 | 4.3% |
식 | 20 | 4.3% |
반 | 19 | 4.0% |
설 | 19 | 4.0% |
시 | 19 | 4.0% |
일 | 19 | 4.0% |
사 | 16 | 3.4% |
및 | 14 | 3.0% |
Other values (92) | 280 |
Decimal Number
Value | Count | Frequency (%) |
2 | 8 | |
1 | 7 | |
3 | 2 | 11.8% |
Space Separator
Value | Count | Frequency (%) |
46 |
Close Punctuation
Value | Count | Frequency (%) |
) | 9 |
Open Punctuation
Value | Count | Frequency (%) |
( | 9 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 470 | |
Common | 86 | 15.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
점 | 24 | 5.1% |
소 | 20 | 4.3% |
음 | 20 | 4.3% |
식 | 20 | 4.3% |
반 | 19 | 4.0% |
설 | 19 | 4.0% |
시 | 19 | 4.0% |
일 | 19 | 4.0% |
사 | 16 | 3.4% |
및 | 14 | 3.0% |
Other values (92) | 280 |
Common
Value | Count | Frequency (%) |
46 | ||
) | 9 | 10.5% |
( | 9 | 10.5% |
2 | 8 | 9.3% |
1 | 7 | 8.1% |
3 | 2 | 2.3% |
. | 2 | 2.3% |
- | 2 | 2.3% |
~ | 1 | 1.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 470 | |
ASCII | 86 | 15.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
46 | ||
) | 9 | 10.5% |
( | 9 | 10.5% |
2 | 8 | 9.3% |
1 | 7 | 8.1% |
3 | 2 | 2.3% |
. | 2 | 2.3% |
- | 2 | 2.3% |
~ | 1 | 1.2% |
Hangul
Value | Count | Frequency (%) |
점 | 24 | 5.1% |
소 | 20 | 4.3% |
음 | 20 | 4.3% |
식 | 20 | 4.3% |
반 | 19 | 4.0% |
설 | 19 | 4.0% |
시 | 19 | 4.0% |
일 | 19 | 4.0% |
사 | 16 | 3.4% |
및 | 14 | 3.0% |
Other values (92) | 280 |
총주차대수
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 36 |
---|---|
Distinct (%) | 43.9% |
Missing | 24 |
Missing (%) | 22.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 102.80488 |
Minimum | 0 |
---|---|
Maximum | 1581 |
Zeros | 14 |
Zeros (%) | 13.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.1 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1.25 |
median | 4 |
Q3 | 17.5 |
95-th percentile | 628.55 |
Maximum | 1581 |
Range | 1581 |
Interquartile range (IQR) | 16.25 |
Descriptive statistics
Standard deviation | 269.95704 |
---|---|
Coefficient of variation (CV) | 2.6259166 |
Kurtosis | 13.146189 |
Mean | 102.80488 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 3.4617874 |
Sum | 8430 |
Variance | 72876.801 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 14 | |
2 | 12 | |
1 | 7 | 6.6% |
3 | 7 | 6.6% |
4 | 4 | 3.8% |
7 | 3 | 2.8% |
5 | 3 | 2.8% |
6 | 2 | 1.9% |
9 | 2 | 1.9% |
8 | 2 | 1.9% |
Other values (26) | 26 | |
(Missing) | 24 |
Value | Count | Frequency (%) |
0 | 14 | |
1 | 7 | |
2 | 12 | |
3 | 7 | |
4 | 4 | 3.8% |
5 | 3 | 2.8% |
6 | 2 | 1.9% |
7 | 3 | 2.8% |
8 | 2 | 1.9% |
9 | 2 | 1.9% |
Value | Count | Frequency (%) |
1581 | 1 | |
997 | 1 | |
942 | 1 | |
892 | 1 | |
631 | 1 | |
582 | 1 | |
554 | 1 | |
450 | 1 | |
332 | 1 | |
317 | 1 |
세대수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 14 |
---|---|
Distinct (%) | 100.0% |
Missing | 92 |
Missing (%) | 86.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 381.07143 |
Minimum | 3 |
---|---|
Maximum | 1047 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.1 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 4.95 |
Q1 | 33.75 |
median | 397 |
Q3 | 641.5 |
95-th percentile | 853.95 |
Maximum | 1047 |
Range | 1044 |
Interquartile range (IQR) | 607.75 |
Descriptive statistics
Standard deviation | 344.57744 |
---|---|
Coefficient of variation (CV) | 0.9042332 |
Kurtosis | -0.9825553 |
Mean | 381.07143 |
Median Absolute Deviation (MAD) | 341 |
Skewness | 0.39545911 |
Sum | 5335 |
Variance | 118733.61 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
335 | 1 | 0.9% |
745 | 1 | 0.9% |
511 | 1 | 0.9% |
750 | 1 | 0.9% |
63 | 1 | 0.9% |
535 | 1 | 0.9% |
459 | 1 | 0.9% |
1047 | 1 | 0.9% |
677 | 1 | 0.9% |
6 | 1 | 0.9% |
Other values (4) | 4 | 3.8% |
(Missing) | 92 |
Value | Count | Frequency (%) |
3 | 1 | |
6 | 1 | |
8 | 1 | |
24 | 1 | |
63 | 1 | |
172 | 1 | |
335 | 1 | |
459 | 1 | |
511 | 1 | |
535 | 1 |
Value | Count | Frequency (%) |
1047 | 1 | |
750 | 1 | |
745 | 1 | |
677 | 1 | |
535 | 1 | |
511 | 1 | |
459 | 1 | |
335 | 1 | |
172 | 1 | |
63 | 1 |
가구수
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 4.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
<NA> | |
---|---|
1 | |
4 | 1 |
7 | 1 |
2 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.6320755 |
Min length | 1 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 2.8% |
Sample
1st row | 1 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 93 | |
1 | 10 | 9.4% |
4 | 1 | 0.9% |
7 | 1 | 0.9% |
2 | 1 | 0.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 93 | |
1 | 10 | 9.4% |
4 | 1 | 0.9% |
7 | 1 | 0.9% |
2 | 1 | 0.9% |
공사명
Text
Distinct | 98 |
---|---|
Distinct (%) | 93.3% |
Missing | 1 |
Missing (%) | 0.9% |
Memory size | 980.0 B |
Value | Count | Frequency (%) |
1 | 11 | 7.4% |
외 | 11 | 7.4% |
사천시 | 6 | 4.0% |
아파트 | 4 | 2.7% |
사천 | 3 | 2.0% |
차익순 | 3 | 2.0% |
옥경희 | 2 | 1.3% |
재단법인기독교대한성결교회유지재단 | 2 | 1.3% |
강석경 | 2 | 1.3% |
사천시장 | 2 | 1.3% |
Other values (102) | 103 |
Most occurring characters
Value | Count | Frequency (%) |
44 | 6.4% | |
사 | 37 | 5.4% |
주 | 30 | 4.4% |
회 | 19 | 2.8% |
천 | 19 | 2.8% |
김 | 18 | 2.6% |
식 | 15 | 2.2% |
지 | 15 | 2.2% |
이 | 13 | 1.9% |
1 | 13 | 1.9% |
Other values (177) | 465 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 611 | |
Space Separator | 44 | 6.4% |
Decimal Number | 14 | 2.0% |
Open Punctuation | 8 | 1.2% |
Close Punctuation | 8 | 1.2% |
Lowercase Letter | 1 | 0.1% |
Dash Punctuation | 1 | 0.1% |
Uppercase Letter | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 37 | 6.1% |
주 | 30 | 4.9% |
회 | 19 | 3.1% |
천 | 19 | 3.1% |
김 | 18 | 2.9% |
식 | 15 | 2.5% |
지 | 15 | 2.5% |
이 | 13 | 2.1% |
외 | 11 | 1.8% |
경 | 10 | 1.6% |
Other values (169) | 424 |
Decimal Number
Value | Count | Frequency (%) |
1 | 13 | |
2 | 1 | 7.1% |
Space Separator
Value | Count | Frequency (%) |
44 |
Open Punctuation
Value | Count | Frequency (%) |
( | 8 |
Close Punctuation
Value | Count | Frequency (%) |
) | 8 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 611 | |
Common | 75 | 10.9% |
Latin | 2 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 37 | 6.1% |
주 | 30 | 4.9% |
회 | 19 | 3.1% |
천 | 19 | 3.1% |
김 | 18 | 2.9% |
식 | 15 | 2.5% |
지 | 15 | 2.5% |
이 | 13 | 2.1% |
외 | 11 | 1.8% |
경 | 10 | 1.6% |
Other values (169) | 424 |
Common
Value | Count | Frequency (%) |
44 | ||
1 | 13 | 17.3% |
( | 8 | 10.7% |
) | 8 | 10.7% |
2 | 1 | 1.3% |
- | 1 | 1.3% |
Latin
Value | Count | Frequency (%) |
e | 1 | |
A | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 611 | |
ASCII | 77 | 11.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
44 | ||
1 | 13 | 16.9% |
( | 8 | 10.4% |
) | 8 | 10.4% |
2 | 1 | 1.3% |
e | 1 | 1.3% |
- | 1 | 1.3% |
A | 1 | 1.3% |
Hangul
Value | Count | Frequency (%) |
사 | 37 | 6.1% |
주 | 30 | 4.9% |
회 | 19 | 3.1% |
천 | 19 | 3.1% |
김 | 18 | 2.9% |
식 | 15 | 2.5% |
지 | 15 | 2.5% |
이 | 13 | 2.1% |
외 | 11 | 1.8% |
경 | 10 | 1.6% |
Other values (169) | 424 |
시행사
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
미선정 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 미선정 |
---|---|
2nd row | 미선정 |
3rd row | 미선정 |
4th row | 미선정 |
5th row | 미선정 |
Common Values
Value | Count | Frequency (%) |
미선정 | 106 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
미선정 | 106 |
시공사
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 21 |
---|---|
Distinct (%) | 19.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
미선정 | |
---|---|
<NA> | |
파인건설(주) 남윤광 | 1 |
박경란 | 1 |
손명섭 임상후 | 1 |
Other values (16) |
Length
Max length | 13 |
---|---|
Median length | 3 |
Mean length | 4 |
Min length | 3 |
Unique
Unique | 19 ? |
---|---|
Unique (%) | 17.9% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
미선정 | 66 | |
<NA> | 21 | 19.8% |
파인건설(주) 남윤광 | 1 | 0.9% |
박경란 | 1 | 0.9% |
손명섭 임상후 | 1 | 0.9% |
김순석 | 1 | 0.9% |
정재욱 | 1 | 0.9% |
안재명 | 1 | 0.9% |
정배영 | 1 | 0.9% |
(주)한양건설 안순걸 | 1 | 0.9% |
Other values (11) | 11 | 10.4% |
Length
Value | Count | Frequency (%) |
미선정 | 66 | |
na | 21 | 18.4% |
주식회사 | 2 | 1.8% |
이상주 | 1 | 0.9% |
동문건설 | 1 | 0.9% |
주)강민종합건설 | 1 | 0.9% |
한웅건설(주 | 1 | 0.9% |
프라임건설(주 | 1 | 0.9% |
광득건설(주 | 1 | 0.9% |
청아건설 | 1 | 0.9% |
Other values (18) | 18 | 15.8% |
데이터기준일자
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 980.0 B |
2023-08-30 | |
---|---|
2023-10-31 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-10-31 |
---|---|
2nd row | 2023-10-31 |
3rd row | 2023-10-31 |
4th row | 2023-10-31 |
5th row | 2023-10-31 |
Common Values
Value | Count | Frequency (%) |
2023-08-30 | 78 | |
2023-10-31 | 28 | 26.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-08-30 | 78 | |
2023-10-31 | 28 | 26.4% |
건축구분 | 허가일 | 착공일(예정일) | 준공일(예정일) | 연면적(제곱미터) | 지상층수 | 지하층수 | 주용도 | 부속용도 | 총주차대수 | 세대수 | 가구수 | 공사명 | 시공사 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
건축구분 | 1.000 | 0.809 | 1.000 | 0.000 | 0.000 | 0.029 | 0.366 | 0.587 | 0.891 | 0.000 | 0.000 | 0.214 | 0.939 | 0.808 | 0.556 |
허가일 | 0.809 | 1.000 | 0.996 | 0.949 | 0.957 | 1.000 | 1.000 | 0.000 | 0.973 | 0.959 | 1.000 | 1.000 | 0.993 | 0.000 | 1.000 |
착공일(예정일) | 1.000 | 0.996 | 1.000 | 0.911 | 1.000 | 1.000 | 1.000 | 1.000 | 0.885 | 1.000 | 1.000 | 1.000 | 1.000 | 0.850 | 1.000 |
준공일(예정일) | 0.000 | 0.949 | 0.911 | 1.000 | 0.936 | 0.799 | 0.914 | 0.800 | 0.610 | 0.722 | 1.000 | NaN | 1.000 | 0.922 | 0.000 |
연면적(제곱미터) | 0.000 | 0.957 | 1.000 | 0.936 | 1.000 | 0.958 | 0.761 | 0.365 | 0.000 | 0.991 | 0.965 | NaN | 1.000 | 0.925 | 0.000 |
지상층수 | 0.029 | 1.000 | 1.000 | 0.799 | 0.958 | 1.000 | 0.863 | 0.466 | 0.000 | 0.965 | 0.842 | 0.000 | 1.000 | 0.784 | 0.105 |
지하층수 | 0.366 | 1.000 | 1.000 | 0.914 | 0.761 | 0.863 | 1.000 | 0.263 | 0.000 | 0.789 | 0.881 | 0.000 | 1.000 | 0.698 | 0.183 |
주용도 | 0.587 | 0.000 | 1.000 | 0.800 | 0.365 | 0.466 | 0.263 | 1.000 | 1.000 | 0.326 | 0.000 | 0.897 | 0.894 | 0.857 | 0.818 |
부속용도 | 0.891 | 0.973 | 0.885 | 0.610 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 | 1.000 | 0.955 | 0.707 | 0.748 |
총주차대수 | 0.000 | 0.959 | 1.000 | 0.722 | 0.991 | 0.965 | 0.789 | 0.326 | 0.000 | 1.000 | 1.000 | NaN | 1.000 | 0.876 | 0.000 |
세대수 | 0.000 | 1.000 | 1.000 | 1.000 | 0.965 | 0.842 | 0.881 | 0.000 | 0.000 | 1.000 | 1.000 | NaN | 1.000 | 0.822 | NaN |
가구수 | 0.214 | 1.000 | 1.000 | NaN | NaN | 0.000 | 0.000 | 0.897 | 1.000 | NaN | NaN | 1.000 | 1.000 | 0.552 | 0.702 |
공사명 | 0.939 | 0.993 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.894 | 0.955 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.557 |
시공사 | 0.808 | 0.000 | 0.850 | 0.922 | 0.925 | 0.784 | 0.698 | 0.857 | 0.707 | 0.876 | 0.822 | 0.552 | 1.000 | 1.000 | 1.000 |
데이터기준일자 | 0.556 | 1.000 | 1.000 | 0.000 | 0.000 | 0.105 | 0.183 | 0.818 | 0.748 | 0.000 | NaN | 0.702 | 0.557 | 1.000 | 1.000 |
시공사 | 데이터기준일자 | 주용도 | 건축구분 | 지하층수 | 가구수 | |
---|---|---|---|---|---|---|
시공사 | 1.000 | 0.885 | 0.558 | 0.459 | 0.390 | 0.487 |
데이터기준일자 | 0.885 | 1.000 | 0.778 | 0.377 | 0.217 | 0.433 |
주용도 | 0.558 | 0.778 | 1.000 | 0.382 | 0.143 | 0.567 |
건축구분 | 0.459 | 0.377 | 0.382 | 1.000 | 0.302 | 0.122 |
지하층수 | 0.390 | 0.217 | 0.143 | 0.302 | 1.000 | 0.000 |
가구수 | 0.487 | 0.433 | 0.567 | 0.122 | 0.000 | 1.000 |
연면적(제곱미터) | 지상층수 | 총주차대수 | 세대수 | 건축구분 | 지하층수 | 주용도 | 가구수 | 시공사 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|---|---|
연면적(제곱미터) | 1.000 | 0.658 | 0.784 | 0.987 | 0.000 | 0.615 | 0.183 | 1.000 | 0.666 | 0.000 |
지상층수 | 0.658 | 1.000 | 0.670 | 0.668 | 0.000 | 0.773 | 0.193 | 0.000 | 0.461 | 0.044 |
총주차대수 | 0.784 | 0.670 | 1.000 | 0.973 | 0.000 | 0.651 | 0.158 | 1.000 | 0.542 | 0.000 |
세대수 | 0.987 | 0.668 | 0.973 | 1.000 | 0.000 | 0.606 | 0.000 | 0.000 | 0.313 | 1.000 |
건축구분 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.302 | 0.382 | 0.122 | 0.459 | 0.377 |
지하층수 | 0.615 | 0.773 | 0.651 | 0.606 | 0.302 | 1.000 | 0.143 | 0.000 | 0.390 | 0.217 |
주용도 | 0.183 | 0.193 | 0.158 | 0.000 | 0.382 | 0.143 | 1.000 | 0.567 | 0.558 | 0.778 |
가구수 | 1.000 | 0.000 | 1.000 | 0.000 | 0.122 | 0.000 | 0.567 | 1.000 | 0.487 | 0.433 |
시공사 | 0.666 | 0.461 | 0.542 | 0.313 | 0.459 | 0.390 | 0.558 | 0.487 | 1.000 | 0.885 |
데이터기준일자 | 0.000 | 0.044 | 0.000 | 1.000 | 0.377 | 0.217 | 0.778 | 0.433 | 0.885 | 1.000 |
건축구분 | 허가일 | 착공일(예정일) | 준공일(예정일) | 대지위치 | 연면적(제곱미터) | 지상층수 | 지하층수 | 주용도 | 부속용도 | 총주차대수 | 세대수 | 가구수 | 공사명 | 시행사 | 시공사 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 신축 | 2023-10-31 | <NA> | <NA> | 경상남도 사천시 벌리동 54-11 | 198.35 | 2 | 0 | 제2종근린생활시설 | 단독주택 | 2 | <NA> | 1 | 장병철 | 미선정 | <NA> | 2023-10-31 |
1 | 증축 | 2023-10-30 | <NA> | <NA> | 경상남도 사천시 백천동 108-1 외2필지 | 2583.15 | 2 | <NA> | 창고시설 | <NA> | 3 | <NA> | <NA> | 대한불교관음회조계종백천사 | 미선정 | <NA> | 2023-10-31 |
2 | 신축 | 2023-10-30 | <NA> | <NA> | 경상남도 사천시 동금동 330-9 외1필지 | 423.0 | 1 | 0 | 제2종근린생활시설 | 일반음식점 | 4 | <NA> | <NA> | 주식회사와이인베스트먼트 | 미선정 | <NA> | 2023-10-31 |
3 | 증축 | 2023-10-27 | <NA> | <NA> | 경상남도 사천시 곤양면 환덕리 1360-1 외2필지 | 3937.0 | 1 | <NA> | 동물및식물관련시설 | 축사 | 0 | <NA> | <NA> | 김병기 | 미선정 | <NA> | 2023-10-31 |
4 | 신축 | 2023-10-25 | <NA> | <NA> | 경상남도 사천시 사천읍 정의리 1-11 | 114.16 | 1 | 0 | 노유자시설 | 경로당 | 0 | <NA> | <NA> | 사천시장 | 미선정 | <NA> | 2023-10-31 |
5 | 신축 | 2023-10-25 | <NA> | <NA> | 경상남도 사천시 서포면 비토리 14-13 | 479.35 | 2 | 0 | 제1종근린생활시설 | 마을회관 | 2 | <NA> | <NA> | 사천시 | 미선정 | <NA> | 2023-10-31 |
6 | 증축 | 2023-10-12 | <NA> | <NA> | 경상남도 사천시 사천읍 장전리 산 73-6 외1필지 | 2109.93 | 1 | <NA> | 동물및식물관련시설 | <NA> | 0 | <NA> | <NA> | 주식회사중앙개발 | 미선정 | <NA> | 2023-10-31 |
7 | 신축 | 2023-10-11 | <NA> | <NA> | 경상남도 사천시 사천읍 정의리 209-1 외2필지 | 820.17 | 4 | 0 | 제1종근린생활시설 | 통신용시설 | 4 | <NA> | <NA> | 에스케이텔레콤주식회사 | 미선정 | <NA> | 2023-10-31 |
8 | 증축 | 2023-09-26 | 2023-10-20 | 2024-03-17 | 경상남도 사천시 용현면 신촌리 588-1 | 9909.63 | 2 | <NA> | 공장 | <NA> | 50 | <NA> | <NA> | 한국표면처리(주) | 미선정 | 한국표면처리(주) | 2023-10-31 |
9 | 용도변경 | 2023-09-21 | <NA> | <NA> | 경상남도 사천시 축동면 가산리 405-1 | 51.94 | 1 | <NA> | 단독주택 | <NA> | 0 | <NA> | 1 | 최창경 | 미선정 | <NA> | 2023-10-31 |
건축구분 | 허가일 | 착공일(예정일) | 준공일(예정일) | 대지위치 | 연면적(제곱미터) | 지상층수 | 지하층수 | 주용도 | 부속용도 | 총주차대수 | 세대수 | 가구수 | 공사명 | 시행사 | 시공사 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
96 | 용도변경 | 2018-08-14 | <NA> | <NA> | 경상남도 사천시 서금동 144-22 | 187.96 | 2 | <NA> | 제2종근린생활시설 | <NA> | <NA> | <NA> | <NA> | 김재연 | 미선정 | 미선정 | 2023-08-30 |
97 | 신축 | 2018-07-26 | 2021-07-27 | <NA> | 경상남도 사천시 축동면 구호리 373-8 외1필지 | 483.0 | 2 | 0 | 제2종근린생활시설 | <NA> | 4 | <NA> | <NA> | 강용구 | 미선정 | 미선정 | 2023-08-30 |
98 | 용도변경 | 2018-06-12 | <NA> | <NA> | 경상남도 사천시 사천읍 수석리 256-59 | 122.31 | 1 | <NA> | 제2종근린생활시설 | 사무소 | <NA> | <NA> | <NA> | 성용진 | 미선정 | 미선정 | 2023-08-30 |
99 | 용도변경 | 2018-04-16 | <NA> | <NA> | 경상남도 사천시 벌리동 481-7 | 521.83 | 3 | <NA> | 제2종근린생활시설 | <NA> | 2 | <NA> | <NA> | 강성열 외 1 | 미선정 | 미선정 | 2023-08-30 |
100 | 신축 | 2018-04-12 | 2018-09-21 | <NA> | 경상남도 사천시 서포면 비토리 산 15-1 외1필지 | 6505.11 | 4 | 2 | 숙박시설 | 숙박시설 제1~2종근.생 | <NA> | <NA> | <NA> | 주식회사정근개발 | 미선정 | 미선정 | 2023-08-30 |
101 | 신축 | 2018-04-05 | 2018-05-03 | <NA> | 경상남도 사천시 용강동 662-7 외2필지 | 3877.03 | 18 | 0 | 공동주택 | 연립주택 및 업무시설(오피스텔) | 37 | 8 | <NA> | 주식회사명품산업개발 | 미선정 | (주)강민종합건설 | 2023-08-30 |
102 | 신축 | 2018-03-30 | <NA> | <NA> | 경상남도 사천시 용현면 선진리 1001-5 외1필지 | 276.44 | 3 | 0 | 제2종근린생활시설 | <NA> | 2 | <NA> | 1 | 이민주 | 미선정 | 미선정 | 2023-08-30 |
103 | 증축 | 2018-02-06 | 2022-12-30 | <NA> | 경상남도 사천시 용현면 선진리 762-1 외1필지 | 1224.12 | 3 | <NA> | 제2종근린생활시설 | 일반음식점 | 8 | <NA> | 1 | 옥경희 외 1 | 미선정 | 주식회사우상건설 | 2023-08-30 |
104 | 용도변경 | 2018-01-08 | <NA> | <NA> | 경상남도 사천시 서금동 101-6 외2필지 | 919.69 | 5 | <NA> | 숙박시설 | <NA> | 6 | <NA> | <NA> | (주)미래로 | 미선정 | 미선정 | 2023-08-30 |
105 | 용도변경 | 2018-01-05 | <NA> | <NA> | 경상남도 사천시 사천읍 사주리 8-5 | 32.37 | 1 | <NA> | 제2종근린생활시설 | 부동산중개사무소 | <NA> | <NA> | <NA> | 정순혜 외 1 | 미선정 | 미선정 | 2023-08-30 |