Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 39 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1 |
Duplicate rows (%) | 2.6% |
Total size in memory | 2.7 KiB |
Average record size in memory | 70.4 B |
Variable types
Categorical | 3 |
---|---|
Text | 1 |
Numeric | 3 |
DateTime | 1 |
Dataset
Description | 2022년도 건축허가 현황에 대한 데이터로서 대지위치, 지목, 대지면적, 건축면적, 연면적, 허가일, 주용도에 관한 공공데이터를 제공합니다. |
---|---|
Author | 충청남도 |
URL | https://alldam.chungnam.go.kr/index.chungnam?menuCd=DOM_000000201001001001&st=&cds=&orgCd=&apiType=&isOpen=Y&pageIndex=310&beforeMenuCd=DOM_000000201001001000&publicdatapk=15093863 |
건축구분 has constant value "" | Constant |
Dataset has 1 (2.6%) duplicate rows | Duplicates |
대지면적(제곱미터) is highly overall correlated with 건축면적(제곱미터) and 3 other fields | High correlation |
건축면적(제곱미터) is highly overall correlated with 대지면적(제곱미터) and 3 other fields | High correlation |
연면적(제곱미터) is highly overall correlated with 대지면적(제곱미터) and 3 other fields | High correlation |
지목 is highly overall correlated with 대지면적(제곱미터) and 3 other fields | High correlation |
주용도 is highly overall correlated with 대지면적(제곱미터) and 3 other fields | High correlation |
Reproduction
Analysis started | 2024-01-09 20:16:55.892806 |
---|---|
Analysis finished | 2024-01-09 20:16:56.994314 |
Duration | 1.1 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
건축구분
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 444.0 B |
신축 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 신축 |
---|---|
2nd row | 신축 |
3rd row | 신축 |
4th row | 신축 |
5th row | 신축 |
Common Values
Value | Count | Frequency (%) |
신축 | 39 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
신축 | 39 |
대지위치
Text
Distinct | 38 |
---|---|
Distinct (%) | 97.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 444.0 B |
Length
Max length | 27 |
---|---|
Median length | 25 |
Mean length | 21.230769 |
Min length | 17 |
Characters and Unicode
Total characters | 828 |
---|---|
Distinct characters | 40 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 37 ? |
---|---|
Unique (%) | 94.9% |
Sample
1st row | 충청남도 계룡시 엄사면 향한리 407-33 |
---|---|
2nd row | 충청남도 계룡시 두마면 입암리 650 |
3rd row | 충청남도 계룡시 두마면 입암리 650 |
4th row | 충청남도 계룡시 엄사면 도곡리 155-2 |
5th row | 충청남도 계룡시 금암동 156-7 |
Value | Count | Frequency (%) |
충청남도 | 39 | |
계룡시 | 39 | |
엄사면 | 24 | |
엄사리 | 11 | 5.6% |
두마면 | 10 | 5.1% |
향한리 | 9 | 4.6% |
입암리 | 5 | 2.6% |
금암동 | 5 | 2.6% |
도곡리 | 3 | 1.5% |
농소리 | 3 | 1.5% |
Other values (45) | 47 |
Most occurring characters
Value | Count | Frequency (%) |
156 | ||
도 | 42 | 5.1% |
계 | 40 | 4.8% |
충 | 39 | 4.7% |
남 | 39 | 4.7% |
룡 | 39 | 4.7% |
시 | 39 | 4.7% |
청 | 39 | 4.7% |
엄 | 35 | 4.2% |
사 | 35 | 4.2% |
Other values (30) | 325 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 507 | |
Space Separator | 156 | 18.8% |
Decimal Number | 143 | 17.3% |
Dash Punctuation | 22 | 2.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 42 | 8.3% |
계 | 40 | 7.9% |
충 | 39 | 7.7% |
남 | 39 | 7.7% |
룡 | 39 | 7.7% |
시 | 39 | 7.7% |
청 | 39 | 7.7% |
엄 | 35 | 6.9% |
사 | 35 | 6.9% |
면 | 34 | 6.7% |
Other values (18) | 126 |
Decimal Number
Value | Count | Frequency (%) |
1 | 23 | |
6 | 22 | |
3 | 17 | |
5 | 16 | |
9 | 15 | |
2 | 13 | |
7 | 13 | |
8 | 12 | |
4 | 8 | 5.6% |
0 | 4 | 2.8% |
Space Separator
Value | Count | Frequency (%) |
156 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 22 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 507 | |
Common | 321 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 42 | 8.3% |
계 | 40 | 7.9% |
충 | 39 | 7.7% |
남 | 39 | 7.7% |
룡 | 39 | 7.7% |
시 | 39 | 7.7% |
청 | 39 | 7.7% |
엄 | 35 | 6.9% |
사 | 35 | 6.9% |
면 | 34 | 6.7% |
Other values (18) | 126 |
Common
Value | Count | Frequency (%) |
156 | ||
1 | 23 | 7.2% |
- | 22 | 6.9% |
6 | 22 | 6.9% |
3 | 17 | 5.3% |
5 | 16 | 5.0% |
9 | 15 | 4.7% |
2 | 13 | 4.0% |
7 | 13 | 4.0% |
8 | 12 | 3.7% |
Other values (2) | 12 | 3.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 507 | |
ASCII | 321 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
156 | ||
1 | 23 | 7.2% |
- | 22 | 6.9% |
6 | 22 | 6.9% |
3 | 17 | 5.3% |
5 | 16 | 5.0% |
9 | 15 | 4.7% |
2 | 13 | 4.0% |
7 | 13 | 4.0% |
8 | 12 | 3.7% |
Other values (2) | 12 | 3.7% |
Hangul
Value | Count | Frequency (%) |
도 | 42 | 8.3% |
계 | 40 | 7.9% |
충 | 39 | 7.7% |
남 | 39 | 7.7% |
룡 | 39 | 7.7% |
시 | 39 | 7.7% |
청 | 39 | 7.7% |
엄 | 35 | 6.9% |
사 | 35 | 6.9% |
면 | 34 | 6.7% |
Other values (18) | 126 |
지목
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 12.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 444.0 B |
대 | |
---|---|
공장용지 | |
답 | 2 |
임야 | 2 |
주차장 | 1 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.4102564 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 2.6% |
Sample
1st row | 대 |
---|---|
2nd row | 공장용지 |
3rd row | 공장용지 |
4th row | 답 |
5th row | 대 |
Common Values
Value | Count | Frequency (%) |
대 | 30 | |
공장용지 | 4 | 10.3% |
답 | 2 | 5.1% |
임야 | 2 | 5.1% |
주차장 | 1 | 2.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대 | 30 | |
공장용지 | 4 | 10.3% |
답 | 2 | 5.1% |
임야 | 2 | 5.1% |
주차장 | 1 | 2.6% |
대지면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 38 |
---|---|
Distinct (%) | 97.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1213.6538 |
Minimum | 225.9 |
---|---|
Maximum | 5173 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 483.0 B |
Quantile statistics
Minimum | 225.9 |
---|---|
5-th percentile | 236.84 |
Q1 | 261.05 |
median | 505 |
Q3 | 1641.05 |
95-th percentile | 4128.12 |
Maximum | 5173 |
Range | 4947.1 |
Interquartile range (IQR) | 1380 |
Descriptive statistics
Standard deviation | 1406.2717 |
---|---|
Coefficient of variation (CV) | 1.1587091 |
Kurtosis | 1.3453593 |
Mean | 1213.6538 |
Median Absolute Deviation (MAD) | 254.3 |
Skewness | 1.5757463 |
Sum | 47332.5 |
Variance | 1977600.1 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3359.2 | 2 | 5.1% |
2668.0 | 1 | 2.6% |
261.2 | 1 | 2.6% |
441.6 | 1 | 2.6% |
564.7 | 1 | 2.6% |
3641.0 | 1 | 2.6% |
1216.1 | 1 | 2.6% |
519.0 | 1 | 2.6% |
250.7 | 1 | 2.6% |
237.3 | 1 | 2.6% |
Other values (28) | 28 |
Value | Count | Frequency (%) |
225.9 | 1 | |
232.7 | 1 | |
237.3 | 1 | |
243.8 | 1 | |
249.2 | 1 | |
249.9 | 1 | |
250.7 | 1 | |
253.5 | 1 | |
258.2 | 1 | |
260.9 | 1 |
Value | Count | Frequency (%) |
5173.0 | 1 | |
4847.4 | 1 | |
4048.2 | 1 | |
3641.0 | 1 | |
3359.2 | 2 | |
2668.0 | 1 | |
2447.0 | 1 | |
2166.5 | 1 | |
2066.0 | 1 | |
1216.1 | 1 |
건축면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 38 |
---|---|
Distinct (%) | 97.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 502.81134 |
Minimum | 72.17 |
---|---|
Maximum | 3570.28 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 483.0 B |
Quantile statistics
Minimum | 72.17 |
---|---|
5-th percentile | 86.727 |
Q1 | 100.26 |
median | 151.46 |
Q3 | 515.73 |
95-th percentile | 1797.15 |
Maximum | 3570.28 |
Range | 3498.11 |
Interquartile range (IQR) | 415.47 |
Descriptive statistics
Standard deviation | 733.04658 |
---|---|
Coefficient of variation (CV) | 1.4578959 |
Kurtosis | 7.2622158 |
Mean | 502.81134 |
Median Absolute Deviation (MAD) | 55.28 |
Skewness | 2.4957598 |
Sum | 19609.642 |
Variance | 537357.29 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1797.15 | 2 | 5.1% |
889.3921 | 1 | 2.6% |
156.12 | 1 | 2.6% |
87.81 | 1 | 2.6% |
96.18 | 1 | 2.6% |
1239.15 | 1 | 2.6% |
151.87 | 1 | 2.6% |
103.75 | 1 | 2.6% |
99.0 | 1 | 2.6% |
133.58 | 1 | 2.6% |
Other values (28) | 28 |
Value | Count | Frequency (%) |
72.17 | 1 | |
76.98 | 1 | |
87.81 | 1 | |
91.91 | 1 | |
94.72 | 1 | |
95.82 | 1 | |
96.18 | 1 | |
99.0 | 1 | |
99.02 | 1 | |
99.64 | 1 |
Value | Count | Frequency (%) |
3570.28 | 1 | |
1797.15 | 2 | |
1697.46 | 1 | |
1548.17 | 1 | |
1239.15 | 1 | |
1189.32 | 1 | |
913.55 | 1 | |
889.3921 | 1 | |
524.2 | 1 | |
507.26 | 1 |
연면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 37 |
---|---|
Distinct (%) | 94.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 796.06629 |
Minimum | 104.61 |
---|---|
Maximum | 4880.63 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 483.0 B |
Quantile statistics
Minimum | 104.61 |
---|---|
5-th percentile | 125.527 |
Q1 | 151.8 |
median | 198 |
Q3 | 1073.76 |
95-th percentile | 2668.957 |
Maximum | 4880.63 |
Range | 4776.02 |
Interquartile range (IQR) | 921.96 |
Descriptive statistics
Standard deviation | 1061.3359 |
---|---|
Coefficient of variation (CV) | 1.3332255 |
Kurtosis | 4.783896 |
Mean | 796.06629 |
Median Absolute Deviation (MAD) | 73.49 |
Skewness | 2.0845483 |
Sum | 31046.586 |
Variance | 1126433.8 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1944.16 | 2 | 5.1% |
198.0 | 2 | 5.1% |
2629.4555 | 1 | 2.6% |
382.2 | 1 | 2.6% |
148.17 | 1 | 2.6% |
125.64 | 1 | 2.6% |
1678.76 | 1 | 2.6% |
195.61 | 1 | 2.6% |
148.55 | 1 | 2.6% |
196.98 | 1 | 2.6% |
Other values (27) | 27 |
Value | Count | Frequency (%) |
104.61 | 1 | |
124.51 | 1 | |
125.64 | 1 | |
139.65 | 1 | |
142.31 | 1 | |
143.4 | 1 | |
148.17 | 1 | |
148.55 | 1 | |
149.82 | 1 | |
149.9 | 1 |
Value | Count | Frequency (%) |
4880.63 | 1 | |
3024.47 | 1 | |
2629.4555 | 1 | |
2354.81 | 1 | |
1990.34 | 1 | |
1944.16 | 2 | |
1780.5 | 1 | |
1678.76 | 1 | |
1150.6 | 1 | |
996.92 | 1 |
허가일
Date
Distinct | 33 |
---|---|
Distinct (%) | 84.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 444.0 B |
Minimum | 2022-01-28 00:00:00 |
---|---|
Maximum | 2022-12-09 00:00:00 |
주용도
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 20.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 444.0 B |
단독주택 | |
---|---|
제1종근린생활시설 | |
공장 | |
창고시설 | 2 |
제2종근린생활시설 | 1 |
Other values (3) |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 4.7179487 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 10.3% |
Sample
1st row | 단독주택 |
---|---|
2nd row | 공장 |
3rd row | 공장 |
4th row | 제2종근린생활시설 |
5th row | 노유자시설 |
Common Values
Value | Count | Frequency (%) |
단독주택 | 23 | |
제1종근린생활시설 | 6 | 15.4% |
공장 | 4 | 10.3% |
창고시설 | 2 | 5.1% |
제2종근린생활시설 | 1 | 2.6% |
노유자시설 | 1 | 2.6% |
공동주택 | 1 | 2.6% |
운동시설 | 1 | 2.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단독주택 | 23 | |
제1종근린생활시설 | 6 | 15.4% |
공장 | 4 | 10.3% |
창고시설 | 2 | 5.1% |
제2종근린생활시설 | 1 | 2.6% |
노유자시설 | 1 | 2.6% |
공동주택 | 1 | 2.6% |
운동시설 | 1 | 2.6% |
대지위치 | 지목 | 대지면적(제곱미터) | 건축면적(제곱미터) | 연면적(제곱미터) | 허가일 | 주용도 | |
---|---|---|---|---|---|---|---|
대지위치 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
지목 | 1.000 | 1.000 | 0.850 | 0.680 | 0.803 | 0.850 | 0.879 |
대지면적(제곱미터) | 1.000 | 0.850 | 1.000 | 0.801 | 0.958 | 0.000 | 0.925 |
건축면적(제곱미터) | 1.000 | 0.680 | 0.801 | 1.000 | 0.964 | 0.000 | 0.800 |
연면적(제곱미터) | 1.000 | 0.803 | 0.958 | 0.964 | 1.000 | 0.000 | 0.961 |
허가일 | 1.000 | 0.850 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
주용도 | 1.000 | 0.879 | 0.925 | 0.800 | 0.961 | 0.000 | 1.000 |
주용도 | 지목 | |
---|---|---|
주용도 | 1.000 | 0.752 |
지목 | 0.752 | 1.000 |
대지면적(제곱미터) | 건축면적(제곱미터) | 연면적(제곱미터) | 지목 | 주용도 | |
---|---|---|---|---|---|
대지면적(제곱미터) | 1.000 | 0.704 | 0.540 | 0.705 | 0.578 |
건축면적(제곱미터) | 0.704 | 1.000 | 0.905 | 0.532 | 0.589 |
연면적(제곱미터) | 0.540 | 0.905 | 1.000 | 0.631 | 0.682 |
지목 | 0.705 | 0.532 | 0.631 | 1.000 | 0.752 |
주용도 | 0.578 | 0.589 | 0.682 | 0.752 | 1.000 |
건축구분 | 대지위치 | 지목 | 대지면적(제곱미터) | 건축면적(제곱미터) | 연면적(제곱미터) | 허가일 | 주용도 | |
---|---|---|---|---|---|---|---|---|
0 | 신축 | 충청남도 계룡시 엄사면 향한리 407-33 | 대 | 503.0 | 99.02 | 153.7 | 2022-12-09 | 단독주택 |
1 | 신축 | 충청남도 계룡시 두마면 입암리 650 | 공장용지 | 3359.2 | 1797.15 | 1944.16 | 2022-12-09 | 공장 |
2 | 신축 | 충청남도 계룡시 두마면 입암리 650 | 공장용지 | 3359.2 | 1797.15 | 1944.16 | 2022-12-09 | 공장 |
3 | 신축 | 충청남도 계룡시 엄사면 도곡리 155-2 | 답 | 890.0 | 176.9 | 176.9 | 2022-11-23 | 제2종근린생활시설 |
4 | 신축 | 충청남도 계룡시 금암동 156-7 | 대 | 560.1 | 374.2 | 1990.34 | 2022-10-27 | 노유자시설 |
5 | 신축 | 충청남도 계룡시 금암동 68-3 | 대 | 464.7 | 151.5 | 454.24 | 2022-10-25 | 제1종근린생활시설 |
6 | 신축 | 충청남도 계룡시 엄사면 엄사리 355-1 | 대 | 249.2 | 149.5 | 394.04 | 2022-09-19 | 단독주택 |
7 | 신축 | 충청남도 계룡시 엄사면 향한리 712 | 대 | 462.5 | 91.91 | 124.51 | 2022-09-15 | 단독주택 |
8 | 신축 | 충청남도 계룡시 엄사면 향한리 690 | 대 | 633.7 | 126.66 | 182.5 | 2022-09-13 | 단독주택 |
9 | 신축 | 충청남도 계룡시 엄사면 도곡리 33-7 | 대 | 505.0 | 100.88 | 167.18 | 2022-09-06 | 단독주택 |
건축구분 | 대지위치 | 지목 | 대지면적(제곱미터) | 건축면적(제곱미터) | 연면적(제곱미터) | 허가일 | 주용도 | |
---|---|---|---|---|---|---|---|---|
29 | 신축 | 충청남도 계룡시 엄사면 엄사리 245-7 | 대 | 237.3 | 133.58 | 196.98 | 2022-03-14 | 단독주택 |
30 | 신축 | 충청남도 계룡시 두마면 농소리 982 외2필지 | 대 | 2066.0 | 1189.32 | 2354.81 | 2022-03-07 | 제1종근린생활시설 |
31 | 신축 | 충청남도 계룡시 엄사면 향한리 696 | 대 | 503.8 | 99.64 | 149.9 | 2022-03-07 | 단독주택 |
32 | 신축 | 충청남도 계룡시 엄사면 엄사리 271-7 | 대 | 258.2 | 152.67 | 469.53 | 2022-02-25 | 단독주택 |
33 | 신축 | 충청남도 계룡시 엄사면 향한리 694 | 대 | 386.2 | 76.98 | 139.65 | 2022-02-16 | 단독주택 |
34 | 신축 | 충청남도 계룡시 금암동 161-3 | 대 | 2166.5 | 1697.46 | 3024.47 | 2022-02-14 | 운동시설 |
35 | 신축 | 충청남도 계룡시 두마면 농소리 999 | 대 | 1015.4 | 507.26 | 996.92 | 2022-02-14 | 제1종근린생활시설 |
36 | 신축 | 충청남도 계룡시 두마면 농소리 985 | 대 | 592.0 | 353.05 | 353.05 | 2022-02-14 | 제1종근린생활시설 |
37 | 신축 | 충청남도 계룡시 엄사면 엄사리 355-6 | 대 | 253.5 | 139.79 | 199.92 | 2022-02-04 | 단독주택 |
38 | 신축 | 충청남도 계룡시 엄사면 엄사리 269-7 | 대 | 225.9 | 94.72 | 149.82 | 2022-01-28 | 단독주택 |
Most frequently occurring
건축구분 | 대지위치 | 지목 | 대지면적(제곱미터) | 건축면적(제곱미터) | 연면적(제곱미터) | 허가일 | 주용도 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
0 | 신축 | 충청남도 계룡시 두마면 입암리 650 | 공장용지 | 3359.2 | 1797.15 | 1944.16 | 2022-12-09 | 공장 | 2 |