Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 173 |
Duplicate rows (%) | 1.7% |
Total size in memory | 507.8 KiB |
Average record size in memory | 52.0 B |
Variable types
Text | 1 |
---|---|
Numeric | 4 |
Dataset
Description | 전북특별자치도 진안군 도시계획정보시스템 건축물대장 표제부에 대한 데이터로 지붕종류, 대지면적, 부속 건축물 수, 부속 건축물 면적, 총 동 연면적 정보를 제공합니다. |
---|---|
Author | 전북특별자치도 진안군 |
URL | https://www.data.go.kr/data/15119155/fileData.do |
Dataset has 173 (1.7%) duplicate rows | Duplicates |
부속 건축물 수 is highly overall correlated with 부속 건축물 면적 | High correlation |
부속 건축물 면적 is highly overall correlated with 부속 건축물 수 | High correlation |
대지면적 is highly skewed (γ1 = 47.28945327) | Skewed |
부속 건축물 면적 is highly skewed (γ1 = 20.93583335) | Skewed |
총 동 연면적 is highly skewed (γ1 = 29.90410422) | Skewed |
대지면적 has 4590 (45.9%) zeros | Zeros |
부속 건축물 수 has 3665 (36.6%) zeros | Zeros |
부속 건축물 면적 has 3667 (36.7%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-14 21:26:04.569761 |
---|---|
Analysis finished | 2024-03-14 21:26:09.814155 |
Duration | 5.24 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
지붕종류
Text
Distinct | 478 |
---|---|
Distinct (%) | 4.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
스레트 | 4023 | |
스라브 | 947 | 9.3% |
스레이트 | 467 | 4.6% |
함석 | 383 | 3.8% |
슬라브 | 361 | 3.6% |
세멘기와+스레트 | 284 | 2.8% |
함석+스레트 | 278 | 2.7% |
기와 | 269 | 2.7% |
세멘기와 | 153 | 1.5% |
판넬 | 152 | 1.5% |
Other values (465) | 2824 |
Most occurring characters
Value | Count | Frequency (%) |
스 | 7443 | |
트 | 6768 | |
레 | 6193 | |
라 | 1878 | 4.6% |
+ | 1868 | 4.6% |
브 | 1831 | 4.5% |
와 | 1575 | 3.9% |
기 | 1570 | 3.9% |
멘 | 1103 | 2.7% |
석 | 988 | 2.4% |
Other values (159) | 9252 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 38396 | |
Math Symbol | 1868 | 4.6% |
Space Separator | 141 | 0.3% |
Open Punctuation | 24 | 0.1% |
Close Punctuation | 24 | 0.1% |
Decimal Number | 6 | < 0.1% |
Other Punctuation | 4 | < 0.1% |
Uppercase Letter | 4 | < 0.1% |
Lowercase Letter | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 7443 | |
트 | 6768 | |
레 | 6193 | |
라 | 1878 | 4.9% |
브 | 1831 | 4.8% |
와 | 1575 | 4.1% |
기 | 1570 | 4.1% |
멘 | 1103 | 2.9% |
석 | 988 | 2.6% |
함 | 986 | 2.6% |
Other values (143) | 8061 |
Decimal Number
Value | Count | Frequency (%) |
7 | 2 | |
1 | 1 | |
5 | 1 | |
0 | 1 | |
2 | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 1 | |
E | 1 | |
P | 1 | |
T | 1 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 3 | |
. | 1 | 25.0% |
Math Symbol
Value | Count | Frequency (%) |
+ | 1868 |
Space Separator
Value | Count | Frequency (%) |
141 |
Open Punctuation
Value | Count | Frequency (%) |
( | 24 |
Close Punctuation
Value | Count | Frequency (%) |
) | 24 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 38396 | |
Common | 2067 | 5.1% |
Latin | 6 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 7443 | |
트 | 6768 | |
레 | 6193 | |
라 | 1878 | 4.9% |
브 | 1831 | 4.8% |
와 | 1575 | 4.1% |
기 | 1570 | 4.1% |
멘 | 1103 | 2.9% |
석 | 988 | 2.6% |
함 | 986 | 2.6% |
Other values (143) | 8061 |
Common
Value | Count | Frequency (%) |
+ | 1868 | |
141 | 6.8% | |
( | 24 | 1.2% |
) | 24 | 1.2% |
/ | 3 | 0.1% |
7 | 2 | 0.1% |
1 | 1 | < 0.1% |
. | 1 | < 0.1% |
5 | 1 | < 0.1% |
0 | 1 | < 0.1% |
Latin
Value | Count | Frequency (%) |
m | 2 | |
C | 1 | |
E | 1 | |
P | 1 | |
T | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 38396 | |
ASCII | 2073 | 5.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
스 | 7443 | |
트 | 6768 | |
레 | 6193 | |
라 | 1878 | 4.9% |
브 | 1831 | 4.8% |
와 | 1575 | 4.1% |
기 | 1570 | 4.1% |
멘 | 1103 | 2.9% |
석 | 988 | 2.6% |
함 | 986 | 2.6% |
Other values (143) | 8061 |
ASCII
Value | Count | Frequency (%) |
+ | 1868 | |
141 | 6.8% | |
( | 24 | 1.2% |
) | 24 | 1.2% |
/ | 3 | 0.1% |
m | 2 | 0.1% |
7 | 2 | 0.1% |
C | 1 | < 0.1% |
E | 1 | < 0.1% |
P | 1 | < 0.1% |
Other values (6) | 6 | 0.3% |
대지면적
Real number (ℝ)
SKEWED
  ZEROS
 
Distinct | 1446 |
---|---|
Distinct (%) | 14.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 429.83388 |
Minimum | 0 |
---|---|
Maximum | 198227 |
Zeros | 4590 |
Zeros (%) | 45.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 162 |
Q3 | 450 |
95-th percentile | 1184.1 |
Maximum | 198227 |
Range | 198227 |
Interquartile range (IQR) | 450 |
Descriptive statistics
Standard deviation | 2950.7439 |
---|---|
Coefficient of variation (CV) | 6.8648472 |
Kurtosis | 2760.3176 |
Mean | 429.83388 |
Median Absolute Deviation (MAD) | 162 |
Skewness | 47.289453 |
Sum | 4298338.8 |
Variance | 8706889.5 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 4590 | |
660.0 | 82 | 0.8% |
327.0 | 35 | 0.4% |
397.0 | 31 | 0.3% |
357.0 | 28 | 0.3% |
347.0 | 28 | 0.3% |
281.0 | 27 | 0.3% |
377.0 | 27 | 0.3% |
387.0 | 27 | 0.3% |
311.0 | 27 | 0.3% |
Other values (1436) | 5098 |
Value | Count | Frequency (%) |
0.0 | 4590 | |
3.0 | 1 | < 0.1% |
10.0 | 2 | < 0.1% |
13.0 | 4 | < 0.1% |
16.0 | 2 | < 0.1% |
17.0 | 2 | < 0.1% |
20.0 | 2 | < 0.1% |
25.0 | 1 | < 0.1% |
26.0 | 4 | < 0.1% |
30.563 | 1 | < 0.1% |
Value | Count | Frequency (%) |
198227.0 | 1 | |
150000.0 | 1 | |
73241.0 | 1 | |
69124.0 | 1 | |
48535.0 | 1 | |
38091.0 | 1 | |
36496.0 | 1 | |
31252.0 | 1 | |
25551.0 | 1 | |
23158.0 | 1 |
부속 건축물 수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.9429 |
Minimum | 0 |
---|---|
Maximum | 12 |
Zeros | 3665 |
Zeros (%) | 36.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 1 |
Q3 | 1 |
95-th percentile | 3 |
Maximum | 12 |
Range | 12 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 0.94006806 |
---|---|
Coefficient of variation (CV) | 0.99699657 |
Kurtosis | 6.5981375 |
Mean | 0.9429 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.4495263 |
Sum | 9429 |
Variance | 0.88372796 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 3931 | |
0 | 3665 | |
2 | 1891 | |
3 | 415 | 4.2% |
4 | 65 | 0.7% |
5 | 15 | 0.1% |
6 | 6 | 0.1% |
7 | 5 | 0.1% |
8 | 4 | < 0.1% |
12 | 1 | < 0.1% |
Other values (2) | 2 | < 0.1% |
Value | Count | Frequency (%) |
0 | 3665 | |
1 | 3931 | |
2 | 1891 | |
3 | 415 | 4.2% |
4 | 65 | 0.7% |
5 | 15 | 0.1% |
6 | 6 | 0.1% |
7 | 5 | 0.1% |
8 | 4 | < 0.1% |
10 | 1 | < 0.1% |
Value | Count | Frequency (%) |
12 | 1 | < 0.1% |
11 | 1 | < 0.1% |
10 | 1 | < 0.1% |
8 | 4 | < 0.1% |
7 | 5 | 0.1% |
6 | 6 | 0.1% |
5 | 15 | 0.1% |
4 | 65 | 0.7% |
3 | 415 | 4.2% |
2 | 1891 |
부속 건축물 면적
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 3598 |
---|---|
Distinct (%) | 36.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 29.107376 |
Minimum | 0 |
---|---|
Maximum | 3116.58 |
Zeros | 3667 |
Zeros (%) | 36.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 18.91 |
Q3 | 38.25 |
95-th percentile | 87.49525 |
Maximum | 3116.58 |
Range | 3116.58 |
Interquartile range (IQR) | 38.25 |
Descriptive statistics
Standard deviation | 70.548264 |
---|---|
Coefficient of variation (CV) | 2.4237247 |
Kurtosis | 680.42154 |
Mean | 29.107376 |
Median Absolute Deviation (MAD) | 18.91 |
Skewness | 20.935833 |
Sum | 291073.76 |
Variance | 4977.0575 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 3667 | |
18.0 | 57 | 0.6% |
27.0 | 29 | 0.3% |
24.0 | 26 | 0.3% |
28.0 | 22 | 0.2% |
12.0 | 19 | 0.2% |
16.8 | 15 | 0.1% |
36.0 | 15 | 0.1% |
19.2 | 15 | 0.1% |
25.2 | 14 | 0.1% |
Other values (3588) | 6121 |
Value | Count | Frequency (%) |
0.0 | 3667 | |
0.64 | 1 | < 0.1% |
0.81 | 1 | < 0.1% |
0.88 | 1 | < 0.1% |
1.0 | 1 | < 0.1% |
1.1 | 1 | < 0.1% |
1.2 | 1 | < 0.1% |
1.21 | 1 | < 0.1% |
1.42 | 1 | < 0.1% |
1.44 | 3 | < 0.1% |
Value | Count | Frequency (%) |
3116.58 | 1 | |
2418.99 | 1 | |
2050.07 | 1 | |
1669.17 | 1 | |
1668.33 | 1 | |
1621.13 | 1 | |
1379.65 | 1 | |
1166.84 | 1 | |
1048.01 | 1 | |
888.0 | 1 |
총 동 연면적
Real number (ℝ)
SKEWED
 
Distinct | 6833 |
---|---|
Distinct (%) | 68.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 112.83626 |
Minimum | 0 |
---|---|
Maximum | 15118.16 |
Zeros | 27 |
Zeros (%) | 0.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 18.74 |
Q1 | 48.8 |
median | 76.705 |
Q3 | 105.985 |
95-th percentile | 281.008 |
Maximum | 15118.16 |
Range | 15118.16 |
Interquartile range (IQR) | 57.185 |
Descriptive statistics
Standard deviation | 280.36481 |
---|---|
Coefficient of variation (CV) | 2.4847049 |
Kurtosis | 1369.4447 |
Mean | 112.83626 |
Median Absolute Deviation (MAD) | 28.345 |
Skewness | 29.904104 |
Sum | 1128362.6 |
Variance | 78604.425 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 27 | 0.3% |
66.0 | 15 | 0.1% |
96.0 | 13 | 0.1% |
84.0 | 13 | 0.1% |
36.0 | 13 | 0.1% |
171.0 | 13 | 0.1% |
27.0 | 11 | 0.1% |
165.0 | 11 | 0.1% |
99.0 | 11 | 0.1% |
32.0 | 11 | 0.1% |
Other values (6823) | 9862 |
Value | Count | Frequency (%) |
0.0 | 27 | |
2.6 | 1 | < 0.1% |
2.88 | 4 | < 0.1% |
3.0 | 2 | < 0.1% |
3.3 | 1 | < 0.1% |
3.52 | 1 | < 0.1% |
3.64 | 1 | < 0.1% |
4.16 | 1 | < 0.1% |
4.29 | 1 | < 0.1% |
4.36 | 1 | < 0.1% |
Value | Count | Frequency (%) |
15118.16 | 1 | |
13329.75 | 1 | |
5985.83 | 1 | |
5665.34 | 1 | |
4505.0 | 1 | |
4388.99 | 1 | |
3269.73 | 1 | |
3174.37 | 1 | |
2718.94 | 1 | |
2568.508 | 1 |
대지면적 | 부속 건축물 수 | 부속 건축물 면적 | 총 동 연면적 | |
---|---|---|---|---|
대지면적 | 1.000 | 0.507 | 0.817 | 0.624 |
부속 건축물 수 | 0.507 | 1.000 | 0.854 | 0.395 |
부속 건축물 면적 | 0.817 | 0.854 | 1.000 | 0.606 |
총 동 연면적 | 0.624 | 0.395 | 0.606 | 1.000 |
대지면적 | 부속 건축물 수 | 부속 건축물 면적 | 총 동 연면적 | |
---|---|---|---|---|
대지면적 | 1.000 | 0.142 | 0.184 | 0.438 |
부속 건축물 수 | 0.142 | 1.000 | 0.901 | 0.309 |
부속 건축물 면적 | 0.184 | 0.901 | 1.000 | 0.411 |
총 동 연면적 | 0.438 | 0.309 | 0.411 | 1.000 |
지붕종류 | 대지면적 | 부속 건축물 수 | 부속 건축물 면적 | 총 동 연면적 | |
---|---|---|---|---|---|
7325 | 스레이트 | 149.0 | 0 | 0.0 | 27.94 |
3329 | 스라브 | 333.0 | 0 | 0.0 | 68.4 |
9559 | 스레트 | 165.0 | 1 | 15.0 | 126.87 |
4236 | 함석 | 165.0 | 0 | 0.0 | 21.87 |
411 | 스레이트 | 248.0 | 1 | 22.36 | 71.36 |
11815 | 스레트 | 612.0 | 3 | 78.02 | 152.02 |
8281 | 스라브 | 357.0 | 0 | 0.0 | 71.02 |
7773 | 스레트 | 572.0 | 0 | 0.0 | 247.0 |
4969 | 함석+스레트 | 0.0 | 2 | 41.48 | 72.28 |
6656 | 함석 | 0.0 | 0 | 0.0 | 16.95 |
지붕종류 | 대지면적 | 부속 건축물 수 | 부속 건축물 면적 | 총 동 연면적 | |
---|---|---|---|---|---|
11754 | 스레트 | 1260.0 | 1 | 24.6 | 57.6 |
8680 | 스레트 | 0.0 | 1 | 32.0 | 130.4 |
12124 | 강판기와 | 842.0 | 1 | 55.86 | 98.1 |
4377 | 세멘기와 | 410.0 | 0 | 0.0 | 66.28 |
345 | 스레트 | 0.0 | 1 | 13.72 | 35.12 |
11730 | 스레트 | 0.0 | 1 | 19.2 | 54.54 |
1192 | 스레트 | 0.0 | 0 | 0.0 | 43.24 |
10011 | 세멘기와 | 228.0 | 2 | 56.76 | 105.71 |
4425 | 시멘트기와 | 221.0 | 1 | 22.7 | 66.37 |
219 | 아연+스레트 | 0.0 | 1 | 9.68 | 40.9 |
Most frequently occurring
지붕종류 | 대지면적 | 부속 건축물 수 | 부속 건축물 면적 | 총 동 연면적 | # duplicates | |
---|---|---|---|---|---|---|
18 | 스라브 | 0.0 | 0 | 0.0 | 36.0 | 6 |
122 | 스레트 | 0.0 | 0 | 0.0 | 32.0 | 5 |
6 | 경사지붕 | 0.0 | 2 | 221.66 | 1148.36 | 4 |
62 | 스레트 | 0.0 | 0 | 0.0 | 17.25 | 4 |
69 | 스레트 | 0.0 | 0 | 0.0 | 17.98 | 4 |
83 | 스레트 | 0.0 | 0 | 0.0 | 21.0 | 4 |
98 | 스레트 | 0.0 | 0 | 0.0 | 25.19 | 4 |
106 | 스레트 | 0.0 | 0 | 0.0 | 28.5 | 4 |
130 | 스레트 | 0.0 | 0 | 0.0 | 34.02 | 4 |
3 | 갈바륨강판 | 0.0 | 0 | 0.0 | 752.0 | 3 |