Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 30 |
Missing cells (%) | 0.1% |
Duplicate rows | 734 |
Duplicate rows (%) | 7.3% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
Categorical | 1 |
---|---|
Numeric | 2 |
Text | 2 |
Dataset
Description | 전북특별자치도 진안군 도시계획정보시스템 건축물대장 층별 개요에 대한 데이터로 층명, 구조, 구조명, 용도, 면적 정보를 제공합니다. |
---|---|
Author | 전북특별자치도 진안군 |
URL | https://www.data.go.kr/data/15119152/fileData.do |
Dataset has 734 (7.3%) duplicate rows | Duplicates |
층명 is highly imbalanced (90.1%) | Imbalance |
Reproduction
Analysis started | 2024-03-14 08:54:44.829867 |
---|---|
Analysis finished | 2024-03-14 08:54:47.258614 |
Duration | 2.43 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
층명
Categorical
IMBALANCE
 
Distinct | 23 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
1층 | |
---|---|
2층 | 364 |
지상1층 | 113 |
3층 | 50 |
4층 | 12 |
Other values (18) | 60 |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.0305 |
Min length | 2 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 1층 |
---|---|
2nd row | 1층 |
3rd row | 1층 |
4th row | 1층 |
5th row | 1층 |
Common Values
Value | Count | Frequency (%) |
1층 | 9401 | |
2층 | 364 | 3.6% |
지상1층 | 113 | 1.1% |
3층 | 50 | 0.5% |
4층 | 12 | 0.1% |
옥탑1층 | 10 | 0.1% |
지하1층 | 9 | 0.1% |
옥탑층 | 7 | 0.1% |
5층 | 5 | 0.1% |
옥탑 | 4 | < 0.1% |
Other values (13) | 25 | 0.2% |
Length
Value | Count | Frequency (%) |
1층 | 9403 | |
2층 | 365 | 3.6% |
지상1층 | 113 | 1.1% |
3층 | 50 | 0.5% |
4층 | 12 | 0.1% |
옥탑1층 | 10 | 0.1% |
지하1층 | 9 | 0.1% |
옥탑층 | 7 | 0.1% |
옥탑 | 7 | 0.1% |
5층 | 5 | < 0.1% |
Other values (11) | 22 | 0.2% |
구조
Real number (ℝ)
Distinct | 15 |
---|---|
Distinct (%) | 0.2% |
Missing | 23 |
Missing (%) | 0.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 36.88684 |
Minimum | 11 |
---|---|
Maximum | 99 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 11 |
---|---|
5-th percentile | 11 |
Q1 | 21 |
median | 51 |
Q3 | 51 |
95-th percentile | 51 |
Maximum | 99 |
Range | 88 |
Interquartile range (IQR) | 30 |
Descriptive statistics
Standard deviation | 16.614675 |
---|---|
Coefficient of variation (CV) | 0.45042285 |
Kurtosis | -1.2660234 |
Mean | 36.88684 |
Median Absolute Deviation (MAD) | 0 |
Skewness | -0.48690296 |
Sum | 368020 |
Variance | 276.04744 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
51 | 5339 | |
11 | 1412 | 14.1% |
32 | 1034 | 10.3% |
12 | 723 | 7.2% |
21 | 705 | 7.0% |
31 | 303 | 3.0% |
33 | 286 | 2.9% |
19 | 121 | 1.2% |
39 | 22 | 0.2% |
99 | 9 | 0.1% |
Other values (5) | 23 | 0.2% |
(Missing) | 23 | 0.2% |
Value | Count | Frequency (%) |
11 | 1412 | |
12 | 723 | |
13 | 7 | 0.1% |
19 | 121 | 1.2% |
21 | 705 | |
29 | 4 | < 0.1% |
31 | 303 | 3.0% |
32 | 1034 | |
33 | 286 | 2.9% |
39 | 22 | 0.2% |
Value | Count | Frequency (%) |
99 | 9 | 0.1% |
52 | 4 | < 0.1% |
51 | 5339 | |
49 | 1 | < 0.1% |
41 | 7 | 0.1% |
39 | 22 | 0.2% |
33 | 286 | 2.9% |
32 | 1034 | 10.3% |
31 | 303 | 3.0% |
29 | 4 | < 0.1% |
구조명
Text
Distinct | 765 |
---|---|
Distinct (%) | 7.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
목조+스레트 | 3286 | |
목조+함석 | 427 | 4.2% |
경량철골구조 | 391 | 3.8% |
목조 | 382 | 3.7% |
목조+스레이트 | 317 | 3.1% |
목조+세멘기와 | 275 | 2.7% |
철근콘크리트구조 | 225 | 2.2% |
경량철골조 | 162 | 1.6% |
일반철골구조 | 156 | 1.5% |
강파이프구조 | 130 | 1.3% |
Other values (738) | 4442 |
Most occurring characters
Value | Count | Frequency (%) |
조 | 9060 | 13.9% |
+ | 7232 | 11.1% |
트 | 5566 | 8.5% |
목 | 5365 | 8.2% |
스 | 4820 | 7.4% |
레 | 4336 | 6.7% |
철 | 2079 | 3.2% |
구 | 1372 | 2.1% |
벽 | 1370 | 2.1% |
돌 | 1340 | 2.1% |
Other values (149) | 22662 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 56868 | |
Math Symbol | 7232 | 11.1% |
Open Punctuation | 440 | 0.7% |
Close Punctuation | 440 | 0.7% |
Space Separator | 194 | 0.3% |
Other Punctuation | 21 | < 0.1% |
Uppercase Letter | 7 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
조 | 9060 | |
트 | 5566 | 9.8% |
목 | 5365 | 9.4% |
스 | 4820 | 8.5% |
레 | 4336 | 7.6% |
철 | 2079 | 3.7% |
구 | 1372 | 2.4% |
벽 | 1370 | 2.4% |
돌 | 1340 | 2.4% |
멘 | 1326 | 2.3% |
Other values (138) | 20234 |
Uppercase Letter
Value | Count | Frequency (%) |
H | 3 | |
C | 2 | |
O | 1 | 14.3% |
N | 1 | 14.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 19 | |
: | 1 | 4.8% |
. | 1 | 4.8% |
Math Symbol
Value | Count | Frequency (%) |
+ | 7232 |
Open Punctuation
Value | Count | Frequency (%) |
( | 440 |
Close Punctuation
Value | Count | Frequency (%) |
) | 440 |
Space Separator
Value | Count | Frequency (%) |
194 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 56868 | |
Common | 8327 | 12.8% |
Latin | 7 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
조 | 9060 | |
트 | 5566 | 9.8% |
목 | 5365 | 9.4% |
스 | 4820 | 8.5% |
레 | 4336 | 7.6% |
철 | 2079 | 3.7% |
구 | 1372 | 2.4% |
벽 | 1370 | 2.4% |
돌 | 1340 | 2.4% |
멘 | 1326 | 2.3% |
Other values (138) | 20234 |
Common
Value | Count | Frequency (%) |
+ | 7232 | |
( | 440 | 5.3% |
) | 440 | 5.3% |
194 | 2.3% | |
, | 19 | 0.2% |
: | 1 | < 0.1% |
. | 1 | < 0.1% |
Latin
Value | Count | Frequency (%) |
H | 3 | |
C | 2 | |
O | 1 | 14.3% |
N | 1 | 14.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 56868 | |
ASCII | 8334 | 12.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
조 | 9060 | |
트 | 5566 | 9.8% |
목 | 5365 | 9.4% |
스 | 4820 | 8.5% |
레 | 4336 | 7.6% |
철 | 2079 | 3.7% |
구 | 1372 | 2.4% |
벽 | 1370 | 2.4% |
돌 | 1340 | 2.4% |
멘 | 1326 | 2.3% |
Other values (138) | 20234 |
ASCII
Value | Count | Frequency (%) |
+ | 7232 | |
( | 440 | 5.3% |
) | 440 | 5.3% |
194 | 2.3% | |
, | 19 | 0.2% |
H | 3 | < 0.1% |
C | 2 | < 0.1% |
: | 1 | < 0.1% |
O | 1 | < 0.1% |
N | 1 | < 0.1% |
용도
Text
Distinct | 667 |
---|---|
Distinct (%) | 6.7% |
Missing | 6 |
Missing (%) | 0.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
주택 | 3280 | |
부속 | 2201 | |
창고 | 822 | 8.2% |
단독주택 | 750 | 7.5% |
축사 | 418 | 4.2% |
퇴비사 | 138 | 1.4% |
부속(창고 | 137 | 1.4% |
저온창고 | 118 | 1.2% |
화장실 | 118 | 1.2% |
근린생활시설 | 106 | 1.1% |
Other values (644) | 1977 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 4227 | |
택 | 4147 | |
부 | 2466 | 8.7% |
속 | 2462 | 8.7% |
고 | 1245 | 4.4% |
창 | 1213 | 4.3% |
사 | 1023 | 3.6% |
단 | 783 | 2.8% |
독 | 765 | 2.7% |
) | 505 | 1.8% |
Other values (284) | 9559 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 27117 | |
Close Punctuation | 505 | 1.8% |
Open Punctuation | 505 | 1.8% |
Other Punctuation | 117 | 0.4% |
Space Separator | 73 | 0.3% |
Decimal Number | 67 | 0.2% |
Uppercase Letter | 11 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 4227 | |
택 | 4147 | |
부 | 2466 | 9.1% |
속 | 2462 | 9.1% |
고 | 1245 | 4.6% |
창 | 1213 | 4.5% |
사 | 1023 | 3.8% |
단 | 783 | 2.9% |
독 | 765 | 2.8% |
축 | 489 | 1.8% |
Other values (261) | 8297 |
Decimal Number
Value | Count | Frequency (%) |
2 | 20 | |
1 | 15 | |
7 | 10 | |
6 | 7 | 10.4% |
9 | 5 | 7.5% |
3 | 3 | 4.5% |
5 | 3 | 4.5% |
4 | 3 | 4.5% |
8 | 1 | 1.5% |
Uppercase Letter
Value | Count | Frequency (%) |
E | 4 | |
V | 2 | |
M | 1 | 9.1% |
D | 1 | 9.1% |
F | 1 | 9.1% |
A | 1 | 9.1% |
L | 1 | 9.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 85 | |
/ | 17 | 14.5% |
. | 13 | 11.1% |
: | 2 | 1.7% |
Close Punctuation
Value | Count | Frequency (%) |
) | 505 |
Open Punctuation
Value | Count | Frequency (%) |
( | 505 |
Space Separator
Value | Count | Frequency (%) |
73 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 27115 | |
Common | 1267 | 4.5% |
Latin | 11 | < 0.1% |
Han | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 4227 | |
택 | 4147 | |
부 | 2466 | 9.1% |
속 | 2462 | 9.1% |
고 | 1245 | 4.6% |
창 | 1213 | 4.5% |
사 | 1023 | 3.8% |
단 | 783 | 2.9% |
독 | 765 | 2.8% |
축 | 489 | 1.8% |
Other values (259) | 8295 |
Common
Value | Count | Frequency (%) |
) | 505 | |
( | 505 | |
, | 85 | 6.7% |
73 | 5.8% | |
2 | 20 | 1.6% |
/ | 17 | 1.3% |
1 | 15 | 1.2% |
. | 13 | 1.0% |
7 | 10 | 0.8% |
6 | 7 | 0.6% |
Other values (6) | 17 | 1.3% |
Latin
Value | Count | Frequency (%) |
E | 4 | |
V | 2 | |
M | 1 | 9.1% |
D | 1 | 9.1% |
F | 1 | 9.1% |
A | 1 | 9.1% |
L | 1 | 9.1% |
Han
Value | Count | Frequency (%) |
住 | 1 | |
宅 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 27115 | |
ASCII | 1278 | 4.5% |
CJK | 1 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 4227 | |
택 | 4147 | |
부 | 2466 | 9.1% |
속 | 2462 | 9.1% |
고 | 1245 | 4.6% |
창 | 1213 | 4.5% |
사 | 1023 | 3.8% |
단 | 783 | 2.9% |
독 | 765 | 2.8% |
축 | 489 | 1.8% |
Other values (259) | 8295 |
ASCII
Value | Count | Frequency (%) |
) | 505 | |
( | 505 | |
, | 85 | 6.7% |
73 | 5.7% | |
2 | 20 | 1.6% |
/ | 17 | 1.3% |
1 | 15 | 1.2% |
. | 13 | 1.0% |
7 | 10 | 0.8% |
6 | 7 | 0.5% |
Other values (13) | 28 | 2.2% |
CJK
Value | Count | Frequency (%) |
住 | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
宅 | 1 |
면적
Real number (ℝ)
Distinct | 4860 |
---|---|
Distinct (%) | 48.6% |
Missing | 1 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 79.023692 |
Minimum | 0.88 |
---|---|
Maximum | 3174.37 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0.88 |
---|---|
5-th percentile | 11.157 |
Q1 | 23.235 |
median | 36.18 |
Q3 | 78.94 |
95-th percentile | 273.104 |
Maximum | 3174.37 |
Range | 3173.49 |
Interquartile range (IQR) | 55.705 |
Descriptive statistics
Standard deviation | 162.46269 |
---|---|
Coefficient of variation (CV) | 2.0558731 |
Kurtosis | 68.383963 |
Mean | 79.023692 |
Median Absolute Deviation (MAD) | 17.7 |
Skewness | 7.1776871 |
Sum | 790157.89 |
Variance | 26394.124 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
18.0 | 65 | 0.7% |
32.0 | 41 | 0.4% |
21.0 | 33 | 0.3% |
27.0 | 32 | 0.3% |
36.0 | 29 | 0.3% |
32.4 | 27 | 0.3% |
28.0 | 27 | 0.3% |
24.0 | 25 | 0.2% |
16.5 | 25 | 0.2% |
33.6 | 23 | 0.2% |
Other values (4850) | 9672 |
Value | Count | Frequency (%) |
0.88 | 1 | < 0.1% |
1.0 | 1 | < 0.1% |
1.21 | 1 | < 0.1% |
1.32 | 1 | < 0.1% |
1.43 | 1 | < 0.1% |
1.44 | 4 | |
1.5 | 1 | < 0.1% |
1.65 | 1 | < 0.1% |
1.8 | 2 | |
1.88 | 1 | < 0.1% |
Value | Count | Frequency (%) |
3174.37 | 1 | |
2442.0 | 1 | |
2129.3 | 1 | |
2122.33 | 1 | |
1974.94 | 1 | |
1922.94 | 1 | |
1909.05 | 1 | |
1900.8 | 1 | |
1893.0 | 1 | |
1892.88 | 1 |
층명 | 구조 | 면적 | |
---|---|---|---|
층명 | 1.000 | 0.519 | 0.282 |
구조 | 0.519 | 1.000 | 0.310 |
면적 | 0.282 | 0.310 | 1.000 |
구조 | 면적 | 층명 | |
---|---|---|---|
구조 | 1.000 | -0.430 | 0.264 |
면적 | -0.430 | 1.000 | 0.112 |
층명 | 0.264 | 0.112 | 1.000 |
층명 | 구조 | 구조명 | 용도 | 면적 | |
---|---|---|---|---|---|
11638 | 1층 | 11 | 조적조(적벽돌) | 주택 | 98.07 |
11851 | 1층 | 51 | 목조+스레트 | 주택 | 37.15 |
2928 | 1층 | 51 | 목조+스레트 | 주택 | 36.98 |
3181 | 1층 | 51 | 목조+스레트 | 부속 | 24.64 |
12358 | 1층 | 11 | 적벽돌 | 단독주택 | 97.2 |
6310 | 1층 | 51 | 목조+스레트 | 주택 | 28.46 |
13812 | 1층 | 12 | 시멘트블록+스라브 | 화장실 | 2.0 |
6091 | 1층 | 32 | 경량철골구조 | 제조업소 | 60.0 |
23820 | 1층 | 11 | 조적조(적벽돌)+스라브 | 주택 | 86.98 |
1042 | 1층 | 32 | 경량파이프+갈바륨 | 퇴비사 | 67.2 |
층명 | 구조 | 구조명 | 용도 | 면적 | |
---|---|---|---|---|---|
19167 | 1층 | 21 | 철근콘크리트구조 | 단독주택 | 83.39 |
4834 | 1층 | 51 | 목조+스레트 | 주택 | 21.19 |
503 | 1층 | 51 | 목조+스레이트 | 부속 | 26.5 |
20693 | 1층 | 32 | 경량철골구조+판넬 | 총인처리실 | 104.16 |
17443 | 1층 | 33 | 강파이프조+스레이트 | 축사 | 535.5 |
2392 | 1층 | 51 | 목조+스레트 | 주택 | 30.77 |
11971 | 1층 | 19 | 조적조+슬라브 | 단독주택 | 76.95 |
30140 | 1층 | 31 | 철골조+스레트 | 축사 | 184.0 |
20137 | 1층 | 51 | 목조 | 주택 | 39.14 |
18533 | 1층 | 11 | 시멘트벽돌조+칼라강판 | 저온창고 | 16.94 |
Most frequently occurring
층명 | 구조 | 구조명 | 용도 | 면적 | # duplicates | |
---|---|---|---|---|---|---|
586 | 1층 | 51 | 목조+스레트 | 주택 | 34.44 | 12 |
580 | 1층 | 51 | 목조+스레트 | 주택 | 34.02 | 11 |
261 | 1층 | 51 | 목조+스레트 | 부속 | 18.0 | 10 |
566 | 1층 | 51 | 목조+스레트 | 주택 | 32.4 | 10 |
572 | 1층 | 51 | 목조+스레트 | 주택 | 33.21 | 10 |
296 | 1층 | 51 | 목조+스레트 | 부속 | 21.0 | 9 |
374 | 1층 | 51 | 목조+스레트 | 부속 | 27.0 | 9 |
552 | 1층 | 51 | 목조+스레트 | 주택 | 31.2 | 9 |
561 | 1층 | 51 | 목조+스레트 | 주택 | 32.0 | 9 |
84 | 1층 | 33 | 강파이프구조 | 축사 | 336.0 | 8 |