Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 369 |
Missing cells | 163 |
Missing cells (%) | 5.5% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 24.3 KiB |
Average record size in memory | 67.4 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 5 |
Text | 1 |
Dataset
Description | 서웉특별시 강서구 오피스텔 현황 데이터 입니다. 제공데이터 : 연도, 시군구, 법정동, 주용도, 기타용도, 세대수, 가구수, 데이터기준일자 |
---|---|
Author | 서울특별시 강서구 |
URL | https://www.data.go.kr/data/15107751/fileData.do |
시군구 has constant value "" | Constant |
데이터기준일자 has constant value "" | Constant |
연번 is highly overall correlated with 세대수 | High correlation |
세대수 is highly overall correlated with 연번 | High correlation |
가구수 is highly imbalanced (57.0%) | Imbalance |
세대수 has 163 (44.2%) missing values | Missing |
연번 has unique values | Unique |
세대수 has 73 (19.8%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 15:45:49.012111 |
---|---|
Analysis finished | 2023-12-12 15:45:50.101287 |
Duration | 1.09 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 369 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 185 |
Minimum | 1 |
---|---|
Maximum | 369 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 19.4 |
Q1 | 93 |
median | 185 |
Q3 | 277 |
95-th percentile | 350.6 |
Maximum | 369 |
Range | 368 |
Interquartile range (IQR) | 184 |
Descriptive statistics
Standard deviation | 106.66536 |
---|---|
Coefficient of variation (CV) | 0.57656954 |
Kurtosis | -1.2 |
Mean | 185 |
Median Absolute Deviation (MAD) | 92 |
Skewness | 0 |
Sum | 68265 |
Variance | 11377.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.3% |
244 | 1 | 0.3% |
253 | 1 | 0.3% |
252 | 1 | 0.3% |
251 | 1 | 0.3% |
250 | 1 | 0.3% |
249 | 1 | 0.3% |
248 | 1 | 0.3% |
247 | 1 | 0.3% |
246 | 1 | 0.3% |
Other values (359) | 359 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
369 | 1 | |
368 | 1 | |
367 | 1 | |
366 | 1 | |
365 | 1 | |
364 | 1 | |
363 | 1 | |
362 | 1 | |
361 | 1 | |
360 | 1 |
시군구
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.0 KiB |
서울특별시 강서구 |
---|
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 강서구 |
---|---|
2nd row | 서울특별시 강서구 |
3rd row | 서울특별시 강서구 |
4th row | 서울특별시 강서구 |
5th row | 서울특별시 강서구 |
Common Values
Value | Count | Frequency (%) |
서울특별시 강서구 | 369 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 369 | |
강서구 | 369 |
법정동
Categorical
Distinct | 8 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.0 KiB |
화곡동 | |
---|---|
등촌동 | |
염창동 | |
마곡동 | |
방화동 | |
Other values (3) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0108401 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 화곡동 |
---|---|
2nd row | 등촌동 |
3rd row | 등촌동 |
4th row | 등촌동 |
5th row | 등촌동 |
Common Values
Value | Count | Frequency (%) |
화곡동 | 173 | |
등촌동 | 61 | 16.5% |
염창동 | 40 | 10.8% |
마곡동 | 37 | 10.0% |
방화동 | 29 | 7.9% |
가양동 | 22 | 6.0% |
내발산동 | 4 | 1.1% |
공항동 | 3 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
화곡동 | 173 | |
등촌동 | 61 | 16.5% |
염창동 | 40 | 10.8% |
마곡동 | 37 | 10.0% |
방화동 | 29 | 7.9% |
가양동 | 22 | 6.0% |
내발산동 | 4 | 1.1% |
공항동 | 3 | 0.8% |
주용도
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.0 KiB |
업무시설 | |
---|---|
공동주택 | |
제1종근린생활시설 | 2 |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 4.0271003 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 업무시설 |
---|---|
2nd row | 업무시설 |
3rd row | 업무시설 |
4th row | 업무시설 |
5th row | 업무시설 |
Common Values
Value | Count | Frequency (%) |
업무시설 | 287 | |
공동주택 | 80 | 21.7% |
제1종근린생활시설 | 2 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
업무시설 | 287 | |
공동주택 | 80 | 21.7% |
제1종근린생활시설 | 2 | 0.5% |
기타용도
Text
Distinct | 148 |
---|---|
Distinct (%) | 40.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.0 KiB |
Value | Count | Frequency (%) |
업무시설(오피스텔 | 164 | |
오피스텔 | 83 | |
및 | 59 | 9.7% |
근린생활시설 | 53 | 8.7% |
업무시설,오피스텔 | 28 | 4.6% |
업무시설(오피스텔),근린생활시설 | 18 | 3.0% |
다세대주택 | 12 | 2.0% |
도시형생활주택(단지형다세대 | 12 | 2.0% |
도시형생활주택(원룸형 | 10 | 1.6% |
공동주택(다세대주택 | 9 | 1.5% |
Other values (103) | 162 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 464 | 7.8% |
설 | 392 | 6.6% |
텔 | 369 | 6.2% |
오 | 369 | 6.2% |
피 | 369 | 6.2% |
스 | 369 | 6.2% |
) | 338 | 5.7% |
( | 338 | 5.7% |
무 | 275 | 4.7% |
업 | 264 | 4.5% |
Other values (55) | 2364 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4665 | |
Close Punctuation | 338 | 5.7% |
Open Punctuation | 338 | 5.7% |
Other Punctuation | 256 | 4.3% |
Space Separator | 241 | 4.1% |
Decimal Number | 66 | 1.1% |
Dash Punctuation | 7 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 464 | 9.9% |
설 | 392 | 8.4% |
텔 | 369 | 7.9% |
오 | 369 | 7.9% |
피 | 369 | 7.9% |
스 | 369 | 7.9% |
무 | 275 | 5.9% |
업 | 264 | 5.7% |
생 | 202 | 4.3% |
활 | 197 | 4.2% |
Other values (39) | 1395 |
Decimal Number
Value | Count | Frequency (%) |
1 | 26 | |
2 | 22 | |
0 | 4 | 6.1% |
6 | 4 | 6.1% |
8 | 3 | 4.5% |
4 | 2 | 3.0% |
3 | 2 | 3.0% |
5 | 2 | 3.0% |
7 | 1 | 1.5% |
Other Punctuation
Value | Count | Frequency (%) |
, | 239 | |
/ | 16 | 6.2% |
. | 1 | 0.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 338 |
Open Punctuation
Value | Count | Frequency (%) |
( | 338 |
Space Separator
Value | Count | Frequency (%) |
241 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4665 | |
Common | 1246 | 21.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 464 | 9.9% |
설 | 392 | 8.4% |
텔 | 369 | 7.9% |
오 | 369 | 7.9% |
피 | 369 | 7.9% |
스 | 369 | 7.9% |
무 | 275 | 5.9% |
업 | 264 | 5.7% |
생 | 202 | 4.3% |
활 | 197 | 4.2% |
Other values (39) | 1395 |
Common
Value | Count | Frequency (%) |
) | 338 | |
( | 338 | |
241 | ||
, | 239 | |
1 | 26 | 2.1% |
2 | 22 | 1.8% |
/ | 16 | 1.3% |
- | 7 | 0.6% |
0 | 4 | 0.3% |
6 | 4 | 0.3% |
Other values (6) | 11 | 0.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4665 | |
ASCII | 1246 | 21.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 464 | 9.9% |
설 | 392 | 8.4% |
텔 | 369 | 7.9% |
오 | 369 | 7.9% |
피 | 369 | 7.9% |
스 | 369 | 7.9% |
무 | 275 | 5.9% |
업 | 264 | 5.7% |
생 | 202 | 4.3% |
활 | 197 | 4.2% |
Other values (39) | 1395 |
ASCII
Value | Count | Frequency (%) |
) | 338 | |
( | 338 | |
241 | ||
, | 239 | |
1 | 26 | 2.1% |
2 | 22 | 1.8% |
/ | 16 | 1.3% |
- | 7 | 0.6% |
0 | 4 | 0.3% |
6 | 4 | 0.3% |
Other values (6) | 11 | 0.9% |
세대수
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 42 |
---|---|
Distinct (%) | 20.4% |
Missing | 163 |
Missing (%) | 44.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 15.966019 |
Minimum | 0 |
---|---|
Maximum | 299 |
Zeros | 73 |
Zeros (%) | 19.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.4 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 12 |
Q3 | 20 |
95-th percentile | 47 |
Maximum | 299 |
Range | 299 |
Interquartile range (IQR) | 20 |
Descriptive statistics
Standard deviation | 27.49286 |
---|---|
Coefficient of variation (CV) | 1.7219609 |
Kurtosis | 57.337198 |
Mean | 15.966019 |
Median Absolute Deviation (MAD) | 12 |
Skewness | 6.3597164 |
Sum | 3289 |
Variance | 755.85738 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 73 | |
16 | 24 | 6.5% |
12 | 20 | 5.4% |
20 | 13 | 3.5% |
24 | 6 | 1.6% |
15 | 5 | 1.4% |
18 | 5 | 1.4% |
32 | 4 | 1.1% |
8 | 4 | 1.1% |
13 | 4 | 1.1% |
Other values (32) | 48 | 13.0% |
(Missing) | 163 |
Value | Count | Frequency (%) |
0 | 73 | |
1 | 2 | 0.5% |
6 | 1 | 0.3% |
7 | 3 | 0.8% |
8 | 4 | 1.1% |
9 | 1 | 0.3% |
10 | 2 | 0.5% |
11 | 2 | 0.5% |
12 | 20 | 5.4% |
13 | 4 | 1.1% |
Value | Count | Frequency (%) |
299 | 1 | |
138 | 1 | |
126 | 1 | |
96 | 1 | |
75 | 1 | |
72 | 1 | |
63 | 1 | |
56 | 1 | |
50 | 1 | |
48 | 2 |
가구수
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.0 KiB |
<NA> | |
---|---|
0 | |
1 | 3 |
221 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.298103 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | <NA> |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
<NA> | 282 | |
0 | 83 | 22.5% |
1 | 3 | 0.8% |
221 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 282 | |
0 | 83 | 22.5% |
1 | 3 | 0.8% |
221 | 1 | 0.3% |
데이터기준일자
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.0 KiB |
2022-10-28 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2022-10-28 |
---|---|
2nd row | 2022-10-28 |
3rd row | 2022-10-28 |
4th row | 2022-10-28 |
5th row | 2022-10-28 |
Common Values
Value | Count | Frequency (%) |
2022-10-28 | 369 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2022-10-28 | 369 |
연번 | 법정동 | 주용도 | 세대수 | 가구수 | |
---|---|---|---|---|---|
연번 | 1.000 | 0.376 | 0.366 | 0.195 | 0.000 |
법정동 | 0.376 | 1.000 | 0.213 | 0.413 | 0.559 |
주용도 | 0.366 | 0.213 | 1.000 | 0.331 | 0.000 |
세대수 | 0.195 | 0.413 | 0.331 | 1.000 | 0.000 |
가구수 | 0.000 | 0.559 | 0.000 | 0.000 | 1.000 |
법정동 | 주용도 | 가구수 | |
---|---|---|---|
법정동 | 1.000 | 0.137 | 0.437 |
주용도 | 0.137 | 1.000 | 0.000 |
가구수 | 0.437 | 0.000 | 1.000 |
연번 | 세대수 | 법정동 | 주용도 | 가구수 | |
---|---|---|---|---|---|
연번 | 1.000 | 0.579 | 0.189 | 0.234 | 0.000 |
세대수 | 0.579 | 1.000 | 0.243 | 0.144 | 0.000 |
법정동 | 0.189 | 0.243 | 1.000 | 0.137 | 0.437 |
주용도 | 0.234 | 0.144 | 0.137 | 1.000 | 0.000 |
가구수 | 0.000 | 0.000 | 0.437 | 0.000 | 1.000 |
연번 | 시군구 | 법정동 | 주용도 | 기타용도 | 세대수 | 가구수 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|
0 | 1 | 서울특별시 강서구 | 화곡동 | 업무시설 | 오피스텔 | <NA> | <NA> | 2022-10-28 |
1 | 2 | 서울특별시 강서구 | 등촌동 | 업무시설 | 업무시설,오피스텔 | 0 | 0 | 2022-10-28 |
2 | 3 | 서울특별시 강서구 | 등촌동 | 업무시설 | 업무시설,오피스텔 | 0 | 0 | 2022-10-28 |
3 | 4 | 서울특별시 강서구 | 등촌동 | 업무시설 | 업무시설,오피스텔 | 0 | 0 | 2022-10-28 |
4 | 5 | 서울특별시 강서구 | 등촌동 | 업무시설 | 업무시설,오피스텔 | 0 | 0 | 2022-10-28 |
5 | 6 | 서울특별시 강서구 | 화곡동 | 업무시설 | 오피스텔 및 근린생활시설 | 0 | 0 | 2022-10-28 |
6 | 7 | 서울특별시 강서구 | 염창동 | 업무시설 | 업무시설,오피스텔 | 0 | 0 | 2022-10-28 |
7 | 8 | 서울특별시 강서구 | 화곡동 | 업무시설 | 업무시설(오피스텔) | 0 | 0 | 2022-10-28 |
8 | 9 | 서울특별시 강서구 | 화곡동 | 업무시설 | 업무시설(오피스텔) | 0 | 0 | 2022-10-28 |
9 | 10 | 서울특별시 강서구 | 내발산동 | 업무시설 | 업무시설(오피스텔) | 0 | 0 | 2022-10-28 |
연번 | 시군구 | 법정동 | 주용도 | 기타용도 | 세대수 | 가구수 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|
359 | 360 | 서울특별시 강서구 | 등촌동 | 업무시설 | 오피스텔, 근린생활시설, 도시형생활주택(단지형다세대) | 16 | <NA> | 2022-10-28 |
360 | 361 | 서울특별시 강서구 | 등촌동 | 업무시설 | 오피스텔, 도시형생활주택(단지형다세대) | 13 | <NA> | 2022-10-28 |
361 | 362 | 서울특별시 강서구 | 염창동 | 공동주택 | 근린생활시설, 오피스텔, 아파트 | 23 | <NA> | 2022-10-28 |
362 | 363 | 서울특별시 강서구 | 내발산동 | 업무시설 | 오피스텔, 도시형생활주택(단지형 다세대), 근린생활시설 | 22 | <NA> | 2022-10-28 |
363 | 364 | 서울특별시 강서구 | 화곡동 | 업무시설 | 오피스텔 | <NA> | <NA> | 2022-10-28 |
364 | 365 | 서울특별시 강서구 | 등촌동 | 업무시설 | 업무시설(오피스텔) | 12 | <NA> | 2022-10-28 |
365 | 366 | 서울특별시 강서구 | 화곡동 | 업무시설 | 업무시설(오피스텔8호) | 0 | 0 | 2022-10-28 |
366 | 367 | 서울특별시 강서구 | 화곡동 | 업무시설 | 오피스텔 | <NA> | <NA> | 2022-10-28 |
367 | 368 | 서울특별시 강서구 | 화곡동 | 업무시설 | 업무시설(오피스텔), 제1,2종근린생활시설 | <NA> | <NA> | 2022-10-28 |
368 | 369 | 서울특별시 강서구 | 화곡동 | 업무시설 | 오피스텔,공동주택(도시형생활주택) | 63 | <NA> | 2022-10-28 |