Overview

Dataset statistics

Number of variables7
Number of observations2666
Missing cells0
Missing cells (%)0.0%
Duplicate rows408
Duplicate rows (%)15.3%
Total size in memory148.5 KiB
Average record size in memory57.0 B

Variable types

Categorical5
Text1
Numeric1

Dataset

Description부산광역시 기장군에 등록된 주택임대사업자 현황에 대한 사업자구분, 임대주택구분, 지번주소, 종류 등의 항목을 제공합니다.
Author부산광역시 기장군
URLhttps://www.data.go.kr/data/15023429/fileData.do

Alerts

Dataset has 408 (15.3%) duplicate rowsDuplicates
사업자구분 is highly overall correlated with 종류High correlation
종류 is highly overall correlated with 사업자구분High correlation
임대주택구분 is highly imbalanced (58.0%)Imbalance

Reproduction

Analysis started2024-03-23 04:11:31.468412
Analysis finished2024-03-23 04:11:34.179371
Duration2.71 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

영업구분
Categorical

Distinct2
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size21.0 KiB
등록영업중
1709 
전입영업중
957 

Length

Max length5
Median length5
Mean length5
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row등록영업중
2nd row등록영업중
3rd row등록영업중
4th row등록영업중
5th row등록영업중

Common Values

ValueCountFrequency (%)
등록영업중 1709
64.1%
전입영업중 957
35.9%

Length

2024-03-23T04:11:34.450019image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-23T04:11:34.843172image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
등록영업중 1709
64.1%
전입영업중 957
35.9%

사업자구분
Categorical

HIGH CORRELATION 

Distinct5
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size21.0 KiB
임대사업자
1583 
일반형임대사업자
668 
매입임대사업자
308 
허가건설임대사업자
 
105
주택건설업자
 
2

Length

Max length9
Median length5
Mean length6.1410353
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row일반형임대사업자
2nd row매입임대사업자
3rd row매입임대사업자
4th row매입임대사업자
5th row매입임대사업자

Common Values

ValueCountFrequency (%)
임대사업자 1583
59.4%
일반형임대사업자 668
25.1%
매입임대사업자 308
 
11.6%
허가건설임대사업자 105
 
3.9%
주택건설업자 2
 
0.1%

Length

2024-03-23T04:11:35.327435image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-23T04:11:35.757983image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
임대사업자 1583
59.4%
일반형임대사업자 668
25.1%
매입임대사업자 308
 
11.6%
허가건설임대사업자 105
 
3.9%
주택건설업자 2
 
0.1%

임대주택구분
Categorical

IMBALANCE 

Distinct3
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size21.0 KiB
민간매입임대주택
2229 
민간건설임대주택
429 
기타
 
8

Length

Max length8
Median length8
Mean length7.9819955
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row민간매입임대주택
2nd row민간매입임대주택
3rd row민간매입임대주택
4th row민간매입임대주택
5th row민간매입임대주택

Common Values

ValueCountFrequency (%)
민간매입임대주택 2229
83.6%
민간건설임대주택 429
 
16.1%
기타 8
 
0.3%

Length

2024-03-23T04:11:36.163587image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-23T04:11:36.550172image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
민간매입임대주택 2229
83.6%
민간건설임대주택 429
 
16.1%
기타 8
 
0.3%
Distinct553
Distinct (%)20.7%
Missing0
Missing (%)0.0%
Memory size21.0 KiB
2024-03-23T04:11:37.258499image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length61
Median length45
Mean length27.627532
Min length14

Characters and Unicode

Total characters73655
Distinct characters405
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique349 ?
Unique (%)13.1%

Sample

1st row경기도 화성시 장지동 (장지동, 금호어울림레이크)
2nd row부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)
3rd row부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)
4th row부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)
5th row부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)
ValueCountFrequency (%)
부산광역시 2085
 
14.3%
기장군 818
 
5.6%
기장읍 448
 
3.1%
정관읍 300
 
2.1%
대연동 272
 
1.9%
광안동 262
 
1.8%
장안읍 242
 
1.7%
남구 241
 
1.7%
예림리 224
 
1.5%
온천동 207
 
1.4%
Other values (1261) 9506
65.1%
2024-03-23T04:11:38.761400image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
12962
 
17.6%
2966
 
4.0%
2913
 
4.0%
2548
 
3.5%
2530
 
3.4%
2469
 
3.4%
- 2285
 
3.1%
2201
 
3.0%
1 2161
 
2.9%
1664
 
2.3%
Other values (395) 38956
52.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 43021
58.4%
Space Separator 12962
 
17.6%
Decimal Number 11759
 
16.0%
Dash Punctuation 2285
 
3.1%
Close Punctuation 1082
 
1.5%
Open Punctuation 1082
 
1.5%
Other Punctuation 751
 
1.0%
Uppercase Letter 453
 
0.6%
Lowercase Letter 259
 
0.4%
Letter Number 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2966
 
6.9%
2913
 
6.8%
2548
 
5.9%
2530
 
5.9%
2469
 
5.7%
2201
 
5.1%
1664
 
3.9%
1528
 
3.6%
1320
 
3.1%
1127
 
2.6%
Other values (357) 21755
50.6%
Uppercase Letter
ValueCountFrequency (%)
H 64
14.1%
W 63
13.9%
S 62
13.7%
K 62
13.7%
V 61
13.5%
I 61
13.5%
E 61
13.5%
B 8
 
1.8%
A 3
 
0.7%
D 2
 
0.4%
Other values (3) 6
 
1.3%
Decimal Number
ValueCountFrequency (%)
1 2161
18.4%
4 1426
12.1%
2 1400
11.9%
5 1073
9.1%
9 1019
8.7%
8 1019
8.7%
7 963
8.2%
3 958
8.1%
6 929
7.9%
0 811
 
6.9%
Lowercase Letter
ValueCountFrequency (%)
l 123
47.5%
i 62
23.9%
s 61
23.6%
e 11
 
4.2%
v 1
 
0.4%
o 1
 
0.4%
Other Punctuation
ValueCountFrequency (%)
, 748
99.6%
& 1
 
0.1%
@ 1
 
0.1%
. 1
 
0.1%
Space Separator
ValueCountFrequency (%)
12962
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 2285
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1082
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1082
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 43021
58.4%
Common 29921
40.6%
Latin 713
 
1.0%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2966
 
6.9%
2913
 
6.8%
2548
 
5.9%
2530
 
5.9%
2469
 
5.7%
2201
 
5.1%
1664
 
3.9%
1528
 
3.6%
1320
 
3.1%
1127
 
2.6%
Other values (357) 21755
50.6%
Latin
ValueCountFrequency (%)
l 123
17.3%
H 64
9.0%
W 63
8.8%
S 62
8.7%
i 62
8.7%
K 62
8.7%
V 61
8.6%
I 61
8.6%
E 61
8.6%
s 61
8.6%
Other values (10) 33
 
4.6%
Common
ValueCountFrequency (%)
12962
43.3%
- 2285
 
7.6%
1 2161
 
7.2%
4 1426
 
4.8%
2 1400
 
4.7%
) 1082
 
3.6%
( 1082
 
3.6%
5 1073
 
3.6%
9 1019
 
3.4%
8 1019
 
3.4%
Other values (8) 4412
 
14.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 43021
58.4%
ASCII 30633
41.6%
Number Forms 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
12962
42.3%
- 2285
 
7.5%
1 2161
 
7.1%
4 1426
 
4.7%
2 1400
 
4.6%
) 1082
 
3.5%
( 1082
 
3.5%
5 1073
 
3.5%
9 1019
 
3.3%
8 1019
 
3.3%
Other values (27) 5124
 
16.7%
Hangul
ValueCountFrequency (%)
2966
 
6.9%
2913
 
6.8%
2548
 
5.9%
2530
 
5.9%
2469
 
5.7%
2201
 
5.1%
1664
 
3.9%
1528
 
3.6%
1320
 
3.1%
1127
 
2.6%
Other values (357) 21755
50.6%
Number Forms
ValueCountFrequency (%)
1
100.0%

종류
Categorical

HIGH CORRELATION 

Distinct11
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size21.0 KiB
장기일반민간임대주택(8년)
1144 
장기일반민간임대주택(10년)
660 
준공공임대
307 
단기임대
134 
공공지원민간임대주택(8년)
 
106
Other values (6)
315 

Length

Max length15
Median length14
Mean length12.273818
Min length4

Unique

Unique2 ?
Unique (%)0.1%

Sample

1st row준공공임대
2nd row장기일반민간임대주택(8년)
3rd row장기일반민간임대주택(8년)
4th row장기일반민간임대주택(8년)
5th row장기일반민간임대주택(8년)

Common Values

ValueCountFrequency (%)
장기일반민간임대주택(8년) 1144
42.9%
장기일반민간임대주택(10년) 660
24.8%
준공공임대 307
 
11.5%
단기임대 134
 
5.0%
공공지원민간임대주택(8년) 106
 
4.0%
단기민간임대주택 104
 
3.9%
공공지원민간임대주택(10년) 97
 
3.6%
5년임대주택(민간) 69
 
2.6%
매입임대주택 43
 
1.6%
국민임대주택 1
 
< 0.1%

Length

2024-03-23T04:11:39.492607image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
장기일반민간임대주택(8년 1144
42.9%
장기일반민간임대주택(10년 660
24.8%
준공공임대 307
 
11.5%
단기임대 134
 
5.0%
공공지원민간임대주택(8년 106
 
4.0%
단기민간임대주택 104
 
3.9%
공공지원민간임대주택(10년 97
 
3.6%
5년임대주택(민간 69
 
2.6%
매입임대주택 43
 
1.6%
국민임대주택 1
 
< 0.1%

유형
Categorical

Distinct9
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size21.0 KiB
준주택(오피스텔)
807 
다세대주택
686 
아파트
394 
다가구주택
359 
도시형생활주택
212 
Other values (4)
208 

Length

Max length12
Median length9
Mean length6.1927982
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row아파트
2nd row다세대주택
3rd row다세대주택
4th row다세대주택
5th row다세대주택

Common Values

ValueCountFrequency (%)
준주택(오피스텔) 807
30.3%
다세대주택 686
25.7%
아파트 394
14.8%
다가구주택 359
13.5%
도시형생활주택 212
 
8.0%
연립주택 70
 
2.6%
단독주택 69
 
2.6%
아파트(도시형생활주택) 62
 
2.3%
준주택(기숙사) 7
 
0.3%

Length

2024-03-23T04:11:39.885038image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-23T04:11:40.381013image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
준주택(오피스텔 807
30.3%
다세대주택 686
25.7%
아파트 394
14.8%
다가구주택 359
13.5%
도시형생활주택 212
 
8.0%
연립주택 70
 
2.6%
단독주택 69
 
2.6%
아파트(도시형생활주택 62
 
2.3%
준주택(기숙사 7
 
0.3%

면적(제곱미터)
Real number (ℝ)

Distinct892
Distinct (%)33.5%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean41.125867
Minimum0
Maximum1045.07
Zeros2
Zeros (%)0.1%
Negative0
Negative (%)0.0%
Memory size23.6 KiB
2024-03-23T04:11:40.991020image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile14.04
Q120.29
median26.94
Q342.321
95-th percentile81.9604
Maximum1045.07
Range1045.07
Interquartile range (IQR)22.031

Descriptive statistics

Standard deviation79.160886
Coefficient of variation (CV)1.9248442
Kurtosis101.61065
Mean41.125867
Median Absolute Deviation (MAD)8.5
Skewness9.4331958
Sum109641.56
Variance6266.4459
MonotonicityNot monotonic
2024-03-23T04:11:41.664414image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
49.863 56
 
2.1%
43.5136 45
 
1.7%
18.1037 45
 
1.7%
24.0 43
 
1.6%
26.665 28
 
1.1%
13.6 28
 
1.1%
40.3936 26
 
1.0%
42.321 22
 
0.8%
49.7536 19
 
0.7%
22.0 18
 
0.7%
Other values (882) 2336
87.6%
ValueCountFrequency (%)
0.0 2
 
0.1%
9.905 3
 
0.1%
11.596 1
 
< 0.1%
11.597 2
 
0.1%
11.902 8
0.3%
12.0 1
 
< 0.1%
12.49 4
0.2%
12.63 4
0.2%
12.65 7
0.3%
12.655 8
0.3%
ValueCountFrequency (%)
1045.07 9
0.3%
659.58 1
 
< 0.1%
659.12 1
 
< 0.1%
658.32 1
 
< 0.1%
657.88 1
 
< 0.1%
653.44 1
 
< 0.1%
549.37 14
0.5%
511.68 1
 
< 0.1%
433.84 1
 
< 0.1%
341.2 1
 
< 0.1%

Interactions

2024-03-23T04:11:33.018840image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-03-23T04:11:42.063103image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
영업구분사업자구분임대주택구분종류유형면적(제곱미터)
영업구분1.0000.2350.1160.3970.2260.102
사업자구분0.2351.0000.3290.8180.3980.110
임대주택구분0.1160.3291.0000.6020.4720.080
종류0.3970.8180.6021.0000.5400.209
유형0.2260.3980.4720.5401.0000.321
면적(제곱미터)0.1020.1100.0800.2090.3211.000
2024-03-23T04:11:42.414838image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
임대주택구분종류유형사업자구분영업구분
임대주택구분1.0000.4350.2360.2630.192
종류0.4351.0000.2800.6290.380
유형0.2360.2801.0000.2430.226
사업자구분0.2630.6290.2431.0000.287
영업구분0.1920.3800.2260.2871.000
2024-03-23T04:11:42.702433image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
면적(제곱미터)영업구분사업자구분임대주택구분종류유형
면적(제곱미터)1.0000.0760.0670.0500.1000.163
영업구분0.0761.0000.2870.1920.3800.226
사업자구분0.0670.2871.0000.2630.6290.243
임대주택구분0.0500.1920.2631.0000.4350.236
종류0.1000.3800.6290.4351.0000.280
유형0.1630.2260.2430.2360.2801.000

Missing values

2024-03-23T04:11:33.546012image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-23T04:11:34.016050image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

영업구분사업자구분임대주택구분지번주소종류유형면적(제곱미터)
0등록영업중일반형임대사업자민간매입임대주택경기도 화성시 장지동 (장지동, 금호어울림레이크)준공공임대아파트59.93
1등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)장기일반민간임대주택(8년)다세대주택23.66
2등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)장기일반민간임대주택(8년)다세대주택23.66
3등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)장기일반민간임대주택(8년)다세대주택16.33
4등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)장기일반민간임대주택(8년)다세대주택23.66
5등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)장기일반민간임대주택(8년)준주택(오피스텔)20.86
6등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)장기일반민간임대주택(8년)준주택(오피스텔)21.65
7등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)장기일반민간임대주택(8년)준주택(오피스텔)21.65
8등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 88-33 (광안동, 칸느하우스)장기일반민간임대주택(8년)준주택(오피스텔)20.86
9등록영업중매입임대사업자민간매입임대주택부산광역시 수영구 광안동 90-60 (광안동, 남강하우스)장기일반민간임대주택(8년)다세대주택19.32
영업구분사업자구분임대주택구분지번주소종류유형면적(제곱미터)
2656전입영업중임대사업자민간매입임대주택울산광역시 울주군 서생면 78-5장기일반민간임대주택(8년)준주택(오피스텔)32.428
2657전입영업중임대사업자민간매입임대주택울산광역시 울주군 서생면 78-5장기일반민간임대주택(8년)준주택(오피스텔)32.428
2658전입영업중임대사업자민간매입임대주택서울특별시 강서구 화곡동 822-3 케이씨타운장기일반민간임대주택(10년)다세대주택26.96
2659전입영업중임대사업자민간매입임대주택서울특별시 양천구 신월동 122-17 케이씨하우징장기일반민간임대주택(10년)다세대주택28.98
2660전입영업중일반형임대사업자민간매입임대주택서울특별시 은평구 불광동 331-28 (불광동, 위산렉스빌)장기일반민간임대주택(8년)다세대주택37.09
2661전입영업중일반형임대사업자민간매입임대주택서울특별시 송파구 삼전동 43-2 (삼전동)장기일반민간임대주택(8년)다세대주택29.92
2662전입영업중일반형임대사업자민간매입임대주택경상남도 양산시 물금읍 가촌리 1272-10 (양산물금 이지더원 1차)준공공임대아파트59.9906
2663전입영업중임대사업자민간매입임대주택서울특별시 송파구 잠실동 22단기민간임대주택아파트59.99
2664전입영업중임대사업자민간매입임대주택부산광역시 해운대구 중동 1757 (중동, 하모니타워마브러스)장기일반민간임대주택(8년)준주택(오피스텔)44.515
2665전입영업중매입임대사업자민간매입임대주택부산광역시 해운대구 우동 1506 (우동, 센텀스퀘어)장기일반민간임대주택(8년)준주택(오피스텔)45.4788

Duplicate rows

Most frequently occurring

영업구분사업자구분임대주택구분지번주소종류유형면적(제곱미터)# duplicates
69등록영업중임대사업자민간건설임대주택부산광역시 기장군 정관읍 예림리 509 (정관읍 예림리, 에코펠리시아)장기일반민간임대주택(8년)아파트49.86356
157등록영업중임대사업자민간매입임대주택부산광역시 남구 대연동 1909 대연 SK VIEW Hills장기일반민간임대주택(8년)아파트(도시형생활주택)18.103745
29등록영업중일반형임대사업자민간건설임대주택경상남도 통영시 무전동 279-27 다우드림캐슬단기임대도시형생활주택43.513644
89등록영업중임대사업자민간매입임대주택경상북도 경주시 석장동 867-1 뉴갤럭시 오피스텔장기일반민간임대주택(10년)준주택(오피스텔)24.035
46등록영업중일반형임대사업자민간매입임대주택부산광역시 기장군 기장읍 대라리 91-6장기일반민간임대주택(8년)준주택(오피스텔)26.66528
171등록영업중임대사업자민간매입임대주택부산광역시 부산진구 가야동 644-25 마이크로하우스장기일반민간임대주택(10년)다세대주택13.628
28등록영업중일반형임대사업자민간건설임대주택경상남도 통영시 무전동 279-27 다우드림캐슬단기임대도시형생활주택40.393626
143등록영업중임대사업자민간매입임대주택부산광역시 기장군 장안읍 257-37장기일반민간임대주택(8년)준주택(오피스텔)42.32122
141등록영업중임대사업자민간매입임대주택부산광역시 기장군 장안읍 257-37장기일반민간임대주택(8년)아파트42.44818
281전입영업중매입임대사업자민간매입임대주택부산광역시 해운대구 좌동 1476-6 (좌동, 천년사랑오피스텔)장기일반민간임대주택(8년)준주택(오피스텔)27.9317