Overview

Dataset statistics

Number of variables10
Number of observations103
Missing cells773
Missing cells (%)75.0%
Duplicate rows2
Duplicate rows (%)1.9%
Total size in memory8.7 KiB
Average record size in memory86.3 B

Variable types

Text4
Categorical1
Numeric1
Unsupported4

Dataset

Description샘플 데이터
AuthorMBN
URLhttps://kdx.kr/data/view/26949

Alerts

Dataset has 2 (1.9%) duplicate rowsDuplicates
STD_YEAR is highly overall correlated with MDA_CGR_NMHigh correlation
MDA_CGR_NM is highly overall correlated with STD_YEARHigh correlation
MDA_CGR_NM is highly imbalanced (63.4%)Imbalance
MBN_MDA_SP_CD has 7 (6.8%) missing valuesMissing
MDA_ART_ESSN_NO has 85 (82.5%) missing valuesMissing
STD_YEAR has 83 (80.6%) missing valuesMissing
ART_SJ_CN has 93 (90.3%) missing valuesMissing
ART_CN has 93 (90.3%) missing valuesMissing
ATCH_IMG_NM has 103 (100.0%) missing valuesMissing
JRNL_NM has 103 (100.0%) missing valuesMissing
WRT_DATE has 103 (100.0%) missing valuesMissing
Unnamed: 9 has 103 (100.0%) missing valuesMissing
ATCH_IMG_NM is an unsupported type, check if it needs cleaning or further analysisUnsupported
JRNL_NM is an unsupported type, check if it needs cleaning or further analysisUnsupported
WRT_DATE is an unsupported type, check if it needs cleaning or further analysisUnsupported
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2023-12-11 20:27:44.840365
Analysis finished2023-12-11 20:27:45.802979
Duration0.96 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

MBN_MDA_SP_CD
Text

MISSING 

Distinct81
Distinct (%)84.4%
Missing7
Missing (%)6.8%
Memory size956.0 B
2023-12-12T05:27:46.072472image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length546
Median length200
Mean length132.01042
Min length3

Characters and Unicode

Total characters12673
Distinct characters504
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks8 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique78 ?
Unique (%)81.2%

Sample

1st rowMBN
2nd row 동양건설산업은 오는 3일 견본주택을 열고 인천 검단신도시에 '검단파라곤 센트럴파크' 1122가구에 대한 분양에 돌입한다고 밝혔다. 새해 전국 첫 아파트 분양 단지이고 지난 5월 이 회사가 분양한 '검단파라곤 1차' 887가구에 이은 이 지역 두 번째 공급이다.
3rd row검단신도시 AA2블록에 지어지는 단지는 지하 2층∼지상 25층 12개동 1122가구 규모로 실수요자 선호도가 가장 높은 전용 84㎡ 단일면적, 두 가지 타입으로 구성됐다.
4th row이 단지는 검단신도시 내에서도 가장 우수한 입지로 꼽히는 곳이다. 역세권, 학세권, 숲세권을 갖추고 있다. 개통이 예정된 인천지하철 1호선이 도보권에 위치한 역세권인데다 인근에는 영어마을과 국제학교, 유·초·중·고교가 접해 있다. 특히 축구장 30개 크기(5만5696㎡)의 대형 근린공원이 맞닿아 있으며 인근에는 계양천 수변공원과 중심 상업시설이 위치해 있다.
5th row<!------------ PHOTO_POS_1 ------------>검단신도시는 수도권 신도시로서는 보기 드물게 비규제지역이다. 12·16 부동산 대책 이후 수도권으로 옮겨가는 풍선효과를 톡톡히 누릴 것으로 전망된다. 이 단지는 주택 소유 여부와 상관없이 청약이 가능하고 재당첨 제한이 없다. 세대주가 아닌 세대원도 청약이 가능하다. 또 추첨제를 통해 전체 물량의 80%을 선정하기 때문에 청약 가점이 낮은 수요자들의 관심을 끌기 충분하다. 다만 전매제한 기간은 3년이다.
ValueCountFrequency (%)
있다 29
 
1.1%
23
 
0.8%
아파트 23
 
0.8%
22
 
0.8%
20
 
0.7%
서울 16
 
0.6%
15
 
0.5%
부동산 15
 
0.5%
14
 
0.5%
5분위 14
 
0.5%
Other values (1608) 2549
93.0%
2023-12-12T05:27:46.538917image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2689
 
21.2%
. 253
 
2.0%
219
 
1.7%
1 209
 
1.6%
209
 
1.6%
199
 
1.6%
191
 
1.5%
- 148
 
1.2%
138
 
1.1%
137
 
1.1%
Other values (494) 8281
65.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 8048
63.5%
Space Separator 2689
 
21.2%
Decimal Number 853
 
6.7%
Other Punctuation 518
 
4.1%
Dash Punctuation 148
 
1.2%
Uppercase Letter 112
 
0.9%
Open Punctuation 73
 
0.6%
Close Punctuation 73
 
0.6%
Lowercase Letter 71
 
0.6%
Math Symbol 39
 
0.3%
Other values (2) 49
 
0.4%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
219
 
2.7%
209
 
2.6%
199
 
2.5%
191
 
2.4%
138
 
1.7%
137
 
1.7%
124
 
1.5%
110
 
1.4%
108
 
1.3%
105
 
1.3%
Other values (439) 6508
80.9%
Uppercase Letter
ValueCountFrequency (%)
O 18
16.1%
B 16
14.3%
P 12
10.7%
T 11
9.8%
M 10
8.9%
N 10
8.9%
S 7
 
6.2%
H 6
 
5.4%
G 5
 
4.5%
D 4
 
3.6%
Other values (4) 13
11.6%
Decimal Number
ValueCountFrequency (%)
1 209
24.5%
2 136
15.9%
0 124
14.5%
5 81
 
9.5%
3 73
 
8.6%
4 61
 
7.2%
9 49
 
5.7%
6 47
 
5.5%
8 40
 
4.7%
7 33
 
3.9%
Other Punctuation
ValueCountFrequency (%)
. 253
48.8%
, 73
 
14.1%
% 57
 
11.0%
' 46
 
8.9%
" 40
 
7.7%
· 32
 
6.2%
& 10
 
1.9%
! 6
 
1.2%
/ 1
 
0.2%
Lowercase Letter
ValueCountFrequency (%)
k 20
28.2%
r 15
21.1%
m 11
15.5%
c 10
14.1%
o 10
14.1%
b 5
 
7.0%
Math Symbol
ValueCountFrequency (%)
> 11
28.2%
< 11
28.2%
~ 6
15.4%
5
12.8%
5
12.8%
± 1
 
2.6%
Other Symbol
ValueCountFrequency (%)
21
56.8%
10
27.0%
6
 
16.2%
Open Punctuation
ValueCountFrequency (%)
( 53
72.6%
[ 20
 
27.4%
Close Punctuation
ValueCountFrequency (%)
) 53
72.6%
] 20
 
27.4%
Space Separator
ValueCountFrequency (%)
2689
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 148
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 12
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 8048
63.5%
Common 4442
35.1%
Latin 183
 
1.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
219
 
2.7%
209
 
2.6%
199
 
2.5%
191
 
2.4%
138
 
1.7%
137
 
1.7%
124
 
1.5%
110
 
1.4%
108
 
1.3%
105
 
1.3%
Other values (439) 6508
80.9%
Common
ValueCountFrequency (%)
2689
60.5%
. 253
 
5.7%
1 209
 
4.7%
- 148
 
3.3%
2 136
 
3.1%
0 124
 
2.8%
5 81
 
1.8%
3 73
 
1.6%
, 73
 
1.6%
4 61
 
1.4%
Other values (25) 595
 
13.4%
Latin
ValueCountFrequency (%)
k 20
 
10.9%
O 18
 
9.8%
B 16
 
8.7%
r 15
 
8.2%
P 12
 
6.6%
T 11
 
6.0%
m 11
 
6.0%
M 10
 
5.5%
N 10
 
5.5%
c 10
 
5.5%
Other values (10) 50
27.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 8048
63.5%
ASCII 4545
35.9%
None 33
 
0.3%
Geometric Shapes 21
 
0.2%
Enclosed Alphanum 10
 
0.1%
CJK Compat 6
 
< 0.1%
Arrows 5
 
< 0.1%
Math Operators 5
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2689
59.2%
. 253
 
5.6%
1 209
 
4.6%
- 148
 
3.3%
2 136
 
3.0%
0 124
 
2.7%
5 81
 
1.8%
3 73
 
1.6%
, 73
 
1.6%
4 61
 
1.3%
Other values (38) 698
 
15.4%
Hangul
ValueCountFrequency (%)
219
 
2.7%
209
 
2.6%
199
 
2.5%
191
 
2.4%
138
 
1.7%
137
 
1.7%
124
 
1.5%
110
 
1.4%
108
 
1.3%
105
 
1.3%
Other values (439) 6508
80.9%
None
ValueCountFrequency (%)
· 32
97.0%
± 1
 
3.0%
Geometric Shapes
ValueCountFrequency (%)
21
100.0%
Enclosed Alphanum
ValueCountFrequency (%)
10
100.0%
CJK Compat
ValueCountFrequency (%)
6
100.0%
Arrows
ValueCountFrequency (%)
5
100.0%
Math Operators
ValueCountFrequency (%)
5
100.0%

MDA_ART_ESSN_NO
Text

MISSING 

Distinct18
Distinct (%)100.0%
Missing85
Missing (%)82.5%
Memory size956.0 B
2023-12-12T05:27:46.723452image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length210
Median length7
Mean length52.555556
Min length7

Characters and Unicode

Total characters946
Distinct characters32
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique18 ?
Unique (%)100.0%

Sample

1st row4023398
2nd rowhttp://img.mbn.co.kr/filewww/news/other/2020/01/01/000020150021.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/310200003016.jpg,,,,,,,,
3rd row4023426
4th rowhttp://img.mbn.co.kr/filewww/news/other/2020/01/01/000020100110.jpg,,,,,,,,,
5th row4023430
ValueCountFrequency (%)
4023398 1
 
5.6%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/000020150021.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/310200003016.jpg 1
 
5.6%
4023632 1
 
5.6%
http://img.mbn.co.kr/filewww/news/other/2020/01/02/002330392921.jpg 1
 
5.6%
4023608 1
 
5.6%
http://img.mbn.co.kr/filewww/news/other/2020/01/02/000200000902.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/02/020100100020.jpg 1
 
5.6%
4023603 1
 
5.6%
http://img.mbn.co.kr/filewww/news/other/2020/01/02/030440308008.jpg 1
 
5.6%
4023565 1
 
5.6%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/221200003020.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/100030130000.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/220000020000.jpg 1
 
5.6%
Other values (8) 8
44.4%
2023-12-12T05:27:47.007666image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 140
14.8%
/ 108
 
11.4%
, 72
 
7.6%
2 67
 
7.1%
w 48
 
5.1%
. 48
 
5.1%
t 36
 
3.8%
e 36
 
3.8%
1 35
 
3.7%
3 31
 
3.3%
Other values (22) 325
34.4%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 396
41.9%
Decimal Number 310
32.8%
Other Punctuation 240
25.4%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
w 48
12.1%
t 36
 
9.1%
e 36
 
9.1%
m 24
 
6.1%
g 24
 
6.1%
n 24
 
6.1%
i 24
 
6.1%
o 24
 
6.1%
p 24
 
6.1%
h 24
 
6.1%
Other values (8) 108
27.3%
Decimal Number
ValueCountFrequency (%)
0 140
45.2%
2 67
21.6%
1 35
 
11.3%
3 31
 
10.0%
4 18
 
5.8%
6 6
 
1.9%
8 4
 
1.3%
9 4
 
1.3%
5 3
 
1.0%
7 2
 
0.6%
Other Punctuation
ValueCountFrequency (%)
/ 108
45.0%
, 72
30.0%
. 48
20.0%
: 12
 
5.0%

Most occurring scripts

ValueCountFrequency (%)
Common 550
58.1%
Latin 396
41.9%

Most frequent character per script

Latin
ValueCountFrequency (%)
w 48
12.1%
t 36
 
9.1%
e 36
 
9.1%
m 24
 
6.1%
g 24
 
6.1%
n 24
 
6.1%
i 24
 
6.1%
o 24
 
6.1%
p 24
 
6.1%
h 24
 
6.1%
Other values (8) 108
27.3%
Common
ValueCountFrequency (%)
0 140
25.5%
/ 108
19.6%
, 72
13.1%
2 67
12.2%
. 48
 
8.7%
1 35
 
6.4%
3 31
 
5.6%
4 18
 
3.3%
: 12
 
2.2%
6 6
 
1.1%
Other values (4) 13
 
2.4%

Most occurring blocks

ValueCountFrequency (%)
ASCII 946
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 140
14.8%
/ 108
 
11.4%
, 72
 
7.6%
2 67
 
7.1%
w 48
 
5.1%
. 48
 
5.1%
t 36
 
3.8%
e 36
 
3.8%
1 35
 
3.7%
3 31
 
3.3%
Other values (22) 325
34.4%

MDA_CGR_NM
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct9
Distinct (%)8.7%
Missing0
Missing (%)0.0%
Memory size956.0 B
<NA>
83 
mbn00005
10 
조성신
 
3
박윤예
 
2
이선희
 
1
Other values (4)
 
4

Length

Max length8
Median length4
Mean length4.3300971
Min length3

Unique

Unique5 ?
Unique (%)4.9%

Sample

1st row<NA>
2nd rowmbn00005
3rd row<NA>
4th row<NA>
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 83
80.6%
mbn00005 10
 
9.7%
조성신 3
 
2.9%
박윤예 2
 
1.9%
이선희 1
 
1.0%
손동우 1
 
1.0%
손동우,나현준 1
 
1.0%
정지성 1
 
1.0%
이미연 1
 
1.0%

Length

2023-12-12T05:27:47.112098image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T05:27:47.202991image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
na 83
80.6%
mbn00005 10
 
9.7%
조성신 3
 
2.9%
박윤예 2
 
1.9%
이선희 1
 
1.0%
손동우 1
 
1.0%
손동우,나현준 1
 
1.0%
정지성 1
 
1.0%
이미연 1
 
1.0%

STD_YEAR
Real number (ℝ)

HIGH CORRELATION  MISSING 

Distinct8
Distinct (%)40.0%
Missing83
Missing (%)80.6%
Infinite0
Infinite (%)0.0%
Mean1.0100051 × 1013
Minimum2020
Maximum2.0200102 × 1013
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.0 KiB
2023-12-12T05:27:47.296462image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2020
5-th percentile2020
Q12020
median1.0100051 × 1013
Q32.0200101 × 1013
95-th percentile2.0200102 × 1013
Maximum2.0200102 × 1013
Range2.0200102 × 1013
Interquartile range (IQR)2.0200101 × 1013

Descriptive statistics

Standard deviation1.0362433 × 1013
Coefficient of variation (CV)1.0259784
Kurtosis-2.2352941
Mean1.0100051 × 1013
Median Absolute Deviation (MAD)1.0100051 × 1013
Skewness2.9464712 × 10-15
Sum2.0200102 × 1014
Variance1.0738003 × 1026
MonotonicityNot monotonic
2023-12-12T05:27:47.391031image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=8)
ValueCountFrequency (%)
2020 10
 
9.7%
20200101174635 4
 
3.9%
20200101163504 1
 
1.0%
20200101172534 1
 
1.0%
20200102084435 1
 
1.0%
20200102092206 1
 
1.0%
20200102092336 1
 
1.0%
20200102094536 1
 
1.0%
(Missing) 83
80.6%
ValueCountFrequency (%)
2020 10
9.7%
20200101163504 1
 
1.0%
20200101172534 1
 
1.0%
20200101174635 4
 
3.9%
20200102084435 1
 
1.0%
20200102092206 1
 
1.0%
20200102092336 1
 
1.0%
20200102094536 1
 
1.0%
ValueCountFrequency (%)
20200102094536 1
 
1.0%
20200102092336 1
 
1.0%
20200102092206 1
 
1.0%
20200102084435 1
 
1.0%
20200101174635 4
 
3.9%
20200101172534 1
 
1.0%
20200101163504 1
 
1.0%
2020 10
9.7%

ART_SJ_CN
Text

MISSING 

Distinct10
Distinct (%)100.0%
Missing93
Missing (%)90.3%
Memory size956.0 B
2023-12-12T05:27:47.576900image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length46
Median length30.5
Mean length29.9
Min length15

Characters and Unicode

Total characters299
Distinct characters145
Distinct categories9 ?
Distinct scripts4 ?
Distinct blocks6 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10 ?
Unique (%)100.0%

Sample

1st row새해 첫 분양 `검단 파라곤 센트럴파크` 3대 경쟁력은
2nd row집값 격차 9년來 최대…부동산 양극화 심화
3rd row주거급여 지원대상·금액 확대…4인가구 월세보조 41만5000원
4th row"인허가 단축" 해준다더니…어딘지 못밝히는 정부
5th row신탁방식 재개발·재건축 각광
ValueCountFrequency (%)
집값 3
 
4.3%
센트럴파크 2
 
2.9%
새해 1
 
1.4%
주택시장 1
 
1.4%
오를까 1
 
1.4%
1
 
1.4%
올해 1
 
1.4%
나오는데도 1
 
1.4%
계속 1
 
1.4%
규제 1
 
1.4%
Other values (56) 56
81.2%
2023-12-12T05:27:47.868927image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
59
 
19.7%
5
 
1.7%
5
 
1.7%
· 4
 
1.3%
4
 
1.3%
1 4
 
1.3%
4
 
1.3%
4
 
1.3%
0 4
 
1.3%
4
 
1.3%
Other values (135) 202
67.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 198
66.2%
Space Separator 59
 
19.7%
Decimal Number 20
 
6.7%
Other Punctuation 13
 
4.3%
Uppercase Letter 3
 
1.0%
Modifier Symbol 2
 
0.7%
Math Symbol 2
 
0.7%
Close Punctuation 1
 
0.3%
Open Punctuation 1
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
5
 
2.5%
5
 
2.5%
4
 
2.0%
4
 
2.0%
4
 
2.0%
3
 
1.5%
3
 
1.5%
3
 
1.5%
3
 
1.5%
3
 
1.5%
Other values (111) 161
81.3%
Decimal Number
ValueCountFrequency (%)
1 4
20.0%
0 4
20.0%
5 2
10.0%
4 2
10.0%
7 2
10.0%
3 2
10.0%
2 2
10.0%
8 1
 
5.0%
9 1
 
5.0%
Other Punctuation
ValueCountFrequency (%)
· 4
30.8%
4
30.8%
" 2
15.4%
% 1
 
7.7%
. 1
 
7.7%
, 1
 
7.7%
Uppercase Letter
ValueCountFrequency (%)
W 1
33.3%
O 1
33.3%
N 1
33.3%
Math Symbol
ValueCountFrequency (%)
1
50.0%
1
50.0%
Space Separator
ValueCountFrequency (%)
59
100.0%
Modifier Symbol
ValueCountFrequency (%)
` 2
100.0%
Close Punctuation
ValueCountFrequency (%)
] 1
100.0%
Open Punctuation
ValueCountFrequency (%)
[ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 195
65.2%
Common 98
32.8%
Han 3
 
1.0%
Latin 3
 
1.0%

Most frequent character per script

Hangul
ValueCountFrequency (%)
5
 
2.6%
5
 
2.6%
4
 
2.1%
4
 
2.1%
4
 
2.1%
3
 
1.5%
3
 
1.5%
3
 
1.5%
3
 
1.5%
3
 
1.5%
Other values (108) 158
81.0%
Common
ValueCountFrequency (%)
59
60.2%
· 4
 
4.1%
1 4
 
4.1%
0 4
 
4.1%
4
 
4.1%
5 2
 
2.0%
" 2
 
2.0%
4 2
 
2.0%
7 2
 
2.0%
3 2
 
2.0%
Other values (11) 13
 
13.3%
Han
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%
Latin
ValueCountFrequency (%)
W 1
33.3%
O 1
33.3%
N 1
33.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 195
65.2%
ASCII 91
30.4%
None 4
 
1.3%
Punctuation 4
 
1.3%
CJK 3
 
1.0%
Arrows 2
 
0.7%

Most frequent character per block

ASCII
ValueCountFrequency (%)
59
64.8%
1 4
 
4.4%
0 4
 
4.4%
5 2
 
2.2%
" 2
 
2.2%
4 2
 
2.2%
7 2
 
2.2%
3 2
 
2.2%
2 2
 
2.2%
` 2
 
2.2%
Other values (10) 10
 
11.0%
Hangul
ValueCountFrequency (%)
5
 
2.6%
5
 
2.6%
4
 
2.1%
4
 
2.1%
4
 
2.1%
3
 
1.5%
3
 
1.5%
3
 
1.5%
3
 
1.5%
3
 
1.5%
Other values (108) 158
81.0%
None
ValueCountFrequency (%)
· 4
100.0%
Punctuation
ValueCountFrequency (%)
4
100.0%
Arrows
ValueCountFrequency (%)
1
50.0%
1
50.0%
CJK
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%

ART_CN
Text

MISSING 

Distinct10
Distinct (%)100.0%
Missing93
Missing (%)90.3%
Memory size956.0 B
2023-12-12T05:27:48.145952image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length261
Median length199
Mean length171.7
Min length62

Characters and Unicode

Total characters1717
Distinct characters270
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10 ?
Unique (%)100.0%

Sample

1st row<!------------ PHOTO_POS_0 ------------> 12·16 부동산 대책 이후 풍선효과로 인해 수도권의 비규제지역 부동산시장이 후끈 달아오르고 있다. 이런 가운데 검단신도시에서 우리나라 새해 첫 아파트 마수걸이 분양단지가 나온다. 2기 신도시인 검단은 규제에서 빗겨나있는데다 올해 하반기부터 그간 '미분양 무덤'이라는 오명을 벗고 인기지역으로 탈바꿈하고 있어 주목된다.
2nd row<!------------ PHOTO_POS_0 ------------> 전국 고가 아파트와 저가 아파트 간 가격 차이가 9년여 만에 최대치로 벌어졌다. '똘똘한 한 채' 열풍으로 신축을 중심으로 한 입지 좋은 아파트에 매수세가 몰리면서 아파트 간에 가격 차이가 벌어지는 것으로 분석된다. 최근 정부는 '소득주도성장'으로 소득 격차가 줄어들고 있다고 밝혔지만, 부동산은 지역·가격에 따라 격차가 더 벌어지고 있어 국민의 자산 양극화는 점점 심화하는 것으로 보인다.
3rd row새해에는 생활이 어려운 가구의 전·월세 임대료와 집수리 비용을 지원하는 주거급여의 지원 대상과 금액이 늘어난다.
4th row국토교통부가 12·16 대책을 발표하며 주택 공급 확대를 위해 막바지 작업에 들어간 정비사업의 인허가 절차를 단축시키겠다고 밝혔지만, 정작 해당 정비사업이 어느 구역인지를 공개하지 않고 있는 것으로 드러났다. 서울 내 해당 정비구역이 어딘지를 공개하면 국토부가 분양가상한제를 피할 수 있는 단지로 공인한 꼴이 돼 집값 상승을 부추길 수 있다는 우려가 반영된 것으로 보인다.
5th row<!------------ PHOTO_POS_0 ------------> 최근 조합 대신 신탁사가 시행사 역할을 맡는 신탁 방식 재개발·재건축이 성공적으로 진행되는 사례가 많아지고 있다. 이에 따라 그간 정비업계에서 찬밥 신세였던 부동산 신탁사의 위상도 올라가고 있다.
ValueCountFrequency (%)
12
 
3.4%
photo_pos_0 6
 
1.7%
것으로 6
 
1.7%
아파트 4
 
1.1%
12·16 4
 
1.1%
있다 4
 
1.1%
부동산 3
 
0.8%
그간 3
 
0.8%
있는 3
 
0.8%
있어 3
 
0.8%
Other values (258) 307
86.5%
2023-12-12T05:27:48.542675image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
351
 
20.4%
- 144
 
8.4%
34
 
2.0%
29
 
1.7%
29
 
1.7%
25
 
1.5%
. 23
 
1.3%
21
 
1.2%
19
 
1.1%
19
 
1.1%
Other values (260) 1023
59.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1051
61.2%
Space Separator 351
 
20.4%
Dash Punctuation 144
 
8.4%
Other Punctuation 55
 
3.2%
Uppercase Letter 48
 
2.8%
Decimal Number 44
 
2.6%
Connector Punctuation 12
 
0.7%
Math Symbol 12
 
0.7%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
34
 
3.2%
29
 
2.8%
29
 
2.8%
25
 
2.4%
21
 
2.0%
19
 
1.8%
19
 
1.8%
18
 
1.7%
16
 
1.5%
16
 
1.5%
Other values (235) 825
78.5%
Decimal Number
ValueCountFrequency (%)
1 11
25.0%
0 11
25.0%
2 10
22.7%
6 5
11.4%
5 2
 
4.5%
7 2
 
4.5%
8 1
 
2.3%
3 1
 
2.3%
9 1
 
2.3%
Other Punctuation
ValueCountFrequency (%)
. 23
41.8%
' 10
18.2%
· 8
 
14.5%
! 6
 
10.9%
, 6
 
10.9%
% 2
 
3.6%
Uppercase Letter
ValueCountFrequency (%)
O 18
37.5%
P 12
25.0%
H 6
 
12.5%
T 6
 
12.5%
S 6
 
12.5%
Math Symbol
ValueCountFrequency (%)
< 6
50.0%
> 6
50.0%
Space Separator
ValueCountFrequency (%)
351
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 144
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 12
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1051
61.2%
Common 618
36.0%
Latin 48
 
2.8%

Most frequent character per script

Hangul
ValueCountFrequency (%)
34
 
3.2%
29
 
2.8%
29
 
2.8%
25
 
2.4%
21
 
2.0%
19
 
1.8%
19
 
1.8%
18
 
1.7%
16
 
1.5%
16
 
1.5%
Other values (235) 825
78.5%
Common
ValueCountFrequency (%)
351
56.8%
- 144
23.3%
. 23
 
3.7%
_ 12
 
1.9%
1 11
 
1.8%
0 11
 
1.8%
' 10
 
1.6%
2 10
 
1.6%
· 8
 
1.3%
< 6
 
1.0%
Other values (10) 32
 
5.2%
Latin
ValueCountFrequency (%)
O 18
37.5%
P 12
25.0%
H 6
 
12.5%
T 6
 
12.5%
S 6
 
12.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1051
61.2%
ASCII 658
38.3%
None 8
 
0.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
351
53.3%
- 144
21.9%
. 23
 
3.5%
O 18
 
2.7%
_ 12
 
1.8%
P 12
 
1.8%
1 11
 
1.7%
0 11
 
1.7%
' 10
 
1.5%
2 10
 
1.5%
Other values (14) 56
 
8.5%
Hangul
ValueCountFrequency (%)
34
 
3.2%
29
 
2.8%
29
 
2.8%
25
 
2.4%
21
 
2.0%
19
 
1.8%
19
 
1.8%
18
 
1.7%
16
 
1.5%
16
 
1.5%
Other values (235) 825
78.5%
None
ValueCountFrequency (%)
· 8
100.0%

ATCH_IMG_NM
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing103
Missing (%)100.0%
Memory size1.0 KiB

JRNL_NM
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing103
Missing (%)100.0%
Memory size1.0 KiB

WRT_DATE
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing103
Missing (%)100.0%
Memory size1.0 KiB

Unnamed: 9
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing103
Missing (%)100.0%
Memory size1.0 KiB

Interactions

2023-12-12T05:27:45.357064image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T05:27:48.622584image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CN
MBN_MDA_SP_CD1.0001.0000.967NaNNaNNaN
MDA_ART_ESSN_NO1.0001.0001.000NaN1.0001.000
MDA_CGR_NM0.9671.0001.000NaNNaNNaN
STD_YEARNaNNaNNaN1.000NaNNaN
ART_SJ_CNNaN1.000NaNNaN1.0001.000
ART_CNNaN1.000NaNNaN1.0001.000
2023-12-12T05:27:48.707893image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
STD_YEARMDA_CGR_NM
STD_YEAR1.0000.816
MDA_CGR_NM0.8161.000

Missing values

2023-12-12T05:27:45.476716image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T05:27:45.626714image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-12T05:27:45.734349image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CNATCH_IMG_NMJRNL_NMWRT_DATEUnnamed: 9
0<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>
1MBN4023398mbn000052020새해 첫 분양 `검단 파라곤 센트럴파크` 3대 경쟁력은<!------------ PHOTO_POS_0 ------------> 12·16 부동산 대책 이후 풍선효과로 인해 수도권의 비규제지역 부동산시장이 후끈 달아오르고 있다. 이런 가운데 검단신도시에서 우리나라 새해 첫 아파트 마수걸이 분양단지가 나온다. 2기 신도시인 검단은 규제에서 빗겨나있는데다 올해 하반기부터 그간 '미분양 무덤'이라는 오명을 벗고 인기지역으로 탈바꿈하고 있어 주목된다.<NA><NA><NA><NA>
2동양건설산업은 오는 3일 견본주택을 열고 인천 검단신도시에 '검단파라곤 센트럴파크' 1122가구에 대한 분양에 돌입한다고 밝혔다. 새해 전국 첫 아파트 분양 단지이고 지난 5월 이 회사가 분양한 '검단파라곤 1차' 887가구에 이은 이 지역 두 번째 공급이다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
3검단신도시 AA2블록에 지어지는 단지는 지하 2층∼지상 25층 12개동 1122가구 규모로 실수요자 선호도가 가장 높은 전용 84㎡ 단일면적, 두 가지 타입으로 구성됐다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
4이 단지는 검단신도시 내에서도 가장 우수한 입지로 꼽히는 곳이다. 역세권, 학세권, 숲세권을 갖추고 있다. 개통이 예정된 인천지하철 1호선이 도보권에 위치한 역세권인데다 인근에는 영어마을과 국제학교, 유·초·중·고교가 접해 있다. 특히 축구장 30개 크기(5만5696㎡)의 대형 근린공원이 맞닿아 있으며 인근에는 계양천 수변공원과 중심 상업시설이 위치해 있다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
5<!------------ PHOTO_POS_1 ------------>검단신도시는 수도권 신도시로서는 보기 드물게 비규제지역이다. 12·16 부동산 대책 이후 수도권으로 옮겨가는 풍선효과를 톡톡히 누릴 것으로 전망된다. 이 단지는 주택 소유 여부와 상관없이 청약이 가능하고 재당첨 제한이 없다. 세대주가 아닌 세대원도 청약이 가능하다. 또 추첨제를 통해 전체 물량의 80%을 선정하기 때문에 청약 가점이 낮은 수요자들의 관심을 끌기 충분하다. 다만 전매제한 기간은 3년이다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
6이번 분양은 향후 검단신도시 부동산 시장을 가늠해 볼 수 있는 바로미터가 될 것으로 보인다. 올해 3월 주택도시보증공사는 검단신도시를 포함한 인천시 서구를 미분양관리지역으로 지정했지만 여름부터 분위기가 180도 바뀌었다. 지난 5월 분양한 '검단 동양파라곤1차'가 인천지하철 연장과 9호선 연결 GTX-D 등 교통호재가 잇달으며 완판을 보이기 시작했기 때문이다. 11월 인천시에 따르면 검단신도시가 있는 인천 서구의 미분양 물량은 9가구에 불과하다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
7검단신도시의 여러 개발 호재 중 교통 개발 호재가 핵심이다. 지난 10월 국토교통부가 발표한 '대도시권 광역교통비전 2030'에 의하면 인천 지하철 1호선을 비롯해 서울 지하철 5호선 연장 사업 및 GTX-D 노선 신설 계획이 포함됐다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
82024년 인천지하철 1호선이 연장 개통되면 계양역에서 검단신도시까지 3개 정거장이 신설되며 김포공항역까지 약 6분이면 갈 수 있고, 계양역에서 서울역까지 30분대에 이동할 수 있다. 또 공항철도와 지하철 9호선 직결사업이 추진중이어서 서울과의 접근성은 더욱 높아진다. 인천지하철 2호선(검단신도시∼일산킨텍스)도 현재 예비타당성 조사가 진행 중이고 서울지하철 5호선 김포∼검단 연장사업도 추진 중이다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
9'검단파라곤 센트럴파크'는 교육환경이 우수하다. 현재 운영 중인 영어마을과 에더블 국제학교가 단지와 맞닿아 있고 유·초·중·고교도 단지 바로 인근에 들어설 예정이다. 또 인천지법 북부지원, 인천지검 서부지청 등 제2법조타운과 경찰청, 행정기관 등이 계획돼 있어 직주근접 요소를 갖췄다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CNATCH_IMG_NMJRNL_NMWRT_DATEUnnamed: 9
93[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]<br>http://img.mbn.co.kr/filewww/news/other/2020/01/02/002330392921.jpg,,,,,,,,,조성신20200102092336<NA><NA><NA><NA><NA><NA>
94MBN4023632mbn000052020고강도 규제에도 집값 뛴 상위 10개 지역 어딘가 보니<!------------ PHOTO_POS_0 ------------> 대전시 유성구가 정부의 고강도 규제책을 비웃기라도 하 듯 전국에서 가장 높은 매매가 상승률을 기록했다. 지역 대부분이 타격권에 들어가는 서울의 경우 민간택지 분양가상한제와 '12·16 대책' 발표에도 전국 매매가 상승률 상위 10개 지역 중 절반인 5곳이 포함됐다.<NA><NA><NA><NA>
952일 경제만랩이 KB부동산의 주택가격현황을 분석한 결과에 따르면 대전 유성구가 전국에서 가장 높은 아파트 평균매매가 상승률은 기록했다. 작년 1월 3.3㎡당 1103만7000원 수준이었던 아파트 평균매매가격은 12월 1281만3000원으로 올라 상승율은 16.10%에 달했다. 두번째 상승률 역시 15.56% 오른 '대전 중구'(작년 1월 825만4000원→12월 953만8000원)가 차지했으며, 이어 ▲서울 광진구 14.13%(3220만5000원→3675만5000원) ▲대전 서구 14.06% ▲서울 송파구 12.62% ▲서울 금천구 12.19% ▲경기 과천 11.34% ▲부산 수영구 11.19% ▲서울 영등포구 10.39% ▲서울 양천구 10.34% 순으로 집계됐다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
96대전 아파트 매매가격은 주거선호도가 가장 높은 유성구가 견인하고 중구와 서구가 이를 떠 받치는 모습이다. 유성구는 신성·하기동 구축 위주로, 중구는 정비사업 기대감 있는 태평·오류동 위주로, 서구는 둔산·탄방동 등 주거여건이 양호한 단지 위주로 올랐다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
97여기에 인근 세종시와 수도권의 부동산 규제 영향으로 투기세력이 유입되면서 과열된 분양시장도 한 몫했다는 게 주택업계 전문가들의 시각이다. 실제 대전에서 분양한 아파트의 1순위 청약경쟁률(금융결제원 자료 참고)은 평균 55.46 대 1로 전국에서 가장 높았다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
98이에 대전시는 외지 투기세력의 유입을 최소화하기 위해 지난 달 주택 분양시장 안정화를 위해 청약 시 적용되는 지역 거주자 우선공급대상 거주기간을 기존 3개월에서 1년으로 늘린다고 고시했다. 대전은 그동안 주택 우선공급대상 거주기간을 3개월로 정해 서구와 유성구에만 적용해 왔다. 이 기준이 강화됨에 따라 앞으로는 대전 5개구 전 지역에서 신규 분양하는 아파트를 우선공급받으려면 1년 이상 대전에 거주해야 한다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
99[디지털뉴스국 조성신 기자]<NA><NA><NA><NA><NA><NA><NA><NA><NA>
100<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>
101[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]<br>http://img.mbn.co.kr/filewww/news/other/2020/01/02/001222127002.jpg,,,,,,,,,조성신20200102094536<NA><NA><NA><NA><NA><NA>
102<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>

Duplicate rows

Most frequently occurring

MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CN# duplicates
1<NA><NA><NA><NA><NA><NA>7
0[디지털뉴스국 조성신 기자]<NA><NA><NA><NA><NA>3