Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 103 |
Missing cells | 773 |
Missing cells (%) | 75.0% |
Duplicate rows | 2 |
Duplicate rows (%) | 1.9% |
Total size in memory | 8.7 KiB |
Average record size in memory | 86.3 B |
Variable types
Text | 4 |
---|---|
Categorical | 1 |
Numeric | 1 |
Unsupported | 4 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | MBN |
URL | https://kdx.kr/data/view/26949 |
Dataset has 2 (1.9%) duplicate rows | Duplicates |
STD_YEAR is highly overall correlated with MDA_CGR_NM | High correlation |
MDA_CGR_NM is highly overall correlated with STD_YEAR | High correlation |
MDA_CGR_NM is highly imbalanced (63.4%) | Imbalance |
MBN_MDA_SP_CD has 7 (6.8%) missing values | Missing |
MDA_ART_ESSN_NO has 85 (82.5%) missing values | Missing |
STD_YEAR has 83 (80.6%) missing values | Missing |
ART_SJ_CN has 93 (90.3%) missing values | Missing |
ART_CN has 93 (90.3%) missing values | Missing |
ATCH_IMG_NM has 103 (100.0%) missing values | Missing |
JRNL_NM has 103 (100.0%) missing values | Missing |
WRT_DATE has 103 (100.0%) missing values | Missing |
Unnamed: 9 has 103 (100.0%) missing values | Missing |
ATCH_IMG_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
JRNL_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
WRT_DATE is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 20:27:44.840365 |
---|---|
Analysis finished | 2023-12-11 20:27:45.802979 |
Duration | 0.96 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
MBN_MDA_SP_CD
Text
MISSING
 
Distinct | 81 |
---|---|
Distinct (%) | 84.4% |
Missing | 7 |
Missing (%) | 6.8% |
Memory size | 956.0 B |
Length
Max length | 546 |
---|---|
Median length | 200 |
Mean length | 132.01042 |
Min length | 3 |
Characters and Unicode
Total characters | 12673 |
---|---|
Distinct characters | 504 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 8 ? |
Unique
Unique | 78 ? |
---|---|
Unique (%) | 81.2% |
Sample
1st row | MBN |
---|---|
2nd row | 동양건설산업은 오는 3일 견본주택을 열고 인천 검단신도시에 '검단파라곤 센트럴파크' 1122가구에 대한 분양에 돌입한다고 밝혔다. 새해 전국 첫 아파트 분양 단지이고 지난 5월 이 회사가 분양한 '검단파라곤 1차' 887가구에 이은 이 지역 두 번째 공급이다. |
3rd row | 검단신도시 AA2블록에 지어지는 단지는 지하 2층∼지상 25층 12개동 1122가구 규모로 실수요자 선호도가 가장 높은 전용 84㎡ 단일면적, 두 가지 타입으로 구성됐다. |
4th row | 이 단지는 검단신도시 내에서도 가장 우수한 입지로 꼽히는 곳이다. 역세권, 학세권, 숲세권을 갖추고 있다. 개통이 예정된 인천지하철 1호선이 도보권에 위치한 역세권인데다 인근에는 영어마을과 국제학교, 유·초·중·고교가 접해 있다. 특히 축구장 30개 크기(5만5696㎡)의 대형 근린공원이 맞닿아 있으며 인근에는 계양천 수변공원과 중심 상업시설이 위치해 있다. |
5th row | <!------------ PHOTO_POS_1 ------------>검단신도시는 수도권 신도시로서는 보기 드물게 비규제지역이다. 12·16 부동산 대책 이후 수도권으로 옮겨가는 풍선효과를 톡톡히 누릴 것으로 전망된다. 이 단지는 주택 소유 여부와 상관없이 청약이 가능하고 재당첨 제한이 없다. 세대주가 아닌 세대원도 청약이 가능하다. 또 추첨제를 통해 전체 물량의 80%을 선정하기 때문에 청약 가점이 낮은 수요자들의 관심을 끌기 충분하다. 다만 전매제한 기간은 3년이다. |
Value | Count | Frequency (%) |
있다 | 29 | 1.1% |
수 | 23 | 0.8% |
아파트 | 23 | 0.8% |
22 | 0.8% | |
등 | 20 | 0.7% |
서울 | 16 | 0.6% |
이 | 15 | 0.5% |
부동산 | 15 | 0.5% |
및 | 14 | 0.5% |
5분위 | 14 | 0.5% |
Other values (1608) | 2549 |
Most occurring characters
Value | Count | Frequency (%) |
2689 | 21.2% | |
. | 253 | 2.0% |
다 | 219 | 1.7% |
1 | 209 | 1.6% |
이 | 209 | 1.6% |
가 | 199 | 1.6% |
지 | 191 | 1.5% |
- | 148 | 1.2% |
에 | 138 | 1.1% |
는 | 137 | 1.1% |
Other values (494) | 8281 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8048 | |
Space Separator | 2689 | 21.2% |
Decimal Number | 853 | 6.7% |
Other Punctuation | 518 | 4.1% |
Dash Punctuation | 148 | 1.2% |
Uppercase Letter | 112 | 0.9% |
Open Punctuation | 73 | 0.6% |
Close Punctuation | 73 | 0.6% |
Lowercase Letter | 71 | 0.6% |
Math Symbol | 39 | 0.3% |
Other values (2) | 49 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
다 | 219 | 2.7% |
이 | 209 | 2.6% |
가 | 199 | 2.5% |
지 | 191 | 2.4% |
에 | 138 | 1.7% |
는 | 137 | 1.7% |
로 | 124 | 1.5% |
서 | 110 | 1.4% |
하 | 108 | 1.3% |
도 | 105 | 1.3% |
Other values (439) | 6508 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 18 | |
B | 16 | |
P | 12 | |
T | 11 | |
M | 10 | |
N | 10 | |
S | 7 | 6.2% |
H | 6 | 5.4% |
G | 5 | 4.5% |
D | 4 | 3.6% |
Other values (4) | 13 |
Decimal Number
Value | Count | Frequency (%) |
1 | 209 | |
2 | 136 | |
0 | 124 | |
5 | 81 | 9.5% |
3 | 73 | 8.6% |
4 | 61 | 7.2% |
9 | 49 | 5.7% |
6 | 47 | 5.5% |
8 | 40 | 4.7% |
7 | 33 | 3.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 253 | |
, | 73 | 14.1% |
% | 57 | 11.0% |
' | 46 | 8.9% |
" | 40 | 7.7% |
· | 32 | 6.2% |
& | 10 | 1.9% |
! | 6 | 1.2% |
/ | 1 | 0.2% |
Lowercase Letter
Value | Count | Frequency (%) |
k | 20 | |
r | 15 | |
m | 11 | |
c | 10 | |
o | 10 | |
b | 5 | 7.0% |
Math Symbol
Value | Count | Frequency (%) |
> | 11 | |
< | 11 | |
~ | 6 | |
→ | 5 | |
∼ | 5 | |
± | 1 | 2.6% |
Other Symbol
Value | Count | Frequency (%) |
▲ | 21 | |
ⓒ | 10 | |
㎡ | 6 | 16.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 53 | |
[ | 20 | 27.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 53 | |
] | 20 | 27.4% |
Space Separator
Value | Count | Frequency (%) |
2689 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 148 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8048 | |
Common | 4442 | |
Latin | 183 | 1.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
다 | 219 | 2.7% |
이 | 209 | 2.6% |
가 | 199 | 2.5% |
지 | 191 | 2.4% |
에 | 138 | 1.7% |
는 | 137 | 1.7% |
로 | 124 | 1.5% |
서 | 110 | 1.4% |
하 | 108 | 1.3% |
도 | 105 | 1.3% |
Other values (439) | 6508 |
Common
Value | Count | Frequency (%) |
2689 | ||
. | 253 | 5.7% |
1 | 209 | 4.7% |
- | 148 | 3.3% |
2 | 136 | 3.1% |
0 | 124 | 2.8% |
5 | 81 | 1.8% |
3 | 73 | 1.6% |
, | 73 | 1.6% |
4 | 61 | 1.4% |
Other values (25) | 595 | 13.4% |
Latin
Value | Count | Frequency (%) |
k | 20 | 10.9% |
O | 18 | 9.8% |
B | 16 | 8.7% |
r | 15 | 8.2% |
P | 12 | 6.6% |
T | 11 | 6.0% |
m | 11 | 6.0% |
M | 10 | 5.5% |
N | 10 | 5.5% |
c | 10 | 5.5% |
Other values (10) | 50 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8048 | |
ASCII | 4545 | |
None | 33 | 0.3% |
Geometric Shapes | 21 | 0.2% |
Enclosed Alphanum | 10 | 0.1% |
CJK Compat | 6 | < 0.1% |
Arrows | 5 | < 0.1% |
Math Operators | 5 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2689 | ||
. | 253 | 5.6% |
1 | 209 | 4.6% |
- | 148 | 3.3% |
2 | 136 | 3.0% |
0 | 124 | 2.7% |
5 | 81 | 1.8% |
3 | 73 | 1.6% |
, | 73 | 1.6% |
4 | 61 | 1.3% |
Other values (38) | 698 | 15.4% |
Hangul
Value | Count | Frequency (%) |
다 | 219 | 2.7% |
이 | 209 | 2.6% |
가 | 199 | 2.5% |
지 | 191 | 2.4% |
에 | 138 | 1.7% |
는 | 137 | 1.7% |
로 | 124 | 1.5% |
서 | 110 | 1.4% |
하 | 108 | 1.3% |
도 | 105 | 1.3% |
Other values (439) | 6508 |
None
Value | Count | Frequency (%) |
· | 32 | |
± | 1 | 3.0% |
Geometric Shapes
Value | Count | Frequency (%) |
▲ | 21 |
Enclosed Alphanum
Value | Count | Frequency (%) |
ⓒ | 10 |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 6 |
Arrows
Value | Count | Frequency (%) |
→ | 5 |
Math Operators
Value | Count | Frequency (%) |
∼ | 5 |
MDA_ART_ESSN_NO
Text
MISSING
 
Distinct | 18 |
---|---|
Distinct (%) | 100.0% |
Missing | 85 |
Missing (%) | 82.5% |
Memory size | 956.0 B |
Length
Max length | 210 |
---|---|
Median length | 7 |
Mean length | 52.555556 |
Min length | 7 |
Characters and Unicode
Total characters | 946 |
---|---|
Distinct characters | 32 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 18 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 4023398 |
---|---|
2nd row | http://img.mbn.co.kr/filewww/news/other/2020/01/01/000020150021.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/310200003016.jpg,,,,,,,, |
3rd row | 4023426 |
4th row | http://img.mbn.co.kr/filewww/news/other/2020/01/01/000020100110.jpg,,,,,,,,, |
5th row | 4023430 |
Value | Count | Frequency (%) |
4023398 | 1 | 5.6% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/000020150021.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/310200003016.jpg | 1 | 5.6% |
4023632 | 1 | 5.6% |
http://img.mbn.co.kr/filewww/news/other/2020/01/02/002330392921.jpg | 1 | 5.6% |
4023608 | 1 | 5.6% |
http://img.mbn.co.kr/filewww/news/other/2020/01/02/000200000902.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/02/020100100020.jpg | 1 | 5.6% |
4023603 | 1 | 5.6% |
http://img.mbn.co.kr/filewww/news/other/2020/01/02/030440308008.jpg | 1 | 5.6% |
4023565 | 1 | 5.6% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/221200003020.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/100030130000.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/220000020000.jpg | 1 | 5.6% |
Other values (8) | 8 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 140 | |
/ | 108 | 11.4% |
, | 72 | 7.6% |
2 | 67 | 7.1% |
w | 48 | 5.1% |
. | 48 | 5.1% |
t | 36 | 3.8% |
e | 36 | 3.8% |
1 | 35 | 3.7% |
3 | 31 | 3.3% |
Other values (22) | 325 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 396 | |
Decimal Number | 310 | |
Other Punctuation | 240 |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
w | 48 | |
t | 36 | 9.1% |
e | 36 | 9.1% |
m | 24 | 6.1% |
g | 24 | 6.1% |
n | 24 | 6.1% |
i | 24 | 6.1% |
o | 24 | 6.1% |
p | 24 | 6.1% |
h | 24 | 6.1% |
Other values (8) | 108 |
Decimal Number
Value | Count | Frequency (%) |
0 | 140 | |
2 | 67 | |
1 | 35 | 11.3% |
3 | 31 | 10.0% |
4 | 18 | 5.8% |
6 | 6 | 1.9% |
8 | 4 | 1.3% |
9 | 4 | 1.3% |
5 | 3 | 1.0% |
7 | 2 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 108 | |
, | 72 | |
. | 48 | |
: | 12 | 5.0% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 550 | |
Latin | 396 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
w | 48 | |
t | 36 | 9.1% |
e | 36 | 9.1% |
m | 24 | 6.1% |
g | 24 | 6.1% |
n | 24 | 6.1% |
i | 24 | 6.1% |
o | 24 | 6.1% |
p | 24 | 6.1% |
h | 24 | 6.1% |
Other values (8) | 108 |
Common
Value | Count | Frequency (%) |
0 | 140 | |
/ | 108 | |
, | 72 | |
2 | 67 | |
. | 48 | 8.7% |
1 | 35 | 6.4% |
3 | 31 | 5.6% |
4 | 18 | 3.3% |
: | 12 | 2.2% |
6 | 6 | 1.1% |
Other values (4) | 13 | 2.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 946 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 140 | |
/ | 108 | 11.4% |
, | 72 | 7.6% |
2 | 67 | 7.1% |
w | 48 | 5.1% |
. | 48 | 5.1% |
t | 36 | 3.8% |
e | 36 | 3.8% |
1 | 35 | 3.7% |
3 | 31 | 3.3% |
Other values (22) | 325 |
MDA_CGR_NM
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 9 |
---|---|
Distinct (%) | 8.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
<NA> | |
---|---|
mbn00005 | |
조성신 | 3 |
박윤예 | 2 |
이선희 | 1 |
Other values (4) | 4 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.3300971 |
Min length | 3 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 4.9% |
Sample
1st row | <NA> |
---|---|
2nd row | mbn00005 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 83 | |
mbn00005 | 10 | 9.7% |
조성신 | 3 | 2.9% |
박윤예 | 2 | 1.9% |
이선희 | 1 | 1.0% |
손동우 | 1 | 1.0% |
손동우,나현준 | 1 | 1.0% |
정지성 | 1 | 1.0% |
이미연 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 83 | |
mbn00005 | 10 | 9.7% |
조성신 | 3 | 2.9% |
박윤예 | 2 | 1.9% |
이선희 | 1 | 1.0% |
손동우 | 1 | 1.0% |
손동우,나현준 | 1 | 1.0% |
정지성 | 1 | 1.0% |
이미연 | 1 | 1.0% |
STD_YEAR
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 8 |
---|---|
Distinct (%) | 40.0% |
Missing | 83 |
Missing (%) | 80.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.0100051 × 1013 |
Minimum | 2020 |
---|---|
Maximum | 2.0200102 × 1013 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 2020 |
---|---|
5-th percentile | 2020 |
Q1 | 2020 |
median | 1.0100051 × 1013 |
Q3 | 2.0200101 × 1013 |
95-th percentile | 2.0200102 × 1013 |
Maximum | 2.0200102 × 1013 |
Range | 2.0200102 × 1013 |
Interquartile range (IQR) | 2.0200101 × 1013 |
Descriptive statistics
Standard deviation | 1.0362433 × 1013 |
---|---|
Coefficient of variation (CV) | 1.0259784 |
Kurtosis | -2.2352941 |
Mean | 1.0100051 × 1013 |
Median Absolute Deviation (MAD) | 1.0100051 × 1013 |
Skewness | 2.9464712 × 10-15 |
Sum | 2.0200102 × 1014 |
Variance | 1.0738003 × 1026 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2020 | 10 | 9.7% |
20200101174635 | 4 | 3.9% |
20200101163504 | 1 | 1.0% |
20200101172534 | 1 | 1.0% |
20200102084435 | 1 | 1.0% |
20200102092206 | 1 | 1.0% |
20200102092336 | 1 | 1.0% |
20200102094536 | 1 | 1.0% |
(Missing) | 83 |
Value | Count | Frequency (%) |
2020 | 10 | |
20200101163504 | 1 | 1.0% |
20200101172534 | 1 | 1.0% |
20200101174635 | 4 | 3.9% |
20200102084435 | 1 | 1.0% |
20200102092206 | 1 | 1.0% |
20200102092336 | 1 | 1.0% |
20200102094536 | 1 | 1.0% |
Value | Count | Frequency (%) |
20200102094536 | 1 | 1.0% |
20200102092336 | 1 | 1.0% |
20200102092206 | 1 | 1.0% |
20200102084435 | 1 | 1.0% |
20200101174635 | 4 | 3.9% |
20200101172534 | 1 | 1.0% |
20200101163504 | 1 | 1.0% |
2020 | 10 |
ART_SJ_CN
Text
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 100.0% |
Missing | 93 |
Missing (%) | 90.3% |
Memory size | 956.0 B |
Length
Max length | 46 |
---|---|
Median length | 30.5 |
Mean length | 29.9 |
Min length | 15 |
Characters and Unicode
Total characters | 299 |
---|---|
Distinct characters | 145 |
Distinct categories | 9 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 새해 첫 분양 `검단 파라곤 센트럴파크` 3대 경쟁력은 |
---|---|
2nd row | 집값 격차 9년來 최대…부동산 양극화 심화 |
3rd row | 주거급여 지원대상·금액 확대…4인가구 월세보조 41만5000원 |
4th row | "인허가 단축" 해준다더니…어딘지 못밝히는 정부 |
5th row | 신탁방식 재개발·재건축 각광 |
Value | Count | Frequency (%) |
집값 | 3 | 4.3% |
센트럴파크 | 2 | 2.9% |
새해 | 1 | 1.4% |
주택시장 | 1 | 1.4% |
오를까 | 1 | 1.4% |
더 | 1 | 1.4% |
올해 | 1 | 1.4% |
나오는데도 | 1 | 1.4% |
계속 | 1 | 1.4% |
규제 | 1 | 1.4% |
Other values (56) | 56 |
Most occurring characters
Value | Count | Frequency (%) |
59 | 19.7% | |
단 | 5 | 1.7% |
지 | 5 | 1.7% |
· | 4 | 1.3% |
월 | 4 | 1.3% |
1 | 4 | 1.3% |
대 | 4 | 1.3% |
파 | 4 | 1.3% |
0 | 4 | 1.3% |
… | 4 | 1.3% |
Other values (135) | 202 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 198 | |
Space Separator | 59 | 19.7% |
Decimal Number | 20 | 6.7% |
Other Punctuation | 13 | 4.3% |
Uppercase Letter | 3 | 1.0% |
Modifier Symbol | 2 | 0.7% |
Math Symbol | 2 | 0.7% |
Close Punctuation | 1 | 0.3% |
Open Punctuation | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
단 | 5 | 2.5% |
지 | 5 | 2.5% |
월 | 4 | 2.0% |
대 | 4 | 2.0% |
파 | 4 | 2.0% |
년 | 3 | 1.5% |
집 | 3 | 1.5% |
해 | 3 | 1.5% |
가 | 3 | 1.5% |
도 | 3 | 1.5% |
Other values (111) | 161 |
Decimal Number
Value | Count | Frequency (%) |
1 | 4 | |
0 | 4 | |
5 | 2 | |
4 | 2 | |
7 | 2 | |
3 | 2 | |
2 | 2 | |
8 | 1 | 5.0% |
9 | 1 | 5.0% |
Other Punctuation
Value | Count | Frequency (%) |
· | 4 | |
… | 4 | |
" | 2 | |
% | 1 | 7.7% |
. | 1 | 7.7% |
, | 1 | 7.7% |
Uppercase Letter
Value | Count | Frequency (%) |
W | 1 | |
O | 1 | |
N | 1 |
Math Symbol
Value | Count | Frequency (%) |
→ | 1 | |
↑ | 1 |
Space Separator
Value | Count | Frequency (%) |
59 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 2 |
Close Punctuation
Value | Count | Frequency (%) |
] | 1 |
Open Punctuation
Value | Count | Frequency (%) |
[ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 195 | |
Common | 98 | |
Han | 3 | 1.0% |
Latin | 3 | 1.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
단 | 5 | 2.6% |
지 | 5 | 2.6% |
월 | 4 | 2.1% |
대 | 4 | 2.1% |
파 | 4 | 2.1% |
년 | 3 | 1.5% |
집 | 3 | 1.5% |
해 | 3 | 1.5% |
가 | 3 | 1.5% |
도 | 3 | 1.5% |
Other values (108) | 158 |
Common
Value | Count | Frequency (%) |
59 | ||
· | 4 | 4.1% |
1 | 4 | 4.1% |
0 | 4 | 4.1% |
… | 4 | 4.1% |
5 | 2 | 2.0% |
" | 2 | 2.0% |
4 | 2 | 2.0% |
7 | 2 | 2.0% |
3 | 2 | 2.0% |
Other values (11) | 13 | 13.3% |
Han
Value | Count | Frequency (%) |
比 | 1 | |
來 | 1 | |
無 | 1 |
Latin
Value | Count | Frequency (%) |
W | 1 | |
O | 1 | |
N | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 195 | |
ASCII | 91 | |
None | 4 | 1.3% |
Punctuation | 4 | 1.3% |
CJK | 3 | 1.0% |
Arrows | 2 | 0.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
59 | ||
1 | 4 | 4.4% |
0 | 4 | 4.4% |
5 | 2 | 2.2% |
" | 2 | 2.2% |
4 | 2 | 2.2% |
7 | 2 | 2.2% |
3 | 2 | 2.2% |
2 | 2 | 2.2% |
` | 2 | 2.2% |
Other values (10) | 10 | 11.0% |
Hangul
Value | Count | Frequency (%) |
단 | 5 | 2.6% |
지 | 5 | 2.6% |
월 | 4 | 2.1% |
대 | 4 | 2.1% |
파 | 4 | 2.1% |
년 | 3 | 1.5% |
집 | 3 | 1.5% |
해 | 3 | 1.5% |
가 | 3 | 1.5% |
도 | 3 | 1.5% |
Other values (108) | 158 |
None
Value | Count | Frequency (%) |
· | 4 |
Punctuation
Value | Count | Frequency (%) |
… | 4 |
Arrows
Value | Count | Frequency (%) |
→ | 1 | |
↑ | 1 |
CJK
Value | Count | Frequency (%) |
比 | 1 | |
來 | 1 | |
無 | 1 |
ART_CN
Text
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 100.0% |
Missing | 93 |
Missing (%) | 90.3% |
Memory size | 956.0 B |
Length
Max length | 261 |
---|---|
Median length | 199 |
Mean length | 171.7 |
Min length | 62 |
Characters and Unicode
Total characters | 1717 |
---|---|
Distinct characters | 270 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | <!------------ PHOTO_POS_0 ------------> 12·16 부동산 대책 이후 풍선효과로 인해 수도권의 비규제지역 부동산시장이 후끈 달아오르고 있다. 이런 가운데 검단신도시에서 우리나라 새해 첫 아파트 마수걸이 분양단지가 나온다. 2기 신도시인 검단은 규제에서 빗겨나있는데다 올해 하반기부터 그간 '미분양 무덤'이라는 오명을 벗고 인기지역으로 탈바꿈하고 있어 주목된다. |
---|---|
2nd row | <!------------ PHOTO_POS_0 ------------> 전국 고가 아파트와 저가 아파트 간 가격 차이가 9년여 만에 최대치로 벌어졌다. '똘똘한 한 채' 열풍으로 신축을 중심으로 한 입지 좋은 아파트에 매수세가 몰리면서 아파트 간에 가격 차이가 벌어지는 것으로 분석된다. 최근 정부는 '소득주도성장'으로 소득 격차가 줄어들고 있다고 밝혔지만, 부동산은 지역·가격에 따라 격차가 더 벌어지고 있어 국민의 자산 양극화는 점점 심화하는 것으로 보인다. |
3rd row | 새해에는 생활이 어려운 가구의 전·월세 임대료와 집수리 비용을 지원하는 주거급여의 지원 대상과 금액이 늘어난다. |
4th row | 국토교통부가 12·16 대책을 발표하며 주택 공급 확대를 위해 막바지 작업에 들어간 정비사업의 인허가 절차를 단축시키겠다고 밝혔지만, 정작 해당 정비사업이 어느 구역인지를 공개하지 않고 있는 것으로 드러났다. 서울 내 해당 정비구역이 어딘지를 공개하면 국토부가 분양가상한제를 피할 수 있는 단지로 공인한 꼴이 돼 집값 상승을 부추길 수 있다는 우려가 반영된 것으로 보인다. |
5th row | <!------------ PHOTO_POS_0 ------------> 최근 조합 대신 신탁사가 시행사 역할을 맡는 신탁 방식 재개발·재건축이 성공적으로 진행되는 사례가 많아지고 있다. 이에 따라 그간 정비업계에서 찬밥 신세였던 부동산 신탁사의 위상도 올라가고 있다. |
Value | Count | Frequency (%) |
12 | 3.4% | |
photo_pos_0 | 6 | 1.7% |
것으로 | 6 | 1.7% |
아파트 | 4 | 1.1% |
12·16 | 4 | 1.1% |
있다 | 4 | 1.1% |
부동산 | 3 | 0.8% |
그간 | 3 | 0.8% |
있는 | 3 | 0.8% |
있어 | 3 | 0.8% |
Other values (258) | 307 |
Most occurring characters
Value | Count | Frequency (%) |
351 | 20.4% | |
- | 144 | 8.4% |
가 | 34 | 2.0% |
다 | 29 | 1.7% |
이 | 29 | 1.7% |
지 | 25 | 1.5% |
. | 23 | 1.3% |
로 | 21 | 1.2% |
에 | 19 | 1.1% |
는 | 19 | 1.1% |
Other values (260) | 1023 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1051 | |
Space Separator | 351 | 20.4% |
Dash Punctuation | 144 | 8.4% |
Other Punctuation | 55 | 3.2% |
Uppercase Letter | 48 | 2.8% |
Decimal Number | 44 | 2.6% |
Connector Punctuation | 12 | 0.7% |
Math Symbol | 12 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 34 | 3.2% |
다 | 29 | 2.8% |
이 | 29 | 2.8% |
지 | 25 | 2.4% |
로 | 21 | 2.0% |
에 | 19 | 1.8% |
는 | 19 | 1.8% |
상 | 18 | 1.7% |
부 | 16 | 1.5% |
고 | 16 | 1.5% |
Other values (235) | 825 |
Decimal Number
Value | Count | Frequency (%) |
1 | 11 | |
0 | 11 | |
2 | 10 | |
6 | 5 | |
5 | 2 | 4.5% |
7 | 2 | 4.5% |
8 | 1 | 2.3% |
3 | 1 | 2.3% |
9 | 1 | 2.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 23 | |
' | 10 | |
· | 8 | 14.5% |
! | 6 | 10.9% |
, | 6 | 10.9% |
% | 2 | 3.6% |
Uppercase Letter
Value | Count | Frequency (%) |
O | 18 | |
P | 12 | |
H | 6 | 12.5% |
T | 6 | 12.5% |
S | 6 | 12.5% |
Math Symbol
Value | Count | Frequency (%) |
< | 6 | |
> | 6 |
Space Separator
Value | Count | Frequency (%) |
351 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 144 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1051 | |
Common | 618 | |
Latin | 48 | 2.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 34 | 3.2% |
다 | 29 | 2.8% |
이 | 29 | 2.8% |
지 | 25 | 2.4% |
로 | 21 | 2.0% |
에 | 19 | 1.8% |
는 | 19 | 1.8% |
상 | 18 | 1.7% |
부 | 16 | 1.5% |
고 | 16 | 1.5% |
Other values (235) | 825 |
Common
Value | Count | Frequency (%) |
351 | ||
- | 144 | |
. | 23 | 3.7% |
_ | 12 | 1.9% |
1 | 11 | 1.8% |
0 | 11 | 1.8% |
' | 10 | 1.6% |
2 | 10 | 1.6% |
· | 8 | 1.3% |
< | 6 | 1.0% |
Other values (10) | 32 | 5.2% |
Latin
Value | Count | Frequency (%) |
O | 18 | |
P | 12 | |
H | 6 | 12.5% |
T | 6 | 12.5% |
S | 6 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1051 | |
ASCII | 658 | |
None | 8 | 0.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
351 | ||
- | 144 | |
. | 23 | 3.5% |
O | 18 | 2.7% |
_ | 12 | 1.8% |
P | 12 | 1.8% |
1 | 11 | 1.7% |
0 | 11 | 1.7% |
' | 10 | 1.5% |
2 | 10 | 1.5% |
Other values (14) | 56 | 8.5% |
Hangul
Value | Count | Frequency (%) |
가 | 34 | 3.2% |
다 | 29 | 2.8% |
이 | 29 | 2.8% |
지 | 25 | 2.4% |
로 | 21 | 2.0% |
에 | 19 | 1.8% |
는 | 19 | 1.8% |
상 | 18 | 1.7% |
부 | 16 | 1.5% |
고 | 16 | 1.5% |
Other values (235) | 825 |
None
Value | Count | Frequency (%) |
· | 8 |
ATCH_IMG_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 103 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.0 KiB |
JRNL_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 103 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.0 KiB |
WRT_DATE
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 103 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.0 KiB |
Unnamed: 9
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 103 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.0 KiB |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | |
---|---|---|---|---|---|---|
MBN_MDA_SP_CD | 1.000 | 1.000 | 0.967 | NaN | NaN | NaN |
MDA_ART_ESSN_NO | 1.000 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
MDA_CGR_NM | 0.967 | 1.000 | 1.000 | NaN | NaN | NaN |
STD_YEAR | NaN | NaN | NaN | 1.000 | NaN | NaN |
ART_SJ_CN | NaN | 1.000 | NaN | NaN | 1.000 | 1.000 |
ART_CN | NaN | 1.000 | NaN | NaN | 1.000 | 1.000 |
STD_YEAR | MDA_CGR_NM | |
---|---|---|
STD_YEAR | 1.000 | 0.816 |
MDA_CGR_NM | 0.816 | 1.000 |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | MBN | 4023398 | mbn00005 | 2020 | 새해 첫 분양 `검단 파라곤 센트럴파크` 3대 경쟁력은 | <!------------ PHOTO_POS_0 ------------> 12·16 부동산 대책 이후 풍선효과로 인해 수도권의 비규제지역 부동산시장이 후끈 달아오르고 있다. 이런 가운데 검단신도시에서 우리나라 새해 첫 아파트 마수걸이 분양단지가 나온다. 2기 신도시인 검단은 규제에서 빗겨나있는데다 올해 하반기부터 그간 '미분양 무덤'이라는 오명을 벗고 인기지역으로 탈바꿈하고 있어 주목된다. | <NA> | <NA> | <NA> | <NA> |
2 | 동양건설산업은 오는 3일 견본주택을 열고 인천 검단신도시에 '검단파라곤 센트럴파크' 1122가구에 대한 분양에 돌입한다고 밝혔다. 새해 전국 첫 아파트 분양 단지이고 지난 5월 이 회사가 분양한 '검단파라곤 1차' 887가구에 이은 이 지역 두 번째 공급이다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | 검단신도시 AA2블록에 지어지는 단지는 지하 2층∼지상 25층 12개동 1122가구 규모로 실수요자 선호도가 가장 높은 전용 84㎡ 단일면적, 두 가지 타입으로 구성됐다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | 이 단지는 검단신도시 내에서도 가장 우수한 입지로 꼽히는 곳이다. 역세권, 학세권, 숲세권을 갖추고 있다. 개통이 예정된 인천지하철 1호선이 도보권에 위치한 역세권인데다 인근에는 영어마을과 국제학교, 유·초·중·고교가 접해 있다. 특히 축구장 30개 크기(5만5696㎡)의 대형 근린공원이 맞닿아 있으며 인근에는 계양천 수변공원과 중심 상업시설이 위치해 있다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | <!------------ PHOTO_POS_1 ------------>검단신도시는 수도권 신도시로서는 보기 드물게 비규제지역이다. 12·16 부동산 대책 이후 수도권으로 옮겨가는 풍선효과를 톡톡히 누릴 것으로 전망된다. 이 단지는 주택 소유 여부와 상관없이 청약이 가능하고 재당첨 제한이 없다. 세대주가 아닌 세대원도 청약이 가능하다. 또 추첨제를 통해 전체 물량의 80%을 선정하기 때문에 청약 가점이 낮은 수요자들의 관심을 끌기 충분하다. 다만 전매제한 기간은 3년이다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | 이번 분양은 향후 검단신도시 부동산 시장을 가늠해 볼 수 있는 바로미터가 될 것으로 보인다. 올해 3월 주택도시보증공사는 검단신도시를 포함한 인천시 서구를 미분양관리지역으로 지정했지만 여름부터 분위기가 180도 바뀌었다. 지난 5월 분양한 '검단 동양파라곤1차'가 인천지하철 연장과 9호선 연결 GTX-D 등 교통호재가 잇달으며 완판을 보이기 시작했기 때문이다. 11월 인천시에 따르면 검단신도시가 있는 인천 서구의 미분양 물량은 9가구에 불과하다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | 검단신도시의 여러 개발 호재 중 교통 개발 호재가 핵심이다. 지난 10월 국토교통부가 발표한 '대도시권 광역교통비전 2030'에 의하면 인천 지하철 1호선을 비롯해 서울 지하철 5호선 연장 사업 및 GTX-D 노선 신설 계획이 포함됐다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | 2024년 인천지하철 1호선이 연장 개통되면 계양역에서 검단신도시까지 3개 정거장이 신설되며 김포공항역까지 약 6분이면 갈 수 있고, 계양역에서 서울역까지 30분대에 이동할 수 있다. 또 공항철도와 지하철 9호선 직결사업이 추진중이어서 서울과의 접근성은 더욱 높아진다. 인천지하철 2호선(검단신도시∼일산킨텍스)도 현재 예비타당성 조사가 진행 중이고 서울지하철 5호선 김포∼검단 연장사업도 추진 중이다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | '검단파라곤 센트럴파크'는 교육환경이 우수하다. 현재 운영 중인 영어마을과 에더블 국제학교가 단지와 맞닿아 있고 유·초·중·고교도 단지 바로 인근에 들어설 예정이다. 또 인천지법 북부지원, 인천지검 서부지청 등 제2법조타운과 경찰청, 행정기관 등이 계획돼 있어 직주근접 요소를 갖췄다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
93 | [ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]<br> | http://img.mbn.co.kr/filewww/news/other/2020/01/02/002330392921.jpg,,,,,,,,, | 조성신 | 20200102092336 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
94 | MBN | 4023632 | mbn00005 | 2020 | 고강도 규제에도 집값 뛴 상위 10개 지역 어딘가 보니 | <!------------ PHOTO_POS_0 ------------> 대전시 유성구가 정부의 고강도 규제책을 비웃기라도 하 듯 전국에서 가장 높은 매매가 상승률을 기록했다. 지역 대부분이 타격권에 들어가는 서울의 경우 민간택지 분양가상한제와 '12·16 대책' 발표에도 전국 매매가 상승률 상위 10개 지역 중 절반인 5곳이 포함됐다. | <NA> | <NA> | <NA> | <NA> |
95 | 2일 경제만랩이 KB부동산의 주택가격현황을 분석한 결과에 따르면 대전 유성구가 전국에서 가장 높은 아파트 평균매매가 상승률은 기록했다. 작년 1월 3.3㎡당 1103만7000원 수준이었던 아파트 평균매매가격은 12월 1281만3000원으로 올라 상승율은 16.10%에 달했다. 두번째 상승률 역시 15.56% 오른 '대전 중구'(작년 1월 825만4000원→12월 953만8000원)가 차지했으며, 이어 ▲서울 광진구 14.13%(3220만5000원→3675만5000원) ▲대전 서구 14.06% ▲서울 송파구 12.62% ▲서울 금천구 12.19% ▲경기 과천 11.34% ▲부산 수영구 11.19% ▲서울 영등포구 10.39% ▲서울 양천구 10.34% 순으로 집계됐다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
96 | 대전 아파트 매매가격은 주거선호도가 가장 높은 유성구가 견인하고 중구와 서구가 이를 떠 받치는 모습이다. 유성구는 신성·하기동 구축 위주로, 중구는 정비사업 기대감 있는 태평·오류동 위주로, 서구는 둔산·탄방동 등 주거여건이 양호한 단지 위주로 올랐다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
97 | 여기에 인근 세종시와 수도권의 부동산 규제 영향으로 투기세력이 유입되면서 과열된 분양시장도 한 몫했다는 게 주택업계 전문가들의 시각이다. 실제 대전에서 분양한 아파트의 1순위 청약경쟁률(금융결제원 자료 참고)은 평균 55.46 대 1로 전국에서 가장 높았다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
98 | 이에 대전시는 외지 투기세력의 유입을 최소화하기 위해 지난 달 주택 분양시장 안정화를 위해 청약 시 적용되는 지역 거주자 우선공급대상 거주기간을 기존 3개월에서 1년으로 늘린다고 고시했다. 대전은 그동안 주택 우선공급대상 거주기간을 3개월로 정해 서구와 유성구에만 적용해 왔다. 이 기준이 강화됨에 따라 앞으로는 대전 5개구 전 지역에서 신규 분양하는 아파트를 우선공급받으려면 1년 이상 대전에 거주해야 한다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
99 | [디지털뉴스국 조성신 기자] | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
100 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
101 | [ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]<br> | http://img.mbn.co.kr/filewww/news/other/2020/01/02/001222127002.jpg,,,,,,,,, | 조성신 | 20200102094536 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
102 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | # duplicates | |
---|---|---|---|---|---|---|---|
1 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 7 |
0 | [디지털뉴스국 조성신 기자] | <NA> | <NA> | <NA> | <NA> | <NA> | 3 |