Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 192 |
Missing cells | 1704 |
Missing cells (%) | 88.8% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.5% |
Total size in memory | 16.1 KiB |
Average record size in memory | 85.7 B |
Variable types
Text | 5 |
---|---|
Numeric | 1 |
Unsupported | 4 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | MBN |
URL | https://kdx.kr/data/view/26952 |
Dataset has 1 (0.5%) duplicate rows | Duplicates |
MBN_MDA_SP_CD has 50 (26.0%) missing values | Missing |
MDA_ART_ESSN_NO has 176 (91.7%) missing values | Missing |
MDA_CGR_NM has 174 (90.6%) missing values | Missing |
STD_YEAR has 172 (89.6%) missing values | Missing |
ART_SJ_CN has 182 (94.8%) missing values | Missing |
ART_CN has 182 (94.8%) missing values | Missing |
ATCH_IMG_NM has 192 (100.0%) missing values | Missing |
JRNL_NM has 192 (100.0%) missing values | Missing |
WRT_DATE has 192 (100.0%) missing values | Missing |
Unnamed: 9 has 192 (100.0%) missing values | Missing |
ATCH_IMG_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
JRNL_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
WRT_DATE is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 21:03:40.276899 |
---|---|
Analysis finished | 2023-12-11 21:03:42.510278 |
Duration | 2.23 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
MBN_MDA_SP_CD
Text
MISSING
 
Distinct | 126 |
---|---|
Distinct (%) | 88.7% |
Missing | 50 |
Missing (%) | 26.0% |
Memory size | 1.6 KiB |
Length
Max length | 480 |
---|---|
Median length | 144.5 |
Mean length | 90.669014 |
Min length | 3 |
Characters and Unicode
Total characters | 12875 |
---|---|
Distinct characters | 688 |
Distinct categories | 14 ? |
Distinct scripts | 4 ? |
Distinct blocks | 8 ? |
Unique
Unique | 123 ? |
---|---|
Unique (%) | 86.6% |
Sample
1st row | MBN |
---|---|
2nd row | 수도권 남부 중 수원시는 교통의 요충지이자 도청이 자리한 도시로 발전 중입니다. 수원을 중심으로 화성, 오산, 평택 등 신도시의 개발과 신규 아파트가 들어서면서 역세권을 중심으로 희소성이 있습니다. 수원역과 고색역을 동시에 누리며 주변 시세 대비 저렴한 공급가로 실거주자의 인기가 높은 ‘남수원 이지더원’이 막바지 특별 모집 중입니다. |
3rd row | ‘남수원 이지더원’은 경기도 화성시 배양동 일대로 총 1014세대의 대단지로 조성됩니다. 선호도 높은 중소형 평형위주로 전용면적 59㎡, 69㎡, 84㎡로 선택의 폭이 넓습니다. |
4th row | 전 세대 남향위주의 배치와 3천여평의 공원을 조성해 일조량 및 채광이 우수합니다. 테마정원, 어린이놀이터, 주민운동시설 등 입주민을 위한 힐링 라이프를 선사합니다. 드레스룸, 알파룸, 현관수납장 등 수납공간을 넓히고 일부 타입의 경우 1+1 세대분리형으로 2세대가 거주가능합니다. |
5th row | 북카페, 사우나, 피트니스센터, 배드민턴&탁구 등 다양한 커뮤니티시설을 도입합니다. 남수원 골프장 조망권과 숲세권을 누릴 수 있습니다. 황구지천 수변공원을 도보로 이용가능하며 단지 내 다양한 어린이놀이터, 산책로, 작은공원 등 설계했습니다. |
Value | Count | Frequency (%) |
등 | 23 | 0.8% |
수 | 21 | 0.7% |
19 | 0.7% | |
및 | 19 | 0.7% |
통해 | 18 | 0.6% |
있는 | 13 | 0.5% |
mbn | 12 | 0.4% |
제네시스 | 11 | 0.4% |
것으로 | 11 | 0.4% |
대형 | 10 | 0.4% |
Other values (2050) | 2680 |
Most occurring characters
Value | Count | Frequency (%) |
2756 | 21.4% | |
다 | 231 | 1.8% |
이 | 225 | 1.7% |
. | 200 | 1.6% |
을 | 162 | 1.3% |
는 | 161 | 1.3% |
로 | 152 | 1.2% |
에 | 136 | 1.1% |
의 | 136 | 1.1% |
기 | 135 | 1.0% |
Other values (678) | 8581 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8564 | |
Space Separator | 2756 | 21.4% |
Other Punctuation | 438 | 3.4% |
Decimal Number | 351 | 2.7% |
Lowercase Letter | 274 | 2.1% |
Uppercase Letter | 224 | 1.7% |
Dash Punctuation | 84 | 0.7% |
Open Punctuation | 63 | 0.5% |
Close Punctuation | 63 | 0.5% |
Math Symbol | 25 | 0.2% |
Other values (4) | 33 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
다 | 231 | 2.7% |
이 | 225 | 2.6% |
을 | 162 | 1.9% |
는 | 161 | 1.9% |
로 | 152 | 1.8% |
에 | 136 | 1.6% |
의 | 136 | 1.6% |
기 | 135 | 1.6% |
지 | 124 | 1.4% |
가 | 115 | 1.3% |
Other values (591) | 6987 |
Lowercase Letter
Value | Count | Frequency (%) |
r | 30 | |
e | 29 | |
i | 27 | |
o | 23 | 8.4% |
a | 19 | 6.9% |
n | 18 | 6.6% |
t | 18 | 6.6% |
s | 15 | 5.5% |
c | 15 | 5.5% |
k | 14 | 5.1% |
Other values (14) | 66 |
Uppercase Letter
Value | Count | Frequency (%) |
V | 29 | |
S | 28 | |
M | 18 | 8.0% |
U | 18 | 8.0% |
N | 17 | 7.6% |
G | 16 | 7.1% |
B | 16 | 7.1% |
C | 13 | 5.8% |
P | 9 | 4.0% |
O | 9 | 4.0% |
Other values (11) | 51 |
Other Punctuation
Value | Count | Frequency (%) |
. | 200 | |
, | 87 | |
' | 50 | 11.4% |
" | 40 | 9.1% |
% | 24 | 5.5% |
: | 8 | 1.8% |
· | 8 | 1.8% |
& | 8 | 1.8% |
/ | 5 | 1.1% |
! | 4 | 0.9% |
Other values (2) | 4 | 0.9% |
Decimal Number
Value | Count | Frequency (%) |
0 | 85 | |
1 | 72 | |
2 | 56 | |
3 | 40 | |
8 | 22 | 6.3% |
5 | 21 | 6.0% |
4 | 18 | 5.1% |
9 | 14 | 4.0% |
7 | 13 | 3.7% |
6 | 10 | 2.8% |
Other Symbol
Value | Count | Frequency (%) |
▲ | 7 | |
ⓒ | 7 | |
㎡ | 3 | |
▶ | 2 | 9.5% |
㎞ | 2 | 9.5% |
Math Symbol
Value | Count | Frequency (%) |
< | 10 | |
> | 10 | |
+ | 3 | 12.0% |
~ | 2 | 8.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 46 | |
[ | 16 | 25.4% |
【 | 1 | 1.6% |
Close Punctuation
Value | Count | Frequency (%) |
) | 46 | |
] | 16 | 25.4% |
】 | 1 | 1.6% |
Space Separator
Value | Count | Frequency (%) |
2756 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 84 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 6 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 3 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8562 | |
Common | 3813 | |
Latin | 498 | 3.9% |
Han | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
다 | 231 | 2.7% |
이 | 225 | 2.6% |
을 | 162 | 1.9% |
는 | 161 | 1.9% |
로 | 152 | 1.8% |
에 | 136 | 1.6% |
의 | 136 | 1.6% |
기 | 135 | 1.6% |
지 | 124 | 1.4% |
가 | 115 | 1.3% |
Other values (589) | 6985 |
Latin
Value | Count | Frequency (%) |
r | 30 | 6.0% |
V | 29 | 5.8% |
e | 29 | 5.8% |
S | 28 | 5.6% |
i | 27 | 5.4% |
o | 23 | 4.6% |
a | 19 | 3.8% |
M | 18 | 3.6% |
n | 18 | 3.6% |
U | 18 | 3.6% |
Other values (35) | 259 |
Common
Value | Count | Frequency (%) |
2756 | ||
. | 200 | 5.2% |
, | 87 | 2.3% |
0 | 85 | 2.2% |
- | 84 | 2.2% |
1 | 72 | 1.9% |
2 | 56 | 1.5% |
' | 50 | 1.3% |
( | 46 | 1.2% |
) | 46 | 1.2% |
Other values (32) | 331 | 8.7% |
Han
Value | Count | Frequency (%) |
對 | 1 | |
新 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8562 | |
ASCII | 4273 | |
None | 10 | 0.1% |
Geometric Shapes | 9 | 0.1% |
Enclosed Alphanum | 7 | 0.1% |
Punctuation | 7 | 0.1% |
CJK Compat | 5 | < 0.1% |
CJK | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2756 | ||
. | 200 | 4.7% |
, | 87 | 2.0% |
0 | 85 | 2.0% |
- | 84 | 2.0% |
1 | 72 | 1.7% |
2 | 56 | 1.3% |
' | 50 | 1.2% |
( | 46 | 1.1% |
) | 46 | 1.1% |
Other values (66) | 791 | 18.5% |
Hangul
Value | Count | Frequency (%) |
다 | 231 | 2.7% |
이 | 225 | 2.6% |
을 | 162 | 1.9% |
는 | 161 | 1.9% |
로 | 152 | 1.8% |
에 | 136 | 1.6% |
의 | 136 | 1.6% |
기 | 135 | 1.6% |
지 | 124 | 1.4% |
가 | 115 | 1.3% |
Other values (589) | 6985 |
None
Value | Count | Frequency (%) |
· | 8 | |
【 | 1 | 10.0% |
】 | 1 | 10.0% |
Geometric Shapes
Value | Count | Frequency (%) |
▲ | 7 | |
▶ | 2 | 22.2% |
Enclosed Alphanum
Value | Count | Frequency (%) |
ⓒ | 7 |
Punctuation
Value | Count | Frequency (%) |
’ | 3 | |
‘ | 3 | |
… | 1 | 14.3% |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 3 | |
㎞ | 2 |
CJK
Value | Count | Frequency (%) |
對 | 1 | |
新 | 1 |
MDA_ART_ESSN_NO
Text
MISSING
 
Distinct | 16 |
---|---|
Distinct (%) | 100.0% |
Missing | 176 |
Missing (%) | 91.7% |
Memory size | 1.6 KiB |
Length
Max length | 210 |
---|---|
Median length | 7 |
Mean length | 37.375 |
Min length | 7 |
Characters and Unicode
Total characters | 598 |
---|---|
Distinct characters | 34 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 16 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 4022298 |
---|---|
2nd row | http://img.mbn.co.kr/filewww/news/2019/12/31/15777540505e0a9dc2d9285.jpg,,,,,,,,, |
3rd row | 4023158 |
4th row | http://img.mbn.co.kr/filewww/news/other/2020/01/01/121021909010.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/000001012910.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/110901021202.jpg,,,,,,, |
5th row | 4023174 |
Value | Count | Frequency (%) |
4022298 | 1 | 6.2% |
http://img.mbn.co.kr/filewww/news/2019/12/31/15777540505e0a9dc2d9285.jpg | 1 | 6.2% |
4023158 | 1 | 6.2% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/121021909010.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/000001012910.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/110901021202.jpg | 1 | 6.2% |
4023174 | 1 | 6.2% |
1 | 6.2% | |
4023201 | 1 | 6.2% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/012050025012.jpg | 1 | 6.2% |
4023233 | 1 | 6.2% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/522001053151.jpg | 1 | 6.2% |
Other values (6) | 6 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 70 | 11.7% |
/ | 62 | 10.4% |
, | 54 | 9.0% |
2 | 45 | 7.5% |
1 | 39 | 6.5% |
w | 28 | 4.7% |
. | 28 | 4.7% |
e | 21 | 3.5% |
t | 20 | 3.3% |
4 | 16 | 2.7% |
Other values (24) | 215 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 231 | |
Decimal Number | 216 | |
Other Punctuation | 151 |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
w | 28 | |
e | 21 | 9.1% |
t | 20 | 8.7% |
i | 14 | 6.1% |
m | 14 | 6.1% |
g | 14 | 6.1% |
p | 14 | 6.1% |
n | 14 | 6.1% |
r | 13 | 5.6% |
o | 13 | 5.6% |
Other values (10) | 66 |
Decimal Number
Value | Count | Frequency (%) |
0 | 70 | |
2 | 45 | |
1 | 39 | |
4 | 16 | 7.4% |
3 | 16 | 7.4% |
5 | 11 | 5.1% |
9 | 10 | 4.6% |
7 | 5 | 2.3% |
8 | 3 | 1.4% |
6 | 1 | 0.5% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 62 | |
, | 54 | |
. | 28 | |
: | 7 | 4.6% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 367 | |
Latin | 231 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
w | 28 | |
e | 21 | 9.1% |
t | 20 | 8.7% |
i | 14 | 6.1% |
m | 14 | 6.1% |
g | 14 | 6.1% |
p | 14 | 6.1% |
n | 14 | 6.1% |
r | 13 | 5.6% |
o | 13 | 5.6% |
Other values (10) | 66 |
Common
Value | Count | Frequency (%) |
0 | 70 | |
/ | 62 | |
, | 54 | |
2 | 45 | |
1 | 39 | |
. | 28 | 7.6% |
4 | 16 | 4.4% |
3 | 16 | 4.4% |
5 | 11 | 3.0% |
9 | 10 | 2.7% |
Other values (4) | 16 | 4.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 598 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 70 | 11.7% |
/ | 62 | 10.4% |
, | 54 | 9.0% |
2 | 45 | 7.5% |
1 | 39 | 6.5% |
w | 28 | 4.7% |
. | 28 | 4.7% |
e | 21 | 3.5% |
t | 20 | 3.3% |
4 | 16 | 2.7% |
Other values (24) | 215 |
MDA_CGR_NM
Text
MISSING
 
Distinct | 9 |
---|---|
Distinct (%) | 50.0% |
Missing | 174 |
Missing (%) | 90.6% |
Memory size | 1.6 KiB |
Value | Count | Frequency (%) |
mbn00003 | 10 | |
최기성 | 1 | 5.6% |
김연주 | 1 | 5.6% |
김태성 | 1 | 5.6% |
이호승 | 1 | 5.6% |
정슬기 | 1 | 5.6% |
임성현 | 1 | 5.6% |
강계만 | 1 | 5.6% |
서영수 | 1 | 5.6% |
Most occurring characters
Value | Count | Frequency (%) |
0 | 40 | |
m | 10 | 9.6% |
n | 10 | 9.6% |
3 | 10 | 9.6% |
b | 10 | 9.6% |
성 | 3 | 2.9% |
기 | 2 | 1.9% |
김 | 2 | 1.9% |
슬 | 1 | 1.0% |
영 | 1 | 1.0% |
Other values (15) | 15 | 14.4% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 50 | |
Lowercase Letter | 30 | |
Other Letter | 24 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
성 | 3 | 12.5% |
기 | 2 | 8.3% |
김 | 2 | 8.3% |
슬 | 1 | 4.2% |
영 | 1 | 4.2% |
서 | 1 | 4.2% |
만 | 1 | 4.2% |
계 | 1 | 4.2% |
강 | 1 | 4.2% |
현 | 1 | 4.2% |
Other values (10) | 10 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 10 | |
n | 10 | |
b | 10 |
Decimal Number
Value | Count | Frequency (%) |
0 | 40 | |
3 | 10 | 20.0% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 50 | |
Latin | 30 | |
Hangul | 24 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
성 | 3 | 12.5% |
기 | 2 | 8.3% |
김 | 2 | 8.3% |
슬 | 1 | 4.2% |
영 | 1 | 4.2% |
서 | 1 | 4.2% |
만 | 1 | 4.2% |
계 | 1 | 4.2% |
강 | 1 | 4.2% |
현 | 1 | 4.2% |
Other values (10) | 10 |
Latin
Value | Count | Frequency (%) |
m | 10 | |
n | 10 | |
b | 10 |
Common
Value | Count | Frequency (%) |
0 | 40 | |
3 | 10 | 20.0% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 80 | |
Hangul | 24 | 23.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 40 | |
m | 10 | 12.5% |
n | 10 | 12.5% |
3 | 10 | 12.5% |
b | 10 | 12.5% |
Hangul
Value | Count | Frequency (%) |
성 | 3 | 12.5% |
기 | 2 | 8.3% |
김 | 2 | 8.3% |
슬 | 1 | 4.2% |
영 | 1 | 4.2% |
서 | 1 | 4.2% |
만 | 1 | 4.2% |
계 | 1 | 4.2% |
강 | 1 | 4.2% |
현 | 1 | 4.2% |
Other values (10) | 10 |
STD_YEAR
Real number (ℝ)
MISSING
 
Distinct | 11 |
---|---|
Distinct (%) | 55.0% |
Missing | 172 |
Missing (%) | 89.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.0100051 × 1013 |
Minimum | 2020 |
---|---|
Maximum | 2.0200102 × 1013 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.8 KiB |
Quantile statistics
Minimum | 2020 |
---|---|
5-th percentile | 2020 |
Q1 | 2020 |
median | 1.0100051 × 1013 |
Q3 | 2.0200101 × 1013 |
95-th percentile | 2.0200101 × 1013 |
Maximum | 2.0200102 × 1013 |
Range | 2.0200102 × 1013 |
Interquartile range (IQR) | 2.0200101 × 1013 |
Descriptive statistics
Standard deviation | 1.0362433 × 1013 |
---|---|
Coefficient of variation (CV) | 1.0259784 |
Kurtosis | -2.2352941 |
Mean | 1.0100051 × 1013 |
Median Absolute Deviation (MAD) | 1.0100051 × 1013 |
Skewness | 1.1674698 × 10-15 |
Sum | 2.0200101 × 1014 |
Variance | 1.0738002 × 1026 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2020 | 10 | 5.2% |
20200102090022 | 1 | 0.5% |
20200101090112 | 1 | 0.5% |
20200101094041 | 1 | 0.5% |
20200101101944 | 1 | 0.5% |
20200101111043 | 1 | 0.5% |
20200101133232 | 1 | 0.5% |
20200101141032 | 1 | 0.5% |
20200101161233 | 1 | 0.5% |
20200101164234 | 1 | 0.5% |
(Missing) | 172 |
Value | Count | Frequency (%) |
2020 | 10 | |
20200101090112 | 1 | 0.5% |
20200101094041 | 1 | 0.5% |
20200101101944 | 1 | 0.5% |
20200101111043 | 1 | 0.5% |
20200101133232 | 1 | 0.5% |
20200101141032 | 1 | 0.5% |
20200101161233 | 1 | 0.5% |
20200101164234 | 1 | 0.5% |
20200101193035 | 1 | 0.5% |
Value | Count | Frequency (%) |
20200102090022 | 1 | |
20200101193035 | 1 | |
20200101164234 | 1 | |
20200101161233 | 1 | |
20200101141032 | 1 | |
20200101133232 | 1 | |
20200101111043 | 1 | |
20200101101944 | 1 | |
20200101094041 | 1 | |
20200101090112 | 1 |
ART_SJ_CN
Text
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 100.0% |
Missing | 182 |
Missing (%) | 94.8% |
Memory size | 1.6 KiB |
Length
Max length | 34 |
---|---|
Median length | 31.5 |
Mean length | 28.5 |
Min length | 15 |
Characters and Unicode
Total characters | 285 |
---|---|
Distinct characters | 146 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | ‘남수원 이지더원’ 수원 생활인프라 공유, 마지막 조합원 모집 |
---|---|
2nd row | 새해 첫날 `베일 벗은` 제네시스 GV80, 1월 출시 확정 |
3rd row | 작년 수출 금융위기후 10년만에 첫 두자릿수 하락…10.3%↓ |
4th row | [단독] 자연출산률 0%에도···정부 콘트롤타워는 마비중 |
5th row | 극한배달전쟁에…이마트24도 요기요와 배달서비스 |
Value | Count | Frequency (%) |
출시 | 2 | 3.2% |
항변 | 1 | 1.6% |
흰쥐의 | 1 | 1.6% |
해 | 1 | 1.6% |
맞아 | 1 | 1.6% |
해피치즈 | 1 | 1.6% |
화이트모카 | 1 | 1.6% |
당뇨병 | 1 | 1.6% |
관리기기 | 1 | 1.6% |
구입도 | 1 | 1.6% |
Other values (52) | 52 |
Most occurring characters
Value | Count | Frequency (%) |
53 | 18.6% | |
0 | 6 | 2.1% |
원 | 5 | 1.8% |
기 | 5 | 1.8% |
자 | 5 | 1.8% |
도 | 4 | 1.4% |
시 | 4 | 1.4% |
1 | 4 | 1.4% |
출 | 4 | 1.4% |
년 | 4 | 1.4% |
Other values (136) | 191 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 191 | |
Space Separator | 53 | 18.6% |
Decimal Number | 18 | 6.3% |
Other Punctuation | 14 | 4.9% |
Modifier Symbol | 2 | 0.7% |
Uppercase Letter | 2 | 0.7% |
Initial Punctuation | 1 | 0.4% |
Final Punctuation | 1 | 0.4% |
Close Punctuation | 1 | 0.4% |
Open Punctuation | 1 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
원 | 5 | 2.6% |
기 | 5 | 2.6% |
자 | 5 | 2.6% |
도 | 4 | 2.1% |
시 | 4 | 2.1% |
출 | 4 | 2.1% |
년 | 4 | 2.1% |
해 | 4 | 2.1% |
스 | 4 | 2.1% |
전 | 4 | 2.1% |
Other values (113) | 148 |
Decimal Number
Value | Count | Frequency (%) |
0 | 6 | |
1 | 4 | |
2 | 3 | |
9 | 1 | 5.6% |
6 | 1 | 5.6% |
4 | 1 | 5.6% |
8 | 1 | 5.6% |
3 | 1 | 5.6% |
Other Punctuation
Value | Count | Frequency (%) |
· | 3 | |
, | 3 | |
… | 3 | |
% | 2 | |
' | 2 | |
. | 1 | 7.1% |
Uppercase Letter
Value | Count | Frequency (%) |
V | 1 | |
G | 1 |
Space Separator
Value | Count | Frequency (%) |
53 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 2 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 |
Close Punctuation
Value | Count | Frequency (%) |
] | 1 |
Open Punctuation
Value | Count | Frequency (%) |
[ | 1 |
Math Symbol
Value | Count | Frequency (%) |
↓ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 191 | |
Common | 92 | |
Latin | 2 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
원 | 5 | 2.6% |
기 | 5 | 2.6% |
자 | 5 | 2.6% |
도 | 4 | 2.1% |
시 | 4 | 2.1% |
출 | 4 | 2.1% |
년 | 4 | 2.1% |
해 | 4 | 2.1% |
스 | 4 | 2.1% |
전 | 4 | 2.1% |
Other values (113) | 148 |
Common
Value | Count | Frequency (%) |
53 | ||
0 | 6 | 6.5% |
1 | 4 | 4.3% |
· | 3 | 3.3% |
, | 3 | 3.3% |
… | 3 | 3.3% |
2 | 3 | 3.3% |
% | 2 | 2.2% |
` | 2 | 2.2% |
' | 2 | 2.2% |
Other values (11) | 11 | 12.0% |
Latin
Value | Count | Frequency (%) |
V | 1 | |
G | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 191 | |
ASCII | 85 | |
Punctuation | 5 | 1.8% |
None | 3 | 1.1% |
Arrows | 1 | 0.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
53 | ||
0 | 6 | 7.1% |
1 | 4 | 4.7% |
, | 3 | 3.5% |
2 | 3 | 3.5% |
% | 2 | 2.4% |
` | 2 | 2.4% |
' | 2 | 2.4% |
9 | 1 | 1.2% |
6 | 1 | 1.2% |
Other values (8) | 8 | 9.4% |
Hangul
Value | Count | Frequency (%) |
원 | 5 | 2.6% |
기 | 5 | 2.6% |
자 | 5 | 2.6% |
도 | 4 | 2.1% |
시 | 4 | 2.1% |
출 | 4 | 2.1% |
년 | 4 | 2.1% |
해 | 4 | 2.1% |
스 | 4 | 2.1% |
전 | 4 | 2.1% |
Other values (113) | 148 |
None
Value | Count | Frequency (%) |
· | 3 |
Punctuation
Value | Count | Frequency (%) |
… | 3 | |
‘ | 1 | 20.0% |
’ | 1 | 20.0% |
Arrows
Value | Count | Frequency (%) |
↓ | 1 |
ART_CN
Text
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 100.0% |
Missing | 182 |
Missing (%) | 94.8% |
Memory size | 1.6 KiB |
Length
Max length | 205 |
---|---|
Median length | 72.5 |
Mean length | 85.4 |
Min length | 8 |
Characters and Unicode
Total characters | 854 |
---|---|
Distinct characters | 237 |
Distinct categories | 10 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | <!------------ PHOTO_POS_0 ------------> |
---|---|
2nd row | <!------------ PHOTO_POS_0 ------------>지난해 하반기부터 국내 자동차 시장의 핫이슈로 떠오른 제네시스 GV80이 마침내 새해 첫달 출시된다. |
3rd row | 2019년 수출이 10년 만에 두 자릿수의 하락세를 보였습니다. |
4th row | <!------------ PHOTO_POS_0 ------------> 지난 10월 자연출산률이 0까지 떨어지면서 인구 '데드크로스'가 코 앞으로 닥쳤다. 그러나 '인구재앙'이라 할 만한 위기상황에서 인구정책의 컨트롤타워인 저출산고령사회 위원회는 사실상 개점휴업 상태다. 총책임자인 부위원장이 3개월째 공석인데다, 대면회의는 단 한번도 열지 않은 것으로 알려졌다. |
5th row | <!------------ PHOTO_POS_0 ------------> 편의점 이마트24가 배달앱 '요기요'와 손잡고 편의점 상품을 배달하는 서비스를 시작한다고 1일 밝혔다. |
Value | Count | Frequency (%) |
9 | 5.7% | |
photo_pos_0 | 5 | 3.2% |
새해 | 2 | 1.3% |
최대 | 2 | 1.3% |
편의점 | 2 | 1.3% |
관리기기를 | 1 | 0.6% |
당뇨병 | 1 | 0.6% |
환자가 | 1 | 0.6% |
당뇨 | 1 | 0.6% |
소아당뇨(제1형 | 1 | 0.6% |
Other values (133) | 133 |
Most occurring characters
Value | Count | Frequency (%) |
150 | 17.6% | |
- | 120 | 14.1% |
이 | 15 | 1.8% |
O | 15 | 1.8% |
0 | 14 | 1.6% |
다 | 13 | 1.5% |
인 | 12 | 1.4% |
. | 11 | 1.3% |
의 | 11 | 1.3% |
_ | 10 | 1.2% |
Other values (227) | 483 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 446 | |
Space Separator | 150 | 17.6% |
Dash Punctuation | 120 | 14.1% |
Uppercase Letter | 46 | 5.4% |
Decimal Number | 34 | 4.0% |
Other Punctuation | 30 | 3.5% |
Connector Punctuation | 10 | 1.2% |
Math Symbol | 10 | 1.2% |
Close Punctuation | 4 | 0.5% |
Open Punctuation | 4 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 15 | 3.4% |
다 | 13 | 2.9% |
인 | 12 | 2.7% |
의 | 11 | 2.5% |
해 | 8 | 1.8% |
기 | 7 | 1.6% |
자 | 7 | 1.6% |
한 | 7 | 1.6% |
로 | 7 | 1.6% |
지 | 6 | 1.3% |
Other values (194) | 353 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 15 | |
P | 10 | |
T | 5 | 10.9% |
H | 5 | 10.9% |
S | 5 | 10.9% |
M | 2 | 4.3% |
G | 2 | 4.3% |
D | 1 | 2.2% |
V | 1 | 2.2% |
Decimal Number
Value | Count | Frequency (%) |
0 | 14 | |
1 | 6 | |
2 | 5 | 14.7% |
6 | 2 | 5.9% |
5 | 2 | 5.9% |
3 | 2 | 5.9% |
8 | 1 | 2.9% |
9 | 1 | 2.9% |
4 | 1 | 2.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 11 | |
' | 8 | |
! | 5 | |
, | 3 | 10.0% |
" | 2 | 6.7% |
% | 1 | 3.3% |
Math Symbol
Value | Count | Frequency (%) |
< | 5 | |
> | 5 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 | |
】 | 1 | 25.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 | |
【 | 1 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
150 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 120 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 443 | |
Common | 362 | |
Latin | 46 | 5.4% |
Han | 3 | 0.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 15 | 3.4% |
다 | 13 | 2.9% |
인 | 12 | 2.7% |
의 | 11 | 2.5% |
해 | 8 | 1.8% |
기 | 7 | 1.6% |
자 | 7 | 1.6% |
한 | 7 | 1.6% |
로 | 7 | 1.6% |
지 | 6 | 1.4% |
Other values (191) | 350 |
Common
Value | Count | Frequency (%) |
150 | ||
- | 120 | |
0 | 14 | 3.9% |
. | 11 | 3.0% |
_ | 10 | 2.8% |
' | 8 | 2.2% |
1 | 6 | 1.7% |
2 | 5 | 1.4% |
! | 5 | 1.4% |
< | 5 | 1.4% |
Other values (14) | 28 | 7.7% |
Latin
Value | Count | Frequency (%) |
O | 15 | |
P | 10 | |
T | 5 | 10.9% |
H | 5 | 10.9% |
S | 5 | 10.9% |
M | 2 | 4.3% |
G | 2 | 4.3% |
D | 1 | 2.2% |
V | 1 | 2.2% |
Han
Value | Count | Frequency (%) |
子 | 1 | |
年 | 1 | |
庚 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 443 | |
ASCII | 406 | |
CJK | 3 | 0.4% |
None | 2 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
150 | ||
- | 120 | |
O | 15 | 3.7% |
0 | 14 | 3.4% |
. | 11 | 2.7% |
_ | 10 | 2.5% |
P | 10 | 2.5% |
' | 8 | 2.0% |
1 | 6 | 1.5% |
2 | 5 | 1.2% |
Other values (21) | 57 | 14.0% |
Hangul
Value | Count | Frequency (%) |
이 | 15 | 3.4% |
다 | 13 | 2.9% |
인 | 12 | 2.7% |
의 | 11 | 2.5% |
해 | 8 | 1.8% |
기 | 7 | 1.6% |
자 | 7 | 1.6% |
한 | 7 | 1.6% |
로 | 7 | 1.6% |
지 | 6 | 1.4% |
Other values (191) | 350 |
None
Value | Count | Frequency (%) |
【 | 1 | |
】 | 1 |
CJK
Value | Count | Frequency (%) |
子 | 1 | |
年 | 1 | |
庚 | 1 |
ATCH_IMG_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 192 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.8 KiB |
JRNL_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 192 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.8 KiB |
WRT_DATE
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 192 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.8 KiB |
Unnamed: 9
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 192 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.8 KiB |
MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | |
---|---|---|---|---|---|
MDA_ART_ESSN_NO | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
MDA_CGR_NM | 1.000 | 1.000 | NaN | NaN | NaN |
STD_YEAR | NaN | NaN | 1.000 | NaN | NaN |
ART_SJ_CN | 1.000 | NaN | NaN | 1.000 | 1.000 |
ART_CN | 1.000 | NaN | NaN | 1.000 | 1.000 |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | MBN | 4022298 | mbn00003 | 2020 | ‘남수원 이지더원’ 수원 생활인프라 공유, 마지막 조합원 모집 | <!------------ PHOTO_POS_0 ------------> | <NA> | <NA> | <NA> | <NA> |
2 | 수도권 남부 중 수원시는 교통의 요충지이자 도청이 자리한 도시로 발전 중입니다. 수원을 중심으로 화성, 오산, 평택 등 신도시의 개발과 신규 아파트가 들어서면서 역세권을 중심으로 희소성이 있습니다. 수원역과 고색역을 동시에 누리며 주변 시세 대비 저렴한 공급가로 실거주자의 인기가 높은 ‘남수원 이지더원’이 막바지 특별 모집 중입니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | ‘남수원 이지더원’은 경기도 화성시 배양동 일대로 총 1014세대의 대단지로 조성됩니다. 선호도 높은 중소형 평형위주로 전용면적 59㎡, 69㎡, 84㎡로 선택의 폭이 넓습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | 전 세대 남향위주의 배치와 3천여평의 공원을 조성해 일조량 및 채광이 우수합니다. 테마정원, 어린이놀이터, 주민운동시설 등 입주민을 위한 힐링 라이프를 선사합니다. 드레스룸, 알파룸, 현관수납장 등 수납공간을 넓히고 일부 타입의 경우 1+1 세대분리형으로 2세대가 거주가능합니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | 북카페, 사우나, 피트니스센터, 배드민턴&탁구 등 다양한 커뮤니티시설을 도입합니다. 남수원 골프장 조망권과 숲세권을 누릴 수 있습니다. 황구지천 수변공원을 도보로 이용가능하며 단지 내 다양한 어린이놀이터, 산책로, 작은공원 등 설계했습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
182 | 지난 2018년 3월에도 삼성전자 평택 반도체 공장에서 20여 분간 정전이 발생해 500억 원가량의 피해가 나기도 했습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
183 | 다만, 이번 사고는 정전 시간이 지난번보다 짧고 바로 복구해 피해가 크지 않을 것으로 보입니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
184 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
185 | 업계에서는 생산라인의 완전 복구까지는 2~3일 정도가 걸릴 것으로 보고 있습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
186 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
187 | MBN뉴스 서영수입니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
188 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
189 | 영상취재 : 배완호 기자 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
190 | 영상편집 : 이재형 | <NA> | 서영수 | 20200101193035 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
191 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 50 |