Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 97 |
Missing cells | 735 |
Missing cells (%) | 75.8% |
Duplicate rows | 7 |
Duplicate rows (%) | 7.2% |
Total size in memory | 8.2 KiB |
Average record size in memory | 86.4 B |
Variable types
Text | 4 |
---|---|
Categorical | 1 |
Numeric | 1 |
Unsupported | 4 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | MBN |
URL | https://kdx.kr/data/view/26945 |
Dataset has 7 (7.2%) duplicate rows | Duplicates |
STD_YEAR is highly overall correlated with MDA_CGR_NM | High correlation |
MDA_CGR_NM is highly overall correlated with STD_YEAR | High correlation |
MDA_CGR_NM is highly imbalanced (58.3%) | Imbalance |
MBN_MDA_SP_CD has 19 (19.6%) missing values | Missing |
MDA_ART_ESSN_NO has 77 (79.4%) missing values | Missing |
STD_YEAR has 77 (79.4%) missing values | Missing |
ART_SJ_CN has 87 (89.7%) missing values | Missing |
ART_CN has 87 (89.7%) missing values | Missing |
ATCH_IMG_NM has 97 (100.0%) missing values | Missing |
JRNL_NM has 97 (100.0%) missing values | Missing |
WRT_DATE has 97 (100.0%) missing values | Missing |
Unnamed: 9 has 97 (100.0%) missing values | Missing |
ATCH_IMG_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
JRNL_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
WRT_DATE is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 20:37:18.111985 |
---|---|
Analysis finished | 2023-12-11 20:37:19.973009 |
Duration | 1.86 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
MBN_MDA_SP_CD
Text
MISSING
 
Distinct | 58 |
---|---|
Distinct (%) | 74.4% |
Missing | 19 |
Missing (%) | 19.6% |
Memory size | 908.0 B |
Length
Max length | 206 |
---|---|
Median length | 103 |
Mean length | 72.666667 |
Min length | 3 |
Characters and Unicode
Total characters | 5668 |
---|---|
Distinct characters | 495 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 48 ? |
---|---|
Unique (%) | 61.5% |
Sample
1st row | MBN |
---|---|
2nd row | 'VIP' 이상윤과 '의사요한' 이세영이 ‘2019 SBS 연기대상’에서 미니시리즈 부문 우수 연기상을 수상했다. |
3rd row | 31일 오후 8시 55분 서울시 마포구 상암동 SBS프리즘타워에서는 신동엽, 장나라의 진행으로 ‘2019 SBS 연기대상’ 시상식이 열렸다. |
4th row | 이날 이상윤은 "촬영을 하면서도, 방송을 할 때도 신기한 경험을 많이 해서 그것 만으로도 감사한 작품이었다. 저 때문에 화가 나신 시청자분들께 죄송하고, 작품을 하면서 바람은 피지 말아야겠다는 생각을 하게 됐다"라고 말해 웃음을 자아냈다. 이어 "다른 결의 인물을 연기할 수 있게 해주신 감독님, 작가님에게도 감사하고, 함께 촬영을 한 배우들에게 고맙다"라고 덧붙였다. |
5th row | 이어 이세영은 "너무 큰 상 주셔서 감사하고, 부끄럽다. 현장에 갈 때마다 제가 밥값을 잘하고 있는지 힘들었는데 감독님, 배우들이 이끌어줘서 잘 마칠 수 있었다. 더운 여름에 더 덥게 고생하신 스태프분들 고생 많으셨고, 함께할 수 있어서 행복한 시간이었다"라고 울컥하는 모습을 보였다. |
Value | Count | Frequency (%) |
‘2019 | 16 | 1.3% |
sbs | 14 | 1.1% |
mbn | 12 | 1.0% |
31일 | 10 | 0.8% |
kbs | 9 | 0.7% |
매일경제 | 8 | 0.6% |
수 | 8 | 0.6% |
7 | 0.6% | |
연기대상’에서 | 7 | 0.6% |
오후 | 7 | 0.6% |
Other values (782) | 1133 |
Most occurring characters
Value | Count | Frequency (%) |
1181 | 20.8% | |
다 | 146 | 2.6% |
. | 122 | 2.2% |
이 | 115 | 2.0% |
, | 70 | 1.2% |
서 | 68 | 1.2% |
에 | 67 | 1.2% |
하 | 64 | 1.1% |
고 | 62 | 1.1% |
을 | 59 | 1.0% |
Other values (485) | 3714 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3608 | |
Space Separator | 1181 | 20.8% |
Other Punctuation | 263 | 4.6% |
Uppercase Letter | 155 | 2.7% |
Decimal Number | 137 | 2.4% |
Lowercase Letter | 135 | 2.4% |
Final Punctuation | 78 | 1.4% |
Initial Punctuation | 78 | 1.4% |
Dash Punctuation | 10 | 0.2% |
Open Punctuation | 10 | 0.2% |
Other values (2) | 13 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
다 | 146 | 4.0% |
이 | 115 | 3.2% |
서 | 68 | 1.9% |
에 | 67 | 1.9% |
하 | 64 | 1.8% |
고 | 62 | 1.7% |
을 | 59 | 1.6% |
는 | 58 | 1.6% |
상 | 55 | 1.5% |
가 | 54 | 1.5% |
Other values (430) | 2860 |
Lowercase Letter
Value | Count | Frequency (%) |
k | 26 | |
m | 17 | |
r | 16 | |
c | 16 | |
o | 11 | |
u | 10 | 7.4% |
t | 7 | 5.2% |
e | 6 | 4.4% |
l | 5 | 3.7% |
s | 4 | 3.0% |
Other values (7) | 17 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 47 | |
B | 44 | |
M | 16 | 10.3% |
N | 15 | 9.7% |
K | 9 | 5.8% |
V | 7 | 4.5% |
I | 6 | 3.9% |
P | 6 | 3.9% |
E | 2 | 1.3% |
T | 1 | 0.6% |
Other values (2) | 2 | 1.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 40 | |
2 | 23 | |
0 | 19 | |
9 | 18 | |
3 | 15 | 10.9% |
8 | 8 | 5.8% |
4 | 7 | 5.1% |
5 | 6 | 4.4% |
7 | 1 | 0.7% |
Other Punctuation
Value | Count | Frequency (%) |
. | 122 | |
, | 70 | |
' | 38 | 14.4% |
" | 22 | 8.4% |
@ | 8 | 3.0% |
& | 3 | 1.1% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 57 | |
” | 21 | 26.9% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 57 | |
“ | 21 | 26.9% |
Open Punctuation
Value | Count | Frequency (%) |
[ | 8 | |
( | 2 | 20.0% |
Close Punctuation
Value | Count | Frequency (%) |
] | 8 | |
) | 2 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
1181 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10 |
Other Symbol
Value | Count | Frequency (%) |
ⓒ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3608 | |
Common | 1770 | |
Latin | 290 | 5.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
다 | 146 | 4.0% |
이 | 115 | 3.2% |
서 | 68 | 1.9% |
에 | 67 | 1.9% |
하 | 64 | 1.8% |
고 | 62 | 1.7% |
을 | 59 | 1.6% |
는 | 58 | 1.6% |
상 | 55 | 1.5% |
가 | 54 | 1.5% |
Other values (430) | 2860 |
Latin
Value | Count | Frequency (%) |
S | 47 | |
B | 44 | |
k | 26 | 9.0% |
m | 17 | 5.9% |
M | 16 | 5.5% |
r | 16 | 5.5% |
c | 16 | 5.5% |
N | 15 | 5.2% |
o | 11 | 3.8% |
u | 10 | 3.4% |
Other values (19) | 72 |
Common
Value | Count | Frequency (%) |
1181 | ||
. | 122 | 6.9% |
, | 70 | 4.0% |
’ | 57 | 3.2% |
‘ | 57 | 3.2% |
1 | 40 | 2.3% |
' | 38 | 2.1% |
2 | 23 | 1.3% |
" | 22 | 1.2% |
“ | 21 | 1.2% |
Other values (16) | 139 | 7.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3608 | |
ASCII | 1901 | |
Punctuation | 156 | 2.8% |
Enclosed Alphanum | 3 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1181 | ||
. | 122 | 6.4% |
, | 70 | 3.7% |
S | 47 | 2.5% |
B | 44 | 2.3% |
1 | 40 | 2.1% |
' | 38 | 2.0% |
k | 26 | 1.4% |
2 | 23 | 1.2% |
" | 22 | 1.2% |
Other values (40) | 288 | 15.1% |
Hangul
Value | Count | Frequency (%) |
다 | 146 | 4.0% |
이 | 115 | 3.2% |
서 | 68 | 1.9% |
에 | 67 | 1.9% |
하 | 64 | 1.8% |
고 | 62 | 1.7% |
을 | 59 | 1.6% |
는 | 58 | 1.6% |
상 | 55 | 1.5% |
가 | 54 | 1.5% |
Other values (430) | 2860 |
Punctuation
Value | Count | Frequency (%) |
’ | 57 | |
‘ | 57 | |
“ | 21 | 13.5% |
” | 21 | 13.5% |
Enclosed Alphanum
Value | Count | Frequency (%) |
ⓒ | 3 |
MDA_ART_ESSN_NO
Text
MISSING
 
Distinct | 20 |
---|---|
Distinct (%) | 100.0% |
Missing | 77 |
Missing (%) | 79.4% |
Memory size | 908.0 B |
Length
Max length | 76 |
---|---|
Median length | 41.5 |
Mean length | 41.5 |
Min length | 7 |
Characters and Unicode
Total characters | 830 |
---|---|
Distinct characters | 35 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 20 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 4023071 |
---|---|
2nd row | http://img.mbn.co.kr/filewww/news/other/2020/01/01/010101000010.jpg,,,,,,,,, |
3rd row | 4023072 |
4th row | http://img.mbn.co.kr/filewww/news/other/2020/01/01/112200001100.jpg,,,,,,,,, |
5th row | 4023073 |
Value | Count | Frequency (%) |
4023071 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/010101000010.jpg | 1 | 5.0% |
4023081 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/000922022211.jpg | 1 | 5.0% |
4023080 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/300020000003.jpg | 1 | 5.0% |
4023079 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/121000001111.jpg | 1 | 5.0% |
4023078 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/100212000010.jpg | 1 | 5.0% |
Other values (10) | 10 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 125 | |
/ | 90 | 10.8% |
, | 90 | 10.8% |
2 | 49 | 5.9% |
1 | 49 | 5.9% |
w | 40 | 4.8% |
. | 40 | 4.8% |
e | 30 | 3.6% |
t | 30 | 3.6% |
m | 20 | 2.4% |
Other values (25) | 267 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 327 | |
Decimal Number | 270 | |
Other Punctuation | 230 | |
Uppercase Letter | 3 | 0.4% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
w | 40 | |
e | 30 | 9.2% |
t | 30 | 9.2% |
m | 20 | 6.1% |
o | 20 | 6.1% |
n | 20 | 6.1% |
r | 20 | 6.1% |
i | 20 | 6.1% |
h | 20 | 6.1% |
g | 19 | 5.8% |
Other values (8) | 88 |
Decimal Number
Value | Count | Frequency (%) |
0 | 125 | |
2 | 49 | 18.1% |
1 | 49 | 18.1% |
3 | 15 | 5.6% |
4 | 12 | 4.4% |
7 | 8 | 3.0% |
9 | 7 | 2.6% |
8 | 3 | 1.1% |
5 | 1 | 0.4% |
6 | 1 | 0.4% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 90 | |
, | 90 | |
. | 40 | |
: | 10 | 4.3% |
Uppercase Letter
Value | Count | Frequency (%) |
J | 1 | |
P | 1 | |
G | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 500 | |
Latin | 330 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
w | 40 | |
e | 30 | 9.1% |
t | 30 | 9.1% |
m | 20 | 6.1% |
o | 20 | 6.1% |
n | 20 | 6.1% |
r | 20 | 6.1% |
i | 20 | 6.1% |
h | 20 | 6.1% |
g | 19 | 5.8% |
Other values (11) | 91 |
Common
Value | Count | Frequency (%) |
0 | 125 | |
/ | 90 | |
, | 90 | |
2 | 49 | 9.8% |
1 | 49 | 9.8% |
. | 40 | 8.0% |
3 | 15 | 3.0% |
4 | 12 | 2.4% |
: | 10 | 2.0% |
7 | 8 | 1.6% |
Other values (4) | 12 | 2.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 830 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 125 | |
/ | 90 | 10.8% |
, | 90 | 10.8% |
2 | 49 | 5.9% |
1 | 49 | 5.9% |
w | 40 | 4.8% |
. | 40 | 4.8% |
e | 30 | 3.6% |
t | 30 | 3.6% |
m | 20 | 2.4% |
Other values (25) | 267 |
MDA_CGR_NM
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 7.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 908.0 B |
<NA> | |
---|---|
mbn00012 | |
양소영 | 3 |
이다겸 | 2 |
서지경 | 2 |
Other values (2) | 3 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.3092784 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | <NA> |
---|---|
2nd row | mbn00012 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 77 | |
mbn00012 | 10 | 10.3% |
양소영 | 3 | 3.1% |
이다겸 | 2 | 2.1% |
서지경 | 2 | 2.1% |
안하나 | 2 | 2.1% |
신미래 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 77 | |
mbn00012 | 10 | 10.3% |
양소영 | 3 | 3.1% |
이다겸 | 2 | 2.1% |
서지경 | 2 | 2.1% |
안하나 | 2 | 2.1% |
신미래 | 1 | 1.0% |
STD_YEAR
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 9 |
---|---|
Distinct (%) | 45.0% |
Missing | 77 |
Missing (%) | 79.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.0100051 × 1013 |
Minimum | 2020 |
---|---|
Maximum | 2.0200101 × 1013 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1005.0 B |
Quantile statistics
Minimum | 2020 |
---|---|
5-th percentile | 2020 |
Q1 | 2020 |
median | 1.0100051 × 1013 |
Q3 | 2.0200101 × 1013 |
95-th percentile | 2.0200101 × 1013 |
Maximum | 2.0200101 × 1013 |
Range | 2.0200101 × 1013 |
Interquartile range (IQR) | 2.0200101 × 1013 |
Descriptive statistics
Standard deviation | 1.0362433 × 1013 |
---|---|
Coefficient of variation (CV) | 1.0259784 |
Kurtosis | -2.2352941 |
Mean | 1.0100051 × 1013 |
Median Absolute Deviation (MAD) | 1.010005 × 1013 |
Skewness | 1.5883943 × 10-17 |
Sum | 2.0200101 × 1014 |
Variance | 1.0738002 × 1026 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2020 | 10 | 10.3% |
20200101000138 | 2 | 2.1% |
20200101001137 | 2 | 2.1% |
20200101000207 | 1 | 1.0% |
20200101000237 | 1 | 1.0% |
20200101000639 | 1 | 1.0% |
20200101000708 | 1 | 1.0% |
20200101001307 | 1 | 1.0% |
20200101001437 | 1 | 1.0% |
(Missing) | 77 |
Value | Count | Frequency (%) |
2020 | 10 | |
20200101000138 | 2 | 2.1% |
20200101000207 | 1 | 1.0% |
20200101000237 | 1 | 1.0% |
20200101000639 | 1 | 1.0% |
20200101000708 | 1 | 1.0% |
20200101001137 | 2 | 2.1% |
20200101001307 | 1 | 1.0% |
20200101001437 | 1 | 1.0% |
Value | Count | Frequency (%) |
20200101001437 | 1 | 1.0% |
20200101001307 | 1 | 1.0% |
20200101001137 | 2 | 2.1% |
20200101000708 | 1 | 1.0% |
20200101000639 | 1 | 1.0% |
20200101000237 | 1 | 1.0% |
20200101000207 | 1 | 1.0% |
20200101000138 | 2 | 2.1% |
2020 | 10 |
ART_SJ_CN
Text
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 100.0% |
Missing | 87 |
Missing (%) | 89.7% |
Memory size | 908.0 B |
Length
Max length | 52 |
---|---|
Median length | 42 |
Mean length | 36.4 |
Min length | 16 |
Characters and Unicode
Total characters | 364 |
---|---|
Distinct characters | 141 |
Distinct categories | 13 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 이상윤X이세영, 미니시리즈 우수연기상 “밥값 하는지 몰라 힘들었다”[2019 SBS 연기대상] |
---|---|
2nd row | 김성균X한예리, 중편드라마 우수연기상 “심장 터질 것 같아”[2019 SBS 연기대상] |
3rd row | 김명수 김세정, 한류스타상 "한류스타들 아프지 않고 건강하길"[KBS 연기대상] |
4th row | 신혜선 "강하늘, 동기의 자랑…얼굴 찌푸린 걸 본 적 없다"[KBS 연기대상] |
5th row | `보이스퀸-스페셜` 3라운드 조2위 늴리리맘마...눈물바다 만든 진한 여운 |
Value | Count | Frequency (%) |
연기대상 | 5 | 7.4% |
보이스퀸-스페셜 | 2 | 2.9% |
우수연기상 | 2 | 2.9% |
3라운드 | 2 | 2.9% |
sbs | 2 | 2.9% |
1위 | 1 | 1.5% |
펭수 | 1 | 1.5% |
무대 | 1 | 1.5% |
판소리 | 1 | 1.5% |
소리퀸즈...압도적인 | 1 | 1.5% |
Other values (50) | 50 |
Most occurring characters
Value | Count | Frequency (%) |
58 | 15.9% | |
상 | 14 | 3.8% |
기 | 9 | 2.5% |
연 | 8 | 2.2% |
, | 8 | 2.2% |
이 | 7 | 1.9% |
스 | 7 | 1.9% |
S | 7 | 1.9% |
대 | 7 | 1.9% |
리 | 6 | 1.6% |
Other values (131) | 233 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 230 | |
Space Separator | 58 | 15.9% |
Other Punctuation | 19 | 5.2% |
Uppercase Letter | 17 | 4.7% |
Decimal Number | 12 | 3.3% |
Close Punctuation | 6 | 1.6% |
Open Punctuation | 6 | 1.6% |
Modifier Symbol | 4 | 1.1% |
Dash Punctuation | 3 | 0.8% |
Initial Punctuation | 3 | 0.8% |
Other values (3) | 6 | 1.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
상 | 14 | 6.1% |
기 | 9 | 3.9% |
연 | 8 | 3.5% |
이 | 7 | 3.0% |
스 | 7 | 3.0% |
대 | 7 | 3.0% |
리 | 6 | 2.6% |
수 | 6 | 2.6% |
하 | 5 | 2.2% |
한 | 4 | 1.7% |
Other values (107) | 157 |
Decimal Number
Value | Count | Frequency (%) |
2 | 3 | |
1 | 3 | |
3 | 2 | |
0 | 2 | |
9 | 2 |
Other Punctuation
Value | Count | Frequency (%) |
, | 8 | |
. | 6 | |
" | 4 | |
… | 1 | 5.3% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 7 | |
B | 5 | |
K | 3 | |
X | 2 | 11.8% |
Initial Punctuation
Value | Count | Frequency (%) |
“ | 2 | |
‘ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
” | 2 | |
’ | 1 |
Space Separator
Value | Count | Frequency (%) |
58 |
Close Punctuation
Value | Count | Frequency (%) |
] | 6 |
Open Punctuation
Value | Count | Frequency (%) |
[ | 6 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 4 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Other Symbol
Value | Count | Frequency (%) |
♥ | 2 |
Math Symbol
Value | Count | Frequency (%) |
→ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 230 | |
Common | 117 | |
Latin | 17 | 4.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
상 | 14 | 6.1% |
기 | 9 | 3.9% |
연 | 8 | 3.5% |
이 | 7 | 3.0% |
스 | 7 | 3.0% |
대 | 7 | 3.0% |
리 | 6 | 2.6% |
수 | 6 | 2.6% |
하 | 5 | 2.2% |
한 | 4 | 1.7% |
Other values (107) | 157 |
Common
Value | Count | Frequency (%) |
58 | ||
, | 8 | 6.8% |
. | 6 | 5.1% |
] | 6 | 5.1% |
[ | 6 | 5.1% |
` | 4 | 3.4% |
" | 4 | 3.4% |
- | 3 | 2.6% |
2 | 3 | 2.6% |
1 | 3 | 2.6% |
Other values (10) | 16 | 13.7% |
Latin
Value | Count | Frequency (%) |
S | 7 | |
B | 5 | |
K | 3 | |
X | 2 | 11.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 230 | |
ASCII | 124 | |
Punctuation | 7 | 1.9% |
Misc Symbols | 2 | 0.5% |
Arrows | 1 | 0.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
58 | ||
, | 8 | 6.5% |
S | 7 | 5.6% |
. | 6 | 4.8% |
] | 6 | 4.8% |
[ | 6 | 4.8% |
B | 5 | 4.0% |
` | 4 | 3.2% |
" | 4 | 3.2% |
- | 3 | 2.4% |
Other values (7) | 17 | 13.7% |
Hangul
Value | Count | Frequency (%) |
상 | 14 | 6.1% |
기 | 9 | 3.9% |
연 | 8 | 3.5% |
이 | 7 | 3.0% |
스 | 7 | 3.0% |
대 | 7 | 3.0% |
리 | 6 | 2.6% |
수 | 6 | 2.6% |
하 | 5 | 2.2% |
한 | 4 | 1.7% |
Other values (107) | 157 |
Misc Symbols
Value | Count | Frequency (%) |
♥ | 2 |
Punctuation
Value | Count | Frequency (%) |
“ | 2 | |
” | 2 | |
’ | 1 | |
‘ | 1 | |
… | 1 |
Arrows
Value | Count | Frequency (%) |
→ | 1 |
ART_CN
Text
MISSING
 
Distinct | 5 |
---|---|
Distinct (%) | 50.0% |
Missing | 87 |
Missing (%) | 89.7% |
Memory size | 908.0 B |
Length
Max length | 90 |
---|---|
Median length | 86 |
Mean length | 56.1 |
Min length | 41 |
Characters and Unicode
Total characters | 561 |
---|---|
Distinct characters | 74 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 30.0% |
Sample
1st row | <!------------ PHOTO_POS_0 ------------> [매일경제 스타투데이 이다겸 기자] |
---|---|
2nd row | <!------------ PHOTO_POS_0 ------------> [매일경제 스타투데이 이다겸 기자] |
3rd row | <!------------ PHOTO_POS_0 ------------> |
4th row | <!------------ PHOTO_POS_0 ------------> |
5th row | <!------------ PHOTO_POS_0 ------------> |
Value | Count | Frequency (%) |
20 | ||
photo_pos_0 | 10 | |
수상했다 | 2 | 3.3% |
연기대상’에서 | 2 | 3.3% |
sbs | 2 | 3.3% |
‘2019 | 2 | 3.3% |
배우 | 2 | 3.3% |
기자 | 2 | 3.3% |
이다겸 | 2 | 3.3% |
매일경제 | 2 | 3.3% |
Other values (14) | 15 |
Most occurring characters
Value | Count | Frequency (%) |
- | 240 | |
57 | 10.2% | |
O | 30 | 5.3% |
P | 20 | 3.6% |
_ | 20 | 3.6% |
S | 14 | 2.5% |
0 | 12 | 2.1% |
< | 10 | 1.8% |
H | 10 | 1.8% |
T | 10 | 1.8% |
Other values (64) | 138 |
Most occurring categories
Value | Count | Frequency (%) |
Dash Punctuation | 240 | |
Other Letter | 98 | |
Uppercase Letter | 86 | 15.3% |
Space Separator | 57 | 10.2% |
Connector Punctuation | 20 | 3.6% |
Math Symbol | 20 | 3.6% |
Decimal Number | 18 | 3.2% |
Other Punctuation | 14 | 2.5% |
Open Punctuation | 2 | 0.4% |
Initial Punctuation | 2 | 0.4% |
Other values (2) | 4 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 8 | 8.2% |
상 | 7 | 7.1% |
다 | 5 | 5.1% |
기 | 4 | 4.1% |
수 | 4 | 4.1% |
스 | 3 | 3.1% |
을 | 3 | 3.1% |
제 | 3 | 3.1% |
우 | 3 | 3.1% |
서 | 2 | 2.0% |
Other values (42) | 56 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 30 | |
P | 20 | |
S | 14 | |
H | 10 | 11.6% |
T | 10 | 11.6% |
B | 2 | 2.3% |
Decimal Number
Value | Count | Frequency (%) |
0 | 12 | |
2 | 2 | 11.1% |
1 | 2 | 11.1% |
9 | 2 | 11.1% |
Other Punctuation
Value | Count | Frequency (%) |
! | 10 | |
. | 3 | 21.4% |
, | 1 | 7.1% |
Math Symbol
Value | Count | Frequency (%) |
< | 10 | |
> | 10 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 240 |
Space Separator
Value | Count | Frequency (%) |
57 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 20 |
Open Punctuation
Value | Count | Frequency (%) |
[ | 2 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 2 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 2 |
Close Punctuation
Value | Count | Frequency (%) |
] | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 377 | |
Hangul | 98 | 17.5% |
Latin | 86 | 15.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 8 | 8.2% |
상 | 7 | 7.1% |
다 | 5 | 5.1% |
기 | 4 | 4.1% |
수 | 4 | 4.1% |
스 | 3 | 3.1% |
을 | 3 | 3.1% |
제 | 3 | 3.1% |
우 | 3 | 3.1% |
서 | 2 | 2.0% |
Other values (42) | 56 |
Common
Value | Count | Frequency (%) |
- | 240 | |
57 | 15.1% | |
_ | 20 | 5.3% |
0 | 12 | 3.2% |
< | 10 | 2.7% |
> | 10 | 2.7% |
! | 10 | 2.7% |
. | 3 | 0.8% |
[ | 2 | 0.5% |
‘ | 2 | 0.5% |
Other values (6) | 11 | 2.9% |
Latin
Value | Count | Frequency (%) |
O | 30 | |
P | 20 | |
S | 14 | |
H | 10 | 11.6% |
T | 10 | 11.6% |
B | 2 | 2.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 459 | |
Hangul | 98 | 17.5% |
Punctuation | 4 | 0.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 240 | |
57 | 12.4% | |
O | 30 | 6.5% |
P | 20 | 4.4% |
_ | 20 | 4.4% |
S | 14 | 3.1% |
0 | 12 | 2.6% |
< | 10 | 2.2% |
H | 10 | 2.2% |
T | 10 | 2.2% |
Other values (10) | 36 | 7.8% |
Hangul
Value | Count | Frequency (%) |
이 | 8 | 8.2% |
상 | 7 | 7.1% |
다 | 5 | 5.1% |
기 | 4 | 4.1% |
수 | 4 | 4.1% |
스 | 3 | 3.1% |
을 | 3 | 3.1% |
제 | 3 | 3.1% |
우 | 3 | 3.1% |
서 | 2 | 2.0% |
Other values (42) | 56 |
Punctuation
Value | Count | Frequency (%) |
‘ | 2 | |
’ | 2 |
ATCH_IMG_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 97 |
---|---|
Missing (%) | 100.0% |
Memory size | 1005.0 B |
JRNL_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 97 |
---|---|
Missing (%) | 100.0% |
Memory size | 1005.0 B |
WRT_DATE
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 97 |
---|---|
Missing (%) | 100.0% |
Memory size | 1005.0 B |
Unnamed: 9
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 97 |
---|---|
Missing (%) | 100.0% |
Memory size | 1005.0 B |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | |
---|---|---|---|---|---|---|
MBN_MDA_SP_CD | 1.000 | 1.000 | 1.000 | NaN | NaN | NaN |
MDA_ART_ESSN_NO | 1.000 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
MDA_CGR_NM | 1.000 | 1.000 | 1.000 | NaN | NaN | NaN |
STD_YEAR | NaN | NaN | NaN | 1.000 | NaN | NaN |
ART_SJ_CN | NaN | 1.000 | NaN | NaN | 1.000 | 1.000 |
ART_CN | NaN | 1.000 | NaN | NaN | 1.000 | 1.000 |
STD_YEAR | MDA_CGR_NM | |
---|---|---|
STD_YEAR | 1.000 | 0.882 |
MDA_CGR_NM | 0.882 | 1.000 |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | MBN | 4023071 | mbn00012 | 2020 | 이상윤X이세영, 미니시리즈 우수연기상 “밥값 하는지 몰라 힘들었다”[2019 SBS 연기대상] | <!------------ PHOTO_POS_0 ------------> [매일경제 스타투데이 이다겸 기자] | <NA> | <NA> | <NA> | <NA> |
2 | 'VIP' 이상윤과 '의사요한' 이세영이 ‘2019 SBS 연기대상’에서 미니시리즈 부문 우수 연기상을 수상했다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | 31일 오후 8시 55분 서울시 마포구 상암동 SBS프리즘타워에서는 신동엽, 장나라의 진행으로 ‘2019 SBS 연기대상’ 시상식이 열렸다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | 이날 이상윤은 "촬영을 하면서도, 방송을 할 때도 신기한 경험을 많이 해서 그것 만으로도 감사한 작품이었다. 저 때문에 화가 나신 시청자분들께 죄송하고, 작품을 하면서 바람은 피지 말아야겠다는 생각을 하게 됐다"라고 말해 웃음을 자아냈다. 이어 "다른 결의 인물을 연기할 수 있게 해주신 감독님, 작가님에게도 감사하고, 함께 촬영을 한 배우들에게 고맙다"라고 덧붙였다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | 이어 이세영은 "너무 큰 상 주셔서 감사하고, 부끄럽다. 현장에 갈 때마다 제가 밥값을 잘하고 있는지 힘들었는데 감독님, 배우들이 이끌어줘서 잘 마칠 수 있었다. 더운 여름에 더 덥게 고생하신 스태프분들 고생 많으셨고, 함께할 수 있어서 행복한 시간이었다"라고 울컥하는 모습을 보였다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | 한편 ‘2019 SBS 연기대상’은 ‘열혈사제’, ‘배가본드’, ‘스토브리그’, ‘VIP’, ‘의사요한’, ‘녹두꽃’, ‘시크릿 부티크’ 등 올해를 빛낸 SBS 드라마를 총 결산 하는 자리다. SBS에서 생중계된다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | trdk0114@mk.co.kr | http://img.mbn.co.kr/filewww/news/other/2020/01/01/010101000010.jpg,,,,,,,,, | 이다겸 | 20200101000138 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | MBN | 4023072 | mbn00012 | 2020 | 김성균X한예리, 중편드라마 우수연기상 “심장 터질 것 같아”[2019 SBS 연기대상] | <!------------ PHOTO_POS_0 ------------> [매일경제 스타투데이 이다겸 기자] | <NA> | <NA> | <NA> | <NA> |
9 | '열혈사제' 김성균과 '녹두꽃' 한예리가 ‘2019 SBS 연기대상’에서 중편드라마 부문 우수연기상을 수상했다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
87 | 김소현 역시 “사극치고 뽀뽀신이 많았다. 사극인데 왜 이렇게 많냐고 하더라. 저희는 새로운 시대를 열어가는 커플이었다”고 너스레를 떨었다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
88 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
89 | skyb1842@mk.co.kr | http://img.mbn.co.kr/filewww/news/other/2020/01/01/000922022211.jpg,,,,,,,,, | 양소영 | 20200101001307 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
90 | MBN | 4023081 | mbn00012 | 2020 | 정문성, 많이 떨려요 [포토] | <!------------ PHOTO_POS_0 ------------> 배우 정문성이 ‘2019 SBS 연기대상’에서 베스트 캐릭터상을 수상했다. | <NA> | <NA> | <NA> | <NA> |
91 | ‘2019 SBS 연기대상’이 지난해 31일 오후 서울 마포구 상암동 SBS 미디어센터에서 신동엽, 장나라의 사회로 진행됐다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
92 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
93 | 이번 ‘2019 SBS 연기대상’에서 가장 큰 관심사는 대상 수상자에 대한 궁금증이다. 특히 ‘열혈사제’, ‘황후의 품격’, ‘배가본드’, ‘녹두꽃’, ‘의사 요한’, ‘VIP’ 등 시청률과 화제성, 작품성을 인정받으며 시청자들의 마음을 사로잡은 쟁쟁한 작품들이 수두룩한 가운데 영예의 대상을 누가 받게 될지가 초미의 관심사다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
94 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
95 | MBN스타 대중문화부 안하나 기자 mkculture@mkculture.com | http://img.mbn.co.kr/filewww/news/other/2020/01/01/002010010104.JPG,,,,,,,,, | 안하나 | 20200101001437 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
96 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | # duplicates | |
---|---|---|---|---|---|---|---|
6 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 19 |
1 | 31일 오후 서울 KBS 여의도홀에서 ‘2019 KBS 연기대상’이 열렸다. 방송인 전현무, 배우 신혜선이 진행을 맡았다. | <NA> | <NA> | <NA> | <NA> | <NA> | 3 |
3 | [매일경제 스타투데이 양소영 기자] | <NA> | <NA> | <NA> | <NA> | <NA> | 3 |
0 | 31일 오후 8시 55분 서울시 마포구 상암동 SBS프리즘타워에서는 신동엽, 장나라의 진행으로 ‘2019 SBS 연기대상’ 시상식이 열렸다. | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |
2 | [ 매일경제 스타투데이 서지경 객원기자 ] | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |
4 | 이번 ‘2019 SBS 연기대상’에서 가장 큰 관심사는 대상 수상자에 대한 궁금증이다. 특히 ‘열혈사제’, ‘황후의 품격’, ‘배가본드’, ‘녹두꽃’, ‘의사 요한’, ‘VIP’ 등 시청률과 화제성, 작품성을 인정받으며 시청자들의 마음을 사로잡은 쟁쟁한 작품들이 수두룩한 가운데 영예의 대상을 누가 받게 될지가 초미의 관심사다. | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |
5 | 한편 ‘2019 SBS 연기대상’은 ‘열혈사제’, ‘배가본드’, ‘스토브리그’, ‘VIP’, ‘의사요한’, ‘녹두꽃’, ‘시크릿 부티크’ 등 올해를 빛낸 SBS 드라마를 총 결산 하는 자리다. SBS에서 생중계된다. | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |