Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 186 |
Missing cells | 1323 |
Missing cells (%) | 71.1% |
Duplicate rows | 2 |
Duplicate rows (%) | 1.1% |
Total size in memory | 15.4 KiB |
Average record size in memory | 84.7 B |
Variable types
Text | 5 |
---|---|
Categorical | 2 |
Numeric | 1 |
Unsupported | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | MBN |
URL | https://kdx.kr/data/view/26951 |
ATCH_IMG_NM has constant value "" | Constant |
Dataset has 2 (1.1%) duplicate rows | Duplicates |
STD_YEAR is highly overall correlated with MDA_CGR_NM | High correlation |
MDA_CGR_NM is highly overall correlated with STD_YEAR | High correlation |
MDA_CGR_NM is highly imbalanced (80.8%) | Imbalance |
WRT_DATE is highly imbalanced (95.2%) | Imbalance |
MBN_MDA_SP_CD has 77 (41.4%) missing values | Missing |
MDA_ART_ESSN_NO has 170 (91.4%) missing values | Missing |
STD_YEAR has 167 (89.8%) missing values | Missing |
ART_SJ_CN has 176 (94.6%) missing values | Missing |
ART_CN has 176 (94.6%) missing values | Missing |
ATCH_IMG_NM has 185 (99.5%) missing values | Missing |
JRNL_NM has 186 (100.0%) missing values | Missing |
Unnamed: 9 has 186 (100.0%) missing values | Missing |
JRNL_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 21:13:13.948897 |
---|---|
Analysis finished | 2023-12-11 21:13:15.356377 |
Duration | 1.41 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
MBN_MDA_SP_CD
Text
MISSING
 
Distinct | 95 |
---|---|
Distinct (%) | 87.2% |
Missing | 77 |
Missing (%) | 41.4% |
Memory size | 1.6 KiB |
Length
Max length | 271 |
---|---|
Median length | 119 |
Mean length | 81.394495 |
Min length | 3 |
Characters and Unicode
Total characters | 8872 |
---|---|
Distinct characters | 549 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 7 ? |
Unique
Unique | 92 ? |
---|---|
Unique (%) | 84.4% |
Sample
1st row | MBN |
---|---|
2nd row | 트럼프 대통령은 또 나중에 2단계 회담이 시작되는 베이징으로 갈 것이라고 밝혀 베이징에서 미중 정상회담이 개최될 것임을 시사했으나 시기 등 구체적인 언급은 하지 않았습니다. |
3rd row | 중국은 농산물을 포함해 미국산 제품을 대규모로 구매하고, 미국은 추가 관세 부과를 철회하는 한편 기존 관세 중 일부 제품의 관세율을 낮추는 것이 1단계 합의의 주된 내용입니다. |
4th row | MBN |
5th row | 최근 미국 정부에 '크리스마스 선물'을 언급하며 군사 도발 불안감을 키웠던 북한이 전략무기개발을 계속하겠다고 밝혔습니다. |
Value | Count | Frequency (%) |
전 | 30 | 1.5% |
곤 | 25 | 1.2% |
트럼프 | 24 | 1.2% |
김 | 24 | 1.2% |
위원장이 | 17 | 0.8% |
mbn | 15 | 0.7% |
북한이 | 13 | 0.6% |
미국 | 13 | 0.6% |
수 | 11 | 0.5% |
것이라고 | 10 | 0.5% |
Other values (1344) | 1863 |
Most occurring characters
Value | Count | Frequency (%) |
2017 | 22.7% | |
이 | 219 | 2.5% |
다 | 205 | 2.3% |
고 | 132 | 1.5% |
. | 115 | 1.3% |
는 | 113 | 1.3% |
의 | 110 | 1.2% |
에 | 104 | 1.2% |
을 | 102 | 1.1% |
한 | 101 | 1.1% |
Other values (539) | 5654 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6182 | |
Space Separator | 2017 | 22.7% |
Other Punctuation | 300 | 3.4% |
Uppercase Letter | 150 | 1.7% |
Decimal Number | 98 | 1.1% |
Close Punctuation | 34 | 0.4% |
Open Punctuation | 33 | 0.4% |
Dash Punctuation | 26 | 0.3% |
Lowercase Letter | 23 | 0.3% |
Math Symbol | 5 | 0.1% |
Other values (2) | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 219 | 3.5% |
다 | 205 | 3.3% |
고 | 132 | 2.1% |
는 | 113 | 1.8% |
의 | 110 | 1.8% |
에 | 104 | 1.7% |
을 | 102 | 1.6% |
한 | 101 | 1.6% |
로 | 98 | 1.6% |
지 | 95 | 1.5% |
Other values (474) | 4903 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 30 | |
M | 26 | |
B | 25 | |
C | 16 | |
I | 10 | 6.7% |
P | 9 | 6.0% |
A | 7 | 4.7% |
T | 7 | 4.7% |
Y | 4 | 2.7% |
O | 3 | 2.0% |
Other values (8) | 13 |
Lowercase Letter
Value | Count | Frequency (%) |
r | 3 | |
i | 3 | |
o | 3 | |
g | 2 | |
k | 2 | |
n | 2 | |
a | 2 | |
b | 2 | |
c | 1 | 4.3% |
m | 1 | 4.3% |
Other values (2) | 2 |
Other Punctuation
Value | Count | Frequency (%) |
. | 115 | |
" | 69 | |
' | 58 | |
, | 40 | 13.3% |
· | 8 | 2.7% |
% | 3 | 1.0% |
: | 2 | 0.7% |
/ | 2 | 0.7% |
& | 1 | 0.3% |
… | 1 | 0.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 28 | |
2 | 25 | |
0 | 14 | |
3 | 8 | 8.2% |
4 | 6 | 6.1% |
5 | 5 | 5.1% |
7 | 4 | 4.1% |
9 | 3 | 3.1% |
6 | 3 | 3.1% |
8 | 2 | 2.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 25 | |
] | 7 | 20.6% |
】 | 2 | 5.9% |
Open Punctuation
Value | Count | Frequency (%) |
( | 24 | |
[ | 7 | 21.2% |
【 | 2 | 6.1% |
Math Symbol
Value | Count | Frequency (%) |
> | 2 | |
< | 2 | |
= | 1 |
Other Symbol
Value | Count | Frequency (%) |
▶ | 1 | |
ⓒ | 1 |
Space Separator
Value | Count | Frequency (%) |
2017 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 26 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6174 | |
Common | 2517 | |
Latin | 173 | 1.9% |
Han | 8 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 219 | 3.5% |
다 | 205 | 3.3% |
고 | 132 | 2.1% |
는 | 113 | 1.8% |
의 | 110 | 1.8% |
에 | 104 | 1.7% |
을 | 102 | 1.7% |
한 | 101 | 1.6% |
로 | 98 | 1.6% |
지 | 95 | 1.5% |
Other values (466) | 4895 |
Common
Value | Count | Frequency (%) |
2017 | ||
. | 115 | 4.6% |
" | 69 | 2.7% |
' | 58 | 2.3% |
, | 40 | 1.6% |
1 | 28 | 1.1% |
- | 26 | 1.0% |
) | 25 | 1.0% |
2 | 25 | 1.0% |
( | 24 | 1.0% |
Other values (25) | 90 | 3.6% |
Latin
Value | Count | Frequency (%) |
N | 30 | |
M | 26 | |
B | 25 | |
C | 16 | |
I | 10 | 5.8% |
P | 9 | 5.2% |
A | 7 | 4.0% |
T | 7 | 4.0% |
Y | 4 | 2.3% |
O | 3 | 1.7% |
Other values (20) | 36 |
Han
Value | Count | Frequency (%) |
三 | 1 | |
晋 | 1 | |
倍 | 1 | |
安 | 1 | |
仁 | 1 | |
和 | 1 | |
令 | 1 | |
德 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6174 | |
ASCII | 2675 | |
None | 12 | 0.1% |
CJK | 8 | 0.1% |
Geometric Shapes | 1 | < 0.1% |
Enclosed Alphanum | 1 | < 0.1% |
Punctuation | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2017 | ||
. | 115 | 4.3% |
" | 69 | 2.6% |
' | 58 | 2.2% |
, | 40 | 1.5% |
N | 30 | 1.1% |
1 | 28 | 1.0% |
M | 26 | 1.0% |
- | 26 | 1.0% |
) | 25 | 0.9% |
Other values (49) | 241 | 9.0% |
Hangul
Value | Count | Frequency (%) |
이 | 219 | 3.5% |
다 | 205 | 3.3% |
고 | 132 | 2.1% |
는 | 113 | 1.8% |
의 | 110 | 1.8% |
에 | 104 | 1.7% |
을 | 102 | 1.7% |
한 | 101 | 1.6% |
로 | 98 | 1.6% |
지 | 95 | 1.5% |
Other values (466) | 4895 |
None
Value | Count | Frequency (%) |
· | 8 | |
】 | 2 | 16.7% |
【 | 2 | 16.7% |
Geometric Shapes
Value | Count | Frequency (%) |
▶ | 1 |
Enclosed Alphanum
Value | Count | Frequency (%) |
ⓒ | 1 |
Punctuation
Value | Count | Frequency (%) |
… | 1 |
CJK
Value | Count | Frequency (%) |
三 | 1 | |
晋 | 1 | |
倍 | 1 | |
安 | 1 | |
仁 | 1 | |
和 | 1 | |
令 | 1 | |
德 | 1 |
MDA_ART_ESSN_NO
Text
MISSING
 
Distinct | 12 |
---|---|
Distinct (%) | 75.0% |
Missing | 170 |
Missing (%) | 91.4% |
Memory size | 1.6 KiB |
Value | Count | Frequency (%) |
5 | ||
4023133 | 1 | 6.2% |
4023138 | 1 | 6.2% |
4023166 | 1 | 6.2% |
4023232 | 1 | 6.2% |
4023246 | 1 | 6.2% |
4023278 | 1 | 6.2% |
4023297 | 1 | 6.2% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/032001212223.jpg | 1 | 6.2% |
4023298 | 1 | 6.2% |
Other values (2) | 2 | 12.5% |
Most occurring characters
Value | Count | Frequency (%) |
, | 54 | |
2 | 25 | |
0 | 18 | 9.4% |
3 | 16 | 8.4% |
4 | 12 | 6.3% |
/ | 9 | 4.7% |
1 | 7 | 3.7% |
. | 4 | 2.1% |
w | 4 | 2.1% |
8 | 3 | 1.6% |
Other values (22) | 39 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 90 | |
Other Punctuation | 68 | |
Lowercase Letter | 33 | 17.3% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
w | 4 | |
e | 3 | 9.1% |
t | 3 | 9.1% |
g | 2 | 6.1% |
r | 2 | 6.1% |
o | 2 | 6.1% |
n | 2 | 6.1% |
m | 2 | 6.1% |
i | 2 | 6.1% |
p | 2 | 6.1% |
Other values (8) | 9 |
Decimal Number
Value | Count | Frequency (%) |
2 | 25 | |
0 | 18 | |
3 | 16 | |
4 | 12 | |
1 | 7 | 7.8% |
8 | 3 | 3.3% |
6 | 3 | 3.3% |
9 | 2 | 2.2% |
7 | 2 | 2.2% |
5 | 2 | 2.2% |
Other Punctuation
Value | Count | Frequency (%) |
, | 54 | |
/ | 9 | 13.2% |
. | 4 | 5.9% |
: | 1 | 1.5% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 158 | |
Latin | 33 | 17.3% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
w | 4 | |
e | 3 | 9.1% |
t | 3 | 9.1% |
g | 2 | 6.1% |
r | 2 | 6.1% |
o | 2 | 6.1% |
n | 2 | 6.1% |
m | 2 | 6.1% |
i | 2 | 6.1% |
p | 2 | 6.1% |
Other values (8) | 9 |
Common
Value | Count | Frequency (%) |
, | 54 | |
2 | 25 | |
0 | 18 | 11.4% |
3 | 16 | 10.1% |
4 | 12 | 7.6% |
/ | 9 | 5.7% |
1 | 7 | 4.4% |
. | 4 | 2.5% |
8 | 3 | 1.9% |
6 | 3 | 1.9% |
Other values (4) | 7 | 4.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 191 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
, | 54 | |
2 | 25 | |
0 | 18 | 9.4% |
3 | 16 | 8.4% |
4 | 12 | 6.3% |
/ | 9 | 4.7% |
1 | 7 | 3.7% |
. | 4 | 2.1% |
w | 4 | 2.1% |
8 | 3 | 1.6% |
Other values (22) | 39 |
MDA_CGR_NM
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 2.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
<NA> | |
---|---|
mbn00008 | 10 |
이혁준 | 1 |
정욱 | 1 |
임성재 | 1 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.1935484 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 1.6% |
Sample
1st row | <NA> |
---|---|
2nd row | mbn00008 |
3rd row | <NA> |
4th row | <NA> |
5th row | mbn00008 |
Common Values
Value | Count | Frequency (%) |
<NA> | 173 | |
mbn00008 | 10 | 5.4% |
이혁준 | 1 | 0.5% |
정욱 | 1 | 0.5% |
임성재 | 1 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 173 | |
mbn00008 | 10 | 5.4% |
이혁준 | 1 | 0.5% |
정욱 | 1 | 0.5% |
임성재 | 1 | 0.5% |
STD_YEAR
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 52.6% |
Missing | 167 |
Missing (%) | 89.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9.568469 × 1012 |
Minimum | 2020 |
---|---|
Maximum | 2.0200102 × 1013 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.8 KiB |
Quantile statistics
Minimum | 2020 |
---|---|
5-th percentile | 2020 |
Q1 | 2020 |
median | 2020 |
Q3 | 2.0200101 × 1013 |
95-th percentile | 2.0200101 × 1013 |
Maximum | 2.0200102 × 1013 |
Range | 2.0200102 × 1013 |
Interquartile range (IQR) | 2.0200101 × 1013 |
Descriptive statistics
Standard deviation | 1.0362433 × 1013 |
---|---|
Coefficient of variation (CV) | 1.0829771 |
Kurtosis | -2.2352941 |
Mean | 9.568469 × 1012 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 0.11466817 |
Sum | 1.8180091 × 1014 |
Variance | 1.0738002 × 1026 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2020 | 10 | 5.4% |
20200101072035 | 1 | 0.5% |
20200101080035 | 1 | 0.5% |
20200101092438 | 1 | 0.5% |
20200101111007 | 1 | 0.5% |
20200101122349 | 1 | 0.5% |
20200101133332 | 1 | 0.5% |
20200101133442 | 1 | 0.5% |
20200101193035 | 1 | 0.5% |
20200102072234 | 1 | 0.5% |
(Missing) | 167 |
Value | Count | Frequency (%) |
2020 | 10 | |
20200101072035 | 1 | 0.5% |
20200101080035 | 1 | 0.5% |
20200101092438 | 1 | 0.5% |
20200101111007 | 1 | 0.5% |
20200101122349 | 1 | 0.5% |
20200101133332 | 1 | 0.5% |
20200101133442 | 1 | 0.5% |
20200101193035 | 1 | 0.5% |
20200102072234 | 1 | 0.5% |
Value | Count | Frequency (%) |
20200102072234 | 1 | 0.5% |
20200101193035 | 1 | 0.5% |
20200101133442 | 1 | 0.5% |
20200101133332 | 1 | 0.5% |
20200101122349 | 1 | 0.5% |
20200101111007 | 1 | 0.5% |
20200101092438 | 1 | 0.5% |
20200101080035 | 1 | 0.5% |
20200101072035 | 1 | 0.5% |
2020 | 10 |
ART_SJ_CN
Text
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 100.0% |
Missing | 176 |
Missing (%) | 94.6% |
Memory size | 1.6 KiB |
Length
Max length | 43 |
---|---|
Median length | 33.5 |
Mean length | 32 |
Min length | 15 |
Characters and Unicode
Total characters | 320 |
---|---|
Distinct characters | 143 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 트럼프 "미·중 1단계 무역합의, 1월15일 서명" |
---|---|
2nd row | 김정은 "전략무기개발 계속…실제 행동 넘어갈 것" |
3rd row | 폼페이오, 김정은에 경고 "새 무기 목격하게 될 것...'옳은 결정' 바란다" |
4th row | 아베, 새해 첫 소감 '평화헌법' 개정 추진 뜻 거듭 밝혀 |
5th row | [속보] 트럼프 "김정은과 좋은 관계…김정은 약속 지킬 것"<로이터> |
Value | Count | Frequency (%) |
트럼프 | 4 | 5.1% |
김정은 | 3 | 3.8% |
전 | 2 | 2.6% |
곤 | 2 | 2.6% |
약속 | 2 | 2.6% |
선물 | 1 | 1.3% |
꽃병이길"...비핵화 | 1 | 1.3% |
북한 | 1 | 1.3% |
이행 | 1 | 1.3% |
낙관 | 1 | 1.3% |
Other values (60) | 60 |
Most occurring characters
Value | Count | Frequency (%) |
68 | 21.2% | |
" | 14 | 4.4% |
정 | 8 | 2.5% |
은 | 8 | 2.5% |
김 | 6 | 1.9% |
, | 6 | 1.9% |
. | 6 | 1.9% |
이 | 5 | 1.6% |
럼 | 4 | 1.2% |
트 | 4 | 1.2% |
Other values (133) | 191 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 200 | |
Space Separator | 68 | 21.2% |
Other Punctuation | 37 | 11.6% |
Uppercase Letter | 7 | 2.2% |
Decimal Number | 4 | 1.2% |
Math Symbol | 2 | 0.6% |
Close Punctuation | 1 | 0.3% |
Open Punctuation | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
정 | 8 | 4.0% |
은 | 8 | 4.0% |
김 | 6 | 3.0% |
이 | 5 | 2.5% |
럼 | 4 | 2.0% |
트 | 4 | 2.0% |
프 | 4 | 2.0% |
속 | 4 | 2.0% |
개 | 3 | 1.5% |
기 | 3 | 1.5% |
Other values (115) | 151 |
Other Punctuation
Value | Count | Frequency (%) |
" | 14 | |
, | 6 | |
. | 6 | |
… | 4 | 10.8% |
' | 4 | 10.8% |
· | 3 | 8.1% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 2 | |
N | 2 | |
M | 1 | |
B | 1 | |
I | 1 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
5 | 1 | 25.0% |
Math Symbol
Value | Count | Frequency (%) |
> | 1 | |
< | 1 |
Space Separator
Value | Count | Frequency (%) |
68 |
Close Punctuation
Value | Count | Frequency (%) |
] | 1 |
Open Punctuation
Value | Count | Frequency (%) |
[ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 200 | |
Common | 113 | |
Latin | 7 | 2.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
정 | 8 | 4.0% |
은 | 8 | 4.0% |
김 | 6 | 3.0% |
이 | 5 | 2.5% |
럼 | 4 | 2.0% |
트 | 4 | 2.0% |
프 | 4 | 2.0% |
속 | 4 | 2.0% |
개 | 3 | 1.5% |
기 | 3 | 1.5% |
Other values (115) | 151 |
Common
Value | Count | Frequency (%) |
68 | ||
" | 14 | 12.4% |
, | 6 | 5.3% |
. | 6 | 5.3% |
… | 4 | 3.5% |
' | 4 | 3.5% |
· | 3 | 2.7% |
1 | 3 | 2.7% |
> | 1 | 0.9% |
5 | 1 | 0.9% |
Other values (3) | 3 | 2.7% |
Latin
Value | Count | Frequency (%) |
C | 2 | |
N | 2 | |
M | 1 | |
B | 1 | |
I | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 200 | |
ASCII | 113 | |
Punctuation | 4 | 1.2% |
None | 3 | 0.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
68 | ||
" | 14 | 12.4% |
, | 6 | 5.3% |
. | 6 | 5.3% |
' | 4 | 3.5% |
1 | 3 | 2.7% |
C | 2 | 1.8% |
N | 2 | 1.8% |
M | 1 | 0.9% |
B | 1 | 0.9% |
Other values (6) | 6 | 5.3% |
Hangul
Value | Count | Frequency (%) |
정 | 8 | 4.0% |
은 | 8 | 4.0% |
김 | 6 | 3.0% |
이 | 5 | 2.5% |
럼 | 4 | 2.0% |
트 | 4 | 2.0% |
프 | 4 | 2.0% |
속 | 4 | 2.0% |
개 | 3 | 1.5% |
기 | 3 | 1.5% |
Other values (115) | 151 |
Punctuation
Value | Count | Frequency (%) |
… | 4 |
None
Value | Count | Frequency (%) |
· | 3 |
ART_CN
Text
MISSING
 
Distinct | 5 |
---|---|
Distinct (%) | 50.0% |
Missing | 176 |
Missing (%) | 94.6% |
Memory size | 1.6 KiB |
Length
Max length | 107 |
---|---|
Median length | 94 |
Mean length | 43.7 |
Min length | 8 |
Characters and Unicode
Total characters | 437 |
---|---|
Distinct characters | 112 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 30.0% |
Sample
1st row | 트럼프 미국 대통령이 오는 1월15일 백악관에서 중국과의 매우 크고 포괄적인 1단계 무역합의에 서명할 것이라고 트위터 계정을 통해 밝혔습니다. |
---|---|
2nd row | 【 앵커멘트 】 |
3rd row | <!------------ PHOTO_POS_0 ------------> |
4th row | <!------------ PHOTO_POS_0 ------------> |
5th row | 트럼프 "김정은과 좋은 관계…김정은 약속 지킬 것"<로이터> |
Value | Count | Frequency (%) |
12 | 18.2% | |
photo_pos_0 | 6 | 9.1% |
【 | 2 | 3.0% |
앵커멘트 | 2 | 3.0% |
】 | 2 | 3.0% |
트럼프 | 2 | 3.0% |
곤 | 1 | 1.5% |
것"<로이터 | 1 | 1.5% |
일본 | 1 | 1.5% |
사법당국의 | 1 | 1.5% |
Other values (36) | 36 |
Most occurring characters
Value | Count | Frequency (%) |
- | 144 | |
59 | 13.5% | |
O | 18 | 4.1% |
P | 12 | 2.7% |
_ | 12 | 2.7% |
< | 7 | 1.6% |
> | 7 | 1.6% |
H | 6 | 1.4% |
T | 6 | 1.4% |
S | 6 | 1.4% |
Other values (102) | 160 |
Most occurring categories
Value | Count | Frequency (%) |
Dash Punctuation | 144 | |
Other Letter | 135 | |
Space Separator | 59 | |
Uppercase Letter | 48 | 11.0% |
Math Symbol | 14 | 3.2% |
Connector Punctuation | 12 | 2.7% |
Other Punctuation | 11 | 2.5% |
Decimal Number | 10 | 2.3% |
Open Punctuation | 2 | 0.5% |
Close Punctuation | 2 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
트 | 5 | 3.7% |
이 | 4 | 3.0% |
의 | 4 | 3.0% |
고 | 3 | 2.2% |
정 | 3 | 2.2% |
은 | 3 | 2.2% |
계 | 3 | 2.2% |
국 | 3 | 2.2% |
커 | 2 | 1.5% |
인 | 2 | 1.5% |
Other values (83) | 103 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 18 | |
P | 12 | |
H | 6 | 12.5% |
T | 6 | 12.5% |
S | 6 | 12.5% |
Other Punctuation
Value | Count | Frequency (%) |
! | 6 | |
. | 2 | 18.2% |
" | 2 | 18.2% |
… | 1 | 9.1% |
Decimal Number
Value | Count | Frequency (%) |
0 | 6 | |
1 | 3 | |
5 | 1 | 10.0% |
Math Symbol
Value | Count | Frequency (%) |
< | 7 | |
> | 7 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 144 |
Space Separator
Value | Count | Frequency (%) |
59 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 12 |
Open Punctuation
Value | Count | Frequency (%) |
【 | 2 |
Close Punctuation
Value | Count | Frequency (%) |
】 | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 254 | |
Hangul | 135 | |
Latin | 48 | 11.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
트 | 5 | 3.7% |
이 | 4 | 3.0% |
의 | 4 | 3.0% |
고 | 3 | 2.2% |
정 | 3 | 2.2% |
은 | 3 | 2.2% |
계 | 3 | 2.2% |
국 | 3 | 2.2% |
커 | 2 | 1.5% |
인 | 2 | 1.5% |
Other values (83) | 103 |
Common
Value | Count | Frequency (%) |
- | 144 | |
59 | ||
_ | 12 | 4.7% |
< | 7 | 2.8% |
> | 7 | 2.8% |
0 | 6 | 2.4% |
! | 6 | 2.4% |
1 | 3 | 1.2% |
【 | 2 | 0.8% |
. | 2 | 0.8% |
Other values (4) | 6 | 2.4% |
Latin
Value | Count | Frequency (%) |
O | 18 | |
P | 12 | |
H | 6 | 12.5% |
T | 6 | 12.5% |
S | 6 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 297 | |
Hangul | 135 | |
None | 4 | 0.9% |
Punctuation | 1 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 144 | |
59 | ||
O | 18 | 6.1% |
P | 12 | 4.0% |
_ | 12 | 4.0% |
< | 7 | 2.4% |
> | 7 | 2.4% |
H | 6 | 2.0% |
T | 6 | 2.0% |
S | 6 | 2.0% |
Other values (6) | 20 | 6.7% |
Hangul
Value | Count | Frequency (%) |
트 | 5 | 3.7% |
이 | 4 | 3.0% |
의 | 4 | 3.0% |
고 | 3 | 2.2% |
정 | 3 | 2.2% |
은 | 3 | 2.2% |
계 | 3 | 2.2% |
국 | 3 | 2.2% |
커 | 2 | 1.5% |
인 | 2 | 1.5% |
Other values (83) | 103 |
None
Value | Count | Frequency (%) |
【 | 2 | |
】 | 2 |
Punctuation
Value | Count | Frequency (%) |
… | 1 |
ATCH_IMG_NM
Text
CONSTANT
  MISSING
 
Distinct | 1 |
---|---|
Distinct (%) | 100.0% |
Missing | 185 |
Missing (%) | 99.5% |
Memory size | 1.6 KiB |
Value | Count | Frequency (%) |
1 |
Most occurring characters
Value | Count | Frequency (%) |
, | 9 |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 9 |
Most frequent character per category
Other Punctuation
Value | Count | Frequency (%) |
, | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 9 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
, | 9 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 9 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
, | 9 |
JRNL_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 186 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.8 KiB |
WRT_DATE
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
<NA> | |
---|---|
20200101113443 | 1 |
Length
Max length | 14 |
---|---|
Median length | 4 |
Mean length | 4.0537634 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 185 | |
20200101113443 | 1 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 185 | |
20200101113443 | 1 | 0.5% |
Unnamed: 9
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 186 |
---|---|
Missing (%) | 100.0% |
Memory size | 1.8 KiB |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | |
---|---|---|---|---|---|---|
MBN_MDA_SP_CD | 1.000 | 1.000 | 1.000 | NaN | NaN | NaN |
MDA_ART_ESSN_NO | 1.000 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
MDA_CGR_NM | 1.000 | 1.000 | 1.000 | NaN | NaN | NaN |
STD_YEAR | NaN | NaN | NaN | 1.000 | NaN | NaN |
ART_SJ_CN | NaN | 1.000 | NaN | NaN | 1.000 | 1.000 |
ART_CN | NaN | 1.000 | NaN | NaN | 1.000 | 1.000 |
MDA_CGR_NM | WRT_DATE | |
---|---|---|
MDA_CGR_NM | 1.000 | NaN |
WRT_DATE | NaN | 1.000 |
STD_YEAR | MDA_CGR_NM | WRT_DATE | |
---|---|---|---|
STD_YEAR | 1.000 | 0.905 | NaN |
MDA_CGR_NM | 0.905 | 1.000 | NaN |
WRT_DATE | NaN | NaN | 1.000 |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | MBN | 4023133 | mbn00008 | 2020 | 트럼프 "미·중 1단계 무역합의, 1월15일 서명" | 트럼프 미국 대통령이 오는 1월15일 백악관에서 중국과의 매우 크고 포괄적인 1단계 무역합의에 서명할 것이라고 트위터 계정을 통해 밝혔습니다. | <NA> | <NA> | <NA> | <NA> |
2 | 트럼프 대통령은 또 나중에 2단계 회담이 시작되는 베이징으로 갈 것이라고 밝혀 베이징에서 미중 정상회담이 개최될 것임을 시사했으나 시기 등 구체적인 언급은 하지 않았습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | 중국은 농산물을 포함해 미국산 제품을 대규모로 구매하고, 미국은 추가 관세 부과를 철회하는 한편 기존 관세 중 일부 제품의 관세율을 낮추는 것이 1단계 합의의 주된 내용입니다. | <NA> | <NA> | 20200101072035 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | MBN | 4023138 | mbn00008 | 2020 | 김정은 "전략무기개발 계속…실제 행동 넘어갈 것" | 【 앵커멘트 】 | <NA> | <NA> | <NA> | <NA> |
5 | 최근 미국 정부에 '크리스마스 선물'을 언급하며 군사 도발 불안감을 키웠던 북한이 전략무기개발을 계속하겠다고 밝혔습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | 김정은 국무위원장은 제재에 따른 조치라는 단서를 달았지만, 실제 행동하겠다고도 언급했습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | 이혁준 기자입니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
176 | 중국의 대북 영향력이 미 전문가들이 생각하는 수준보다는 훨씬 더 제한적일 수 있지만, 그럼에도 북의 무기 시험발사를 자제시키는데 있어 중국의 외교적 노력이 성공을 거둬왔다는 것입니다. 북중간 이해관계 등을 제대로 파악해 대처해야 한다는 취지로 보입니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
177 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
178 | 로버트 매닝 애틀랜틱 카운슬 선임연구원은 더힐에 기고한 '2020년에 주시할 6가지 최고 위험'이라는 글에서 북한 문제를 그중 하나로 꼽고 "이는 이제 형태를 갖추고 있는 새로운 핵 시대의 가장 당면한 도전과제'라고 밝혔습니다. 이어 "추가 북미정상회담 개최 여부와 상관없이 북한이 전략 무기 개발을 지속하면서 2020년 긴장이 고조될 가능성이 높다"고 말했습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
179 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
180 | 그러면서 "표면적으로는 외교가 지속될지 모르지만, 김정은은 '전략적 결정'에 조금씩 가까이 다가갈 것이다. 김정은의 목표는 미사일과 핵무기를 향상하면서 시간을 버는 것"이라며 김 위원장의 '새로운 길' 위협에도 전쟁은 여전히 상상도 할 수 없는 파멸적 선택인 만큼 상호 억지가 유지돼야 한다고 말했습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
181 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
182 | 이어 다음 단계는 핵을 보유한 북한과 어떻게 함께 살아가느냐의 문제일 수 있다고 지적하기도 했습니다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
183 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
184 | [MBN 온라인뉴스팀] | ,,,,,,,,, | <NA> | 20200102072234 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
185 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | WRT_DATE | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
1 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 77 |
0 | 【 기자 】 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |