Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 95 |
Missing cells | 625 |
Missing cells (%) | 65.8% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.1% |
Total size in memory | 8.0 KiB |
Average record size in memory | 86.4 B |
Variable types
Text | 3 |
---|---|
Categorical | 2 |
Numeric | 1 |
Unsupported | 4 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | MBN |
URL | https://kdx.kr/data/view/26946 |
Dataset has 1 (1.1%) duplicate rows | Duplicates |
ART_CN is highly overall correlated with STD_YEAR and 1 other fields | High correlation |
MDA_CGR_NM is highly overall correlated with STD_YEAR and 1 other fields | High correlation |
STD_YEAR is highly overall correlated with MDA_CGR_NM and 1 other fields | High correlation |
MDA_CGR_NM is highly imbalanced (51.5%) | Imbalance |
ART_CN is highly imbalanced (70.9%) | Imbalance |
MBN_MDA_SP_CD has 10 (10.5%) missing values | Missing |
MDA_ART_ESSN_NO has 75 (78.9%) missing values | Missing |
STD_YEAR has 75 (78.9%) missing values | Missing |
ART_SJ_CN has 85 (89.5%) missing values | Missing |
ATCH_IMG_NM has 95 (100.0%) missing values | Missing |
JRNL_NM has 95 (100.0%) missing values | Missing |
WRT_DATE has 95 (100.0%) missing values | Missing |
Unnamed: 9 has 95 (100.0%) missing values | Missing |
ATCH_IMG_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
JRNL_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
WRT_DATE is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 22:18:07.132978 |
---|---|
Analysis finished | 2023-12-11 22:18:09.058875 |
Duration | 1.93 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
MBN_MDA_SP_CD
Text
MISSING
 
Distinct | 76 |
---|---|
Distinct (%) | 89.4% |
Missing | 10 |
Missing (%) | 10.5% |
Memory size | 892.0 B |
Length
Max length | 312 |
---|---|
Median length | 163 |
Mean length | 116.29412 |
Min length | 3 |
Characters and Unicode
Total characters | 9885 |
---|---|
Distinct characters | 616 |
Distinct categories | 14 ? |
Distinct scripts | 3 ? |
Distinct blocks | 6 ? |
Unique
Unique | 75 ? |
---|---|
Unique (%) | 88.2% |
Sample
1st row | MBN |
---|---|
2nd row | 주제 무리뉴(57·포르투갈) 토트넘 홋스퍼 감독이 영국 축구전문가로부터 부정적인 평가를 받았다. |
3rd row | 스코틀랜드 방송 STV 축구 패널 그레이엄 러스벤은 지난 31일(한국시간) “무리뉴는 토트넘에서 힘든 2020년을 보낼 것이다. 시즌 도중 부임하여 10전 6승은 긍정적이지만 전임 마우리시오 포체티노(48·아르헨티나) 감독 시절 존재한 문제는 (근본적으로 해결된 것이 아니라) 수면 아래서 부글부글 끓고 있다”라고 지적했다. |
4th row | 러스벤은 “토트넘은 (만년 중위권이었던) 과거와 (빅클럽이) 되고자 하는 지향점 사이에서 언젠가부터 고착되어 있다. 구단은 이런 격차를 해소하기 위해 무리뉴 감독을 선임했지만, 오히려 문제를 더욱 악화시킬 수 있다”라고 예상했다. |
5th row | <!------------ PHOTO_POS_0 ------------> 한국에선 손흥민(28)에 대한 우려가 커지고 있다. 전임 포체티노 감독이 토트넘 재직 시절 손흥민을 경기당 62.1분을 출전시켰다면 무리뉴 감독 부임 후에는 78.1분으로 늘어났다. |
Value | Count | Frequency (%) |
29 | 1.4% | |
있다 | 15 | 0.7% |
수 | 15 | 0.7% |
mbn | 11 | 0.5% |
및 | 10 | 0.5% |
지난 | 9 | 0.4% |
photo_pos_0 | 9 | 0.4% |
금지 | 9 | 0.4% |
재배포 | 9 | 0.4% |
무단전재 | 9 | 0.4% |
Other values (1451) | 1959 |
Most occurring characters
Value | Count | Frequency (%) |
2017 | 20.4% | |
- | 246 | 2.5% |
다 | 223 | 2.3% |
. | 211 | 2.1% |
이 | 186 | 1.9% |
에 | 142 | 1.4% |
지 | 115 | 1.2% |
0 | 112 | 1.1% |
1 | 106 | 1.1% |
는 | 105 | 1.1% |
Other values (606) | 6422 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6065 | |
Space Separator | 2017 | 20.4% |
Decimal Number | 505 | 5.1% |
Uppercase Letter | 320 | 3.2% |
Other Punctuation | 303 | 3.1% |
Dash Punctuation | 246 | 2.5% |
Lowercase Letter | 199 | 2.0% |
Open Punctuation | 72 | 0.7% |
Close Punctuation | 72 | 0.7% |
Math Symbol | 23 | 0.2% |
Other values (4) | 63 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
다 | 223 | 3.7% |
이 | 186 | 3.1% |
에 | 142 | 2.3% |
지 | 115 | 1.9% |
는 | 105 | 1.7% |
을 | 100 | 1.6% |
스 | 93 | 1.5% |
리 | 90 | 1.5% |
은 | 87 | 1.4% |
서 | 71 | 1.2% |
Other values (537) | 4853 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 37 | |
F | 37 | |
B | 30 | |
A | 28 | 8.8% |
P | 26 | 8.1% |
K | 24 | 7.5% |
I | 18 | 5.6% |
N | 17 | 5.3% |
L | 17 | 5.3% |
S | 15 | 4.7% |
Other values (12) | 71 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 30 | |
k | 28 | |
c | 28 | |
o | 20 | |
a | 18 | |
n | 18 | |
e | 9 | 4.5% |
r | 9 | 4.5% |
g | 9 | 4.5% |
u | 9 | 4.5% |
Other values (4) | 21 |
Decimal Number
Value | Count | Frequency (%) |
0 | 112 | |
1 | 106 | |
2 | 92 | |
3 | 59 | |
9 | 28 | 5.5% |
4 | 27 | 5.3% |
5 | 24 | 4.8% |
8 | 23 | 4.6% |
7 | 22 | 4.4% |
6 | 12 | 2.4% |
Other Punctuation
Value | Count | Frequency (%) |
. | 211 | |
, | 54 | 17.8% |
! | 10 | 3.3% |
& | 9 | 3.0% |
@ | 9 | 3.0% |
· | 7 | 2.3% |
' | 3 | 1.0% |
Math Symbol
Value | Count | Frequency (%) |
< | 10 | |
> | 10 | |
~ | 2 | 8.7% |
∼ | 1 | 4.3% |
Open Punctuation
Value | Count | Frequency (%) |
( | 62 | |
[ | 10 | 13.9% |
Close Punctuation
Value | Count | Frequency (%) |
) | 62 | |
] | 10 | 13.9% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 9 | |
“ | 8 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 9 | |
” | 8 |
Space Separator
Value | Count | Frequency (%) |
2017 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 246 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 20 |
Other Symbol
Value | Count | Frequency (%) |
ⓒ | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6065 | |
Common | 3301 | |
Latin | 519 | 5.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
다 | 223 | 3.7% |
이 | 186 | 3.1% |
에 | 142 | 2.3% |
지 | 115 | 1.9% |
는 | 105 | 1.7% |
을 | 100 | 1.6% |
스 | 93 | 1.5% |
리 | 90 | 1.5% |
은 | 87 | 1.4% |
서 | 71 | 1.2% |
Other values (537) | 4853 |
Latin
Value | Count | Frequency (%) |
O | 37 | 7.1% |
F | 37 | 7.1% |
B | 30 | 5.8% |
m | 30 | 5.8% |
k | 28 | 5.4% |
c | 28 | 5.4% |
A | 28 | 5.4% |
P | 26 | 5.0% |
K | 24 | 4.6% |
o | 20 | 3.9% |
Other values (26) | 231 |
Common
Value | Count | Frequency (%) |
2017 | ||
- | 246 | 7.5% |
. | 211 | 6.4% |
0 | 112 | 3.4% |
1 | 106 | 3.2% |
2 | 92 | 2.8% |
( | 62 | 1.9% |
) | 62 | 1.9% |
3 | 59 | 1.8% |
, | 54 | 1.6% |
Other values (23) | 280 | 8.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6065 | |
ASCII | 3766 | |
Punctuation | 34 | 0.3% |
None | 10 | 0.1% |
Enclosed Alphanum | 9 | 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2017 | ||
- | 246 | 6.5% |
. | 211 | 5.6% |
0 | 112 | 3.0% |
1 | 106 | 2.8% |
2 | 92 | 2.4% |
( | 62 | 1.6% |
) | 62 | 1.6% |
3 | 59 | 1.6% |
, | 54 | 1.4% |
Other values (51) | 745 | 19.8% |
Hangul
Value | Count | Frequency (%) |
다 | 223 | 3.7% |
이 | 186 | 3.1% |
에 | 142 | 2.3% |
지 | 115 | 1.9% |
는 | 105 | 1.7% |
을 | 100 | 1.6% |
스 | 93 | 1.5% |
리 | 90 | 1.5% |
은 | 87 | 1.4% |
서 | 71 | 1.2% |
Other values (537) | 4853 |
Punctuation
Value | Count | Frequency (%) |
‘ | 9 | |
’ | 9 | |
“ | 8 | |
” | 8 |
Enclosed Alphanum
Value | Count | Frequency (%) |
ⓒ | 9 |
None
Value | Count | Frequency (%) |
· | 7 | |
m | 3 |
Math Operators
Value | Count | Frequency (%) |
∼ | 1 |
MDA_ART_ESSN_NO
Text
MISSING
 
Distinct | 20 |
---|---|
Distinct (%) | 100.0% |
Missing | 75 |
Missing (%) | 78.9% |
Memory size | 892.0 B |
Length
Max length | 143 |
---|---|
Median length | 109.5 |
Mean length | 41.5 |
Min length | 7 |
Characters and Unicode
Total characters | 830 |
---|---|
Distinct characters | 32 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 20 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 4023077 |
---|---|
2nd row | http://img.mbn.co.kr/filewww/news/other/2020/01/01/021111000001.jpg,,,,,,,,, |
3rd row | 4023153 |
4th row | http://img.mbn.co.kr/filewww/news/other/2020/01/01/210380381333.jpg,,,,,,,,, |
5th row | 4023156 |
Value | Count | Frequency (%) |
4023077 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/021111000001.jpg | 1 | 5.0% |
4023282 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/201200302001.jpg | 1 | 5.0% |
4023274 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/001100010200.jpg | 1 | 5.0% |
4023225 | 1 | 5.0% |
1 | 5.0% | |
4023215 | 1 | 5.0% |
http://img.mbn.co.kr/filewww/news/other/2020/01/01/911021110109.jpg | 1 | 5.0% |
Other values (10) | 10 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 100 | 12.0% |
, | 90 | 10.8% |
/ | 90 | 10.8% |
2 | 56 | 6.7% |
1 | 54 | 6.5% |
w | 40 | 4.8% |
. | 40 | 4.8% |
t | 30 | 3.6% |
e | 30 | 3.6% |
3 | 21 | 2.5% |
Other values (22) | 279 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 330 | |
Decimal Number | 270 | |
Other Punctuation | 230 |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
w | 40 | |
t | 30 | 9.1% |
e | 30 | 9.1% |
r | 20 | 6.1% |
o | 20 | 6.1% |
n | 20 | 6.1% |
i | 20 | 6.1% |
g | 20 | 6.1% |
m | 20 | 6.1% |
p | 20 | 6.1% |
Other values (8) | 90 |
Decimal Number
Value | Count | Frequency (%) |
0 | 100 | |
2 | 56 | |
1 | 54 | |
3 | 21 | 7.8% |
4 | 12 | 4.4% |
5 | 8 | 3.0% |
7 | 7 | 2.6% |
8 | 5 | 1.9% |
9 | 5 | 1.9% |
6 | 2 | 0.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 90 | |
/ | 90 | |
. | 40 | |
: | 10 | 4.3% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 500 | |
Latin | 330 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
w | 40 | |
t | 30 | 9.1% |
e | 30 | 9.1% |
r | 20 | 6.1% |
o | 20 | 6.1% |
n | 20 | 6.1% |
i | 20 | 6.1% |
g | 20 | 6.1% |
m | 20 | 6.1% |
p | 20 | 6.1% |
Other values (8) | 90 |
Common
Value | Count | Frequency (%) |
0 | 100 | |
, | 90 | |
/ | 90 | |
2 | 56 | |
1 | 54 | |
. | 40 | 8.0% |
3 | 21 | 4.2% |
4 | 12 | 2.4% |
: | 10 | 2.0% |
5 | 8 | 1.6% |
Other values (4) | 19 | 3.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 830 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 100 | 12.0% |
, | 90 | 10.8% |
/ | 90 | 10.8% |
2 | 56 | 6.7% |
1 | 54 | 6.5% |
w | 40 | 4.8% |
. | 40 | 4.8% |
t | 30 | 3.6% |
e | 30 | 3.6% |
3 | 21 | 2.5% |
Other values (22) | 279 |
MDA_CGR_NM
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 892.0 B |
<NA> | |
---|---|
mbn00011 | |
안준철 | |
노기완 | 1 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.3263158 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.1% |
Sample
1st row | <NA> |
---|---|
2nd row | mbn00011 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 76 | |
mbn00011 | 10 | 10.5% |
안준철 | 8 | 8.4% |
노기완 | 1 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 76 | |
mbn00011 | 10 | 10.5% |
안준철 | 8 | 8.4% |
노기완 | 1 | 1.1% |
STD_YEAR
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 11 |
---|---|
Distinct (%) | 55.0% |
Missing | 75 |
Missing (%) | 78.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.0100051 × 1013 |
Minimum | 2020 |
---|---|
Maximum | 2.0200101 × 1013 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 987.0 B |
Quantile statistics
Minimum | 2020 |
---|---|
5-th percentile | 2020 |
Q1 | 2020 |
median | 1.0100051 × 1013 |
Q3 | 2.0200101 × 1013 |
95-th percentile | 2.0200101 × 1013 |
Maximum | 2.0200101 × 1013 |
Range | 2.0200101 × 1013 |
Interquartile range (IQR) | 2.0200101 × 1013 |
Descriptive statistics
Standard deviation | 1.0362433 × 1013 |
---|---|
Coefficient of variation (CV) | 1.0259784 |
Kurtosis | -2.2352941 |
Mean | 1.0100051 × 1013 |
Median Absolute Deviation (MAD) | 1.010005 × 1013 |
Skewness | -2.223752 × 10-16 |
Sum | 2.0200101 × 1014 |
Variance | 1.0738002 × 1026 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2020 | 10 | 10.5% |
20200101001007 | 1 | 1.1% |
20200101083842 | 1 | 1.1% |
20200101085842 | 1 | 1.1% |
20200101091142 | 1 | 1.1% |
20200101094212 | 1 | 1.1% |
20200101101944 | 1 | 1.1% |
20200101103407 | 1 | 1.1% |
20200101110113 | 1 | 1.1% |
20200101121031 | 1 | 1.1% |
(Missing) | 75 |
Value | Count | Frequency (%) |
2020 | 10 | |
20200101001007 | 1 | 1.1% |
20200101083842 | 1 | 1.1% |
20200101085842 | 1 | 1.1% |
20200101091142 | 1 | 1.1% |
20200101094212 | 1 | 1.1% |
20200101101944 | 1 | 1.1% |
20200101103407 | 1 | 1.1% |
20200101110113 | 1 | 1.1% |
20200101121031 | 1 | 1.1% |
Value | Count | Frequency (%) |
20200101124701 | 1 | |
20200101121031 | 1 | |
20200101110113 | 1 | |
20200101103407 | 1 | |
20200101101944 | 1 | |
20200101094212 | 1 | |
20200101091142 | 1 | |
20200101085842 | 1 | |
20200101083842 | 1 | |
20200101001007 | 1 |
ART_SJ_CN
Text
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 100.0% |
Missing | 85 |
Missing (%) | 89.5% |
Memory size | 892.0 B |
Length
Max length | 47 |
---|---|
Median length | 36.5 |
Mean length | 33.9 |
Min length | 22 |
Characters and Unicode
Total characters | 339 |
---|---|
Distinct characters | 151 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 영국 전문가 “무리뉴, 토트넘 악화시킬 수도” |
---|---|
2nd row | 김광현, 명품 슬라이더 앞세워 ML 정복 나선다 [2020 꿈꾼다] |
3rd row | 손흥민, 번리·첼시전 골…EPL ‘2010년대 최고의 골’ 선정 |
4th row | 정정용호·박항서의 베트남, FIFA선정 ‘2019 가장 놀라운 팀’ |
5th row | 김단비, WKBL 최초 4년 연속 올스타 팬 투표 1위 |
Value | Count | Frequency (%) |
1위 | 2 | 2.6% |
챔피언 | 2 | 2.6% |
번리·첼시전 | 2 | 2.6% |
4년 | 2 | 2.6% |
epl | 1 | 1.3% |
아톰급 | 1 | 1.3% |
fc | 1 | 1.3% |
road | 1 | 1.3% |
포함 | 1 | 1.3% |
베스트골에 | 1 | 1.3% |
Other values (63) | 63 |
Most occurring characters
Value | Count | Frequency (%) |
67 | 19.8% | |
, | 10 | 2.9% |
0 | 7 | 2.1% |
L | 6 | 1.8% |
2 | 5 | 1.5% |
전 | 5 | 1.5% |
정 | 5 | 1.5% |
· | 5 | 1.5% |
A | 5 | 1.5% |
1 | 5 | 1.5% |
Other values (141) | 219 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 192 | |
Space Separator | 67 | 19.8% |
Uppercase Letter | 30 | 8.8% |
Decimal Number | 20 | 5.9% |
Other Punctuation | 18 | 5.3% |
Final Punctuation | 5 | 1.5% |
Initial Punctuation | 5 | 1.5% |
Open Punctuation | 1 | 0.3% |
Close Punctuation | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
전 | 5 | 2.6% |
정 | 5 | 2.6% |
이 | 4 | 2.1% |
년 | 4 | 2.1% |
선 | 4 | 2.1% |
다 | 4 | 2.1% |
리 | 4 | 2.1% |
골 | 4 | 2.1% |
시 | 4 | 2.1% |
에 | 3 | 1.6% |
Other values (112) | 151 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 6 | |
A | 5 | |
F | 4 | |
D | 3 | |
P | 2 | 6.7% |
E | 2 | 6.7% |
C | 1 | 3.3% |
O | 1 | 3.3% |
R | 1 | 3.3% |
M | 1 | 3.3% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
0 | 7 | |
2 | 5 | |
1 | 5 | |
4 | 2 | 10.0% |
9 | 1 | 5.0% |
Other Punctuation
Value | Count | Frequency (%) |
, | 10 | |
· | 5 | |
… | 3 | 16.7% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 4 | |
” | 1 | 20.0% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 4 | |
“ | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
67 |
Open Punctuation
Value | Count | Frequency (%) |
[ | 1 |
Close Punctuation
Value | Count | Frequency (%) |
] | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 192 | |
Common | 117 | |
Latin | 30 | 8.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
전 | 5 | 2.6% |
정 | 5 | 2.6% |
이 | 4 | 2.1% |
년 | 4 | 2.1% |
선 | 4 | 2.1% |
다 | 4 | 2.1% |
리 | 4 | 2.1% |
골 | 4 | 2.1% |
시 | 4 | 2.1% |
에 | 3 | 1.6% |
Other values (112) | 151 |
Common
Value | Count | Frequency (%) |
67 | ||
, | 10 | 8.5% |
0 | 7 | 6.0% |
2 | 5 | 4.3% |
· | 5 | 4.3% |
1 | 5 | 4.3% |
’ | 4 | 3.4% |
‘ | 4 | 3.4% |
… | 3 | 2.6% |
4 | 2 | 1.7% |
Other values (5) | 5 | 4.3% |
Latin
Value | Count | Frequency (%) |
L | 6 | |
A | 5 | |
F | 4 | |
D | 3 | |
P | 2 | 6.7% |
E | 2 | 6.7% |
C | 1 | 3.3% |
O | 1 | 3.3% |
R | 1 | 3.3% |
M | 1 | 3.3% |
Other values (4) | 4 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 192 | |
ASCII | 129 | |
Punctuation | 13 | 3.8% |
None | 5 | 1.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
67 | ||
, | 10 | 7.8% |
0 | 7 | 5.4% |
L | 6 | 4.7% |
2 | 5 | 3.9% |
A | 5 | 3.9% |
1 | 5 | 3.9% |
F | 4 | 3.1% |
D | 3 | 2.3% |
P | 2 | 1.6% |
Other values (13) | 15 | 11.6% |
Hangul
Value | Count | Frequency (%) |
전 | 5 | 2.6% |
정 | 5 | 2.6% |
이 | 4 | 2.1% |
년 | 4 | 2.1% |
선 | 4 | 2.1% |
다 | 4 | 2.1% |
리 | 4 | 2.1% |
골 | 4 | 2.1% |
시 | 4 | 2.1% |
에 | 3 | 1.6% |
Other values (112) | 151 |
None
Value | Count | Frequency (%) |
· | 5 |
Punctuation
Value | Count | Frequency (%) |
’ | 4 | |
‘ | 4 | |
… | 3 | |
” | 1 | 7.7% |
“ | 1 | 7.7% |
ART_CN
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 892.0 B |
<NA> | |
---|---|
매경닷컴 MK스포츠 안준철 기자 | 8 |
매경닷컴 MK스포츠 노기완 기자 | 1 |
<!------------ PHOTO_POS_0 ------------> | 1 |
Length
Max length | 40 |
---|---|
Median length | 4 |
Mean length | 5.6105263 |
Min length | 4 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 2.1% |
Sample
1st row | <NA> |
---|---|
2nd row | 매경닷컴 MK스포츠 노기완 기자 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 85 | |
매경닷컴 MK스포츠 안준철 기자 | 8 | 8.4% |
매경닷컴 MK스포츠 노기완 기자 | 1 | 1.1% |
<!------------ PHOTO_POS_0 ------------> | 1 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 85 | |
매경닷컴 | 9 | 7.3% |
mk스포츠 | 9 | 7.3% |
기자 | 9 | 7.3% |
안준철 | 8 | 6.5% |
2 | 1.6% | |
노기완 | 1 | 0.8% |
photo_pos_0 | 1 | 0.8% |
ATCH_IMG_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 95 |
---|---|
Missing (%) | 100.0% |
Memory size | 987.0 B |
JRNL_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 95 |
---|---|
Missing (%) | 100.0% |
Memory size | 987.0 B |
WRT_DATE
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 95 |
---|---|
Missing (%) | 100.0% |
Memory size | 987.0 B |
Unnamed: 9
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 95 |
---|---|
Missing (%) | 100.0% |
Memory size | 987.0 B |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | |
---|---|---|---|---|---|---|
MBN_MDA_SP_CD | 1.000 | 1.000 | 1.000 | NaN | NaN | NaN |
MDA_ART_ESSN_NO | 1.000 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
MDA_CGR_NM | 1.000 | 1.000 | 1.000 | NaN | NaN | NaN |
STD_YEAR | NaN | NaN | NaN | 1.000 | NaN | NaN |
ART_SJ_CN | NaN | 1.000 | NaN | NaN | 1.000 | 1.000 |
ART_CN | NaN | 1.000 | NaN | NaN | 1.000 | 1.000 |
ART_CN | MDA_CGR_NM | |
---|---|---|
ART_CN | 1.000 | 1.000 |
MDA_CGR_NM | 1.000 | 1.000 |
STD_YEAR | MDA_CGR_NM | ART_CN | |
---|---|---|---|
STD_YEAR | 1.000 | 0.970 | 1.000 |
MDA_CGR_NM | 0.970 | 1.000 | 1.000 |
ART_CN | 1.000 | 1.000 | 1.000 |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | MBN | 4023077 | mbn00011 | 2020 | 영국 전문가 “무리뉴, 토트넘 악화시킬 수도” | 매경닷컴 MK스포츠 노기완 기자 | <NA> | <NA> | <NA> | <NA> |
2 | 주제 무리뉴(57·포르투갈) 토트넘 홋스퍼 감독이 영국 축구전문가로부터 부정적인 평가를 받았다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | 스코틀랜드 방송 STV 축구 패널 그레이엄 러스벤은 지난 31일(한국시간) “무리뉴는 토트넘에서 힘든 2020년을 보낼 것이다. 시즌 도중 부임하여 10전 6승은 긍정적이지만 전임 마우리시오 포체티노(48·아르헨티나) 감독 시절 존재한 문제는 (근본적으로 해결된 것이 아니라) 수면 아래서 부글부글 끓고 있다”라고 지적했다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | 러스벤은 “토트넘은 (만년 중위권이었던) 과거와 (빅클럽이) 되고자 하는 지향점 사이에서 언젠가부터 고착되어 있다. 구단은 이런 격차를 해소하기 위해 무리뉴 감독을 선임했지만, 오히려 문제를 더욱 악화시킬 수 있다”라고 예상했다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | <!------------ PHOTO_POS_0 ------------> 한국에선 손흥민(28)에 대한 우려가 커지고 있다. 전임 포체티노 감독이 토트넘 재직 시절 손흥민을 경기당 62.1분을 출전시켰다면 무리뉴 감독 부임 후에는 78.1분으로 늘어났다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | 손흥민은 아시아에서 A매치를 치르는 경우가 대부분이기에 유럽 현지 선수보다 비행거리에 따른 과부하가 크다. 관리를 해줘야 한다는 얘기다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | 포체티노 감독은 토트넘을 유럽축구연맹(UEFA) 챔피언스리그 준우승과 잉글랜드 프리미어리그(EPL) 2위로 이끌며 찬사를 받았다. 그러나 토트넘은 영국 수도 런던이라는 좋은 연고지를 기반으로 하는 클럽임에도 자본력 한계가 분명하다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | 토트넘은 성적이 우수하면 우수할수록 몸값이 상승할 기본 스타를 다 잔류시킬 수 없는 팀이다. 억지로 남기면 명성 대비 낮은 연봉 때문에 불만이 쌓이고 경기력은 저하된다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | 누구보다 포체티노 감독부터가 챔피언스리그 결승전 패배 직후 ‘토트넘으로 이보다 더 좋은 성적은 낼 수 없다’라는 것을 너무도 잘 알기에 동기부여에 어려움을 겪었다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | ATCH_IMG_NM | JRNL_NM | WRT_DATE | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
85 | 이들 준척급 선수 3명 모두 원소속 구단과의 협상에만 집중하는 양상이다. 보상금과 보상선수 규정에 타구단들도 시장에 나온 이들을 외면하는 분위기다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
86 | 해를 넘긴 줄다리기는 쉽게 끝나지 않을 전망. 결국 스프링캠프가 열리는 2월까지도 지켜봐야 한다. jcan1231@maekyung.com[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지] | http://img.mbn.co.kr/filewww/news/other/2020/01/01/201200302001.jpg,,,,,,,,, | 안준철 | 20200101121031 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
87 | MBN | 4023282 | mbn00011 | 2020 | 류현진에 4년 제시한 LAD, 금액서 토론토와 차이컸다 | 매경닷컴 MK스포츠 안준철 기자 | <NA> | <NA> | <NA> | <NA> |
88 | LA다저스도 류현진(33·토론토 블루제이스)에게 4년 계약을 제시했던 것으로 알려졌다. 하지만 금액에서 토론토와 차이가 컸다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
89 | LA타임스는 1일(한국시간) 다저스가 류현진에게 4년 계약을 제시했지만 연봉 조건이 낮았다고 보도했다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
90 | LA타임스에 따르면 다저스는 스토브리그(정규리그가 끝난 뒤 오프시즌 동안 전력보강을 위해 구단들이 작업하는 것) 초반 게릿 콜, 스티븐 스트라스버그, 앤서니 렌돈 등의 영입전에 뛰어들었지만 모두 실패했다. 이어 다저스는 선발 강화를 위해 매디슨 범가너를 영입하려 했지만 범가너는 애리조나와 계약했다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
91 | 결국 다저스는 남아 있는 선발 중 최고 카드인 류현진 영입을 고려했다. 지난 7시즌 동안 다저스 유니폼을 입고 있었고, 2019시즌에는 실질적인 다저스 에이스 역할을 했다. 내셔널리그사이영상 2위에도 올랐다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
92 | <!------------ PHOTO_POS_0 ------------> 결국 계약기간은 다저스도 토론토와 같았다. 하지만 금액 차가 컸다. 류현진은 토론토와 4년 8000만 달러(약 930억원)에 계약했다. 토론토는 류현진 영입에 있어 투구 능력 뿐만 아니라 팀을 이끌어갈 수 있는 리더로서의 능력도 크게 고려했다. 등번호도 기존에 달던 99번을 그대로 달게 됐다. 토론토 최초의 99번 선수다. 99번은 캐나다에서 남다른 의미가 있다. 캐나다의 국기인 아이스하키의 전설 웨인 그레츠키의 번호이기 때문이다. | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
93 | 이번 계약으로 류현진은 한국인 투수 FA 역대 최대 규모 계약의 주인공이 됐다. 동시에 토론토 구단의 역대 투수 FA 최고 계약 신기록도 썼다. 토론토 FA 최고 계약 선수는 외야수 버넌 웰스(7년 1억2600만 달러)다. 2위는 포수 러셀 마틴(5년 8200만 달러)이다. 류현진은 전체로는 세 번째, 투수로는 최고 계약이다. jcan1231@maekyung.com[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지] | http://img.mbn.co.kr/filewww/news/other/2020/01/01/117021027007.jpg,,,,,,,,, | 안준철 | 20200101124701 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
94 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
MBN_MDA_SP_CD | MDA_ART_ESSN_NO | MDA_CGR_NM | STD_YEAR | ART_SJ_CN | ART_CN | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 10 |