Overview

Dataset statistics

Number of variables10
Number of observations95
Missing cells625
Missing cells (%)65.8%
Duplicate rows1
Duplicate rows (%)1.1%
Total size in memory8.0 KiB
Average record size in memory86.4 B

Variable types

Text3
Categorical2
Numeric1
Unsupported4

Dataset

Description샘플 데이터
AuthorMBN
URLhttps://kdx.kr/data/view/26946

Alerts

Dataset has 1 (1.1%) duplicate rowsDuplicates
ART_CN is highly overall correlated with STD_YEAR and 1 other fieldsHigh correlation
MDA_CGR_NM is highly overall correlated with STD_YEAR and 1 other fieldsHigh correlation
STD_YEAR is highly overall correlated with MDA_CGR_NM and 1 other fieldsHigh correlation
MDA_CGR_NM is highly imbalanced (51.5%)Imbalance
ART_CN is highly imbalanced (70.9%)Imbalance
MBN_MDA_SP_CD has 10 (10.5%) missing valuesMissing
MDA_ART_ESSN_NO has 75 (78.9%) missing valuesMissing
STD_YEAR has 75 (78.9%) missing valuesMissing
ART_SJ_CN has 85 (89.5%) missing valuesMissing
ATCH_IMG_NM has 95 (100.0%) missing valuesMissing
JRNL_NM has 95 (100.0%) missing valuesMissing
WRT_DATE has 95 (100.0%) missing valuesMissing
Unnamed: 9 has 95 (100.0%) missing valuesMissing
ATCH_IMG_NM is an unsupported type, check if it needs cleaning or further analysisUnsupported
JRNL_NM is an unsupported type, check if it needs cleaning or further analysisUnsupported
WRT_DATE is an unsupported type, check if it needs cleaning or further analysisUnsupported
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2023-12-11 22:18:07.132978
Analysis finished2023-12-11 22:18:09.058875
Duration1.93 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

MBN_MDA_SP_CD
Text

MISSING 

Distinct76
Distinct (%)89.4%
Missing10
Missing (%)10.5%
Memory size892.0 B
2023-12-12T07:18:09.258340image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length312
Median length163
Mean length116.29412
Min length3

Characters and Unicode

Total characters9885
Distinct characters616
Distinct categories14 ?
Distinct scripts3 ?
Distinct blocks6 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique75 ?
Unique (%)88.2%

Sample

1st rowMBN
2nd row주제 무리뉴(57·포르투갈) 토트넘 홋스퍼 감독이 영국 축구전문가로부터 부정적인 평가를 받았다.
3rd row스코틀랜드 방송 STV 축구 패널 그레이엄 러스벤은 지난 31일(한국시간) “무리뉴는 토트넘에서 힘든 2020년을 보낼 것이다. 시즌 도중 부임하여 10전 6승은 긍정적이지만 전임 마우리시오 포체티노(48·아르헨티나) 감독 시절 존재한 문제는 (근본적으로 해결된 것이 아니라) 수면 아래서 부글부글 끓고 있다”라고 지적했다.
4th row러스벤은 “토트넘은 (만년 중위권이었던) 과거와 (빅클럽이) 되고자 하는 지향점 사이에서 언젠가부터 고착되어 있다. 구단은 이런 격차를 해소하기 위해 무리뉴 감독을 선임했지만, 오히려 문제를 더욱 악화시킬 수 있다”라고 예상했다.
5th row <!------------ PHOTO_POS_0 ------------> 한국에선 손흥민(28)에 대한 우려가 커지고 있다. 전임 포체티노 감독이 토트넘 재직 시절 손흥민을 경기당 62.1분을 출전시켰다면 무리뉴 감독 부임 후에는 78.1분으로 늘어났다.
ValueCountFrequency (%)
29
 
1.4%
있다 15
 
0.7%
15
 
0.7%
mbn 11
 
0.5%
10
 
0.5%
지난 9
 
0.4%
photo_pos_0 9
 
0.4%
금지 9
 
0.4%
재배포 9
 
0.4%
무단전재 9
 
0.4%
Other values (1451) 1959
94.0%
2023-12-12T07:18:09.669573image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2017
 
20.4%
- 246
 
2.5%
223
 
2.3%
. 211
 
2.1%
186
 
1.9%
142
 
1.4%
115
 
1.2%
0 112
 
1.1%
1 106
 
1.1%
105
 
1.1%
Other values (606) 6422
65.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 6065
61.4%
Space Separator 2017
 
20.4%
Decimal Number 505
 
5.1%
Uppercase Letter 320
 
3.2%
Other Punctuation 303
 
3.1%
Dash Punctuation 246
 
2.5%
Lowercase Letter 199
 
2.0%
Open Punctuation 72
 
0.7%
Close Punctuation 72
 
0.7%
Math Symbol 23
 
0.2%
Other values (4) 63
 
0.6%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
223
 
3.7%
186
 
3.1%
142
 
2.3%
115
 
1.9%
105
 
1.7%
100
 
1.6%
93
 
1.5%
90
 
1.5%
87
 
1.4%
71
 
1.2%
Other values (537) 4853
80.0%
Uppercase Letter
ValueCountFrequency (%)
O 37
11.6%
F 37
11.6%
B 30
9.4%
A 28
 
8.8%
P 26
 
8.1%
K 24
 
7.5%
I 18
 
5.6%
N 17
 
5.3%
L 17
 
5.3%
S 15
 
4.7%
Other values (12) 71
22.2%
Lowercase Letter
ValueCountFrequency (%)
m 30
15.1%
k 28
14.1%
c 28
14.1%
o 20
10.1%
a 18
9.0%
n 18
9.0%
e 9
 
4.5%
r 9
 
4.5%
g 9
 
4.5%
u 9
 
4.5%
Other values (4) 21
10.6%
Decimal Number
ValueCountFrequency (%)
0 112
22.2%
1 106
21.0%
2 92
18.2%
3 59
11.7%
9 28
 
5.5%
4 27
 
5.3%
5 24
 
4.8%
8 23
 
4.6%
7 22
 
4.4%
6 12
 
2.4%
Other Punctuation
ValueCountFrequency (%)
. 211
69.6%
, 54
 
17.8%
! 10
 
3.3%
& 9
 
3.0%
@ 9
 
3.0%
· 7
 
2.3%
' 3
 
1.0%
Math Symbol
ValueCountFrequency (%)
< 10
43.5%
> 10
43.5%
~ 2
 
8.7%
1
 
4.3%
Open Punctuation
ValueCountFrequency (%)
( 62
86.1%
[ 10
 
13.9%
Close Punctuation
ValueCountFrequency (%)
) 62
86.1%
] 10
 
13.9%
Initial Punctuation
ValueCountFrequency (%)
9
52.9%
8
47.1%
Final Punctuation
ValueCountFrequency (%)
9
52.9%
8
47.1%
Space Separator
ValueCountFrequency (%)
2017
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 246
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 20
100.0%
Other Symbol
ValueCountFrequency (%)
9
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 6065
61.4%
Common 3301
33.4%
Latin 519
 
5.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
223
 
3.7%
186
 
3.1%
142
 
2.3%
115
 
1.9%
105
 
1.7%
100
 
1.6%
93
 
1.5%
90
 
1.5%
87
 
1.4%
71
 
1.2%
Other values (537) 4853
80.0%
Latin
ValueCountFrequency (%)
O 37
 
7.1%
F 37
 
7.1%
B 30
 
5.8%
m 30
 
5.8%
k 28
 
5.4%
c 28
 
5.4%
A 28
 
5.4%
P 26
 
5.0%
K 24
 
4.6%
o 20
 
3.9%
Other values (26) 231
44.5%
Common
ValueCountFrequency (%)
2017
61.1%
- 246
 
7.5%
. 211
 
6.4%
0 112
 
3.4%
1 106
 
3.2%
2 92
 
2.8%
( 62
 
1.9%
) 62
 
1.9%
3 59
 
1.8%
, 54
 
1.6%
Other values (23) 280
 
8.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 6065
61.4%
ASCII 3766
38.1%
Punctuation 34
 
0.3%
None 10
 
0.1%
Enclosed Alphanum 9
 
0.1%
Math Operators 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2017
53.6%
- 246
 
6.5%
. 211
 
5.6%
0 112
 
3.0%
1 106
 
2.8%
2 92
 
2.4%
( 62
 
1.6%
) 62
 
1.6%
3 59
 
1.6%
, 54
 
1.4%
Other values (51) 745
 
19.8%
Hangul
ValueCountFrequency (%)
223
 
3.7%
186
 
3.1%
142
 
2.3%
115
 
1.9%
105
 
1.7%
100
 
1.6%
93
 
1.5%
90
 
1.5%
87
 
1.4%
71
 
1.2%
Other values (537) 4853
80.0%
Punctuation
ValueCountFrequency (%)
9
26.5%
9
26.5%
8
23.5%
8
23.5%
Enclosed Alphanum
ValueCountFrequency (%)
9
100.0%
None
ValueCountFrequency (%)
· 7
70.0%
3
30.0%
Math Operators
ValueCountFrequency (%)
1
100.0%

MDA_ART_ESSN_NO
Text

MISSING 

Distinct20
Distinct (%)100.0%
Missing75
Missing (%)78.9%
Memory size892.0 B
2023-12-12T07:18:09.884873image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length143
Median length109.5
Mean length41.5
Min length7

Characters and Unicode

Total characters830
Distinct characters32
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique20 ?
Unique (%)100.0%

Sample

1st row4023077
2nd rowhttp://img.mbn.co.kr/filewww/news/other/2020/01/01/021111000001.jpg,,,,,,,,,
3rd row4023153
4th rowhttp://img.mbn.co.kr/filewww/news/other/2020/01/01/210380381333.jpg,,,,,,,,,
5th row4023156
ValueCountFrequency (%)
4023077 1
 
5.0%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/021111000001.jpg 1
 
5.0%
4023282 1
 
5.0%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/201200302001.jpg 1
 
5.0%
4023274 1
 
5.0%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/001100010200.jpg 1
 
5.0%
4023225 1
 
5.0%
1
 
5.0%
4023215 1
 
5.0%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/911021110109.jpg 1
 
5.0%
Other values (10) 10
50.0%
2023-12-12T07:18:10.191985image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 100
 
12.0%
, 90
 
10.8%
/ 90
 
10.8%
2 56
 
6.7%
1 54
 
6.5%
w 40
 
4.8%
. 40
 
4.8%
t 30
 
3.6%
e 30
 
3.6%
3 21
 
2.5%
Other values (22) 279
33.6%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 330
39.8%
Decimal Number 270
32.5%
Other Punctuation 230
27.7%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
w 40
12.1%
t 30
 
9.1%
e 30
 
9.1%
r 20
 
6.1%
o 20
 
6.1%
n 20
 
6.1%
i 20
 
6.1%
g 20
 
6.1%
m 20
 
6.1%
p 20
 
6.1%
Other values (8) 90
27.3%
Decimal Number
ValueCountFrequency (%)
0 100
37.0%
2 56
20.7%
1 54
20.0%
3 21
 
7.8%
4 12
 
4.4%
5 8
 
3.0%
7 7
 
2.6%
8 5
 
1.9%
9 5
 
1.9%
6 2
 
0.7%
Other Punctuation
ValueCountFrequency (%)
, 90
39.1%
/ 90
39.1%
. 40
17.4%
: 10
 
4.3%

Most occurring scripts

ValueCountFrequency (%)
Common 500
60.2%
Latin 330
39.8%

Most frequent character per script

Latin
ValueCountFrequency (%)
w 40
12.1%
t 30
 
9.1%
e 30
 
9.1%
r 20
 
6.1%
o 20
 
6.1%
n 20
 
6.1%
i 20
 
6.1%
g 20
 
6.1%
m 20
 
6.1%
p 20
 
6.1%
Other values (8) 90
27.3%
Common
ValueCountFrequency (%)
0 100
20.0%
, 90
18.0%
/ 90
18.0%
2 56
11.2%
1 54
10.8%
. 40
 
8.0%
3 21
 
4.2%
4 12
 
2.4%
: 10
 
2.0%
5 8
 
1.6%
Other values (4) 19
 
3.8%

Most occurring blocks

ValueCountFrequency (%)
ASCII 830
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 100
 
12.0%
, 90
 
10.8%
/ 90
 
10.8%
2 56
 
6.7%
1 54
 
6.5%
w 40
 
4.8%
. 40
 
4.8%
t 30
 
3.6%
e 30
 
3.6%
3 21
 
2.5%
Other values (22) 279
33.6%

MDA_CGR_NM
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct4
Distinct (%)4.2%
Missing0
Missing (%)0.0%
Memory size892.0 B
<NA>
76 
mbn00011
10 
안준철
노기완
 
1

Length

Max length8
Median length4
Mean length4.3263158
Min length3

Unique

Unique1 ?
Unique (%)1.1%

Sample

1st row<NA>
2nd rowmbn00011
3rd row<NA>
4th row<NA>
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 76
80.0%
mbn00011 10
 
10.5%
안준철 8
 
8.4%
노기완 1
 
1.1%

Length

2023-12-12T07:18:10.291562image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T07:18:10.379345image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
na 76
80.0%
mbn00011 10
 
10.5%
안준철 8
 
8.4%
노기완 1
 
1.1%

STD_YEAR
Real number (ℝ)

HIGH CORRELATION  MISSING 

Distinct11
Distinct (%)55.0%
Missing75
Missing (%)78.9%
Infinite0
Infinite (%)0.0%
Mean1.0100051 × 1013
Minimum2020
Maximum2.0200101 × 1013
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size987.0 B
2023-12-12T07:18:10.454532image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2020
5-th percentile2020
Q12020
median1.0100051 × 1013
Q32.0200101 × 1013
95-th percentile2.0200101 × 1013
Maximum2.0200101 × 1013
Range2.0200101 × 1013
Interquartile range (IQR)2.0200101 × 1013

Descriptive statistics

Standard deviation1.0362433 × 1013
Coefficient of variation (CV)1.0259784
Kurtosis-2.2352941
Mean1.0100051 × 1013
Median Absolute Deviation (MAD)1.010005 × 1013
Skewness-2.223752 × 10-16
Sum2.0200101 × 1014
Variance1.0738002 × 1026
MonotonicityNot monotonic
2023-12-12T07:18:10.562127image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=11)
ValueCountFrequency (%)
2020 10
 
10.5%
20200101001007 1
 
1.1%
20200101083842 1
 
1.1%
20200101085842 1
 
1.1%
20200101091142 1
 
1.1%
20200101094212 1
 
1.1%
20200101101944 1
 
1.1%
20200101103407 1
 
1.1%
20200101110113 1
 
1.1%
20200101121031 1
 
1.1%
(Missing) 75
78.9%
ValueCountFrequency (%)
2020 10
10.5%
20200101001007 1
 
1.1%
20200101083842 1
 
1.1%
20200101085842 1
 
1.1%
20200101091142 1
 
1.1%
20200101094212 1
 
1.1%
20200101101944 1
 
1.1%
20200101103407 1
 
1.1%
20200101110113 1
 
1.1%
20200101121031 1
 
1.1%
ValueCountFrequency (%)
20200101124701 1
1.1%
20200101121031 1
1.1%
20200101110113 1
1.1%
20200101103407 1
1.1%
20200101101944 1
1.1%
20200101094212 1
1.1%
20200101091142 1
1.1%
20200101085842 1
1.1%
20200101083842 1
1.1%
20200101001007 1
1.1%

ART_SJ_CN
Text

MISSING 

Distinct10
Distinct (%)100.0%
Missing85
Missing (%)89.5%
Memory size892.0 B
2023-12-12T07:18:10.770959image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length47
Median length36.5
Mean length33.9
Min length22

Characters and Unicode

Total characters339
Distinct characters151
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10 ?
Unique (%)100.0%

Sample

1st row영국 전문가 “무리뉴, 토트넘 악화시킬 수도”
2nd row김광현, 명품 슬라이더 앞세워 ML 정복 나선다 [2020 꿈꾼다]
3rd row손흥민, 번리·첼시전 골…EPL ‘2010년대 최고의 골’ 선정
4th row정정용호·박항서의 베트남, FIFA선정 ‘2019 가장 놀라운 팀’
5th row김단비, WKBL 최초 4년 연속 올스타 팬 투표 1위
ValueCountFrequency (%)
1위 2
 
2.6%
챔피언 2
 
2.6%
번리·첼시전 2
 
2.6%
4년 2
 
2.6%
epl 1
 
1.3%
아톰급 1
 
1.3%
fc 1
 
1.3%
road 1
 
1.3%
포함 1
 
1.3%
베스트골에 1
 
1.3%
Other values (63) 63
81.8%
2023-12-12T07:18:11.100539image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
67
 
19.8%
, 10
 
2.9%
0 7
 
2.1%
L 6
 
1.8%
2 5
 
1.5%
5
 
1.5%
5
 
1.5%
· 5
 
1.5%
A 5
 
1.5%
1 5
 
1.5%
Other values (141) 219
64.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 192
56.6%
Space Separator 67
 
19.8%
Uppercase Letter 30
 
8.8%
Decimal Number 20
 
5.9%
Other Punctuation 18
 
5.3%
Final Punctuation 5
 
1.5%
Initial Punctuation 5
 
1.5%
Open Punctuation 1
 
0.3%
Close Punctuation 1
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
5
 
2.6%
5
 
2.6%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
3
 
1.6%
Other values (112) 151
78.6%
Uppercase Letter
ValueCountFrequency (%)
L 6
20.0%
A 5
16.7%
F 4
13.3%
D 3
10.0%
P 2
 
6.7%
E 2
 
6.7%
C 1
 
3.3%
O 1
 
3.3%
R 1
 
3.3%
M 1
 
3.3%
Other values (4) 4
13.3%
Decimal Number
ValueCountFrequency (%)
0 7
35.0%
2 5
25.0%
1 5
25.0%
4 2
 
10.0%
9 1
 
5.0%
Other Punctuation
ValueCountFrequency (%)
, 10
55.6%
· 5
27.8%
3
 
16.7%
Final Punctuation
ValueCountFrequency (%)
4
80.0%
1
 
20.0%
Initial Punctuation
ValueCountFrequency (%)
4
80.0%
1
 
20.0%
Space Separator
ValueCountFrequency (%)
67
100.0%
Open Punctuation
ValueCountFrequency (%)
[ 1
100.0%
Close Punctuation
ValueCountFrequency (%)
] 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 192
56.6%
Common 117
34.5%
Latin 30
 
8.8%

Most frequent character per script

Hangul
ValueCountFrequency (%)
5
 
2.6%
5
 
2.6%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
3
 
1.6%
Other values (112) 151
78.6%
Common
ValueCountFrequency (%)
67
57.3%
, 10
 
8.5%
0 7
 
6.0%
2 5
 
4.3%
· 5
 
4.3%
1 5
 
4.3%
4
 
3.4%
4
 
3.4%
3
 
2.6%
4 2
 
1.7%
Other values (5) 5
 
4.3%
Latin
ValueCountFrequency (%)
L 6
20.0%
A 5
16.7%
F 4
13.3%
D 3
10.0%
P 2
 
6.7%
E 2
 
6.7%
C 1
 
3.3%
O 1
 
3.3%
R 1
 
3.3%
M 1
 
3.3%
Other values (4) 4
13.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 192
56.6%
ASCII 129
38.1%
Punctuation 13
 
3.8%
None 5
 
1.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
67
51.9%
, 10
 
7.8%
0 7
 
5.4%
L 6
 
4.7%
2 5
 
3.9%
A 5
 
3.9%
1 5
 
3.9%
F 4
 
3.1%
D 3
 
2.3%
P 2
 
1.6%
Other values (13) 15
 
11.6%
Hangul
ValueCountFrequency (%)
5
 
2.6%
5
 
2.6%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
3
 
1.6%
Other values (112) 151
78.6%
None
ValueCountFrequency (%)
· 5
100.0%
Punctuation
ValueCountFrequency (%)
4
30.8%
4
30.8%
3
23.1%
1
 
7.7%
1
 
7.7%

ART_CN
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct4
Distinct (%)4.2%
Missing0
Missing (%)0.0%
Memory size892.0 B
<NA>
85 
매경닷컴 MK스포츠 안준철 기자
 
8
매경닷컴 MK스포츠 노기완 기자
 
1
<!------------ PHOTO_POS_0 ------------>
 
1

Length

Max length40
Median length4
Mean length5.6105263
Min length4

Unique

Unique2 ?
Unique (%)2.1%

Sample

1st row<NA>
2nd row매경닷컴 MK스포츠 노기완 기자
3rd row<NA>
4th row<NA>
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 85
89.5%
매경닷컴 MK스포츠 안준철 기자 8
 
8.4%
매경닷컴 MK스포츠 노기완 기자 1
 
1.1%
<!------------ PHOTO_POS_0 ------------> 1
 
1.1%

Length

2023-12-12T07:18:11.483677image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T07:18:11.567837image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
na 85
68.5%
매경닷컴 9
 
7.3%
mk스포츠 9
 
7.3%
기자 9
 
7.3%
안준철 8
 
6.5%
2
 
1.6%
노기완 1
 
0.8%
photo_pos_0 1
 
0.8%

ATCH_IMG_NM
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing95
Missing (%)100.0%
Memory size987.0 B

JRNL_NM
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing95
Missing (%)100.0%
Memory size987.0 B

WRT_DATE
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing95
Missing (%)100.0%
Memory size987.0 B

Unnamed: 9
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing95
Missing (%)100.0%
Memory size987.0 B

Interactions

2023-12-12T07:18:08.545599image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T07:18:11.632731image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CN
MBN_MDA_SP_CD1.0001.0001.000NaNNaNNaN
MDA_ART_ESSN_NO1.0001.0001.000NaN1.0001.000
MDA_CGR_NM1.0001.0001.000NaNNaNNaN
STD_YEARNaNNaNNaN1.000NaNNaN
ART_SJ_CNNaN1.000NaNNaN1.0001.000
ART_CNNaN1.000NaNNaN1.0001.000
2023-12-12T07:18:11.723945image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ART_CNMDA_CGR_NM
ART_CN1.0001.000
MDA_CGR_NM1.0001.000
2023-12-12T07:18:11.789029image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
STD_YEARMDA_CGR_NMART_CN
STD_YEAR1.0000.9701.000
MDA_CGR_NM0.9701.0001.000
ART_CN1.0001.0001.000

Missing values

2023-12-12T07:18:08.719434image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T07:18:08.862130image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-12T07:18:08.981910image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CNATCH_IMG_NMJRNL_NMWRT_DATEUnnamed: 9
0<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>
1MBN4023077mbn000112020영국 전문가 “무리뉴, 토트넘 악화시킬 수도”매경닷컴 MK스포츠 노기완 기자<NA><NA><NA><NA>
2주제 무리뉴(57·포르투갈) 토트넘 홋스퍼 감독이 영국 축구전문가로부터 부정적인 평가를 받았다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
3스코틀랜드 방송 STV 축구 패널 그레이엄 러스벤은 지난 31일(한국시간) “무리뉴는 토트넘에서 힘든 2020년을 보낼 것이다. 시즌 도중 부임하여 10전 6승은 긍정적이지만 전임 마우리시오 포체티노(48·아르헨티나) 감독 시절 존재한 문제는 (근본적으로 해결된 것이 아니라) 수면 아래서 부글부글 끓고 있다”라고 지적했다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
4러스벤은 “토트넘은 (만년 중위권이었던) 과거와 (빅클럽이) 되고자 하는 지향점 사이에서 언젠가부터 고착되어 있다. 구단은 이런 격차를 해소하기 위해 무리뉴 감독을 선임했지만, 오히려 문제를 더욱 악화시킬 수 있다”라고 예상했다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
5<!------------ PHOTO_POS_0 ------------> 한국에선 손흥민(28)에 대한 우려가 커지고 있다. 전임 포체티노 감독이 토트넘 재직 시절 손흥민을 경기당 62.1분을 출전시켰다면 무리뉴 감독 부임 후에는 78.1분으로 늘어났다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
6손흥민은 아시아에서 A매치를 치르는 경우가 대부분이기에 유럽 현지 선수보다 비행거리에 따른 과부하가 크다. 관리를 해줘야 한다는 얘기다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
7포체티노 감독은 토트넘을 유럽축구연맹(UEFA) 챔피언스리그 준우승과 잉글랜드 프리미어리그(EPL) 2위로 이끌며 찬사를 받았다. 그러나 토트넘은 영국 수도 런던이라는 좋은 연고지를 기반으로 하는 클럽임에도 자본력 한계가 분명하다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
8토트넘은 성적이 우수하면 우수할수록 몸값이 상승할 기본 스타를 다 잔류시킬 수 없는 팀이다. 억지로 남기면 명성 대비 낮은 연봉 때문에 불만이 쌓이고 경기력은 저하된다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
9누구보다 포체티노 감독부터가 챔피언스리그 결승전 패배 직후 ‘토트넘으로 이보다 더 좋은 성적은 낼 수 없다’라는 것을 너무도 잘 알기에 동기부여에 어려움을 겪었다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CNATCH_IMG_NMJRNL_NMWRT_DATEUnnamed: 9
85이들 준척급 선수 3명 모두 원소속 구단과의 협상에만 집중하는 양상이다. 보상금과 보상선수 규정에 타구단들도 시장에 나온 이들을 외면하는 분위기다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
86해를 넘긴 줄다리기는 쉽게 끝나지 않을 전망. 결국 스프링캠프가 열리는 2월까지도 지켜봐야 한다. jcan1231@maekyung.com[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]http://img.mbn.co.kr/filewww/news/other/2020/01/01/201200302001.jpg,,,,,,,,,안준철20200101121031<NA><NA><NA><NA><NA><NA>
87MBN4023282mbn000112020류현진에 4년 제시한 LAD, 금액서 토론토와 차이컸다매경닷컴 MK스포츠 안준철 기자<NA><NA><NA><NA>
88LA다저스도 류현진(33·토론토 블루제이스)에게 4년 계약을 제시했던 것으로 알려졌다. 하지만 금액에서 토론토와 차이가 컸다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
89LA타임스는 1일(한국시간) 다저스가 류현진에게 4년 계약을 제시했지만 연봉 조건이 낮았다고 보도했다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
90LA타임스에 따르면 다저스는 스토브리그(정규리그가 끝난 뒤 오프시즌 동안 전력보강을 위해 구단들이 작업하는 것) 초반 게릿 콜, 스티븐 스트라스버그, 앤서니 렌돈 등의 영입전에 뛰어들었지만 모두 실패했다. 이어 다저스는 선발 강화를 위해 매디슨 범가너를 영입하려 했지만 범가너는 애리조나와 계약했다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
91결국 다저스는 남아 있는 선발 중 최고 카드인 류현진 영입을 고려했다. 지난 7시즌 동안 다저스 유니폼을 입고 있었고, 2019시즌에는 실질적인 다저스 에이스 역할을 했다. 내셔널리그사이영상 2위에도 올랐다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
92<!------------ PHOTO_POS_0 ------------> 결국 계약기간은 다저스도 토론토와 같았다. 하지만 금액 차가 컸다. 류현진은 토론토와 4년 8000만 달러(약 930억원)에 계약했다. 토론토는 류현진 영입에 있어 투구 능력 뿐만 아니라 팀을 이끌어갈 수 있는 리더로서의 능력도 크게 고려했다. 등번호도 기존에 달던 99번을 그대로 달게 됐다. 토론토 최초의 99번 선수다. 99번은 캐나다에서 남다른 의미가 있다. 캐나다의 국기인 아이스하키의 전설 웨인 그레츠키의 번호이기 때문이다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
93이번 계약으로 류현진은 한국인 투수 FA 역대 최대 규모 계약의 주인공이 됐다. 동시에 토론토 구단의 역대 투수 FA 최고 계약 신기록도 썼다. 토론토 FA 최고 계약 선수는 외야수 버넌 웰스(7년 1억2600만 달러)다. 2위는 포수 러셀 마틴(5년 8200만 달러)이다. 류현진은 전체로는 세 번째, 투수로는 최고 계약이다. jcan1231@maekyung.com[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]http://img.mbn.co.kr/filewww/news/other/2020/01/01/117021027007.jpg,,,,,,,,,안준철20200101124701<NA><NA><NA><NA><NA><NA>
94<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>

Duplicate rows

Most frequently occurring

MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CN# duplicates
0<NA><NA><NA><NA><NA><NA>10