Overview

Dataset statistics

Number of variables10
Number of observations85
Missing cells609
Missing cells (%)71.6%
Duplicate rows1
Duplicate rows (%)1.2%
Total size in memory7.2 KiB
Average record size in memory86.6 B

Variable types

Text5
Numeric1
Unsupported3
Categorical1

Dataset

Description샘플 데이터
AuthorMBN
URLhttps://kdx.kr/data/view/26941

Alerts

Dataset has 1 (1.2%) duplicate rowsDuplicates
WRT_DATE is highly imbalanced (90.8%)Imbalance
MBN_MDA_SP_CD has 4 (4.7%) missing valuesMissing
MDA_ART_ESSN_NO has 68 (80.0%) missing valuesMissing
MDA_CGR_NM has 66 (77.6%) missing valuesMissing
STD_YEAR has 66 (77.6%) missing valuesMissing
ART_SJ_CN has 75 (88.2%) missing valuesMissing
ART_CN has 75 (88.2%) missing valuesMissing
ATCH_IMG_NM has 85 (100.0%) missing valuesMissing
JRNL_NM has 85 (100.0%) missing valuesMissing
Unnamed: 9 has 85 (100.0%) missing valuesMissing
ATCH_IMG_NM is an unsupported type, check if it needs cleaning or further analysisUnsupported
JRNL_NM is an unsupported type, check if it needs cleaning or further analysisUnsupported
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2023-12-11 21:15:57.941913
Analysis finished2023-12-11 21:15:58.949242
Duration1.01 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

MBN_MDA_SP_CD
Text

MISSING 

Distinct71
Distinct (%)87.7%
Missing4
Missing (%)4.7%
Memory size812.0 B
2023-12-12T06:15:59.145295image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length355
Median length192
Mean length123.54321
Min length3

Characters and Unicode

Total characters10007
Distinct characters580
Distinct categories12 ?
Distinct scripts4 ?
Distinct blocks7 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique69 ?
Unique (%)85.2%

Sample

1st rowMBN
2nd row손회장은 신년사에서 "매년 1월 1일 홍유릉을 방문할 때마다 우리은행의 뿌리인 고종황제를 생각한다"며 "올해는 우리은행의 또 다른 뿌리인 고객과의 신뢰를 더욱 깊고 두텁게 만들겠다"고 새해 다짐을 밝혔다.
3rd row그는 지난해 어려운 환경에도 불구하고 우리금융그룹의 성공적인 출범과 안정적인 기반 구축에 큰 역할을 한 모든 임직원에게 감사를 표했다. 특히 굳건한 고객신뢰를 바탕으로 더 나은 금융그룹을 만들기 위해 혁신을 시작할 때라고 강조했다. 이와 함께 손 회장은 장기화 되고 있는 국내외 경기 침체, 오픈뱅킹 시행에 따른 금융사간 경쟁 격화, 핀테크 기업의 금융업 진출 등의 위기를 언급하며 모든 임직원의 비상한 각오를 당부했다.
4th row<!------------ PHOTO_POS_1 ------------>손 회장은 우리금융그룹의 2020년 경영목표를 '고객신뢰와 혁신으로 1등 종합금융그룹 달성'이라 선언하고 7대 경영전략으로 ▲고객 중심 영업혁신 ▲리스크관리·내부통제 혁신 ▲지속성장동력 강화 ▲사업포트폴리오 강화 ▲디지털 혁신 선도 ▲글로벌사업 레벨업(Level Up) ▲우리투게더(Woori Together) 시너지 확대를 제시했다.
5th row손 회장은 변화를 강요받기 전에 먼저 변화와 혁신을 위해 도전해야 함을 강조했다. 특히 우리금융의 올해 가장 중요한 목표는 고객의 믿음과 신뢰를 되찾는 것이라 당부하며 '본립도생(本立道生)'과 '경사이신(敬事而信)'이라는 한자성어를 인용해 '기본과 원칙을 철저히 지키며, 매사에 정성과 믿음을 다하자'는 신년 의지를 전했다.
ValueCountFrequency (%)
있다 17
 
0.8%
지난해 15
 
0.7%
14
 
0.6%
국내 14
 
0.6%
올해 14
 
0.6%
12
 
0.5%
11
 
0.5%
대주주 11
 
0.5%
작년 11
 
0.5%
mbn 10
 
0.5%
Other values (1372) 2068
94.1%
2023-12-12T06:15:59.760252image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2146
 
21.4%
215
 
2.1%
. 165
 
1.6%
163
 
1.6%
153
 
1.5%
135
 
1.3%
126
 
1.3%
113
 
1.1%
106
 
1.1%
104
 
1.0%
Other values (570) 6581
65.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 6630
66.3%
Space Separator 2146
 
21.4%
Decimal Number 460
 
4.6%
Other Punctuation 310
 
3.1%
Uppercase Letter 166
 
1.7%
Lowercase Letter 83
 
0.8%
Dash Punctuation 73
 
0.7%
Close Punctuation 45
 
0.4%
Open Punctuation 45
 
0.4%
Math Symbol 25
 
0.2%
Other values (2) 24
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
215
 
3.2%
163
 
2.5%
153
 
2.3%
135
 
2.0%
126
 
1.9%
113
 
1.7%
106
 
1.6%
104
 
1.6%
101
 
1.5%
90
 
1.4%
Other values (503) 5324
80.3%
Uppercase Letter
ValueCountFrequency (%)
I 26
15.7%
B 15
9.0%
M 14
8.4%
O 13
 
7.8%
P 13
 
7.8%
G 13
 
7.8%
N 11
 
6.6%
S 10
 
6.0%
E 10
 
6.0%
F 7
 
4.2%
Other values (10) 34
20.5%
Lowercase Letter
ValueCountFrequency (%)
k 18
21.7%
r 15
18.1%
o 13
15.7%
c 9
10.8%
m 9
10.8%
b 8
9.6%
e 4
 
4.8%
g 1
 
1.2%
h 1
 
1.2%
t 1
 
1.2%
Other values (4) 4
 
4.8%
Other Punctuation
ValueCountFrequency (%)
. 165
53.2%
, 38
 
12.3%
" 34
 
11.0%
% 26
 
8.4%
' 24
 
7.7%
& 11
 
3.5%
· 4
 
1.3%
3
 
1.0%
! 3
 
1.0%
/ 2
 
0.6%
Decimal Number
ValueCountFrequency (%)
1 97
21.1%
0 91
19.8%
2 79
17.2%
6 34
 
7.4%
9 33
 
7.2%
4 30
 
6.5%
3 27
 
5.9%
8 27
 
5.9%
7 23
 
5.0%
5 19
 
4.1%
Math Symbol
ValueCountFrequency (%)
> 11
44.0%
< 11
44.0%
~ 3
 
12.0%
Other Symbol
ValueCountFrequency (%)
9
50.0%
7
38.9%
2
 
11.1%
Close Punctuation
ValueCountFrequency (%)
) 27
60.0%
] 18
40.0%
Open Punctuation
ValueCountFrequency (%)
( 27
60.0%
[ 18
40.0%
Space Separator
ValueCountFrequency (%)
2146
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 73
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 6
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 6621
66.2%
Common 3128
31.3%
Latin 249
 
2.5%
Han 9
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
215
 
3.2%
163
 
2.5%
153
 
2.3%
135
 
2.0%
126
 
1.9%
113
 
1.7%
106
 
1.6%
104
 
1.6%
101
 
1.5%
90
 
1.4%
Other values (494) 5315
80.3%
Latin
ValueCountFrequency (%)
I 26
 
10.4%
k 18
 
7.2%
B 15
 
6.0%
r 15
 
6.0%
M 14
 
5.6%
o 13
 
5.2%
O 13
 
5.2%
P 13
 
5.2%
G 13
 
5.2%
N 11
 
4.4%
Other values (24) 98
39.4%
Common
ValueCountFrequency (%)
2146
68.6%
. 165
 
5.3%
1 97
 
3.1%
0 91
 
2.9%
2 79
 
2.5%
- 73
 
2.3%
, 38
 
1.2%
6 34
 
1.1%
" 34
 
1.1%
9 33
 
1.1%
Other values (23) 338
 
10.8%
Han
ValueCountFrequency (%)
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 6621
66.2%
ASCII 3352
33.5%
Enclosed Alphanum 9
 
0.1%
Geometric Shapes 9
 
0.1%
CJK 9
 
0.1%
None 4
 
< 0.1%
Punctuation 3
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2146
64.0%
. 165
 
4.9%
1 97
 
2.9%
0 91
 
2.7%
2 79
 
2.4%
- 73
 
2.2%
, 38
 
1.1%
6 34
 
1.0%
" 34
 
1.0%
9 33
 
1.0%
Other values (52) 562
 
16.8%
Hangul
ValueCountFrequency (%)
215
 
3.2%
163
 
2.5%
153
 
2.3%
135
 
2.0%
126
 
1.9%
113
 
1.7%
106
 
1.6%
104
 
1.6%
101
 
1.5%
90
 
1.4%
Other values (494) 5315
80.3%
Enclosed Alphanum
ValueCountFrequency (%)
9
100.0%
Geometric Shapes
ValueCountFrequency (%)
7
77.8%
2
 
22.2%
None
ValueCountFrequency (%)
· 4
100.0%
Punctuation
ValueCountFrequency (%)
3
100.0%
CJK
ValueCountFrequency (%)
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%

MDA_ART_ESSN_NO
Text

MISSING 

Distinct17
Distinct (%)100.0%
Missing68
Missing (%)80.0%
Memory size812.0 B
2023-12-12T06:15:59.913615image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length210
Median length7
Mean length47.235294
Min length7

Characters and Unicode

Total characters803
Distinct characters32
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique17 ?
Unique (%)100.0%

Sample

1st row4023324
2nd rowhttp://img.mbn.co.kr/filewww/news/other/2020/01/01/212431130433.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/012201101400.jpg,,,,,,,,
3rd row4023333
4th rowhttp://img.mbn.co.kr/filewww/news/other/2020/01/01/013000221404.jpg,,,,,,,,,
5th row4023335
ValueCountFrequency (%)
4023324 1
 
5.9%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/210250230020.jpg 1
 
5.9%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/120211220211.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/110011200101.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/107017222337.jpg 1
 
5.9%
4023437 1
 
5.9%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/002102110002.jpg 1
 
5.9%
4023436 1
 
5.9%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/111010121010.jpg 1
 
5.9%
4023423 1
 
5.9%
4023422 1
 
5.9%
http://img.mbn.co.kr/filewww/news/other/2020/01/01/212431130433.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/012201101400.jpg 1
 
5.9%
Other values (7) 7
41.2%
2023-12-12T06:16:00.177116image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
/ 90
 
11.2%
0 87
 
10.8%
2 63
 
7.8%
, 63
 
7.8%
1 59
 
7.3%
w 40
 
5.0%
. 40
 
5.0%
t 30
 
3.7%
e 30
 
3.7%
3 29
 
3.6%
Other values (22) 272
33.9%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 330
41.1%
Decimal Number 270
33.6%
Other Punctuation 203
25.3%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
w 40
12.1%
t 30
 
9.1%
e 30
 
9.1%
n 20
 
6.1%
r 20
 
6.1%
o 20
 
6.1%
g 20
 
6.1%
h 20
 
6.1%
m 20
 
6.1%
p 20
 
6.1%
Other values (8) 90
27.3%
Decimal Number
ValueCountFrequency (%)
0 87
32.2%
2 63
23.3%
1 59
21.9%
3 29
 
10.7%
4 23
 
8.5%
7 4
 
1.5%
5 2
 
0.7%
9 1
 
0.4%
6 1
 
0.4%
8 1
 
0.4%
Other Punctuation
ValueCountFrequency (%)
/ 90
44.3%
, 63
31.0%
. 40
19.7%
: 10
 
4.9%

Most occurring scripts

ValueCountFrequency (%)
Common 473
58.9%
Latin 330
41.1%

Most frequent character per script

Latin
ValueCountFrequency (%)
w 40
12.1%
t 30
 
9.1%
e 30
 
9.1%
n 20
 
6.1%
r 20
 
6.1%
o 20
 
6.1%
g 20
 
6.1%
h 20
 
6.1%
m 20
 
6.1%
p 20
 
6.1%
Other values (8) 90
27.3%
Common
ValueCountFrequency (%)
/ 90
19.0%
0 87
18.4%
2 63
13.3%
, 63
13.3%
1 59
12.5%
. 40
8.5%
3 29
 
6.1%
4 23
 
4.9%
: 10
 
2.1%
7 4
 
0.8%
Other values (4) 5
 
1.1%

Most occurring blocks

ValueCountFrequency (%)
ASCII 803
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
/ 90
 
11.2%
0 87
 
10.8%
2 63
 
7.8%
, 63
 
7.8%
1 59
 
7.3%
w 40
 
5.0%
. 40
 
5.0%
t 30
 
3.7%
e 30
 
3.7%
3 29
 
3.6%
Other values (22) 272
33.9%

MDA_CGR_NM
Text

MISSING 

Distinct10
Distinct (%)52.6%
Missing66
Missing (%)77.6%
Memory size812.0 B
2023-12-12T06:16:00.309081image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length8
Median length8
Mean length5.6315789
Min length3

Characters and Unicode

Total characters107
Distinct characters29
Distinct categories3 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique9 ?
Unique (%)47.4%

Sample

1st rowmbn00004
2nd row이승훈
3rd rowmbn00004
4th row남기현
5th rowmbn00004
ValueCountFrequency (%)
mbn00004 10
52.6%
이승훈 1
 
5.3%
남기현 1
 
5.3%
김규리 1
 
5.3%
홍혜진 1
 
5.3%
박인혜 1
 
5.3%
강우석 1
 
5.3%
정석환 1
 
5.3%
우제윤 1
 
5.3%
문가영 1
 
5.3%
2023-12-12T06:16:00.517093image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 40
37.4%
m 10
 
9.3%
n 10
 
9.3%
4 10
 
9.3%
b 10
 
9.3%
2
 
1.9%
2
 
1.9%
2
 
1.9%
1
 
0.9%
1
 
0.9%
Other values (19) 19
17.8%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 50
46.7%
Lowercase Letter 30
28.0%
Other Letter 27
25.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2
 
7.4%
2
 
7.4%
2
 
7.4%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
Other values (14) 14
51.9%
Lowercase Letter
ValueCountFrequency (%)
m 10
33.3%
n 10
33.3%
b 10
33.3%
Decimal Number
ValueCountFrequency (%)
0 40
80.0%
4 10
 
20.0%

Most occurring scripts

ValueCountFrequency (%)
Common 50
46.7%
Latin 30
28.0%
Hangul 27
25.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2
 
7.4%
2
 
7.4%
2
 
7.4%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
Other values (14) 14
51.9%
Latin
ValueCountFrequency (%)
m 10
33.3%
n 10
33.3%
b 10
33.3%
Common
ValueCountFrequency (%)
0 40
80.0%
4 10
 
20.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 80
74.8%
Hangul 27
 
25.2%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 40
50.0%
m 10
 
12.5%
n 10
 
12.5%
4 10
 
12.5%
b 10
 
12.5%
Hangul
ValueCountFrequency (%)
2
 
7.4%
2
 
7.4%
2
 
7.4%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
1
 
3.7%
Other values (14) 14
51.9%

STD_YEAR
Real number (ℝ)

MISSING 

Distinct10
Distinct (%)52.6%
Missing66
Missing (%)77.6%
Infinite0
Infinite (%)0.0%
Mean9.568469 × 1012
Minimum2020
Maximum2.0200101 × 1013
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size897.0 B
2023-12-12T06:16:00.610918image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2020
5-th percentile2020
Q12020
median2020
Q32.0200101 × 1013
95-th percentile2.0200101 × 1013
Maximum2.0200101 × 1013
Range2.0200101 × 1013
Interquartile range (IQR)2.0200101 × 1013

Descriptive statistics

Standard deviation1.0362433 × 1013
Coefficient of variation (CV)1.0829771
Kurtosis-2.2352941
Mean9.568469 × 1012
Median Absolute Deviation (MAD)0
Skewness0.11466817
Sum1.8180091 × 1014
Variance1.0738002 × 1026
MonotonicityNot monotonic
2023-12-12T06:16:00.700710image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%)
2020 10
 
11.8%
20200101143102 1
 
1.2%
20200101145238 1
 
1.2%
20200101145702 1
 
1.2%
20200101171633 1
 
1.2%
20200101171734 1
 
1.2%
20200101171804 1
 
1.2%
20200101171904 1
 
1.2%
20200101180734 1
 
1.2%
20200101181204 1
 
1.2%
(Missing) 66
77.6%
ValueCountFrequency (%)
2020 10
11.8%
20200101143102 1
 
1.2%
20200101145238 1
 
1.2%
20200101145702 1
 
1.2%
20200101171633 1
 
1.2%
20200101171734 1
 
1.2%
20200101171804 1
 
1.2%
20200101171904 1
 
1.2%
20200101180734 1
 
1.2%
20200101181204 1
 
1.2%
ValueCountFrequency (%)
20200101181204 1
 
1.2%
20200101180734 1
 
1.2%
20200101171904 1
 
1.2%
20200101171804 1
 
1.2%
20200101171734 1
 
1.2%
20200101171633 1
 
1.2%
20200101145702 1
 
1.2%
20200101145238 1
 
1.2%
20200101143102 1
 
1.2%
2020 10
11.8%

ART_SJ_CN
Text

MISSING 

Distinct10
Distinct (%)100.0%
Missing75
Missing (%)88.2%
Memory size812.0 B
2023-12-12T06:16:00.888300image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length39
Median length23.5
Mean length25.3
Min length15

Characters and Unicode

Total characters253
Distinct characters136
Distinct categories8 ?
Distinct scripts4 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10 ?
Unique (%)100.0%

Sample

1st row우리금융, "고객신뢰와 혁신으로 1등 종합금융그룹 달성하자"
2nd row개인 12월 한달간 주식 5조원어치 팔았다
3rd row라임사태 피해 투자자들 대규모 법정대응 예고…`불완전 판매` 여부 핵심
4th row사모펀드 판매 5개월째 감소
5th row개인 12월 코스피 4조 팔았다…규제 강화탓 7년만에 최대치
ValueCountFrequency (%)
개인 2
 
3.5%
12월 2
 
3.5%
판매 2
 
3.5%
우리금융 1
 
1.8%
공시 1
 
1.8%
상장 1
 
1.8%
안갯속 1
 
1.8%
日수출규제 1
 
1.8%
반사이익…솔브레인 1
 
1.8%
매출 1
 
1.8%
Other values (44) 44
77.2%
2023-12-12T06:16:01.177506image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
47
 
18.6%
` 8
 
3.2%
1 5
 
2.0%
4
 
1.6%
4
 
1.6%
4
 
1.6%
3
 
1.2%
2 3
 
1.2%
3
 
1.2%
3
 
1.2%
Other values (126) 169
66.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 175
69.2%
Space Separator 47
 
18.6%
Decimal Number 12
 
4.7%
Modifier Symbol 8
 
3.2%
Other Punctuation 8
 
3.2%
Open Punctuation 1
 
0.4%
Uppercase Letter 1
 
0.4%
Close Punctuation 1
 
0.4%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
4
 
2.3%
4
 
2.3%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
Other values (112) 143
81.7%
Decimal Number
ValueCountFrequency (%)
1 5
41.7%
2 3
25.0%
5 2
 
16.7%
7 1
 
8.3%
4 1
 
8.3%
Other Punctuation
ValueCountFrequency (%)
4
50.0%
" 2
25.0%
· 1
 
12.5%
, 1
 
12.5%
Space Separator
ValueCountFrequency (%)
47
100.0%
Modifier Symbol
ValueCountFrequency (%)
` 8
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1
100.0%
Uppercase Letter
ValueCountFrequency (%)
M 1
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 174
68.8%
Common 77
30.4%
Han 1
 
0.4%
Latin 1
 
0.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
4
 
2.3%
4
 
2.3%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
Other values (111) 142
81.6%
Common
ValueCountFrequency (%)
47
61.0%
` 8
 
10.4%
1 5
 
6.5%
4
 
5.2%
2 3
 
3.9%
5 2
 
2.6%
" 2
 
2.6%
( 1
 
1.3%
· 1
 
1.3%
, 1
 
1.3%
Other values (3) 3
 
3.9%
Han
ValueCountFrequency (%)
1
100.0%
Latin
ValueCountFrequency (%)
M 1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 174
68.8%
ASCII 73
28.9%
Punctuation 4
 
1.6%
CJK 1
 
0.4%
None 1
 
0.4%

Most frequent character per block

ASCII
ValueCountFrequency (%)
47
64.4%
` 8
 
11.0%
1 5
 
6.8%
2 3
 
4.1%
5 2
 
2.7%
" 2
 
2.7%
( 1
 
1.4%
M 1
 
1.4%
, 1
 
1.4%
7 1
 
1.4%
Other values (2) 2
 
2.7%
Hangul
ValueCountFrequency (%)
4
 
2.3%
4
 
2.3%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
3
 
1.7%
Other values (111) 142
81.6%
Punctuation
ValueCountFrequency (%)
4
100.0%
CJK
ValueCountFrequency (%)
1
100.0%
None
ValueCountFrequency (%)
· 1
100.0%

ART_CN
Text

MISSING 

Distinct10
Distinct (%)100.0%
Missing75
Missing (%)88.2%
Memory size812.0 B
2023-12-12T06:16:01.378294image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length217
Median length146
Mean length143.1
Min length56

Characters and Unicode

Total characters1431
Distinct characters286
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10 ?
Unique (%)100.0%

Sample

1st row<!------------ PHOTO_POS_0 ------------>손태승 우리금융그룹 회장은 1일 신년사를 통해 올해 굳건한 고객신뢰를 바탕으로 변화와 혁신을 주도하며 대한민국 금융의 미래를 이끌어 가자는 포부를 밝혔다.
2nd row<!------------ PHOTO_POS_0 ------------> 작년 12월 한달간 코스피(유가증권시장)서 개인 투자자 순매도액이 7년여만에 최대치인 3조8275억원에 달한 것으로 집계됐다.
3rd row라임자산운용 무역금융펀드 투자처인 미국 헤지펀드 운용사가 등록취소 제재를 받으면서 투자자들이 법적 대응에 나서기로 했다.
4th row라임자산운용의 펀드 환매 연기 및 파생결합펀드(DLF) 손실 사태로 얼어붙은 사모펀드 시장이 좀처럼 풀릴 기미가 보이지 않는다. 개인투자자들의 사모펀드 투자는 5개월 연속 감소세를 이어가고 있다.
5th row<!------------ PHOTO_POS_0 ------------> 작년 12월 한 달간 코스피(유가증권시장)에서 개인투자자 순매도액이 7년여 만에 최대치인 3조8275억원에 달한 것으로 집계됐다. 코스닥에서도 지난달 월간 개인 순매도 금액이 9954억원에 달해 역대 세 번째로 높은 개인 월순매도를 기록했다.
ValueCountFrequency (%)
14
 
5.2%
photo_pos_0 7
 
2.6%
개인 3
 
1.1%
것으로 3
 
1.1%
작년 3
 
1.1%
신재생에너지에 3
 
1.1%
있다 3
 
1.1%
2
 
0.7%
펀드 2
 
0.7%
사모펀드 2
 
0.7%
Other values (217) 228
84.4%
2023-12-12T06:16:01.697817image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
264
 
18.4%
- 168
 
11.7%
O 23
 
1.6%
23
 
1.6%
21
 
1.5%
20
 
1.4%
. 19
 
1.3%
P 18
 
1.3%
17
 
1.2%
_ 14
 
1.0%
Other values (276) 844
59.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 791
55.3%
Space Separator 264
 
18.4%
Dash Punctuation 168
 
11.7%
Uppercase Letter 71
 
5.0%
Decimal Number 46
 
3.2%
Other Punctuation 35
 
2.4%
Connector Punctuation 14
 
1.0%
Math Symbol 14
 
1.0%
Close Punctuation 10
 
0.7%
Open Punctuation 10
 
0.7%
Other values (2) 8
 
0.6%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
23
 
2.9%
21
 
2.7%
20
 
2.5%
17
 
2.1%
13
 
1.6%
13
 
1.6%
13
 
1.6%
12
 
1.5%
12
 
1.5%
12
 
1.5%
Other values (234) 635
80.3%
Uppercase Letter
ValueCountFrequency (%)
O 23
32.4%
P 18
25.4%
S 7
 
9.9%
H 7
 
9.9%
T 7
 
9.9%
F 3
 
4.2%
E 2
 
2.8%
I 2
 
2.8%
L 1
 
1.4%
D 1
 
1.4%
Decimal Number
ValueCountFrequency (%)
0 14
30.4%
1 7
15.2%
2 6
13.0%
5 5
 
10.9%
7 4
 
8.7%
9 3
 
6.5%
3 3
 
6.5%
8 2
 
4.3%
6 1
 
2.2%
4 1
 
2.2%
Other Punctuation
ValueCountFrequency (%)
. 19
54.3%
! 7
 
20.0%
' 4
 
11.4%
· 3
 
8.6%
& 1
 
2.9%
, 1
 
2.9%
Lowercase Letter
ValueCountFrequency (%)
k 2
33.3%
m 1
16.7%
c 1
16.7%
o 1
16.7%
r 1
16.7%
Close Punctuation
ValueCountFrequency (%)
) 9
90.0%
] 1
 
10.0%
Open Punctuation
ValueCountFrequency (%)
( 9
90.0%
[ 1
 
10.0%
Math Symbol
ValueCountFrequency (%)
< 7
50.0%
> 7
50.0%
Other Symbol
ValueCountFrequency (%)
1
50.0%
1
50.0%
Space Separator
ValueCountFrequency (%)
264
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 168
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 14
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 791
55.3%
Common 563
39.3%
Latin 77
 
5.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
23
 
2.9%
21
 
2.7%
20
 
2.5%
17
 
2.1%
13
 
1.6%
13
 
1.6%
13
 
1.6%
12
 
1.5%
12
 
1.5%
12
 
1.5%
Other values (234) 635
80.3%
Common
ValueCountFrequency (%)
264
46.9%
- 168
29.8%
. 19
 
3.4%
_ 14
 
2.5%
0 14
 
2.5%
) 9
 
1.6%
( 9
 
1.6%
! 7
 
1.2%
< 7
 
1.2%
> 7
 
1.2%
Other values (17) 45
 
8.0%
Latin
ValueCountFrequency (%)
O 23
29.9%
P 18
23.4%
S 7
 
9.1%
H 7
 
9.1%
T 7
 
9.1%
F 3
 
3.9%
E 2
 
2.6%
I 2
 
2.6%
k 2
 
2.6%
m 1
 
1.3%
Other values (5) 5
 
6.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 791
55.3%
ASCII 635
44.4%
None 3
 
0.2%
Geometric Shapes 1
 
0.1%
Enclosed Alphanum 1
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
264
41.6%
- 168
26.5%
O 23
 
3.6%
. 19
 
3.0%
P 18
 
2.8%
_ 14
 
2.2%
0 14
 
2.2%
) 9
 
1.4%
( 9
 
1.4%
! 7
 
1.1%
Other values (29) 90
 
14.2%
Hangul
ValueCountFrequency (%)
23
 
2.9%
21
 
2.7%
20
 
2.5%
17
 
2.1%
13
 
1.6%
13
 
1.6%
13
 
1.6%
12
 
1.5%
12
 
1.5%
12
 
1.5%
Other values (234) 635
80.3%
None
ValueCountFrequency (%)
· 3
100.0%
Geometric Shapes
ValueCountFrequency (%)
1
100.0%
Enclosed Alphanum
ValueCountFrequency (%)
1
100.0%

ATCH_IMG_NM
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing85
Missing (%)100.0%
Memory size897.0 B

JRNL_NM
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing85
Missing (%)100.0%
Memory size897.0 B

WRT_DATE
Categorical

IMBALANCE 

Distinct2
Distinct (%)2.4%
Missing0
Missing (%)0.0%
Memory size812.0 B
<NA>
84 
20200101181604
 
1

Length

Max length14
Median length4
Mean length4.1176471
Min length4

Unique

Unique1 ?
Unique (%)1.2%

Sample

1st row<NA>
2nd row<NA>
3rd row<NA>
4th row<NA>
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 84
98.8%
20200101181604 1
 
1.2%

Length

2023-12-12T06:16:01.804560image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T06:16:01.878818image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
na 84
98.8%
20200101181604 1
 
1.2%

Unnamed: 9
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing85
Missing (%)100.0%
Memory size897.0 B

Interactions

2023-12-12T06:15:58.561852image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T06:16:01.939837image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CN
MBN_MDA_SP_CD1.0001.0001.000NaNNaNNaN
MDA_ART_ESSN_NO1.0001.0001.000NaN1.0001.000
MDA_CGR_NM1.0001.0001.000NaNNaNNaN
STD_YEARNaNNaNNaN1.000NaNNaN
ART_SJ_CNNaN1.000NaNNaN1.0001.000
ART_CNNaN1.000NaNNaN1.0001.000
2023-12-12T06:16:02.030710image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
STD_YEARWRT_DATE
STD_YEAR1.000NaN
WRT_DATENaN1.000

Missing values

2023-12-12T06:15:58.668659image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T06:15:58.776168image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-12T06:15:58.882525image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CNATCH_IMG_NMJRNL_NMWRT_DATEUnnamed: 9
0<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>
1MBN4023324mbn000042020우리금융, "고객신뢰와 혁신으로 1등 종합금융그룹 달성하자"<!------------ PHOTO_POS_0 ------------>손태승 우리금융그룹 회장은 1일 신년사를 통해 올해 굳건한 고객신뢰를 바탕으로 변화와 혁신을 주도하며 대한민국 금융의 미래를 이끌어 가자는 포부를 밝혔다.<NA><NA><NA><NA>
2손회장은 신년사에서 "매년 1월 1일 홍유릉을 방문할 때마다 우리은행의 뿌리인 고종황제를 생각한다"며 "올해는 우리은행의 또 다른 뿌리인 고객과의 신뢰를 더욱 깊고 두텁게 만들겠다"고 새해 다짐을 밝혔다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
3그는 지난해 어려운 환경에도 불구하고 우리금융그룹의 성공적인 출범과 안정적인 기반 구축에 큰 역할을 한 모든 임직원에게 감사를 표했다. 특히 굳건한 고객신뢰를 바탕으로 더 나은 금융그룹을 만들기 위해 혁신을 시작할 때라고 강조했다. 이와 함께 손 회장은 장기화 되고 있는 국내외 경기 침체, 오픈뱅킹 시행에 따른 금융사간 경쟁 격화, 핀테크 기업의 금융업 진출 등의 위기를 언급하며 모든 임직원의 비상한 각오를 당부했다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
4<!------------ PHOTO_POS_1 ------------>손 회장은 우리금융그룹의 2020년 경영목표를 '고객신뢰와 혁신으로 1등 종합금융그룹 달성'이라 선언하고 7대 경영전략으로 ▲고객 중심 영업혁신 ▲리스크관리·내부통제 혁신 ▲지속성장동력 강화 ▲사업포트폴리오 강화 ▲디지털 혁신 선도 ▲글로벌사업 레벨업(Level Up) ▲우리투게더(Woori Together) 시너지 확대를 제시했다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
5손 회장은 변화를 강요받기 전에 먼저 변화와 혁신을 위해 도전해야 함을 강조했다. 특히 우리금융의 올해 가장 중요한 목표는 고객의 믿음과 신뢰를 되찾는 것이라 당부하며 '본립도생(本立道生)'과 '경사이신(敬事而信)'이라는 한자성어를 인용해 '기본과 원칙을 철저히 지키며, 매사에 정성과 믿음을 다하자'는 신년 의지를 전했다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
6이날 손 회장을 비롯한 임원들은 우리은행의 전신인 대한천일은행의 기틀을 마련한 고종황제의 묘소 홍유릉을 참배하며 경자년 새해 첫날을 맞이했다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
7[이승훈 기자]<NA><NA><NA><NA><NA><NA><NA><NA><NA>
8<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>
9[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]<br>http://img.mbn.co.kr/filewww/news/other/2020/01/01/212431130433.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/012201101400.jpg,,,,,,,,이승훈20200101143102<NA><NA><NA><NA><NA><NA>
MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CNATCH_IMG_NMJRNL_NMWRT_DATEUnnamed: 9
75■ <b>신재생에너지 밀어붙이는데 국내 녹색성장 펀드는 '헉헉'</b><br>지난해 한자릿수 수익률 기록, 한국은 대기업위주 종목 구성…전문 강소기업 발굴 어려워<NA><NA><NA><NA><NA><NA><NA><NA><NA>
76<!------------ PHOTO_POS_2 ------------> 이와 같이 전 세계적으로 신재생에너지 비중을 확대하는 정책이 쏟아지면서 관련 산업도 확장세에 접어들었지만 국내 투자업계에서는 이를 실감하기 어렵다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
77국내 기업에 투자하는 녹색성장펀드의 지난해 평균 수익률은 9.05%로 한 자릿수 성장에 그쳤다. 녹색성장펀드 전체 설정액이 점점 빠지는 추세로 친환경에너지 투자에 대한 국내 투자자들의 관심도 식어가고 있다. 지난 3년간 녹색성장펀드 설정액은 1647억원에서 1271억원으로 오히려 20% 이상 줄어들었다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
78이에 정부는 재생에너지 예산을 대폭 늘리는 등 투자를 확대해 나가고 있지만 막상 민간에서는 재생에너지 관련 투자 기반이 제대로 마련되고 있지 않다는 지적이 나온다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
79국내 녹색성장펀드가 친환경에너지 산업 성장세에 편승하지 못한 이유는 근본적인 펀드 구성에서 찾을 수 있다. 국내 녹색성장펀드는 이스라엘 솔라에지, 덴마크 베스타스 풍력시스템, 중국 신의솔라 등 재생에너지 기술에 특화된 기업에 주로 투자하는 해외 녹색성장펀드와 달리 국내 대기업 위주로 종목이 구성된다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
80예컨대 지난해 10.77%의 수익을 올린 미래에셋그린인덱스 펀드의 비중 상위 종목에는 기아차(종목 비중 9.26%) 현대차(9.18%) 삼성전자(9.15%) SK하이닉스(8.68%) 등이 포함됐다. 국내 녹색성장펀드 종목 구성이 이같이 국내 대기업 위주로 편성되는 원인은 대부분 액티브 전략보다는 지수를 추종하는 방식을 활용하기 때문이다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
81한 투자업계 관계자는 "우리나라에서는 청정에너지 테마의 펀드가 잘 발달되지 않고 있다"고 지적했다. 청정에너지 산업은 규모의 경제가 작용하기 때문에 아직 초기 단계에서 벗어나지 못하고 있는 국내 중소형 녹생성장 테마주에는 투자하기 어렵다는 것이다. 또 글로벌 자산운용사 중에는 오랜 친환경 기술 투자 경험과 전문성을 갖춘 운용팀을 보유하고 있는 곳이 종종 있지만 국내 투자업계에는 그런 경험치가 아직 부족하다는 게 그의 설명이다. 그는 다만 "최근 국민연금에서도 ESG 투자 위탁운용 계획을 발표하는 등 신재생에너지 관련 투자 역량을 끌어올리기 위한 노력이 이뤄질 것으로 보인다"고 밝혔다.<NA><NA><NA><NA><NA><NA><NA><NA><NA>
82[문가영 기자][ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]http://img.mbn.co.kr/filewww/news/other/2020/01/01/120211220211.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/110011200101.jpg,http://img.mbn.co.kr/filewww/news/other/2020/01/01/107017222337.jpg,,,,,,,문가영20200101181204<NA><NA><NA><NA><NA><NA>
83MBN4023438mbn000042020오늘의 레이더M 뉴스 (1월 2일)● PEF 외면받는 기업공개(IPO)시장[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]<NA><NA>20200101181604<NA>
84<NA><NA><NA><NA><NA><NA><NA><NA><NA><NA>

Duplicate rows

Most frequently occurring

MBN_MDA_SP_CDMDA_ART_ESSN_NOMDA_CGR_NMSTD_YEARART_SJ_CNART_CNWRT_DATE# duplicates
0<NA><NA><NA><NA><NA><NA><NA>4