Overview

Dataset statistics

Number of variables8
Number of observations10000
Missing cells27
Missing cells (%)< 0.1%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory703.1 KiB
Average record size in memory72.0 B

Variable types

Text7
DateTime1

Dataset

Description문화체육관광부_정책브리핑_외부연계는 정책뉴스, 보도자료등 콘텐츠를 외부와 연계하기 위한 기본정보를 나타내는 데이터셋 입니다.
Author문화체육관광부
URLhttps://www.data.go.kr/data/15042144/fileData.do

Alerts

메타블로그아이디 has unique valuesUnique

Reproduction

Analysis started2023-12-12 09:31:24.580577
Analysis finished2023-12-12 09:31:30.514641
Duration5.93 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct10000
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-12T18:31:30.725570image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length13
Median length12
Mean length12.3255
Min length9

Characters and Unicode

Total characters123255
Distinct characters18
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10000 ?
Unique (%)100.0%

Sample

1st rowmetablog10789
2nd rowmetablog12907
3rd rowmetablog2120
4th rowmetablog12510
5th rowmetablog12358
ValueCountFrequency (%)
metablog10789 1
 
< 0.1%
metablog9820 1
 
< 0.1%
metablog13237 1
 
< 0.1%
metablog16731 1
 
< 0.1%
metablog10271 1
 
< 0.1%
metablog120 1
 
< 0.1%
metablog1569 1
 
< 0.1%
metablog15363 1
 
< 0.1%
metablog216 1
 
< 0.1%
metablog13384 1
 
< 0.1%
Other values (9990) 9990
99.9%
2023-12-12T18:31:31.211972image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
m 10000
 
8.1%
t 10000
 
8.1%
a 10000
 
8.1%
b 10000
 
8.1%
l 10000
 
8.1%
o 10000
 
8.1%
g 10000
 
8.1%
e 10000
 
8.1%
1 8291
 
6.7%
2 4265
 
3.5%
Other values (8) 30699
24.9%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 80000
64.9%
Decimal Number 43255
35.1%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
1 8291
19.2%
2 4265
9.9%
5 4208
9.7%
3 4078
9.4%
4 4040
9.3%
6 3894
9.0%
8 3662
8.5%
0 3620
8.4%
7 3615
8.4%
9 3582
8.3%
Lowercase Letter
ValueCountFrequency (%)
m 10000
12.5%
t 10000
12.5%
a 10000
12.5%
b 10000
12.5%
l 10000
12.5%
o 10000
12.5%
g 10000
12.5%
e 10000
12.5%

Most occurring scripts

ValueCountFrequency (%)
Latin 80000
64.9%
Common 43255
35.1%

Most frequent character per script

Common
ValueCountFrequency (%)
1 8291
19.2%
2 4265
9.9%
5 4208
9.7%
3 4078
9.4%
4 4040
9.3%
6 3894
9.0%
8 3662
8.5%
0 3620
8.4%
7 3615
8.4%
9 3582
8.3%
Latin
ValueCountFrequency (%)
m 10000
12.5%
t 10000
12.5%
a 10000
12.5%
b 10000
12.5%
l 10000
12.5%
o 10000
12.5%
g 10000
12.5%
e 10000
12.5%

Most occurring blocks

ValueCountFrequency (%)
ASCII 123255
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
m 10000
 
8.1%
t 10000
 
8.1%
a 10000
 
8.1%
b 10000
 
8.1%
l 10000
 
8.1%
o 10000
 
8.1%
g 10000
 
8.1%
e 10000
 
8.1%
1 8291
 
6.7%
2 4265
 
3.5%
Other values (8) 30699
24.9%
Distinct8030
Distinct (%)80.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-12T18:31:31.571588image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length61
Median length45
Mean length18.1815
Min length1

Characters and Unicode

Total characters181815
Distinct characters1492
Distinct categories17 ?
Distinct scripts4 ?
Distinct blocks14 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique6115 ?
Unique (%)61.2%

Sample

1st row한-EUFTA발효후달라질소비생활
2nd row맛있는레시피-에프터더레인?
3rd row당첨작:경남여행기(거제외도신선대)^^
4th row계속되는겨울비언제까지오나요?
5th row안드로이드아이폰넘을까?
ValueCountFrequency (%)
나루나래의깜짝퀴즈&지난주정답자발표 6
 
0.1%
세종시어떻게달라지나요?④-투자하고싶은명품기업이됩니다 5
 
< 0.1%
청양군2010농촌지도시범사업접수 4
 
< 0.1%
설명절어려운이웃과따뜻한사랑함께해요 4
 
< 0.1%
세종시어떻게달라지나요?①-첨단과학·교육중심의세계일류경제도시 4
 
< 0.1%
청양군동절기상수도동파예방홍보 4
 
< 0.1%
고추산업이끌어갈농업인모여라 4
 
< 0.1%
상반기60%이상재정조기집행추진상황보고회개최 4
 
< 0.1%
국방대양촌면거사리로최종확정 4
 
< 0.1%
청양자동차세10%감면해드려요 4
 
< 0.1%
Other values (8001) 9959
99.6%
2023-12-12T18:31:32.213969image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
3011
 
1.7%
2608
 
1.4%
2194
 
1.2%
2148
 
1.2%
2082
 
1.1%
! 2051
 
1.1%
0 1965
 
1.1%
1951
 
1.1%
1883
 
1.0%
1845
 
1.0%
Other values (1482) 160077
88.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 158583
87.2%
Other Punctuation 7336
 
4.0%
Decimal Number 6904
 
3.8%
Uppercase Letter 2187
 
1.2%
Lowercase Letter 1347
 
0.7%
Open Punctuation 1091
 
0.6%
Close Punctuation 1088
 
0.6%
Final Punctuation 847
 
0.5%
Initial Punctuation 843
 
0.5%
Math Symbol 644
 
0.4%
Other values (7) 945
 
0.5%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
3011
 
1.9%
2608
 
1.6%
2194
 
1.4%
2148
 
1.4%
2082
 
1.3%
1951
 
1.2%
1883
 
1.2%
1845
 
1.2%
1744
 
1.1%
1719
 
1.1%
Other values (1345) 137398
86.6%
Uppercase Letter
ValueCountFrequency (%)
T 212
 
9.7%
S 175
 
8.0%
C 165
 
7.5%
A 149
 
6.8%
E 142
 
6.5%
I 115
 
5.3%
P 114
 
5.2%
O 113
 
5.2%
M 106
 
4.8%
D 103
 
4.7%
Other values (16) 793
36.3%
Lowercase Letter
ValueCountFrequency (%)
e 167
12.4%
o 129
 
9.6%
n 114
 
8.5%
a 100
 
7.4%
i 86
 
6.4%
r 83
 
6.2%
t 82
 
6.1%
l 70
 
5.2%
y 67
 
5.0%
s 65
 
4.8%
Other values (15) 384
28.5%
Other Punctuation
ValueCountFrequency (%)
! 2051
28.0%
. 1425
19.4%
? 1343
18.3%
' 1323
18.0%
· 314
 
4.3%
" 215
 
2.9%
169
 
2.3%
: 142
 
1.9%
* 107
 
1.5%
% 102
 
1.4%
Other values (10) 145
 
2.0%
Other Symbol
ValueCountFrequency (%)
55
29.6%
55
29.6%
26
14.0%
11
 
5.9%
11
 
5.9%
6
 
3.2%
4
 
2.2%
4
 
2.2%
3
 
1.6%
3
 
1.6%
Other values (6) 8
 
4.3%
Math Symbol
ValueCountFrequency (%)
~ 566
87.9%
> 32
 
5.0%
+ 21
 
3.3%
| 7
 
1.1%
= 5
 
0.8%
2
 
0.3%
2
 
0.3%
2
 
0.3%
2
 
0.3%
2
 
0.3%
Other values (3) 3
 
0.5%
Decimal Number
ValueCountFrequency (%)
0 1965
28.5%
1 1659
24.0%
2 1437
20.8%
3 408
 
5.9%
9 330
 
4.8%
5 330
 
4.8%
4 285
 
4.1%
6 202
 
2.9%
7 157
 
2.3%
8 131
 
1.9%
Other Number
ValueCountFrequency (%)
23
29.5%
19
24.4%
14
17.9%
14
17.9%
6
 
7.7%
1
 
1.3%
1
 
1.3%
Close Punctuation
ValueCountFrequency (%)
) 551
50.6%
] 455
41.8%
68
 
6.2%
14
 
1.3%
Open Punctuation
ValueCountFrequency (%)
( 550
50.4%
[ 458
42.0%
69
 
6.3%
14
 
1.3%
Modifier Symbol
ValueCountFrequency (%)
^ 122
80.3%
` 28
 
18.4%
´ 2
 
1.3%
Initial Punctuation
ValueCountFrequency (%)
538
63.8%
305
36.2%
Final Punctuation
ValueCountFrequency (%)
536
63.3%
311
36.7%
Dash Punctuation
ValueCountFrequency (%)
- 465
98.7%
6
 
1.3%
Connector Punctuation
ValueCountFrequency (%)
_ 54
100.0%
Letter Number
ValueCountFrequency (%)
2
100.0%
Space Separator
ValueCountFrequency (%)
  2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 158219
87.0%
Common 19696
 
10.8%
Latin 3536
 
1.9%
Han 364
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
3011
 
1.9%
2608
 
1.6%
2194
 
1.4%
2148
 
1.4%
2082
 
1.3%
1951
 
1.2%
1883
 
1.2%
1845
 
1.2%
1744
 
1.1%
1719
 
1.1%
Other values (1179) 137034
86.6%
Han
ValueCountFrequency (%)
15
 
4.1%
15
 
4.1%
14
 
3.8%
11
 
3.0%
11
 
3.0%
9
 
2.5%
8
 
2.2%
7
 
1.9%
7
 
1.9%
6
 
1.6%
Other values (156) 261
71.7%
Common
ValueCountFrequency (%)
! 2051
 
10.4%
0 1965
 
10.0%
1 1659
 
8.4%
2 1437
 
7.3%
. 1425
 
7.2%
? 1343
 
6.8%
' 1323
 
6.7%
~ 566
 
2.9%
) 551
 
2.8%
( 550
 
2.8%
Other values (75) 6826
34.7%
Latin
ValueCountFrequency (%)
T 212
 
6.0%
S 175
 
4.9%
e 167
 
4.7%
C 165
 
4.7%
A 149
 
4.2%
E 142
 
4.0%
o 129
 
3.6%
I 115
 
3.3%
n 114
 
3.2%
P 114
 
3.2%
Other values (42) 2054
58.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 158183
87.0%
ASCII 20597
 
11.3%
Punctuation 1870
 
1.0%
None 493
 
0.3%
CJK 362
 
0.2%
Misc Symbols 170
 
0.1%
Enclosed Alphanum 78
 
< 0.1%
Compat Jamo 36
 
< 0.1%
CJK Compat 8
 
< 0.1%
Arrows 7
 
< 0.1%
Other values (4) 11
 
< 0.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
3011
 
1.9%
2608
 
1.6%
2194
 
1.4%
2148
 
1.4%
2082
 
1.3%
1951
 
1.2%
1883
 
1.2%
1845
 
1.2%
1744
 
1.1%
1719
 
1.1%
Other values (1178) 136998
86.6%
ASCII
ValueCountFrequency (%)
! 2051
 
10.0%
0 1965
 
9.5%
1 1659
 
8.1%
2 1437
 
7.0%
. 1425
 
6.9%
? 1343
 
6.5%
' 1323
 
6.4%
~ 566
 
2.7%
) 551
 
2.7%
( 550
 
2.7%
Other values (77) 7727
37.5%
Punctuation
ValueCountFrequency (%)
538
28.8%
536
28.7%
311
16.6%
305
16.3%
169
 
9.0%
6
 
0.3%
2
 
0.1%
2
 
0.1%
1
 
0.1%
None
ValueCountFrequency (%)
· 314
63.7%
69
 
14.0%
68
 
13.8%
14
 
2.8%
14
 
2.8%
´ 2
 
0.4%
2
 
0.4%
  2
 
0.4%
2
 
0.4%
2
 
0.4%
Other values (3) 4
 
0.8%
Misc Symbols
ValueCountFrequency (%)
55
32.4%
55
32.4%
26
15.3%
11
 
6.5%
11
 
6.5%
6
 
3.5%
3
 
1.8%
2
 
1.2%
1
 
0.6%
Compat Jamo
ValueCountFrequency (%)
36
100.0%
Enclosed Alphanum
ValueCountFrequency (%)
23
29.5%
19
24.4%
14
17.9%
14
17.9%
6
 
7.7%
1
 
1.3%
1
 
1.3%
CJK
ValueCountFrequency (%)
15
 
4.1%
15
 
4.1%
14
 
3.9%
11
 
3.0%
11
 
3.0%
9
 
2.5%
8
 
2.2%
7
 
1.9%
7
 
1.9%
6
 
1.7%
Other values (154) 259
71.5%
CJK Compat
ValueCountFrequency (%)
4
50.0%
2
25.0%
1
 
12.5%
1
 
12.5%
Letterlike Symbols
ValueCountFrequency (%)
4
100.0%
Geometric Shapes
ValueCountFrequency (%)
3
100.0%
Number Forms
ValueCountFrequency (%)
2
100.0%
Arrows
ValueCountFrequency (%)
2
28.6%
2
28.6%
1
14.3%
1
14.3%
1
14.3%
CJK Compat Ideographs
ValueCountFrequency (%)
1
50.0%
1
50.0%
Distinct5494
Distinct (%)54.9%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
Minimum2009-12-12 06:33:57
Maximum2010-03-17 15:25:31
2023-12-12T18:31:32.421608image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T18:31:32.574354image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
Distinct72
Distinct (%)0.7%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-12T18:31:32.895521image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length33
Median length27
Mean length10.08
Min length1

Characters and Unicode

Total characters100800
Distinct characters239
Distinct categories11 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique2 ?
Unique (%)< 0.1%

Sample

1st rowFTA국내대책위원회
2nd row법무부 정책 블로그
3rd row따오기의 녹색 이야기 "따옥따옥"
4th row하늘친구들
5th row두루누리=방송통신위원회 공식블로그
ValueCountFrequency (%)
충청남도 2595
 
11.5%
블로그 1625
 
7.2%
934
 
4.1%
공식블로그 521
 
2.3%
세상 466
 
2.1%
정책공감 374
 
1.7%
이야기 322
 
1.4%
두루누리=방송통신위원회 284
 
1.3%
대한민국 255
 
1.1%
검찰이야기 253
 
1.1%
Other values (132) 14892
66.1%
2023-12-12T18:31:33.407194image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
13097
 
13.0%
3425
 
3.4%
3110
 
3.1%
2668
 
2.6%
2639
 
2.6%
2595
 
2.6%
2542
 
2.5%
2360
 
2.3%
: 1789
 
1.8%
1782
 
1.8%
Other values (229) 64793
64.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 78526
77.9%
Space Separator 13097
 
13.0%
Other Punctuation 3083
 
3.1%
Lowercase Letter 1742
 
1.7%
Uppercase Letter 1451
 
1.4%
Other Symbol 1017
 
1.0%
Math Symbol 824
 
0.8%
Open Punctuation 341
 
0.3%
Close Punctuation 341
 
0.3%
Dash Punctuation 288
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
3425
 
4.4%
3110
 
4.0%
2668
 
3.4%
2639
 
3.4%
2595
 
3.3%
2542
 
3.2%
2360
 
3.0%
1782
 
2.3%
1751
 
2.2%
1473
 
1.9%
Other values (181) 54181
69.0%
Lowercase Letter
ValueCountFrequency (%)
o 264
15.2%
t 262
15.0%
e 234
13.4%
l 203
11.7%
m 144
8.3%
f 132
7.6%
a 132
7.6%
g 71
 
4.1%
n 69
 
4.0%
i 69
 
4.0%
Other values (7) 162
9.3%
Uppercase Letter
ValueCountFrequency (%)
F 269
18.5%
I 264
18.2%
A 193
13.3%
T 120
8.3%
P 113
7.8%
Y 73
 
5.0%
R 73
 
5.0%
O 73
 
5.0%
C 73
 
5.0%
E 73
 
5.0%
Other values (2) 127
8.8%
Other Punctuation
ValueCountFrequency (%)
: 1789
58.0%
" 392
 
12.7%
. 328
 
10.6%
, 250
 
8.1%
; 118
 
3.8%
& 118
 
3.8%
! 88
 
2.9%
Math Symbol
ValueCountFrequency (%)
= 521
63.2%
~ 187
 
22.7%
+ 116
 
14.1%
Other Symbol
ValueCountFrequency (%)
723
71.1%
294
28.9%
Open Punctuation
ValueCountFrequency (%)
[ 225
66.0%
( 116
34.0%
Close Punctuation
ValueCountFrequency (%)
] 225
66.0%
) 116
34.0%
Space Separator
ValueCountFrequency (%)
13097
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 288
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 90
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 78526
77.9%
Common 19081
 
18.9%
Latin 3193
 
3.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
3425
 
4.4%
3110
 
4.0%
2668
 
3.4%
2639
 
3.4%
2595
 
3.3%
2542
 
3.2%
2360
 
3.0%
1782
 
2.3%
1751
 
2.2%
1473
 
1.9%
Other values (181) 54181
69.0%
Latin
ValueCountFrequency (%)
F 269
 
8.4%
I 264
 
8.3%
o 264
 
8.3%
t 262
 
8.2%
e 234
 
7.3%
l 203
 
6.4%
A 193
 
6.0%
m 144
 
4.5%
f 132
 
4.1%
a 132
 
4.1%
Other values (19) 1096
34.3%
Common
ValueCountFrequency (%)
13097
68.6%
: 1789
 
9.4%
723
 
3.8%
= 521
 
2.7%
" 392
 
2.1%
. 328
 
1.7%
294
 
1.5%
- 288
 
1.5%
, 250
 
1.3%
[ 225
 
1.2%
Other values (9) 1174
 
6.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 78526
77.9%
ASCII 21257
 
21.1%
Misc Symbols 1017
 
1.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
13097
61.6%
: 1789
 
8.4%
= 521
 
2.5%
" 392
 
1.8%
. 328
 
1.5%
- 288
 
1.4%
F 269
 
1.3%
I 264
 
1.2%
o 264
 
1.2%
t 262
 
1.2%
Other values (36) 3783
 
17.8%
Hangul
ValueCountFrequency (%)
3425
 
4.4%
3110
 
4.0%
2668
 
3.4%
2639
 
3.4%
2595
 
3.3%
2542
 
3.2%
2360
 
3.0%
1782
 
2.3%
1751
 
2.2%
1473
 
1.9%
Other values (181) 54181
69.0%
Misc Symbols
ValueCountFrequency (%)
723
71.1%
294
28.9%
Distinct80
Distinct (%)0.8%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-12T18:31:33.744923image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length36
Median length34
Mean length28.9411
Min length13

Characters and Unicode

Total characters289411
Distinct characters39
Distinct categories5 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st rowhttp://blog.daum.net/korusfta
2nd rowhttp://blog.naver.com/mojjustice
3rd rowhttp://blog.naver.com/gnfeel
4th rowhttp://blog.daum.net/kma_skylove
5th rowhttp://blog.naver.com/kcc1335
ValueCountFrequency (%)
http://blog.naver.com/sinmunman 1312
 
13.1%
http://blog.daum.net/cnjjs 1283
 
12.8%
http://blog.naver.com/kcc1335 284
 
2.8%
http://blog.daum.net/kcgpr 246
 
2.5%
http://blog.daum.net/kcc1335 237
 
2.4%
http://blog.daum.net/gyeonggi 226
 
2.3%
http://blog.naver.com/ntscafe 225
 
2.2%
http://blog.daum.net/loveacrc 199
 
2.0%
http://blog.naver.com/gnfeel 196
 
2.0%
http://blog.naver.com/hellopolicy 193
 
1.9%
Other values (70) 5599
56.0%
2023-12-12T18:31:34.249543image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
/ 29763
 
10.3%
t 26548
 
9.2%
o 20912
 
7.2%
. 20236
 
7.0%
n 16793
 
5.8%
m 15676
 
5.4%
a 13951
 
4.8%
l 13032
 
4.5%
e 12904
 
4.5%
p 12796
 
4.4%
Other values (29) 106800
36.9%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 221389
76.5%
Other Punctuation 59940
 
20.7%
Decimal Number 6906
 
2.4%
Connector Punctuation 906
 
0.3%
Dash Punctuation 270
 
0.1%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
t 26548
12.0%
o 20912
 
9.4%
n 16793
 
7.6%
m 15676
 
7.1%
a 13951
 
6.3%
l 13032
 
5.9%
e 12904
 
5.8%
p 12796
 
5.8%
g 12497
 
5.6%
h 10991
 
5.0%
Other values (14) 65289
29.5%
Decimal Number
ValueCountFrequency (%)
0 1310
19.0%
3 1237
17.9%
1 993
14.4%
5 691
10.0%
2 673
9.7%
9 628
9.1%
4 582
8.4%
8 527
7.6%
7 200
 
2.9%
6 65
 
0.9%
Other Punctuation
ValueCountFrequency (%)
/ 29763
49.7%
. 20236
33.8%
: 9941
 
16.6%
Connector Punctuation
ValueCountFrequency (%)
_ 906
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 270
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 221389
76.5%
Common 68022
 
23.5%

Most frequent character per script

Latin
ValueCountFrequency (%)
t 26548
12.0%
o 20912
 
9.4%
n 16793
 
7.6%
m 15676
 
7.1%
a 13951
 
6.3%
l 13032
 
5.9%
e 12904
 
5.8%
p 12796
 
5.8%
g 12497
 
5.6%
h 10991
 
5.0%
Other values (14) 65289
29.5%
Common
ValueCountFrequency (%)
/ 29763
43.8%
. 20236
29.7%
: 9941
 
14.6%
0 1310
 
1.9%
3 1237
 
1.8%
1 993
 
1.5%
_ 906
 
1.3%
5 691
 
1.0%
2 673
 
1.0%
9 628
 
0.9%
Other values (5) 1644
 
2.4%

Most occurring blocks

ValueCountFrequency (%)
ASCII 289411
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
/ 29763
 
10.3%
t 26548
 
9.2%
o 20912
 
7.2%
. 20236
 
7.0%
n 16793
 
5.8%
m 15676
 
5.4%
a 13951
 
4.8%
l 13032
 
4.5%
e 12904
 
4.5%
p 12796
 
4.4%
Other values (29) 106800
36.9%
Distinct9915
Distinct (%)99.2%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-12T18:31:34.587257image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length384
Median length312
Mean length38.6649
Min length20

Characters and Unicode

Total characters386649
Distinct characters46
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique9831 ?
Unique (%)98.3%

Sample

1st rowhttp://blog.daum.net/korusfta/16895260
2nd rowhttp://blog.naver.com/mojjustice/150080930235
3rd rowhttp://blog.naver.com/gnfeel/140095572272
4th rowhttp://blog.daum.net/kma_skylove/7668201
5th rowhttp://blog.naver.com/kcc1335/130080224399
ValueCountFrequency (%)
http://mnd9090.tistory.com/744 3
 
< 0.1%
http://blog.jb.go.kr/130080618556 2
 
< 0.1%
http://blog.naver.com/pmo_1/130078386498 2
 
< 0.1%
http://blog.naver.com/citysejong/140098513775 2
 
< 0.1%
http://blog.naver.com/citysejong/140098518128 2
 
< 0.1%
http://blog.naver.com/citysejong/140098363854 2
 
< 0.1%
http://blog.naver.com/citysejong/140098530708 2
 
< 0.1%
http://blog.jb.go.kr/130075215545 2
 
< 0.1%
http://blog.naver.com/citysejong/140098349897 2
 
< 0.1%
http://blog.naver.com/citysejong/140098381926 2
 
< 0.1%
Other values (9905) 9979
99.8%
2023-12-12T18:31:35.119272image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
/ 39224
 
10.1%
t 26694
 
6.9%
o 20912
 
5.4%
. 20236
 
5.2%
n 16821
 
4.4%
0 16273
 
4.2%
m 15676
 
4.1%
a 13951
 
3.6%
l 13032
 
3.4%
e 12932
 
3.3%
Other values (36) 190898
49.4%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 221765
57.4%
Decimal Number 89996
23.3%
Other Punctuation 71365
 
18.5%
Uppercase Letter 2180
 
0.6%
Connector Punctuation 906
 
0.2%
Dash Punctuation 437
 
0.1%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
t 26694
12.0%
o 20912
 
9.4%
n 16821
 
7.6%
m 15676
 
7.1%
a 13951
 
6.3%
l 13032
 
5.9%
e 12932
 
5.8%
p 12855
 
5.8%
g 12497
 
5.6%
h 11050
 
5.0%
Other values (14) 65345
29.5%
Decimal Number
ValueCountFrequency (%)
0 16273
18.1%
1 12071
13.4%
7 11324
12.6%
9 8566
9.5%
8 8427
9.4%
6 6976
7.8%
3 6894
7.7%
5 6854
7.6%
4 6738
7.5%
2 5873
 
6.5%
Uppercase Letter
ValueCountFrequency (%)
E 659
30.2%
B 573
26.3%
C 421
19.3%
A 362
16.6%
D 149
 
6.8%
F 16
 
0.7%
Other Punctuation
ValueCountFrequency (%)
/ 39224
55.0%
. 20236
28.4%
: 10000
 
14.0%
% 1905
 
2.7%
Connector Punctuation
ValueCountFrequency (%)
_ 906
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 437
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 223945
57.9%
Common 162704
42.1%

Most frequent character per script

Latin
ValueCountFrequency (%)
t 26694
 
11.9%
o 20912
 
9.3%
n 16821
 
7.5%
m 15676
 
7.0%
a 13951
 
6.2%
l 13032
 
5.8%
e 12932
 
5.8%
p 12855
 
5.7%
g 12497
 
5.6%
h 11050
 
4.9%
Other values (20) 67525
30.2%
Common
ValueCountFrequency (%)
/ 39224
24.1%
. 20236
12.4%
0 16273
10.0%
1 12071
 
7.4%
7 11324
 
7.0%
: 10000
 
6.1%
9 8566
 
5.3%
8 8427
 
5.2%
6 6976
 
4.3%
3 6894
 
4.2%
Other values (6) 22713
14.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 386649
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
/ 39224
 
10.1%
t 26694
 
6.9%
o 20912
 
5.4%
. 20236
 
5.2%
n 16821
 
4.4%
0 16273
 
4.2%
m 15676
 
4.1%
a 13951
 
3.6%
l 13032
 
3.4%
e 12932
 
3.3%
Other values (36) 190898
49.4%
Distinct9812
Distinct (%)98.4%
Missing27
Missing (%)0.3%
Memory size156.2 KiB
2023-12-12T18:31:35.588793image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length1024
Median length475
Mean length281.95458
Min length1

Characters and Unicode

Total characters2811933
Distinct characters2455
Distinct categories19 ?
Distinct scripts6 ?
Distinct blocks18 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique9706 ?
Unique (%)97.3%

Sample

1st row 한-유럽연합(EU) 자유무역협정(FTA)이 타결되면 유럽산 와인 식재료 의류·가방 등의 가격이 내릴 전망이다. 기혼여성 황모씨와 미혼여성 김모씨를 통해 한-EU FTA가 한국인의 소비생활에 가져올 변화를 조망해 본다. 물론 예상을 바탕으로 한 것으로 구체적인 가격이 일치하지 않을 수도 있다. 최근 시청자들에게 큰 사랑.....tag : 명품와인선물FTA프랑스와인휴가계획유럽자동차
2nd row이주여성들도 연기파 배우 ‘맛있는 레시피-에프터 더 레인’ 극단 샐러드 서울의 한 식당에 장애를 가진 아기를 안고 한 이주여성이 들어왔다. “저 일 좀 시켜주세요.”주인 할머니는 불쌍한 그녀를 받아드리지만 곧 할머니가 사고로 몸을 가눌 수 없게 된다. 엎친 데 덮친 격으로 할머니의 아들은 사채 빚까지 지게 되고 결국 가게를 팔 수 밖에 없는 처지에 놓이게 되는데.... 실제로 이런 일이 일어난다면 얼마나 속상할까? 하지만 이건 실제가 아닌 연극이다. 바로 공개 오디션을 통해 모집된 총 7개국(중국몽골필리핀스리랑카터키방글라데시베트남)출신 10명의 배우가 본.......
3rd row 결혼하고 신랑과 처음으로 간 여행지가 경남에 거제도 위치한 “신선대”와 외도를 다녀왔어요^^ 처음가게된 경남지역엔 볼거리들이 가득하더라구요^^경상남도 거제시 남부면 갈곶리 도장포마을 바닷가에 있는 커다란 바위이며. 신선이 놀던 자리라 하여 신선대라고 불릴 만큼 경치가 뛰어나더라구요^^ 정말 즐거운 여행이였어요^^그리고 아름다운 섬 외도 를 다녀왔어요! 이창호.최호숙부부가 처음으로 섬을 개발했다가하여 정말 놀랬어요! 그 두두 덕분에 저희 부부 또한 아름다운 섬을 구경할수있어서 정말 행복하더라구요^^
4th row 2월 7일부터 오늘까지 남부지방을 중심으로 잦은 비가 내리고 있다. 왜 이러한 잦은 비가 계속 되고 있는 걸까? 1. 최근 중동태평야의 해수면 온도가 평년보다 1.2도 높은 엘니뇨 상태가 지속되고 있다. 엘니뇨 모도키의 영향으로 필리핀 부근에서 발달한 해양성 고기압이 일본 남쪽까지 확장되어 북쪽의 대륙고기압 세력을.....tag : 겨울비설날겨울비
5th row2010년 2월10일 수요일안드로이드 아이폰 넘을까?가슴떨리게 하는 멋진 이 광고 아시죠? 그럼 귀여우면서도 앙칼질 초록괴물 녀석은요? 요즘 기억에 남는 광고이면서동시에 모두 '안드로이드폰'이라는 공통점이 있죠~각 제조사와 이동통신사에서상반기 내에만 여러 종류의 안드로이드폰 출시를 기다리고 있다는데안드로이드폰이 과연 아이폰의 아성을 넘어설까요?우선 기대도에서는 앞선 것으로 보이는데요.한 시장조사기관의 설문조사 결과현재의 운영체계(OS) 선호도는아이폰OS가 37.6% 안드로이드가 27.3% 윈도 모바일이 21.0%인 반면미래 유망한 운영체계(OS)에 .......
ValueCountFrequency (%)
9808
 
1.7%
많은 3498
 
0.6%
2010년 3367
 
0.6%
3204
 
0.6%
3131
 
0.6%
충남 2869
 
0.5%
클릭 2613
 
0.5%
소식은 2600
 
0.5%
news 2597
 
0.5%
cni 2595
 
0.5%
Other values (168194) 526124
93.5%
2023-12-12T18:31:36.265733image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
576351
 
20.5%
. 91522
 
3.3%
45893
 
1.6%
0 33406
 
1.2%
32480
 
1.2%
31016
 
1.1%
28967
 
1.0%
1 27434
 
1.0%
27153
 
1.0%
26339
 
0.9%
Other values (2445) 1891372
67.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1803051
64.1%
Space Separator 576431
 
20.5%
Other Punctuation 127085
 
4.5%
Decimal Number 123917
 
4.4%
Lowercase Letter 87122
 
3.1%
Uppercase Letter 24921
 
0.9%
Control 17837
 
0.6%
Open Punctuation 14223
 
0.5%
Close Punctuation 14022
 
0.5%
Dash Punctuation 6484
 
0.2%
Other values (9) 16840
 
0.6%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
45893
 
2.5%
32480
 
1.8%
31016
 
1.7%
28967
 
1.6%
27153
 
1.5%
26339
 
1.5%
24998
 
1.4%
23998
 
1.3%
23452
 
1.3%
23244
 
1.3%
Other values (2226) 1515511
84.1%
Other Symbol
ValueCountFrequency (%)
570
26.3%
212
 
9.8%
177
 
8.2%
135
 
6.2%
119
 
5.5%
112
 
5.2%
89
 
4.1%
78
 
3.6%
75
 
3.5%
70
 
3.2%
Other values (43) 532
24.5%
Other Punctuation
ValueCountFrequency (%)
. 91522
72.0%
: 11739
 
9.2%
' 5533
 
4.4%
! 3755
 
3.0%
? 3554
 
2.8%
@ 2599
 
2.0%
· 2155
 
1.7%
" 2002
 
1.6%
/ 1481
 
1.2%
% 1251
 
1.0%
Other values (20) 1494
 
1.2%
Lowercase Letter
ValueCountFrequency (%)
a 10760
12.4%
e 10213
11.7%
t 7989
 
9.2%
g 6114
 
7.0%
n 5655
 
6.5%
i 5354
 
6.1%
s 5261
 
6.0%
o 5177
 
5.9%
r 4962
 
5.7%
k 4322
 
5.0%
Other values (19) 21315
24.5%
Uppercase Letter
ValueCountFrequency (%)
N 5808
23.3%
C 3949
15.8%
T 1681
 
6.7%
S 1354
 
5.4%
A 1137
 
4.6%
I 1088
 
4.4%
D 920
 
3.7%
P 911
 
3.7%
M 809
 
3.2%
E 788
 
3.2%
Other values (16) 6476
26.0%
Math Symbol
ValueCountFrequency (%)
~ 2772
69.4%
> 526
 
13.2%
= 135
 
3.4%
+ 123
 
3.1%
122
 
3.1%
105
 
2.6%
| 81
 
2.0%
44
 
1.1%
24
 
0.6%
× 16
 
0.4%
Other values (9) 45
 
1.1%
Decimal Number
ValueCountFrequency (%)
0 33406
27.0%
1 27434
22.1%
2 21990
17.7%
3 8151
 
6.6%
5 7000
 
5.6%
9 6623
 
5.3%
4 6550
 
5.3%
6 4723
 
3.8%
8 4288
 
3.5%
7 3747
 
3.0%
Other values (3) 5
 
< 0.1%
Open Punctuation
ValueCountFrequency (%)
( 10661
75.0%
[ 2965
 
20.8%
393
 
2.8%
149
 
1.0%
18
 
0.1%
{ 13
 
0.1%
12
 
0.1%
8
 
0.1%
2
 
< 0.1%
2
 
< 0.1%
Close Punctuation
ValueCountFrequency (%)
) 10502
74.9%
] 2957
 
21.1%
367
 
2.6%
147
 
1.0%
18
 
0.1%
} 11
 
0.1%
8
 
0.1%
8
 
0.1%
2
 
< 0.1%
2
 
< 0.1%
Other Number
ValueCountFrequency (%)
41
33.1%
31
25.0%
24
19.4%
15
 
12.1%
7
 
5.6%
4
 
3.2%
1
 
0.8%
1
 
0.8%
Letter Number
ValueCountFrequency (%)
11
57.9%
3
 
15.8%
2
 
10.5%
1
 
5.3%
1
 
5.3%
1
 
5.3%
Modifier Symbol
ValueCountFrequency (%)
^ 1224
93.4%
` 74
 
5.6%
´ 10
 
0.8%
˚ 2
 
0.2%
Space Separator
ValueCountFrequency (%)
576351
> 99.9%
  80
 
< 0.1%
Dash Punctuation
ValueCountFrequency (%)
- 6476
99.9%
8
 
0.1%
Initial Punctuation
ValueCountFrequency (%)
3359
70.2%
1426
29.8%
Final Punctuation
ValueCountFrequency (%)
3068
72.4%
1170
 
27.6%
Control
ValueCountFrequency (%)
17837
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 199
100.0%
Currency Symbol
ValueCountFrequency (%)
$ 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1801259
64.1%
Common 896823
31.9%
Latin 112049
 
4.0%
Han 1795
 
0.1%
Hiragana 5
 
< 0.1%
Greek 2
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
45893
 
2.5%
32480
 
1.8%
31016
 
1.7%
28967
 
1.6%
27153
 
1.5%
26339
 
1.5%
24998
 
1.4%
23998
 
1.3%
23452
 
1.3%
23244
 
1.3%
Other values (1625) 1513719
84.0%
Han
ValueCountFrequency (%)
55
 
3.1%
35
 
1.9%
25
 
1.4%
25
 
1.4%
23
 
1.3%
23
 
1.3%
21
 
1.2%
18
 
1.0%
18
 
1.0%
17
 
0.9%
Other values (588) 1535
85.5%
Common
ValueCountFrequency (%)
576351
64.3%
. 91522
 
10.2%
0 33406
 
3.7%
1 27434
 
3.1%
2 21990
 
2.5%
17837
 
2.0%
: 11739
 
1.3%
( 10661
 
1.2%
) 10502
 
1.2%
3 8151
 
0.9%
Other values (148) 87230
 
9.7%
Latin
ValueCountFrequency (%)
a 10760
 
9.6%
e 10213
 
9.1%
t 7989
 
7.1%
g 6114
 
5.5%
N 5808
 
5.2%
n 5655
 
5.0%
i 5354
 
4.8%
s 5261
 
4.7%
o 5177
 
4.6%
r 4962
 
4.4%
Other values (49) 44756
39.9%
Hiragana
ValueCountFrequency (%)
2
40.0%
1
20.0%
1
20.0%
1
20.0%
Greek
ValueCountFrequency (%)
α 2
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1800598
64.0%
ASCII 993217
35.3%
Punctuation 9552
 
0.3%
None 3606
 
0.1%
CJK 1737
 
0.1%
Geometric Shapes 1350
 
< 0.1%
Compat Jamo 653
 
< 0.1%
Misc Symbols 419
 
< 0.1%
CJK Compat 251
 
< 0.1%
Enclosed Alphanum 186
 
< 0.1%
Other values (8) 364
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
576351
58.0%
. 91522
 
9.2%
0 33406
 
3.4%
1 27434
 
2.8%
2 21990
 
2.2%
17837
 
1.8%
: 11739
 
1.2%
a 10760
 
1.1%
( 10661
 
1.1%
) 10502
 
1.1%
Other values (84) 181015
 
18.2%
Hangul
ValueCountFrequency (%)
45893
 
2.5%
32480
 
1.8%
31016
 
1.7%
28967
 
1.6%
27153
 
1.5%
26339
 
1.5%
24998
 
1.4%
23998
 
1.3%
23452
 
1.3%
23244
 
1.3%
Other values (1609) 1513058
84.0%
Punctuation
ValueCountFrequency (%)
3359
35.2%
3068
32.1%
1426
14.9%
1170
 
12.2%
383
 
4.0%
132
 
1.4%
8
 
0.1%
3
 
< 0.1%
2
 
< 0.1%
1
 
< 0.1%
None
ValueCountFrequency (%)
· 2155
59.8%
393
 
10.9%
367
 
10.2%
149
 
4.1%
147
 
4.1%
122
 
3.4%
  80
 
2.2%
18
 
0.5%
18
 
0.5%
× 16
 
0.4%
Other values (32) 141
 
3.9%
Geometric Shapes
ValueCountFrequency (%)
570
42.2%
212
 
15.7%
177
 
13.1%
112
 
8.3%
89
 
6.6%
56
 
4.1%
33
 
2.4%
21
 
1.6%
19
 
1.4%
16
 
1.2%
Other values (6) 45
 
3.3%
Compat Jamo
ValueCountFrequency (%)
288
44.1%
123
18.8%
79
 
12.1%
62
 
9.5%
44
 
6.7%
17
 
2.6%
14
 
2.1%
12
 
1.8%
5
 
0.8%
3
 
0.5%
Other values (5) 6
 
0.9%
CJK Compat
ValueCountFrequency (%)
135
53.8%
29
 
11.6%
27
 
10.8%
17
 
6.8%
11
 
4.4%
10
 
4.0%
6
 
2.4%
6
 
2.4%
3
 
1.2%
2
 
0.8%
Other values (4) 5
 
2.0%
Misc Symbols
ValueCountFrequency (%)
119
28.4%
78
18.6%
75
17.9%
32
 
7.6%
32
 
7.6%
26
 
6.2%
19
 
4.5%
13
 
3.1%
9
 
2.1%
6
 
1.4%
Other values (6) 10
 
2.4%
Arrows
ValueCountFrequency (%)
105
58.7%
44
24.6%
24
 
13.4%
6
 
3.4%
Enclosed Alphanum
ValueCountFrequency (%)
70
37.6%
41
22.0%
31
16.7%
24
 
12.9%
15
 
8.1%
4
 
2.2%
1
 
0.5%
Letterlike Symbols
ValueCountFrequency (%)
65
84.4%
11
 
14.3%
1
 
1.3%
CJK
ValueCountFrequency (%)
55
 
3.2%
35
 
2.0%
25
 
1.4%
25
 
1.4%
23
 
1.3%
23
 
1.3%
21
 
1.2%
18
 
1.0%
18
 
1.0%
17
 
1.0%
Other values (568) 1477
85.0%
Math Operators
ValueCountFrequency (%)
15
78.9%
2
 
10.5%
2
 
10.5%
CJK Compat Ideographs
ValueCountFrequency (%)
15
25.9%
11
19.0%
6
 
10.3%
5
 
8.6%
2
 
3.4%
2
 
3.4%
2
 
3.4%
2
 
3.4%
2
 
3.4%
1
 
1.7%
Other values (10) 10
17.2%
Number Forms
ValueCountFrequency (%)
11
57.9%
3
 
15.8%
2
 
10.5%
1
 
5.3%
1
 
5.3%
1
 
5.3%
Box Drawing
ValueCountFrequency (%)
2
40.0%
2
40.0%
1
20.0%
Hiragana
ValueCountFrequency (%)
2
40.0%
1
20.0%
1
20.0%
1
20.0%
Modifier Letters
ValueCountFrequency (%)
˚ 2
100.0%
Distinct9164
Distinct (%)91.6%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-12T18:31:36.744589image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length283
Median length177
Mean length39.3018
Min length1

Characters and Unicode

Total characters393018
Distinct characters1247
Distinct categories13 ?
Distinct scripts4 ?
Distinct blocks7 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique8635 ?
Unique (%)86.4%

Sample

1st row명품·와인·선물·FTA·프랑스와인·휴가계획·유럽자동차
2nd row에프터 더 레인·샐러드
3rd row국내여행·거제·외도·신선대
4th row겨울비·설날겨울비
5th row두루누리·안드로이드폰·아이폰·모토로이·안드로보이·스마트폰·운영체계·어플리케이션·DMB·영상통화
ValueCountFrequency (%)
비즈니스·경제 140
 
0.6%
사회·정치 112
 
0.5%
활성화 42
 
0.2%
일자리 38
 
0.2%
지원 35
 
0.2%
충남 32
 
0.1%
향상 27
 
0.1%
조성 26
 
0.1%
26
 
0.1%
서비스 25
 
0.1%
Other values (17498) 21721
97.7%
2023-12-12T18:31:37.480884image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
· 63595
 
16.2%
12224
 
3.1%
5224
 
1.3%
4836
 
1.2%
4356
 
1.1%
4138
 
1.1%
4061
 
1.0%
3910
 
1.0%
3824
 
1.0%
3637
 
0.9%
Other values (1237) 283213
72.1%

Most occurring categories

ValueCountFrequency (%)
Other Letter 304081
77.4%
Other Punctuation 63760
 
16.2%
Space Separator 12224
 
3.1%
Uppercase Letter 5947
 
1.5%
Decimal Number 4114
 
1.0%
Lowercase Letter 2547
 
0.6%
Connector Punctuation 169
 
< 0.1%
Dash Punctuation 119
 
< 0.1%
Close Punctuation 24
 
< 0.1%
Open Punctuation 24
 
< 0.1%
Other values (3) 9
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
5224
 
1.7%
4836
 
1.6%
4356
 
1.4%
4138
 
1.4%
4061
 
1.3%
3910
 
1.3%
3824
 
1.3%
3637
 
1.2%
3617
 
1.2%
3511
 
1.2%
Other values (1155) 262967
86.5%
Uppercase Letter
ValueCountFrequency (%)
T 697
 
11.7%
I 561
 
9.4%
C 491
 
8.3%
D 451
 
7.6%
S 445
 
7.5%
A 436
 
7.3%
K 284
 
4.8%
F 280
 
4.7%
P 266
 
4.5%
M 257
 
4.3%
Other values (16) 1779
29.9%
Lowercase Letter
ValueCountFrequency (%)
a 273
 
10.7%
e 267
 
10.5%
o 230
 
9.0%
n 223
 
8.8%
r 154
 
6.0%
t 144
 
5.7%
i 143
 
5.6%
s 129
 
5.1%
c 121
 
4.8%
p 105
 
4.1%
Other values (16) 758
29.8%
Other Punctuation
ValueCountFrequency (%)
· 63595
99.7%
. 131
 
0.2%
! 9
 
< 0.1%
/ 8
 
< 0.1%
' 4
 
< 0.1%
? 4
 
< 0.1%
& 3
 
< 0.1%
: 2
 
< 0.1%
@ 2
 
< 0.1%
% 2
 
< 0.1%
Decimal Number
ValueCountFrequency (%)
1 1131
27.5%
0 1098
26.7%
2 912
22.2%
3 253
 
6.1%
9 192
 
4.7%
4 173
 
4.2%
5 154
 
3.7%
6 79
 
1.9%
8 67
 
1.6%
7 55
 
1.3%
Math Symbol
ValueCountFrequency (%)
| 3
42.9%
+ 3
42.9%
~ 1
 
14.3%
Space Separator
ValueCountFrequency (%)
12224
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 169
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 119
100.0%
Close Punctuation
ValueCountFrequency (%)
) 24
100.0%
Open Punctuation
ValueCountFrequency (%)
( 24
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%
Other Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 304074
77.4%
Common 80442
 
20.5%
Latin 8495
 
2.2%
Han 7
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
5224
 
1.7%
4836
 
1.6%
4356
 
1.4%
4138
 
1.4%
4061
 
1.3%
3910
 
1.3%
3824
 
1.3%
3637
 
1.2%
3617
 
1.2%
3511
 
1.2%
Other values (1148) 262960
86.5%
Latin
ValueCountFrequency (%)
T 697
 
8.2%
I 561
 
6.6%
C 491
 
5.8%
D 451
 
5.3%
S 445
 
5.2%
A 436
 
5.1%
K 284
 
3.3%
F 280
 
3.3%
a 273
 
3.2%
e 267
 
3.1%
Other values (43) 4310
50.7%
Common
ValueCountFrequency (%)
· 63595
79.1%
12224
 
15.2%
1 1131
 
1.4%
0 1098
 
1.4%
2 912
 
1.1%
3 253
 
0.3%
9 192
 
0.2%
4 173
 
0.2%
_ 169
 
0.2%
5 154
 
0.2%
Other values (19) 541
 
0.7%
Han
ValueCountFrequency (%)
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 304062
77.4%
None 63596
 
16.2%
ASCII 25340
 
6.4%
Compat Jamo 12
 
< 0.1%
CJK 6
 
< 0.1%
Number Forms 1
 
< 0.1%
CJK Compat Ideographs 1
 
< 0.1%

Most frequent character per block

None
ValueCountFrequency (%)
· 63595
> 99.9%
1
 
< 0.1%
ASCII
ValueCountFrequency (%)
12224
48.2%
1 1131
 
4.5%
0 1098
 
4.3%
2 912
 
3.6%
T 697
 
2.8%
I 561
 
2.2%
C 491
 
1.9%
D 451
 
1.8%
S 445
 
1.8%
A 436
 
1.7%
Other values (69) 6894
27.2%
Hangul
ValueCountFrequency (%)
5224
 
1.7%
4836
 
1.6%
4356
 
1.4%
4138
 
1.4%
4061
 
1.3%
3910
 
1.3%
3824
 
1.3%
3637
 
1.2%
3617
 
1.2%
3511
 
1.2%
Other values (1138) 262948
86.5%
Compat Jamo
ValueCountFrequency (%)
3
25.0%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
CJK
ValueCountFrequency (%)
1
16.7%
1
16.7%
1
16.7%
1
16.7%
1
16.7%
1
16.7%
Number Forms
ValueCountFrequency (%)
1
100.0%
CJK Compat Ideographs
ValueCountFrequency (%)
1
100.0%

Correlations

2023-12-12T18:31:37.631310image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
카테고리명카테고리주소
카테고리명1.0001.000
카테고리주소1.0001.000

Missing values

2023-12-12T18:31:30.246073image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T18:31:30.420711image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

메타블로그아이디컨텐츠의제목컨텐츠등록일카테고리명카테고리주소컨텐츠주소요약정보관련태그
7892metablog10789한-EUFTA발효후달라질소비생활2010-02-02 14:22:09FTA국내대책위원회http://blog.daum.net/korusftahttp://blog.daum.net/korusfta/16895260한-유럽연합(EU) 자유무역협정(FTA)이 타결되면 유럽산 와인 식재료 의류·가방 등의 가격이 내릴 전망이다. 기혼여성 황모씨와 미혼여성 김모씨를 통해 한-EU FTA가 한국인의 소비생활에 가져올 변화를 조망해 본다. 물론 예상을 바탕으로 한 것으로 구체적인 가격이 일치하지 않을 수도 있다. 최근 시청자들에게 큰 사랑.....tag : 명품와인선물FTA프랑스와인휴가계획유럽자동차명품·와인·선물·FTA·프랑스와인·휴가계획·유럽자동차
10923metablog12907맛있는레시피-에프터더레인?2010-02-16 09:38:28법무부 정책 블로그http://blog.naver.com/mojjusticehttp://blog.naver.com/mojjustice/150080930235이주여성들도 연기파 배우 ‘맛있는 레시피-에프터 더 레인’ 극단 샐러드 서울의 한 식당에 장애를 가진 아기를 안고 한 이주여성이 들어왔다. “저 일 좀 시켜주세요.”주인 할머니는 불쌍한 그녀를 받아드리지만 곧 할머니가 사고로 몸을 가눌 수 없게 된다. 엎친 데 덮친 격으로 할머니의 아들은 사채 빚까지 지게 되고 결국 가게를 팔 수 밖에 없는 처지에 놓이게 되는데.... 실제로 이런 일이 일어난다면 얼마나 속상할까? 하지만 이건 실제가 아닌 연극이다. 바로 공개 오디션을 통해 모집된 총 7개국(중국몽골필리핀스리랑카터키방글라데시베트남)출신 10명의 배우가 본.......에프터 더 레인·샐러드
1919metablog2120당첨작:경남여행기(거제외도신선대)^^2009-12-12 07:25:00따오기의 녹색 이야기 "따옥따옥"http://blog.naver.com/gnfeelhttp://blog.naver.com/gnfeel/140095572272결혼하고 신랑과 처음으로 간 여행지가 경남에 거제도 위치한 “신선대”와 외도를 다녀왔어요^^ 처음가게된 경남지역엔 볼거리들이 가득하더라구요^^경상남도 거제시 남부면 갈곶리 도장포마을 바닷가에 있는 커다란 바위이며. 신선이 놀던 자리라 하여 신선대라고 불릴 만큼 경치가 뛰어나더라구요^^ 정말 즐거운 여행이였어요^^그리고 아름다운 섬 외도 를 다녀왔어요! 이창호.최호숙부부가 처음으로 섬을 개발했다가하여 정말 놀랬어요! 그 두두 덕분에 저희 부부 또한 아름다운 섬을 구경할수있어서 정말 행복하더라구요^^국내여행·거제·외도·신선대
10635metablog12510계속되는겨울비언제까지오나요?2010-02-10 23:37:19하늘친구들http://blog.daum.net/kma_skylovehttp://blog.daum.net/kma_skylove/76682012월 7일부터 오늘까지 남부지방을 중심으로 잦은 비가 내리고 있다. 왜 이러한 잦은 비가 계속 되고 있는 걸까? 1. 최근 중동태평야의 해수면 온도가 평년보다 1.2도 높은 엘니뇨 상태가 지속되고 있다. 엘니뇨 모도키의 영향으로 필리핀 부근에서 발달한 해양성 고기압이 일본 남쪽까지 확장되어 북쪽의 대륙고기압 세력을.....tag : 겨울비설날겨울비겨울비·설날겨울비
10362metablog12358안드로이드아이폰넘을까?2010-02-10 10:03:42두루누리=방송통신위원회 공식블로그http://blog.naver.com/kcc1335http://blog.naver.com/kcc1335/1300802243992010년 2월10일 수요일안드로이드 아이폰 넘을까?가슴떨리게 하는 멋진 이 광고 아시죠? 그럼 귀여우면서도 앙칼질 초록괴물 녀석은요? 요즘 기억에 남는 광고이면서동시에 모두 '안드로이드폰'이라는 공통점이 있죠~각 제조사와 이동통신사에서상반기 내에만 여러 종류의 안드로이드폰 출시를 기다리고 있다는데안드로이드폰이 과연 아이폰의 아성을 넘어설까요?우선 기대도에서는 앞선 것으로 보이는데요.한 시장조사기관의 설문조사 결과현재의 운영체계(OS) 선호도는아이폰OS가 37.6% 안드로이드가 27.3% 윈도 모바일이 21.0%인 반면미래 유망한 운영체계(OS)에 .......두루누리·안드로이드폰·아이폰·모토로이·안드로보이·스마트폰·운영체계·어플리케이션·DMB·영상통화
3869metablog4559초록나래산을가다(지리산국립공원)2010-01-01 13:33:36환경부 정책홍보 블로그 초록나래http://blog.daum.net/mepr_greenwinghttp://blog.daum.net/mepr_greenwing/7632229초록나래 산을 가다 (지리산 국립공원) 1. 우리나라 최초의 국립공원 지리산은 전라남도 구례군과 전라북도 남원시 경상남도의 하동 산청 함양군 3개도에 걸쳐 자리를 잡고 있습니다. 1967년 12월 29일 우리나라 최초로 국립공원에 지정된 지리산은 주능선이 길이......tag : 지리산삼도봉국립공원천왕봉환경부지리산 종주고사목장터목 대피소세석평전초록나래종주 산행겨울철 산행지리산·삼도봉·국립공원·천왕봉·환경부·지리산 종주·고사목·장터목 대피소·세석평전·초록나래·종주 산행·겨울철 산행
12416metablog14615계약을할때는꼭계약서를!2010-03-02 10:39:58검토리가 본 검찰이야기http://blog.daum.net/spogoodhttp://blog.daum.net/spogood/669계약이란 두 사람 이상 사이에 체결되는 법률적인 약속입니다. 우리는 살아가면서 여러 종류의 계약을 하게 되는데요 예를 등어 버스를 타는 것은 버스 운송회사와의 계약이고 자판기에서 커피를 뽑는 것 또한 계약입니다. 이처럼 우리는 특별히 의식하지 않은채 여러가지 계약을 맺으며 살고 있습니다. 그러나 가끔은 제.....tag : 계약계약서차용증차용계약·계약서·차용증·차용
11891metablog13648모바일스타기업만들어볼까?2010-02-22 11:39:42☆두루누리☆ = 방송통신위원회 공식블로그http://blog.daum.net/kcc1335http://blog.daum.net/kcc1335/1863모바일 스타기업 만들어볼까?? 스마트폰의 활성화로 인해 무선인터넷 생태계의 무게중심이 공급자 위주에서 소비자 중심으로 급격히 옮겨가고 있는 것 잘 알고 계시죠? 모바일 콘텐츠와 소프트웨어가 글로벌 무선 인터넷 시장을 주도할 수 있는 가장 큰 경쟁력으로 보이네요. But 우리나에선 뛰어난 기술을 보유하고 있음에.....tag : 마케팅엔씨소프트벤처최시중방통위모바일광고스마트폰NHN벤처투자모바일기업모바일벤처IT발전 기금5000억원KIF마케팅·엔씨소프트·벤처·최시중·방통위·모바일광고·스마트폰·NHN·벤처투자·모바일기업·모바일벤처·IT발전 기금·5000억원·KIF
3219metablog48242010우수바이오제품품질인증제지원사업실시2010-01-05 15:03:32그곳이 차마 꿈엔들 잊힐리야http://blog.daum.net/cbkb21http://blog.daum.net/cbkb21/16904721충북도는 지역바이오제품에 대한 소비자의 신뢰도를 향상시키고 제품의 안정적인 판매촉진을 위하여 충청북도지사 인증 우수바이오제품 품질인증제 지원사업을 시행한다. 사업신청 자격은 도내에 소재한 기업중 한국산업규격 KSM 1000의 바이오산업분류코드의 바이오제품(생물의학 ......tag : 충청북도바이오인증바이오제품첨단의료복합단지바이오토피아한국산업규격바이오마크충청북도·바이오·인증·바이오제품·첨단의료복합단지·바이오토피아·한국산업규격·바이오마크
12216metablog14950실업급여신규신청자2월들어작년동기보다감소2010-03-03 16:02:55무대리의 내일을 위한 수다http://blog.naver.com/molab_sudahttp://blog.naver.com/molab_suda/30081792092고용유지지원금은 ‘09. 1월 이후 최저 노동부는 올해 2월 실업급여 신규 신청자가 88천명으로 나타나 작년 동기보다 20천명(18.5%)이 감소하였다고 밝혔어요.또한 올해 2월 실업급여는 417천명에게 3308억원이 지급되어 전년 동기 400천명 3103억원에 비해 지급자수는 4.3% 지급액은 6.6%가 증가하였어요. 한편 고용조정이 불가피한 사업주가 휴업·훈련 등을 통해 근로자의 고용유지를 하는 경우 지급하는 고용유지지원금은 올해 2월 계획신고가 689건으로 전년 동기 6130건에 비해 88.8% 감소하고 지급액은 59억원으로 전년 동기 296억원에 비해 80.1%가 감소하여 ‘.......비즈니스·경제·실업급여
메타블로그아이디컨텐츠의제목컨텐츠등록일카테고리명카테고리주소컨텐츠주소요약정보관련태그
5810metablog7242아성방한민선생학술강연회개최2010-01-15 10:50:09충청남도http://blog.naver.com/sinmunmanhttp://blog.naver.com/sinmunman/70078137364더 많은 충남 소식은 CNi News 클릭 아성 방한민 선생 학술강연회 개최 [0호] 2010년 01월 14일 (목) 10:03:17논산시청 kimds70s@nate.com 사단법인 대한민국순국선열유족회가 주최하고 논산문화원(원장 박웅진) 아성 방한민선생기념사업회가 주관하는 ‘아성 방한민 선생 학술강연회’가 1월 15일(금) 오후 2시에 논산문화예술회관 소공연장에서 개최된다. 이번 강연회는 우리지역 논산(강경)출신으로 1월의 독립운동가로 선정된 ‘아성 방한민 선생’의 탄신 110년을 기념하고 선생의 생애와 업적을 재조명하는 행사이다. 본 행사는 1부 기념식과 2부 공훈선양 학술.......대한민국순국선열유족회·논산문화원·논산문화예술회관·건국훈장 애국장·아성 방한민 선생
6888metablog9592日백제축제‘시와스마츠리’대백제전참가할듯2010-01-26 15:51:29충청남도http://blog.naver.com/sinmunmanhttp://blog.naver.com/sinmunman/70079030869더 많은 충남 소식은 CNi News 클릭 日 백제축제 ‘시와스 마츠리’ 대백제전 참가할 듯 대백제전 측 “옛 백제왕 부자 기리는 축제...참가 요청에 긍정 답변” 밝혀 [0호] 2010년 01월 26일 (화) 11:04:23충청남도 neoems@ems.chungnam.net 옛 백제 멸망 직후 일본으로 망명한 백제 왕족 부자(父子)의 생이별에 얽힌 슬픈 전설을 소재로 한 일본 내 대표 백제 문화축제가 2010세계 대백제전에서 재현될 가능성이 높다. 이 축제는 일본 미야자키현 옛 백제촌「난고손」의 현 행정구역인「미사토쵸」에서 벌어지는「시와스 마츠리」로서 이는 2010세계 대백제전이 추구하.......2010세계 대백제전·백제 문화축제·시와스 마츠리·한일 문화축제 한마당
1790metablog1351중앙소방학교김병훈전국최우수교수로선발2009-12-12 07:07:54네마의 안전생활 블로그http://blog.naver.com/nemabloghttp://blog.naver.com/nemablog/40094399495발표장면시상식 중앙소방학교 김병훈교수는 중앙공무원교육원에서 주관하는 제27회 중앙교육훈련경연대회에서 최우수 교수로 선발되어 대통령상을 수상하는 영예를 안았다. 지난 11월 13일 중앙공무원교육원.......네마·소방공무원·소방방재청·안전·안전상식·안전생활·안전수칙·정책·중앙소방학교
6632metablog8020서산사회복지통합관리망가동2010-01-19 15:50:38충청남도http://blog.naver.com/sinmunmanhttp://blog.naver.com/sinmunman/70078452974더 많은 충남 소식은 CNi News 클릭 서산 사회복지통합관리망 가동 [535호] 2010년 01월 19일 (화) 15:02:12서산/김인숙 기자 ins503@hanmail.net 서산시는 120여개의 복지급여 및 서비스 이력을 개인별 가구별로 통합 관리하는 ‘행복e음’(사회복지통합관리망)을 운영한다고 지난 5일 밝혔다. 이 시스템은 시민에게 필요한 서비스가 누락되지 않도록 하는 맞춤형 복지 서비스로서 복지행정의 획기적인 변화를 가져올 것으로 전망된다.서산시·사회복지통합관리망 가동·행복e음·맞품형 복지 서비스·복지행정
10577metablog12873국무총리“소외된이웃에게나눔을실천하는설명절되길”2010-02-12 18:08:31희망 Feel 하모닉http://blog.naver.com/pmo_1http://blog.naver.com/pmo_1/130080410189며칠 동안 비가 오더니 이제는 눈이 내리네요. 날씨 때문에 설 분위기는 물씬 나지만 고향에 가시는 분들은 안전 운전에 신경 쓰셔야 겠습니다. 정운찬 국무총리는 오늘(12일) 국가정책조정회의를 주재하고 철저한귀성길교통 대책을 주문했습니다. 정운찬 국무총리는 12일 세종로 정부중앙청사에서 국가정책조정회의를 주재했습니다.연휴 전날인 만큼 설과 관련된 이야기가 많았는데요. 우선 "오늘 오후부터 귀향이 시작되는데 곳곳에 내린 눈 때문에 불편이 더해질까 우려된다"며 "국민들이 안전하고 편안히 고향에 다녀올 수 있도록 관계 기관.......정운찬·국가정책조정회의·귀향길·귀성길교통대책
392metablog481청소년미디어중독이야기들어보니…2009-12-12 06:57:57따스아리 (따뜻한+메아리)http://blog.daum.net/mohwprhttp://blog.daum.net/mohwpr/12879272중학생인 현진이는 휴대폰이 없으면 단 하루도 살 수 없다. 친구들과 연락하는 목적이지만 수시로 휴대폰 메시지를 보내거나 확인하고 휴대폰 게임도 많이 한다. 현진이와 같은 또래의 동훈이는 수 시간씩 인터넷 게임을 하고 급기야 게임아이템 구입을 위해 부모님 몰래 아버지 지......tag : 보건복지가족부청소년 문제따스아리청소년미디어중독청소년 중독청소년 미디어 중독청소년 핸드폰 중독청소년 정신 건강청소년 미디어 중독 예방센터청소년미디어센터미디어중독예방센터보건복지가족부·청소년 문제·따스아리·청소년미디어중독·청소년 중독·청소년 미디어 중독·청소년 핸드폰 중독·청소년 정신 건강·청소년 미디어 중독 예방센터·청소년미디어센터·미디어중독예방센터
12130metablog15439손목시큰대는스마트폰유저2010-03-08 10:07:49두루누리=방송통신위원회 공식블로그http://blog.naver.com/kcc1335http://blog.naver.com/kcc1335/1300819740752010년 3월8일 월요일손목 시큰대는 스마트폰 유저오가는 차 안에서 스마트폰을 사용하는 이들때론 넷북을 이용해 본격적으로 인터넷 등을 하는 이들도 쉽게 만나죠~분명 그들은 집이나 회사 학교에서 컴퓨터를 사용할 텐데요.저 역시 마찬가지지만 참 지독히도 사랑에 빠졌습니다~그런데 한참을 키보드를 치다가 혹은 스마트폰을 이용하다가손가락이 아프거나 손목이 저리는 경험 없으셨나요?저는 처음 스마트폰을 사용하고 얼마 안지났을 때검지 손가락부터 손목이 아파서 정형외과를 다녔었는데요...이런 일이 비단 저만의 문제는 아닌 듯 합니다.스마트폰은 키보드가 없다보니 오타율을 줄이기 위해손가락을 곧추세워서 손.......스마트폰·넷북·컴퓨터·무선인터넷·검지족·손목터널증후군·스트레칭·키보드·마우스·인터넷
6322metablog80621천400년만의부활’백제역사재현단지웅자2010-01-19 16:20:41충청남도http://blog.daum.net/cnjjshttp://blog.daum.net/cnjjs/17744더 많은 충남 소식은 CNi News 클릭 ‘1천400년만의 부활’ 백제역사재현단지 웅자 [535호] 2010년 01월 19일 (화) 15:28:57 김용진 kimpress@korea.kr 역사와 위락·쇼핑·숙박 겸한 ‘한국형 역사테마파크’ 2010세계대백제전 주무대 ......tag : 백제역사문화관백제역사재현단지롯데부여리조트백제문화권관리사업소백제역사문화관·백제역사재현단지·롯데부여리조트·백제문화권관리사업소
1630metablog1289갈대.늪지.철새의고장순천만을가다☆폴인러브2009-12-12 07:07:25폴 인 러브http://blog.naver.com/e_podorihttp://blog.naver.com/e_podori/100094677177휴가 2일차 예정된 기차여행이다.순천행 새마을호 티켓을 들고 열차에 오른다. 늦가을 .. 가장 아름다운 정취를 풍기는 갈대밭.. 우리가 찾아간 순천만은 그야말로 "낭만"그 자체였다. 처음 들어섰을 때 부터 영화'불꽃처럼 나비처럼'의 한장면을 보는 것 같은(주인공 무명이 갈대밭 사이에서 배를 띄우고 노는 장면) 착각을 하게 했다. -순천만 갈대열차 - 열차를 타고 갈대밭을 돌아볼 수 있다. 비용은 천원짜리 한장 우리가 찾아갔을 때도 하늘을 검게 물들이며 무리지어 날아가는 철새떼를 볼수 있었.......국내여행·순천만·갈대·습지·자연생태공원·기차여행·철새·짱뚱어·문학·책·곽재구의포구기행
11270metablog140952010년방위사업청행정인턴!2010-02-24 17:08:47대한민국 군수품의 모든 것! 방위사업청http://blog.daum.net/dapaprhttp://blog.daum.net/dapapr/76724312009년 행정인턴 제도 청년실업 해소를 위해 중앙부처와 지방자치단체의 직장체험 및 취업지원을 통해 구직 청년들의 취업을 돕기 위한 행정인턴제도는 대졸 미취업자들이 정부 각 부처 등에서 사회 실무능력을 갖추도록 도왔습니다. 2010년에도 시행이 되고 있는데 어떤 점이 달라졌는지 알아봅시다. 2010년 행정인턴 무엇.....tag : 취업자기계발방위사업청방사청행정인턴방위청방위산업청취업·자기계발·방위사업청·방사청·행정인턴·방위청·방위산업청