Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 2620 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 64.1 KiB |
Average record size in memory | 25.1 B |
Variable types
DateTime | 1 |
---|---|
Text | 1 |
Numeric | 1 |
Dataset
Description | 뉴스데이터베이스 "BIGKinds" 에서 신문방송의 뉴스를 분석한 오늘의 이슈 정보입니다.국내 54개 언론사에서 가장 많이 다룬 오늘의 이슈 10건과 빈도 건수를 제공합니다.https://www.bigkinds.or.kr/v2/news/weekendNews.do 에 접속하면 보다 많은 정보를 확인할 수 있습니다. |
---|---|
Author | 한국언론진흥재단 |
URL | https://www.data.go.kr/data/15119893/fileData.do |
Reproduction
Analysis started | 2024-04-06 08:06:51.816948 |
---|---|
Analysis finished | 2024-04-06 08:06:53.558910 |
Duration | 1.74 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
날짜
Date
Distinct | 262 |
---|---|
Distinct (%) | 10.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.6 KiB |
Minimum | 2020-01-01 00:00:00 |
---|---|
Maximum | 2020-12-31 00:00:00 |
제목
Text
Distinct | 2446 |
---|---|
Distinct (%) | 93.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.6 KiB |
Length
Max length | 27 |
---|---|
Median length | 24 |
Mean length | 18.614885 |
Min length | 8 |
Characters and Unicode
Total characters | 48771 |
---|---|
Distinct characters | 674 |
Distinct categories | 10 ? |
Distinct scripts | 5 ? |
Distinct blocks | 5 ? |
Unique
Unique | 2372 ? |
---|---|
Unique (%) | 90.5% |
Sample
1st row | 초대 공수처장 후보 김진욱 지명 |
---|---|
2nd row | 박범계 신임 법무부장관 내정 |
3rd row | 코스피 사상 마감 최고 8만 전자 |
4th row | 김진욱 국민 공수처장 권한 후보 |
5th row | 카투사 한미 미군 한국인 백신 접종 |
Value | Count | Frequency (%) |
코로나19 | 495 | 3.6% |
확진자 | 291 | 2.1% |
확진 | 194 | 1.4% |
신규 | 178 | 1.3% |
코로나 | 178 | 1.3% |
대통령 | 143 | 1.0% |
발생 | 126 | 0.9% |
트럼프 | 119 | 0.9% |
감염 | 118 | 0.9% |
추가 | 103 | 0.7% |
Other values (3696) | 11882 |
Most occurring characters
Value | Count | Frequency (%) |
11207 | 23.0% | |
로 | 803 | 1.6% |
1 | 791 | 1.6% |
코 | 774 | 1.6% |
나 | 744 | 1.5% |
확 | 660 | 1.4% |
진 | 589 | 1.2% |
사 | 583 | 1.2% |
자 | 568 | 1.2% |
9 | 566 | 1.2% |
Other values (664) | 31486 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 33167 | |
Space Separator | 11207 | 23.0% |
Decimal Number | 2449 | 5.0% |
Other Punctuation | 839 | 1.7% |
Initial Punctuation | 478 | 1.0% |
Final Punctuation | 476 | 1.0% |
Uppercase Letter | 100 | 0.2% |
Dash Punctuation | 25 | 0.1% |
Lowercase Letter | 25 | 0.1% |
Math Symbol | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 803 | 2.4% |
코 | 774 | 2.3% |
나 | 744 | 2.2% |
확 | 660 | 2.0% |
진 | 589 | 1.8% |
사 | 583 | 1.8% |
자 | 568 | 1.7% |
대 | 565 | 1.7% |
국 | 492 | 1.5% |
이 | 476 | 1.4% |
Other values (614) | 26913 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 12 | |
C | 11 | |
S | 9 | 9.0% |
H | 8 | 8.0% |
D | 7 | 7.0% |
W | 7 | 7.0% |
T | 6 | 6.0% |
P | 6 | 6.0% |
K | 5 | 5.0% |
G | 5 | 5.0% |
Other values (9) | 24 |
Decimal Number
Value | Count | Frequency (%) |
1 | 791 | |
9 | 566 | |
2 | 246 | 10.0% |
0 | 225 | 9.2% |
3 | 181 | 7.4% |
5 | 122 | 5.0% |
4 | 109 | 4.5% |
7 | 79 | 3.2% |
8 | 67 | 2.7% |
6 | 63 | 2.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 542 | |
· | 136 | 16.2% |
. | 64 | 7.6% |
% | 58 | 6.9% |
? | 33 | 3.9% |
… | 2 | 0.2% |
" | 2 | 0.2% |
' | 2 | 0.2% |
Lowercase Letter
Value | Count | Frequency (%) |
n | 12 | |
m | 8 | |
v | 2 | 8.0% |
s | 2 | 8.0% |
α | 1 | 4.0% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 343 | |
“ | 135 | 28.2% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 341 | |
” | 135 | 28.4% |
Math Symbol
Value | Count | Frequency (%) |
~ | 3 | |
+ | 2 |
Space Separator
Value | Count | Frequency (%) |
11207 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 25 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 32923 | |
Common | 15479 | |
Han | 244 | 0.5% |
Latin | 124 | 0.3% |
Greek | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 803 | 2.4% |
코 | 774 | 2.4% |
나 | 744 | 2.3% |
확 | 660 | 2.0% |
진 | 589 | 1.8% |
사 | 583 | 1.8% |
자 | 568 | 1.7% |
대 | 565 | 1.7% |
국 | 492 | 1.5% |
이 | 476 | 1.4% |
Other values (597) | 26669 |
Common
Value | Count | Frequency (%) |
11207 | ||
1 | 791 | 5.1% |
9 | 566 | 3.7% |
, | 542 | 3.5% |
‘ | 343 | 2.2% |
’ | 341 | 2.2% |
2 | 246 | 1.6% |
0 | 225 | 1.5% |
3 | 181 | 1.2% |
· | 136 | 0.9% |
Other values (16) | 901 | 5.8% |
Latin
Value | Count | Frequency (%) |
n | 12 | 9.7% |
O | 12 | 9.7% |
C | 11 | 8.9% |
S | 9 | 7.3% |
m | 8 | 6.5% |
H | 8 | 6.5% |
D | 7 | 5.6% |
W | 7 | 5.6% |
T | 6 | 4.8% |
P | 6 | 4.8% |
Other values (13) | 38 |
Han
Value | Count | Frequency (%) |
文 | 75 | |
美 | 44 | |
北 | 30 | 12.3% |
靑 | 18 | 7.4% |
故 | 16 | 6.6% |
檢 | 14 | 5.7% |
日 | 13 | 5.3% |
與 | 12 | 4.9% |
中 | 10 | 4.1% |
尹 | 3 | 1.2% |
Other values (7) | 9 | 3.7% |
Greek
Value | Count | Frequency (%) |
α | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 32923 | |
ASCII | 14511 | |
Punctuation | 956 | 2.0% |
CJK | 244 | 0.5% |
None | 137 | 0.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
11207 | ||
1 | 791 | 5.5% |
9 | 566 | 3.9% |
, | 542 | 3.7% |
2 | 246 | 1.7% |
0 | 225 | 1.6% |
3 | 181 | 1.2% |
5 | 122 | 0.8% |
4 | 109 | 0.8% |
7 | 79 | 0.5% |
Other values (33) | 443 | 3.1% |
Hangul
Value | Count | Frequency (%) |
로 | 803 | 2.4% |
코 | 774 | 2.4% |
나 | 744 | 2.3% |
확 | 660 | 2.0% |
진 | 589 | 1.8% |
사 | 583 | 1.8% |
자 | 568 | 1.7% |
대 | 565 | 1.7% |
국 | 492 | 1.5% |
이 | 476 | 1.4% |
Other values (597) | 26669 |
Punctuation
Value | Count | Frequency (%) |
‘ | 343 | |
’ | 341 | |
“ | 135 | 14.1% |
” | 135 | 14.1% |
… | 2 | 0.2% |
None
Value | Count | Frequency (%) |
· | 136 | |
α | 1 | 0.7% |
CJK
Value | Count | Frequency (%) |
文 | 75 | |
美 | 44 | |
北 | 30 | 12.3% |
靑 | 18 | 7.4% |
故 | 16 | 6.6% |
檢 | 14 | 5.7% |
日 | 13 | 5.3% |
與 | 12 | 4.9% |
中 | 10 | 4.1% |
尹 | 3 | 1.2% |
Other values (7) | 9 | 3.7% |
건수
Real number (ℝ)
Distinct | 359 |
---|---|
Distinct (%) | 13.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 132.90038 |
Minimum | 26 |
---|---|
Maximum | 1264 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 23.2 KiB |
Quantile statistics
Minimum | 26 |
---|---|
5-th percentile | 59 |
Q1 | 81 |
median | 105 |
Q3 | 149 |
95-th percentile | 305 |
Maximum | 1264 |
Range | 1238 |
Interquartile range (IQR) | 68 |
Descriptive statistics
Standard deviation | 95.073326 |
---|---|
Coefficient of variation (CV) | 0.71537286 |
Kurtosis | 27.509239 |
Mean | 132.90038 |
Median Absolute Deviation (MAD) | 30 |
Skewness | 4.0222328 |
Sum | 348199 |
Variance | 9038.9374 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
79 | 37 | 1.4% |
96 | 37 | 1.4% |
83 | 36 | 1.4% |
99 | 36 | 1.4% |
90 | 35 | 1.3% |
104 | 35 | 1.3% |
81 | 34 | 1.3% |
95 | 34 | 1.3% |
73 | 32 | 1.2% |
74 | 31 | 1.2% |
Other values (349) | 2273 |
Value | Count | Frequency (%) |
26 | 1 | < 0.1% |
28 | 1 | < 0.1% |
37 | 1 | < 0.1% |
39 | 3 | |
40 | 4 | |
41 | 3 | |
42 | 1 | < 0.1% |
43 | 2 | 0.1% |
44 | 5 | |
45 | 2 | 0.1% |
Value | Count | Frequency (%) |
1264 | 1 | |
1237 | 1 | |
1026 | 1 | |
944 | 1 | |
924 | 1 | |
850 | 1 | |
709 | 1 | |
700 | 1 | |
699 | 1 | |
674 | 1 |
날짜 | 제목 | 건수 | |
---|---|---|---|
0 | 2020-12-31 | 초대 공수처장 후보 김진욱 지명 | 220 |
1 | 2020-12-31 | 박범계 신임 법무부장관 내정 | 192 |
2 | 2020-12-31 | 코스피 사상 마감 최고 8만 전자 | 114 |
3 | 2020-12-31 | 김진욱 국민 공수처장 권한 후보 | 107 |
4 | 2020-12-31 | 카투사 한미 미군 한국인 백신 접종 | 105 |
5 | 2020-12-31 | 서울 동부구치소 코로나19 추가 확진 | 96 |
6 | 2020-12-31 | 여성단체연합, ‘박원순 피소’ 유출 연루 | 95 |
7 | 2020-12-31 | 영국발 변이 바이러스 2명 추가 확인 | 94 |
8 | 2020-12-31 | 이재용 국정농단 재판 징역 9년 구형 | 89 |
9 | 2020-12-31 | 김진욱 공수처장 초대 지명 출신 | 86 |
날짜 | 제목 | 건수 | |
---|---|---|---|
2610 | 2020-01-01 | 검찰 조국 뇌물 혐의 불구속 기소 | 208 |
2611 | 2020-01-01 | 폼페이오 김정은 트럼프 약속 전략무기 | 148 |
2612 | 2020-01-01 | 검찰 뇌물 조국 혐의 불구속 기소 | 81 |
2613 | 2020-01-01 | 2020년 대통령 새해 열매 국민 성과 신년 | 80 |
2614 | 2020-01-01 | 송병기 선거 개입 영장 구속 | 73 |
2615 | 2020-01-01 | 날씨 첫날 해돋이 새해 한파 강추위 | 71 |
2616 | 2020-01-01 | 여야 새해 이해찬 총선 승리 집권 다짐 | 70 |
2617 | 2020-01-01 | 김정은 투쟁 결심 전원회의 | 69 |
2618 | 2020-01-01 | 소비자물가 상승 0.4% 최저 | 60 |
2619 | 2020-01-01 | 폼페이오 김정은 트럼프 약속 전략무기 | 59 |