Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 200 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 5.2 KiB |
Average record size in memory | 26.7 B |
Variable types
Numeric | 2 |
---|---|
Text | 1 |
Dataset
Description | 뉴스데이터베이스 "BIGKinds" 기반 분석 자료, 기타 메타정보 |
---|---|
Author | 한국언론진흥재단 |
URL | https://www.data.go.kr/data/15072750/fileData.do |
Reproduction
Analysis started | 2023-12-12 14:47:51.279491 |
---|---|
Analysis finished | 2023-12-12 14:47:52.114314 |
Duration | 0.83 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순위
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 200 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 100.5 |
Minimum | 1 |
---|---|
Maximum | 200 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 10.95 |
Q1 | 50.75 |
median | 100.5 |
Q3 | 150.25 |
95-th percentile | 190.05 |
Maximum | 200 |
Range | 199 |
Interquartile range (IQR) | 99.5 |
Descriptive statistics
Standard deviation | 57.879185 |
---|---|
Coefficient of variation (CV) | 0.57591228 |
Kurtosis | -1.2 |
Mean | 100.5 |
Median Absolute Deviation (MAD) | 50 |
Skewness | 0 |
Sum | 20100 |
Variance | 3350 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.5% |
139 | 1 | 0.5% |
129 | 1 | 0.5% |
130 | 1 | 0.5% |
131 | 1 | 0.5% |
132 | 1 | 0.5% |
133 | 1 | 0.5% |
134 | 1 | 0.5% |
135 | 1 | 0.5% |
136 | 1 | 0.5% |
Other values (190) | 190 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
200 | 1 | |
199 | 1 | |
198 | 1 | |
197 | 1 | |
196 | 1 | |
195 | 1 | |
194 | 1 | |
193 | 1 | |
192 | 1 | |
191 | 1 |
키워드
Text
UNIQUE
 
Distinct | 200 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
Value | Count | Frequency (%) |
대통령 | 1 | 0.5% |
선수들 | 1 | 0.5% |
대법원 | 1 | 0.5% |
프리미엄 | 1 | 0.5% |
카탈루냐 | 1 | 0.5% |
간담회 | 1 | 0.5% |
전기차 | 1 | 0.5% |
대변인 | 1 | 0.5% |
ceo | 1 | 0.5% |
인공지능 | 1 | 0.5% |
Other values (190) | 190 |
Most occurring characters
Value | Count | Frequency (%) |
자 | 22 | 3.4% |
이 | 16 | 2.4% |
트 | 15 | 2.3% |
인 | 14 | 2.1% |
스 | 13 | 2.0% |
시 | 13 | 2.0% |
부 | 12 | 1.8% |
전 | 11 | 1.7% |
대 | 11 | 1.7% |
리 | 10 | 1.5% |
Other values (252) | 517 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 618 | |
Uppercase Letter | 22 | 3.4% |
Lowercase Letter | 5 | 0.8% |
Decimal Number | 5 | 0.8% |
Connector Punctuation | 3 | 0.5% |
Other Punctuation | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
자 | 22 | 3.6% |
이 | 16 | 2.6% |
트 | 15 | 2.4% |
인 | 14 | 2.3% |
스 | 13 | 2.1% |
시 | 13 | 2.1% |
부 | 12 | 1.9% |
전 | 11 | 1.8% |
대 | 11 | 1.8% |
리 | 10 | 1.6% |
Other values (225) | 481 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 2 | 9.1% |
T | 2 | 9.1% |
R | 2 | 9.1% |
K | 2 | 9.1% |
I | 2 | 9.1% |
A | 2 | 9.1% |
O | 1 | 4.5% |
E | 1 | 4.5% |
C | 1 | 4.5% |
B | 1 | 4.5% |
Other values (6) | 6 |
Decimal Number
Value | Count | Frequency (%) |
4 | 1 | |
2 | 1 | |
0 | 1 | |
1 | 1 | |
7 | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 2 | |
r | 1 | |
e | 1 | |
a | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 3 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 618 | |
Latin | 27 | 4.1% |
Common | 9 | 1.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
자 | 22 | 3.6% |
이 | 16 | 2.6% |
트 | 15 | 2.4% |
인 | 14 | 2.3% |
스 | 13 | 2.1% |
시 | 13 | 2.1% |
부 | 12 | 1.9% |
전 | 11 | 1.8% |
대 | 11 | 1.8% |
리 | 10 | 1.6% |
Other values (225) | 481 |
Latin
Value | Count | Frequency (%) |
o | 2 | 7.4% |
S | 2 | 7.4% |
T | 2 | 7.4% |
R | 2 | 7.4% |
K | 2 | 7.4% |
I | 2 | 7.4% |
A | 2 | 7.4% |
O | 1 | 3.7% |
E | 1 | 3.7% |
C | 1 | 3.7% |
Other values (10) | 10 |
Common
Value | Count | Frequency (%) |
_ | 3 | |
& | 1 | 11.1% |
4 | 1 | 11.1% |
2 | 1 | 11.1% |
0 | 1 | 11.1% |
1 | 1 | 11.1% |
7 | 1 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 618 | |
ASCII | 36 | 5.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
자 | 22 | 3.6% |
이 | 16 | 2.6% |
트 | 15 | 2.4% |
인 | 14 | 2.3% |
스 | 13 | 2.1% |
시 | 13 | 2.1% |
부 | 12 | 1.9% |
전 | 11 | 1.8% |
대 | 11 | 1.8% |
리 | 10 | 1.6% |
Other values (225) | 481 |
ASCII
Value | Count | Frequency (%) |
_ | 3 | 8.3% |
o | 2 | 5.6% |
S | 2 | 5.6% |
T | 2 | 5.6% |
R | 2 | 5.6% |
K | 2 | 5.6% |
I | 2 | 5.6% |
A | 2 | 5.6% |
O | 1 | 2.8% |
E | 1 | 2.8% |
Other values (17) | 17 |
빈도수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 176 |
---|---|
Distinct (%) | 88.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1248.4 |
Minimum | 562 |
---|---|
Maximum | 13864 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 562 |
---|---|
5-th percentile | 573.8 |
Q1 | 664 |
median | 935.5 |
Q3 | 1393.75 |
95-th percentile | 2842.1 |
Maximum | 13864 |
Range | 13302 |
Interquartile range (IQR) | 729.75 |
Descriptive statistics
Standard deviation | 1197.8927 |
---|---|
Coefficient of variation (CV) | 0.9595424 |
Kurtosis | 63.701097 |
Mean | 1248.4 |
Median Absolute Deviation (MAD) | 315.5 |
Skewness | 6.7175905 |
Sum | 249680 |
Variance | 1434947 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
564 | 3 | 1.5% |
613 | 3 | 1.5% |
574 | 3 | 1.5% |
674 | 3 | 1.5% |
732 | 2 | 1.0% |
585 | 2 | 1.0% |
621 | 2 | 1.0% |
615 | 2 | 1.0% |
661 | 2 | 1.0% |
665 | 2 | 1.0% |
Other values (166) | 176 |
Value | Count | Frequency (%) |
562 | 1 | 0.5% |
563 | 1 | 0.5% |
564 | 3 | |
565 | 1 | 0.5% |
566 | 1 | 0.5% |
568 | 2 | |
570 | 1 | 0.5% |
574 | 3 | |
580 | 2 | |
581 | 2 |
Value | Count | Frequency (%) |
13864 | 1 | |
6773 | 1 | |
4445 | 1 | |
3697 | 1 | |
3594 | 1 | |
3333 | 1 | |
3256 | 1 | |
3130 | 1 | |
3026 | 1 | |
2977 | 1 |
순위 | 빈도수 | |
---|---|---|
순위 | 1.000 | 0.768 |
빈도수 | 0.768 | 1.000 |
순위 | 빈도수 | |
---|---|---|
순위 | 1.000 | -1.000 |
빈도수 | -1.000 | 1.000 |
순위 | 키워드 | 빈도수 | |
---|---|---|---|
0 | 1 | 대통령 | 13864 |
1 | 2 | 서비스 | 6773 |
2 | 3 | 프로그램 | 4445 |
3 | 4 | 청와대 | 3697 |
4 | 5 | 트럼프 | 3594 |
5 | 6 | 글로벌 | 3333 |
6 | 7 | 위원장 | 3256 |
7 | 8 | 외국인 | 3130 |
8 | 9 | 삼성전자 | 3026 |
9 | 10 | 드라마 | 2977 |
순위 | 키워드 | 빈도수 | |
---|---|---|---|
190 | 191 | 인천시 | 570 |
191 | 192 | IoT | 568 |
192 | 193 | 리스크 | 568 |
193 | 194 | 국정감사 | 566 |
194 | 195 | 개정안 | 565 |
195 | 196 | 태양광 | 564 |
196 | 197 | 순이익 | 564 |
197 | 198 | 협의회 | 564 |
198 | 199 | 문화재 | 563 |
199 | 200 | 성매매 | 562 |