Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 200 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 5.2 KiB |
Average record size in memory | 26.6 B |
Variable types
Numeric | 2 |
---|---|
Text | 1 |
Dataset
Description | 뉴스데이터베이스 "BIGKinds" 에서 54개 신문방송의 뉴스를 분석한 메타정보.분야별 보도에서 월별로 가장 많이 등장한 명사를 200개 추출해 순위와 빈도를 제공https://www.bigkinds.or.kr 에 접속하면 보다 많은 정보를 확인할 수 있습니다. |
---|---|
Author | 한국언론진흥재단 |
URL | https://www.data.go.kr/data/15065434/fileData.do |
Reproduction
Analysis started | 2024-03-14 20:49:25.176299 |
---|---|
Analysis finished | 2024-03-14 20:49:27.172124 |
Duration | 2 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순위
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 200 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 100.5 |
Minimum | 1 |
---|---|
Maximum | 200 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 10.95 |
Q1 | 50.75 |
median | 100.5 |
Q3 | 150.25 |
95-th percentile | 190.05 |
Maximum | 200 |
Range | 199 |
Interquartile range (IQR) | 99.5 |
Descriptive statistics
Standard deviation | 57.879185 |
---|---|
Coefficient of variation (CV) | 0.57591228 |
Kurtosis | -1.2 |
Mean | 100.5 |
Median Absolute Deviation (MAD) | 50 |
Skewness | 0 |
Sum | 20100 |
Variance | 3350 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.5% |
139 | 1 | 0.5% |
129 | 1 | 0.5% |
130 | 1 | 0.5% |
131 | 1 | 0.5% |
132 | 1 | 0.5% |
133 | 1 | 0.5% |
134 | 1 | 0.5% |
135 | 1 | 0.5% |
136 | 1 | 0.5% |
Other values (190) | 190 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
200 | 1 | |
199 | 1 | |
198 | 1 | |
197 | 1 | |
196 | 1 | |
195 | 1 | |
194 | 1 | |
193 | 1 | |
192 | 1 | |
191 | 1 |
키워드
Text
UNIQUE
 
Distinct | 200 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
Value | Count | Frequency (%) |
피해자 | 1 | 0.5% |
성범죄 | 1 | 0.5% |
챌린지 | 1 | 0.5% |
보건소 | 1 | 0.5% |
공동체 | 1 | 0.5% |
조우형 | 1 | 0.5% |
플라스틱 | 1 | 0.5% |
보호자 | 1 | 0.5% |
기상청 | 1 | 0.5% |
sns | 1 | 0.5% |
Other values (190) | 190 |
Most occurring characters
Value | Count | Frequency (%) |
자 | 17 | 2.6% |
부 | 16 | 2.4% |
원 | 16 | 2.4% |
사 | 16 | 2.4% |
지 | 14 | 2.1% |
교 | 13 | 2.0% |
대 | 12 | 1.8% |
인 | 12 | 1.8% |
장 | 11 | 1.7% |
동 | 10 | 1.5% |
Other values (233) | 528 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 628 | |
Uppercase Letter | 27 | 4.1% |
Connector Punctuation | 7 | 1.1% |
Decimal Number | 3 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
자 | 17 | 2.7% |
부 | 16 | 2.5% |
원 | 16 | 2.5% |
사 | 16 | 2.5% |
지 | 14 | 2.2% |
교 | 13 | 2.1% |
대 | 12 | 1.9% |
인 | 12 | 1.9% |
장 | 11 | 1.8% |
동 | 10 | 1.6% |
Other values (216) | 491 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 5 | |
C | 4 | |
T | 4 | |
E | 3 | |
B | 2 | 7.4% |
N | 1 | 3.7% |
G | 1 | 3.7% |
R | 1 | 3.7% |
O | 1 | 3.7% |
D | 1 | 3.7% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
9 | 2 | |
1 | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 628 | |
Latin | 27 | 4.1% |
Common | 10 | 1.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
자 | 17 | 2.7% |
부 | 16 | 2.5% |
원 | 16 | 2.5% |
사 | 16 | 2.5% |
지 | 14 | 2.2% |
교 | 13 | 2.1% |
대 | 12 | 1.9% |
인 | 12 | 1.9% |
장 | 11 | 1.8% |
동 | 10 | 1.6% |
Other values (216) | 491 |
Latin
Value | Count | Frequency (%) |
S | 5 | |
C | 4 | |
T | 4 | |
E | 3 | |
B | 2 | 7.4% |
N | 1 | 3.7% |
G | 1 | 3.7% |
R | 1 | 3.7% |
O | 1 | 3.7% |
D | 1 | 3.7% |
Other values (4) | 4 |
Common
Value | Count | Frequency (%) |
_ | 7 | |
9 | 2 | 20.0% |
1 | 1 | 10.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 628 | |
ASCII | 37 | 5.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
자 | 17 | 2.7% |
부 | 16 | 2.5% |
원 | 16 | 2.5% |
사 | 16 | 2.5% |
지 | 14 | 2.2% |
교 | 13 | 2.1% |
대 | 12 | 1.9% |
인 | 12 | 1.9% |
장 | 11 | 1.8% |
동 | 10 | 1.6% |
Other values (216) | 491 |
ASCII
Value | Count | Frequency (%) |
_ | 7 | |
S | 5 | |
C | 4 | |
T | 4 | |
E | 3 | |
B | 2 | 5.4% |
9 | 2 | 5.4% |
N | 1 | 2.7% |
G | 1 | 2.7% |
R | 1 | 2.7% |
Other values (7) | 7 |
빈도수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 157 |
---|---|
Distinct (%) | 78.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 446.04 |
Minimum | 164 |
---|---|
Maximum | 2785 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 164 |
---|---|
5-th percentile | 173 |
Q1 | 208 |
median | 275 |
Q3 | 481.75 |
95-th percentile | 1200.8 |
Maximum | 2785 |
Range | 2621 |
Interquartile range (IQR) | 273.75 |
Descriptive statistics
Standard deviation | 424.85425 |
---|---|
Coefficient of variation (CV) | 0.95250258 |
Kurtosis | 11.592418 |
Mean | 446.04 |
Median Absolute Deviation (MAD) | 89 |
Skewness | 3.0898 |
Sum | 89208 |
Variance | 180501.13 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
179 | 4 | 2.0% |
201 | 4 | 2.0% |
208 | 4 | 2.0% |
193 | 3 | 1.5% |
270 | 3 | 1.5% |
197 | 3 | 1.5% |
222 | 2 | 1.0% |
203 | 2 | 1.0% |
205 | 2 | 1.0% |
210 | 2 | 1.0% |
Other values (147) | 171 |
Value | Count | Frequency (%) |
164 | 1 | |
165 | 2 | |
166 | 2 | |
168 | 1 | |
169 | 1 | |
171 | 2 | |
173 | 2 | |
174 | 2 | |
175 | 1 | |
176 | 1 |
Value | Count | Frequency (%) |
2785 | 1 | |
2621 | 1 | |
2515 | 1 | |
2331 | 1 | |
1684 | 1 | |
1562 | 1 | |
1394 | 1 | |
1366 | 1 | |
1330 | 2 | |
1194 | 1 |
순위 | 빈도수 | |
---|---|---|
순위 | 1.000 | 0.788 |
빈도수 | 0.788 | 1.000 |
순위 | 빈도수 | |
---|---|---|
순위 | 1.000 | -1.000 |
빈도수 | -1.000 | 1.000 |
순위 | 키워드 | 빈도수 | |
---|---|---|---|
0 | 1 | 피해자 | 2785 |
1 | 2 | 이재명 | 2621 |
2 | 3 | 학부모 | 2515 |
3 | 4 | 장애인 | 2331 |
4 | 5 | 교육부 | 1684 |
5 | 6 | 서비스 | 1562 |
6 | 7 | 민주당 | 1394 |
7 | 8 | 위원장 | 1366 |
8 | 9 | 청소년 | 1330 |
9 | 10 | 근로자 | 1330 |
순위 | 키워드 | 빈도수 | |
---|---|---|---|
190 | 191 | 방심위 | 173 |
191 | 192 | 서이초_교사 | 171 |
192 | 193 | 공모전 | 171 |
193 | 194 | 조직원 | 169 |
194 | 195 | 보증금 | 168 |
195 | 196 | 응급실 | 166 |
196 | 197 | 사업주 | 166 |
197 | 198 | 지원자 | 165 |
198 | 199 | 병원장 | 165 |
199 | 200 | 임단협 | 164 |