Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 200 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 5.2 KiB |
Average record size in memory | 26.6 B |
Variable types
Numeric | 2 |
---|---|
Text | 1 |
Dataset
Description | 뉴스데이터베이스 "BIGKinds" 기반 분석 자료, 기타 메타정보https://www.bigkinds.or.kr 에 접속하시면 보다 많은 정보를 확인할 수 있습니다.뉴스빅데이터 분석 자료입니다. 관련 뉴스와 키워드를 확인할 수 있습니다. |
---|---|
Author | 한국언론진흥재단 |
URL | https://www.data.go.kr/data/15012945/fileData.do |
Reproduction
Analysis started | 2024-03-14 12:39:43.990942 |
---|---|
Analysis finished | 2024-03-14 12:39:45.122677 |
Duration | 1.13 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순위
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 200 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 100.5 |
Minimum | 1 |
---|---|
Maximum | 200 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 10.95 |
Q1 | 50.75 |
median | 100.5 |
Q3 | 150.25 |
95-th percentile | 190.05 |
Maximum | 200 |
Range | 199 |
Interquartile range (IQR) | 99.5 |
Descriptive statistics
Standard deviation | 57.879185 |
---|---|
Coefficient of variation (CV) | 0.57591228 |
Kurtosis | -1.2 |
Mean | 100.5 |
Median Absolute Deviation (MAD) | 50 |
Skewness | 0 |
Sum | 20100 |
Variance | 3350 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.5% |
139 | 1 | 0.5% |
129 | 1 | 0.5% |
130 | 1 | 0.5% |
131 | 1 | 0.5% |
132 | 1 | 0.5% |
133 | 1 | 0.5% |
134 | 1 | 0.5% |
135 | 1 | 0.5% |
136 | 1 | 0.5% |
Other values (190) | 190 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
200 | 1 | |
199 | 1 | |
198 | 1 | |
197 | 1 | |
196 | 1 | |
195 | 1 | |
194 | 1 | |
193 | 1 | |
192 | 1 | |
191 | 1 |
키워드
Text
UNIQUE
 
Distinct | 200 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
Value | Count | Frequency (%) |
한국당 | 2 | 1.0% |
대통령 | 1 | 0.5% |
김재원 | 1 | 0.5% |
신년사 | 1 | 0.5% |
탄핵소추안 | 1 | 0.5% |
문재인_정부 | 1 | 0.5% |
예비후보 | 1 | 0.5% |
성탄절 | 1 | 0.5% |
체육회 | 1 | 0.5% |
연동형_비례대표제 | 1 | 0.5% |
Other values (189) | 189 |
Most occurring characters
Value | Count | Frequency (%) |
_ | 19 | 2.7% |
부 | 17 | 2.4% |
정 | 17 | 2.4% |
회 | 16 | 2.2% |
대 | 15 | 2.1% |
당 | 15 | 2.1% |
장 | 15 | 2.1% |
안 | 15 | 2.1% |
의 | 14 | 2.0% |
원 | 13 | 1.8% |
Other values (185) | 557 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 694 | |
Connector Punctuation | 19 | 2.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
부 | 17 | 2.4% |
정 | 17 | 2.4% |
회 | 16 | 2.3% |
대 | 15 | 2.2% |
당 | 15 | 2.2% |
장 | 15 | 2.2% |
안 | 15 | 2.2% |
의 | 14 | 2.0% |
원 | 13 | 1.9% |
법 | 13 | 1.9% |
Other values (184) | 544 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 19 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 694 | |
Common | 19 | 2.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
부 | 17 | 2.4% |
정 | 17 | 2.4% |
회 | 16 | 2.3% |
대 | 15 | 2.2% |
당 | 15 | 2.2% |
장 | 15 | 2.2% |
안 | 15 | 2.2% |
의 | 14 | 2.0% |
원 | 13 | 1.9% |
법 | 13 | 1.9% |
Other values (184) | 544 |
Common
Value | Count | Frequency (%) |
_ | 19 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 694 | |
ASCII | 19 | 2.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
_ | 19 |
Hangul
Value | Count | Frequency (%) |
부 | 17 | 2.4% |
정 | 17 | 2.4% |
회 | 16 | 2.3% |
대 | 15 | 2.2% |
당 | 15 | 2.2% |
장 | 15 | 2.2% |
안 | 15 | 2.2% |
의 | 14 | 2.0% |
원 | 13 | 1.9% |
법 | 13 | 1.9% |
Other values (184) | 544 |
빈도수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 163 |
---|---|
Distinct (%) | 81.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 615.32 |
Minimum | 122 |
---|---|
Maximum | 9556 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 122 |
---|---|
5-th percentile | 130 |
Q1 | 166 |
median | 257 |
Q3 | 486.5 |
95-th percentile | 1935.9 |
Maximum | 9556 |
Range | 9434 |
Interquartile range (IQR) | 320.5 |
Descriptive statistics
Standard deviation | 1234.0689 |
---|---|
Coefficient of variation (CV) | 2.0055726 |
Kurtosis | 31.716273 |
Mean | 615.32 |
Median Absolute Deviation (MAD) | 112.5 |
Skewness | 5.2647612 |
Sum | 123064 |
Variance | 1522926.2 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
222 | 4 | 2.0% |
130 | 3 | 1.5% |
162 | 3 | 1.5% |
175 | 3 | 1.5% |
176 | 3 | 1.5% |
133 | 3 | 1.5% |
301 | 3 | 1.5% |
127 | 3 | 1.5% |
124 | 3 | 1.5% |
189 | 2 | 1.0% |
Other values (153) | 170 |
Value | Count | Frequency (%) |
122 | 1 | 0.5% |
123 | 1 | 0.5% |
124 | 3 | |
127 | 3 | |
128 | 1 | 0.5% |
130 | 3 | |
131 | 2 | |
132 | 2 | |
133 | 3 | |
134 | 1 | 0.5% |
Value | Count | Frequency (%) |
9556 | 1 | |
9547 | 1 | |
6619 | 1 | |
6550 | 1 | |
3791 | 1 | |
3523 | 1 | |
3180 | 1 | |
2842 | 1 | |
2344 | 1 | |
2143 | 1 |
순위 | 빈도수 | |
---|---|---|
순위 | 1.000 | 0.609 |
빈도수 | 0.609 | 1.000 |
순위 | 빈도수 | |
---|---|---|
순위 | 1.000 | -1.000 |
빈도수 | -1.000 | 1.000 |
순위 | 키워드 | 빈도수 | |
---|---|---|---|
0 | 1 | 대통령 | 9556 |
1 | 2 | 한국당 | 9547 |
2 | 3 | 청와대 | 6619 |
3 | 4 | 민주당 | 6550 |
4 | 5 | 위원장 | 3791 |
5 | 6 | 선거법 | 3523 |
6 | 7 | 본회의 | 3180 |
7 | 8 | 트럼프 | 2842 |
8 | 9 | 원내대표 | 2344 |
9 | 10 | 예산안 | 2143 |
순위 | 키워드 | 빈도수 | |
---|---|---|---|
190 | 191 | 감찰_중단 | 130 |
191 | 192 | 한반도_상공 | 128 |
192 | 193 | 시위대 | 127 |
193 | 194 | 수출규제 | 127 |
194 | 195 | 비서실장 | 127 |
195 | 196 | 유엔_안보리 | 124 |
196 | 197 | 데이터 | 124 |
197 | 198 | 단체장 | 124 |
198 | 199 | 탄핵안 | 123 |
199 | 200 | 시의원 | 122 |