Dataset statistics
Number of variables | 2 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.8 KiB |
Average record size in memory | 18.3 B |
Variable types
Text | 1 |
---|---|
Numeric | 1 |
Dataset
Description | Sample |
---|---|
Author | 한국문화정보원 |
URL | https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=4303c0f0-4a97-11ed-afda-c3455b72364b |
kwrd_nm has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 09:54:53.986865 |
---|---|
Analysis finished | 2023-12-10 09:54:54.812380 |
Duration | 0.83 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
kwrd_nm
Text
UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
방탄소년단 | 1 | 1.0% |
하이브 | 1 | 1.0% |
시작 | 1 | 1.0% |
작가 | 1 | 1.0% |
인기 | 1 | 1.0% |
종이의집 | 1 | 1.0% |
부산 | 1 | 1.0% |
개최 | 1 | 1.0% |
행사 | 1 | 1.0% |
그룹 | 1 | 1.0% |
Other values (90) | 90 |
Most occurring characters
Value | Count | Frequency (%) |
국 | 10 | 4.3% |
사 | 9 | 3.9% |
대 | 6 | 2.6% |
이 | 5 | 2.2% |
제 | 5 | 2.2% |
인 | 5 | 2.2% |
공 | 4 | 1.7% |
가 | 4 | 1.7% |
전 | 4 | 1.7% |
시 | 4 | 1.7% |
Other values (129) | 175 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 231 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 10 | 4.3% |
사 | 9 | 3.9% |
대 | 6 | 2.6% |
이 | 5 | 2.2% |
제 | 5 | 2.2% |
인 | 5 | 2.2% |
공 | 4 | 1.7% |
가 | 4 | 1.7% |
전 | 4 | 1.7% |
시 | 4 | 1.7% |
Other values (129) | 175 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 231 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 10 | 4.3% |
사 | 9 | 3.9% |
대 | 6 | 2.6% |
이 | 5 | 2.2% |
제 | 5 | 2.2% |
인 | 5 | 2.2% |
공 | 4 | 1.7% |
가 | 4 | 1.7% |
전 | 4 | 1.7% |
시 | 4 | 1.7% |
Other values (129) | 175 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 231 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
국 | 10 | 4.3% |
사 | 9 | 3.9% |
대 | 6 | 2.6% |
이 | 5 | 2.2% |
제 | 5 | 2.2% |
인 | 5 | 2.2% |
공 | 4 | 1.7% |
가 | 4 | 1.7% |
전 | 4 | 1.7% |
시 | 4 | 1.7% |
Other values (129) | 175 |
tot_cas_co
Real number (ℝ)
Distinct | 54 |
---|---|
Distinct (%) | 54.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 56.87 |
Minimum | 19 |
---|---|
Maximum | 229 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 19 |
---|---|
5-th percentile | 30 |
Q1 | 34 |
median | 46 |
Q3 | 66 |
95-th percentile | 136.3 |
Maximum | 229 |
Range | 210 |
Interquartile range (IQR) | 32 |
Descriptive statistics
Standard deviation | 35.975203 |
---|---|
Coefficient of variation (CV) | 0.63258666 |
Kurtosis | 8.2250493 |
Mean | 56.87 |
Median Absolute Deviation (MAD) | 13 |
Skewness | 2.5841075 |
Sum | 5687 |
Variance | 1294.2153 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
30 | 6 | 6.0% |
34 | 6 | 6.0% |
31 | 6 | 6.0% |
46 | 3 | 3.0% |
37 | 3 | 3.0% |
19 | 3 | 3.0% |
35 | 3 | 3.0% |
33 | 3 | 3.0% |
38 | 3 | 3.0% |
32 | 3 | 3.0% |
Other values (44) | 61 |
Value | Count | Frequency (%) |
19 | 3 | |
30 | 6 | |
31 | 6 | |
32 | 3 | |
33 | 3 | |
34 | 6 | |
35 | 3 | |
36 | 1 | 1.0% |
37 | 3 | |
38 | 3 |
Value | Count | Frequency (%) |
229 | 1 | |
211 | 1 | |
163 | 1 | |
143 | 1 | |
142 | 1 | |
136 | 1 | |
126 | 1 | |
99 | 1 | |
88 | 2 | |
87 | 2 |
kwrd_nm | tot_cas_co | |
---|---|---|
kwrd_nm | 1.000 | 1.000 |
tot_cas_co | 1.000 | 1.000 |
kwrd_nm | tot_cas_co | |
---|---|---|
0 | 방탄소년단 | 229 |
1 | 플랫폼 | 19 |
2 | 사용 | 37 |
3 | 세계 | 143 |
4 | 멤버 | 59 |
5 | 영화 | 211 |
6 | 그녀 | 33 |
7 | 최초 | 19 |
8 | 문화원 | 71 |
9 | 교류 | 55 |
kwrd_nm | tot_cas_co | |
---|---|---|
90 | 촬영 | 44 |
91 | 지역 | 42 |
92 | 한류 | 42 |
93 | 제공 | 41 |
94 | 장소 | 40 |
95 | 아이 | 38 |
96 | 공개 | 38 |
97 | 오징어게임 | 37 |
98 | 글 | 37 |
99 | 김치 | 35 |