Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 56 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 4 |
Duplicate rows (%) | 7.1% |
Total size in memory | 2.5 KiB |
Average record size in memory | 46.4 B |
Variable types
Text | 1 |
---|---|
Categorical | 3 |
Numeric | 1 |
Dataset
Description | 2014, 2015, 2018, 2019년 문예진흥기금 공모사업 중 문학 분야 "문학행사 및 연구" 지원 사업의 홍보실적(예: 언론보도실적, 온라인홍보실적, 홍보물홍보실적) |
---|---|
Author | 한국문화예술위원회 |
URL | https://www.data.go.kr/data/15076464/fileData.do |
Dataset has 4 (7.1%) duplicate rows | Duplicates |
온라인홍보실적(건) is highly overall correlated with 홍보물홍보실적(건) | High correlation |
홍보물홍보실적(건) is highly overall correlated with 온라인홍보실적(건) | High correlation |
언론보도실적(건) has 25 (44.6%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 05:29:10.322517 |
---|---|
Analysis finished | 2023-12-12 05:29:10.863003 |
Duration | 0.54 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
문학단체명
Text
Distinct | 28 |
---|---|
Distinct (%) | 50.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
Value | Count | Frequency (%) |
국**회 | 20 | |
동**회 | 3 | 5.4% |
린**회 | 2 | 3.6% |
우**터 | 2 | 3.6% |
디**원 | 2 | 3.6% |
주**의 | 2 | 3.6% |
국**관 | 2 | 3.6% |
국**의 | 2 | 3.6% |
b**회 | 2 | 3.6% |
학**사 | 1 | 1.8% |
Other values (18) | 18 |
Most occurring characters
Value | Count | Frequency (%) |
* | 168 | |
회 | 33 | 11.8% |
국 | 24 | 8.6% |
의 | 4 | 1.4% |
원 | 3 | 1.1% |
학 | 3 | 1.1% |
관 | 3 | 1.1% |
주 | 3 | 1.1% |
사 | 3 | 1.1% |
우 | 3 | 1.1% |
Other values (26) | 33 | 11.8% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 168 | |
Other Letter | 110 | |
Uppercase Letter | 2 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
Other Punctuation
Value | Count | Frequency (%) |
* | 168 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 168 | |
Hangul | 110 | |
Latin | 2 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
Common
Value | Count | Frequency (%) |
* | 168 |
Latin
Value | Count | Frequency (%) |
B | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 170 | |
Hangul | 110 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 168 | |
B | 2 | 1.2% |
Hangul
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
사업연도
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 7.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
2014 | |
---|---|
2018 | |
2015 | |
2019 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2014 |
---|---|
2nd row | 2014 |
3rd row | 2014 |
4th row | 2014 |
5th row | 2014 |
Common Values
Value | Count | Frequency (%) |
2014 | 22 | |
2018 | 12 | |
2015 | 11 | |
2019 | 11 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2014 | 22 | |
2018 | 12 | |
2015 | 11 | |
2019 | 11 |
언론보도실적(건)
Real number (ℝ)
ZEROS
 
Distinct | 9 |
---|---|
Distinct (%) | 16.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.6071429 |
Minimum | 0 |
---|---|
Maximum | 11 |
Zeros | 25 |
Zeros (%) | 44.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 636.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 1 |
Q3 | 2.25 |
95-th percentile | 5.25 |
Maximum | 11 |
Range | 11 |
Interquartile range (IQR) | 2.25 |
Descriptive statistics
Standard deviation | 2.2130076 |
---|---|
Coefficient of variation (CV) | 1.3769825 |
Kurtosis | 4.9823869 |
Mean | 1.6071429 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.9708613 |
Sum | 90 |
Variance | 4.8974026 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 25 | |
1 | 11 | |
4 | 6 | 10.7% |
2 | 6 | 10.7% |
3 | 3 | 5.4% |
5 | 2 | 3.6% |
6 | 1 | 1.8% |
7 | 1 | 1.8% |
11 | 1 | 1.8% |
Value | Count | Frequency (%) |
0 | 25 | |
1 | 11 | |
2 | 6 | 10.7% |
3 | 3 | 5.4% |
4 | 6 | 10.7% |
5 | 2 | 3.6% |
6 | 1 | 1.8% |
7 | 1 | 1.8% |
11 | 1 | 1.8% |
Value | Count | Frequency (%) |
11 | 1 | 1.8% |
7 | 1 | 1.8% |
6 | 1 | 1.8% |
5 | 2 | 3.6% |
4 | 6 | 10.7% |
3 | 3 | 5.4% |
2 | 6 | 10.7% |
1 | 11 | |
0 | 25 |
온라인홍보실적(건)
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 10.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
<NA> | |
---|---|
0 | |
1 | |
2 | |
4 | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 2.7678571 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.8% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 33 | |
0 | 8 | 14.3% |
1 | 7 | 12.5% |
2 | 5 | 8.9% |
4 | 2 | 3.6% |
5 | 1 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 33 | |
0 | 8 | 14.3% |
1 | 7 | 12.5% |
2 | 5 | 8.9% |
4 | 2 | 3.6% |
5 | 1 | 1.8% |
홍보물홍보실적(건)
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 8.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
<NA> | |
---|---|
1 | |
0 | |
2 | 1 |
3 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 2.7678571 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 3.6% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 33 | |
1 | 11 | 19.6% |
0 | 10 | 17.9% |
2 | 1 | 1.8% |
3 | 1 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 33 | |
1 | 11 | 19.6% |
0 | 10 | 17.9% |
2 | 1 | 1.8% |
3 | 1 | 1.8% |
문학단체명 | 사업연도 | 언론보도실적(건) | 온라인홍보실적(건) | 홍보물홍보실적(건) | |
---|---|---|---|---|---|
문학단체명 | 1.000 | 0.000 | 0.630 | 0.840 | 0.886 |
사업연도 | 0.000 | 1.000 | 0.000 | 0.126 | 0.000 |
언론보도실적(건) | 0.630 | 0.000 | 1.000 | 0.463 | 0.252 |
온라인홍보실적(건) | 0.840 | 0.126 | 0.463 | 1.000 | 0.835 |
홍보물홍보실적(건) | 0.886 | 0.000 | 0.252 | 0.835 | 1.000 |
홍보물홍보실적(건) | 온라인홍보실적(건) | 사업연도 | |
---|---|---|---|
홍보물홍보실적(건) | 1.000 | 0.784 | 0.000 |
온라인홍보실적(건) | 0.784 | 1.000 | 0.111 |
사업연도 | 0.000 | 0.111 | 1.000 |
언론보도실적(건) | 사업연도 | 온라인홍보실적(건) | 홍보물홍보실적(건) | |
---|---|---|---|---|
언론보도실적(건) | 1.000 | 0.000 | 0.310 | 0.114 |
사업연도 | 0.000 | 1.000 | 0.111 | 0.000 |
온라인홍보실적(건) | 0.310 | 0.111 | 1.000 | 0.784 |
홍보물홍보실적(건) | 0.114 | 0.000 | 0.784 | 1.000 |
문학단체명 | 사업연도 | 언론보도실적(건) | 온라인홍보실적(건) | 홍보물홍보실적(건) | |
---|---|---|---|---|---|
0 | *국**회 | 2014 | 0 | <NA> | <NA> |
1 | *색**원 | 2014 | 0 | <NA> | <NA> |
2 | *린**회 | 2014 | 0 | <NA> | <NA> |
3 | *랑**회 | 2014 | 0 | <NA> | <NA> |
4 | *국**회 | 2014 | 4 | <NA> | <NA> |
5 | *오**촌 | 2014 | 3 | <NA> | <NA> |
6 | *서**요 | 2014 | 0 | <NA> | <NA> |
7 | *국**회 | 2014 | 0 | <NA> | <NA> |
8 | *우**터 | 2014 | 6 | <NA> | <NA> |
9 | *국**회 | 2014 | 2 | <NA> | <NA> |
문학단체명 | 사업연도 | 언론보도실적(건) | 온라인홍보실적(건) | 홍보물홍보실적(건) | |
---|---|---|---|---|---|
46 | *국**회 | 2019 | 1 | 1 | 1 |
47 | *B**회 | 2019 | 1 | 4 | 2 |
48 | *림**회 | 2019 | 0 | 1 | 1 |
49 | *주**의 | 2019 | 5 | 0 | 0 |
50 | *학**실 | 2019 | 1 | 0 | 0 |
51 | *린**대 | 2019 | 0 | 4 | 1 |
52 | *동**회 | 2019 | 11 | 2 | 1 |
53 | *국**의 | 2019 | 4 | 2 | 1 |
54 | *디**원 | 2019 | 5 | 5 | 3 |
55 | *지**션 | 2019 | 1 | 0 | 0 |
Most frequently occurring
문학단체명 | 사업연도 | 언론보도실적(건) | 온라인홍보실적(건) | 홍보물홍보실적(건) | # duplicates | |
---|---|---|---|---|---|---|
0 | *국**회 | 2014 | 0 | <NA> | <NA> | 4 |
1 | *국**회 | 2015 | 0 | <NA> | <NA> | 2 |
2 | *국**회 | 2015 | 4 | <NA> | <NA> | 2 |
3 | *국**회 | 2018 | 1 | 1 | 1 | 2 |