Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 56 |
Missing cells | 33 |
Missing cells (%) | 19.6% |
Duplicate rows | 4 |
Duplicate rows (%) | 7.1% |
Total size in memory | 1.6 KiB |
Average record size in memory | 28.4 B |
Variable types
Text | 1 |
---|---|
Categorical | 1 |
Numeric | 1 |
Dataset
Description | 2014, 2015, 2018, 2019년 문에진흥기금 공모사업 중 문학 분야 "문학행사 및 연구" 지원 사업의 국고보조금 현황(단위: 원) |
---|---|
Author | 한국문화예술위원회 |
URL | https://www.data.go.kr/data/15076465/fileData.do |
Dataset has 4 (7.1%) duplicate rows | Duplicates |
국고보조금(원) has 33 (58.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 21:17:48.689589 |
---|---|
Analysis finished | 2023-12-12 21:17:49.013654 |
Duration | 0.32 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
문학단체명
Text
Distinct | 28 |
---|---|
Distinct (%) | 50.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
Value | Count | Frequency (%) |
국**회 | 20 | |
동**회 | 3 | 5.4% |
린**회 | 2 | 3.6% |
우**터 | 2 | 3.6% |
디**원 | 2 | 3.6% |
주**의 | 2 | 3.6% |
국**관 | 2 | 3.6% |
국**의 | 2 | 3.6% |
b**회 | 2 | 3.6% |
학**사 | 1 | 1.8% |
Other values (18) | 18 |
Most occurring characters
Value | Count | Frequency (%) |
* | 168 | |
회 | 33 | 11.8% |
국 | 24 | 8.6% |
의 | 4 | 1.4% |
원 | 3 | 1.1% |
학 | 3 | 1.1% |
관 | 3 | 1.1% |
주 | 3 | 1.1% |
사 | 3 | 1.1% |
우 | 3 | 1.1% |
Other values (26) | 33 | 11.8% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 168 | |
Other Letter | 110 | |
Uppercase Letter | 2 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
Other Punctuation
Value | Count | Frequency (%) |
* | 168 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 168 | |
Hangul | 110 | |
Latin | 2 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
Common
Value | Count | Frequency (%) |
* | 168 |
Latin
Value | Count | Frequency (%) |
B | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 170 | |
Hangul | 110 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 168 | |
B | 2 | 1.2% |
Hangul
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
사업연도
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 7.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
2014 | |
---|---|
2018 | |
2015 | |
2019 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2014 |
---|---|
2nd row | 2014 |
3rd row | 2014 |
4th row | 2014 |
5th row | 2014 |
Common Values
Value | Count | Frequency (%) |
2014 | 22 | |
2018 | 12 | |
2015 | 11 | |
2019 | 11 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2014 | 22 | |
2018 | 12 | |
2015 | 11 | |
2019 | 11 |
국고보조금(원)
Real number (ℝ)
MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 43.5% |
Missing | 33 |
Missing (%) | 58.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 8002522 |
Minimum | 6 |
---|---|
Maximum | 12000000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 636.0 B |
Quantile statistics
Minimum | 6 |
---|---|
5-th percentile | 1490000 |
Q1 | 6000000 |
median | 8000000 |
Q3 | 11000000 |
95-th percentile | 11995800 |
Maximum | 12000000 |
Range | 11999994 |
Interquartile range (IQR) | 5000000 |
Descriptive statistics
Standard deviation | 3291003.7 |
---|---|
Coefficient of variation (CV) | 0.41124582 |
Kurtosis | 0.46275367 |
Mean | 8002522 |
Median Absolute Deviation (MAD) | 2000000 |
Skewness | -0.81469836 |
Sum | 1.8405801 × 108 |
Variance | 1.0830706 × 1013 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
6000000 | 5 | 8.9% |
11000000 | 5 | 8.9% |
9000000 | 3 | 5.4% |
8000000 | 2 | 3.6% |
12000000 | 2 | 3.6% |
7000000 | 2 | 3.6% |
11958000 | 1 | 1.8% |
1100000 | 1 | 1.8% |
6 | 1 | 1.8% |
5000000 | 1 | 1.8% |
(Missing) | 33 |
Value | Count | Frequency (%) |
6 | 1 | 1.8% |
1100000 | 1 | 1.8% |
5000000 | 1 | 1.8% |
6000000 | 5 | |
7000000 | 2 | 3.6% |
8000000 | 2 | 3.6% |
9000000 | 3 | |
11000000 | 5 | |
11958000 | 1 | 1.8% |
12000000 | 2 | 3.6% |
Value | Count | Frequency (%) |
12000000 | 2 | 3.6% |
11958000 | 1 | 1.8% |
11000000 | 5 | |
9000000 | 3 | |
8000000 | 2 | 3.6% |
7000000 | 2 | 3.6% |
6000000 | 5 | |
5000000 | 1 | 1.8% |
1100000 | 1 | 1.8% |
6 | 1 | 1.8% |
문학단체명 | 사업연도 | 국고보조금(원) | |
---|---|---|---|
문학단체명 | 1.000 | 0.000 | 0.000 |
사업연도 | 0.000 | 1.000 | 0.224 |
국고보조금(원) | 0.000 | 0.224 | 1.000 |
국고보조금(원) | 사업연도 | |
---|---|---|
국고보조금(원) | 1.000 | 0.104 |
사업연도 | 0.104 | 1.000 |
문학단체명 | 사업연도 | 국고보조금(원) | |
---|---|---|---|
0 | *국**회 | 2014 | <NA> |
1 | *색**원 | 2014 | <NA> |
2 | *린**회 | 2014 | <NA> |
3 | *랑**회 | 2014 | <NA> |
4 | *국**회 | 2014 | <NA> |
5 | *오**촌 | 2014 | <NA> |
6 | *서**요 | 2014 | <NA> |
7 | *국**회 | 2014 | <NA> |
8 | *우**터 | 2014 | <NA> |
9 | *국**회 | 2014 | <NA> |
문학단체명 | 사업연도 | 국고보조금(원) | |
---|---|---|---|
46 | *국**회 | 2019 | 11000000 |
47 | *B**회 | 2019 | 6 |
48 | *림**회 | 2019 | 11000000 |
49 | *주**의 | 2019 | 11000000 |
50 | *학**실 | 2019 | 6000000 |
51 | *린**대 | 2019 | 8000000 |
52 | *동**회 | 2019 | 11000000 |
53 | *국**의 | 2019 | 9000000 |
54 | *디**원 | 2019 | 11000000 |
55 | *지**션 | 2019 | 5000000 |
Most frequently occurring
문학단체명 | 사업연도 | 국고보조금(원) | # duplicates | |
---|---|---|---|---|
0 | *국**회 | 2014 | <NA> | 7 |
1 | *국**회 | 2015 | <NA> | 5 |
2 | *국**회 | 2018 | 6000000 | 2 |
3 | *국**회 | 2018 | 9000000 | 2 |