Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 1429 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 229 |
Duplicate rows (%) | 16.0% |
Total size in memory | 58.7 KiB |
Average record size in memory | 42.1 B |
Variable types
Text | 1 |
---|---|
Numeric | 2 |
Categorical | 2 |
Dataset
Description | 2014-2019년 문예진흥기금 공모사업 중 문학 분야 "문예지발간" 지원 사업의 우수작품 실적(예: 작가 연령대, 실적 분야, 우수작품 수록 및 수상 건수) |
---|---|
Author | 한국문화예술위원회 |
URL | https://www.data.go.kr/data/15076423/fileData.do |
Dataset has 229 (16.0%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-12 07:08:29.688645 |
---|---|
Analysis finished | 2023-12-12 07:08:30.587568 |
Duration | 0.9 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
문학단체명
Text
Distinct | 62 |
---|---|
Distinct (%) | 4.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.3 KiB |
Value | Count | Frequency (%) |
국**회 | 783 | |
학**네 | 51 | 3.6% |
대**학 | 50 | 3.5% |
국**학 | 38 | 2.7% |
조**학 | 32 | 2.2% |
비**비 | 26 | 1.8% |
요**사 | 26 | 1.8% |
학**사 | 20 | 1.4% |
학**상 | 19 | 1.3% |
동**론 | 18 | 1.3% |
Other values (52) | 366 |
Most occurring characters
Value | Count | Frequency (%) |
* | 4287 | |
국 | 841 | 11.8% |
회 | 798 | 11.2% |
학 | 281 | 3.9% |
사 | 97 | 1.4% |
대 | 60 | 0.8% |
비 | 52 | 0.7% |
네 | 51 | 0.7% |
린 | 39 | 0.5% |
조 | 33 | 0.5% |
Other values (58) | 606 | 8.5% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 4287 | |
Other Letter | 2850 | |
Decimal Number | 8 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 841 | |
회 | 798 | |
학 | 281 | 9.9% |
사 | 97 | 3.4% |
대 | 60 | 2.1% |
비 | 52 | 1.8% |
네 | 51 | 1.8% |
린 | 39 | 1.4% |
조 | 33 | 1.2% |
시 | 32 | 1.1% |
Other values (56) | 566 |
Other Punctuation
Value | Count | Frequency (%) |
* | 4287 |
Decimal Number
Value | Count | Frequency (%) |
1 | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 4295 | |
Hangul | 2850 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 841 | |
회 | 798 | |
학 | 281 | 9.9% |
사 | 97 | 3.4% |
대 | 60 | 2.1% |
비 | 52 | 1.8% |
네 | 51 | 1.8% |
린 | 39 | 1.4% |
조 | 33 | 1.2% |
시 | 32 | 1.1% |
Other values (56) | 566 |
Common
Value | Count | Frequency (%) |
* | 4287 | |
1 | 8 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 4295 | |
Hangul | 2850 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 4287 | |
1 | 8 | 0.2% |
Hangul
Value | Count | Frequency (%) |
국 | 841 | |
회 | 798 | |
학 | 281 | 9.9% |
사 | 97 | 3.4% |
대 | 60 | 2.1% |
비 | 52 | 1.8% |
네 | 51 | 1.8% |
린 | 39 | 1.4% |
조 | 33 | 1.2% |
시 | 32 | 1.1% |
Other values (56) | 566 |
사업연도
Real number (ℝ)
Distinct | 6 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.0252 |
Minimum | 2014 |
---|---|
Maximum | 2019 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 12.7 KiB |
Quantile statistics
Minimum | 2014 |
---|---|
5-th percentile | 2014 |
Q1 | 2014 |
median | 2016 |
Q3 | 2018 |
95-th percentile | 2019 |
Maximum | 2019 |
Range | 5 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 1.9662939 |
---|---|
Coefficient of variation (CV) | 0.00097533201 |
Kurtosis | -1.5693346 |
Mean | 2016.0252 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.26314313 |
Sum | 2880900 |
Variance | 3.8663117 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
2014 | 570 | |
2018 | 245 | |
2019 | 216 | 15.1% |
2017 | 178 | 12.5% |
2015 | 140 | 9.8% |
2016 | 80 | 5.6% |
Value | Count | Frequency (%) |
2014 | 570 | |
2015 | 140 | 9.8% |
2016 | 80 | 5.6% |
2017 | 178 | 12.5% |
2018 | 245 | |
2019 | 216 | 15.1% |
Value | Count | Frequency (%) |
2019 | 216 | 15.1% |
2018 | 245 | |
2017 | 178 | 12.5% |
2016 | 80 | 5.6% |
2015 | 140 | 9.8% |
2014 | 570 |
작가연령대
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.3 KiB |
20대 미만 | |
---|---|
50대 | |
40대 | |
30대 | |
60대 | |
Other values (2) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 4.7214836 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 40대 |
---|---|
2nd row | 20대 미만 |
3rd row | 20대 미만 |
4th row | 20대 미만 |
5th row | 20대 미만 |
Common Values
Value | Count | Frequency (%) |
20대 미만 | 790 | |
50대 | 184 | 12.9% |
40대 | 136 | 9.5% |
30대 | 105 | 7.3% |
60대 | 102 | 7.1% |
20대 | 82 | 5.7% |
60대 이상 | 30 | 2.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20대 | 872 | |
미만 | 790 | |
50대 | 184 | 8.2% |
40대 | 136 | 6.0% |
60대 | 132 | 5.9% |
30대 | 105 | 4.7% |
이상 | 30 | 1.3% |
실적분야
Categorical
Distinct | 41 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.3 KiB |
시 | |
---|---|
수필 | |
소설 | |
동시 | |
시조 | |
Other values (36) |
Length
Max length | 8 |
---|---|
Median length | 2 |
Mean length | 1.973408 |
Min length | 1 |
Unique
Unique | 16 ? |
---|---|
Unique (%) | 1.1% |
Sample
1st row | 시 |
---|---|
2nd row | 시 |
3rd row | 시조 |
4th row | 수필 |
5th row | 희곡 |
Common Values
Value | Count | Frequency (%) |
시 | 361 | |
수필 | 247 | |
소설 | 207 | |
동시 | 123 | 8.6% |
시조 | 84 | 5.9% |
희곡 | 61 | 4.3% |
평론 | 60 | 4.2% |
동화 | 54 | 3.8% |
<NA> | 49 | 3.4% |
에세이 | 43 | 3.0% |
Other values (31) | 140 | 9.8% |
Length
Value | Count | Frequency (%) |
시 | 361 | |
수필 | 247 | |
소설 | 207 | |
동시 | 123 | 8.6% |
시조 | 84 | 5.9% |
희곡 | 61 | 4.3% |
평론 | 60 | 4.2% |
동화 | 54 | 3.8% |
na | 49 | 3.4% |
에세이 | 43 | 3.0% |
Other values (31) | 140 | 9.8% |
우수작품수록및수상건수(건)
Real number (ℝ)
Distinct | 10 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.1770469 |
Minimum | 1 |
---|---|
Maximum | 11 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 12.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 2 |
Maximum | 11 |
Range | 10 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.79132514 |
---|---|
Coefficient of variation (CV) | 0.67229704 |
Kurtosis | 68.01452 |
Mean | 1.1770469 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 7.4101114 |
Sum | 1682 |
Variance | 0.62619547 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1297 | |
2 | 90 | 6.3% |
3 | 16 | 1.1% |
5 | 11 | 0.8% |
4 | 6 | 0.4% |
10 | 3 | 0.2% |
8 | 2 | 0.1% |
6 | 2 | 0.1% |
9 | 1 | 0.1% |
11 | 1 | 0.1% |
Value | Count | Frequency (%) |
1 | 1297 | |
2 | 90 | 6.3% |
3 | 16 | 1.1% |
4 | 6 | 0.4% |
5 | 11 | 0.8% |
6 | 2 | 0.1% |
8 | 2 | 0.1% |
9 | 1 | 0.1% |
10 | 3 | 0.2% |
11 | 1 | 0.1% |
Value | Count | Frequency (%) |
11 | 1 | 0.1% |
10 | 3 | 0.2% |
9 | 1 | 0.1% |
8 | 2 | 0.1% |
6 | 2 | 0.1% |
5 | 11 | 0.8% |
4 | 6 | 0.4% |
3 | 16 | 1.1% |
2 | 90 | 6.3% |
1 | 1297 |
문학단체명 | 사업연도 | 작가연령대 | 실적분야 | 우수작품수록및수상건수(건) | |
---|---|---|---|---|---|
문학단체명 | 1.000 | 0.731 | 0.598 | 0.719 | 0.453 |
사업연도 | 0.731 | 1.000 | 0.274 | 0.604 | 0.160 |
작가연령대 | 0.598 | 0.274 | 1.000 | 0.440 | 0.219 |
실적분야 | 0.719 | 0.604 | 0.440 | 1.000 | 0.679 |
우수작품수록및수상건수(건) | 0.453 | 0.160 | 0.219 | 0.679 | 1.000 |
실적분야 | 작가연령대 | |
---|---|---|
실적분야 | 1.000 | 0.193 |
작가연령대 | 0.193 | 1.000 |
사업연도 | 우수작품수록및수상건수(건) | 작가연령대 | 실적분야 | |
---|---|---|---|---|
사업연도 | 1.000 | -0.245 | 0.143 | 0.276 |
우수작품수록및수상건수(건) | -0.245 | 1.000 | 0.059 | 0.411 |
작가연령대 | 0.143 | 0.059 | 1.000 | 0.193 |
실적분야 | 0.276 | 0.411 | 0.193 | 1.000 |
문학단체명 | 사업연도 | 작가연령대 | 실적분야 | 우수작품수록및수상건수(건) | |
---|---|---|---|---|---|
0 | *제**부 | 2014 | 40대 | 시 | 4 |
1 | *국**회 | 2014 | 20대 미만 | 시 | 1 |
2 | *국**회 | 2014 | 20대 미만 | 시조 | 1 |
3 | *국**회 | 2014 | 20대 미만 | 수필 | 1 |
4 | *국**회 | 2014 | 20대 미만 | 희곡 | 1 |
5 | *국**회 | 2014 | 50대 | 시 | 1 |
6 | *국**회 | 2014 | 40대 | 소설 | 1 |
7 | *국**회 | 2014 | 50대 | 수필 | 1 |
8 | *국**회 | 2014 | 40대 | 동시 | 1 |
9 | *국**회 | 2014 | 50대 | 시 | 1 |
문학단체명 | 사업연도 | 작가연령대 | 실적분야 | 우수작품수록및수상건수(건) | |
---|---|---|---|---|---|
1419 | *국**회 | 2019 | 20대 미만 | 동시조 | 1 |
1420 | *국**회 | 2019 | 20대 미만 | 장편동화 | 1 |
1421 | *국**회 | 2019 | 20대 미만 | 동화 | 1 |
1422 | *국**회 | 2019 | 20대 미만 | 동시 | 1 |
1423 | *국**회 | 2019 | 20대 미만 | 동시 | 1 |
1424 | *국**회 | 2019 | 20대 미만 | 동시 | 1 |
1425 | *국**회 | 2019 | 20대 미만 | 동시 | 1 |
1426 | *천**학 | 2019 | 20대 | 소설 | 1 |
1427 | *천**학 | 2019 | 60대 | 시 | 1 |
1428 | *천**학 | 2019 | 50대 | 시 | 1 |
Most frequently occurring
문학단체명 | 사업연도 | 작가연령대 | 실적분야 | 우수작품수록및수상건수(건) | # duplicates | |
---|---|---|---|---|---|---|
48 | *국**회 | 2014 | 50대 | 수필 | 2 | 36 |
26 | *국**회 | 2014 | 20대 미만 | 수필 | 1 | 28 |
23 | *국**회 | 2014 | 20대 미만 | 리뷰 | 1 | 27 |
88 | *국**회 | 2017 | 20대 미만 | 희곡 | 1 | 25 |
82 | *국**회 | 2017 | 20대 미만 | 수필 | 1 | 22 |
99 | *국**회 | 2018 | 20대 미만 | 동시 | 1 | 21 |
78 | *국**회 | 2017 | 20대 미만 | 동시 | 1 | 20 |
117 | *국**회 | 2019 | 20대 미만 | 동시 | 1 | 19 |
115 | *국**회 | 2018 | 60대 | 수필 | 1 | 18 |
36 | *국**회 | 2014 | 20대 미만 | 희곡 | 1 | 17 |