Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 1708 |
Missing cells | 1069 |
Missing cells (%) | 12.5% |
Duplicate rows | 201 |
Duplicate rows (%) | 11.8% |
Total size in memory | 70.2 KiB |
Average record size in memory | 42.1 B |
Variable types
Categorical | 2 |
---|---|
Numeric | 2 |
Text | 1 |
Dataset
Description | 2014-2019년 문예진흥기금 공모사업 중 문학 분야 "집필공간운영" 지원 사업의 신청자 현황(예: 선정 분야, 성별, 생년) |
---|---|
Author | 한국문화예술위원회 |
URL | https://www.data.go.kr/data/15076480/fileData.do |
Dataset has 201 (11.8%) duplicate rows | Duplicates |
문학단체명 is highly overall correlated with 성별 | High correlation |
성별 is highly overall correlated with 문학단체명 | High correlation |
생년 has 1069 (62.6%) missing values | Missing |
Reproduction
Analysis started | 2024-04-17 11:19:38.899285 |
---|---|
Analysis finished | 2024-04-17 11:19:39.526188 |
Duration | 0.63 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
문학단체명
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.5 KiB |
*1**학 | |
---|---|
*지**단 | |
*을**집 | |
*악**원 | |
*버**집 | |
Other values (2) |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | *악**원 |
---|---|
2nd row | *악**원 |
3rd row | *악**원 |
4th row | *악**원 |
5th row | *악**원 |
Common Values
Value | Count | Frequency (%) |
*1**학 | 501 | |
*지**단 | 470 | |
*을**집 | 390 | |
*악**원 | 107 | 6.3% |
*버**집 | 100 | 5.9% |
*날**날 | 83 | 4.9% |
*산**꽃 | 57 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1**학 | 501 | |
지**단 | 470 | |
을**집 | 390 | |
악**원 | 107 | 6.3% |
버**집 | 100 | 5.9% |
날**날 | 83 | 4.9% |
산**꽃 | 57 | 3.3% |
사업연도
Real number (ℝ)
Distinct | 6 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.3343 |
Minimum | 2014 |
---|---|
Maximum | 2019 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 15.1 KiB |
Quantile statistics
Minimum | 2014 |
---|---|
5-th percentile | 2014 |
Q1 | 2015 |
median | 2016 |
Q3 | 2018 |
95-th percentile | 2019 |
Maximum | 2019 |
Range | 5 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 1.7339285 |
---|---|
Coefficient of variation (CV) | 0.000859941 |
Kurtosis | -1.2685346 |
Mean | 2016.3343 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.095637094 |
Sum | 3443899 |
Variance | 3.0065082 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
2014 | 368 | |
2016 | 310 | |
2017 | 272 | |
2019 | 257 | |
2018 | 255 | |
2015 | 246 |
Value | Count | Frequency (%) |
2014 | 368 | |
2015 | 246 | |
2016 | 310 | |
2017 | 272 | |
2018 | 255 | |
2019 | 257 |
Value | Count | Frequency (%) |
2019 | 257 | |
2018 | 255 | |
2017 | 272 | |
2016 | 310 | |
2015 | 246 | |
2014 | 368 |
신청분야
Text
Distinct | 52 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.5 KiB |
Value | Count | Frequency (%) |
소설 | 537 | |
시 | 410 | |
미분류 | 305 | |
아동문학 | 147 | 8.6% |
희곡 | 104 | 6.1% |
동화 | 49 | 2.9% |
평론 | 30 | 1.7% |
번역 | 21 | 1.2% |
시나리오 | 20 | 1.2% |
산문 | 18 | 1.0% |
Other values (28) | 76 | 4.4% |
Most occurring characters
Value | Count | Frequency (%) |
소 | 552 | |
설 | 550 | |
시 | 459 | |
분 | 306 | |
미 | 305 | |
류 | 305 | |
동 | 201 | 5.3% |
문 | 170 | 4.5% |
학 | 152 | 4.0% |
아 | 148 | 3.9% |
Other values (47) | 641 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3721 | |
Space Separator | 52 | 1.4% |
Math Symbol | 12 | 0.3% |
Close Punctuation | 2 | 0.1% |
Open Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
소 | 552 | |
설 | 550 | |
시 | 459 | |
분 | 306 | |
미 | 305 | |
류 | 305 | |
동 | 201 | 5.4% |
문 | 170 | 4.6% |
학 | 152 | 4.1% |
아 | 148 | 4.0% |
Other values (43) | 573 |
Space Separator
Value | Count | Frequency (%) |
52 |
Math Symbol
Value | Count | Frequency (%) |
| | 12 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3721 | |
Common | 68 | 1.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
소 | 552 | |
설 | 550 | |
시 | 459 | |
분 | 306 | |
미 | 305 | |
류 | 305 | |
동 | 201 | 5.4% |
문 | 170 | 4.6% |
학 | 152 | 4.1% |
아 | 148 | 4.0% |
Other values (43) | 573 |
Common
Value | Count | Frequency (%) |
52 | ||
| | 12 | 17.6% |
) | 2 | 2.9% |
( | 2 | 2.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3721 | |
ASCII | 68 | 1.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
소 | 552 | |
설 | 550 | |
시 | 459 | |
분 | 306 | |
미 | 305 | |
류 | 305 | |
동 | 201 | 5.4% |
문 | 170 | 4.6% |
학 | 152 | 4.1% |
아 | 148 | 4.0% |
Other values (43) | 573 |
ASCII
Value | Count | Frequency (%) |
52 | ||
| | 12 | 17.6% |
) | 2 | 2.9% |
( | 2 | 2.9% |
성별
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.5 KiB |
미분류 | |
---|---|
여 | |
남 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.1135831 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 미분류 |
---|---|
2nd row | 미분류 |
3rd row | 미분류 |
4th row | 미분류 |
5th row | 미분류 |
Common Values
Value | Count | Frequency (%) |
미분류 | 951 | |
여 | 409 | |
남 | 348 | 20.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
미분류 | 951 | |
여 | 409 | |
남 | 348 | 20.4% |
생년
Real number (ℝ)
MISSING
 
Distinct | 54 |
---|---|
Distinct (%) | 8.5% |
Missing | 1069 |
Missing (%) | 62.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1966.0501 |
Minimum | 1940 |
---|---|
Maximum | 1996 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 15.1 KiB |
Quantile statistics
Minimum | 1940 |
---|---|
5-th percentile | 1950 |
Q1 | 1959 |
median | 1965 |
Q3 | 1972 |
95-th percentile | 1986 |
Maximum | 1996 |
Range | 56 |
Interquartile range (IQR) | 13 |
Descriptive statistics
Standard deviation | 10.297335 |
---|---|
Coefficient of variation (CV) | 0.0052375751 |
Kurtosis | 0.010954117 |
Mean | 1966.0501 |
Median Absolute Deviation (MAD) | 6 |
Skewness | 0.36210909 |
Sum | 1256306 |
Variance | 106.03511 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1961 | 43 | 2.5% |
1956 | 42 | 2.5% |
1970 | 33 | 1.9% |
1963 | 29 | 1.7% |
1962 | 26 | 1.5% |
1965 | 25 | 1.5% |
1967 | 25 | 1.5% |
1969 | 25 | 1.5% |
1968 | 24 | 1.4% |
1959 | 22 | 1.3% |
Other values (44) | 345 | 20.2% |
(Missing) | 1069 |
Value | Count | Frequency (%) |
1940 | 1 | 0.1% |
1941 | 1 | 0.1% |
1943 | 2 | 0.1% |
1945 | 4 | |
1946 | 6 | |
1947 | 3 | 0.2% |
1948 | 3 | 0.2% |
1949 | 8 | |
1950 | 7 | |
1951 | 6 |
Value | Count | Frequency (%) |
1996 | 1 | 0.1% |
1995 | 2 | 0.1% |
1993 | 3 | 0.2% |
1992 | 2 | 0.1% |
1991 | 4 | 0.2% |
1990 | 4 | 0.2% |
1989 | 2 | 0.1% |
1988 | 4 | 0.2% |
1987 | 3 | 0.2% |
1986 | 10 |
문학단체명 | 사업연도 | 신청분야 | 성별 | 생년 | |
---|---|---|---|---|---|
문학단체명 | 1.000 | 0.559 | 0.723 | 0.636 | 0.307 |
사업연도 | 0.559 | 1.000 | 0.539 | 0.507 | 0.171 |
신청분야 | 0.723 | 0.539 | 1.000 | 0.529 | 0.625 |
성별 | 0.636 | 0.507 | 0.529 | 1.000 | 0.201 |
생년 | 0.307 | 0.171 | 0.625 | 0.201 | 1.000 |
문학단체명 | 성별 | |
---|---|---|
문학단체명 | 1.000 | 0.534 |
성별 | 0.534 | 1.000 |
사업연도 | 생년 | 문학단체명 | 성별 | |
---|---|---|---|---|
사업연도 | 1.000 | -0.009 | 0.350 | 0.395 |
생년 | -0.009 | 1.000 | 0.129 | 0.121 |
문학단체명 | 0.350 | 0.129 | 1.000 | 0.534 |
성별 | 0.395 | 0.121 | 0.534 | 1.000 |
문학단체명 | 사업연도 | 신청분야 | 성별 | 생년 | |
---|---|---|---|---|---|
0 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
1 | *악**원 | 2014 | 시 | 미분류 | <NA> |
2 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
3 | *악**원 | 2014 | 희곡|소설 | 미분류 | <NA> |
4 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
5 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
6 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
7 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
8 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
9 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
문학단체명 | 사업연도 | 신청분야 | 성별 | 생년 | |
---|---|---|---|---|---|
1698 | *악**원 | 2019 | 희곡 | 남 | 1974 |
1699 | *악**원 | 2019 | 평론 | 남 | 1952 |
1700 | *악**원 | 2019 | 시 | 여 | 1962 |
1701 | *악**원 | 2019 | 희곡 | 여 | 1971 |
1702 | *악**원 | 2019 | 아동문학 | 여 | 1963 |
1703 | *악**원 | 2019 | 소설 | 남 | 1972 |
1704 | *악**원 | 2019 | 평론 | 남 | 1974 |
1705 | *악**원 | 2019 | 소설 | 남 | 1972 |
1706 | *악**원 | 2019 | 소설 | 남 | 1972 |
1707 | *악**원 | 2019 | 소설 | 여 | 1961 |
Most frequently occurring
문학단체명 | 사업연도 | 신청분야 | 성별 | 생년 | # duplicates | |
---|---|---|---|---|---|---|
0 | *1**학 | 2014 | 미분류 | 남 | <NA> | 74 |
1 | *1**학 | 2014 | 미분류 | 여 | <NA> | 74 |
159 | *지**단 | 2014 | 소설 | 미분류 | <NA> | 43 |
166 | *지**단 | 2015 | 소설 | 미분류 | <NA> | 40 |
94 | *버**집 | 2018 | 미분류 | 미분류 | <NA> | 39 |
119 | *을**집 | 2014 | 시 | 미분류 | <NA> | 33 |
101 | *산**꽃 | 2015 | 소설 | 미분류 | <NA> | 31 |
125 | *을**집 | 2015 | 시 | 미분류 | <NA> | 31 |
137 | *을**집 | 2017 | 시 | 미분류 | <NA> | 31 |
172 | *지**단 | 2016 | 소설 | 미분류 | <NA> | 31 |