Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 885 |
Missing cells | 734 |
Missing cells (%) | 16.6% |
Duplicate rows | 100 |
Duplicate rows (%) | 11.3% |
Total size in memory | 36.4 KiB |
Average record size in memory | 42.1 B |
Variable types
Categorical | 2 |
---|---|
Numeric | 2 |
Text | 1 |
Dataset
Description | 2014-2019년 문예진흥기금 공모사업 중 문학 분야 "집필공간운영" 지원 사업의 선정자 현황(예: 선정 분야, 성별, 생년) |
---|---|
Author | 한국문화예술위원회 |
URL | https://www.data.go.kr/data/15076478/fileData.do |
Dataset has 100 (11.3%) duplicate rows | Duplicates |
문학단체명 is highly overall correlated with 성별 | High correlation |
성별 is highly overall correlated with 문학단체명 | High correlation |
선정분야 has 36 (4.1%) missing values | Missing |
생년 has 698 (78.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 22:57:19.217256 |
---|---|
Analysis finished | 2023-12-12 22:57:20.027171 |
Duration | 0.81 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
문학단체명
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.0 KiB |
*지**단 | |
---|---|
*을**집 | |
*1**학 | |
*악**원 | |
*날**날 | |
Other values (2) |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | *악**원 |
---|---|
2nd row | *악**원 |
3rd row | *악**원 |
4th row | *악**원 |
5th row | *악**원 |
Common Values
Value | Count | Frequency (%) |
*지**단 | 303 | |
*을**집 | 181 | |
*1**학 | 162 | |
*악**원 | 99 | 11.2% |
*날**날 | 63 | 7.1% |
*버**집 | 50 | 5.6% |
*산**꽃 | 27 | 3.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지**단 | 303 | |
을**집 | 181 | |
1**학 | 162 | |
악**원 | 99 | 11.2% |
날**날 | 63 | 7.1% |
버**집 | 50 | 5.6% |
산**꽃 | 27 | 3.1% |
사업연도
Real number (ℝ)
Distinct | 6 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.3243 |
Minimum | 2014 |
---|---|
Maximum | 2019 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 7.9 KiB |
Quantile statistics
Minimum | 2014 |
---|---|
5-th percentile | 2014 |
Q1 | 2015 |
median | 2016 |
Q3 | 2018 |
95-th percentile | 2019 |
Maximum | 2019 |
Range | 5 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 1.6579466 |
---|---|
Coefficient of variation (CV) | 0.00082226188 |
Kurtosis | -1.168757 |
Mean | 2016.3243 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 0.1579232 |
Sum | 1784447 |
Variance | 2.748787 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
2015 | 170 | |
2016 | 167 | |
2014 | 153 | |
2017 | 148 | |
2018 | 126 | |
2019 | 121 |
Value | Count | Frequency (%) |
2014 | 153 | |
2015 | 170 | |
2016 | 167 | |
2017 | 148 | |
2018 | 126 | |
2019 | 121 |
Value | Count | Frequency (%) |
2019 | 121 | |
2018 | 126 | |
2017 | 148 | |
2016 | 167 | |
2015 | 170 | |
2014 | 153 |
선정분야
Text
MISSING
 
Distinct | 53 |
---|---|
Distinct (%) | 6.2% |
Missing | 36 |
Missing (%) | 4.1% |
Memory size | 7.0 KiB |
Value | Count | Frequency (%) |
소설 | 241 | |
미분류 | 222 | |
시 | 157 | |
아동문학 | 47 | 5.5% |
희곡 | 47 | 5.5% |
동화 | 42 | 4.9% |
평론 | 18 | 2.1% |
시조 | 8 | 0.9% |
번역 | 6 | 0.7% |
수필 | 6 | 0.7% |
Other values (36) | 59 | 6.9% |
Most occurring characters
Value | Count | Frequency (%) |
소 | 256 | |
설 | 254 | |
분 | 224 | |
미 | 223 | |
류 | 222 | |
시 | 188 | |
동 | 92 | 4.6% |
72 | 3.6% | |
문 | 55 | 2.7% |
희 | 50 | 2.5% |
Other values (50) | 385 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1936 | |
Space Separator | 72 | 3.6% |
Math Symbol | 13 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
소 | 256 | |
설 | 254 | |
분 | 224 | |
미 | 223 | |
류 | 222 | |
시 | 188 | |
동 | 92 | 4.8% |
문 | 55 | 2.8% |
희 | 50 | 2.6% |
곡 | 50 | 2.6% |
Other values (48) | 322 |
Space Separator
Value | Count | Frequency (%) |
72 |
Math Symbol
Value | Count | Frequency (%) |
| | 13 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1936 | |
Common | 85 | 4.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
소 | 256 | |
설 | 254 | |
분 | 224 | |
미 | 223 | |
류 | 222 | |
시 | 188 | |
동 | 92 | 4.8% |
문 | 55 | 2.8% |
희 | 50 | 2.6% |
곡 | 50 | 2.6% |
Other values (48) | 322 |
Common
Value | Count | Frequency (%) |
72 | ||
| | 13 | 15.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1936 | |
ASCII | 85 | 4.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
소 | 256 | |
설 | 254 | |
분 | 224 | |
미 | 223 | |
류 | 222 | |
시 | 188 | |
동 | 92 | 4.8% |
문 | 55 | 2.8% |
희 | 50 | 2.6% |
곡 | 50 | 2.6% |
Other values (48) | 322 |
ASCII
Value | Count | Frequency (%) |
72 | ||
| | 13 | 15.3% |
성별
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.0 KiB |
미분류 | |
---|---|
여 | |
남 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.5751412 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 미분류 |
---|---|
2nd row | 미분류 |
3rd row | 미분류 |
4th row | 미분류 |
5th row | 미분류 |
Common Values
Value | Count | Frequency (%) |
미분류 | 697 | |
여 | 117 | 13.2% |
남 | 71 | 8.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
미분류 | 697 | |
여 | 117 | 13.2% |
남 | 71 | 8.0% |
생년
Real number (ℝ)
MISSING
 
Distinct | 44 |
---|---|
Distinct (%) | 23.5% |
Missing | 698 |
Missing (%) | 78.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1967.4545 |
Minimum | 1940 |
---|---|
Maximum | 1996 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 7.9 KiB |
Quantile statistics
Minimum | 1940 |
---|---|
5-th percentile | 1952 |
Q1 | 1961 |
median | 1967 |
Q3 | 1972 |
95-th percentile | 1986.7 |
Maximum | 1996 |
Range | 56 |
Interquartile range (IQR) | 11 |
Descriptive statistics
Standard deviation | 10.256486 |
---|---|
Coefficient of variation (CV) | 0.0052130739 |
Kurtosis | 0.24702732 |
Mean | 1967.4545 |
Median Absolute Deviation (MAD) | 6 |
Skewness | 0.46723076 |
Sum | 367914 |
Variance | 105.1955 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1970 | 15 | 1.7% |
1969 | 12 | 1.4% |
1962 | 11 | 1.2% |
1967 | 11 | 1.2% |
1959 | 10 | 1.1% |
1956 | 8 | 0.9% |
1963 | 8 | 0.9% |
1961 | 7 | 0.8% |
1952 | 7 | 0.8% |
1966 | 6 | 0.7% |
Other values (34) | 92 | 10.4% |
(Missing) | 698 |
Value | Count | Frequency (%) |
1940 | 1 | 0.1% |
1945 | 1 | 0.1% |
1949 | 2 | 0.2% |
1951 | 1 | 0.1% |
1952 | 7 | |
1953 | 2 | 0.2% |
1954 | 3 | 0.3% |
1955 | 1 | 0.1% |
1956 | 8 | |
1957 | 3 | 0.3% |
Value | Count | Frequency (%) |
1996 | 1 | 0.1% |
1995 | 1 | 0.1% |
1993 | 2 | 0.2% |
1991 | 2 | 0.2% |
1989 | 1 | 0.1% |
1988 | 2 | 0.2% |
1987 | 1 | 0.1% |
1986 | 5 | |
1984 | 2 | 0.2% |
1982 | 1 | 0.1% |
문학단체명 | 사업연도 | 선정분야 | 성별 | 생년 | |
---|---|---|---|---|---|
문학단체명 | 1.000 | 0.496 | 0.670 | 0.609 | 0.331 |
사업연도 | 0.496 | 1.000 | 0.584 | 0.402 | 0.431 |
선정분야 | 0.670 | 0.584 | 1.000 | 0.445 | 0.407 |
성별 | 0.609 | 0.402 | 0.445 | 1.000 | 0.290 |
생년 | 0.331 | 0.431 | 0.407 | 0.290 | 1.000 |
성별 | 문학단체명 | |
---|---|---|
성별 | 1.000 | 0.503 |
문학단체명 | 0.503 | 1.000 |
사업연도 | 생년 | 문학단체명 | 성별 | |
---|---|---|---|---|
사업연도 | 1.000 | -0.172 | 0.311 | 0.299 |
생년 | -0.172 | 1.000 | 0.202 | 0.209 |
문학단체명 | 0.311 | 0.202 | 1.000 | 0.503 |
성별 | 0.299 | 0.209 | 0.503 | 1.000 |
문학단체명 | 사업연도 | 선정분야 | 성별 | 생년 | |
---|---|---|---|---|---|
0 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
1 | *악**원 | 2014 | 시 | 미분류 | <NA> |
2 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
3 | *악**원 | 2014 | 희곡 | 미분류 | <NA> |
4 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
5 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
6 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
7 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
8 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
9 | *악**원 | 2014 | 소설 | 미분류 | <NA> |
문학단체명 | 사업연도 | 선정분야 | 성별 | 생년 | |
---|---|---|---|---|---|
875 | *악**원 | 2019 | 아동문학 | 남 | 1966 |
876 | *악**원 | 2019 | 소설 | 남 | 1953 |
877 | *악**원 | 2019 | 소설 | 남 | 1949 |
878 | *악**원 | 2019 | 번역 | 여 | 1971 |
879 | *악**원 | 2019 | 시 | 남 | 1970 |
880 | *악**원 | 2019 | 아동문학 | 남 | 1963 |
881 | *악**원 | 2019 | 소설 | 남 | 1957 |
882 | *악**원 | 2019 | 소설 | 남 | 1972 |
883 | *악**원 | 2019 | 소설 | 남 | 1956 |
884 | *악**원 | 2019 | 평론 | 남 | 1972 |
Most frequently occurring
문학단체명 | 사업연도 | 선정분야 | 성별 | 생년 | # duplicates | |
---|---|---|---|---|---|---|
78 | *지**단 | 2015 | 미분류 | 미분류 | <NA> | 62 |
89 | *지**단 | 2018 | 미분류 | 미분류 | <NA> | 47 |
60 | *을**집 | 2015 | 시 | 미분류 | <NA> | 23 |
39 | *버**집 | 2018 | 미분류 | 미분류 | <NA> | 21 |
46 | *악**원 | 2014 | 소설 | 미분류 | <NA> | 20 |
84 | *지**단 | 2017 | 소설 | 미분류 | <NA> | 20 |
79 | *지**단 | 2016 | 소설 | 미분류 | <NA> | 19 |
42 | *산**꽃 | 2015 | 소설 | 미분류 | <NA> | 18 |
48 | *악**원 | 2015 | 소설 | 미분류 | <NA> | 18 |
31 | *날**날 | 2016 | 소설 | 미분류 | <NA> | 17 |