Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 56 |
Missing cells | 33 |
Missing cells (%) | 8.4% |
Duplicate rows | 2 |
Duplicate rows (%) | 3.6% |
Total size in memory | 3.2 KiB |
Average record size in memory | 59.4 B |
Variable types
Text | 1 |
---|---|
Categorical | 2 |
Boolean | 3 |
DateTime | 1 |
Dataset
Description | 2014, 2015, 2018, 2019년 문예진흥기금 공모사업 중 문학 분야 "문학행사 및 연구" 지원 사업의 개요(예: 사업유형, 사업시작일, 사업종료일) |
---|---|
Author | 한국문화예술위원회 |
URL | https://www.data.go.kr/data/15076463/fileData.do |
Dataset has 2 (3.6%) duplicate rows | Duplicates |
사업유형_기타 is highly overall correlated with 사업종료일 | High correlation |
사업종료일 is highly overall correlated with 사업연도 and 1 other fields | High correlation |
사업연도 is highly overall correlated with 사업종료일 | High correlation |
사업유형_행사 is highly overall correlated with 사업유형_연구조사 | High correlation |
사업유형_연구조사 is highly overall correlated with 사업유형_행사 | High correlation |
사업유형_기타 is highly imbalanced (87.1%) | Imbalance |
사업시작일 has 33 (58.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 13:03:26.243174 |
---|---|
Analysis finished | 2023-12-12 13:03:26.811025 |
Duration | 0.57 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
문학단체명
Text
Distinct | 28 |
---|---|
Distinct (%) | 50.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
Value | Count | Frequency (%) |
국**회 | 20 | |
동**회 | 3 | 5.4% |
린**회 | 2 | 3.6% |
우**터 | 2 | 3.6% |
디**원 | 2 | 3.6% |
주**의 | 2 | 3.6% |
국**관 | 2 | 3.6% |
국**의 | 2 | 3.6% |
b**회 | 2 | 3.6% |
학**사 | 1 | 1.8% |
Other values (18) | 18 |
Most occurring characters
Value | Count | Frequency (%) |
* | 168 | |
회 | 33 | 11.8% |
국 | 24 | 8.6% |
의 | 4 | 1.4% |
원 | 3 | 1.1% |
학 | 3 | 1.1% |
관 | 3 | 1.1% |
주 | 3 | 1.1% |
사 | 3 | 1.1% |
우 | 3 | 1.1% |
Other values (26) | 33 | 11.8% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 168 | |
Other Letter | 110 | |
Uppercase Letter | 2 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
Other Punctuation
Value | Count | Frequency (%) |
* | 168 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 168 | |
Hangul | 110 | |
Latin | 2 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
Common
Value | Count | Frequency (%) |
* | 168 |
Latin
Value | Count | Frequency (%) |
B | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 170 | |
Hangul | 110 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 168 | |
B | 2 | 1.2% |
Hangul
Value | Count | Frequency (%) |
회 | 33 | |
국 | 24 | |
의 | 4 | 3.6% |
원 | 3 | 2.7% |
학 | 3 | 2.7% |
관 | 3 | 2.7% |
주 | 3 | 2.7% |
사 | 3 | 2.7% |
우 | 3 | 2.7% |
린 | 3 | 2.7% |
Other values (24) | 28 |
사업연도
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 7.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
2014 | |
---|---|
2018 | |
2015 | |
2019 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2014 |
---|---|
2nd row | 2014 |
3rd row | 2014 |
4th row | 2014 |
5th row | 2014 |
Common Values
Value | Count | Frequency (%) |
2014 | 22 | |
2018 | 12 | |
2015 | 11 | |
2019 | 11 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2014 | 22 | |
2018 | 12 | |
2015 | 11 | |
2019 | 11 |
사업유형_행사
Boolean
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 188.0 B |
False | |
---|---|
True |
Value | Count | Frequency (%) |
False | 30 | |
True | 26 |
사업유형_연구조사
Boolean
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 188.0 B |
True | |
---|---|
False |
Value | Count | Frequency (%) |
True | 32 | |
False | 24 |
사업유형_기타
Boolean
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 188.0 B |
False | |
---|---|
True | 1 |
Value | Count | Frequency (%) |
False | 55 | |
True | 1 | 1.8% |
사업시작일
Date
MISSING
 
Distinct | 17 |
---|---|
Distinct (%) | 73.9% |
Missing | 33 |
Missing (%) | 58.9% |
Memory size | 580.0 B |
Minimum | 2018-01-01 00:00:00 |
---|---|
Maximum | 2019-06-29 00:00:00 |
사업종료일
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 14.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
<NA> | |
---|---|
2018-12-31 | |
2019-12-31 | |
2018-09-16 | 1 |
2020-01-31 | 1 |
Other values (3) | 3 |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 6.4642857 |
Min length | 4 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 8.9% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 33 | |
2018-12-31 | 11 | 19.6% |
2019-12-31 | 7 | 12.5% |
2018-09-16 | 1 | 1.8% |
2020-01-31 | 1 | 1.8% |
2019-11-16 | 1 | 1.8% |
2019-12-04 | 1 | 1.8% |
2019-06-29 | 1 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 33 | |
2018-12-31 | 11 | 19.6% |
2019-12-31 | 7 | 12.5% |
2018-09-16 | 1 | 1.8% |
2020-01-31 | 1 | 1.8% |
2019-11-16 | 1 | 1.8% |
2019-12-04 | 1 | 1.8% |
2019-06-29 | 1 | 1.8% |
문학단체명 | 사업연도 | 사업유형_행사 | 사업유형_연구조사 | 사업유형_기타 | 사업시작일 | 사업종료일 | |
---|---|---|---|---|---|---|---|
문학단체명 | 1.000 | 0.000 | 0.598 | 0.626 | 0.000 | 0.000 | 0.000 |
사업연도 | 0.000 | 1.000 | 0.413 | 0.478 | 0.000 | 1.000 | 1.000 |
사업유형_행사 | 0.598 | 0.413 | 1.000 | 0.959 | 0.000 | 0.000 | 0.000 |
사업유형_연구조사 | 0.626 | 0.478 | 0.959 | 1.000 | 0.000 | 0.000 | 0.000 |
사업유형_기타 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | NaN | NaN |
사업시작일 | 0.000 | 1.000 | 0.000 | 0.000 | NaN | 1.000 | 0.754 |
사업종료일 | 0.000 | 1.000 | 0.000 | 0.000 | NaN | 0.754 | 1.000 |
사업유형_연구조사 | 사업유형_기타 | 사업유형_행사 | 사업연도 | 사업종료일 | |
---|---|---|---|---|---|
사업유형_연구조사 | 1.000 | 0.000 | 0.818 | 0.316 | 0.000 |
사업유형_기타 | 0.000 | 1.000 | 0.000 | 0.000 | 1.000 |
사업유형_행사 | 0.818 | 0.000 | 1.000 | 0.271 | 0.000 |
사업연도 | 0.316 | 0.000 | 0.271 | 1.000 | 0.873 |
사업종료일 | 0.000 | 1.000 | 0.000 | 0.873 | 1.000 |
사업연도 | 사업유형_행사 | 사업유형_연구조사 | 사업유형_기타 | 사업종료일 | |
---|---|---|---|---|---|
사업연도 | 1.000 | 0.271 | 0.316 | 0.000 | 0.873 |
사업유형_행사 | 0.271 | 1.000 | 0.818 | 0.000 | 0.000 |
사업유형_연구조사 | 0.316 | 0.818 | 1.000 | 0.000 | 0.000 |
사업유형_기타 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 |
사업종료일 | 0.873 | 0.000 | 0.000 | 1.000 | 1.000 |
문학단체명 | 사업연도 | 사업유형_행사 | 사업유형_연구조사 | 사업유형_기타 | 사업시작일 | 사업종료일 | |
---|---|---|---|---|---|---|---|
0 | *국**회 | 2014 | N | Y | N | <NA> | <NA> |
1 | *색**원 | 2014 | Y | N | N | <NA> | <NA> |
2 | *린**회 | 2014 | Y | Y | N | <NA> | <NA> |
3 | *랑**회 | 2014 | Y | N | N | <NA> | <NA> |
4 | *국**회 | 2014 | N | Y | N | <NA> | <NA> |
5 | *오**촌 | 2014 | Y | N | N | <NA> | <NA> |
6 | *서**요 | 2014 | Y | Y | N | <NA> | <NA> |
7 | *국**회 | 2014 | N | Y | N | <NA> | <NA> |
8 | *우**터 | 2014 | N | Y | N | <NA> | <NA> |
9 | *국**회 | 2014 | N | Y | N | <NA> | <NA> |
문학단체명 | 사업연도 | 사업유형_행사 | 사업유형_연구조사 | 사업유형_기타 | 사업시작일 | 사업종료일 | |
---|---|---|---|---|---|---|---|
46 | *국**회 | 2019 | Y | N | N | 2019-02-01 | 2020-01-31 |
47 | *B**회 | 2019 | N | Y | N | 2019-02-01 | 2019-11-16 |
48 | *림**회 | 2019 | N | Y | N | 2019-02-01 | 2019-12-31 |
49 | *주**의 | 2019 | N | Y | N | 2019-03-01 | 2019-12-31 |
50 | *학**실 | 2019 | Y | N | N | 2019-03-01 | 2019-12-31 |
51 | *린**대 | 2019 | N | Y | N | 2019-03-01 | 2019-12-31 |
52 | *동**회 | 2019 | Y | N | N | 2019-04-01 | 2019-12-04 |
53 | *국**의 | 2019 | Y | N | N | 2019-06-01 | 2019-12-31 |
54 | *디**원 | 2019 | Y | N | N | 2019-06-01 | 2019-12-31 |
55 | *지**션 | 2019 | Y | N | N | 2019-06-29 | 2019-06-29 |
Most frequently occurring
문학단체명 | 사업연도 | 사업유형_행사 | 사업유형_연구조사 | 사업유형_기타 | 사업시작일 | 사업종료일 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | *국**회 | 2014 | N | Y | N | <NA> | <NA> | 6 |
1 | *국**회 | 2015 | N | Y | N | <NA> | <NA> | 4 |