Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 979 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 15 |
Duplicate rows (%) | 1.5% |
Total size in memory | 39.3 KiB |
Average record size in memory | 41.1 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 2 |
Text | 2 |
Dataset
Description | 한국국제교류재단이 시행하는 다양한 문화예술교류 사업에 관한 정보(사업연도, 사업분류, 프로젝트명 등)를 제공합니다. |
---|---|
Author | 한국국제교류재단 |
URL | https://www.data.go.kr/data/15116500/fileData.do |
Dataset has 15 (1.5%) duplicate rows | Duplicates |
사업유형 is highly imbalanced (79.7%) | Imbalance |
Reproduction
Analysis started | 2024-03-14 13:24:47.245110 |
---|---|
Analysis finished | 2024-03-14 13:24:48.458631 |
Duration | 1.21 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
사업연도
Real number (ℝ)
Distinct | 32 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2009.2247 |
Minimum | 1992 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 8.7 KiB |
Quantile statistics
Minimum | 1992 |
---|---|
5-th percentile | 2000 |
Q1 | 2007 |
median | 2009 |
Q3 | 2010 |
95-th percentile | 2020 |
Maximum | 2023 |
Range | 31 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 5.283822 |
---|---|
Coefficient of variation (CV) | 0.0026297815 |
Kurtosis | 1.7781652 |
Mean | 2009.2247 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.0064962871 |
Sum | 1967031 |
Variance | 27.918775 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
2010 | 178 | |
2009 | 160 | |
2008 | 98 | |
2007 | 88 | |
2006 | 76 | 7.8% |
2011 | 48 | 4.9% |
2005 | 45 | 4.6% |
2012 | 31 | 3.2% |
2013 | 22 | 2.2% |
2015 | 21 | 2.1% |
Other values (22) | 212 |
Value | Count | Frequency (%) |
1992 | 6 | |
1993 | 3 | 0.3% |
1994 | 6 | |
1995 | 6 | |
1996 | 5 | |
1997 | 10 | |
1998 | 3 | 0.3% |
1999 | 5 | |
2000 | 9 | |
2001 | 8 |
Value | Count | Frequency (%) |
2023 | 15 | |
2022 | 17 | |
2021 | 10 | |
2020 | 8 | 0.8% |
2019 | 15 | |
2018 | 18 | |
2017 | 18 | |
2016 | 19 | |
2015 | 21 | |
2014 | 1 | 0.1% |
사업유형
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.8 KiB |
단년 | |
---|---|
다년 | 31 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 단년 |
---|---|
2nd row | 단년 |
3rd row | 단년 |
4th row | 단년 |
5th row | 단년 |
Common Values
Value | Count | Frequency (%) |
단년 | 948 | |
다년 | 31 | 3.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단년 | 948 | |
다년 | 31 | 3.2% |
사업분류
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.8 KiB |
세계문화교류 | |
---|---|
전략지역 문화예술행사 개최 | |
코리아페스티벌 | 1 |
Length
Max length | 14 |
---|---|
Median length | 6 |
Mean length | 8.1256384 |
Min length | 6 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 세계문화교류 |
---|---|
2nd row | 세계문화교류 |
3rd row | 세계문화교류 |
4th row | 세계문화교류 |
5th row | 세계문화교류 |
Common Values
Value | Count | Frequency (%) |
세계문화교류 | 718 | |
전략지역 문화예술행사 개최 | 260 | 26.6% |
코리아페스티벌 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
세계문화교류 | 718 | |
전략지역 | 260 | 17.3% |
문화예술행사 | 260 | 17.3% |
개최 | 260 | 17.3% |
코리아페스티벌 | 1 | 0.1% |
프로젝트명
Text
Distinct | 877 |
---|---|
Distinct (%) | 89.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.8 KiB |
Length
Max length | 66 |
---|---|
Median length | 42 |
Mean length | 17.727273 |
Min length | 5 |
Characters and Unicode
Total characters | 17355 |
---|---|
Distinct characters | 650 |
Distinct categories | 14 ? |
Distinct scripts | 4 ? |
Distinct blocks | 7 ? |
Unique
Unique | 827 ? |
---|---|
Unique (%) | 84.5% |
Sample
1st row | 전략적문화교류증진사업 |
---|---|
2nd row | 체험관 K-컬처 전시 |
3rd row | <한글 헬베티카 서밋> |
4th row | 2023 코리아워크숍 |
5th row | <모두의 어떤 차이> |
Value | Count | Frequency (%) |
118 | 3.1% | |
예술인 | 51 | 1.3% |
재외 | 50 | 1.3% |
한국어교실 | 47 | 1.2% |
문화행사 | 46 | 1.2% |
순회공연 | 44 | 1.1% |
공연 | 39 | 1.0% |
지원 | 38 | 1.0% |
기념 | 33 | 0.9% |
사진전 | 33 | 0.9% |
Other values (1870) | 3366 |
Most occurring characters
Value | Count | Frequency (%) |
2963 | 17.1% | |
국 | 408 | 2.4% |
한 | 402 | 2.3% |
화 | 335 | 1.9% |
사 | 255 | 1.5% |
전 | 245 | 1.4% |
0 | 237 | 1.4% |
아 | 212 | 1.2% |
회 | 210 | 1.2% |
교 | 202 | 1.2% |
Other values (640) | 11886 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 11830 | |
Space Separator | 2963 | 17.1% |
Decimal Number | 772 | 4.4% |
Lowercase Letter | 713 | 4.1% |
Uppercase Letter | 425 | 2.4% |
Dash Punctuation | 191 | 1.1% |
Other Punctuation | 191 | 1.1% |
Math Symbol | 121 | 0.7% |
Open Punctuation | 55 | 0.3% |
Close Punctuation | 55 | 0.3% |
Other values (4) | 39 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 408 | 3.4% |
한 | 402 | 3.4% |
화 | 335 | 2.8% |
사 | 255 | 2.2% |
전 | 245 | 2.1% |
아 | 212 | 1.8% |
회 | 210 | 1.8% |
교 | 202 | 1.7% |
문 | 196 | 1.7% |
의 | 176 | 1.5% |
Other values (553) | 9189 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 113 | |
o | 80 | |
a | 72 | |
r | 60 | |
t | 57 | 8.0% |
n | 44 | 6.2% |
s | 42 | 5.9% |
i | 41 | 5.8% |
l | 38 | 5.3% |
h | 20 | 2.8% |
Other values (15) | 146 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 66 | |
F | 62 | |
I | 49 | |
A | 37 | 8.7% |
C | 24 | 5.6% |
S | 23 | 5.4% |
E | 21 | 4.9% |
N | 19 | 4.5% |
T | 18 | 4.2% |
R | 13 | 3.1% |
Other values (14) | 93 |
Decimal Number
Value | Count | Frequency (%) |
0 | 237 | |
2 | 182 | |
1 | 146 | |
5 | 41 | 5.3% |
9 | 37 | 4.8% |
3 | 36 | 4.7% |
6 | 29 | 3.8% |
8 | 27 | 3.5% |
7 | 19 | 2.5% |
4 | 18 | 2.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 59 | |
' | 38 | |
: | 37 | |
" | 27 | |
& | 11 | 5.8% |
. | 6 | 3.1% |
· | 5 | 2.6% |
/ | 5 | 2.6% |
? | 2 | 1.0% |
! | 1 | 0.5% |
Math Symbol
Value | Count | Frequency (%) |
> | 60 | |
< | 60 | |
+ | 1 | 0.8% |
Open Punctuation
Value | Count | Frequency (%) |
《 | 30 | |
( | 18 | |
「 | 7 | 12.7% |
Close Punctuation
Value | Count | Frequency (%) |
》 | 30 | |
) | 18 | |
」 | 7 | 12.7% |
Initial Punctuation
Value | Count | Frequency (%) |
“ | 10 | |
‘ | 7 |
Final Punctuation
Value | Count | Frequency (%) |
” | 9 | |
’ | 7 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 3 | |
Ⅲ | 1 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
2963 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 191 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 11818 | |
Common | 4383 | 25.3% |
Latin | 1142 | 6.6% |
Han | 12 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 408 | 3.5% |
한 | 402 | 3.4% |
화 | 335 | 2.8% |
사 | 255 | 2.2% |
전 | 245 | 2.1% |
아 | 212 | 1.8% |
회 | 210 | 1.8% |
교 | 202 | 1.7% |
문 | 196 | 1.7% |
의 | 176 | 1.5% |
Other values (546) | 9177 |
Latin
Value | Count | Frequency (%) |
e | 113 | 9.9% |
o | 80 | 7.0% |
a | 72 | 6.3% |
K | 66 | 5.8% |
F | 62 | 5.4% |
r | 60 | 5.3% |
t | 57 | 5.0% |
I | 49 | 4.3% |
n | 44 | 3.9% |
s | 42 | 3.7% |
Other values (41) | 497 |
Common
Value | Count | Frequency (%) |
2963 | ||
0 | 237 | 5.4% |
- | 191 | 4.4% |
2 | 182 | 4.2% |
1 | 146 | 3.3% |
> | 60 | 1.4% |
< | 60 | 1.4% |
, | 59 | 1.3% |
5 | 41 | 0.9% |
' | 38 | 0.9% |
Other values (26) | 406 | 9.3% |
Han
Value | Count | Frequency (%) |
展 | 5 | |
和 | 2 | 16.7% |
共 | 1 | 8.3% |
感 | 1 | 8.3% |
社 | 1 | 8.3% |
人 | 1 | 8.3% |
美 | 1 | 8.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 11812 | |
ASCII | 5409 | |
None | 79 | 0.5% |
Punctuation | 33 | 0.2% |
CJK | 12 | 0.1% |
Compat Jamo | 6 | < 0.1% |
Number Forms | 4 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2963 | ||
0 | 237 | 4.4% |
- | 191 | 3.5% |
2 | 182 | 3.4% |
1 | 146 | 2.7% |
e | 113 | 2.1% |
o | 80 | 1.5% |
a | 72 | 1.3% |
K | 66 | 1.2% |
F | 62 | 1.1% |
Other values (66) | 1297 |
Hangul
Value | Count | Frequency (%) |
국 | 408 | 3.5% |
한 | 402 | 3.4% |
화 | 335 | 2.8% |
사 | 255 | 2.2% |
전 | 245 | 2.1% |
아 | 212 | 1.8% |
회 | 210 | 1.8% |
교 | 202 | 1.7% |
문 | 196 | 1.7% |
의 | 176 | 1.5% |
Other values (545) | 9171 |
None
Value | Count | Frequency (%) |
《 | 30 | |
》 | 30 | |
」 | 7 | 8.9% |
「 | 7 | 8.9% |
· | 5 | 6.3% |
Punctuation
Value | Count | Frequency (%) |
“ | 10 | |
” | 9 | |
‘ | 7 | |
’ | 7 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 6 |
CJK
Value | Count | Frequency (%) |
展 | 5 | |
和 | 2 | 16.7% |
共 | 1 | 8.3% |
感 | 1 | 8.3% |
社 | 1 | 8.3% |
人 | 1 | 8.3% |
美 | 1 | 8.3% |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 3 | |
Ⅲ | 1 | 25.0% |
사업국가
Text
Distinct | 76 |
---|---|
Distinct (%) | 7.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.8 KiB |
Value | Count | Frequency (%) |
대한민국 | 517 | |
다국가 | 207 | |
이탈리아 | 16 | 1.6% |
브라질 | 11 | 1.1% |
독일 | 10 | 1.0% |
멕시코 | 9 | 0.9% |
체코 | 8 | 0.8% |
인도 | 8 | 0.8% |
러시아 | 7 | 0.7% |
폴란드 | 7 | 0.7% |
Other values (68) | 181 | 18.5% |
Most occurring characters
Value | Count | Frequency (%) |
국 | 746 | |
대 | 518 | |
민 | 517 | |
한 | 517 | |
가 | 222 | 6.3% |
다 | 210 | 5.9% |
아 | 63 | 1.8% |
리 | 43 | 1.2% |
이 | 40 | 1.1% |
스 | 35 | 1.0% |
Other values (110) | 640 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3549 | |
Space Separator | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 746 | |
대 | 518 | |
민 | 517 | |
한 | 517 | |
가 | 222 | 6.3% |
다 | 210 | 5.9% |
아 | 63 | 1.8% |
리 | 43 | 1.2% |
이 | 40 | 1.1% |
스 | 35 | 1.0% |
Other values (109) | 638 |
Space Separator
Value | Count | Frequency (%) |
2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3549 | |
Common | 2 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 746 | |
대 | 518 | |
민 | 517 | |
한 | 517 | |
가 | 222 | 6.3% |
다 | 210 | 5.9% |
아 | 63 | 1.8% |
리 | 43 | 1.2% |
이 | 40 | 1.1% |
스 | 35 | 1.0% |
Other values (109) | 638 |
Common
Value | Count | Frequency (%) |
2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3549 | |
ASCII | 2 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
국 | 746 | |
대 | 518 | |
민 | 517 | |
한 | 517 | |
가 | 222 | 6.3% |
다 | 210 | 5.9% |
아 | 63 | 1.8% |
리 | 43 | 1.2% |
이 | 40 | 1.1% |
스 | 35 | 1.0% |
Other values (109) | 638 |
ASCII
Value | Count | Frequency (%) |
2 |
사업연도 | 사업유형 | 사업분류 | 사업국가 | |
---|---|---|---|---|
사업연도 | 1.000 | 0.363 | 0.431 | 0.582 |
사업유형 | 0.363 | 1.000 | 0.060 | 0.247 |
사업분류 | 0.431 | 0.060 | 1.000 | 0.135 |
사업국가 | 0.582 | 0.247 | 0.135 | 1.000 |
사업유형 | 사업분류 | |
---|---|---|
사업유형 | 1.000 | 0.099 |
사업분류 | 0.099 | 1.000 |
사업연도 | 사업유형 | 사업분류 | |
---|---|---|---|
사업연도 | 1.000 | 0.278 | 0.285 |
사업유형 | 0.278 | 1.000 | 0.099 |
사업분류 | 0.285 | 0.099 | 1.000 |
사업연도 | 사업유형 | 사업분류 | 프로젝트명 | 사업국가 | |
---|---|---|---|---|---|
0 | 2023 | 단년 | 세계문화교류 | 전략적문화교류증진사업 | 몽골 |
1 | 2023 | 단년 | 세계문화교류 | 체험관 K-컬처 전시 | 글로벌 |
2 | 2023 | 단년 | 세계문화교류 | <한글 헬베티카 서밋> | 스위스 |
3 | 2023 | 단년 | 세계문화교류 | 2023 코리아워크숍 | 대한민국 |
4 | 2023 | 단년 | 세계문화교류 | <모두의 어떤 차이> | 캐나다 |
5 | 2023 | 단년 | 세계문화교류 | <모두의 어떤 차이> | 캐나다 |
6 | 2023 | 단년 | 세계문화교류 | 체험관 개관전 <창백한 푸른 점> | 대한민국 |
7 | 2023 | 단년 | 세계문화교류 | 포르투갈-마법으로 지은 찰나 | 포르투갈 |
8 | 2023 | 단년 | 세계문화교류 | 태평양도서국 대상 전시 | 다국가 |
9 | 2023 | 단년 | 세계문화교류 | 런웨이 싱가포르 서울 순회전 | 싱가포르 |
사업연도 | 사업유형 | 사업분류 | 프로젝트명 | 사업국가 | |
---|---|---|---|---|---|
969 | 1994 | 단년 | 전략지역 문화예술행사 개최 | 한국문화 공개강좌 | 대한민국 |
970 | 1993 | 단년 | 세계문화교류 | 대전 Expo 1993 국제민속축제 | 다국가 |
971 | 1993 | 단년 | 전략지역 문화예술행사 개최 | 한국문화소개 프로그램 | 대한민국 |
972 | 1993 | 단년 | 전략지역 문화예술행사 개최 | 한,베 수교 1주년 기념 창작&전통공연 | 다국가 |
973 | 1992 | 단년 | 세계문화교류 | 포르투갈 포스터전 지원 | 포르투갈 |
974 | 1992 | 단년 | 세계문화교류 | 호주현대미술전 개최 | 호주 |
975 | 1992 | 단년 | 세계문화교류 | 우스이 다이칸 사진전 "세계의 얼굴들" | 일본 |
976 | 1992 | 단년 | 전략지역 문화예술행사 개최 | 전통예술단 미국 순회공연 | 대한민국 |
977 | 1992 | 단년 | 전략지역 문화예술행사 개최 | 한국문화 공개 강좌 | 대한민국 |
978 | 1992 | 단년 | 전략지역 문화예술행사 개최 | 전통예술단 남미 순회공연전통예술단 남미 순회공연 | 대한민국 |
Most frequently occurring
사업연도 | 사업유형 | 사업분류 | 프로젝트명 | 사업국가 | # duplicates | |
---|---|---|---|---|---|---|
7 | 2010 | 단년 | 전략지역 문화예술행사 개최 | 재외 예술인 참여 문화행사 | 대한민국 | 14 |
6 | 2010 | 단년 | 전략지역 문화예술행사 개최 | 재외 예술인 참여 문화행사 | 다국가 | 7 |
2 | 2006 | 단년 | 세계문화교류 | 아린(AHRIN) 월례포럼 | 대한민국 | 5 |
8 | 2010 | 단년 | 전략지역 문화예술행사 개최 | 재외 예술인 참여 문화행사 | 대한민국 | 4 |
9 | 2010 | 단년 | 전략지역 문화예술행사 개최 | 재외 예술인 활용 문화행사 | 다국가 | 3 |
0 | 2004 | 단년 | 전략지역 문화예술행사 개최 | 한국예술단 아시아 순회공연 | 대한민국 | 2 |
1 | 2005 | 단년 | 세계문화교류 | 아린(AHRIN) 월례포럼 | 대한민국 | 2 |
3 | 2006 | 단년 | 세계문화교류 | 음악은 나의 인생 | 다국가 | 2 |
4 | 2007 | 단년 | 전략지역 문화예술행사 개최 | 중국 Team Korea Project 행사 | 대한민국 | 2 |
5 | 2009 | 단년 | 전략지역 문화예술행사 개최 | 재외 예술인 활용 문화행사 | 대한민국 | 2 |