Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 174 |
Missing cells | 116 |
Missing cells (%) | 7.4% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.6% |
Total size in memory | 13.4 KiB |
Average record size in memory | 78.8 B |
Variable types
Text | 1 |
---|---|
Numeric | 3 |
Categorical | 5 |
Dataset
Description | 2014-2019년 문예진흥기금 공모사업 중 공연예술 분야 "올해의 신작" 지원 사업의 일자리 창출 성과(예: 고용유형, 고용기간, 고용인원 등) |
---|---|
Author | 한국문화예술위원회 |
URL | https://www.data.go.kr/data/15076409/fileData.do |
Dataset has 1 (0.6%) duplicate rows | Duplicates |
고용유형 is highly overall correlated with 고용기간_주 and 2 other fields | High correlation |
고용기간_주 is highly overall correlated with 고용유형 | High correlation |
고용기간_월 is highly overall correlated with 고용유형 | High correlation |
고용대상 is highly overall correlated with 고용유형 | High correlation |
고용기간_시간 is highly imbalanced (53.0%) | Imbalance |
고용기간_일 has 58 (33.3%) missing values | Missing |
고용인원(명) has 58 (33.3%) missing values | Missing |
고용기간_일 has 95 (54.6%) zeros | Zeros |
고용인원(명) has 44 (25.3%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 20:10:09.736233 |
---|---|
Analysis finished | 2023-12-12 20:10:11.967591 |
Duration | 2.23 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
공연단체명
Text
Distinct | 106 |
---|---|
Distinct (%) | 60.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Value | Count | Frequency (%) |
이**단 | 9 | 5.2% |
단**험 | 7 | 4.0% |
앤**스 | 7 | 4.0% |
스**n | 6 | 3.4% |
로**인 | 6 | 3.4% |
애**순 | 6 | 3.4% |
빈**스 | 5 | 2.9% |
은**단 | 5 | 2.9% |
페**크 | 4 | 2.3% |
블**티 | 3 | 1.7% |
Other values (96) | 116 |
Most occurring characters
Value | Count | Frequency (%) |
* | 522 | |
단 | 65 | 7.5% |
스 | 22 | 2.5% |
이 | 14 | 1.6% |
니 | 8 | 0.9% |
페 | 8 | 0.9% |
앤 | 7 | 0.8% |
험 | 7 | 0.8% |
인 | 7 | 0.8% |
n | 6 | 0.7% |
Other values (110) | 204 | 23.4% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 523 | |
Other Letter | 316 | |
Lowercase Letter | 18 | 2.1% |
Uppercase Letter | 12 | 1.4% |
Decimal Number | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
단 | 65 | 20.6% |
스 | 22 | 7.0% |
이 | 14 | 4.4% |
니 | 8 | 2.5% |
페 | 8 | 2.5% |
앤 | 7 | 2.2% |
험 | 7 | 2.2% |
인 | 7 | 2.2% |
로 | 6 | 1.9% |
애 | 6 | 1.9% |
Other values (94) | 166 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 6 | |
o | 4 | |
y | 4 | |
i | 1 | 5.6% |
r | 1 | 5.6% |
t | 1 | 5.6% |
a | 1 | 5.6% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 5 | |
D | 2 | 16.7% |
S | 2 | 16.7% |
P | 1 | 8.3% |
R | 1 | 8.3% |
J | 1 | 8.3% |
Other Punctuation
Value | Count | Frequency (%) |
* | 522 | |
! | 1 | 0.2% |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 524 | |
Hangul | 316 | |
Latin | 30 | 3.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
단 | 65 | 20.6% |
스 | 22 | 7.0% |
이 | 14 | 4.4% |
니 | 8 | 2.5% |
페 | 8 | 2.5% |
앤 | 7 | 2.2% |
험 | 7 | 2.2% |
인 | 7 | 2.2% |
로 | 6 | 1.9% |
애 | 6 | 1.9% |
Other values (94) | 166 |
Latin
Value | Count | Frequency (%) |
n | 6 | |
C | 5 | |
o | 4 | |
y | 4 | |
D | 2 | 6.7% |
S | 2 | 6.7% |
P | 1 | 3.3% |
i | 1 | 3.3% |
r | 1 | 3.3% |
R | 1 | 3.3% |
Other values (3) | 3 |
Common
Value | Count | Frequency (%) |
* | 522 | |
1 | 1 | 0.2% |
! | 1 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 554 | |
Hangul | 316 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 522 | |
n | 6 | 1.1% |
C | 5 | 0.9% |
o | 4 | 0.7% |
y | 4 | 0.7% |
D | 2 | 0.4% |
S | 2 | 0.4% |
1 | 1 | 0.2% |
P | 1 | 0.2% |
i | 1 | 0.2% |
Other values (6) | 6 | 1.1% |
Hangul
Value | Count | Frequency (%) |
단 | 65 | 20.6% |
스 | 22 | 7.0% |
이 | 14 | 4.4% |
니 | 8 | 2.5% |
페 | 8 | 2.5% |
앤 | 7 | 2.2% |
험 | 7 | 2.2% |
인 | 7 | 2.2% |
로 | 6 | 1.9% |
애 | 6 | 1.9% |
Other values (94) | 166 |
사업연도
Real number (ℝ)
Distinct | 6 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.9368 |
Minimum | 2014 |
---|---|
Maximum | 2019 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 2014 |
---|---|
5-th percentile | 2014 |
Q1 | 2016 |
median | 2017 |
Q3 | 2018 |
95-th percentile | 2019 |
Maximum | 2019 |
Range | 5 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.4904408 |
---|---|
Coefficient of variation (CV) | 0.00073896259 |
Kurtosis | -0.73470475 |
Mean | 2016.9368 |
Median Absolute Deviation (MAD) | 1 |
Skewness | -0.50524711 |
Sum | 350947 |
Variance | 2.2214139 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
2018 | 52 | |
2017 | 41 | |
2019 | 23 | |
2016 | 22 | |
2015 | 21 | |
2014 | 15 | 8.6% |
Value | Count | Frequency (%) |
2014 | 15 | 8.6% |
2015 | 21 | |
2016 | 22 | |
2017 | 41 | |
2018 | 52 | |
2019 | 23 |
Value | Count | Frequency (%) |
2019 | 23 | |
2018 | 52 | |
2017 | 41 | |
2016 | 22 | |
2015 | 21 | |
2014 | 15 | 8.6% |
고용유형
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
<NA> | |
---|---|
미분류 | |
1개월~12개월 | |
1일~1주 | |
1주~1개월 |
Length
Max length | 8 |
---|---|
Median length | 6 |
Mean length | 4.7241379 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 58 | |
미분류 | 44 | |
1개월~12개월 | 27 | |
1일~1주 | 21 | 12.1% |
1주~1개월 | 17 | 9.8% |
1일 이내 | 7 | 4.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 58 | |
미분류 | 44 | |
1개월~12개월 | 27 | |
1일~1주 | 21 | 11.6% |
1주~1개월 | 17 | 9.4% |
1일 | 7 | 3.9% |
이내 | 7 | 3.9% |
고용기간_시간
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
0 | |
---|---|
<NA> | |
9 | 2 |
8 | 2 |
4 | 2 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 2 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
0 | 109 | |
<NA> | 58 | |
9 | 2 | 1.1% |
8 | 2 | 1.1% |
4 | 2 | 1.1% |
7 | 1 | 0.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 109 | |
na | 58 | |
9 | 2 | 1.1% |
8 | 2 | 1.1% |
4 | 2 | 1.1% |
7 | 1 | 0.6% |
고용기간_일
Real number (ℝ)
MISSING
  ZEROS
 
Distinct | 6 |
---|---|
Distinct (%) | 5.2% |
Missing | 58 |
Missing (%) | 33.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.82758621 |
Minimum | 0 |
---|---|
Maximum | 6 |
Zeros | 95 |
Zeros (%) | 54.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 5.25 |
Maximum | 6 |
Range | 6 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 1.8522647 |
---|---|
Coefficient of variation (CV) | 2.2381532 |
Kurtosis | 2.2399704 |
Mean | 0.82758621 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.9697096 |
Sum | 96 |
Variance | 3.4308846 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 95 | |
5 | 7 | 4.0% |
6 | 6 | 3.4% |
4 | 3 | 1.7% |
3 | 3 | 1.7% |
2 | 2 | 1.1% |
(Missing) | 58 |
Value | Count | Frequency (%) |
0 | 95 | |
2 | 2 | 1.1% |
3 | 3 | 1.7% |
4 | 3 | 1.7% |
5 | 7 | 4.0% |
6 | 6 | 3.4% |
Value | Count | Frequency (%) |
6 | 6 | 3.4% |
5 | 7 | 4.0% |
4 | 3 | 1.7% |
3 | 3 | 1.7% |
2 | 2 | 1.1% |
0 | 95 |
고용기간_주
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
0 | |
---|---|
<NA> | |
2 | 8 |
3 | 7 |
4 | 2 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 2 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
0 | 99 | |
<NA> | 58 | |
2 | 8 | 4.6% |
3 | 7 | 4.0% |
4 | 2 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 99 | |
na | 58 | |
2 | 8 | 4.6% |
3 | 7 | 4.0% |
4 | 2 | 1.1% |
고용기간_월
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
0 | |
---|---|
<NA> | |
3 | |
2 | 8 |
4 | 2 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 2 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
0 | 89 | |
<NA> | 58 | |
3 | 17 | 9.8% |
2 | 8 | 4.6% |
4 | 2 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 89 | |
na | 58 | |
3 | 17 | 9.8% |
2 | 8 | 4.6% |
4 | 2 | 1.1% |
고용인원(명)
Real number (ℝ)
MISSING
  ZEROS
 
Distinct | 22 |
---|---|
Distinct (%) | 19.0% |
Missing | 58 |
Missing (%) | 33.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.2068966 |
Minimum | 0 |
---|---|
Maximum | 30 |
Zeros | 44 |
Zeros (%) | 25.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 1 |
Q3 | 5 |
95-th percentile | 18.5 |
Maximum | 30 |
Range | 30 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 6.6679209 |
---|---|
Coefficient of variation (CV) | 1.5849976 |
Kurtosis | 3.4613659 |
Mean | 4.2068966 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 2.0006082 |
Sum | 488 |
Variance | 44.461169 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 44 | |
1 | 21 | 12.1% |
2 | 9 | 5.2% |
4 | 6 | 3.4% |
3 | 6 | 3.4% |
5 | 5 | 2.9% |
10 | 3 | 1.7% |
15 | 2 | 1.1% |
20 | 2 | 1.1% |
25 | 2 | 1.1% |
Other values (12) | 16 | 9.2% |
(Missing) | 58 |
Value | Count | Frequency (%) |
0 | 44 | |
1 | 21 | |
2 | 9 | 5.2% |
3 | 6 | 3.4% |
4 | 6 | 3.4% |
5 | 5 | 2.9% |
6 | 2 | 1.1% |
8 | 1 | 0.6% |
9 | 1 | 0.6% |
10 | 3 | 1.7% |
Value | Count | Frequency (%) |
30 | 1 | |
27 | 1 | |
25 | 2 | |
20 | 2 | |
18 | 1 | |
17 | 2 | |
16 | 2 | |
15 | 2 | |
14 | 1 | |
13 | 1 |
고용대상
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 2.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
<NA> | |
---|---|
미분류 | |
일반 | |
청년 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.9195402 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 58 | |
미분류 | 44 | |
일반 | 40 | |
청년 | 32 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 58 | |
미분류 | 44 | |
일반 | 40 | |
청년 | 32 |
사업연도 | 고용유형 | 고용기간_시간 | 고용기간_일 | 고용기간_주 | 고용기간_월 | 고용인원(명) | 고용대상 | |
---|---|---|---|---|---|---|---|---|
사업연도 | 1.000 | 0.388 | 0.125 | 0.000 | 0.212 | 0.164 | 0.363 | 0.672 |
고용유형 | 0.388 | 1.000 | 0.840 | 0.605 | 0.628 | 0.628 | 0.496 | 0.723 |
고용기간_시간 | 0.125 | 0.840 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.150 |
고용기간_일 | 0.000 | 0.605 | 0.000 | 1.000 | 0.000 | 0.000 | 0.346 | 0.482 |
고용기간_주 | 0.212 | 0.628 | 0.000 | 0.000 | 1.000 | 0.000 | 0.066 | 0.199 |
고용기간_월 | 0.164 | 0.628 | 0.000 | 0.000 | 0.000 | 1.000 | 0.385 | 0.278 |
고용인원(명) | 0.363 | 0.496 | 0.000 | 0.346 | 0.066 | 0.385 | 1.000 | 0.698 |
고용대상 | 0.672 | 0.723 | 0.150 | 0.482 | 0.199 | 0.278 | 0.698 | 1.000 |
고용대상 | 고용기간_월 | 고용기간_주 | 고용기간_시간 | 고용유형 | |
---|---|---|---|---|---|
고용대상 | 1.000 | 0.264 | 0.187 | 0.111 | 0.707 |
고용기간_월 | 0.264 | 1.000 | 0.000 | 0.000 | 0.554 |
고용기간_주 | 0.187 | 0.000 | 1.000 | 0.000 | 0.554 |
고용기간_시간 | 0.111 | 0.000 | 0.000 | 1.000 | 0.472 |
고용유형 | 0.707 | 0.554 | 0.554 | 0.472 | 1.000 |
사업연도 | 고용기간_일 | 고용인원(명) | 고용유형 | 고용기간_시간 | 고용기간_주 | 고용기간_월 | 고용대상 | |
---|---|---|---|---|---|---|---|---|
사업연도 | 1.000 | -0.075 | -0.163 | 0.315 | 0.092 | 0.201 | 0.154 | 0.330 |
고용기간_일 | -0.075 | 1.000 | 0.329 | 0.463 | 0.000 | 0.000 | 0.000 | 0.223 |
고용인원(명) | -0.163 | 0.329 | 1.000 | 0.308 | 0.000 | 0.000 | 0.325 | 0.331 |
고용유형 | 0.315 | 0.463 | 0.308 | 1.000 | 0.472 | 0.554 | 0.554 | 0.707 |
고용기간_시간 | 0.092 | 0.000 | 0.000 | 0.472 | 1.000 | 0.000 | 0.000 | 0.111 |
고용기간_주 | 0.201 | 0.000 | 0.000 | 0.554 | 0.000 | 1.000 | 0.000 | 0.187 |
고용기간_월 | 0.154 | 0.000 | 0.325 | 0.554 | 0.000 | 0.000 | 1.000 | 0.264 |
고용대상 | 0.330 | 0.223 | 0.331 | 0.707 | 0.111 | 0.187 | 0.264 | 1.000 |
공연단체명 | 사업연도 | 고용유형 | 고용기간_시간 | 고용기간_일 | 고용기간_주 | 고용기간_월 | 고용인원(명) | 고용대상 | |
---|---|---|---|---|---|---|---|---|---|
0 | *나**단 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | *경**단 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
2 | *러**단 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | *울**터 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | *선**단 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | *스**창 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | *경**영 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | *o**r | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | *이**쳐 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | *능**부 | 2014 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
공연단체명 | 사업연도 | 고용유형 | 고용기간_시간 | 고용기간_일 | 고용기간_주 | 고용기간_월 | 고용인원(명) | 고용대상 | |
---|---|---|---|---|---|---|---|---|---|
164 | *정**옥 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
165 | *단**수 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
166 | *단**고 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
167 | *금**스 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
168 | *처**인 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
169 | *단**리 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
170 | *이**트 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
171 | *컴**니 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
172 | *단**희 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
173 | *단**자 | 2019 | 미분류 | 0 | 0 | 0 | 0 | 0 | 미분류 |
Most frequently occurring
공연단체명 | 사업연도 | 고용유형 | 고용기간_시간 | 고용기간_일 | 고용기간_주 | 고용기간_월 | 고용인원(명) | 고용대상 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|
0 | *이**단 | 2017 | 1일~1주 | 0 | 4 | 0 | 0 | 1 | 일반 | 2 |