Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 188 |
Missing cells | 12 |
Missing cells (%) | 0.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 10.6 KiB |
Average record size in memory | 57.7 B |
Variable types
Text | 4 |
---|---|
Categorical | 2 |
Numeric | 1 |
Dataset
Description | 국립중앙극장 공연예술자료 분류유형에 대한 데이터로 코드번호, 코드명, 코드전체명, 최상위코드명, 레벨 등의 정보를 제공합니다. |
---|---|
Author | 문화체육관광부 국립중앙극장 |
URL | https://www.data.go.kr/data/15090167/fileData.do |
Reproduction
Analysis started | 2023-12-12 13:43:45.275453 |
---|---|
Analysis finished | 2023-12-12 13:43:45.958410 |
Duration | 0.68 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
코드번호
Text
UNIQUE
 
Distinct | 188 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
Value | Count | Frequency (%) |
root | 1 | 0.5% |
ms0103 | 1 | 0.5% |
ms010303 | 1 | 0.5% |
dn0403 | 1 | 0.5% |
dn0501 | 1 | 0.5% |
dn0502 | 1 | 0.5% |
dn0503 | 1 | 0.5% |
dn9901 | 1 | 0.5% |
dn9999 | 1 | 0.5% |
ms0101 | 1 | 0.5% |
Other values (178) | 178 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 358 | |
1 | 136 | 11.7% |
M | 110 | 9.5% |
s | 110 | 9.5% |
2 | 105 | 9.1% |
9 | 60 | 5.2% |
3 | 58 | 5.0% |
D | 38 | 3.3% |
n | 31 | 2.7% |
5 | 20 | 1.7% |
Other values (17) | 134 | 11.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 782 | |
Uppercase Letter | 191 | 16.5% |
Lowercase Letter | 187 | 16.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 358 | |
1 | 136 | 17.4% |
2 | 105 | 13.4% |
9 | 60 | 7.7% |
3 | 58 | 7.4% |
5 | 20 | 2.6% |
6 | 18 | 2.3% |
4 | 16 | 2.0% |
7 | 6 | 0.8% |
8 | 5 | 0.6% |
Uppercase Letter
Value | Count | Frequency (%) |
M | 110 | |
D | 38 | 19.9% |
E | 15 | 7.9% |
P | 14 | 7.3% |
G | 5 | 2.6% |
S | 5 | 2.6% |
O | 2 | 1.0% |
T | 1 | 0.5% |
R | 1 | 0.5% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 110 | |
n | 31 | 16.6% |
l | 14 | 7.5% |
r | 11 | 5.9% |
h | 9 | 4.8% |
d | 8 | 4.3% |
v | 3 | 1.6% |
o | 1 | 0.5% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 782 | |
Latin | 378 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
M | 110 | |
s | 110 | |
D | 38 | 10.1% |
n | 31 | 8.2% |
E | 15 | 4.0% |
P | 14 | 3.7% |
l | 14 | 3.7% |
r | 11 | 2.9% |
h | 9 | 2.4% |
d | 8 | 2.1% |
Other values (7) | 18 | 4.8% |
Common
Value | Count | Frequency (%) |
0 | 358 | |
1 | 136 | 17.4% |
2 | 105 | 13.4% |
9 | 60 | 7.7% |
3 | 58 | 7.4% |
5 | 20 | 2.6% |
6 | 18 | 2.3% |
4 | 16 | 2.0% |
7 | 6 | 0.8% |
8 | 5 | 0.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1160 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 358 | |
1 | 136 | 11.7% |
M | 110 | 9.5% |
s | 110 | 9.5% |
2 | 105 | 9.1% |
9 | 60 | 5.2% |
3 | 58 | 5.0% |
D | 38 | 3.3% |
n | 31 | 2.7% |
5 | 20 | 1.7% |
Other values (17) | 134 | 11.6% |
코드명
Text
Distinct | 151 |
---|---|
Distinct (%) | 80.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
Value | Count | Frequency (%) |
기타 | 21 | 11.1% |
종합 | 5 | 2.6% |
듀엣 | 3 | 1.6% |
트리오 | 3 | 1.6% |
4중창 | 3 | 1.6% |
관악기 | 2 | 1.1% |
피아노 | 2 | 1.1% |
4중주 | 2 | 1.1% |
건반악기 | 2 | 1.1% |
타악기 | 2 | 1.1% |
Other values (141) | 145 |
Most occurring characters
Value | Count | Frequency (%) |
기 | 34 | 6.0% |
악 | 33 | 5.9% |
타 | 24 | 4.3% |
합 | 20 | 3.6% |
창 | 19 | 3.4% |
무 | 18 | 3.2% |
중 | 15 | 2.7% |
성 | 12 | 2.1% |
용 | 12 | 2.1% |
종 | 12 | 2.1% |
Other values (152) | 364 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 554 | |
Decimal Number | 5 | 0.9% |
Space Separator | 2 | 0.4% |
Open Punctuation | 1 | 0.2% |
Close Punctuation | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 34 | 6.1% |
악 | 33 | 6.0% |
타 | 24 | 4.3% |
합 | 20 | 3.6% |
창 | 19 | 3.4% |
무 | 18 | 3.2% |
중 | 15 | 2.7% |
성 | 12 | 2.2% |
용 | 12 | 2.2% |
종 | 12 | 2.2% |
Other values (148) | 355 |
Decimal Number
Value | Count | Frequency (%) |
4 | 5 |
Space Separator
Value | Count | Frequency (%) |
2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 554 | |
Common | 9 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 34 | 6.1% |
악 | 33 | 6.0% |
타 | 24 | 4.3% |
합 | 20 | 3.6% |
창 | 19 | 3.4% |
무 | 18 | 3.2% |
중 | 15 | 2.7% |
성 | 12 | 2.2% |
용 | 12 | 2.2% |
종 | 12 | 2.2% |
Other values (148) | 355 |
Common
Value | Count | Frequency (%) |
4 | 5 | |
2 | 22.2% | |
( | 1 | 11.1% |
) | 1 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 554 | |
ASCII | 9 | 1.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
기 | 34 | 6.1% |
악 | 33 | 6.0% |
타 | 24 | 4.3% |
합 | 20 | 3.6% |
창 | 19 | 3.4% |
무 | 18 | 3.2% |
중 | 15 | 2.7% |
성 | 12 | 2.2% |
용 | 12 | 2.2% |
종 | 12 | 2.2% |
Other values (148) | 355 |
ASCII
Value | Count | Frequency (%) |
4 | 5 | |
2 | 22.2% | |
( | 1 | 11.1% |
) | 1 | 11.1% |
코드전체명
Text
Distinct | 187 |
---|---|
Distinct (%) | 100.0% |
Missing | 1 |
Missing (%) | 0.5% |
Memory size | 1.6 KiB |
Value | Count | Frequency (%) |
음악 | 110 | 19.0% |
서양성악 | 31 | 5.3% |
기타 | 31 | 5.3% |
무용 | 26 | 4.5% |
서양기악 | 24 | 4.1% |
중창 | 16 | 2.8% |
연희 | 14 | 2.4% |
한국기악 | 12 | 2.1% |
한국무용 | 12 | 2.1% |
연극 | 11 | 1.9% |
Other values (140) | 293 |
Most occurring characters
Value | Count | Frequency (%) |
393 | ||
악 | 241 | 11.7% |
음 | 137 | 6.7% |
기 | 86 | 4.2% |
성 | 69 | 3.4% |
무 | 68 | 3.3% |
창 | 66 | 3.2% |
중 | 65 | 3.2% |
용 | 62 | 3.0% |
서 | 60 | 2.9% |
Other values (150) | 807 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1654 | |
Space Separator | 393 | 19.1% |
Decimal Number | 5 | 0.2% |
Close Punctuation | 1 | < 0.1% |
Open Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
악 | 241 | 14.6% |
음 | 137 | 8.3% |
기 | 86 | 5.2% |
성 | 69 | 4.2% |
무 | 68 | 4.1% |
창 | 66 | 4.0% |
중 | 65 | 3.9% |
용 | 62 | 3.7% |
서 | 60 | 3.6% |
양 | 59 | 3.6% |
Other values (146) | 741 |
Space Separator
Value | Count | Frequency (%) |
393 |
Decimal Number
Value | Count | Frequency (%) |
4 | 5 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1654 | |
Common | 400 | 19.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
악 | 241 | 14.6% |
음 | 137 | 8.3% |
기 | 86 | 5.2% |
성 | 69 | 4.2% |
무 | 68 | 4.1% |
창 | 66 | 4.0% |
중 | 65 | 3.9% |
용 | 62 | 3.7% |
서 | 60 | 3.6% |
양 | 59 | 3.6% |
Other values (146) | 741 |
Common
Value | Count | Frequency (%) |
393 | ||
4 | 5 | 1.2% |
) | 1 | 0.2% |
( | 1 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1654 | |
ASCII | 400 | 19.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
393 | ||
4 | 5 | 1.2% |
) | 1 | 0.2% |
( | 1 | 0.2% |
Hangul
Value | Count | Frequency (%) |
악 | 241 | 14.6% |
음 | 137 | 8.3% |
기 | 86 | 5.2% |
성 | 69 | 4.2% |
무 | 68 | 4.1% |
창 | 66 | 4.0% |
중 | 65 | 3.9% |
용 | 62 | 3.7% |
서 | 60 | 3.6% |
양 | 59 | 3.6% |
Other values (146) | 741 |
최상위코드명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 5.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
음악 | |
---|---|
무용 | |
연희 | |
연극 | 11 |
교육 | 8 |
Other values (6) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0638298 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.1% |
Sample
1st row | <NA> |
---|---|
2nd row | 무용 |
3rd row | 음악 |
4th row | 연희 |
5th row | 기증 |
Common Values
Value | Count | Frequency (%) |
음악 | 110 | |
무용 | 26 | 13.8% |
연희 | 14 | 7.4% |
연극 | 11 | 5.9% |
교육 | 8 | 4.3% |
기타 | 5 | 2.7% |
공연일반 | 5 | 2.7% |
전시 | 4 | 2.1% |
행사 | 3 | 1.6% |
<NA> | 1 | 0.5% |
Length
Value | Count | Frequency (%) |
음악 | 110 | |
무용 | 26 | 13.8% |
연희 | 14 | 7.4% |
연극 | 11 | 5.9% |
교육 | 8 | 4.3% |
기타 | 5 | 2.7% |
공연일반 | 5 | 2.7% |
전시 | 4 | 2.1% |
행사 | 3 | 1.6% |
na | 1 | 0.5% |
최상위코드
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 5.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
Ms | |
---|---|
Dn | |
Pl | |
Dr | 11 |
Ed | 8 |
Other values (6) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0106383 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.1% |
Sample
1st row | <NA> |
---|---|
2nd row | Dn |
3rd row | Ms |
4th row | Pl |
5th row | Do |
Common Values
Value | Count | Frequency (%) |
Ms | 110 | |
Dn | 26 | 13.8% |
Pl | 14 | 7.4% |
Dr | 11 | 5.9% |
Ed | 8 | 4.3% |
Gn | 5 | 2.7% |
Sh | 5 | 2.7% |
Eh | 4 | 2.1% |
Ev | 3 | 1.6% |
<NA> | 1 | 0.5% |
Length
Value | Count | Frequency (%) |
ms | 110 | |
dn | 26 | 13.8% |
pl | 14 | 7.4% |
dr | 11 | 5.9% |
ed | 8 | 4.3% |
gn | 5 | 2.7% |
sh | 5 | 2.7% |
eh | 4 | 2.1% |
ev | 3 | 1.6% |
na | 1 | 0.5% |
차상위전체코드명
Text
MISSING
 
Distinct | 52 |
---|---|
Distinct (%) | 29.4% |
Missing | 11 |
Missing (%) | 5.9% |
Memory size | 1.6 KiB |
Value | Count | Frequency (%) |
음악 | 109 | |
서양음악 | 30 | 7.7% |
무용 | 25 | 6.4% |
서양기악 | 23 | 5.9% |
중창 | 15 | 3.8% |
연희 | 13 | 3.3% |
한국기악 | 11 | 2.8% |
한국무용 | 11 | 2.8% |
기타 | 10 | 2.6% |
연극 | 10 | 2.6% |
Other values (35) | 134 |
Most occurring characters
Value | Count | Frequency (%) |
214 | ||
악 | 208 | |
음 | 157 | |
양 | 55 | 4.2% |
서 | 55 | 4.2% |
기 | 52 | 3.9% |
무 | 50 | 3.8% |
용 | 50 | 3.8% |
중 | 50 | 3.8% |
창 | 47 | 3.6% |
Other values (37) | 380 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1104 | |
Space Separator | 214 | 16.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
악 | 208 | |
음 | 157 | |
양 | 55 | 5.0% |
서 | 55 | 5.0% |
기 | 52 | 4.7% |
무 | 50 | 4.5% |
용 | 50 | 4.5% |
중 | 50 | 4.5% |
창 | 47 | 4.3% |
연 | 37 | 3.4% |
Other values (36) | 343 |
Space Separator
Value | Count | Frequency (%) |
214 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1104 | |
Common | 214 | 16.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
악 | 208 | |
음 | 157 | |
양 | 55 | 5.0% |
서 | 55 | 5.0% |
기 | 52 | 4.7% |
무 | 50 | 4.5% |
용 | 50 | 4.5% |
중 | 50 | 4.5% |
창 | 47 | 4.3% |
연 | 37 | 3.4% |
Other values (36) | 343 |
Common
Value | Count | Frequency (%) |
214 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1104 | |
ASCII | 214 | 16.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
214 |
Hangul
Value | Count | Frequency (%) |
악 | 208 | |
음 | 157 | |
양 | 55 | 5.0% |
서 | 55 | 5.0% |
기 | 52 | 4.7% |
무 | 50 | 4.5% |
용 | 50 | 4.5% |
중 | 50 | 4.5% |
창 | 47 | 4.3% |
연 | 37 | 3.4% |
Other values (36) | 343 |
레벨
Real number (ℝ)
Distinct | 6 |
---|---|
Distinct (%) | 3.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.0744681 |
Minimum | 0 |
---|---|
Maximum | 5 |
Zeros | 1 |
Zeros (%) | 0.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.8 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 3 |
Q3 | 4 |
95-th percentile | 5 |
Maximum | 5 |
Range | 5 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.116137 |
---|---|
Coefficient of variation (CV) | 0.36303417 |
Kurtosis | -0.48633382 |
Mean | 3.0744681 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 0.13169742 |
Sum | 578 |
Variance | 1.2457617 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
3 | 70 | |
2 | 48 | |
4 | 33 | |
5 | 26 | 13.8% |
1 | 10 | 5.3% |
0 | 1 | 0.5% |
Value | Count | Frequency (%) |
0 | 1 | 0.5% |
1 | 10 | 5.3% |
2 | 48 | |
3 | 70 | |
4 | 33 | |
5 | 26 | 13.8% |
Value | Count | Frequency (%) |
5 | 26 | 13.8% |
4 | 33 | |
3 | 70 | |
2 | 48 | |
1 | 10 | 5.3% |
0 | 1 | 0.5% |
최상위코드명 | 최상위코드 | 차상위전체코드명 | 레벨 | |
---|---|---|---|---|
최상위코드명 | 1.000 | 1.000 | 1.000 | 0.685 |
최상위코드 | 1.000 | 1.000 | 1.000 | 0.685 |
차상위전체코드명 | 1.000 | 1.000 | 1.000 | 1.000 |
레벨 | 0.685 | 0.685 | 1.000 | 1.000 |
최상위코드 | 최상위코드명 | |
---|---|---|
최상위코드 | 1.000 | 1.000 |
최상위코드명 | 1.000 | 1.000 |
레벨 | 최상위코드명 | 최상위코드 | |
---|---|---|---|
레벨 | 1.000 | 0.347 | 0.347 |
최상위코드명 | 0.347 | 1.000 | 1.000 |
최상위코드 | 0.347 | 1.000 | 1.000 |
코드번호 | 코드명 | 코드전체명 | 최상위코드명 | 최상위코드 | 차상위전체코드명 | 레벨 | |
---|---|---|---|---|---|---|---|
0 | ROOT | 분류체계 | <NA> | <NA> | <NA> | <NA> | 0 |
1 | Dn | 무용 | 무용 | 무용 | Dn | <NA> | 1 |
2 | Ms | 음악 | 음악 | 음악 | Ms | <NA> | 1 |
3 | Pl | 연희 | 연희 | 연희 | Pl | <NA> | 1 |
4 | Do | 기증 | 기증 | 기증 | Do | <NA> | 1 |
5 | Dr | 연극 | 연극 | 연극 | Dr | <NA> | 1 |
6 | Gn | 기타 | 기타 | 기타 | Gn | <NA> | 1 |
7 | Ev | 행사 | 행사 | 행사 | Ev | <NA> | 1 |
8 | Eh | 전시 | 전시 | 전시 | Eh | <NA> | 1 |
9 | Ed | 교육 | 교육 | 교육 | Ed | <NA> | 1 |
코드번호 | 코드명 | 코드전체명 | 최상위코드명 | 최상위코드 | 차상위전체코드명 | 레벨 | |
---|---|---|---|---|---|---|---|
178 | Ms02010301 | 북 | 음악 서양기악 독주 타악기 북 | 음악 | Ms | 음악 서양기악 독주 타악기 | 5 |
179 | Ms02010201 | 플롯 | 음악 서양기악 독주 관악기 플롯 | 음악 | Ms | 음악 서양기악 독주 관악기 | 5 |
180 | Ms02010101 | 바이올린 | 음악 서양기악 독주 현악기 바이올린 | 음악 | Ms | 음악 서양기악 독주 현악기 | 5 |
181 | Ms01020399 | 기타 | 음악 서양성악 중창 혼성중창 기타 | 음악 | Ms | 음악 서양음악 중창 혼성중창 | 5 |
182 | Ms01020303 | 4중창 | 음악 서양성악 중창 혼성중창 4중창 | 음악 | Ms | 음악 서양음악 중창 혼성중창 | 5 |
183 | Ms01020302 | 트리오 | 음악 서양성악 중창 혼성중창 트리오 | 음악 | Ms | 음악 서양음악 중창 혼성중창 | 5 |
184 | Ms01020301 | 듀엣 | 음악 서양성악 중창 혼성중창 듀엣 | 음악 | Ms | 음악 서양음악 중창 혼성중창 | 5 |
185 | Ms01020202 | 트리오 | 음악 서양성악 중창 여성중창 트리오 | 음악 | Ms | 음악 서양음악 중창 여성중창 | 5 |
186 | Ms01020203 | 4중창 | 음악 서양성악 중창 여성중창 4중창 | 음악 | Ms | 음악 서양음악 중창 여성중창 | 5 |
187 | Ms01020299 | 기타 | 음악 서양성악 중창 여성중창 기타 | 음악 | Ms | 음악 서양음악 중창 여성중창 | 5 |