Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 1374 |
Missing cells | 509 |
Missing cells (%) | 7.4% |
Duplicate rows | 14 |
Duplicate rows (%) | 1.0% |
Total size in memory | 55.1 KiB |
Average record size in memory | 41.1 B |
Variable types
Text | 3 |
---|---|
Categorical | 2 |
Dataset
Description | 국립중앙극장 관련된 공연 기획을 하기 위한 기획 협력 업체들의 정보에 대한 데이터로 960여건의 데이터를 제공합니다. |
---|---|
Author | 문화체육관광부 국립중앙극장 |
URL | https://www.data.go.kr/data/15090292/fileData.do |
Reproduction
Analysis started | 2023-12-12 21:13:33.784338 |
---|---|
Analysis finished | 2023-12-12 21:13:34.508020 |
Duration | 0.72 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
조직명
Text
Distinct | 1342 |
---|---|
Distinct (%) | 97.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.9 KiB |
Length
Max length | 31 |
---|---|
Median length | 22 |
Mean length | 7.636099 |
Min length | 2 |
Characters and Unicode
Total characters | 10492 |
---|---|
Distinct characters | 605 |
Distinct categories | 15 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 1310 ? |
---|---|
Unique (%) | 95.3% |
Sample
1st row | (사) 나누리. |
---|---|
2nd row | (사) 전국문예회관연합회. |
3rd row | (사) 한국기독교문화사업단 |
4th row | (사)갈물한글서회. |
5th row | (사)고려오페라단. |
Value | Count | Frequency (%) |
사단법인 | 37 | 2.2% |
극단 | 30 | 1.8% |
주식회사 | 25 | 1.5% |
무용단 | 9 | 0.5% |
프로젝트 | 5 | 0.3% |
컴퍼니 | 4 | 0.2% |
필하모닉 | 4 | 0.2% |
art | 4 | 0.2% |
오케스트라 | 4 | 0.2% |
4 | 0.2% | |
Other values (1489) | 1571 |
Most occurring characters
Value | Count | Frequency (%) |
. | 714 | 6.8% |
325 | 3.1% | |
) | 270 | 2.6% |
( | 262 | 2.5% |
단 | 240 | 2.3% |
사 | 202 | 1.9% |
이 | 190 | 1.8% |
주 | 183 | 1.7% |
회 | 175 | 1.7% |
아 | 173 | 1.6% |
Other values (595) | 7758 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8347 | |
Other Punctuation | 728 | 6.9% |
Space Separator | 325 | 3.1% |
Uppercase Letter | 283 | 2.7% |
Close Punctuation | 271 | 2.6% |
Open Punctuation | 263 | 2.5% |
Lowercase Letter | 214 | 2.0% |
Decimal Number | 33 | 0.3% |
Other Symbol | 16 | 0.2% |
Dash Punctuation | 4 | < 0.1% |
Other values (5) | 8 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
단 | 240 | 2.9% |
사 | 202 | 2.4% |
이 | 190 | 2.3% |
주 | 183 | 2.2% |
회 | 175 | 2.1% |
아 | 173 | 2.1% |
국 | 160 | 1.9% |
스 | 154 | 1.8% |
트 | 150 | 1.8% |
한 | 138 | 1.7% |
Other values (521) | 6582 |
Uppercase Letter
Value | Count | Frequency (%) |
M | 26 | 9.2% |
S | 23 | 8.1% |
T | 20 | 7.1% |
A | 19 | 6.7% |
C | 19 | 6.7% |
O | 18 | 6.4% |
E | 16 | 5.7% |
R | 15 | 5.3% |
N | 15 | 5.3% |
I | 13 | 4.6% |
Other values (14) | 99 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 23 | |
e | 22 | |
o | 19 | 8.9% |
n | 17 | 7.9% |
s | 16 | 7.5% |
u | 16 | 7.5% |
t | 16 | 7.5% |
c | 13 | 6.1% |
r | 10 | 4.7% |
m | 9 | 4.2% |
Other values (13) | 53 |
Decimal Number
Value | Count | Frequency (%) |
1 | 14 | |
2 | 4 | 12.1% |
0 | 3 | 9.1% |
4 | 3 | 9.1% |
9 | 3 | 9.1% |
5 | 2 | 6.1% |
3 | 2 | 6.1% |
6 | 1 | 3.0% |
7 | 1 | 3.0% |
Other Punctuation
Value | Count | Frequency (%) |
. | 714 | |
& | 7 | 1.0% |
, | 4 | 0.5% |
' | 2 | 0.3% |
/ | 1 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 270 | |
] | 1 | 0.4% |
Open Punctuation
Value | Count | Frequency (%) |
( | 262 | |
[ | 1 | 0.4% |
Math Symbol
Value | Count | Frequency (%) |
+ | 2 | |
= | 2 |
Space Separator
Value | Count | Frequency (%) |
325 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 16 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8358 | |
Common | 1632 | 15.6% |
Latin | 497 | 4.7% |
Han | 5 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
단 | 240 | 2.9% |
사 | 202 | 2.4% |
이 | 190 | 2.3% |
주 | 183 | 2.2% |
회 | 175 | 2.1% |
아 | 173 | 2.1% |
국 | 160 | 1.9% |
스 | 154 | 1.8% |
트 | 150 | 1.8% |
한 | 138 | 1.7% |
Other values (517) | 6593 |
Latin
Value | Count | Frequency (%) |
M | 26 | 5.2% |
a | 23 | 4.6% |
S | 23 | 4.6% |
e | 22 | 4.4% |
T | 20 | 4.0% |
o | 19 | 3.8% |
A | 19 | 3.8% |
C | 19 | 3.8% |
O | 18 | 3.6% |
n | 17 | 3.4% |
Other values (37) | 291 |
Common
Value | Count | Frequency (%) |
. | 714 | |
325 | ||
) | 270 | 16.5% |
( | 262 | 16.1% |
1 | 14 | 0.9% |
& | 7 | 0.4% |
2 | 4 | 0.2% |
, | 4 | 0.2% |
- | 4 | 0.2% |
0 | 3 | 0.2% |
Other values (16) | 25 | 1.5% |
Han
Value | Count | Frequency (%) |
丙 | 1 | |
歌 | 1 | |
團 | 1 | |
新 | 1 | |
感 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8342 | |
ASCII | 2127 | 20.3% |
None | 16 | 0.2% |
CJK | 5 | < 0.1% |
Punctuation | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
. | 714 | |
325 | ||
) | 270 | 12.7% |
( | 262 | 12.3% |
M | 26 | 1.2% |
a | 23 | 1.1% |
S | 23 | 1.1% |
e | 22 | 1.0% |
T | 20 | 0.9% |
o | 19 | 0.9% |
Other values (61) | 423 |
Hangul
Value | Count | Frequency (%) |
단 | 240 | 2.9% |
사 | 202 | 2.4% |
이 | 190 | 2.3% |
주 | 183 | 2.2% |
회 | 175 | 2.1% |
아 | 173 | 2.1% |
국 | 160 | 1.9% |
스 | 154 | 1.8% |
트 | 150 | 1.8% |
한 | 138 | 1.7% |
Other values (516) | 6577 |
None
Value | Count | Frequency (%) |
㈜ | 16 |
Punctuation
Value | Count | Frequency (%) |
‘ | 1 | |
’ | 1 |
CJK
Value | Count | Frequency (%) |
丙 | 1 | |
歌 | 1 | |
團 | 1 | |
新 | 1 | |
感 | 1 |
조직유형
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.9 KiB |
1480 | |
---|---|
10 | |
9 | |
3530 | 12 |
1481 | 5 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.1659389 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 1480 |
---|---|
2nd row | 1480 |
3rd row | 10 |
4th row | 1480 |
5th row | 1480 |
Common Values
Value | Count | Frequency (%) |
1480 | 882 | |
10 | 276 | 20.1% |
9 | 198 | 14.4% |
3530 | 12 | 0.9% |
1481 | 5 | 0.4% |
<NA> | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1480 | 882 | |
10 | 276 | 20.1% |
9 | 198 | 14.4% |
3530 | 12 | 0.9% |
1481 | 5 | 0.4% |
na | 1 | 0.1% |
우편번호
Text
MISSING
 
Distinct | 775 |
---|---|
Distinct (%) | 67.2% |
Missing | 220 |
Missing (%) | 16.0% |
Memory size | 10.9 KiB |
Value | Count | Frequency (%) |
137-070 | 65 | 5.6% |
4621 | 26 | 2.3% |
6715 | 15 | 1.3% |
137-718 | 11 | 1.0% |
135-080 | 11 | 1.0% |
137-867 | 11 | 1.0% |
137-060 | 9 | 0.8% |
135-090 | 9 | 0.8% |
111-111 | 8 | 0.7% |
135-270 | 7 | 0.6% |
Other values (765) | 982 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 1225 | |
0 | 999 | |
3 | 719 | |
- | 701 | |
7 | 621 | |
6 | 478 | 7.0% |
8 | 469 | 6.9% |
2 | 462 | 6.8% |
5 | 454 | 6.7% |
4 | 452 | 6.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 6114 | |
Dash Punctuation | 701 | 10.3% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 1225 | |
0 | 999 | |
3 | 719 | |
7 | 621 | |
6 | 478 | 7.8% |
8 | 469 | 7.7% |
2 | 462 | 7.6% |
5 | 454 | 7.4% |
4 | 452 | 7.4% |
9 | 235 | 3.8% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 701 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 6815 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 1225 | |
0 | 999 | |
3 | 719 | |
- | 701 | |
7 | 621 | |
6 | 478 | 7.0% |
8 | 469 | 6.9% |
2 | 462 | 6.8% |
5 | 454 | 6.7% |
4 | 452 | 6.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 6815 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 1225 | |
0 | 999 | |
3 | 719 | |
- | 701 | |
7 | 621 | |
6 | 478 | 7.0% |
8 | 469 | 6.9% |
2 | 462 | 6.8% |
5 | 454 | 6.7% |
4 | 452 | 6.6% |
주소 1
Text
MISSING
 
Distinct | 743 |
---|---|
Distinct (%) | 68.5% |
Missing | 289 |
Missing (%) | 21.0% |
Memory size | 10.9 KiB |
Length
Max length | 45 |
---|---|
Median length | 41 |
Mean length | 16.943779 |
Min length | 1 |
Characters and Unicode
Total characters | 18384 |
---|---|
Distinct characters | 423 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 637 ? |
---|---|
Unique (%) | 58.7% |
Sample
1st row | 서울 강남 논현2동 |
---|---|
2nd row | 서울 서초 서초3동 예술의전당 |
3rd row | 서울 강남구 청담동 11-23 (청담동) |
4th row | 서울 종로 낙원동 |
5th row | 서울시 관악구 행운동 |
Value | Count | Frequency (%) |
서울 | 841 | 18.6% |
서초 | 162 | 3.6% |
경기 | 110 | 2.4% |
서초동 | 101 | 2.2% |
강남 | 91 | 2.0% |
서초구 | 70 | 1.6% |
중구 | 69 | 1.5% |
강남구 | 61 | 1.4% |
종로 | 60 | 1.3% |
서초3동 | 52 | 1.2% |
Other values (1509) | 2893 |
Most occurring characters
Value | Count | Frequency (%) |
3426 | 18.6% | |
서 | 1381 | 7.5% |
동 | 1168 | 6.4% |
울 | 898 | 4.9% |
구 | 518 | 2.8% |
로 | 507 | 2.8% |
1 | 415 | 2.3% |
초 | 410 | 2.2% |
( | 404 | 2.2% |
) | 404 | 2.2% |
Other values (413) | 8853 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 11934 | |
Space Separator | 3426 | 18.6% |
Decimal Number | 1810 | 9.8% |
Open Punctuation | 404 | 2.2% |
Close Punctuation | 404 | 2.2% |
Other Punctuation | 259 | 1.4% |
Dash Punctuation | 101 | 0.5% |
Uppercase Letter | 39 | 0.2% |
Lowercase Letter | 4 | < 0.1% |
Math Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 1381 | 11.6% |
동 | 1168 | 9.8% |
울 | 898 | 7.5% |
구 | 518 | 4.3% |
로 | 507 | 4.2% |
초 | 410 | 3.4% |
남 | 245 | 2.1% |
강 | 207 | 1.7% |
길 | 198 | 1.7% |
대 | 181 | 1.5% |
Other values (375) | 6221 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 5 | |
E | 5 | |
M | 4 | |
T | 4 | |
G | 3 | |
A | 3 | |
W | 2 | 5.1% |
X | 2 | 5.1% |
L | 2 | 5.1% |
C | 2 | 5.1% |
Other values (7) | 7 |
Decimal Number
Value | Count | Frequency (%) |
1 | 415 | |
2 | 282 | |
3 | 261 | |
4 | 171 | |
5 | 145 | 8.0% |
0 | 137 | 7.6% |
6 | 109 | 6.0% |
7 | 106 | 5.9% |
8 | 100 | 5.5% |
9 | 84 | 4.6% |
Lowercase Letter
Value | Count | Frequency (%) |
r | 1 | |
k | 1 | |
o | 1 | |
e | 1 |
Space Separator
Value | Count | Frequency (%) |
3426 |
Open Punctuation
Value | Count | Frequency (%) |
( | 404 |
Close Punctuation
Value | Count | Frequency (%) |
) | 404 |
Other Punctuation
Value | Count | Frequency (%) |
, | 259 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 101 |
Math Symbol
Value | Count | Frequency (%) |
~ | 2 |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 11934 | |
Common | 6406 | |
Latin | 44 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 1381 | 11.6% |
동 | 1168 | 9.8% |
울 | 898 | 7.5% |
구 | 518 | 4.3% |
로 | 507 | 4.2% |
초 | 410 | 3.4% |
남 | 245 | 2.1% |
강 | 207 | 1.7% |
길 | 198 | 1.7% |
대 | 181 | 1.5% |
Other values (375) | 6221 |
Latin
Value | Count | Frequency (%) |
S | 5 | |
E | 5 | |
M | 4 | 9.1% |
T | 4 | 9.1% |
G | 3 | 6.8% |
A | 3 | 6.8% |
W | 2 | 4.5% |
X | 2 | 4.5% |
L | 2 | 4.5% |
C | 2 | 4.5% |
Other values (12) | 12 |
Common
Value | Count | Frequency (%) |
3426 | ||
1 | 415 | 6.5% |
( | 404 | 6.3% |
) | 404 | 6.3% |
2 | 282 | 4.4% |
3 | 261 | 4.1% |
, | 259 | 4.0% |
4 | 171 | 2.7% |
5 | 145 | 2.3% |
0 | 137 | 2.1% |
Other values (6) | 502 | 7.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 11934 | |
ASCII | 6449 | |
Number Forms | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3426 | ||
1 | 415 | 6.4% |
( | 404 | 6.3% |
) | 404 | 6.3% |
2 | 282 | 4.4% |
3 | 261 | 4.0% |
, | 259 | 4.0% |
4 | 171 | 2.7% |
5 | 145 | 2.2% |
0 | 137 | 2.1% |
Other values (27) | 545 | 8.5% |
Hangul
Value | Count | Frequency (%) |
서 | 1381 | 11.6% |
동 | 1168 | 9.8% |
울 | 898 | 7.5% |
구 | 518 | 4.3% |
로 | 507 | 4.2% |
초 | 410 | 3.4% |
남 | 245 | 2.1% |
강 | 207 | 1.7% |
길 | 198 | 1.7% |
대 | 181 | 1.5% |
Other values (375) | 6221 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 1 |
상태코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.9 KiB |
1 | |
---|---|
서울 서초구 방배로34길 8 (방배동, 다원빌딩) | 1 |
Length
Max length | 27 |
---|---|
Median length | 1 |
Mean length | 1.0189229 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 1373 | |
서울 서초구 방배로34길 8 (방배동, 다원빌딩) | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 1373 | |
서울 | 1 | 0.1% |
서초구 | 1 | 0.1% |
방배로34길 | 1 | 0.1% |
8 | 1 | 0.1% |
방배동 | 1 | 0.1% |
다원빌딩 | 1 | 0.1% |
조직유형 | 상태코드 | |
---|---|---|
조직유형 | 1.000 | NaN |
상태코드 | NaN | 1.000 |
상태코드 | 조직유형 | |
---|---|---|
상태코드 | 1.000 | 1.000 |
조직유형 | 1.000 | 1.000 |
조직유형 | 상태코드 | |
---|---|---|
조직유형 | 1.000 | 1.000 |
상태코드 | 1.000 | 1.000 |
조직명 | 조직유형 | 우편번호 | 주소 1 | 상태코드 | |
---|---|---|---|---|---|
0 | (사) 나누리. | 1480 | 135-833 | 서울 강남 논현2동 | 1 |
1 | (사) 전국문예회관연합회. | 1480 | 137-718 | 서울 서초 서초3동 예술의전당 | 1 |
2 | (사) 한국기독교문화사업단 | 10 | 6063 | 서울 강남구 청담동 11-23 (청담동) | 1 |
3 | (사)갈물한글서회. | 1480 | 110-320 | 서울 종로 낙원동 | 1 |
4 | (사)고려오페라단. | 1480 | 151-056 | 서울시 관악구 행운동 | 1 |
5 | (사)국제문화공연교류회 | 10 | 4561 | 서울 중구 을지로44길 10 (광희동1가) | 1 |
6 | (사)국제서예가협회. | 1480 | 501-847 | 광주 동구 학동 | 1 |
7 | (사)글로리아오페라단. | 1480 | 135-893 | 서울 강남 신사동 | 1 |
8 | (사)김자경오페라단. | 1480 | 137-873 | 서울 서초 서초3동 | 1 |
9 | (사)꾸러기예술단 | 1480 | 135-120 | 서울 강남구 신사동 | 1 |
조직명 | 조직유형 | 우편번호 | 주소 1 | 상태코드 | |
---|---|---|---|---|---|
1364 | Sugar & Co. | 1480 | 140-031 | 서울 용산 이촌1동 | 1 |
1365 | SYJ Dance company. | 1480 | 135-877 | <NA> | 1 |
1366 | testtest. | 1480 | 300-814 | 대전 동구 삼성1동 | 1 |
1367 | TIMF앙상블. | 1480 | 650-110 | 경남 통영 도천동 | 1 |
1368 | UNICO. | 1480 | 156-094 | 서울 동작 사당4동 | 1 |
1369 | Unico. | 1480 | 137-060 | 서울 서초 방배동 | 1 |
1370 | We Music. | 1480 | 449-040 | 경기 용인 마평동 | 1 |
1371 | Y발레단 | 10 | 4728 | 서울 성동구 금호로 117 (금호동2가, 금호자이1차) | 1 |
1372 | YAJ MUSIC(야즈뮤직) | 1480 | 3315 | 경기 화성시 동탄대로시범길 19 (청계동, 동탄역 시범 더샵 센트럴시티) | 1 |
1373 | Zamstick. | 1480 | 151-834 | 서울 관악 행운동 | 1 |
Most frequently occurring
조직명 | 조직유형 | 우편번호 | 주소 1 | 상태코드 | # duplicates | |
---|---|---|---|---|---|---|
0 | (재)윤이상평화재단. | 1480 | 110-070 | 서울 종로 내수동 | 1 | 2 |
1 | 극단목화. | 1480 | 129-149 | 서울특별시 종로구 | 1 | 2 |
2 | 김민주 | 9 | <NA> | <NA> | 1 | 2 |
3 | 대전광역시청. | 1480 | 6715 | 대전 서구 둔산로 100 (둔산동, 대전광역시청) | 1 | 2 |
4 | 무직클람머. | 1480 | 135-864 | 서울 강남 삼성2동 | 1 | 2 |
5 | 뮤자인. | 1480 | 137-040 | 서울 서초 반포동 | 1 | 2 |
6 | 보류. | 1480 | 111-111 | 1 | 1 | 2 |
7 | 서울싱어즈소사이어티. | 1480 | 137-868 | 서울 서초 서초3동 | 1 | 2 |
8 | 서울오라토리오. | 1480 | 137-867 | 서울 서초 서초3동 | 1 | 2 |
9 | 아시아투데이. | 1480 | 150-890 | 서울 영등 여의도동 | 1 | 2 |