Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 319 |
Missing cells | 32 |
Missing cells (%) | 1.4% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 17.9 KiB |
Average record size in memory | 57.4 B |
Variable types
Text | 3 |
---|---|
Categorical | 2 |
Numeric | 1 |
DateTime | 1 |
Dataset
Description | 다양성 영화 상영 현황 |
---|---|
Author | 경기콘텐츠진흥원 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=GVMBBRVHF4FD72JSN62012076383&infSeq=1 |
Reproduction
Analysis started | 2023-12-10 21:25:44.082178 |
---|---|
Analysis finished | 2023-12-10 21:25:44.825445 |
Duration | 0.74 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
작품명
Text
Distinct | 314 |
---|---|
Distinct (%) | 98.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.6 KiB |
Value | Count | Frequency (%) |
우리 | 4 | 0.7% |
보희와 | 3 | 0.5% |
두 | 3 | 0.5% |
녹양 | 3 | 0.5% |
나는 | 3 | 0.5% |
그 | 3 | 0.5% |
길 | 3 | 0.5% |
비밀의 | 2 | 0.3% |
마이 | 2 | 0.3% |
위한 | 2 | 0.3% |
Other values (516) | 555 |
Most occurring characters
Value | Count | Frequency (%) |
264 | 13.6% | |
이 | 66 | 3.4% |
의 | 53 | 2.7% |
리 | 36 | 1.9% |
다 | 28 | 1.4% |
스 | 27 | 1.4% |
는 | 25 | 1.3% |
나 | 23 | 1.2% |
아 | 21 | 1.1% |
시 | 20 | 1.0% |
Other values (443) | 1375 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1625 | |
Space Separator | 264 | 13.6% |
Other Punctuation | 28 | 1.4% |
Decimal Number | 14 | 0.7% |
Uppercase Letter | 3 | 0.2% |
Connector Punctuation | 2 | 0.1% |
Open Punctuation | 1 | 0.1% |
Close Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 66 | 4.1% |
의 | 53 | 3.3% |
리 | 36 | 2.2% |
다 | 28 | 1.7% |
스 | 27 | 1.7% |
는 | 25 | 1.5% |
나 | 23 | 1.4% |
아 | 21 | 1.3% |
시 | 20 | 1.2% |
마 | 19 | 1.2% |
Other values (425) | 1307 |
Decimal Number
Value | Count | Frequency (%) |
1 | 4 | |
6 | 3 | |
0 | 2 | |
5 | 2 | |
2 | 1 | 7.1% |
9 | 1 | 7.1% |
8 | 1 | 7.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 16 | |
! | 5 | 17.9% |
: | 5 | 17.9% |
? | 2 | 7.1% |
Uppercase Letter
Value | Count | Frequency (%) |
N | 1 | |
K | 1 | |
B | 1 |
Space Separator
Value | Count | Frequency (%) |
264 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1624 | |
Common | 310 | 16.0% |
Latin | 3 | 0.2% |
Han | 1 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 66 | 4.1% |
의 | 53 | 3.3% |
리 | 36 | 2.2% |
다 | 28 | 1.7% |
스 | 27 | 1.7% |
는 | 25 | 1.5% |
나 | 23 | 1.4% |
아 | 21 | 1.3% |
시 | 20 | 1.2% |
마 | 19 | 1.2% |
Other values (424) | 1306 |
Common
Value | Count | Frequency (%) |
264 | ||
, | 16 | 5.2% |
! | 5 | 1.6% |
: | 5 | 1.6% |
1 | 4 | 1.3% |
6 | 3 | 1.0% |
0 | 2 | 0.6% |
? | 2 | 0.6% |
5 | 2 | 0.6% |
_ | 2 | 0.6% |
Other values (5) | 5 | 1.6% |
Latin
Value | Count | Frequency (%) |
N | 1 | |
K | 1 | |
B | 1 |
Han
Value | Count | Frequency (%) |
樂 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1624 | |
ASCII | 313 | 16.2% |
CJK Compat Ideographs | 1 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
264 | ||
, | 16 | 5.1% |
! | 5 | 1.6% |
: | 5 | 1.6% |
1 | 4 | 1.3% |
6 | 3 | 1.0% |
0 | 2 | 0.6% |
? | 2 | 0.6% |
5 | 2 | 0.6% |
_ | 2 | 0.6% |
Other values (8) | 8 | 2.6% |
Hangul
Value | Count | Frequency (%) |
이 | 66 | 4.1% |
의 | 53 | 3.3% |
리 | 36 | 2.2% |
다 | 28 | 1.7% |
스 | 27 | 1.7% |
는 | 25 | 1.5% |
나 | 23 | 1.4% |
아 | 21 | 1.3% |
시 | 20 | 1.2% |
마 | 19 | 1.2% |
Other values (424) | 1306 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
樂 | 1 |
감독명
Text
Distinct | 284 |
---|---|
Distinct (%) | 89.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.6 KiB |
Value | Count | Frequency (%) |
고봉수 | 3 | 0.9% |
안주영 | 3 | 0.9% |
김보람 | 3 | 0.9% |
백승기 | 3 | 0.9% |
전규환 | 3 | 0.9% |
최승연 | 2 | 0.6% |
김나경 | 2 | 0.6% |
장건재 | 2 | 0.6% |
김태용 | 2 | 0.6% |
황윤 | 2 | 0.6% |
Other values (281) | 301 |
Most occurring characters
Value | Count | Frequency (%) |
김 | 75 | 6.9% |
이 | 56 | 5.1% |
정 | 48 | 4.4% |
영 | 33 | 3.0% |
+ | 26 | 2.4% |
진 | 25 | 2.3% |
박 | 23 | 2.1% |
재 | 23 | 2.1% |
현 | 22 | 2.0% |
승 | 21 | 1.9% |
Other values (149) | 736 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1047 | |
Math Symbol | 26 | 2.4% |
Other Punctuation | 8 | 0.7% |
Space Separator | 7 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 75 | 7.2% |
이 | 56 | 5.3% |
정 | 48 | 4.6% |
영 | 33 | 3.2% |
진 | 25 | 2.4% |
박 | 23 | 2.2% |
재 | 23 | 2.2% |
현 | 22 | 2.1% |
승 | 21 | 2.0% |
지 | 18 | 1.7% |
Other values (146) | 703 |
Math Symbol
Value | Count | Frequency (%) |
+ | 26 |
Other Punctuation
Value | Count | Frequency (%) |
, | 8 |
Space Separator
Value | Count | Frequency (%) |
7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1047 | |
Common | 41 | 3.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 75 | 7.2% |
이 | 56 | 5.3% |
정 | 48 | 4.6% |
영 | 33 | 3.2% |
진 | 25 | 2.4% |
박 | 23 | 2.2% |
재 | 23 | 2.2% |
현 | 22 | 2.1% |
승 | 21 | 2.0% |
지 | 18 | 1.7% |
Other values (146) | 703 |
Common
Value | Count | Frequency (%) |
+ | 26 | |
, | 8 | 19.5% |
7 | 17.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1047 | |
ASCII | 41 | 3.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
김 | 75 | 7.2% |
이 | 56 | 5.3% |
정 | 48 | 4.6% |
영 | 33 | 3.2% |
진 | 25 | 2.4% |
박 | 23 | 2.2% |
재 | 23 | 2.2% |
현 | 22 | 2.1% |
승 | 21 | 2.0% |
지 | 18 | 1.7% |
Other values (146) | 703 |
ASCII
Value | Count | Frequency (%) |
+ | 26 | |
, | 8 | 19.5% |
7 | 17.1% |
장르구분명
Categorical
IMBALANCE
 
Distinct | 43 |
---|---|
Distinct (%) | 13.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.6 KiB |
드라마 | |
---|---|
다큐멘터리 | |
코미디 | 6 |
극영화 | 4 |
멜로 | 3 |
Other values (38) |
Length
Max length | 19 |
---|---|
Median length | 3 |
Mean length | 3.9937304 |
Min length | 2 |
Unique
Unique | 30 ? |
---|---|
Unique (%) | 9.4% |
Sample
1st row | 드라마 |
---|---|
2nd row | 드라마 |
3rd row | 다큐멘터리 |
4th row | 드라마 |
5th row | 다큐멘터리 |
Common Values
Value | Count | Frequency (%) |
드라마 | 160 | |
다큐멘터리 | 98 | |
코미디 | 6 | 1.9% |
극영화 | 4 | 1.3% |
멜로 | 3 | 0.9% |
옴니버스 | 3 | 0.9% |
액션 | 3 | 0.9% |
실사극영화 | 2 | 0.6% |
다큐 | 2 | 0.6% |
스릴러 | 2 | 0.6% |
Other values (33) | 36 | 11.3% |
Length
Value | Count | Frequency (%) |
드라마 | 164 | |
다큐멘터리 | 100 | |
코미디 | 7 | 2.1% |
극영화 | 4 | 1.2% |
멜로 | 4 | 1.2% |
스릴러 | 4 | 1.2% |
옴니버스 | 3 | 0.9% |
액션 | 3 | 0.9% |
멜로,로맨스 | 2 | 0.6% |
애니메이션 | 2 | 0.6% |
Other values (29) | 36 | 10.9% |
상영시간(분)
Real number (ℝ)
Distinct | 84 |
---|---|
Distinct (%) | 26.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 90.366771 |
Minimum | 10 |
---|---|
Maximum | 160 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.9 KiB |
Quantile statistics
Minimum | 10 |
---|---|
5-th percentile | 29.9 |
Q1 | 83 |
median | 95 |
Q3 | 104 |
95-th percentile | 120 |
Maximum | 160 |
Range | 150 |
Interquartile range (IQR) | 21 |
Descriptive statistics
Standard deviation | 24.419814 |
---|---|
Coefficient of variation (CV) | 0.27023002 |
Kurtosis | 2.5848167 |
Mean | 90.366771 |
Median Absolute Deviation (MAD) | 10 |
Skewness | -1.3360967 |
Sum | 28827 |
Variance | 596.32732 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100 | 18 | 5.6% |
90 | 13 | 4.1% |
95 | 12 | 3.8% |
99 | 11 | 3.4% |
104 | 11 | 3.4% |
80 | 10 | 3.1% |
98 | 10 | 3.1% |
83 | 10 | 3.1% |
93 | 10 | 3.1% |
85 | 9 | 2.8% |
Other values (74) | 205 |
Value | Count | Frequency (%) |
10 | 2 | |
11 | 1 | |
12 | 1 | |
15 | 1 | |
18 | 2 | |
19 | 1 | |
20 | 1 | |
22 | 1 | |
23 | 1 | |
24 | 1 |
Value | Count | Frequency (%) |
160 | 1 | |
144 | 1 | |
140 | 2 | |
139 | 1 | |
136 | 1 | |
131 | 1 | |
130 | 1 | |
126 | 1 | |
125 | 2 | |
123 | 2 |
상영등급
Categorical
Distinct | 9 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.6 KiB |
12세이상관람가 | |
---|---|
전체관람가 | |
15세이상관람가 | |
12세 | |
15세 | |
Other values (4) |
Length
Max length | 8 |
---|---|
Median length | 7 |
Mean length | 5.8557994 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 12세이상관람가 |
---|---|
2nd row | 12세이상관람가 |
3rd row | 전체관람가 |
4th row | 12세이상관람가 |
5th row | 12세이상관람가 |
Common Values
Value | Count | Frequency (%) |
12세이상관람가 | 70 | |
전체관람가 | 63 | |
15세이상관람가 | 52 | |
12세 | 42 | |
15세 | 40 | |
청소년관람불가 | 29 | |
청소년 관람불가 | 13 | 4.1% |
전체 | 9 | 2.8% |
12세 예정 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
12세이상관람가 | 70 | |
전체관람가 | 63 | |
15세이상관람가 | 52 | |
12세 | 43 | |
15세 | 40 | |
청소년관람불가 | 29 | |
청소년 | 13 | 3.9% |
관람불가 | 13 | 3.9% |
전체 | 9 | 2.7% |
예정 | 1 | 0.3% |
개봉일정보
Date
MISSING
 
Distinct | 234 |
---|---|
Distinct (%) | 79.9% |
Missing | 26 |
Missing (%) | 8.2% |
Memory size | 2.6 KiB |
Minimum | 2009-04-23 00:00:00 |
---|---|
Maximum | 2023-11-22 00:00:00 |
배급사명
Text
MISSING
 
Distinct | 115 |
---|---|
Distinct (%) | 36.7% |
Missing | 6 |
Missing (%) | 1.9% |
Memory size | 2.6 KiB |
Value | Count | Frequency (%) |
인디스토리 | 24 | 6.5% |
필름다빈 | 19 | 5.1% |
㈜인디스토리 | 17 | 4.6% |
진진 | 17 | 4.6% |
엣나인필름 | 14 | 3.8% |
㈜시네마달 | 12 | 3.2% |
시네마달 | 12 | 3.2% |
무브먼트 | 12 | 3.2% |
상상마당 | 12 | 3.2% |
kt&g | 11 | 3.0% |
Other values (116) | 220 |
Most occurring characters
Value | Count | Frequency (%) |
스 | 107 | 5.8% |
인 | 88 | 4.8% |
리 | 74 | 4.0% |
디 | 73 | 4.0% |
㈜ | 67 | 3.7% |
57 | 3.1% | |
마 | 52 | 2.8% |
필 | 52 | 2.8% |
트 | 51 | 2.8% |
름 | 50 | 2.7% |
Other values (182) | 1161 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1566 | |
Uppercase Letter | 83 | 4.5% |
Other Symbol | 67 | 3.7% |
Space Separator | 57 | 3.1% |
Close Punctuation | 18 | 1.0% |
Open Punctuation | 17 | 0.9% |
Other Punctuation | 17 | 0.9% |
Decimal Number | 4 | 0.2% |
Lowercase Letter | 3 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 107 | 6.8% |
인 | 88 | 5.6% |
리 | 74 | 4.7% |
디 | 73 | 4.7% |
마 | 52 | 3.3% |
필 | 52 | 3.3% |
트 | 51 | 3.3% |
름 | 50 | 3.2% |
진 | 48 | 3.1% |
토 | 47 | 3.0% |
Other values (157) | 924 |
Uppercase Letter
Value | Count | Frequency (%) |
G | 23 | |
C | 13 | |
T | 13 | |
K | 13 | |
V | 10 | |
J | 3 | 3.6% |
E | 2 | 2.4% |
N | 2 | 2.4% |
M | 1 | 1.2% |
W | 1 | 1.2% |
Other values (2) | 2 | 2.4% |
Decimal Number
Value | Count | Frequency (%) |
2 | 1 | |
6 | 1 | |
4 | 1 | |
0 | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
k | 1 | |
h | 1 | |
t | 1 |
Other Punctuation
Value | Count | Frequency (%) |
& | 14 | |
, | 3 | 17.6% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 67 |
Space Separator
Value | Count | Frequency (%) |
57 |
Close Punctuation
Value | Count | Frequency (%) |
) | 18 |
Open Punctuation
Value | Count | Frequency (%) |
( | 17 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1633 | |
Common | 113 | 6.2% |
Latin | 86 | 4.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 107 | 6.6% |
인 | 88 | 5.4% |
리 | 74 | 4.5% |
디 | 73 | 4.5% |
㈜ | 67 | 4.1% |
마 | 52 | 3.2% |
필 | 52 | 3.2% |
트 | 51 | 3.1% |
름 | 50 | 3.1% |
진 | 48 | 2.9% |
Other values (158) | 971 |
Latin
Value | Count | Frequency (%) |
G | 23 | |
C | 13 | |
T | 13 | |
K | 13 | |
V | 10 | |
J | 3 | 3.5% |
E | 2 | 2.3% |
N | 2 | 2.3% |
k | 1 | 1.2% |
M | 1 | 1.2% |
Other values (5) | 5 | 5.8% |
Common
Value | Count | Frequency (%) |
57 | ||
) | 18 | 15.9% |
( | 17 | 15.0% |
& | 14 | 12.4% |
, | 3 | 2.7% |
2 | 1 | 0.9% |
6 | 1 | 0.9% |
4 | 1 | 0.9% |
0 | 1 | 0.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1566 | |
ASCII | 199 | 10.9% |
None | 67 | 3.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
스 | 107 | 6.8% |
인 | 88 | 5.6% |
리 | 74 | 4.7% |
디 | 73 | 4.7% |
마 | 52 | 3.3% |
필 | 52 | 3.3% |
트 | 51 | 3.3% |
름 | 50 | 3.2% |
진 | 48 | 3.1% |
토 | 47 | 3.0% |
Other values (157) | 924 |
None
Value | Count | Frequency (%) |
㈜ | 67 |
ASCII
Value | Count | Frequency (%) |
57 | ||
G | 23 | |
) | 18 | 9.0% |
( | 17 | 8.5% |
& | 14 | 7.0% |
C | 13 | 6.5% |
T | 13 | 6.5% |
K | 13 | 6.5% |
V | 10 | 5.0% |
J | 3 | 1.5% |
Other values (14) | 18 | 9.0% |
장르구분명 | 상영시간(분) | 상영등급 | |
---|---|---|---|
장르구분명 | 1.000 | 0.698 | 0.697 |
상영시간(분) | 0.698 | 1.000 | 0.284 |
상영등급 | 0.697 | 0.284 | 1.000 |
상영등급 | 장르구분명 | |
---|---|---|
상영등급 | 1.000 | 0.317 |
장르구분명 | 0.317 | 1.000 |
상영시간(분) | 장르구분명 | 상영등급 | |
---|---|---|---|
상영시간(분) | 1.000 | 0.311 | 0.140 |
장르구분명 | 0.311 | 1.000 | 0.317 |
상영등급 | 0.140 | 0.317 | 1.000 |
작품명 | 감독명 | 장르구분명 | 상영시간(분) | 상영등급 | 개봉일정보 | 배급사명 | |
---|---|---|---|---|---|---|---|
0 | 윤시내가 사라졌다 | 김진화 | 드라마 | 107 | 12세이상관람가 | 2022-06-28 | 블루라벨픽쳐스 |
1 | 십개월의 미래 | 남궁선 | 드라마 | 96 | 12세이상관람가 | 2021-10-14 | 그린나래미디어 |
2 | 디어마이지니어스 | 구윤주 | 다큐멘터리 | 80 | 전체관람가 | 2020-10-22 | 필름다빈 |
3 | 이장 | 정승오 | 드라마 | 94 | 12세이상관람가 | 2020-03-25 | 인디스토리 |
4 | B급 며느리 | 선호빈 | 다큐멘터리 | 80 | 12세이상관람가 | 2018-01-17 | 에스와이코마드 |
5 | 성적표의 김민영 | 이재은, 임지선 | 드라마 | 97 | 전체관람가 | 2022-09-08 | 엣나인필름 |
6 | 선데이리그 | 이성일 | 코미디 | 83 | 전체관람가 | 2022-10-05 | 아이엠 |
7 | 낫아웃 | 이정곤 | 드라마 | 107 | 15세이상관람가 | 2021-06-03 | kth, 판씨네마㈜ |
8 | 가을이 여름에게 | 원은선 | 드라마 | 33 | 12세이상관람가 | <NA> | 센트럴파크 |
9 | 겹겹이 여름 | 백시원 | 드라마 | 34 | 12세이상관람가 | <NA> | 센트럴파크 |
작품명 | 감독명 | 장르구분명 | 상영시간(분) | 상영등급 | 개봉일정보 | 배급사명 | |
---|---|---|---|---|---|---|---|
309 | 순자와 이슬이 | 김윤지 | 드라마 | 30 | 12세이상관람가 | <NA> | 호우주의보 |
310 | 자유연기 | 김도영 | 드라마 | 30 | 12세이상관람가 | <NA> | 센트럴파크 |
311 | 너에게 가는 길 | 변규리 | 다큐멘터리 | 93 | 12세이상관람가 | 2021-11-17 | 엣나인필름 |
312 | 관계의 가나다에 있는 우리는 | 이인의 | 드라마 | 100 | 전체관람가 | 2021-01-28 | 시네마달 |
313 | 왕자가 된 소녀들 | 김혜정 | 다큐멘터리 | 79 | 전체관람가 | 2013-04-18 | 영희야 놀자 |
314 | 미싱타는 여자들 | 이혁래 | 다큐멘터리 | 108 | 전체관람가 | 2022-01-20 | 영화사 진진 |
315 | 태어나길 잘했어 | 최진영 | 드라마 | 100 | 12세이상관람가 | 2022-04-14 | 그린나래미디어 |
316 | 세자매 | 이승원 | 드라마 | 115 | 15세이상관람가 | 2021-01-27 | 리틀빅픽쳐스 |
317 | 낮에는 덥고 밤에는 춥고 | 박송열 | 드라마 | 90 | 12세이상관람가 | 2022-10-27 | 필름다빈 |
318 | 우스운게 딱! 좋아! | 김현, 정혜연 | 드라마 | 101 | 15세이상관람가 | 2022-06-23 | 필름다빈 |