Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 29 |
Missing cells | 111 |
Missing cells (%) | 63.8% |
Duplicate rows | 1 |
Duplicate rows (%) | 3.4% |
Total size in memory | 1.6 KiB |
Average record size in memory | 55.6 B |
Variable types
Text | 3 |
---|---|
Unsupported | 3 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | MBN |
URL | https://kdx.kr/data/view/161 |
Dataset has 1 (3.4%) duplicate rows | Duplicates |
RSTRC_VID_ESSN_NO has 2 (6.9%) missing values | Missing |
VID_SJ_CN has 11 (37.9%) missing values | Missing |
VID_CN has 11 (37.9%) missing values | Missing |
REG_DATE has 29 (100.0%) missing values | Missing |
VOD_CRS_NM has 29 (100.0%) missing values | Missing |
Unnamed: 5 has 29 (100.0%) missing values | Missing |
REG_DATE is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
VOD_CRS_NM is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 5 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 20:24:54.751230 |
---|---|
Analysis finished | 2023-12-11 20:24:56.733061 |
Duration | 1.98 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
MISSING
 
Distinct | 27 |
---|---|
Distinct (%) | 100.0% |
Missing | 2 |
Missing (%) | 6.9% |
Memory size | 364.0 B |
Length
Max length | 32 |
---|---|
Median length | 27 |
Mean length | 15.444444 |
Min length | 6 |
Characters and Unicode
Total characters | 417 |
---|---|
Distinct characters | 122 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 27 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 1005466 |
---|---|
2nd row | 하지만 모두 믿고 샀다가는 낭패 본다?! |
3rd row | 쇼 호스트가 말하는 믿어도 되는 쇼 호스트의 말은? |
4th row | 1005467 |
5th row | '마지막'에 숨겨진 의미는? |
Value | Count | Frequency (%) |
쇼 | 5 | 4.9% |
호스트의 | 3 | 2.9% |
시장 | 3 | 2.9% |
말은 | 2 | 1.9% |
약재 | 2 | 1.9% |
그 | 2 | 1.9% |
호스트가 | 2 | 1.9% |
천마를 | 2 | 1.9% |
제품이기도 | 2 | 1.9% |
한의약 | 2 | 1.9% |
Other values (78) | 78 |
Most occurring characters
Value | Count | Frequency (%) |
77 | 18.5% | |
0 | 21 | 5.0% |
5 | 14 | 3.4% |
는 | 12 | 2.9% |
1 | 11 | 2.6% |
? | 10 | 2.4% |
하 | 9 | 2.2% |
시 | 9 | 2.2% |
약 | 7 | 1.7% |
다 | 7 | 1.7% |
Other values (112) | 240 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 254 | |
Space Separator | 77 | 18.5% |
Decimal Number | 66 | 15.8% |
Other Punctuation | 20 | 4.8% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
는 | 12 | 4.7% |
하 | 9 | 3.5% |
시 | 9 | 3.5% |
약 | 7 | 2.8% |
다 | 7 | 2.8% |
이 | 7 | 2.8% |
의 | 6 | 2.4% |
가 | 6 | 2.4% |
은 | 6 | 2.4% |
도 | 5 | 2.0% |
Other values (97) | 180 |
Decimal Number
Value | Count | Frequency (%) |
0 | 21 | |
5 | 14 | |
1 | 11 | |
4 | 5 | 7.6% |
3 | 4 | 6.1% |
6 | 4 | 6.1% |
9 | 2 | 3.0% |
2 | 2 | 3.0% |
7 | 2 | 3.0% |
8 | 1 | 1.5% |
Other Punctuation
Value | Count | Frequency (%) |
? | 10 | |
! | 5 | |
, | 3 | 15.0% |
' | 2 | 10.0% |
Space Separator
Value | Count | Frequency (%) |
77 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 254 | |
Common | 163 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
는 | 12 | 4.7% |
하 | 9 | 3.5% |
시 | 9 | 3.5% |
약 | 7 | 2.8% |
다 | 7 | 2.8% |
이 | 7 | 2.8% |
의 | 6 | 2.4% |
가 | 6 | 2.4% |
은 | 6 | 2.4% |
도 | 5 | 2.0% |
Other values (97) | 180 |
Common
Value | Count | Frequency (%) |
77 | ||
0 | 21 | 12.9% |
5 | 14 | 8.6% |
1 | 11 | 6.7% |
? | 10 | 6.1% |
! | 5 | 3.1% |
4 | 5 | 3.1% |
3 | 4 | 2.5% |
6 | 4 | 2.5% |
, | 3 | 1.8% |
Other values (5) | 9 | 5.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 254 | |
ASCII | 163 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
77 | ||
0 | 21 | 12.9% |
5 | 14 | 8.6% |
1 | 11 | 6.7% |
? | 10 | 6.1% |
! | 5 | 3.1% |
4 | 5 | 3.1% |
3 | 4 | 2.5% |
6 | 4 | 2.5% |
, | 3 | 1.8% |
Other values (5) | 9 | 5.5% |
Hangul
Value | Count | Frequency (%) |
는 | 12 | 4.7% |
하 | 9 | 3.5% |
시 | 9 | 3.5% |
약 | 7 | 2.8% |
다 | 7 | 2.8% |
이 | 7 | 2.8% |
의 | 6 | 2.4% |
가 | 6 | 2.4% |
은 | 6 | 2.4% |
도 | 5 | 2.0% |
Other values (97) | 180 |
VID_SJ_CN
Text
MISSING
 
Distinct | 12 |
---|---|
Distinct (%) | 66.7% |
Missing | 11 |
Missing (%) | 37.9% |
Memory size | 364.0 B |
Length
Max length | 21 |
---|---|
Median length | 20.5 |
Mean length | 12.944444 |
Min length | 8 |
Characters and Unicode
Total characters | 233 |
---|---|
Distinct characters | 83 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 50.0% |
Sample
1st row | 믿어도 되는 쇼 호스트의 말 |
---|---|
2nd row | 20141215 |
3rd row | 홈쇼핑에서 '마지막'의 의미는? |
4th row | 20141215 |
5th row | 판매 상품을 직접 사용하는 쇼 호스트? |
Value | Count | Frequency (%) |
20141215 | 3 | 5.9% |
20141229 | 3 | 5.9% |
20141222 | 3 | 5.9% |
쇼 | 2 | 3.9% |
이용하라 | 2 | 3.9% |
세일을 | 2 | 3.9% |
서울 | 1 | 2.0% |
청량리로 | 1 | 2.0% |
가라 | 1 | 2.0% |
국내 | 1 | 2.0% |
Other values (32) | 32 |
Most occurring characters
Value | Count | Frequency (%) |
33 | 14.2% | |
2 | 28 | 12.0% |
1 | 22 | 9.4% |
4 | 9 | 3.9% |
0 | 9 | 3.9% |
의 | 7 | 3.0% |
하 | 5 | 2.1% |
는 | 4 | 1.7% |
용 | 4 | 1.7% |
이 | 4 | 1.7% |
Other values (73) | 108 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 119 | |
Decimal Number | 75 | |
Space Separator | 33 | 14.2% |
Other Punctuation | 6 | 2.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
의 | 7 | 5.9% |
하 | 5 | 4.2% |
는 | 4 | 3.4% |
용 | 4 | 3.4% |
이 | 4 | 3.4% |
을 | 4 | 3.4% |
약 | 4 | 3.4% |
쇼 | 3 | 2.5% |
라 | 3 | 2.5% |
서 | 3 | 2.5% |
Other values (62) | 78 |
Decimal Number
Value | Count | Frequency (%) |
2 | 28 | |
1 | 22 | |
4 | 9 | 12.0% |
0 | 9 | 12.0% |
9 | 3 | 4.0% |
5 | 3 | 4.0% |
7 | 1 | 1.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 | |
' | 2 | |
? | 2 |
Space Separator
Value | Count | Frequency (%) |
33 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 119 | |
Common | 114 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
의 | 7 | 5.9% |
하 | 5 | 4.2% |
는 | 4 | 3.4% |
용 | 4 | 3.4% |
이 | 4 | 3.4% |
을 | 4 | 3.4% |
약 | 4 | 3.4% |
쇼 | 3 | 2.5% |
라 | 3 | 2.5% |
서 | 3 | 2.5% |
Other values (62) | 78 |
Common
Value | Count | Frequency (%) |
33 | ||
2 | 28 | |
1 | 22 | |
4 | 9 | 7.9% |
0 | 9 | 7.9% |
9 | 3 | 2.6% |
5 | 3 | 2.6% |
, | 2 | 1.8% |
' | 2 | 1.8% |
? | 2 | 1.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 119 | |
ASCII | 114 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
33 | ||
2 | 28 | |
1 | 22 | |
4 | 9 | 7.9% |
0 | 9 | 7.9% |
9 | 3 | 2.6% |
5 | 3 | 2.6% |
, | 2 | 1.8% |
' | 2 | 1.8% |
? | 2 | 1.8% |
Hangul
Value | Count | Frequency (%) |
의 | 7 | 5.9% |
하 | 5 | 4.2% |
는 | 4 | 3.4% |
용 | 4 | 3.4% |
이 | 4 | 3.4% |
을 | 4 | 3.4% |
약 | 4 | 3.4% |
쇼 | 3 | 2.5% |
라 | 3 | 2.5% |
서 | 3 | 2.5% |
Other values (62) | 78 |
VID_CN
Text
MISSING
 
Distinct | 18 |
---|---|
Distinct (%) | 100.0% |
Missing | 11 |
Missing (%) | 37.9% |
Memory size | 364.0 B |
Length
Max length | 82 |
---|---|
Median length | 55 |
Mean length | 50.222222 |
Min length | 12 |
Characters and Unicode
Total characters | 904 |
---|---|
Distinct characters | 122 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 18 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 쇼호스트의 현란한 말솜씨! |
---|---|
2nd row | http://www.mbn.co.kr/player/movieContents.mbn?content_cls_cd=21&content_id=1005466 |
3rd row | 홈쇼핑에서 자주 보이는 단어, '마지막' |
4th row | http://www.mbn.co.kr/player/movieContents.mbn?content_cls_cd=21&content_id=1005467 |
5th row | 자기가 판매하는 상품을 |
Value | Count | Frequency (%) |
백화점 | 2 | 3.8% |
쇼호스트의 | 1 | 1.9% |
청량리에 | 1 | 1.9% |
각종 | 1 | 1.9% |
도매 | 1 | 1.9% |
시장들 | 1 | 1.9% |
http://www.mbn.co.kr/player/moviecontents.mbn?content_cls_cd=21&content_id=1005501 | 1 | 1.9% |
조선시대 | 1 | 1.9% |
보제원에서 | 1 | 1.9% |
발전된 | 1 | 1.9% |
Other values (41) | 41 |
Most occurring characters
Value | Count | Frequency (%) |
n | 72 | 8.0% |
t | 72 | 8.0% |
o | 45 | 5.0% |
c | 45 | 5.0% |
e | 45 | 5.0% |
. | 36 | 4.0% |
/ | 36 | 4.0% |
34 | 3.8% | |
m | 27 | 3.0% |
_ | 27 | 3.0% |
Other values (112) | 465 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 504 | |
Other Letter | 115 | 12.7% |
Other Punctuation | 109 | 12.1% |
Decimal Number | 88 | 9.7% |
Space Separator | 34 | 3.8% |
Connector Punctuation | 27 | 3.0% |
Math Symbol | 18 | 2.0% |
Uppercase Letter | 9 | 1.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
에 | 6 | 5.2% |
는 | 5 | 4.3% |
월 | 5 | 4.3% |
한 | 4 | 3.5% |
시 | 3 | 2.6% |
장 | 2 | 1.7% |
전 | 2 | 1.7% |
백 | 2 | 1.7% |
을 | 2 | 1.7% |
대 | 2 | 1.7% |
Other values (71) | 82 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 72 | |
t | 72 | |
o | 45 | 8.9% |
c | 45 | 8.9% |
e | 45 | 8.9% |
m | 27 | 5.4% |
w | 27 | 5.4% |
l | 18 | 3.6% |
b | 18 | 3.6% |
i | 18 | 3.6% |
Other values (9) | 117 |
Decimal Number
Value | Count | Frequency (%) |
0 | 22 | |
1 | 22 | |
5 | 14 | |
2 | 11 | |
4 | 6 | 6.8% |
3 | 4 | 4.5% |
6 | 4 | 4.5% |
9 | 2 | 2.3% |
7 | 2 | 2.3% |
8 | 1 | 1.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 36 | |
/ | 36 | |
? | 9 | 8.3% |
& | 9 | 8.3% |
: | 9 | 8.3% |
, | 5 | 4.6% |
! | 3 | 2.8% |
' | 2 | 1.8% |
Space Separator
Value | Count | Frequency (%) |
34 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 27 |
Math Symbol
Value | Count | Frequency (%) |
= | 18 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 513 | |
Common | 276 | |
Hangul | 115 | 12.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
에 | 6 | 5.2% |
는 | 5 | 4.3% |
월 | 5 | 4.3% |
한 | 4 | 3.5% |
시 | 3 | 2.6% |
장 | 2 | 1.7% |
전 | 2 | 1.7% |
백 | 2 | 1.7% |
을 | 2 | 1.7% |
대 | 2 | 1.7% |
Other values (71) | 82 |
Common
Value | Count | Frequency (%) |
. | 36 | |
/ | 36 | |
34 | ||
_ | 27 | |
0 | 22 | |
1 | 22 | |
= | 18 | 6.5% |
5 | 14 | 5.1% |
2 | 11 | 4.0% |
? | 9 | 3.3% |
Other values (11) | 47 |
Latin
Value | Count | Frequency (%) |
n | 72 | |
t | 72 | |
o | 45 | 8.8% |
c | 45 | 8.8% |
e | 45 | 8.8% |
m | 27 | 5.3% |
w | 27 | 5.3% |
l | 18 | 3.5% |
b | 18 | 3.5% |
i | 18 | 3.5% |
Other values (10) | 126 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 789 | |
Hangul | 115 | 12.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
n | 72 | 9.1% |
t | 72 | 9.1% |
o | 45 | 5.7% |
c | 45 | 5.7% |
e | 45 | 5.7% |
. | 36 | 4.6% |
/ | 36 | 4.6% |
34 | 4.3% | |
m | 27 | 3.4% |
_ | 27 | 3.4% |
Other values (31) | 350 |
Hangul
Value | Count | Frequency (%) |
에 | 6 | 5.2% |
는 | 5 | 4.3% |
월 | 5 | 4.3% |
한 | 4 | 3.5% |
시 | 3 | 2.6% |
장 | 2 | 1.7% |
전 | 2 | 1.7% |
백 | 2 | 1.7% |
을 | 2 | 1.7% |
대 | 2 | 1.7% |
Other values (71) | 82 |
REG_DATE
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 29 |
---|---|
Missing (%) | 100.0% |
Memory size | 393.0 B |
VOD_CRS_NM
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 29 |
---|---|
Missing (%) | 100.0% |
Memory size | 393.0 B |
Unnamed: 5
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 29 |
---|---|
Missing (%) | 100.0% |
Memory size | 393.0 B |
RSTRC_VID_ESSN_NO | VID_SJ_CN | VID_CN | |
---|---|---|---|
RSTRC_VID_ESSN_NO | 1.000 | 1.000 | 1.000 |
VID_SJ_CN | 1.000 | 1.000 | 1.000 |
VID_CN | 1.000 | 1.000 | 1.000 |
RSTRC_VID_ESSN_NO | VID_SJ_CN | VID_CN | REG_DATE | VOD_CRS_NM | Unnamed: 5 | |
---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | 1005466 | 믿어도 되는 쇼 호스트의 말 | 쇼호스트의 현란한 말솜씨! | <NA> | <NA> | <NA> |
2 | 하지만 모두 믿고 샀다가는 낭패 본다?! | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | 쇼 호스트가 말하는 믿어도 되는 쇼 호스트의 말은? | 20141215 | http://www.mbn.co.kr/player/movieContents.mbn?content_cls_cd=21&content_id=1005466 | <NA> | <NA> | <NA> |
4 | 1005467 | 홈쇼핑에서 '마지막'의 의미는? | 홈쇼핑에서 자주 보이는 단어, '마지막' | <NA> | <NA> | <NA> |
5 | '마지막'에 숨겨진 의미는? | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | 쇼 호스트의 말을 끝까지 들어야 하는 이유! | 20141215 | http://www.mbn.co.kr/player/movieContents.mbn?content_cls_cd=21&content_id=1005467 | <NA> | <NA> | <NA> |
7 | 1005468 | 판매 상품을 직접 사용하는 쇼 호스트? | 자기가 판매하는 상품을 | <NA> | <NA> | <NA> |
8 | 직접 사용한다는 쇼 호스트의 말! | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | 쇼 호스트가 신뢰감을 주기 위해 자주 쓰는 말은? | 20141215 | http://www.mbn.co.kr/player/movieContents.mbn?content_cls_cd=21&content_id=1005468 | <NA> | <NA> | <NA> |
RSTRC_VID_ESSN_NO | VID_SJ_CN | VID_CN | REG_DATE | VOD_CRS_NM | Unnamed: 5 | |
---|---|---|---|---|---|---|
19 | 1005532 | 국내 최대의 한약시장, 서울 약령시장 | 조선시대 보제원에서 발전된 약령시장 | <NA> | <NA> | <NA> |
20 | 약령시장 전문가가 밝히는 | <NA> | <NA> | <NA> | <NA> | <NA> |
21 | 약재 시장에서 약초 잘 고르는 법 | 20141229 | http://www.mbn.co.kr/player/movieContents.mbn?content_cls_cd=21&content_id=1005532 | <NA> | <NA> | <NA> |
22 | 1005533 | 한의약 박물관 이용하는 방법 | 한약에 대한 모든 것을 알 수 있다는 | <NA> | <NA> | <NA> |
23 | 약령시 한의약 박물관! | <NA> | <NA> | <NA> | <NA> | <NA> |
24 | 한의약 박물관을 유용하게 이용하는 방법은? | 20141229 | http://www.mbn.co.kr/player/movieContents.mbn?content_cls_cd=21&content_id=1005533 | <NA> | <NA> | <NA> |
25 | 1005534 | 하늘이 내려준 신비의 약초, 천마 | 겨울에 먹으면 더욱 좋다는 천마! | <NA> | <NA> | <NA> |
26 | 좋은 천마를 고르려면 | <NA> | <NA> | <NA> | <NA> | <NA> |
27 | 천마를 백열등에 비춰봐라? | 20141229 | http://www.mbn.co.kr/player/movieContents.mbn?content_cls_cd=21&content_id=1005534 | <NA> | <NA> | <NA> |
28 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
RSTRC_VID_ESSN_NO | VID_SJ_CN | VID_CN | # duplicates | |
---|---|---|---|---|
0 | <NA> | <NA> | <NA> | 2 |