Dataset statistics
Number of variables | 12 |
---|---|
Number of observations | 598 |
Missing cells | 126 |
Missing cells (%) | 1.8% |
Duplicate rows | 3 |
Duplicate rows (%) | 0.5% |
Total size in memory | 57.4 KiB |
Average record size in memory | 98.2 B |
Variable types
Text | 6 |
---|---|
Numeric | 2 |
Categorical | 3 |
DateTime | 1 |
Dataset
Description | 한국문화정보원에서 제공하는 메타데이터(인기저작물) 데이터 입니다. 메타데이터(인기저작물)의 등록정보(제목, 촬영년도, 촬영원본, 원본소유자, 국가, 재질, 컨텐츠캡션, 추천공공저작물 활용안내, 원본파일명, 조회수, 해시태그, 등록일, 사이트주소)를 제공합니다. |
---|---|
Author | 한국문화정보원 |
URL | https://www.data.go.kr/data/15119359/fileData.do |
Dataset has 3 (0.5%) duplicate rows | Duplicates |
촬영년도 is highly overall correlated with 재질 and 1 other fields | High correlation |
조회수 is highly overall correlated with 사이트주소 | High correlation |
국가 is highly overall correlated with 재질 and 1 other fields | High correlation |
재질 is highly overall correlated with 촬영년도 and 1 other fields | High correlation |
사이트주소 is highly overall correlated with 촬영년도 and 2 other fields | High correlation |
국가 is highly imbalanced (65.8%) | Imbalance |
재질 is highly imbalanced (65.2%) | Imbalance |
촬영년도 has 43 (7.2%) missing values | Missing |
원본파일명 has 29 (4.8%) missing values | Missing |
조회수 has 44 (7.4%) missing values | Missing |
해시태그 has 10 (1.7%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 21:26:47.833267 |
---|---|
Analysis finished | 2023-12-12 21:26:50.313465 |
Duration | 2.48 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
제목
Text
Distinct | 523 |
---|---|
Distinct (%) | 87.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
Length
Max length | 75 |
---|---|
Median length | 54 |
Mean length | 10.986622 |
Min length | 1 |
Characters and Unicode
Total characters | 6570 |
---|---|
Distinct characters | 601 |
Distinct categories | 13 ? |
Distinct scripts | 4 ? |
Distinct blocks | 8 ? |
Unique
Unique | 479 ? |
---|---|
Unique (%) | 80.1% |
Sample
1st row | 거친음식도맛있게먹은퇴계이황 |
---|---|
2nd row | 나물밥의소중함을알려준최영 |
3rd row | 사랑의통장 |
4th row | 선이의돌무더기 |
5th row | 아빠바지의비밀 |
Value | Count | Frequency (%) |
50 | 3.7% | |
고객응대근로자 | 28 | 2.1% |
전화연결음 | 28 | 2.1% |
남자 | 28 | 2.1% |
보호 | 28 | 2.1% |
컬러링북 | 16 | 1.2% |
위한 | 16 | 1.2% |
창작을 | 15 | 1.1% |
국악기 | 15 | 1.1% |
이해와 | 15 | 1.1% |
Other values (796) | 1125 |
Most occurring characters
Value | Count | Frequency (%) |
773 | 11.8% | |
2 | 105 | 1.6% |
0 | 88 | 1.3% |
자 | 81 | 1.2% |
리 | 80 | 1.2% |
고 | 78 | 1.2% |
이 | 76 | 1.2% |
대 | 70 | 1.1% |
) | 69 | 1.1% |
( | 69 | 1.1% |
Other values (591) | 5081 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4493 | |
Space Separator | 783 | 11.9% |
Decimal Number | 357 | 5.4% |
Lowercase Letter | 306 | 4.7% |
Uppercase Letter | 252 | 3.8% |
Close Punctuation | 104 | 1.6% |
Open Punctuation | 104 | 1.6% |
Other Punctuation | 78 | 1.2% |
Dash Punctuation | 55 | 0.8% |
Connector Punctuation | 17 | 0.3% |
Other values (3) | 21 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
자 | 81 | 1.8% |
리 | 80 | 1.8% |
고 | 78 | 1.7% |
이 | 76 | 1.7% |
대 | 70 | 1.6% |
체 | 67 | 1.5% |
호 | 64 | 1.4% |
연 | 63 | 1.4% |
기 | 63 | 1.4% |
소 | 58 | 1.3% |
Other values (507) | 3793 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 45 | |
r | 42 | |
a | 39 | |
e | 21 | 6.9% |
p | 20 | 6.5% |
l | 19 | 6.2% |
n | 19 | 6.2% |
i | 16 | 5.2% |
t | 15 | 4.9% |
s | 12 | 3.9% |
Other values (13) | 58 |
Uppercase Letter
Value | Count | Frequency (%) |
P | 40 | |
C | 30 | |
S | 21 | 8.3% |
R | 21 | 8.3% |
E | 14 | 5.6% |
M | 14 | 5.6% |
T | 12 | 4.8% |
I | 12 | 4.8% |
A | 11 | 4.4% |
N | 10 | 4.0% |
Other values (12) | 67 |
Decimal Number
Value | Count | Frequency (%) |
2 | 105 | |
0 | 88 | |
1 | 59 | |
5 | 24 | 6.7% |
3 | 22 | 6.2% |
6 | 17 | 4.8% |
9 | 14 | 3.9% |
4 | 11 | 3.1% |
7 | 10 | 2.8% |
8 | 7 | 2.0% |
Other Punctuation
Value | Count | Frequency (%) |
. | 34 | |
: | 19 | |
, | 11 | 14.1% |
: | 10 | 12.8% |
? | 1 | 1.3% |
· | 1 | 1.3% |
& | 1 | 1.3% |
′ | 1 | 1.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 69 | |
] | 27 | 26.0% |
」 | 4 | 3.8% |
〉 | 3 | 2.9% |
』 | 1 | 1.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 69 | |
[ | 27 | 26.0% |
「 | 4 | 3.8% |
〈 | 3 | 2.9% |
『 | 1 | 1.0% |
Other Number
Value | Count | Frequency (%) |
⑧ | 1 | |
③ | 1 | |
⑨ | 1 | |
② | 1 |
Space Separator
Value | Count | Frequency (%) |
773 | ||
10 | 1.3% |
Math Symbol
Value | Count | Frequency (%) |
+ | 2 | |
~ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 55 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 17 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 14 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4481 | |
Common | 1505 | 22.9% |
Latin | 572 | 8.7% |
Han | 12 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
자 | 81 | 1.8% |
리 | 80 | 1.8% |
고 | 78 | 1.7% |
이 | 76 | 1.7% |
대 | 70 | 1.6% |
체 | 67 | 1.5% |
호 | 64 | 1.4% |
연 | 63 | 1.4% |
기 | 63 | 1.4% |
소 | 58 | 1.3% |
Other values (495) | 3781 |
Latin
Value | Count | Frequency (%) |
o | 45 | 7.9% |
r | 42 | 7.3% |
P | 40 | 7.0% |
a | 39 | 6.8% |
C | 30 | 5.2% |
S | 21 | 3.7% |
R | 21 | 3.7% |
e | 21 | 3.7% |
p | 20 | 3.5% |
l | 19 | 3.3% |
Other values (36) | 274 |
Common
Value | Count | Frequency (%) |
773 | ||
2 | 105 | 7.0% |
0 | 88 | 5.8% |
) | 69 | 4.6% |
( | 69 | 4.6% |
1 | 59 | 3.9% |
- | 55 | 3.7% |
. | 34 | 2.3% |
[ | 27 | 1.8% |
] | 27 | 1.8% |
Other values (28) | 199 | 13.2% |
Han
Value | Count | Frequency (%) |
洞 | 1 | |
豚 | 1 | |
新 | 1 | |
別 | 1 | |
曲 | 1 | |
報 | 1 | |
告 | 1 | |
第 | 1 | |
六 | 1 | |
十 | 1 | |
Other values (2) | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4481 | |
ASCII | 2012 | |
None | 46 | 0.7% |
Number Forms | 14 | 0.2% |
CJK | 11 | 0.2% |
Enclosed Alphanum | 4 | 0.1% |
Punctuation | 1 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
773 | ||
2 | 105 | 5.2% |
0 | 88 | 4.4% |
) | 69 | 3.4% |
( | 69 | 3.4% |
1 | 59 | 2.9% |
- | 55 | 2.7% |
o | 45 | 2.2% |
r | 42 | 2.1% |
P | 40 | 2.0% |
Other values (59) | 667 |
Hangul
Value | Count | Frequency (%) |
자 | 81 | 1.8% |
리 | 80 | 1.8% |
고 | 78 | 1.7% |
이 | 76 | 1.7% |
대 | 70 | 1.6% |
체 | 67 | 1.5% |
호 | 64 | 1.4% |
연 | 63 | 1.4% |
기 | 63 | 1.4% |
소 | 58 | 1.3% |
Other values (495) | 3781 |
None
Value | Count | Frequency (%) |
: | 19 | |
10 | ||
」 | 4 | 8.7% |
「 | 4 | 8.7% |
〈 | 3 | 6.5% |
〉 | 3 | 6.5% |
』 | 1 | 2.2% |
『 | 1 | 2.2% |
· | 1 | 2.2% |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 14 |
CJK
Value | Count | Frequency (%) |
洞 | 1 | |
豚 | 1 | |
新 | 1 | |
別 | 1 | |
曲 | 1 | |
報 | 1 | |
告 | 1 | |
第 | 1 | |
十 | 1 | |
五 | 1 |
Punctuation
Value | Count | Frequency (%) |
′ | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
六 | 1 |
Enclosed Alphanum
Value | Count | Frequency (%) |
⑧ | 1 | |
③ | 1 | |
⑨ | 1 | |
② | 1 |
촬영년도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 11 |
---|---|
Distinct (%) | 2.0% |
Missing | 43 |
Missing (%) | 7.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2018.8829 |
Minimum | 1996 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.4 KiB |
Quantile statistics
Minimum | 1996 |
---|---|
5-th percentile | 2016 |
Q1 | 2017 |
median | 2019 |
Q3 | 2020 |
95-th percentile | 2022 |
Maximum | 2023 |
Range | 27 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.464692 |
---|---|
Coefficient of variation (CV) | 0.0012208197 |
Kurtosis | 26.350594 |
Mean | 2018.8829 |
Median Absolute Deviation (MAD) | 1 |
Skewness | -3.270234 |
Sum | 1120480 |
Variance | 6.0747065 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2020 | 145 | |
2019 | 131 | |
2017 | 93 | |
2021 | 65 | |
2016 | 52 | 8.7% |
2022 | 32 | 5.4% |
2015 | 17 | 2.8% |
2023 | 13 | 2.2% |
2009 | 3 | 0.5% |
2018 | 2 | 0.3% |
(Missing) | 43 | 7.2% |
Value | Count | Frequency (%) |
1996 | 2 | 0.3% |
2009 | 3 | 0.5% |
2015 | 17 | 2.8% |
2016 | 52 | 8.7% |
2017 | 93 | |
2018 | 2 | 0.3% |
2019 | 131 | |
2020 | 145 | |
2021 | 65 | |
2022 | 32 | 5.4% |
Value | Count | Frequency (%) |
2023 | 13 | 2.2% |
2022 | 32 | 5.4% |
2021 | 65 | |
2020 | 145 | |
2019 | 131 | |
2018 | 2 | 0.3% |
2017 | 93 | |
2016 | 52 | 8.7% |
2015 | 17 | 2.8% |
2009 | 3 | 0.5% |
촬영원본
Text
Distinct | 91 |
---|---|
Distinct (%) | 15.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
Value | Count | Frequency (%) |
국립국악원 | 92 | 13.5% |
한국농수산식품유통공사 | 90 | 13.3% |
한국국학진흥원 | 61 | 9.0% |
한국산업안전보건공단 | 41 | 6.0% |
경제·인문사회연구회 | 39 | 5.7% |
국립생물자원관 | 27 | 4.0% |
서울우리소리박물관 | 23 | 3.4% |
한국문화정보원 | 19 | 2.8% |
아산시 | 16 | 2.4% |
국립해양박물관 | 15 | 2.2% |
Other values (94) | 256 |
Most occurring characters
Value | Count | Frequency (%) |
국 | 542 | 10.8% |
한 | 261 | 5.2% |
원 | 243 | 4.8% |
산 | 171 | 3.4% |
공 | 151 | 3.0% |
립 | 140 | 2.8% |
사 | 139 | 2.8% |
회 | 108 | 2.1% |
보 | 107 | 2.1% |
농 | 98 | 1.9% |
Other values (157) | 3077 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4777 | |
Other Punctuation | 85 | 1.7% |
Space Separator | 81 | 1.6% |
Lowercase Letter | 35 | 0.7% |
Close Punctuation | 18 | 0.4% |
Open Punctuation | 18 | 0.4% |
Other Symbol | 10 | 0.2% |
Decimal Number | 8 | 0.2% |
Uppercase Letter | 5 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 542 | 11.3% |
한 | 261 | 5.5% |
원 | 243 | 5.1% |
산 | 171 | 3.6% |
공 | 151 | 3.2% |
립 | 140 | 2.9% |
사 | 139 | 2.9% |
회 | 108 | 2.3% |
보 | 107 | 2.2% |
농 | 98 | 2.1% |
Other values (143) | 2817 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 15 | |
g | 10 | |
n | 5 | 14.3% |
r | 5 | 14.3% |
Decimal Number
Value | Count | Frequency (%) |
2 | 4 | |
1 | 2 | |
0 | 2 |
Other Punctuation
Value | Count | Frequency (%) |
, | 44 | |
· | 41 |
Space Separator
Value | Count | Frequency (%) |
81 |
Close Punctuation
Value | Count | Frequency (%) |
) | 18 |
Open Punctuation
Value | Count | Frequency (%) |
( | 18 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 10 |
Uppercase Letter
Value | Count | Frequency (%) |
G | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4787 | |
Common | 210 | 4.2% |
Latin | 40 | 0.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 542 | 11.3% |
한 | 261 | 5.5% |
원 | 243 | 5.1% |
산 | 171 | 3.6% |
공 | 151 | 3.2% |
립 | 140 | 2.9% |
사 | 139 | 2.9% |
회 | 108 | 2.3% |
보 | 107 | 2.2% |
농 | 98 | 2.0% |
Other values (144) | 2827 |
Common
Value | Count | Frequency (%) |
81 | ||
, | 44 | |
· | 41 | |
) | 18 | 8.6% |
( | 18 | 8.6% |
2 | 4 | 1.9% |
1 | 2 | 1.0% |
0 | 2 | 1.0% |
Latin
Value | Count | Frequency (%) |
e | 15 | |
g | 10 | |
n | 5 | 12.5% |
G | 5 | 12.5% |
r | 5 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4777 | |
ASCII | 209 | 4.1% |
None | 51 | 1.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
국 | 542 | 11.3% |
한 | 261 | 5.5% |
원 | 243 | 5.1% |
산 | 171 | 3.6% |
공 | 151 | 3.2% |
립 | 140 | 2.9% |
사 | 139 | 2.9% |
회 | 108 | 2.3% |
보 | 107 | 2.2% |
농 | 98 | 2.1% |
Other values (143) | 2817 |
ASCII
Value | Count | Frequency (%) |
81 | ||
, | 44 | |
) | 18 | 8.6% |
( | 18 | 8.6% |
e | 15 | 7.2% |
g | 10 | 4.8% |
n | 5 | 2.4% |
G | 5 | 2.4% |
r | 5 | 2.4% |
2 | 4 | 1.9% |
Other values (2) | 4 | 1.9% |
None
Value | Count | Frequency (%) |
· | 41 | |
㈜ | 10 | 19.6% |
원본소유자
Text
Distinct | 70 |
---|---|
Distinct (%) | 11.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
Value | Count | Frequency (%) |
국립국악원 | 92 | |
한국농수산식품유통공사 | 90 | |
한국국학진흥원 | 61 | 9.5% |
경제·인문사회연구회 | 43 | 6.7% |
한국산업안전보건공단 | 41 | 6.4% |
한국저작권위원회 | 34 | 5.3% |
국립생물자원관 | 28 | 4.4% |
서울우리소리박물관 | 23 | 3.6% |
한국문화정보원 | 17 | 2.6% |
아산시 | 16 | 2.5% |
Other values (70) | 198 |
Most occurring characters
Value | Count | Frequency (%) |
국 | 555 | 12.0% |
한 | 266 | 5.7% |
원 | 255 | 5.5% |
산 | 171 | 3.7% |
공 | 151 | 3.3% |
사 | 142 | 3.1% |
립 | 141 | 3.0% |
회 | 120 | 2.6% |
악 | 92 | 2.0% |
수 | 91 | 2.0% |
Other values (110) | 2660 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4554 | |
Space Separator | 45 | 1.0% |
Other Punctuation | 45 | 1.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 555 | 12.2% |
한 | 266 | 5.8% |
원 | 255 | 5.6% |
산 | 171 | 3.8% |
공 | 151 | 3.3% |
사 | 142 | 3.1% |
립 | 141 | 3.1% |
회 | 120 | 2.6% |
악 | 92 | 2.0% |
수 | 91 | 2.0% |
Other values (108) | 2570 |
Space Separator
Value | Count | Frequency (%) |
45 |
Other Punctuation
Value | Count | Frequency (%) |
· | 45 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4554 | |
Common | 90 | 1.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 555 | 12.2% |
한 | 266 | 5.8% |
원 | 255 | 5.6% |
산 | 171 | 3.8% |
공 | 151 | 3.3% |
사 | 142 | 3.1% |
립 | 141 | 3.1% |
회 | 120 | 2.6% |
악 | 92 | 2.0% |
수 | 91 | 2.0% |
Other values (108) | 2570 |
Common
Value | Count | Frequency (%) |
45 | ||
· | 45 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4554 | |
ASCII | 45 | 1.0% |
None | 45 | 1.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
국 | 555 | 12.2% |
한 | 266 | 5.8% |
원 | 255 | 5.6% |
산 | 171 | 3.8% |
공 | 151 | 3.3% |
사 | 142 | 3.1% |
립 | 141 | 3.1% |
회 | 120 | 2.6% |
악 | 92 | 2.0% |
수 | 91 | 2.0% |
Other values (108) | 2570 |
ASCII
Value | Count | Frequency (%) |
45 |
None
Value | Count | Frequency (%) |
· | 45 |
국가
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
한국 | |
---|---|
근현대 | |
현대 | 28 |
한국,광복이후 | 8 |
한국,일제강점기 | 2 |
Other values (2) | 2 |
Length
Max length | 9 |
---|---|
Median length | 2 |
Mean length | 2.2274247 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 한국 |
---|---|
2nd row | 한국 |
3rd row | 한국 |
4th row | 한국 |
5th row | 한국 |
Common Values
Value | Count | Frequency (%) |
한국 | 486 | |
근현대 | 72 | 12.0% |
현대 | 28 | 4.7% |
한국,광복이후 | 8 | 1.3% |
한국,일제강점기 | 2 | 0.3% |
네덜란드,17세기 | 1 | 0.2% |
한국/조선후기 | 1 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
한국 | 486 | |
근현대 | 72 | 12.0% |
현대 | 28 | 4.7% |
한국,광복이후 | 8 | 1.3% |
한국,일제강점기 | 2 | 0.3% |
네덜란드,17세기 | 1 | 0.2% |
한국/조선후기 | 1 | 0.2% |
재질
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 21 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
<NA> | |
---|---|
디지털 | |
가죽,나무 | 14 |
나무 | 14 |
나무,명주실 | 12 |
Other values (16) |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 3.9130435 |
Min length | 1 |
Unique
Unique | 9 ? |
---|---|
Unique (%) | 1.5% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 458 | |
디지털 | 52 | 8.7% |
가죽,나무 | 14 | 2.3% |
나무 | 14 | 2.3% |
나무,명주실 | 12 | 2.0% |
금속 | 12 | 2.0% |
금속,나무 | 8 | 1.3% |
대나무 | 7 | 1.2% |
나무,금속 | 5 | 0.8% |
흙 | 3 | 0.5% |
Other values (11) | 13 | 2.2% |
Length
Value | Count | Frequency (%) |
na | 458 | |
디지털 | 52 | 8.6% |
나무 | 17 | 2.8% |
가죽,나무 | 14 | 2.3% |
나무,명주실 | 12 | 2.0% |
금속 | 12 | 2.0% |
금속,나무 | 8 | 1.3% |
대나무 | 7 | 1.2% |
나무,금속 | 5 | 0.8% |
흙 | 3 | 0.5% |
Other values (12) | 15 | 2.5% |
컨텐츠캡션
Text
Distinct | 202 |
---|---|
Distinct (%) | 33.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
Length
Max length | 1024 |
---|---|
Median length | 25 |
Mean length | 104.68729 |
Min length | 8 |
Characters and Unicode
Total characters | 62603 |
---|---|
Distinct characters | 1270 |
Distinct categories | 14 ? |
Distinct scripts | 4 ? |
Distinct blocks | 11 ? |
Unique
Unique | 194 ? |
---|---|
Unique (%) | 32.4% |
Sample
1st row | 출처를 표시하고 이용조건에 따라 사용해주세요. |
---|---|
2nd row | 출처를 표시하고 이용조건에 따라 사용해주세요. |
3rd row | 출처를 표시하고 이용조건에 따라 사용해주세요. |
4th row | 출처를 표시하고 이용조건에 따라 사용해주세요. |
5th row | 출처를 표시하고 이용조건에 따라 사용해주세요. |
Value | Count | Frequency (%) |
따라 | 386 | 2.9% |
사용해주세요 | 362 | 2.7% |
출처를 | 354 | 2.7% |
표시하고 | 354 | 2.7% |
이용조건에 | 354 | 2.7% |
있다 | 114 | 0.9% |
때 | 66 | 0.5% |
한다 | 56 | 0.4% |
수 | 43 | 0.3% |
한 | 39 | 0.3% |
Other values (5628) | 11216 |
Most occurring characters
Value | Count | Frequency (%) |
12752 | 20.4% | |
에 | 1337 | 2.1% |
이 | 1276 | 2.0% |
. | 1210 | 1.9% |
고 | 1149 | 1.8% |
다 | 1005 | 1.6% |
용 | 984 | 1.6% |
하 | 890 | 1.4% |
는 | 849 | 1.4% |
의 | 745 | 1.2% |
Other values (1260) | 40406 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 43214 | |
Space Separator | 12752 | 20.4% |
Other Punctuation | 1993 | 3.2% |
Lowercase Letter | 1317 | 2.1% |
Decimal Number | 1233 | 2.0% |
Open Punctuation | 664 | 1.1% |
Close Punctuation | 662 | 1.1% |
Math Symbol | 468 | 0.7% |
Uppercase Letter | 206 | 0.3% |
Other Symbol | 34 | 0.1% |
Other values (4) | 60 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
에 | 1337 | 3.1% |
이 | 1276 | 3.0% |
고 | 1149 | 2.7% |
다 | 1005 | 2.3% |
용 | 984 | 2.3% |
하 | 890 | 2.1% |
는 | 849 | 2.0% |
의 | 745 | 1.7% |
사 | 711 | 1.6% |
주 | 677 | 1.6% |
Other values (1169) | 33591 |
Lowercase Letter
Value | Count | Frequency (%) |
p | 156 | |
e | 121 | 9.2% |
n | 114 | 8.7% |
t | 111 | 8.4% |
r | 106 | 8.0% |
a | 105 | 8.0% |
o | 97 | 7.4% |
i | 88 | 6.7% |
l | 59 | 4.5% |
c | 52 | 3.9% |
Other values (14) | 308 |
Uppercase Letter
Value | Count | Frequency (%) |
P | 47 | |
T | 24 | |
I | 19 | |
C | 16 | 7.8% |
S | 15 | 7.3% |
O | 12 | 5.8% |
E | 9 | 4.4% |
R | 9 | 4.4% |
K | 8 | 3.9% |
D | 7 | 3.4% |
Other values (11) | 40 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1210 | |
, | 615 | |
/ | 99 | 5.0% |
· | 26 | 1.3% |
; | 15 | 0.8% |
& | 15 | 0.8% |
# | 8 | 0.4% |
* | 2 | 0.1% |
? | 1 | 0.1% |
% | 1 | 0.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 296 | |
2 | 237 | |
0 | 186 | |
9 | 104 | 8.4% |
5 | 87 | 7.1% |
4 | 81 | 6.6% |
3 | 76 | 6.2% |
6 | 70 | 5.7% |
8 | 52 | 4.2% |
7 | 44 | 3.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 580 | |
『 | 67 | 10.1% |
「 | 12 | 1.8% |
[ | 3 | 0.5% |
《 | 2 | 0.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 578 | |
』 | 67 | 10.1% |
」 | 12 | 1.8% |
] | 3 | 0.5% |
》 | 2 | 0.3% |
Math Symbol
Value | Count | Frequency (%) |
> | 209 | |
< | 209 | |
~ | 47 | 10.0% |
+ | 2 | 0.4% |
∼ | 1 | 0.2% |
Other Symbol
Value | Count | Frequency (%) |
㎝ | 32 | |
♭ | 1 | 2.9% |
□ | 1 | 2.9% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 11 | |
“ | 2 | 15.4% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 9 | |
” | 1 | 10.0% |
Space Separator
Value | Count | Frequency (%) |
12752 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 20 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 17 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 42040 | |
Common | 17866 | |
Latin | 1523 | 2.4% |
Han | 1174 | 1.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
에 | 1337 | 3.2% |
이 | 1276 | 3.0% |
고 | 1149 | 2.7% |
다 | 1005 | 2.4% |
용 | 984 | 2.3% |
하 | 890 | 2.1% |
는 | 849 | 2.0% |
의 | 745 | 1.8% |
사 | 711 | 1.7% |
주 | 677 | 1.6% |
Other values (759) | 32417 |
Han
Value | Count | Frequency (%) |
樂 | 60 | 5.1% |
鼓 | 27 | 2.3% |
琴 | 22 | 1.9% |
禮 | 19 | 1.6% |
竹 | 18 | 1.5% |
軌 | 17 | 1.4% |
學 | 14 | 1.2% |
祭 | 14 | 1.2% |
大 | 14 | 1.2% |
儀 | 13 | 1.1% |
Other values (400) | 956 |
Common
Value | Count | Frequency (%) |
12752 | ||
. | 1210 | 6.8% |
, | 615 | 3.4% |
( | 580 | 3.2% |
) | 578 | 3.2% |
1 | 296 | 1.7% |
2 | 237 | 1.3% |
> | 209 | 1.2% |
< | 209 | 1.2% |
0 | 186 | 1.0% |
Other values (36) | 994 | 5.6% |
Latin
Value | Count | Frequency (%) |
p | 156 | 10.2% |
e | 121 | 7.9% |
n | 114 | 7.5% |
t | 111 | 7.3% |
r | 106 | 7.0% |
a | 105 | 6.9% |
o | 97 | 6.4% |
i | 88 | 5.8% |
l | 59 | 3.9% |
c | 52 | 3.4% |
Other values (35) | 514 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 42035 | |
ASCII | 19143 | |
CJK | 1156 | 1.8% |
None | 188 | 0.3% |
CJK Compat | 32 | 0.1% |
Punctuation | 23 | < 0.1% |
CJK Compat Ideographs | 18 | < 0.1% |
Compat Jamo | 5 | < 0.1% |
Math Operators | 1 | < 0.1% |
Misc Symbols | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
12752 | ||
. | 1210 | 6.3% |
, | 615 | 3.2% |
( | 580 | 3.0% |
) | 578 | 3.0% |
1 | 296 | 1.5% |
2 | 237 | 1.2% |
> | 209 | 1.1% |
< | 209 | 1.1% |
0 | 186 | 1.0% |
Other values (66) | 2271 | 11.9% |
Hangul
Value | Count | Frequency (%) |
에 | 1337 | 3.2% |
이 | 1276 | 3.0% |
고 | 1149 | 2.7% |
다 | 1005 | 2.4% |
용 | 984 | 2.3% |
하 | 890 | 2.1% |
는 | 849 | 2.0% |
의 | 745 | 1.8% |
사 | 711 | 1.7% |
주 | 677 | 1.6% |
Other values (757) | 32412 |
None
Value | Count | Frequency (%) |
『 | 67 | |
』 | 67 | |
· | 26 | 13.8% |
「 | 12 | 6.4% |
」 | 12 | 6.4% |
》 | 2 | 1.1% |
《 | 2 | 1.1% |
CJK
Value | Count | Frequency (%) |
樂 | 60 | 5.2% |
鼓 | 27 | 2.3% |
琴 | 22 | 1.9% |
禮 | 19 | 1.6% |
竹 | 18 | 1.6% |
軌 | 17 | 1.5% |
學 | 14 | 1.2% |
祭 | 14 | 1.2% |
大 | 14 | 1.2% |
儀 | 13 | 1.1% |
Other values (387) | 938 |
CJK Compat
Value | Count | Frequency (%) |
㎝ | 32 |
Punctuation
Value | Count | Frequency (%) |
‘ | 11 | |
’ | 9 | |
“ | 2 | 8.7% |
” | 1 | 4.3% |
CJK Compat Ideographs
Value | Count | Frequency (%) |
樂 | 4 | |
李 | 2 | |
螺 | 2 | |
奈 | 1 | 5.6% |
靈 | 1 | 5.6% |
金 | 1 | 5.6% |
律 | 1 | 5.6% |
立 | 1 | 5.6% |
洞 | 1 | 5.6% |
洛 | 1 | 5.6% |
Other values (3) | 3 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 4 | |
ㄱ | 1 | 20.0% |
Math Operators
Value | Count | Frequency (%) |
∼ | 1 |
Misc Symbols
Value | Count | Frequency (%) |
♭ | 1 |
Geometric Shapes
Value | Count | Frequency (%) |
□ | 1 |
원본파일명
Text
MISSING
 
Distinct | 504 |
---|---|
Distinct (%) | 88.6% |
Missing | 29 |
Missing (%) | 4.8% |
Memory size | 4.8 KiB |
Length
Max length | 89 |
---|---|
Median length | 64 |
Mean length | 21.381371 |
Min length | 5 |
Characters and Unicode
Total characters | 12166 |
---|---|
Distinct characters | 514 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 474 ? |
---|---|
Unique (%) | 83.3% |
Sample
1st row | 대표이미지_거친음식도맛있게먹은퇴계이황_01.jpg |
---|---|
2nd row | 대표이미지_나물밥의소중함을알려준최영.jpg |
3rd row | 대표이미지_사랑의통장.jpg |
4th row | 대표이미지_선이의돌무더기.jpg |
5th row | 대표이미지_아빠바지의비밀.jpg |
Value | Count | Frequency (%) |
33-1.jpg | 30 | 3.6% |
연구기관 | 10 | 1.2% |
상세01_mapo | 9 | 1.1% |
평가편람_1_thumnaillist_list.jpg | 8 | 1.0% |
탄소중립 | 7 | 0.8% |
연구단 | 7 | 0.8% |
issue | 7 | 0.8% |
paper | 7 | 0.8% |
및 | 6 | 0.7% |
상세01_배달의 | 6 | 0.7% |
Other values (651) | 745 |
Most occurring characters
Value | Count | Frequency (%) |
_ | 1123 | 9.2% |
0 | 647 | 5.3% |
. | 590 | 4.8% |
p | 587 | 4.8% |
g | 551 | 4.5% |
1 | 542 | 4.5% |
j | 504 | 4.1% |
273 | 2.2% | |
이 | 206 | 1.7% |
a | 200 | 1.6% |
Other values (504) | 6943 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4576 | |
Lowercase Letter | 2987 | |
Decimal Number | 1984 | |
Connector Punctuation | 1123 | 9.2% |
Other Punctuation | 598 | 4.9% |
Uppercase Letter | 488 | 4.0% |
Space Separator | 273 | 2.2% |
Open Punctuation | 44 | 0.4% |
Close Punctuation | 44 | 0.4% |
Dash Punctuation | 41 | 0.3% |
Other values (2) | 8 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 206 | 4.5% |
지 | 184 | 4.0% |
미 | 182 | 4.0% |
대 | 177 | 3.9% |
표 | 157 | 3.4% |
아 | 110 | 2.4% |
상 | 104 | 2.3% |
라 | 98 | 2.1% |
세 | 95 | 2.1% |
드 | 94 | 2.1% |
Other values (430) | 3169 |
Lowercase Letter
Value | Count | Frequency (%) |
p | 587 | |
g | 551 | |
j | 504 | |
a | 200 | 6.7% |
t | 184 | 6.2% |
i | 171 | 5.7% |
l | 140 | 4.7% |
m | 107 | 3.6% |
n | 103 | 3.4% |
s | 100 | 3.3% |
Other values (15) | 340 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 91 | |
L | 53 | |
P | 47 | 9.6% |
C | 36 | 7.4% |
G | 30 | 6.1% |
S | 25 | 5.1% |
J | 23 | 4.7% |
R | 22 | 4.5% |
A | 18 | 3.7% |
E | 17 | 3.5% |
Other values (14) | 126 |
Decimal Number
Value | Count | Frequency (%) |
0 | 647 | |
1 | 542 | |
3 | 167 | 8.4% |
2 | 161 | 8.1% |
4 | 116 | 5.8% |
6 | 82 | 4.1% |
5 | 78 | 3.9% |
9 | 66 | 3.3% |
7 | 63 | 3.2% |
8 | 62 | 3.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 590 | |
, | 3 | 0.5% |
' | 2 | 0.3% |
′ | 2 | 0.3% |
& | 1 | 0.2% |
Other Number
Value | Count | Frequency (%) |
② | 1 | |
⑧ | 1 | |
③ | 1 | |
⑨ | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1123 |
Space Separator
Value | Count | Frequency (%) |
273 |
Open Punctuation
Value | Count | Frequency (%) |
( | 44 |
Close Punctuation
Value | Count | Frequency (%) |
) | 44 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 41 |
Math Symbol
Value | Count | Frequency (%) |
+ | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4575 | |
Common | 4115 | |
Latin | 3475 | |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 206 | 4.5% |
지 | 184 | 4.0% |
미 | 182 | 4.0% |
대 | 177 | 3.9% |
표 | 157 | 3.4% |
아 | 110 | 2.4% |
상 | 104 | 2.3% |
라 | 98 | 2.1% |
세 | 95 | 2.1% |
드 | 94 | 2.1% |
Other values (429) | 3168 |
Latin
Value | Count | Frequency (%) |
p | 587 | |
g | 551 | |
j | 504 | |
a | 200 | 5.8% |
t | 184 | 5.3% |
i | 171 | 4.9% |
l | 140 | 4.0% |
m | 107 | 3.1% |
n | 103 | 3.0% |
s | 100 | 2.9% |
Other values (39) | 828 |
Common
Value | Count | Frequency (%) |
_ | 1123 | |
0 | 647 | |
. | 590 | |
1 | 542 | |
273 | 6.6% | |
3 | 167 | 4.1% |
2 | 161 | 3.9% |
4 | 116 | 2.8% |
6 | 82 | 2.0% |
5 | 78 | 1.9% |
Other values (15) | 336 | 8.2% |
Han
Value | Count | Frequency (%) |
洞 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 7584 | |
Hangul | 4575 | |
Enclosed Alphanum | 4 | < 0.1% |
Punctuation | 2 | < 0.1% |
CJK | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
_ | 1123 | |
0 | 647 | 8.5% |
. | 590 | 7.8% |
p | 587 | 7.7% |
g | 551 | 7.3% |
1 | 542 | 7.1% |
j | 504 | 6.6% |
273 | 3.6% | |
a | 200 | 2.6% |
t | 184 | 2.4% |
Other values (59) | 2383 |
Hangul
Value | Count | Frequency (%) |
이 | 206 | 4.5% |
지 | 184 | 4.0% |
미 | 182 | 4.0% |
대 | 177 | 3.9% |
표 | 157 | 3.4% |
아 | 110 | 2.4% |
상 | 104 | 2.3% |
라 | 98 | 2.1% |
세 | 95 | 2.1% |
드 | 94 | 2.1% |
Other values (429) | 3168 |
Punctuation
Value | Count | Frequency (%) |
′ | 2 |
Enclosed Alphanum
Value | Count | Frequency (%) |
② | 1 | |
⑧ | 1 | |
③ | 1 | |
⑨ | 1 |
CJK
Value | Count | Frequency (%) |
洞 | 1 |
조회수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 513 |
---|---|
Distinct (%) | 92.6% |
Missing | 44 |
Missing (%) | 7.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4776.5469 |
Minimum | 1 |
---|---|
Maximum | 53454 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 64.95 |
Q1 | 1601 |
median | 3543.5 |
Q3 | 8171.25 |
95-th percentile | 12782.2 |
Maximum | 53454 |
Range | 53453 |
Interquartile range (IQR) | 6570.25 |
Descriptive statistics
Standard deviation | 4861.0487 |
---|---|
Coefficient of variation (CV) | 1.017691 |
Kurtosis | 26.735828 |
Mean | 4776.5469 |
Median Absolute Deviation (MAD) | 2325.5 |
Skewness | 3.7008589 |
Sum | 2646207 |
Variance | 23629794 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
8221 | 4 | 0.7% |
3279 | 3 | 0.5% |
35 | 3 | 0.5% |
520 | 3 | 0.5% |
369 | 3 | 0.5% |
429 | 3 | 0.5% |
8201 | 3 | 0.5% |
8266 | 3 | 0.5% |
3253 | 2 | 0.3% |
13917 | 2 | 0.3% |
Other values (503) | 525 | |
(Missing) | 44 | 7.4% |
Value | Count | Frequency (%) |
1 | 1 | 0.2% |
23 | 1 | 0.2% |
24 | 2 | |
26 | 2 | |
27 | 1 | 0.2% |
28 | 1 | 0.2% |
29 | 2 | |
30 | 1 | 0.2% |
32 | 2 | |
35 | 3 |
Value | Count | Frequency (%) |
53454 | 1 | |
43270 | 1 | |
31932 | 1 | |
27653 | 1 | |
18741 | 1 | |
18483 | 1 | |
17491 | 1 | |
17323 | 1 | |
17241 | 1 | |
17057 | 1 |
해시태그
Text
MISSING
 
Distinct | 340 |
---|---|
Distinct (%) | 57.8% |
Missing | 10 |
Missing (%) | 1.7% |
Memory size | 4.8 KiB |
Length
Max length | 157 |
---|---|
Median length | 80 |
Mean length | 26.894558 |
Min length | 3 |
Characters and Unicode
Total characters | 15814 |
---|---|
Distinct characters | 539 |
Distinct categories | 8 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 279 ? |
---|---|
Unique (%) | 47.4% |
Sample
1st row | #이야기,#할머니,#교육,#거친음식,#퇴계이황 |
---|---|
2nd row | #이야기,#할머니,#교육,#동화,#나물밥,#소중함,#최영 |
3rd row | #이야기,#할머니,#교육,#동화,#사랑,#통장 |
4th row | #이야기,#할머니,#교육,#동화,#선이,#돌무더기 |
5th row | #이야기,#할머니,#교육,#동화,#아빠,#바지,#비밀 |
Value | Count | Frequency (%) |
글꼴 | 50 | 3.2% |
폰트 | 49 | 3.2% |
경제인문사회연구회 | 43 | 2.8% |
국가비전 | 43 | 2.8% |
음성 | 32 | 2.1% |
전화 | 28 | 1.8% |
콜 | 28 | 1.8% |
콜센터 | 28 | 1.8% |
건강보호 | 28 | 1.8% |
음성안내 | 28 | 1.8% |
Other values (541) | 1197 |
Most occurring characters
Value | Count | Frequency (%) |
# | 2960 | 18.7% |
, | 2374 | 15.0% |
1105 | 7.0% | |
식 | 276 | 1.7% |
음 | 226 | 1.4% |
기 | 211 | 1.3% |
리 | 182 | 1.2% |
전 | 169 | 1.1% |
동 | 164 | 1.0% |
악 | 154 | 1.0% |
Other values (529) | 7993 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9146 | |
Other Punctuation | 5347 | |
Space Separator | 1105 | 7.0% |
Lowercase Letter | 82 | 0.5% |
Uppercase Letter | 65 | 0.4% |
Decimal Number | 59 | 0.4% |
Dash Punctuation | 8 | 0.1% |
Connector Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
식 | 276 | 3.0% |
음 | 226 | 2.5% |
기 | 211 | 2.3% |
리 | 182 | 2.0% |
전 | 169 | 1.8% |
동 | 164 | 1.8% |
악 | 154 | 1.7% |
산 | 135 | 1.5% |
소 | 135 | 1.5% |
화 | 131 | 1.4% |
Other values (484) | 7363 |
Lowercase Letter
Value | Count | Frequency (%) |
p | 21 | |
m | 21 | |
a | 8 | 9.8% |
g | 5 | 6.1% |
n | 4 | 4.9% |
e | 4 | 4.9% |
i | 4 | 4.9% |
s | 2 | 2.4% |
t | 2 | 2.4% |
z | 2 | 2.4% |
Other values (7) | 9 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 18 | |
E | 11 | |
B | 8 | |
K | 8 | |
L | 5 | 7.7% |
N | 4 | 6.2% |
I | 3 | 4.6% |
D | 2 | 3.1% |
M | 2 | 3.1% |
T | 2 | 3.1% |
Decimal Number
Value | Count | Frequency (%) |
4 | 24 | |
3 | 8 | 13.6% |
5 | 5 | 8.5% |
2 | 5 | 8.5% |
6 | 5 | 8.5% |
1 | 5 | 8.5% |
0 | 3 | 5.1% |
9 | 2 | 3.4% |
7 | 1 | 1.7% |
8 | 1 | 1.7% |
Other Punctuation
Value | Count | Frequency (%) |
# | 2960 | |
, | 2374 | |
: | 8 | 0.1% |
. | 5 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
1105 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 8 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9139 | |
Common | 6521 | |
Latin | 147 | 0.9% |
Han | 7 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
식 | 276 | 3.0% |
음 | 226 | 2.5% |
기 | 211 | 2.3% |
리 | 182 | 2.0% |
전 | 169 | 1.8% |
동 | 164 | 1.8% |
악 | 154 | 1.7% |
산 | 135 | 1.5% |
소 | 135 | 1.5% |
화 | 131 | 1.4% |
Other values (477) | 7356 |
Latin
Value | Count | Frequency (%) |
p | 21 | |
m | 21 | |
O | 18 | |
E | 11 | 7.5% |
B | 8 | 5.4% |
K | 8 | 5.4% |
a | 8 | 5.4% |
L | 5 | 3.4% |
g | 5 | 3.4% |
N | 4 | 2.7% |
Other values (18) | 38 |
Common
Value | Count | Frequency (%) |
# | 2960 | |
, | 2374 | |
1105 | 16.9% | |
4 | 24 | 0.4% |
- | 8 | 0.1% |
: | 8 | 0.1% |
3 | 8 | 0.1% |
5 | 5 | 0.1% |
2 | 5 | 0.1% |
6 | 5 | 0.1% |
Other values (7) | 19 | 0.3% |
Han
Value | Count | Frequency (%) |
第 | 1 | |
告 | 1 | |
報 | 1 | |
十 | 1 | |
六 | 1 | |
五 | 1 | |
號 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9139 | |
ASCII | 6668 | |
CJK | 6 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
# | 2960 | |
, | 2374 | |
1105 | 16.6% | |
4 | 24 | 0.4% |
p | 21 | 0.3% |
m | 21 | 0.3% |
O | 18 | 0.3% |
E | 11 | 0.2% |
- | 8 | 0.1% |
B | 8 | 0.1% |
Other values (35) | 118 | 1.8% |
Hangul
Value | Count | Frequency (%) |
식 | 276 | 3.0% |
음 | 226 | 2.5% |
기 | 211 | 2.3% |
리 | 182 | 2.0% |
전 | 169 | 1.8% |
동 | 164 | 1.8% |
악 | 154 | 1.7% |
산 | 135 | 1.5% |
소 | 135 | 1.5% |
화 | 131 | 1.4% |
Other values (477) | 7356 |
CJK
Value | Count | Frequency (%) |
第 | 1 | |
告 | 1 | |
報 | 1 | |
十 | 1 | |
五 | 1 | |
號 | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
六 | 1 |
등록일
Date
Distinct | 38 |
---|---|
Distinct (%) | 6.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
Minimum | 1996-01-01 00:00:00 |
---|---|
Maximum | 2023-08-08 00:00:00 |
사이트주소
Categorical
HIGH CORRELATION
 
Distinct | 49 |
---|---|
Distinct (%) | 8.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
<NA> | |
---|---|
https://www.gugak.go.kr/site/main/index001 | |
https://www.at.or.kr/home/apko000000/index.action | |
https://www.koreastudy.or.kr/ | |
https://www.kosha.or.kr/kosha/index.do | |
Other values (44) |
Length
Max length | 56 |
---|---|
Median length | 47 |
Mean length | 30.536789 |
Min length | 4 |
Unique
Unique | 19 ? |
---|---|
Unique (%) | 3.2% |
Sample
1st row | https://www.koreastudy.or.kr/ |
---|---|
2nd row | https://www.koreastudy.or.kr/ |
3rd row | https://www.koreastudy.or.kr/ |
4th row | https://www.koreastudy.or.kr/ |
5th row | https://www.koreastudy.or.kr/ |
Common Values
Value | Count | Frequency (%) |
<NA> | 127 | |
https://www.gugak.go.kr/site/main/index001 | 92 | |
https://www.at.or.kr/home/apko000000/index.action | 90 | |
https://www.koreastudy.or.kr/ | 61 | |
https://www.kosha.or.kr/kosha/index.do | 41 | 6.9% |
https://www.nibr.go.kr/ | 28 | 4.7% |
http://gomuseum.seoul.go.kr/sekm/front/main.do?locale=KO | 23 | 3.8% |
https://www.mmk.or.kr/ | 15 | 2.5% |
https://www.incheon.go.kr/index | 11 | 1.8% |
https://www.mapo.go.kr/site/main/home | 9 | 1.5% |
Other values (39) | 101 |
Length
Value | Count | Frequency (%) |
na | 127 | |
https://www.gugak.go.kr/site/main/index001 | 92 | |
https://www.at.or.kr/home/apko000000/index.action | 90 | |
https://www.koreastudy.or.kr | 61 | |
https://www.kosha.or.kr/kosha/index.do | 41 | 6.9% |
https://www.nibr.go.kr | 28 | 4.7% |
http://gomuseum.seoul.go.kr/sekm/front/main.do?locale=ko | 23 | 3.8% |
https://www.mmk.or.kr | 15 | 2.5% |
https://www.incheon.go.kr/index | 11 | 1.8% |
https://www.mapo.go.kr/site/main/home | 9 | 1.5% |
Other values (39) | 101 |
촬영년도 | 촬영원본 | 원본소유자 | 국가 | 재질 | 조회수 | 등록일 | 사이트주소 | |
---|---|---|---|---|---|---|---|---|
촬영년도 | 1.000 | 0.997 | 0.993 | 0.519 | 0.813 | 0.288 | 0.996 | 0.988 |
촬영원본 | 0.997 | 1.000 | 1.000 | 0.946 | 0.000 | 0.916 | 0.998 | 1.000 |
원본소유자 | 0.993 | 1.000 | 1.000 | 0.952 | 0.000 | 0.891 | 0.996 | 1.000 |
국가 | 0.519 | 0.946 | 0.952 | 1.000 | 0.879 | 0.280 | 0.667 | 0.940 |
재질 | 0.813 | 0.000 | 0.000 | 0.879 | 1.000 | 0.000 | 0.000 | 0.000 |
조회수 | 0.288 | 0.916 | 0.891 | 0.280 | 0.000 | 1.000 | 0.515 | 0.891 |
등록일 | 0.996 | 0.998 | 0.996 | 0.667 | 0.000 | 0.515 | 1.000 | 0.981 |
사이트주소 | 0.988 | 1.000 | 1.000 | 0.940 | 0.000 | 0.891 | 0.981 | 1.000 |
국가 | 재질 | 사이트주소 | |
---|---|---|---|
국가 | 1.000 | 0.622 | 0.695 |
재질 | 0.622 | 1.000 | 0.000 |
사이트주소 | 0.695 | 0.000 | 1.000 |
촬영년도 | 조회수 | 국가 | 재질 | 사이트주소 | |
---|---|---|---|---|---|
촬영년도 | 1.000 | -0.236 | 0.328 | 0.594 | 0.721 |
조회수 | -0.236 | 1.000 | 0.101 | 0.000 | 0.587 |
국가 | 0.328 | 0.101 | 1.000 | 0.622 | 0.695 |
재질 | 0.594 | 0.000 | 0.622 | 1.000 | 0.000 |
사이트주소 | 0.721 | 0.587 | 0.695 | 0.000 | 1.000 |
제목 | 촬영년도 | 촬영원본 | 원본소유자 | 국가 | 재질 | 컨텐츠캡션 | 원본파일명 | 조회수 | 해시태그 | 등록일 | 사이트주소 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 거친음식도맛있게먹은퇴계이황 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_거친음식도맛있게먹은퇴계이황_01.jpg | 3456 | #이야기,#할머니,#교육,#거친음식,#퇴계이황 | 2016-01-01 | https://www.koreastudy.or.kr/ |
1 | 나물밥의소중함을알려준최영 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_나물밥의소중함을알려준최영.jpg | 3005 | #이야기,#할머니,#교육,#동화,#나물밥,#소중함,#최영 | 2016-01-01 | https://www.koreastudy.or.kr/ |
2 | 사랑의통장 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_사랑의통장.jpg | 2981 | #이야기,#할머니,#교육,#동화,#사랑,#통장 | 2016-01-01 | https://www.koreastudy.or.kr/ |
3 | 선이의돌무더기 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_선이의돌무더기.jpg | 2594 | #이야기,#할머니,#교육,#동화,#선이,#돌무더기 | 2016-01-01 | https://www.koreastudy.or.kr/ |
4 | 아빠바지의비밀 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_아빠바지의비밀.jpg | 1979 | #이야기,#할머니,#교육,#동화,#아빠,#바지,#비밀 | 2016-01-01 | https://www.koreastudy.or.kr/ |
5 | 울릉도와독도는우리땅안용복 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_울릉도와독도는우리땅안용복.jpg | 2521 | #이야기,#할머니,#교육,#동화,#울릉도,#독도,#우리땅,#안용복 | 2016-01-01 | https://www.koreastudy.or.kr/ |
6 | 원숭이의잔꾀 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_원숭이의잔꾀.jpg | 2042 | #이야기,#할머니,#교육,#동화,#원숭이,#잔꾀 | 2016-01-01 | https://www.koreastudy.or.kr/ |
7 | 은혜갚은구렁이 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_은혜갚은구렁이_01.jpg | 2000 | #이야기,#할머니,#교육,#동화,#은혜,#구렁이 | 2016-01-01 | https://www.koreastudy.or.kr/ |
8 | 작은실수를스스로밝힌이산두 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_작은실수를스스로밝힌이산두.jpg | 2168 | #이야기,#할머니,#교육,#동화,#실수,#이산두 | 2016-01-01 | https://www.koreastudy.or.kr/ |
9 | 주인을구한강아지 | 2016 | 한국국학진흥원 | 한국국학진흥원 | 한국 | <NA> | 출처를 표시하고 이용조건에 따라 사용해주세요. | 대표이미지_주인을구한강아지.jpg | 2002 | #이야기,#할머니,#교육,#동화,#주인,#강아지 | 2016-01-01 | https://www.koreastudy.or.kr/ |
제목 | 촬영년도 | 촬영원본 | 원본소유자 | 국가 | 재질 | 컨텐츠캡션 | 원본파일명 | 조회수 | 해시태그 | 등록일 | 사이트주소 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
588 | [컬러링북] 트릭종이접기(Origami) | 2022 | 아산시 | 아산시 | 한국 | <NA> | 트릭종이접기(Origami) 컬러링북 | 컬러링북_0084_트릭종이접기(Origami)_1_thumnail.jpg | 41 | #아산시,#컬러링북,#야미야미,#캐릭터 | 2023-06-28 | <NA> |
589 | [컬러링북] 팝업카드(Pop-Up Card) | 2022 | 아산시 | 아산시 | 한국 | <NA> | 팝업카드(Pop-Up Card) 컬러링북 | 컬러링북_0085_팝업카드(Pop-Up Card)_1_thumnail.jpg | 42 | #아산시,#컬러링북,#야미야미,#캐릭터 | 2023-06-28 | <NA> |
590 | [컬러링북] 퍼즐(Puzzle) | 2022 | 아산시 | 아산시 | 한국 | <NA> | 퍼즐(Puzzle) 컬러링북 | 컬러링북_0086_퍼즐(Puzzle)_1_thumnail.jpg | 47 | #아산시,#컬러링북,#야미야미,#캐릭터 | 2023-06-28 | <NA> |
591 | [컬러링북] 표정 변하는 바나 인형(Changing Face Bana) | 2022 | 아산시 | 아산시 | 한국 | <NA> | 표정 변하는 바나 인형(Changing Face Bana) 컬러링북 | 컬러링북_0087_표정 변하는 바나 인형(Changing Face Bana)_1_thumnail.jpg | 43 | #아산시,#컬러링북,#야미야미,#캐릭터 | 2023-06-28 | <NA> |
592 | 국토정중앙 메아리지 8호 | 2023 | 강원특별자치도 양구군 | 강원특별자치도 양구군 | 한국 | <NA> | <p>2023년 8월 국토정중앙 메아리</p> | 8월 양구소식지.pdf_page_01.jpg | 296 | #국토정중앙, #메아리지, #양구 | 2023-08-08 | <NA> |
593 | 옹진군 2023년 6월호 해당화소식지 | 2023 | 인천광역시 옹진군 | 인천광역시 옹진군 | 한국 | <NA> | <p>인천광역시 옹진군 소식지</p> | 2023년 6월호 해당화소식지.pdf_page_01.jpg | 342 | #해당화 소식지, #옹진군 | 2023-07-17 | <NA> |
594 | 광주광역시 광산구 2023년 7월 광산구보 | 2023 | 광주광역시 광산구 | 광주광역시 광산구 | 한국 | <NA> | <p>광주광역시 광산구청 7월 광산구보</p> | 광산구보 제349호(2023년 7월).pdf_page_01.jpg | 278 | #광산구, #광산구보 | 2023-08-08 | <NA> |
595 | 포항시 문화재 안내책자 | 2022 | 경상북도 포항시 | 경상북도 포항시 | 한국 | <NA> | <p>포항시 문화재 안내책자</p> | 2022 우리고장문화재.pdf_page_001.jpg | 36 | #문화재 | 2023-07-26 | <NA> |
596 | 2023년 동(洞) 간호직공무원 활동사례 수기 공모전 수상작 | 2023 | 경기도 시흥시 | 경기도 시흥시 | 한국 | <NA> | <p>□ 시흥시 「찾아가는 보건복지서비스」 및 「돌봄SOS센터」 활동 우수사례 공유 및 확산을 위해 개최한 간호직공무원 대상 수기 공모전 수상작</p> | 2023년 동(洞) 간호직공무원 활동사례 수기 공모전 수상작.pdf_page_01.jpg | 80 | #시흥시, #보건복지서비스, #복지, #건강서비스, #간호직, #간호직공무원, #동간호사, #활동사례, #우수사례, #수기, #공모전, #수상작 | 2023-07-12 | <NA> |
597 | 2023 나이스미추 6월호 | 2023 | 인천광역시 미추홀구 | 인천 미추홀구 | 한국 | <NA> | <p>인천광역시 미추홀구의 월간 소식지</p> | 나이스미추 2023년+6월호.pdf_page_01.jpg | 66 | #나이스미추, #미추홀구 | 2023-06-30 | <NA> |
Most frequently occurring
제목 | 촬영년도 | 촬영원본 | 원본소유자 | 국가 | 재질 | 컨텐츠캡션 | 원본파일명 | 조회수 | 해시태그 | 등록일 | 사이트주소 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 고객응대근로자 보호 전화연결음 - 남자 | 2021 | 한국산업안전보건공단 | 한국산업안전보건공단 | 한국 | <NA> | <p>2019~2020년에 개발된 고객응대근로자 전화연결음 25종을 게시하오니, 사업장 환경에 맞게 자유롭게 편집하여 활용하시기 바랍니다.</p> | 33-1.jpg | 3757 | #고객응대, #감정노동, #전화연결음, #전화, #콜, #콜센터, #건강보호, #음성안내, #음성 | 2021-01-01 | https://www.kosha.or.kr/kosha/index.do | 2 |
1 | 고객응대근로자 보호 전화연결음 - 남자 | 2021 | 한국산업안전보건공단 | 한국산업안전보건공단 | 한국 | <NA> | <p>2019~2020년에 개발된 고객응대근로자 전화연결음 25종을 게시하오니, 사업장 환경에 맞게 자유롭게 편집하여 활용하시기 바랍니다.</p> | 33-1.jpg | 4013 | #고객응대, #감정노동, #전화연결음, #전화, #콜, #콜센터, #건강보호, #음성안내, #음성 | 2021-01-01 | https://www.kosha.or.kr/kosha/index.do | 2 |
2 | 고객응대근로자 보호 전화연결음 - 남자 | 2021 | 한국산업안전보건공단 | 한국산업안전보건공단 | 한국 | <NA> | <p>2019~2020년에 개발된 고객응대근로자 전화연결음 25종을 게시하오니, 사업장 환경에 맞게 자유롭게 편집하여 활용하시기 바랍니다.</p> | 33-1.jpg | 4047 | #고객응대, #감정노동, #전화연결음, #전화, #콜, #콜센터, #건강보호, #음성안내, #음성 | 2021-01-01 | https://www.kosha.or.kr/kosha/index.do | 2 |