Dataset statistics
Number of variables | 36 |
---|---|
Number of observations | 10000 |
Missing cells | 99552 |
Missing cells (%) | 27.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.9 MiB |
Average record size in memory | 305.0 B |
Variable types
Numeric | 6 |
---|---|
Categorical | 12 |
Text | 12 |
DateTime | 5 |
Unsupported | 1 |
Dataset
Description | 문화체육관광부_정책브리핑_포토는 정책브리핑에서 서비스하는 사진기사에 대한 기본정보를 나타내는 데이터 셋 입니다 |
---|---|
Author | 문화체육관광부 |
URL | https://www.data.go.kr/data/15071090/fileData.do |
상태코드 has constant value "" | Constant |
주제코드 is highly imbalanced (53.8%) | Imbalance |
소속코드 is highly imbalanced (68.0%) | Imbalance |
기자기수아이디 is highly imbalanced (95.1%) | Imbalance |
사진기제작자코드 is highly imbalanced (51.0%) | Imbalance |
기사글분류코드 is highly imbalanced (95.7%) | Imbalance |
공공누리자유사용여부 is highly imbalanced (77.2%) | Imbalance |
공공누리유형코드 is highly imbalanced (84.5%) | Imbalance |
사진출처정보 is highly imbalanced (62.1%) | Imbalance |
부가정보 is highly imbalanced (99.8%) | Imbalance |
정렬순서 is highly imbalanced (88.8%) | Imbalance |
최종수정자아이디 is highly imbalanced (71.0%) | Imbalance |
기사글부제목 has 8789 (87.9%) missing values | Missing |
기사글내용 has 7458 (74.6%) missing values | Missing |
기사글태그정보 has 8057 (80.6%) missing values | Missing |
사진기기기종류명 has 7013 (70.1%) missing values | Missing |
촬영지역명 has 6761 (67.6%) missing values | Missing |
촬영지역상세주소 has 6829 (68.3%) missing values | Missing |
촬영날짜정보 has 6761 (67.6%) missing values | Missing |
촬영행위자명 has 7129 (71.3%) missing values | Missing |
썸네일저장주소 has 6271 (62.7%) missing values | Missing |
역사일자 has 2871 (28.7%) missing values | Missing |
이력년월 has 2871 (28.7%) missing values | Missing |
대표사진내용 has 9242 (92.4%) missing values | Missing |
상세주소 has 9500 (95.0%) missing values | Missing |
날짜표시구분 has 10000 (100.0%) missing values | Missing |
조회수 is highly skewed (γ1 = 28.21589233) | Skewed |
기사글번호 has unique values | Unique |
날짜표시구분 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
부모기사글번호 has 9851 (98.5%) zeros | Zeros |
추천수 has 8116 (81.2%) zeros | Zeros |
조회수 has 6762 (67.6%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 05:03:59.993765 |
---|---|
Analysis finished | 2023-12-12 05:04:04.740062 |
Duration | 4.75 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기사글번호
Real number (ℝ)
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9379.392 |
Minimum | 9 |
---|---|
Maximum | 47608 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 9 |
---|---|
5-th percentile | 1038.9 |
Q1 | 4735.75 |
median | 8828 |
Q3 | 13310.75 |
95-th percentile | 16878.05 |
Maximum | 47608 |
Range | 47599 |
Interquartile range (IQR) | 8575 |
Descriptive statistics
Standard deviation | 6803.9643 |
---|---|
Coefficient of variation (CV) | 0.72541635 |
Kurtosis | 12.22085 |
Mean | 9379.392 |
Median Absolute Deviation (MAD) | 4284.5 |
Skewness | 2.4914652 |
Sum | 93793920 |
Variance | 46293930 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
5321 | 1 | < 0.1% |
8651 | 1 | < 0.1% |
1777 | 1 | < 0.1% |
16831 | 1 | < 0.1% |
5196 | 1 | < 0.1% |
9707 | 1 | < 0.1% |
8959 | 1 | < 0.1% |
5677 | 1 | < 0.1% |
9788 | 1 | < 0.1% |
11562 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
9 | 1 | |
10 | 1 | |
25 | 1 | |
26 | 1 | |
27 | 1 | |
28 | 1 | |
34 | 1 | |
36 | 1 | |
37 | 1 | |
38 | 1 |
Value | Count | Frequency (%) |
47608 | 1 | |
47607 | 1 | |
47606 | 1 | |
47605 | 1 | |
47603 | 1 | |
47602 | 1 | |
47601 | 1 | |
47600 | 1 | |
47599 | 1 | |
47598 | 1 |
주제코드
Categorical
IMBALANCE
 
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
역사박물관 | |
---|---|
정부부처 | |
대통령 | 585 |
국무총리 | 484 |
역사속의 오늘 | 358 |
Other values (6) | 238 |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 4.7623 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 역사박물관 |
---|---|
2nd row | 역사박물관 |
3rd row | 역사박물관 |
4th row | 역사박물관 |
5th row | 역사박물관 |
Common Values
Value | Count | Frequency (%) |
역사박물관 | 6761 | |
정부부처 | 1574 | 15.7% |
대통령 | 585 | 5.9% |
국무총리 | 484 | 4.8% |
역사속의 오늘 | 358 | 3.6% |
국민속으로 | 124 | 1.2% |
출사지 소식 | 51 | 0.5% |
생활의 발견 | 38 | 0.4% |
그때 그 시절 | 12 | 0.1% |
오늘의 물가 | 10 | 0.1% |
Length
Value | Count | Frequency (%) |
역사박물관 | 6761 | |
정부부처 | 1574 | 15.0% |
대통령 | 585 | 5.6% |
국무총리 | 484 | 4.6% |
역사속의 | 358 | 3.4% |
오늘 | 358 | 3.4% |
국민속으로 | 124 | 1.2% |
출사지 | 51 | 0.5% |
소식 | 51 | 0.5% |
발견 | 38 | 0.4% |
Other values (9) | 103 | 1.0% |
소속코드
Categorical
IMBALANCE
 
Distinct | 41 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
국민소통실 | |
---|---|
국무조정실 | 484 |
문화체육관광부 | 220 |
조달청 | 166 |
통일부 | 158 |
Other values (36) |
Length
Max length | 8 |
---|---|
Median length | 5 |
Mean length | 4.93 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 국민소통실 |
---|---|
2nd row | 국민소통실 |
3rd row | 국민소통실 |
4th row | 국민소통실 |
5th row | 국민소통실 |
Common Values
Value | Count | Frequency (%) |
국민소통실 | 7767 | |
국무조정실 | 484 | 4.8% |
문화체육관광부 | 220 | 2.2% |
조달청 | 166 | 1.7% |
통일부 | 158 | 1.6% |
기자단 | 129 | 1.3% |
중소기업청 | 104 | 1.0% |
소방방재청 | 102 | 1.0% |
기상청 | 95 | 0.9% |
방송통신위원회 | 91 | 0.9% |
Other values (31) | 684 | 6.8% |
Length
Value | Count | Frequency (%) |
국민소통실 | 7767 | |
국무조정실 | 484 | 4.8% |
문화체육관광부 | 220 | 2.2% |
조달청 | 166 | 1.7% |
통일부 | 158 | 1.6% |
기자단 | 129 | 1.3% |
중소기업청 | 104 | 1.0% |
소방방재청 | 102 | 1.0% |
기상청 | 95 | 0.9% |
방송통신위원회 | 91 | 0.9% |
Other values (31) | 684 | 6.8% |
부모기사글번호
Real number (ℝ)
ZEROS
 
Distinct | 10 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.0958 |
Minimum | 0 |
---|---|
Maximum | 10 |
Zeros | 9851 |
Zeros (%) | 98.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 0 |
Maximum | 10 |
Range | 10 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.86318994 |
---|---|
Coefficient of variation (CV) | 9.0103334 |
Kurtosis | 99.540273 |
Mean | 0.0958 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 9.8415619 |
Sum | 958 |
Variance | 0.74509687 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 9851 | |
10 | 33 | 0.3% |
9 | 24 | 0.2% |
4 | 22 | 0.2% |
8 | 20 | 0.2% |
2 | 20 | 0.2% |
3 | 19 | 0.2% |
6 | 4 | < 0.1% |
7 | 4 | < 0.1% |
5 | 3 | < 0.1% |
Value | Count | Frequency (%) |
0 | 9851 | |
2 | 20 | 0.2% |
3 | 19 | 0.2% |
4 | 22 | 0.2% |
5 | 3 | < 0.1% |
6 | 4 | < 0.1% |
7 | 4 | < 0.1% |
8 | 20 | 0.2% |
9 | 24 | 0.2% |
10 | 33 | 0.3% |
Value | Count | Frequency (%) |
10 | 33 | 0.3% |
9 | 24 | 0.2% |
8 | 20 | 0.2% |
7 | 4 | < 0.1% |
6 | 4 | < 0.1% |
5 | 3 | < 0.1% |
4 | 22 | 0.2% |
3 | 19 | 0.2% |
2 | 20 | 0.2% |
0 | 9851 |
기사글제목
Text
Distinct | 9903 |
---|---|
Distinct (%) | 99.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 88 |
---|---|
Median length | 47 |
Mean length | 21.5525 |
Min length | 1 |
Characters and Unicode
Total characters | 215525 |
---|---|
Distinct characters | 1246 |
Distinct categories | 16 ? |
Distinct scripts | 4 ? |
Distinct blocks | 12 ? |
Unique
Unique | 9846 ? |
---|---|
Unique (%) | 98.5% |
Sample
1st row | 한국과학기술연구소 KIST 발족 |
---|---|
2nd row | 안창호·이대위 등, 샌프란시스코에 친목회 조직 |
3rd row | <한국일보>, |
4th row | 일왕 히로이토, 항복 방송 |
5th row | 한국국제기아·질병·문맹퇴지기구, 북한 수해복구 첫 지원 |
Value | Count | Frequency (%) |
총리 | 500 | 1.1% |
대통령 | 427 | 0.9% |
등 | 342 | 0.7% |
개최 | 298 | 0.6% |
발표 | 298 | 0.6% |
및 | 264 | 0.6% |
방문 | 247 | 0.5% |
첫 | 236 | 0.5% |
· | 226 | 0.5% |
공포 | 201 | 0.4% |
Other values (21838) | 44469 |
Most occurring characters
Value | Count | Frequency (%) |
37810 | 17.5% | |
, | 5295 | 2.5% |
국 | 3327 | 1.5% |
대 | 3178 | 1.5% |
회 | 3128 | 1.5% |
1 | 2918 | 1.4% |
사 | 2508 | 1.2% |
한 | 2485 | 1.2% |
정 | 2354 | 1.1% |
제 | 2261 | 1.0% |
Other values (1236) | 150261 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 151414 | |
Space Separator | 37810 | 17.5% |
Decimal Number | 9877 | 4.6% |
Other Punctuation | 8359 | 3.9% |
Uppercase Letter | 2158 | 1.0% |
Open Punctuation | 1525 | 0.7% |
Close Punctuation | 1516 | 0.7% |
Dash Punctuation | 758 | 0.4% |
Math Symbol | 705 | 0.3% |
Final Punctuation | 639 | 0.3% |
Other values (6) | 764 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 3327 | 2.2% |
대 | 3178 | 2.1% |
회 | 3128 | 2.1% |
사 | 2508 | 1.7% |
한 | 2485 | 1.6% |
정 | 2354 | 1.6% |
제 | 2261 | 1.5% |
의 | 2065 | 1.4% |
개 | 1886 | 1.2% |
기 | 1822 | 1.2% |
Other values (1124) | 126400 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 200 | 9.3% |
C | 171 | 7.9% |
S | 152 | 7.0% |
K | 144 | 6.7% |
T | 143 | 6.6% |
B | 139 | 6.4% |
M | 138 | 6.4% |
O | 127 | 5.9% |
I | 115 | 5.3% |
E | 103 | 4.8% |
Other values (16) | 726 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 75 | |
e | 47 | |
k | 40 | 8.2% |
a | 38 | 7.8% |
r | 38 | 7.8% |
o | 37 | 7.6% |
i | 28 | 5.8% |
n | 26 | 5.3% |
t | 25 | 5.1% |
l | 22 | 4.5% |
Other values (15) | 110 |
Other Punctuation
Value | Count | Frequency (%) |
, | 5295 | |
· | 1016 | 12.2% |
' | 878 | 10.5% |
. | 866 | 10.4% |
" | 120 | 1.4% |
: | 70 | 0.8% |
! | 28 | 0.3% |
? | 23 | 0.3% |
/ | 18 | 0.2% |
& | 15 | 0.2% |
Other values (5) | 30 | 0.4% |
Decimal Number
Value | Count | Frequency (%) |
1 | 2918 | |
2 | 1604 | |
0 | 1378 | |
3 | 803 | 8.1% |
5 | 694 | 7.0% |
9 | 585 | 5.9% |
4 | 541 | 5.5% |
6 | 497 | 5.0% |
8 | 460 | 4.7% |
7 | 397 | 4.0% |
Math Symbol
Value | Count | Frequency (%) |
~ | 268 | |
< | 181 | |
> | 181 | |
↔ | 38 | 5.4% |
∼ | 18 | 2.6% |
→ | 11 | 1.6% |
+ | 8 | 1.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1211 | |
[ | 231 | 15.1% |
「 | 51 | 3.3% |
『 | 22 | 1.4% |
( | 8 | 0.5% |
[ | 2 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1201 | |
] | 231 | 15.2% |
」 | 52 | 3.4% |
』 | 22 | 1.5% |
) | 8 | 0.5% |
] | 2 | 0.1% |
Other Symbol
Value | Count | Frequency (%) |
㎞ | 6 | |
㈜ | 6 | |
㎝ | 3 | |
㎾ | 1 | 5.6% |
㎿ | 1 | 5.6% |
☆ | 1 | 5.6% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 757 | |
- | 1 | 0.1% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 629 | |
” | 10 | 1.6% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 226 | |
“ | 11 | 4.6% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 | |
Ⅰ | 1 |
Space Separator
Value | Count | Frequency (%) |
37810 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 20 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 151117 | |
Common | 61459 | |
Latin | 2646 | 1.2% |
Han | 303 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 3327 | 2.2% |
대 | 3178 | 2.1% |
회 | 3128 | 2.1% |
사 | 2508 | 1.7% |
한 | 2485 | 1.6% |
정 | 2354 | 1.6% |
제 | 2261 | 1.5% |
의 | 2065 | 1.4% |
개 | 1886 | 1.2% |
기 | 1822 | 1.2% |
Other values (910) | 126103 |
Han
Value | Count | Frequency (%) |
故 | 8 | 2.6% |
鮮 | 5 | 1.7% |
丸 | 5 | 1.7% |
美 | 4 | 1.3% |
正 | 4 | 1.3% |
朝 | 4 | 1.3% |
府 | 4 | 1.3% |
民 | 4 | 1.3% |
會 | 4 | 1.3% |
醫 | 3 | 1.0% |
Other values (205) | 258 |
Common
Value | Count | Frequency (%) |
37810 | ||
, | 5295 | 8.6% |
1 | 2918 | 4.7% |
2 | 1604 | 2.6% |
0 | 1378 | 2.2% |
( | 1211 | 2.0% |
) | 1201 | 2.0% |
· | 1016 | 1.7% |
' | 878 | 1.4% |
. | 866 | 1.4% |
Other values (48) | 7282 | 11.8% |
Latin
Value | Count | Frequency (%) |
A | 200 | 7.6% |
C | 171 | 6.5% |
S | 152 | 5.7% |
K | 144 | 5.4% |
T | 143 | 5.4% |
B | 139 | 5.3% |
M | 138 | 5.2% |
O | 127 | 4.8% |
I | 115 | 4.3% |
E | 103 | 3.9% |
Other values (43) | 1214 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 151078 | |
ASCII | 61949 | |
None | 1201 | 0.6% |
Punctuation | 880 | 0.4% |
CJK | 296 | 0.1% |
Arrows | 49 | < 0.1% |
Compat Jamo | 33 | < 0.1% |
Math Operators | 18 | < 0.1% |
CJK Compat | 11 | < 0.1% |
CJK Compat Ideographs | 7 | < 0.1% |
Other values (2) | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
37810 | ||
, | 5295 | 8.5% |
1 | 2918 | 4.7% |
2 | 1604 | 2.6% |
0 | 1378 | 2.2% |
( | 1211 | 2.0% |
) | 1201 | 1.9% |
' | 878 | 1.4% |
. | 866 | 1.4% |
3 | 803 | 1.3% |
Other values (74) | 7985 | 12.9% |
Hangul
Value | Count | Frequency (%) |
국 | 3327 | 2.2% |
대 | 3178 | 2.1% |
회 | 3128 | 2.1% |
사 | 2508 | 1.7% |
한 | 2485 | 1.6% |
정 | 2354 | 1.6% |
제 | 2261 | 1.5% |
의 | 2065 | 1.4% |
개 | 1886 | 1.2% |
기 | 1822 | 1.2% |
Other values (908) | 126064 |
None
Value | Count | Frequency (%) |
· | 1016 | |
」 | 52 | 4.3% |
「 | 51 | 4.2% |
』 | 22 | 1.8% |
『 | 22 | 1.8% |
' | 10 | 0.8% |
( | 8 | 0.7% |
) | 8 | 0.7% |
㈜ | 6 | 0.5% |
[ | 2 | 0.2% |
Other values (3) | 4 | 0.3% |
Punctuation
Value | Count | Frequency (%) |
’ | 629 | |
‘ | 226 | 25.7% |
“ | 11 | 1.2% |
” | 10 | 1.1% |
… | 4 | 0.5% |
Arrows
Value | Count | Frequency (%) |
↔ | 38 | |
→ | 11 | 22.4% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 33 |
Math Operators
Value | Count | Frequency (%) |
∼ | 18 |
CJK
Value | Count | Frequency (%) |
故 | 8 | 2.7% |
鮮 | 5 | 1.7% |
丸 | 5 | 1.7% |
美 | 4 | 1.4% |
正 | 4 | 1.4% |
朝 | 4 | 1.4% |
府 | 4 | 1.4% |
民 | 4 | 1.4% |
會 | 4 | 1.4% |
醫 | 3 | 1.0% |
Other values (200) | 251 |
CJK Compat
Value | Count | Frequency (%) |
㎞ | 6 | |
㎝ | 3 | |
㎾ | 1 | 9.1% |
㎿ | 1 | 9.1% |
CJK Compat Ideographs
Value | Count | Frequency (%) |
金 | 2 | |
羅 | 2 | |
癩 | 1 | |
禮 | 1 | |
李 | 1 |
Misc Symbols
Value | Count | Frequency (%) |
☆ | 1 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 | |
Ⅰ | 1 |
기사글부제목
Text
MISSING
 
Distinct | 1153 |
---|---|
Distinct (%) | 95.2% |
Missing | 8789 |
Missing (%) | 87.9% |
Memory size | 156.2 KiB |
Length
Max length | 187 |
---|---|
Median length | 113 |
Mean length | 24.398018 |
Min length | 1 |
Characters and Unicode
Total characters | 29546 |
---|---|
Distinct characters | 747 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 7 ? |
Unique
Unique | 1136 ? |
---|---|
Unique (%) | 93.8% |
Sample
1st row | 남북관계의 긴장이 완화되면서 백운찬 관세청장이 도라산사무소를 방문했다. 백 청장은 4일 민통선 남방한계선 700m, 북한 개성까지는 12km에 위치한 서울세관 도라산 사무소를 방문해 업무 현황을 보고 받고, 도라산 사무소 직원들을 격려하는 시간을 가졌다. |
---|---|
2nd row | 박창명 병무청장이 인사말을 하고 있다. |
3rd row | 해상예보와 특보에 활용, 신안군 앞바다 해양기상부이 설치 |
4th row | 청년창업 한마당 투어(호서대) |
5th row | 강원도 고성 산불 |
Value | Count | Frequency (%) |
총리 | 242 | 3.6% |
정 | 150 | 2.2% |
방문 | 76 | 1.1% |
및 | 76 | 1.1% |
2013년 | 67 | 1.0% |
정홍원 | 60 | 0.9% |
주재 | 58 | 0.9% |
국토교통부 | 52 | 0.8% |
대통령 | 49 | 0.7% |
45 | 0.7% | |
Other values (3603) | 5910 |
Most occurring characters
Value | Count | Frequency (%) |
5683 | 19.2% | |
정 | 469 | 1.6% |
회 | 448 | 1.5% |
장 | 404 | 1.4% |
국 | 395 | 1.3% |
기 | 387 | 1.3% |
, | 386 | 1.3% |
리 | 361 | 1.2% |
대 | 347 | 1.2% |
의 | 341 | 1.2% |
Other values (737) | 20325 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 21066 | |
Space Separator | 5683 | 19.2% |
Decimal Number | 1221 | 4.1% |
Other Punctuation | 763 | 2.6% |
Uppercase Letter | 331 | 1.1% |
Lowercase Letter | 150 | 0.5% |
Close Punctuation | 89 | 0.3% |
Open Punctuation | 87 | 0.3% |
Dash Punctuation | 64 | 0.2% |
Initial Punctuation | 40 | 0.1% |
Other values (2) | 52 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
정 | 469 | 2.2% |
회 | 448 | 2.1% |
장 | 404 | 1.9% |
국 | 395 | 1.9% |
기 | 387 | 1.8% |
리 | 361 | 1.7% |
대 | 347 | 1.6% |
의 | 341 | 1.6% |
원 | 303 | 1.4% |
사 | 292 | 1.4% |
Other values (645) | 17319 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 37 | |
E | 32 | 9.7% |
O | 30 | 9.1% |
S | 25 | 7.6% |
C | 24 | 7.3% |
I | 23 | 6.9% |
T | 19 | 5.7% |
U | 17 | 5.1% |
G | 16 | 4.8% |
M | 16 | 4.8% |
Other values (16) | 92 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 16 | 10.7% |
n | 13 | 8.7% |
r | 13 | 8.7% |
o | 12 | 8.0% |
i | 12 | 8.0% |
m | 11 | 7.3% |
a | 10 | 6.7% |
s | 9 | 6.0% |
t | 7 | 4.7% |
l | 7 | 4.7% |
Other values (13) | 40 |
Other Punctuation
Value | Count | Frequency (%) |
, | 386 | |
. | 164 | |
' | 58 | 7.6% |
· | 52 | 6.8% |
… | 34 | 4.5% |
! | 20 | 2.6% |
" | 14 | 1.8% |
' | 10 | 1.3% |
/ | 9 | 1.2% |
? | 8 | 1.0% |
Other values (4) | 8 | 1.0% |
Decimal Number
Value | Count | Frequency (%) |
1 | 340 | |
2 | 232 | |
0 | 211 | |
3 | 172 | |
5 | 51 | 4.2% |
4 | 48 | 3.9% |
9 | 45 | 3.7% |
6 | 42 | 3.4% |
7 | 40 | 3.3% |
8 | 40 | 3.3% |
Math Symbol
Value | Count | Frequency (%) |
~ | 7 | |
+ | 2 | 16.7% |
∼ | 1 | 8.3% |
< | 1 | 8.3% |
> | 1 | 8.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 72 | |
) | 7 | 7.9% |
」 | 7 | 7.9% |
』 | 3 | 3.4% |
Open Punctuation
Value | Count | Frequency (%) |
( | 71 | |
( | 7 | 8.0% |
「 | 7 | 8.0% |
『 | 2 | 2.3% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 27 | |
“ | 13 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 27 | |
” | 13 |
Space Separator
Value | Count | Frequency (%) |
5683 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 64 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 21050 | |
Common | 7999 | 27.1% |
Latin | 481 | 1.6% |
Han | 16 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
정 | 469 | 2.2% |
회 | 448 | 2.1% |
장 | 404 | 1.9% |
국 | 395 | 1.9% |
기 | 387 | 1.8% |
리 | 361 | 1.7% |
대 | 347 | 1.6% |
의 | 341 | 1.6% |
원 | 303 | 1.4% |
사 | 292 | 1.4% |
Other values (632) | 17303 |
Latin
Value | Count | Frequency (%) |
A | 37 | 7.7% |
E | 32 | 6.7% |
O | 30 | 6.2% |
S | 25 | 5.2% |
C | 24 | 5.0% |
I | 23 | 4.8% |
T | 19 | 4.0% |
U | 17 | 3.5% |
G | 16 | 3.3% |
M | 16 | 3.3% |
Other values (39) | 242 |
Common
Value | Count | Frequency (%) |
5683 | ||
, | 386 | 4.8% |
1 | 340 | 4.3% |
2 | 232 | 2.9% |
0 | 211 | 2.6% |
3 | 172 | 2.2% |
. | 164 | 2.1% |
) | 72 | 0.9% |
( | 71 | 0.9% |
- | 64 | 0.8% |
Other values (33) | 604 | 7.6% |
Han
Value | Count | Frequency (%) |
故 | 3 | |
美 | 2 | |
無 | 1 | 6.2% |
中 | 1 | 6.2% |
企 | 1 | 6.2% |
展 | 1 | 6.2% |
日 | 1 | 6.2% |
山 | 1 | 6.2% |
茶 | 1 | 6.2% |
韓 | 1 | 6.2% |
Other values (3) | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 21045 | |
ASCII | 8262 | 28.0% |
Punctuation | 114 | 0.4% |
None | 103 | 0.3% |
CJK | 16 | 0.1% |
Compat Jamo | 5 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
5683 | ||
, | 386 | 4.7% |
1 | 340 | 4.1% |
2 | 232 | 2.8% |
0 | 211 | 2.6% |
3 | 172 | 2.1% |
. | 164 | 2.0% |
) | 72 | 0.9% |
( | 71 | 0.9% |
- | 64 | 0.8% |
Other values (67) | 867 | 10.5% |
Hangul
Value | Count | Frequency (%) |
정 | 469 | 2.2% |
회 | 448 | 2.1% |
장 | 404 | 1.9% |
국 | 395 | 1.9% |
기 | 387 | 1.8% |
리 | 361 | 1.7% |
대 | 347 | 1.6% |
의 | 341 | 1.6% |
원 | 303 | 1.4% |
사 | 292 | 1.4% |
Other values (631) | 17298 |
None
Value | Count | Frequency (%) |
· | 52 | |
' | 10 | 9.7% |
? | 8 | 7.8% |
) | 7 | 6.8% |
( | 7 | 6.8% |
」 | 7 | 6.8% |
「 | 7 | 6.8% |
』 | 3 | 2.9% |
『 | 2 | 1.9% |
Punctuation
Value | Count | Frequency (%) |
… | 34 | |
‘ | 27 | |
’ | 27 | |
” | 13 | 11.4% |
“ | 13 | 11.4% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 5 |
CJK
Value | Count | Frequency (%) |
故 | 3 | |
美 | 2 | |
無 | 1 | 6.2% |
中 | 1 | 6.2% |
企 | 1 | 6.2% |
展 | 1 | 6.2% |
日 | 1 | 6.2% |
山 | 1 | 6.2% |
茶 | 1 | 6.2% |
韓 | 1 | 6.2% |
Other values (3) | 3 |
Math Operators
Value | Count | Frequency (%) |
∼ | 1 |
기사글내용
Text
MISSING
 
Distinct | 2535 |
---|---|
Distinct (%) | 99.7% |
Missing | 7458 |
Missing (%) | 74.6% |
Memory size | 156.2 KiB |
Length
Max length | 1024 |
---|---|
Median length | 726.5 |
Mean length | 445.20889 |
Min length | 1 |
Characters and Unicode
Total characters | 1131721 |
---|---|
Distinct characters | 1627 |
Distinct categories | 17 ? |
Distinct scripts | 4 ? |
Distinct blocks | 13 ? |
Unique
Unique | 2530 ? |
---|---|
Unique (%) | 99.5% |
Sample
1st row | 김황식 국무총리가 17일 오전 서울 용산구 효창동 백범기념관에서 열린 제72회 순국선열의 날 기념식에서 기념사를 하고 있다.김황식 국무총리가 17일 오전 서울 용산구 효창동 백범기념관에서 열린 제72회 순국선열의 날 기념식에서 기념사를 하고 있다.김황식 국무총리가 17일 오전 서울 용산구 효창동 백범기념관에서 열린 제72회 순국선열의 날 기념식에서 기념사를 하고 있다.김황식 국무총리가 17일 오전 서울 용산구 효창동 백범기념관에서 열린 제72회 순국선열의 날 기념식에서 기념사를 하고 있다.김황식 국무총리가 17일 오전 서울 용산구 효창동 백범기념관에서 열린 제72회 순국선열의 날 기념식에 참석하였다.김황식 국무총리가 17일 오전 서울 용산구 효창동 백범기념관에서 열린 제72회 순국선열의 날 기념식에 참석하였다. |
---|---|
2nd row | 이명박 대통령이 9일(현지시간) 도하 카타르 왕궁에서 셰이크 하마드 카타르 국왕과 한-카타르 정상회담을 열고 있다. 이명박 대통령이 9일(현지시간) 도하 카타르 왕궁에서 셰이크 하마드 카타르 국왕과 한-카타르 정상회담을 열고 있다. 이명박 대통령이 9일(현지시간) 도하 카타르 왕궁에서 셰이크 하마드 카타르 국왕과 한-카타르 정상회담을 열고 있다. |
3rd row | 지난 6월16일 오전 서울 중구 국립극장 문화광장에서 열린 431회 거북이마라톤 '6월은 호국보훈의 달 국가보훈처와 함께하는 남산 걷기대회'에서 최완근 국가보훈처 차장 2013 미스코리아등을 비롯한 참석자들이 출발전 화이팅을 외치고 있다. 최완근 국가보훈처 차장이 지난 6월 16일 오전 서울 중구 국립극장 문화광장에서 열린 431회 거북이마라톤 '6월은 호국보훈의 달 국가보훈처와 함께하는 남산 걷기대회'에서 출발을 알리는 징을 치고 있다. 지난 6월 16일 오전 서울 중구 남산 일대에서 열린 431회 거북이마라톤 '6월은 호국보훈의 달 국가보훈처와 함께하는 남산 걷기대회'에서 참가자들이 남산길을 오르고 있다. 최완근 국가보훈처 차장이 지난 6월 16일 오전 서울 중구 남산 일대에서 열린 431회 거북이마라톤 '6월은 호국보훈의 달 국가보훈처와 함께하는 남산 걷기대회'에서 백범광장에 설치된 태극기 모형에 스티커를 붙이고 있다. 지난 6월 16일 오전 서울 중구 남산 일대에서 열린 431회 거북이마라톤 '6월은 호국보훈의 달 국가보훈처와 함께하는 남산 걷기대회'에서 참가자들이 백범광장에 설치된 태극기 모형에 스티커를 붙이고 있다. 2013년 미스코리아들이 16일 오전 서울 중구 남산 일대에서 열린 431회 거북이마라톤 '6월은 호국보훈의 달 국가보훈처와 함께하는 남산 걷기대회'에서 백범광장에 설치된 태극기 모형에 스티커를 붙이고 있다. |
4th row | 이일수 기상청장과 국회 환경노동위원회 주영순 의원은 전남중부서해앞바다의 해상 예·특보에 활용하기 위하여 21일 전라남도 신안군 앞바다에 원반형 해양기상부이 1대를 설치하였다. 해양기상부이는 태풍 폭풍 등 위험기상 발생 시 관측이 어려운 환경에서도 관측이 가능해 기상분석과 예보에 매우 유용한 정보를 생산하는 첨단 해양기상관측장비이다.풍랑특보는 선박의 입·출항을 통제하는 판단 기준. 풍랑특보가 발표되면 선박 운항이 제한되기 때문에 어업 등 생업에 지장을 준다는 민원으로 지난 2012년 국정감사에서 풍랑특보 발표기준 완화 필요성이 제기되었다. 이에 기상청은 1004개의 섬으로 이루어진 신안군을 중심으로 유관기관 도서지역 주민들과 간담회를 개최하는 등 풍랑특보의 탄력적인 운영을 위한 대책을 강구해 왔다. 그 노력의 일환으로 주영순 의원실 신안군청 등과 협력하여 신안군 앞바다에 해양기상부이를 설치하게 되었다.이일수 기상청장과 국회 환경노동위원회 주영순 의원은 전남중부서해앞바다의 해상 예·특보에 활용하기 위하여 21일 전라남도 신안군 앞바다에 원반형 해양기상부이 1대를 설치하였다. 해양기상부이는 태풍 폭풍 등 위험기상 발생 시 관측이 어려운 환경에서도 관측이 가능해 기상분석과 예보에 매우 유용한 정보를 생산하는 첨단 해양기상관측장비이다.풍랑특보는 선박의 입·출항을 통제하는 판단 기준. 풍랑특보가 발표되면 선박 운항이 제한되기 때문에 어업 등 생업에 지장을 준다는 민원으로 지난 2012년 국정감사에서 풍랑특보 발표기준 완화 필요성이 제기되었다. 이에 기상청은 1004개의 섬으로 이루어진 신안군을 중심으로 유관기관 도서지역 주민들과 간담회를 개최하는 등 풍랑특보의 탄력적인 운영을 위한 대책을 강구해 왔다. 그 노력의 일환으로 주영순 의원실 신안군청 등과 협력하여 신안군 앞바다에 해양기상부이를 설치하게 되었다.이일수 기상청장과 국회 환경노동위원회 주영순 의원은 전남중부서해앞바다의 해상 예·특보에 활용하기 위하여 21일 전라남도 신안군 앞바다에 원반형 해양기상부이 1대를 설치하였다. 해양기상부이는 태풍 폭풍 등 위험기상 |
5th row | 송종호 중소기업청장과 남민우 벤처협회장이민화 카이스트 교수 등 벤처 1세대와 최근 창업한 벤처 2세대가 함께 25일 충남 아산 호서대학교제2공학관에서 학생들과 소통하는 청년창업 한마당 투어를 가졌다. |
Value | Count | Frequency (%) |
열린 | 5054 | 2.1% |
하고 | 3439 | 1.5% |
국무총리가 | 3252 | 1.4% |
대통령이 | 2995 | 1.3% |
서울 | 2362 | 1.0% |
있다 | 1816 | 0.8% |
오후 | 1807 | 0.8% |
있다.박근혜 | 1752 | 0.7% |
오전 | 1703 | 0.7% |
있다.김황식 | 1373 | 0.6% |
Other values (50543) | 209597 |
Most occurring characters
Value | Count | Frequency (%) |
233483 | 20.6% | |
에 | 20604 | 1.8% |
서 | 18391 | 1.6% |
. | 18189 | 1.6% |
이 | 17243 | 1.5% |
다 | 16618 | 1.5% |
고 | 15192 | 1.3% |
대 | 13491 | 1.2% |
하 | 13389 | 1.2% |
을 | 13383 | 1.2% |
Other values (1617) | 751738 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 806292 | |
Space Separator | 233484 | 20.6% |
Decimal Number | 50150 | 4.4% |
Other Punctuation | 22402 | 2.0% |
Uppercase Letter | 5890 | 0.5% |
Lowercase Letter | 3795 | 0.3% |
Close Punctuation | 2410 | 0.2% |
Open Punctuation | 2398 | 0.2% |
Control | 1935 | 0.2% |
Dash Punctuation | 884 | 0.1% |
Other values (7) | 2081 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
에 | 20604 | 2.6% |
서 | 18391 | 2.3% |
이 | 17243 | 2.1% |
다 | 16618 | 2.1% |
고 | 15192 | 1.9% |
대 | 13491 | 1.7% |
하 | 13389 | 1.7% |
을 | 13383 | 1.7% |
일 | 11880 | 1.5% |
국 | 11682 | 1.4% |
Other values (1484) | 654419 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 554 | 9.4% |
E | 508 | 8.6% |
A | 438 | 7.4% |
U | 422 | 7.2% |
O | 359 | 6.1% |
S | 356 | 6.0% |
I | 342 | 5.8% |
T | 318 | 5.4% |
K | 311 | 5.3% |
N | 277 | 4.7% |
Other values (16) | 2005 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 411 | 10.8% |
e | 343 | 9.0% |
o | 338 | 8.9% |
r | 306 | 8.1% |
n | 302 | 8.0% |
t | 241 | 6.4% |
i | 231 | 6.1% |
m | 227 | 6.0% |
s | 174 | 4.6% |
h | 171 | 4.5% |
Other values (16) | 1051 |
Other Punctuation
Value | Count | Frequency (%) |
. | 18189 | |
' | 2415 | 10.8% |
· | 513 | 2.3% |
? | 283 | 1.3% |
: | 253 | 1.1% |
! | 248 | 1.1% |
/ | 132 | 0.6% |
" | 132 | 0.6% |
? | 71 | 0.3% |
% | 56 | 0.2% |
Other values (8) | 110 | 0.5% |
Other Symbol
Value | Count | Frequency (%) |
○ | 12 | |
▶ | 11 | |
㎞ | 10 | |
▲ | 8 | |
♬ | 7 | |
㈜ | 6 | |
㎡ | 4 | 6.2% |
㏊ | 2 | 3.1% |
㎢ | 1 | 1.6% |
㎜ | 1 | 1.6% |
Other values (2) | 2 | 3.1% |
Math Symbol
Value | Count | Frequency (%) |
~ | 279 | |
+ | 33 | 9.7% |
→ | 8 | 2.4% |
= | 4 | 1.2% |
< | 4 | 1.2% |
> | 4 | 1.2% |
> | 2 | 0.6% |
| | 2 | 0.6% |
≪ | 1 | 0.3% |
≫ | 1 | 0.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 12442 | |
2 | 9384 | |
0 | 6171 | |
9 | 4726 | 9.4% |
3 | 4021 | 8.0% |
5 | 3173 | 6.3% |
6 | 2828 | 5.6% |
4 | 2529 | 5.0% |
8 | 2519 | 5.0% |
7 | 2357 | 4.7% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1883 | |
) | 447 | 18.5% |
」 | 27 | 1.1% |
] | 22 | 0.9% |
』 | 18 | 0.7% |
〉 | 12 | 0.5% |
》 | 1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1872 | |
( | 447 | 18.6% |
「 | 27 | 1.1% |
[ | 22 | 0.9% |
『 | 17 | 0.7% |
〈 | 12 | 0.5% |
《 | 1 | < 0.1% |
Other Number
Value | Count | Frequency (%) |
① | 1 | |
② | 1 | |
③ | 1 | |
④ | 1 |
Modifier Symbol
Value | Count | Frequency (%) |
^ | 87 | |
` | 18 | 16.7% |
´ | 3 | 2.8% |
Space Separator
Value | Count | Frequency (%) |
233483 | ||
1 | < 0.1% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 711 | |
“ | 97 | 12.0% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 668 | |
” | 86 | 11.4% |
Control
Value | Count | Frequency (%) |
1935 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 884 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 805768 | |
Common | 315738 | 27.9% |
Latin | 9685 | 0.9% |
Han | 530 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
에 | 20604 | 2.6% |
서 | 18391 | 2.3% |
이 | 17243 | 2.1% |
다 | 16618 | 2.1% |
고 | 15192 | 1.9% |
대 | 13491 | 1.7% |
하 | 13389 | 1.7% |
을 | 13383 | 1.7% |
일 | 11880 | 1.5% |
국 | 11682 | 1.4% |
Other values (1305) | 653895 |
Han
Value | Count | Frequency (%) |
故 | 65 | 12.3% |
平 | 27 | 5.1% |
近 | 26 | 4.9% |
習 | 26 | 4.9% |
軍 | 13 | 2.5% |
美 | 12 | 2.3% |
祭 | 12 | 2.3% |
英 | 12 | 2.3% |
崇 | 11 | 2.1% |
陵 | 11 | 2.1% |
Other values (170) | 315 |
Common
Value | Count | Frequency (%) |
233483 | ||
. | 18189 | 5.8% |
1 | 12442 | 3.9% |
2 | 9384 | 3.0% |
0 | 6171 | 2.0% |
9 | 4726 | 1.5% |
3 | 4021 | 1.3% |
5 | 3173 | 1.0% |
6 | 2828 | 0.9% |
4 | 2529 | 0.8% |
Other values (70) | 18792 | 6.0% |
Latin
Value | Count | Frequency (%) |
C | 554 | 5.7% |
E | 508 | 5.2% |
A | 438 | 4.5% |
U | 422 | 4.4% |
a | 411 | 4.2% |
O | 359 | 3.7% |
S | 356 | 3.7% |
e | 343 | 3.5% |
I | 342 | 3.5% |
o | 338 | 3.5% |
Other values (42) | 5614 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 805512 | |
ASCII | 322170 | 28.5% |
None | 1616 | 0.1% |
Punctuation | 1571 | 0.1% |
CJK | 524 | < 0.1% |
Compat Jamo | 250 | < 0.1% |
Geometric Shapes | 32 | < 0.1% |
CJK Compat | 19 | < 0.1% |
Arrows | 8 | < 0.1% |
Misc Symbols | 7 | < 0.1% |
Other values (3) | 12 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
233483 | ||
. | 18189 | 5.6% |
1 | 12442 | 3.9% |
2 | 9384 | 2.9% |
0 | 6171 | 1.9% |
9 | 4726 | 1.5% |
3 | 4021 | 1.2% |
5 | 3173 | 1.0% |
6 | 2828 | 0.9% |
4 | 2529 | 0.8% |
Other values (80) | 25224 | 7.8% |
Hangul
Value | Count | Frequency (%) |
에 | 20604 | 2.6% |
서 | 18391 | 2.3% |
이 | 17243 | 2.1% |
다 | 16618 | 2.1% |
고 | 15192 | 1.9% |
대 | 13491 | 1.7% |
하 | 13389 | 1.7% |
을 | 13383 | 1.7% |
일 | 11880 | 1.5% |
국 | 11682 | 1.5% |
Other values (1297) | 653639 |
Punctuation
Value | Count | Frequency (%) |
‘ | 711 | |
’ | 668 | |
“ | 97 | 6.2% |
” | 86 | 5.5% |
″ | 6 | 0.4% |
… | 3 | 0.2% |
None
Value | Count | Frequency (%) |
· | 513 | |
) | 447 | |
( | 447 | |
? | 71 | 4.4% |
「 | 27 | 1.7% |
」 | 27 | 1.7% |
』 | 18 | 1.1% |
『 | 17 | 1.1% |
〉 | 12 | 0.7% |
〈 | 12 | 0.7% |
Other values (9) | 25 | 1.5% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 197 | |
ㅠ | 19 | 7.6% |
ㅎ | 18 | 7.2% |
ㅋ | 11 | 4.4% |
ㅇ | 2 | 0.8% |
ㅁ | 2 | 0.8% |
ㅣ | 1 | 0.4% |
CJK
Value | Count | Frequency (%) |
故 | 65 | 12.4% |
平 | 27 | 5.2% |
近 | 26 | 5.0% |
習 | 26 | 5.0% |
軍 | 13 | 2.5% |
美 | 12 | 2.3% |
祭 | 12 | 2.3% |
英 | 12 | 2.3% |
崇 | 11 | 2.1% |
陵 | 11 | 2.1% |
Other values (164) | 309 |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 12 | |
▶ | 11 | |
▲ | 8 | |
■ | 1 | 3.1% |
CJK Compat
Value | Count | Frequency (%) |
㎞ | 10 | |
㎡ | 4 | 21.1% |
㏊ | 2 | 10.5% |
㎢ | 1 | 5.3% |
㎜ | 1 | 5.3% |
㎘ | 1 | 5.3% |
Arrows
Value | Count | Frequency (%) |
→ | 8 |
Misc Symbols
Value | Count | Frequency (%) |
♬ | 7 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
樂 | 1 | |
盧 | 1 | |
力 | 1 | |
女 | 1 | |
漏 | 1 | |
樓 | 1 |
Enclosed Alphanum
Value | Count | Frequency (%) |
① | 1 | |
② | 1 | |
③ | 1 | |
④ | 1 |
Math Operators
Value | Count | Frequency (%) |
≪ | 1 | |
≫ | 1 |
기사글태그정보
Text
MISSING
 
Distinct | 1843 |
---|---|
Distinct (%) | 94.9% |
Missing | 8057 |
Missing (%) | 80.6% |
Memory size | 156.2 KiB |
Length
Max length | 94 |
---|---|
Median length | 53 |
Mean length | 18.193515 |
Min length | 1 |
Characters and Unicode
Total characters | 35350 |
---|---|
Distinct characters | 751 |
Distinct categories | 13 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 1798 ? |
---|---|
Unique (%) | 92.5% |
Sample
1st row | 강원도 고성, 강원도, 산불 |
---|---|
2nd row | 맹호부대, 파월, 베트남 전쟁, 수도기계화보병사단, 역사 속의 오늘 |
3rd row | 전통시장 |
4th row | 한ㆍ중 확대 정상 회담, 박근혜 대통령, 중국 방문 |
5th row | 병무, 홍보, 대변인, 수상, 커무니케이션, 우수기관, 김영후, 박경규병무청 차장 |
Value | Count | Frequency (%) |
대통령 | 237 | 3.4% |
조달청 | 161 | 2.3% |
조달청장 | 55 | 0.8% |
박근혜 | 53 | 0.8% |
총리 | 52 | 0.8% |
김황식 | 50 | 0.7% |
정홍원 | 49 | 0.7% |
국무총리 | 45 | 0.7% |
이명박 | 39 | 0.6% |
이돈구 | 37 | 0.5% |
Other values (3645) | 6125 |
Most occurring characters
Value | Count | Frequency (%) |
5067 | 14.3% | |
, | 3276 | 9.3% |
대 | 670 | 1.9% |
회 | 549 | 1.6% |
장 | 528 | 1.5% |
국 | 469 | 1.3% |
청 | 434 | 1.2% |
조 | 419 | 1.2% |
원 | 396 | 1.1% |
정 | 369 | 1.0% |
Other values (741) | 23173 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 25473 | |
Space Separator | 5067 | 14.3% |
Other Punctuation | 3376 | 9.6% |
Decimal Number | 703 | 2.0% |
Uppercase Letter | 523 | 1.5% |
Lowercase Letter | 157 | 0.4% |
Dash Punctuation | 28 | 0.1% |
Close Punctuation | 8 | < 0.1% |
Open Punctuation | 8 | < 0.1% |
Math Symbol | 4 | < 0.1% |
Other values (3) | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 670 | 2.6% |
회 | 549 | 2.2% |
장 | 528 | 2.1% |
국 | 469 | 1.8% |
청 | 434 | 1.7% |
조 | 419 | 1.6% |
원 | 396 | 1.6% |
정 | 369 | 1.4% |
통 | 367 | 1.4% |
기 | 362 | 1.4% |
Other values (664) | 20910 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 51 | 9.8% |
E | 45 | 8.6% |
C | 43 | 8.2% |
S | 37 | 7.1% |
O | 35 | 6.7% |
T | 30 | 5.7% |
U | 29 | 5.5% |
N | 28 | 5.4% |
M | 27 | 5.2% |
I | 27 | 5.2% |
Other values (15) | 171 |
Lowercase Letter
Value | Count | Frequency (%) |
r | 23 | |
n | 16 | |
t | 15 | |
a | 15 | |
o | 13 | 8.3% |
e | 12 | 7.6% |
s | 11 | 7.0% |
i | 7 | 4.5% |
u | 7 | 4.5% |
y | 5 | 3.2% |
Other values (12) | 33 |
Decimal Number
Value | Count | Frequency (%) |
1 | 160 | |
0 | 149 | |
2 | 140 | |
5 | 56 | 8.0% |
4 | 53 | 7.5% |
3 | 48 | 6.8% |
6 | 34 | 4.8% |
9 | 29 | 4.1% |
8 | 21 | 3.0% |
7 | 13 | 1.8% |
Other Punctuation
Value | Count | Frequency (%) |
, | 3276 | |
. | 43 | 1.3% |
· | 21 | 0.6% |
; | 19 | 0.6% |
/ | 11 | 0.3% |
' | 5 | 0.1% |
& | 1 | < 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 6 | |
) | 1 | 12.5% |
」 | 1 | 12.5% |
Open Punctuation
Value | Count | Frequency (%) |
( | 6 | |
( | 1 | 12.5% |
「 | 1 | 12.5% |
Math Symbol
Value | Count | Frequency (%) |
+ | 3 | |
~ | 1 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
5067 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 28 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 25466 | |
Common | 9197 | 26.0% |
Latin | 680 | 1.9% |
Han | 7 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 670 | 2.6% |
회 | 549 | 2.2% |
장 | 528 | 2.1% |
국 | 469 | 1.8% |
청 | 434 | 1.7% |
조 | 419 | 1.6% |
원 | 396 | 1.6% |
정 | 369 | 1.4% |
통 | 367 | 1.4% |
기 | 362 | 1.4% |
Other values (662) | 20903 |
Latin
Value | Count | Frequency (%) |
A | 51 | 7.5% |
E | 45 | 6.6% |
C | 43 | 6.3% |
S | 37 | 5.4% |
O | 35 | 5.1% |
T | 30 | 4.4% |
U | 29 | 4.3% |
N | 28 | 4.1% |
M | 27 | 4.0% |
I | 27 | 4.0% |
Other values (37) | 328 |
Common
Value | Count | Frequency (%) |
5067 | ||
, | 3276 | |
1 | 160 | 1.7% |
0 | 149 | 1.6% |
2 | 140 | 1.5% |
5 | 56 | 0.6% |
4 | 53 | 0.6% |
3 | 48 | 0.5% |
. | 43 | 0.5% |
6 | 34 | 0.4% |
Other values (20) | 171 | 1.9% |
Han
Value | Count | Frequency (%) |
故 | 5 | |
美 | 2 | 28.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 25463 | |
ASCII | 9850 | 27.9% |
None | 25 | 0.1% |
CJK | 7 | < 0.1% |
Compat Jamo | 3 | < 0.1% |
Punctuation | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
5067 | ||
, | 3276 | |
1 | 160 | 1.6% |
0 | 149 | 1.5% |
2 | 140 | 1.4% |
5 | 56 | 0.6% |
4 | 53 | 0.5% |
A | 51 | 0.5% |
3 | 48 | 0.5% |
E | 45 | 0.5% |
Other values (60) | 805 | 8.2% |
Hangul
Value | Count | Frequency (%) |
대 | 670 | 2.6% |
회 | 549 | 2.2% |
장 | 528 | 2.1% |
국 | 469 | 1.8% |
청 | 434 | 1.7% |
조 | 419 | 1.6% |
원 | 396 | 1.6% |
정 | 369 | 1.4% |
통 | 367 | 1.4% |
기 | 362 | 1.4% |
Other values (661) | 20900 |
None
Value | Count | Frequency (%) |
· | 21 | |
( | 1 | 4.0% |
) | 1 | 4.0% |
「 | 1 | 4.0% |
」 | 1 | 4.0% |
CJK
Value | Count | Frequency (%) |
故 | 5 | |
美 | 2 | 28.6% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 3 |
Punctuation
Value | Count | Frequency (%) |
‘ | 1 | |
’ | 1 |
기자기수아이디
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
001 | 79 |
QT_0 | 9 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9921 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 9912 | |
001 | 79 | 0.8% |
QT_0 | 9 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 9912 | |
001 | 79 | 0.8% |
qt_0 | 9 | 0.1% |
사진기제작자코드
Categorical
IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
NIKON | |
CANON | |
ETC | |
SAM | 71 |
Other values (3) | 12 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 4.1123 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 6761 | |
NIKON | 1133 | 11.3% |
CANON | 1040 | 10.4% |
ETC | 983 | 9.8% |
SAM | 71 | 0.7% |
SONY | 9 | 0.1% |
CASIO | 2 | < 0.1% |
PENTAX | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 6761 | |
nikon | 1133 | 11.3% |
canon | 1040 | 10.4% |
etc | 983 | 9.8% |
sam | 71 | 0.7% |
sony | 9 | 0.1% |
casio | 2 | < 0.1% |
pentax | 1 | < 0.1% |
사진기기기종류명
Text
MISSING
 
Distinct | 137 |
---|---|
Distinct (%) | 4.6% |
Missing | 7013 |
Missing (%) | 70.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
mark | 547 | 9.5% |
canon | 459 | 8.0% |
d3 | 453 | 7.9% |
nikon | 409 | 7.1% |
eos-1d | 390 | 6.8% |
일반 | 382 | 6.7% |
iv | 313 | 5.5% |
d3x | 270 | 4.7% |
넣어주세요 | 269 | 4.7% |
d3s | 179 | 3.1% |
Other values (98) | 2068 |
Most occurring characters
Value | Count | Frequency (%) |
2881 | 12.1% | |
D | 1912 | 8.0% |
a | 1196 | 5.0% |
I | 1114 | 4.7% |
O | 1100 | 4.6% |
n | 1040 | 4.4% |
N | 999 | 4.2% |
3 | 998 | 4.2% |
S | 908 | 3.8% |
1 | 775 | 3.2% |
Other values (99) | 10938 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 9024 | |
Lowercase Letter | 4840 | |
Other Letter | 3370 | 14.1% |
Space Separator | 2881 | 12.1% |
Decimal Number | 2648 | 11.1% |
Dash Punctuation | 641 | 2.7% |
Other Punctuation | 273 | 1.1% |
Letter Number | 174 | 0.7% |
Open Punctuation | 5 | < 0.1% |
Close Punctuation | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
일 | 384 | |
반 | 382 | |
기 | 363 | |
요 | 270 | |
세 | 270 | |
주 | 270 | |
어 | 269 | |
넣 | 269 | |
종 | 269 | |
을 | 158 | 4.7% |
Other values (44) | 466 |
Uppercase Letter
Value | Count | Frequency (%) |
D | 1912 | |
I | 1114 | |
O | 1100 | |
N | 999 | |
S | 908 | |
E | 686 | 7.6% |
M | 654 | 7.2% |
C | 458 | 5.1% |
K | 411 | 4.6% |
X | 410 | 4.5% |
Other values (11) | 372 | 4.1% |
Lowercase Letter
Value | Count | Frequency (%) |
a | 1196 | |
n | 1040 | |
k | 750 | |
r | 746 | |
o | 533 | |
c | 119 | 2.5% |
s | 115 | 2.4% |
i | 101 | 2.1% |
m | 99 | 2.0% |
e | 49 | 1.0% |
Other values (6) | 92 | 1.9% |
Decimal Number
Value | Count | Frequency (%) |
3 | 998 | |
1 | 775 | |
0 | 417 | |
2 | 178 | 6.7% |
5 | 118 | 4.5% |
7 | 100 | 3.8% |
6 | 31 | 1.2% |
4 | 30 | 1.1% |
8 | 1 | < 0.1% |
Letter Number
Value | Count | Frequency (%) |
Ⅲ | 106 | |
Ⅳ | 63 | |
Ⅱ | 5 | 2.9% |
Other Punctuation
Value | Count | Frequency (%) |
! | 269 | |
, | 4 | 1.5% |
Space Separator
Value | Count | Frequency (%) |
2881 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 641 |
Open Punctuation
Value | Count | Frequency (%) |
( | 5 |
Close Punctuation
Value | Count | Frequency (%) |
) | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 14038 | |
Common | 6453 | |
Hangul | 3370 | 14.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
일 | 384 | |
반 | 382 | |
기 | 363 | |
요 | 270 | |
세 | 270 | |
주 | 270 | |
어 | 269 | |
넣 | 269 | |
종 | 269 | |
을 | 158 | 4.7% |
Other values (44) | 466 |
Latin
Value | Count | Frequency (%) |
D | 1912 | |
a | 1196 | 8.5% |
I | 1114 | 7.9% |
O | 1100 | 7.8% |
n | 1040 | 7.4% |
N | 999 | 7.1% |
S | 908 | 6.5% |
k | 750 | 5.3% |
r | 746 | 5.3% |
E | 686 | 4.9% |
Other values (30) | 3587 |
Common
Value | Count | Frequency (%) |
2881 | ||
3 | 998 | 15.5% |
1 | 775 | 12.0% |
- | 641 | 9.9% |
0 | 417 | 6.5% |
! | 269 | 4.2% |
2 | 178 | 2.8% |
5 | 118 | 1.8% |
7 | 100 | 1.5% |
6 | 31 | 0.5% |
Other values (5) | 45 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 20317 | |
Hangul | 3370 | 14.1% |
Number Forms | 174 | 0.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2881 | 14.2% | |
D | 1912 | 9.4% |
a | 1196 | 5.9% |
I | 1114 | 5.5% |
O | 1100 | 5.4% |
n | 1040 | 5.1% |
N | 999 | 4.9% |
3 | 998 | 4.9% |
S | 908 | 4.5% |
1 | 775 | 3.8% |
Other values (42) | 7394 |
Hangul
Value | Count | Frequency (%) |
일 | 384 | |
반 | 382 | |
기 | 363 | |
요 | 270 | |
세 | 270 | |
주 | 270 | |
어 | 269 | |
넣 | 269 | |
종 | 269 | |
을 | 158 | 4.7% |
Other values (44) | 466 |
Number Forms
Value | Count | Frequency (%) |
Ⅲ | 106 | |
Ⅳ | 63 | |
Ⅱ | 5 | 2.9% |
촬영지역명
Real number (ℝ)
MISSING
 
Distinct | 18 |
---|---|
Distinct (%) | 0.6% |
Missing | 6761 |
Missing (%) | 67.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.5822785 |
Minimum | 1 |
---|---|
Maximum | 18 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 13 |
95-th percentile | 18 |
Maximum | 18 |
Range | 17 |
Interquartile range (IQR) | 12 |
Descriptive statistics
Standard deviation | 6.9269065 |
---|---|
Coefficient of variation (CV) | 1.0523569 |
Kurtosis | -1.2772282 |
Mean | 6.5822785 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 0.65667668 |
Sum | 21320 |
Variance | 47.982033 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1809 | 18.1% |
18 | 554 | 5.5% |
9 | 233 | 2.3% |
12 | 104 | 1.0% |
10 | 73 | 0.7% |
15 | 73 | 0.7% |
11 | 66 | 0.7% |
16 | 65 | 0.7% |
14 | 62 | 0.6% |
8 | 37 | 0.4% |
Other values (8) | 163 | 1.6% |
(Missing) | 6761 |
Value | Count | Frequency (%) |
1 | 1809 | |
2 | 21 | 0.2% |
3 | 8 | 0.1% |
4 | 19 | 0.2% |
5 | 8 | 0.1% |
6 | 36 | 0.4% |
7 | 3 | < 0.1% |
8 | 37 | 0.4% |
9 | 233 | 2.3% |
10 | 73 | 0.7% |
Value | Count | Frequency (%) |
18 | 554 | |
17 | 34 | 0.3% |
16 | 65 | 0.7% |
15 | 73 | 0.7% |
14 | 62 | 0.6% |
13 | 34 | 0.3% |
12 | 104 | 1.0% |
11 | 66 | 0.7% |
10 | 73 | 0.7% |
9 | 233 |
촬영지역상세주소
Text
MISSING
 
Distinct | 1581 |
---|---|
Distinct (%) | 49.9% |
Missing | 6829 |
Missing (%) | 68.3% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
촬영상세지역 | 285 | 5.9% |
청와대 | 214 | 4.4% |
세종로 | 107 | 2.2% |
기타 | 84 | 1.7% |
정부중앙청사 | 80 | 1.6% |
정부서울청사 | 78 | 1.6% |
코엑스 | 64 | 1.3% |
기상청 | 63 | 1.3% |
정부대전청사 | 58 | 1.2% |
미상 | 51 | 1.0% |
Other values (1752) | 3774 |
Most occurring characters
Value | Count | Frequency (%) |
1799 | 8.6% | |
청 | 754 | 3.6% |
대 | 606 | 2.9% |
세 | 509 | 2.4% |
상 | 453 | 2.2% |
사 | 413 | 2.0% |
지 | 405 | 1.9% |
부 | 394 | 1.9% |
역 | 356 | 1.7% |
구 | 337 | 1.6% |
Other values (553) | 15004 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 18751 | |
Space Separator | 1799 | 8.6% |
Decimal Number | 171 | 0.8% |
Uppercase Letter | 149 | 0.7% |
Lowercase Letter | 58 | 0.3% |
Other Punctuation | 54 | 0.3% |
Open Punctuation | 17 | 0.1% |
Close Punctuation | 17 | 0.1% |
Dash Punctuation | 9 | < 0.1% |
Math Symbol | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
청 | 754 | 4.0% |
대 | 606 | 3.2% |
세 | 509 | 2.7% |
상 | 453 | 2.4% |
사 | 413 | 2.2% |
지 | 405 | 2.2% |
부 | 394 | 2.1% |
역 | 356 | 1.9% |
구 | 337 | 1.8% |
영 | 334 | 1.8% |
Other values (492) | 14190 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 21 | |
S | 14 | |
K | 13 | |
E | 13 | |
T | 13 | |
B | 11 | 7.4% |
A | 10 | 6.7% |
X | 10 | 6.7% |
O | 9 | 6.0% |
M | 5 | 3.4% |
Other values (12) | 30 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 8 | |
t | 7 | |
e | 7 | |
o | 6 | |
k | 5 | |
s | 5 | |
l | 4 | |
x | 3 | 5.2% |
i | 3 | 5.2% |
c | 2 | 3.4% |
Other values (7) | 8 |
Decimal Number
Value | Count | Frequency (%) |
1 | 39 | |
3 | 28 | |
2 | 26 | |
4 | 19 | |
8 | 15 | 8.8% |
6 | 14 | 8.2% |
9 | 10 | 5.8% |
0 | 8 | 4.7% |
5 | 8 | 4.7% |
7 | 4 | 2.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 33 | |
. | 8 | 14.8% |
' | 6 | 11.1% |
/ | 4 | 7.4% |
· | 2 | 3.7% |
! | 1 | 1.9% |
Math Symbol
Value | Count | Frequency (%) |
> | 4 | |
< | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
1799 |
Open Punctuation
Value | Count | Frequency (%) |
( | 17 |
Close Punctuation
Value | Count | Frequency (%) |
) | 17 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 18751 | |
Common | 2072 | 9.9% |
Latin | 207 | 1.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
청 | 754 | 4.0% |
대 | 606 | 3.2% |
세 | 509 | 2.7% |
상 | 453 | 2.4% |
사 | 413 | 2.2% |
지 | 405 | 2.2% |
부 | 394 | 2.1% |
역 | 356 | 1.9% |
구 | 337 | 1.8% |
영 | 334 | 1.8% |
Other values (492) | 14190 |
Latin
Value | Count | Frequency (%) |
C | 21 | 10.1% |
S | 14 | 6.8% |
K | 13 | 6.3% |
E | 13 | 6.3% |
T | 13 | 6.3% |
B | 11 | 5.3% |
A | 10 | 4.8% |
X | 10 | 4.8% |
O | 9 | 4.3% |
a | 8 | 3.9% |
Other values (29) | 85 |
Common
Value | Count | Frequency (%) |
1799 | ||
1 | 39 | 1.9% |
, | 33 | 1.6% |
3 | 28 | 1.4% |
2 | 26 | 1.3% |
4 | 19 | 0.9% |
( | 17 | 0.8% |
) | 17 | 0.8% |
8 | 15 | 0.7% |
6 | 14 | 0.7% |
Other values (12) | 65 | 3.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 18750 | |
ASCII | 2277 | 10.8% |
None | 2 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1799 | ||
1 | 39 | 1.7% |
, | 33 | 1.4% |
3 | 28 | 1.2% |
2 | 26 | 1.1% |
C | 21 | 0.9% |
4 | 19 | 0.8% |
( | 17 | 0.7% |
) | 17 | 0.7% |
8 | 15 | 0.7% |
Other values (50) | 263 | 11.6% |
Hangul
Value | Count | Frequency (%) |
청 | 754 | 4.0% |
대 | 606 | 3.2% |
세 | 509 | 2.7% |
상 | 453 | 2.4% |
사 | 413 | 2.2% |
지 | 405 | 2.2% |
부 | 394 | 2.1% |
역 | 356 | 1.9% |
구 | 337 | 1.8% |
영 | 334 | 1.8% |
Other values (491) | 14189 |
None
Value | Count | Frequency (%) |
· | 2 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
촬영날짜정보
Text
MISSING
 
Distinct | 1310 |
---|---|
Distinct (%) | 40.4% |
Missing | 6761 |
Missing (%) | 67.6% |
Memory size | 156.2 KiB |
Length
Max length | 11 |
---|---|
Median length | 10 |
Mean length | 10.002161 |
Min length | 10 |
Characters and Unicode
Total characters | 32397 |
---|---|
Distinct characters | 12 |
Distinct categories | 3 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 674 ? |
---|---|
Unique (%) | 20.8% |
Sample
1st row | 2011-11-17 |
---|---|
2nd row | 2012-11-30 |
3rd row | 2012-02-09 |
4th row | 2013-07-04 |
5th row | 2011-12-08 |
Value | Count | Frequency (%) |
2013-11-07 | 20 | 0.6% |
2011-12-19 | 17 | 0.5% |
2013-10-08 | 15 | 0.5% |
2013-09-09 | 14 | 0.4% |
2013-09-10 | 14 | 0.4% |
2012-01-19 | 12 | 0.4% |
2011-12-01 | 12 | 0.4% |
2013-08-30 | 11 | 0.3% |
2013-11-08 | 11 | 0.3% |
2013-09-16 | 10 | 0.3% |
Other values (1299) | 3103 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 6921 | |
0 | 6841 | |
- | 6478 | |
2 | 5641 | |
3 | 1879 | 5.8% |
9 | 1242 | 3.8% |
6 | 789 | 2.4% |
7 | 695 | 2.1% |
5 | 690 | 2.1% |
8 | 659 | 2.0% |
Other values (2) | 562 | 1.7% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 25912 | |
Dash Punctuation | 6478 | 20.0% |
Space Separator | 7 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 6921 | |
0 | 6841 | |
2 | 5641 | |
3 | 1879 | 7.3% |
9 | 1242 | 4.8% |
6 | 789 | 3.0% |
7 | 695 | 2.7% |
5 | 690 | 2.7% |
8 | 659 | 2.5% |
4 | 555 | 2.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6478 |
Space Separator
Value | Count | Frequency (%) |
7 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 32397 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 6921 | |
0 | 6841 | |
- | 6478 | |
2 | 5641 | |
3 | 1879 | 5.8% |
9 | 1242 | 3.8% |
6 | 789 | 2.4% |
7 | 695 | 2.1% |
5 | 690 | 2.1% |
8 | 659 | 2.0% |
Other values (2) | 562 | 1.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 32397 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 6921 | |
0 | 6841 | |
- | 6478 | |
2 | 5641 | |
3 | 1879 | 5.8% |
9 | 1242 | 3.8% |
6 | 789 | 2.4% |
7 | 695 | 2.1% |
5 | 690 | 2.1% |
8 | 659 | 2.0% |
Other values (2) | 562 | 1.7% |
촬영행위자명
Text
MISSING
 
Distinct | 164 |
---|---|
Distinct (%) | 5.7% |
Missing | 7129 |
Missing (%) | 71.3% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
국무총리실 | 462 | 15.5% |
박준수 | 327 | 11.0% |
이성규 | 137 | 4.6% |
전소향 | 134 | 4.5% |
통일부 | 120 | 4.0% |
이진우 | 91 | 3.0% |
대변인실 | 89 | 3.0% |
김민영 | 85 | 2.8% |
김성진 | 84 | 2.8% |
김성찬 | 79 | 2.6% |
Other values (148) | 1377 |
Most occurring characters
Value | Count | Frequency (%) |
국 | 609 | 5.7% |
이 | 568 | 5.3% |
실 | 552 | 5.2% |
무 | 484 | 4.5% |
리 | 472 | 4.4% |
총 | 462 | 4.3% |
김 | 448 | 4.2% |
박 | 438 | 4.1% |
수 | 416 | 3.9% |
성 | 335 | 3.1% |
Other values (163) | 5878 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 10441 | |
Space Separator | 191 | 1.8% |
Other Punctuation | 13 | 0.1% |
Decimal Number | 7 | 0.1% |
Uppercase Letter | 4 | < 0.1% |
Dash Punctuation | 2 | < 0.1% |
Lowercase Letter | 2 | < 0.1% |
Close Punctuation | 1 | < 0.1% |
Open Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 609 | 5.8% |
이 | 568 | 5.4% |
실 | 552 | 5.3% |
무 | 484 | 4.6% |
리 | 472 | 4.5% |
총 | 462 | 4.4% |
김 | 448 | 4.3% |
박 | 438 | 4.2% |
수 | 416 | 4.0% |
성 | 335 | 3.2% |
Other values (152) | 5657 |
Uppercase Letter
Value | Count | Frequency (%) |
F | 2 | |
I | 1 | |
B | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 12 | |
; | 1 | 7.7% |
Space Separator
Value | Count | Frequency (%) |
191 |
Decimal Number
Value | Count | Frequency (%) |
4 | 7 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 10441 | |
Common | 215 | 2.0% |
Latin | 6 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 609 | 5.8% |
이 | 568 | 5.4% |
실 | 552 | 5.3% |
무 | 484 | 4.6% |
리 | 472 | 4.5% |
총 | 462 | 4.4% |
김 | 448 | 4.3% |
박 | 438 | 4.2% |
수 | 416 | 4.0% |
성 | 335 | 3.2% |
Other values (152) | 5657 |
Common
Value | Count | Frequency (%) |
191 | ||
, | 12 | 5.6% |
4 | 7 | 3.3% |
- | 2 | 0.9% |
) | 1 | 0.5% |
( | 1 | 0.5% |
; | 1 | 0.5% |
Latin
Value | Count | Frequency (%) |
F | 2 | |
e | 2 | |
I | 1 | |
B | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 10441 | |
ASCII | 221 | 2.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
국 | 609 | 5.8% |
이 | 568 | 5.4% |
실 | 552 | 5.3% |
무 | 484 | 4.6% |
리 | 472 | 4.5% |
총 | 462 | 4.4% |
김 | 448 | 4.3% |
박 | 438 | 4.2% |
수 | 416 | 4.0% |
성 | 335 | 3.2% |
Other values (152) | 5657 |
ASCII
Value | Count | Frequency (%) |
191 | ||
, | 12 | 5.4% |
4 | 7 | 3.2% |
- | 2 | 0.9% |
F | 2 | 0.9% |
e | 2 | 0.9% |
) | 1 | 0.5% |
( | 1 | 0.5% |
; | 1 | 0.5% |
I | 1 | 0.5% |
썸네일저장주소
Text
MISSING
 
Distinct | 3728 |
---|---|
Distinct (%) | > 99.9% |
Missing | 6271 |
Missing (%) | 62.7% |
Memory size | 156.2 KiB |
Length
Max length | 168 |
---|---|
Median length | 80 |
Mean length | 89.573076 |
Min length | 80 |
Characters and Unicode
Total characters | 334018 |
---|---|
Distinct characters | 256 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 3727 ? |
---|---|
Unique (%) | 99.9% |
Sample
1st row | /admin2011/upload/photo/2011/11/8377B3CC-FAD1-42C9-B14C-C522FB5E85B7_THUMB_1.jpg |
---|---|
2nd row | /admin2011/upload/photo/2012/12/E12C0FC5-6BD7-4AB4-9EAF-43B9E711A761_THUMB_1.jpg |
3rd row | /admin2011/upload/photo/2012/02/DEF7CC8E-EA4B-44A4-8024-8AB8FCB9F7C1_THUMB_1.jpg |
4th row | /admin2011/upload/photo/2013/07/11/E942497A-8BAB-4D07-9461-6EC0D8739CAE_THUMB_1.jpg |
5th row | /admin2011/upload/photo/2011/12/917872D6-968C-4541-8176-0272B1CB332D_THUMB_1.jpg |
Value | Count | Frequency (%) |
사진 | 11 | 0.3% |
시찰 | 4 | 0.1% |
admin2011/upload/photo/2011/12/b18475a8-96bb-4670-8f45-37205924907e_thumb_1.jpg | 2 | 0.1% |
대한노총 | 2 | 0.1% |
전달 | 2 | 0.1% |
1일 | 2 | 0.1% |
admin2011/upload/photo/2012/05/9e2476de-7cce-4d4d-8d2d-096a758187cd_thumb_1.jpg | 1 | < 0.1% |
admin2011/upload/images/2013/07/01/57f5cf7f-3915-4d50-977b-357528fced34.jpg**20130701200528.jpg | 1 | < 0.1% |
admin2011/upload/photo/2013/11/05/ebeb01f4-9868-4598-8359-5a6c73b97c71_thumb_1.jpg | 1 | < 0.1% |
admin2011/upload/photo/2013/05/909b785d-3569-43ff-bd65-d9bdbd9ebc81_thumb_1.jpg | 1 | < 0.1% |
Other values (3832) | 3832 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 26818 | 8.0% |
/ | 23189 | 6.9% |
0 | 22447 | 6.7% |
2 | 18377 | 5.5% |
- | 17072 | 5.1% |
4 | 12813 | 3.8% |
a | 11593 | 3.5% |
p | 11420 | 3.4% |
3 | 11145 | 3.3% |
d | 10139 | 3.0% |
Other values (246) | 169005 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 137879 | |
Lowercase Letter | 93371 | |
Uppercase Letter | 47212 | 14.1% |
Other Punctuation | 32151 | 9.6% |
Dash Punctuation | 17072 | 5.1% |
Connector Punctuation | 5687 | 1.7% |
Other Letter | 487 | 0.1% |
Space Separator | 130 | < 0.1% |
Close Punctuation | 13 | < 0.1% |
Open Punctuation | 13 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 37 | 7.6% |
진 | 27 | 5.5% |
대 | 15 | 3.1% |
일 | 12 | 2.5% |
회 | 9 | 1.8% |
월 | 9 | 1.8% |
년 | 9 | 1.8% |
전 | 8 | 1.6% |
의 | 8 | 1.6% |
식 | 6 | 1.2% |
Other values (177) | 347 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 11593 | |
p | 11420 | |
d | 10139 | |
o | 9312 | |
g | 5920 | 6.3% |
j | 4887 | 5.2% |
i | 4770 | 5.1% |
m | 4683 | 5.0% |
e | 3810 | 4.1% |
u | 3735 | 4.0% |
Other values (15) | 23102 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 8676 | |
A | 5938 | |
C | 5298 | |
F | 5235 | |
D | 5216 | |
E | 5083 | |
M | 2792 | 5.9% |
H | 2771 | 5.9% |
U | 2770 | 5.9% |
T | 2770 | 5.9% |
Other values (12) | 663 | 1.4% |
Decimal Number
Value | Count | Frequency (%) |
1 | 26818 | |
0 | 22447 | |
2 | 18377 | |
4 | 12813 | |
3 | 11145 | |
9 | 9708 | 7.0% |
7 | 9519 | 6.9% |
8 | 9469 | 6.9% |
6 | 9066 | 6.6% |
5 | 8517 | 6.2% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 23189 | |
. | 5157 | 16.0% |
* | 3794 | 11.8% |
; | 11 | < 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
] | 10 | |
) | 3 | 23.1% |
Open Punctuation
Value | Count | Frequency (%) |
[ | 10 | |
( | 3 | 23.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 17072 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 5687 |
Space Separator
Value | Count | Frequency (%) |
130 |
Math Symbol
Value | Count | Frequency (%) |
~ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 192948 | |
Latin | 140583 | |
Hangul | 487 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 37 | 7.6% |
진 | 27 | 5.5% |
대 | 15 | 3.1% |
일 | 12 | 2.5% |
회 | 9 | 1.8% |
월 | 9 | 1.8% |
년 | 9 | 1.8% |
전 | 8 | 1.6% |
의 | 8 | 1.6% |
식 | 6 | 1.2% |
Other values (177) | 347 |
Latin
Value | Count | Frequency (%) |
a | 11593 | 8.2% |
p | 11420 | 8.1% |
d | 10139 | 7.2% |
o | 9312 | 6.6% |
B | 8676 | 6.2% |
A | 5938 | 4.2% |
g | 5920 | 4.2% |
C | 5298 | 3.8% |
F | 5235 | 3.7% |
D | 5216 | 3.7% |
Other values (37) | 61836 |
Common
Value | Count | Frequency (%) |
1 | 26818 | |
/ | 23189 | |
0 | 22447 | |
2 | 18377 | |
- | 17072 | |
4 | 12813 | 6.6% |
3 | 11145 | 5.8% |
9 | 9708 | 5.0% |
7 | 9519 | 4.9% |
8 | 9469 | 4.9% |
Other values (12) | 32391 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 333531 | |
Hangul | 487 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 26818 | 8.0% |
/ | 23189 | 7.0% |
0 | 22447 | 6.7% |
2 | 18377 | 5.5% |
- | 17072 | 5.1% |
4 | 12813 | 3.8% |
a | 11593 | 3.5% |
p | 11420 | 3.4% |
3 | 11145 | 3.3% |
d | 10139 | 3.0% |
Other values (59) | 168518 |
Hangul
Value | Count | Frequency (%) |
사 | 37 | 7.6% |
진 | 27 | 5.5% |
대 | 15 | 3.1% |
일 | 12 | 2.5% |
회 | 9 | 1.8% |
월 | 9 | 1.8% |
년 | 9 | 1.8% |
전 | 8 | 1.6% |
의 | 8 | 1.6% |
식 | 6 | 1.2% |
Other values (177) | 347 |
역사일자
Real number (ℝ)
MISSING
 
Distinct | 31 |
---|---|
Distinct (%) | 0.4% |
Missing | 2871 |
Missing (%) | 28.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.826904 |
Minimum | 1 |
---|---|
Maximum | 31 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 7 |
median | 15 |
Q3 | 22 |
95-th percentile | 30 |
Maximum | 31 |
Range | 30 |
Interquartile range (IQR) | 15 |
Descriptive statistics
Standard deviation | 9.0585637 |
---|---|
Coefficient of variation (CV) | 0.61095449 |
Kurtosis | -1.187611 |
Mean | 14.826904 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0.10039853 |
Sum | 105701 |
Variance | 82.057576 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 508 | 5.1% |
15 | 282 | 2.8% |
10 | 269 | 2.7% |
20 | 263 | 2.6% |
9 | 255 | 2.5% |
5 | 254 | 2.5% |
3 | 251 | 2.5% |
2 | 235 | 2.4% |
16 | 233 | 2.3% |
12 | 232 | 2.3% |
Other values (21) | 4347 | |
(Missing) | 2871 |
Value | Count | Frequency (%) |
1 | 508 | |
2 | 235 | |
3 | 251 | |
4 | 201 | 2.0% |
5 | 254 | |
6 | 225 | |
7 | 230 | |
8 | 225 | |
9 | 255 | |
10 | 269 |
Value | Count | Frequency (%) |
31 | 142 | |
30 | 221 | |
29 | 184 | |
28 | 216 | |
27 | 214 | |
26 | 190 | |
25 | 222 | |
24 | 194 | |
23 | 197 | |
22 | 211 |
이력년월
Date
MISSING
 
Distinct | 1382 |
---|---|
Distinct (%) | 19.4% |
Missing | 2871 |
Missing (%) | 28.7% |
Memory size | 156.2 KiB |
Minimum | 1864-01-01 00:00:00 |
---|---|
Maximum | 2023-09-01 00:00:00 |
대표사진내용
Text
MISSING
 
Distinct | 758 |
---|---|
Distinct (%) | 100.0% |
Missing | 9242 |
Missing (%) | 92.4% |
Memory size | 156.2 KiB |
Length
Max length | 608 |
---|---|
Median length | 185 |
Mean length | 77.294195 |
Min length | 2 |
Characters and Unicode
Total characters | 58589 |
---|---|
Distinct characters | 890 |
Distinct categories | 14 ? |
Distinct scripts | 4 ? |
Distinct blocks | 7 ? |
Unique
Unique | 758 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 김황식 국무총리가 17일 오전 서울 용산구 효창동 백범기념관에서 열린 제72회 순국선열의 날 기념식에서 기념사를 하고 있다. |
---|---|
2nd row | 이명박 대통령이 9일(현지시간) 도하 카타르 왕궁에서 셰이크 하마드 카타르 국왕과 한-카타르 정상회담을 열고 있다. |
3rd row | 지난 6월16일 오전 서울 중구 국립극장 문화광장에서 열린 431회 거북이마라톤 '6월은 호국보훈의 달 국가보훈처와 함께하는 남산 걷기대회'에서 최완근 국가보훈처 차장 2013 미스코리아등을 비롯한 참석자들이 출발전 화이팅을 외치고 있다. |
4th row | 이일수 기상청장과 국회 환경노동위원회 주영순 의원은 전남중부서해앞바다의 해상 예·특보에 활용하기 위하여 21일 전라남도 신안군 앞바다에 원반형 해양기상부이 1대를 설치하였다. 해양기상부이는 태풍 폭풍 등 위험기상 발생 시 관측이 어려운 환경에서도 관측이 가능해 기상분석과 예보에 매우 유용한 정보를 생산하는 첨단 해양기상관측장비이다.풍랑특보는 선박의 입·출항을 통제하는 판단 기준. 풍랑특보가 발표되면 선박 운항이 제한되기 때문에 어업 등 생업에 지장을 준다는 민원으로 지난 2012년 국정감사에서 풍랑특보 발표기준 완화 필요성이 제기되었다. 이에 기상청은 1004개의 섬으로 이루어진 신안군을 중심으로 유관기관 도서지역 주민들과 간담회를 개최하는 등 풍랑특보의 탄력적인 운영을 위한 대책을 강구해 왔다. 그 노력의 일환으로 주영순 의원실 신안군청 등과 협력하여 신안군 앞바다에 해양기상부이를 설치하게 되었다. |
5th row | 김황식 국무총리가 18일 중소기업회관에서 열린 중소기업중앙회 창립50주년 기념리셉션에서 축사를 하고 있다. |
Value | Count | Frequency (%) |
있다 | 513 | 4.1% |
열린 | 281 | 2.2% |
하고 | 201 | 1.6% |
대통령이 | 199 | 1.6% |
국무총리가 | 154 | 1.2% |
박근혜 | 139 | 1.1% |
서울 | 116 | 0.9% |
김황식 | 111 | 0.9% |
오후 | 101 | 0.8% |
오전 | 101 | 0.8% |
Other values (6269) | 10699 |
Most occurring characters
Value | Count | Frequency (%) |
12001 | 20.5% | |
에 | 1052 | 1.8% |
서 | 1027 | 1.8% |
이 | 910 | 1.6% |
다 | 879 | 1.5% |
. | 843 | 1.4% |
고 | 797 | 1.4% |
대 | 754 | 1.3% |
하 | 745 | 1.3% |
을 | 716 | 1.2% |
Other values (880) | 38865 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 42059 | |
Space Separator | 12001 | 20.5% |
Decimal Number | 2129 | 3.6% |
Other Punctuation | 1112 | 1.9% |
Uppercase Letter | 404 | 0.7% |
Lowercase Letter | 331 | 0.6% |
Open Punctuation | 193 | 0.3% |
Close Punctuation | 192 | 0.3% |
Dash Punctuation | 61 | 0.1% |
Initial Punctuation | 47 | 0.1% |
Other values (4) | 60 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
에 | 1052 | 2.5% |
서 | 1027 | 2.4% |
이 | 910 | 2.2% |
다 | 879 | 2.1% |
고 | 797 | 1.9% |
대 | 754 | 1.8% |
하 | 745 | 1.8% |
을 | 716 | 1.7% |
기 | 647 | 1.5% |
있 | 640 | 1.5% |
Other values (787) | 33892 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 37 | |
o | 35 | 10.6% |
n | 32 | 9.7% |
e | 32 | 9.7% |
r | 30 | 9.1% |
t | 23 | 6.9% |
s | 16 | 4.8% |
i | 15 | 4.5% |
m | 12 | 3.6% |
d | 11 | 3.3% |
Other values (14) | 88 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 36 | 8.9% |
E | 36 | 8.9% |
O | 34 | 8.4% |
A | 29 | 7.2% |
U | 28 | 6.9% |
S | 25 | 6.2% |
I | 23 | 5.7% |
N | 21 | 5.2% |
T | 20 | 5.0% |
P | 19 | 4.7% |
Other values (14) | 133 |
Other Punctuation
Value | Count | Frequency (%) |
. | 843 | |
' | 155 | 13.9% |
· | 44 | 4.0% |
: | 28 | 2.5% |
" | 9 | 0.8% |
/ | 8 | 0.7% |
? | 7 | 0.6% |
* | 5 | 0.4% |
! | 5 | 0.4% |
? | 4 | 0.4% |
Other values (2) | 4 | 0.4% |
Decimal Number
Value | Count | Frequency (%) |
1 | 532 | |
2 | 486 | |
0 | 281 | |
3 | 195 | 9.2% |
5 | 119 | 5.6% |
6 | 117 | 5.5% |
4 | 111 | 5.2% |
8 | 97 | 4.6% |
9 | 96 | 4.5% |
7 | 95 | 4.5% |
Open Punctuation
Value | Count | Frequency (%) |
( | 152 | |
( | 28 | 14.5% |
「 | 7 | 3.6% |
『 | 4 | 2.1% |
[ | 2 | 1.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 151 | |
) | 28 | 14.6% |
」 | 7 | 3.6% |
』 | 4 | 2.1% |
] | 2 | 1.0% |
Math Symbol
Value | Count | Frequency (%) |
~ | 8 | |
+ | 3 | 25.0% |
> | 1 | 8.3% |
Other Symbol
Value | Count | Frequency (%) |
○ | 3 | |
㈜ | 2 | |
▶ | 1 | 16.7% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 44 | |
“ | 3 | 6.4% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 39 | |
” | 1 | 2.5% |
Space Separator
Value | Count | Frequency (%) |
12001 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 61 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 42039 | |
Common | 15793 | 27.0% |
Latin | 735 | 1.3% |
Han | 22 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
에 | 1052 | 2.5% |
서 | 1027 | 2.4% |
이 | 910 | 2.2% |
다 | 879 | 2.1% |
고 | 797 | 1.9% |
대 | 754 | 1.8% |
하 | 745 | 1.8% |
을 | 716 | 1.7% |
기 | 647 | 1.5% |
있 | 640 | 1.5% |
Other values (768) | 33872 |
Latin
Value | Count | Frequency (%) |
a | 37 | 5.0% |
C | 36 | 4.9% |
E | 36 | 4.9% |
o | 35 | 4.8% |
O | 34 | 4.6% |
n | 32 | 4.4% |
e | 32 | 4.4% |
r | 30 | 4.1% |
A | 29 | 3.9% |
U | 28 | 3.8% |
Other values (38) | 406 |
Common
Value | Count | Frequency (%) |
12001 | ||
. | 843 | 5.3% |
1 | 532 | 3.4% |
2 | 486 | 3.1% |
0 | 281 | 1.8% |
3 | 195 | 1.2% |
' | 155 | 1.0% |
( | 152 | 1.0% |
) | 151 | 1.0% |
5 | 119 | 0.8% |
Other values (34) | 878 | 5.6% |
Han
Value | Count | Frequency (%) |
故 | 3 | 13.6% |
北 | 1 | 4.5% |
展 | 1 | 4.5% |
平 | 1 | 4.5% |
京 | 1 | 4.5% |
近 | 1 | 4.5% |
習 | 1 | 4.5% |
田 | 1 | 4.5% |
彦 | 1 | 4.5% |
佳 | 1 | 4.5% |
Other values (10) | 10 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 42023 | |
ASCII | 16306 | 27.8% |
None | 131 | 0.2% |
Punctuation | 89 | 0.2% |
CJK | 22 | < 0.1% |
Compat Jamo | 14 | < 0.1% |
Geometric Shapes | 4 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
12001 | ||
. | 843 | 5.2% |
1 | 532 | 3.3% |
2 | 486 | 3.0% |
0 | 281 | 1.7% |
3 | 195 | 1.2% |
' | 155 | 1.0% |
( | 152 | 0.9% |
) | 151 | 0.9% |
5 | 119 | 0.7% |
Other values (67) | 1391 | 8.5% |
Hangul
Value | Count | Frequency (%) |
에 | 1052 | 2.5% |
서 | 1027 | 2.4% |
이 | 910 | 2.2% |
다 | 879 | 2.1% |
고 | 797 | 1.9% |
대 | 754 | 1.8% |
하 | 745 | 1.8% |
을 | 716 | 1.7% |
기 | 647 | 1.5% |
있 | 640 | 1.5% |
Other values (765) | 33856 |
None
Value | Count | Frequency (%) |
· | 44 | |
( | 28 | |
) | 28 | |
? | 7 | 5.3% |
「 | 7 | 5.3% |
」 | 7 | 5.3% |
』 | 4 | 3.1% |
『 | 4 | 3.1% |
㈜ | 2 | 1.5% |
Punctuation
Value | Count | Frequency (%) |
‘ | 44 | |
’ | 39 | |
“ | 3 | 3.4% |
″ | 2 | 2.2% |
” | 1 | 1.1% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 13 | |
ㅡ | 1 | 7.1% |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 3 | |
▶ | 1 | 25.0% |
CJK
Value | Count | Frequency (%) |
故 | 3 | 13.6% |
北 | 1 | 4.5% |
展 | 1 | 4.5% |
平 | 1 | 4.5% |
京 | 1 | 4.5% |
近 | 1 | 4.5% |
習 | 1 | 4.5% |
田 | 1 | 4.5% |
彦 | 1 | 4.5% |
佳 | 1 | 4.5% |
Other values (10) | 10 |
기사글분류코드
Categorical
IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
문화 | 60 |
관광 | 37 |
사회 | 13 |
외교 | 7 |
Other values (2) | 7 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9757 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 9876 | |
문화 | 60 | 0.6% |
관광 | 37 | 0.4% |
사회 | 13 | 0.1% |
외교 | 7 | 0.1% |
스포츠 | 5 | 0.1% |
경제 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 9876 | |
문화 | 60 | 0.6% |
관광 | 37 | 0.4% |
사회 | 13 | 0.1% |
외교 | 7 | 0.1% |
스포츠 | 5 | < 0.1% |
경제 | 2 | < 0.1% |
공공누리자유사용여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
미적용 | |
---|---|
적용 | 370 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.963 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 미적용 |
---|---|
2nd row | 미적용 |
3rd row | 미적용 |
4th row | 미적용 |
5th row | 미적용 |
Common Values
Value | Count | Frequency (%) |
미적용 | 9630 | |
적용 | 370 | 3.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
미적용 | 9630 | |
적용 | 370 | 3.7% |
공공누리유형코드
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
유형1 | 370 |
유형 | 17 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9596 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 9613 | |
유형1 | 370 | 3.7% |
유형 | 17 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 9613 | |
유형1 | 370 | 3.7% |
유형 | 17 | 0.2% |
사진출처정보
Categorical
IMBALANCE
 
Distinct | 41 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
청와대 | 436 |
문화체육관광부 | 430 |
e영상역사관 | 370 |
국무조정실 | 274 |
Other values (36) |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.2338 |
Min length | 3 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 7141 | |
청와대 | 436 | 4.4% |
문화체육관광부 | 430 | 4.3% |
e영상역사관 | 370 | 3.7% |
국무조정실 | 274 | 2.7% |
조달청 | 166 | 1.7% |
통일부 | 158 | 1.6% |
중소기업청 | 104 | 1.0% |
소방방재청 | 102 | 1.0% |
기상청 | 95 | 0.9% |
Other values (31) | 724 | 7.2% |
Length
Value | Count | Frequency (%) |
na | 7141 | |
청와대 | 436 | 4.4% |
문화체육관광부 | 430 | 4.3% |
e영상역사관 | 370 | 3.7% |
국무조정실 | 274 | 2.7% |
조달청 | 166 | 1.7% |
통일부 | 158 | 1.6% |
중소기업청 | 104 | 1.0% |
소방방재청 | 102 | 1.0% |
기상청 | 95 | 0.9% |
Other values (31) | 724 | 7.2% |
부가정보
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
2 | 1 |
1 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9994 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 9998 | |
2 | 1 | < 0.1% |
1 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 9998 | |
2 | 1 | < 0.1% |
1 | 1 | < 0.1% |
상세주소
Text
MISSING
 
Distinct | 500 |
---|---|
Distinct (%) | 100.0% |
Missing | 9500 |
Missing (%) | 95.0% |
Memory size | 156.2 KiB |
Length
Max length | 74 |
---|---|
Median length | 73 |
Mean length | 73.168 |
Min length | 73 |
Characters and Unicode
Total characters | 36584 |
---|---|
Distinct characters | 38 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 500 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | http://www.much.go.kr/story/story.do?_method=detailUserStory&mts_idx=6358 |
---|---|
2nd row | http://www.much.go.kr/story/story.do?_method=detailUserStory&mts_idx=5935 |
3rd row | http://www.much.go.kr/story/story.do?_method=detailUserStory&mts_idx=7845 |
4th row | http://www.much.go.kr/story/story.do?_method=detailUserStory&mts_idx=6734 |
5th row | http://www.much.go.kr/story/story.do?_method=detailUserStory&mts_idx=6132 |
Value | Count | Frequency (%) |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=10304 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=10506 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=11489 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=7190 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=6188 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=9890 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=4457 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=8236 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=7697 | 1 | 0.2% |
http://www.much.go.kr/story/story.do?_method=detailuserstory&mts_idx=6492 | 1 | 0.2% |
Other values (490) | 490 |
Most occurring characters
Value | Count | Frequency (%) |
t | 4000 | 10.9% |
o | 3000 | 8.2% |
r | 2500 | 6.8% |
d | 2000 | 5.5% |
/ | 2000 | 5.5% |
. | 2000 | 5.5% |
s | 2000 | 5.5% |
h | 1500 | 4.1% |
y | 1500 | 4.1% |
e | 1500 | 4.1% |
Other values (28) | 14584 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 26000 | |
Other Punctuation | 5500 | 15.0% |
Decimal Number | 2084 | 5.7% |
Connector Punctuation | 1000 | 2.7% |
Math Symbol | 1000 | 2.7% |
Uppercase Letter | 1000 | 2.7% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
t | 4000 | |
o | 3000 | |
r | 2500 | |
d | 2000 | 7.7% |
s | 2000 | 7.7% |
h | 1500 | 5.8% |
y | 1500 | 5.8% |
e | 1500 | 5.8% |
m | 1500 | 5.8% |
w | 1500 | 5.8% |
Other values (9) | 5000 |
Decimal Number
Value | Count | Frequency (%) |
6 | 287 | |
1 | 276 | |
4 | 208 | |
5 | 200 | |
9 | 197 | |
3 | 194 | |
8 | 191 | |
0 | 187 | |
7 | 172 | |
2 | 172 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 2000 | |
. | 2000 | |
& | 500 | 9.1% |
? | 500 | 9.1% |
: | 500 | 9.1% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 500 | |
U | 500 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1000 |
Math Symbol
Value | Count | Frequency (%) |
= | 1000 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 27000 | |
Common | 9584 | 26.2% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
t | 4000 | |
o | 3000 | |
r | 2500 | |
d | 2000 | 7.4% |
s | 2000 | 7.4% |
h | 1500 | 5.6% |
y | 1500 | 5.6% |
e | 1500 | 5.6% |
m | 1500 | 5.6% |
w | 1500 | 5.6% |
Other values (11) | 6000 |
Common
Value | Count | Frequency (%) |
/ | 2000 | |
. | 2000 | |
_ | 1000 | |
= | 1000 | |
& | 500 | 5.2% |
? | 500 | 5.2% |
: | 500 | 5.2% |
6 | 287 | 3.0% |
1 | 276 | 2.9% |
4 | 208 | 2.2% |
Other values (7) | 1313 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 36584 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
t | 4000 | 10.9% |
o | 3000 | 8.2% |
r | 2500 | 6.8% |
d | 2000 | 5.5% |
/ | 2000 | 5.5% |
. | 2000 | 5.5% |
s | 2000 | 5.5% |
h | 1500 | 4.1% |
y | 1500 | 4.1% |
e | 1500 | 4.1% |
Other values (28) | 14584 |
상태코드
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
승인 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 승인 |
---|---|
2nd row | 승인 |
3rd row | 승인 |
4th row | 승인 |
5th row | 승인 |
Common Values
Value | Count | Frequency (%) |
승인 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
승인 | 10000 |
최초승인일시
Date
Distinct | 3289 |
---|---|
Distinct (%) | 32.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2011-10-18 17:06:58 |
---|---|
Maximum | 2013-12-10 13:58:13 |
승인일시
Date
Distinct | 3291 |
---|---|
Distinct (%) | 32.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2011-10-18 17:06:58 |
---|---|
Maximum | 2017-09-19 13:56:28 |
정렬순서
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
0 | |
---|---|
<NA> | 149 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.0447 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 9851 | |
<NA> | 149 | 1.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 9851 | |
na | 149 | 1.5% |
추천수
Real number (ℝ)
ZEROS
 
Distinct | 64 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.5821 |
Minimum | 0 |
---|---|
Maximum | 161 |
Zeros | 8116 |
Zeros (%) | 81.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 9 |
Maximum | 161 |
Range | 161 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 5.8237832 |
---|---|
Coefficient of variation (CV) | 3.6810462 |
Kurtosis | 146.91096 |
Mean | 1.5821 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 9.1224971 |
Sum | 15821 |
Variance | 33.916451 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 8116 | |
1 | 324 | 3.2% |
4 | 228 | 2.3% |
3 | 169 | 1.7% |
5 | 166 | 1.7% |
2 | 137 | 1.4% |
6 | 136 | 1.4% |
7 | 106 | 1.1% |
8 | 67 | 0.7% |
9 | 60 | 0.6% |
Other values (54) | 491 | 4.9% |
Value | Count | Frequency (%) |
0 | 8116 | |
1 | 324 | 3.2% |
2 | 137 | 1.4% |
3 | 169 | 1.7% |
4 | 228 | 2.3% |
5 | 166 | 1.7% |
6 | 136 | 1.4% |
7 | 106 | 1.1% |
8 | 67 | 0.7% |
9 | 60 | 0.6% |
Value | Count | Frequency (%) |
161 | 1 | |
137 | 1 | |
124 | 1 | |
97 | 1 | |
85 | 1 | |
83 | 1 | |
81 | 1 | |
80 | 1 | |
73 | 1 | |
70 | 1 |
조회수
Real number (ℝ)
SKEWED
  ZEROS
 
Distinct | 1381 |
---|---|
Distinct (%) | 13.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 283.0233 |
Minimum | 0 |
---|---|
Maximum | 45786 |
Zeros | 6762 |
Zeros (%) | 67.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 563 |
95-th percentile | 1201 |
Maximum | 45786 |
Range | 45786 |
Interquartile range (IQR) | 563 |
Descriptive statistics
Standard deviation | 707.63269 |
---|---|
Coefficient of variation (CV) | 2.500263 |
Kurtosis | 1717.8746 |
Mean | 283.0233 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 28.215892 |
Sum | 2830233 |
Variance | 500744.02 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 6762 | |
692 | 10 | 0.1% |
833 | 10 | 0.1% |
818 | 10 | 0.1% |
849 | 10 | 0.1% |
852 | 9 | 0.1% |
750 | 9 | 0.1% |
687 | 9 | 0.1% |
842 | 9 | 0.1% |
812 | 9 | 0.1% |
Other values (1371) | 3153 |
Value | Count | Frequency (%) |
0 | 6762 | |
1 | 2 | < 0.1% |
2 | 5 | 0.1% |
3 | 1 | < 0.1% |
4 | 3 | < 0.1% |
5 | 2 | < 0.1% |
9 | 1 | < 0.1% |
11 | 2 | < 0.1% |
13 | 1 | < 0.1% |
15 | 2 | < 0.1% |
Value | Count | Frequency (%) |
45786 | 1 | |
8244 | 1 | |
7584 | 1 | |
7405 | 1 | |
7135 | 1 | |
6924 | 1 | |
5561 | 1 | |
5459 | 1 | |
5058 | 1 | |
4938 | 1 |
최초등록자아이디
Text
Distinct | 107 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
manager01 | 7048 | |
pmomanager | 484 | 4.8% |
banana | 324 | 3.2% |
shjun | 206 | 2.1% |
naonnuri | 164 | 1.6% |
lssun1 | 158 | 1.6% |
egoiste00 | 104 | 1.0% |
kccphoto | 91 | 0.9% |
adsd21 | 86 | 0.9% |
turtel | 84 | 0.8% |
Other values (97) | 1251 | 12.5% |
Most occurring characters
Value | Count | Frequency (%) |
a | 16837 | |
n | 9727 | |
e | 8555 | |
m | 8304 | |
r | 8061 | |
g | 7846 | |
1 | 7556 | |
0 | 7478 | |
o | 1897 | 2.2% |
s | 1300 | 1.5% |
Other values (28) | 7781 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 69139 | |
Decimal Number | 16197 | 19.0% |
Uppercase Letter | 6 | < 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
a | 16837 | |
n | 9727 | |
e | 8555 | |
m | 8304 | |
r | 8061 | |
g | 7846 | |
o | 1897 | 2.7% |
s | 1300 | 1.9% |
p | 886 | 1.3% |
h | 877 | 1.3% |
Other values (15) | 4849 | 7.0% |
Decimal Number
Value | Count | Frequency (%) |
1 | 7556 | |
0 | 7478 | |
9 | 299 | 1.8% |
5 | 214 | 1.3% |
2 | 203 | 1.3% |
7 | 196 | 1.2% |
4 | 143 | 0.9% |
8 | 49 | 0.3% |
6 | 34 | 0.2% |
3 | 25 | 0.2% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 2 | |
J | 2 | |
S | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 69145 | |
Common | 16197 | 19.0% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
a | 16837 | |
n | 9727 | |
e | 8555 | |
m | 8304 | |
r | 8061 | |
g | 7846 | |
o | 1897 | 2.7% |
s | 1300 | 1.9% |
p | 886 | 1.3% |
h | 877 | 1.3% |
Other values (18) | 4855 | 7.0% |
Common
Value | Count | Frequency (%) |
1 | 7556 | |
0 | 7478 | |
9 | 299 | 1.8% |
5 | 214 | 1.3% |
2 | 203 | 1.3% |
7 | 196 | 1.2% |
4 | 143 | 0.9% |
8 | 49 | 0.3% |
6 | 34 | 0.2% |
3 | 25 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 85342 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
a | 16837 | |
n | 9727 | |
e | 8555 | |
m | 8304 | |
r | 8061 | |
g | 7846 | |
1 | 7556 | |
0 | 7478 | |
o | 1897 | 2.2% |
s | 1300 | 1.5% |
Other values (28) | 7781 |
최초등록일시
Date
Distinct | 3322 |
---|---|
Distinct (%) | 33.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2011-10-18 17:06:58 |
---|---|
Maximum | 2013-12-10 13:58:13 |
최종수정자아이디
Categorical
IMBALANCE
 
Distinct | 50 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
pmomanager | 314 |
imhinayo | 275 |
manager01 | 238 |
seloving | 227 |
Other values (45) |
Length
Max length | 12 |
---|---|
Median length | 4 |
Mean length | 4.9348 |
Min length | 4 |
Unique
Unique | 7 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 7867 | |
pmomanager | 314 | 3.1% |
imhinayo | 275 | 2.8% |
manager01 | 238 | 2.4% |
seloving | 227 | 2.3% |
photomanager | 162 | 1.6% |
banana | 125 | 1.2% |
twoskyape | 100 | 1.0% |
dyangs | 80 | 0.8% |
kdrogue | 77 | 0.8% |
Other values (40) | 535 | 5.3% |
Length
Value | Count | Frequency (%) |
na | 7867 | |
pmomanager | 314 | 3.1% |
imhinayo | 275 | 2.8% |
manager01 | 238 | 2.4% |
seloving | 227 | 2.3% |
photomanager | 162 | 1.6% |
banana | 125 | 1.2% |
twoskyape | 100 | 1.0% |
dyangs | 80 | 0.8% |
kdrogue | 77 | 0.8% |
Other values (40) | 535 | 5.3% |
최종수정일시
Date
Distinct | 2173 |
---|---|
Distinct (%) | 21.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2011-10-24 13:18:17 |
---|---|
Maximum | 2022-03-31 12:22:00 |
날짜표시구분
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 10000 |
---|---|
Missing (%) | 100.0% |
Memory size | 166.0 KiB |
기사글번호 | 주제코드 | 소속코드 | 부모기사글번호 | 기사글제목 | 기사글부제목 | 기사글내용 | 기사글태그정보 | 기자기수아이디 | 사진기제작자코드 | 사진기기기종류명 | 촬영지역명 | 촬영지역상세주소 | 촬영날짜정보 | 촬영행위자명 | 썸네일저장주소 | 역사일자 | 이력년월 | 대표사진내용 | 기사글분류코드 | 공공누리자유사용여부 | 공공누리유형코드 | 사진출처정보 | 부가정보 | 상세주소 | 상태코드 | 최초승인일시 | 승인일시 | 정렬순서 | 추천수 | 조회수 | 최초등록자아이디 | 최초등록일시 | 최종수정자아이디 | 최종수정일시 | 날짜표시구분 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
5062 | 5321 | 역사박물관 | 국민소통실 | 0 | 한국과학기술연구소 KIST 발족 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 4 | 1966-02 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:27 | 2013-07-01 20:05:27 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:27 | <NA> | 2013-07-01 20:05:27 | <NA> |
11690 | 12297 | 역사박물관 | 국민소통실 | 0 | 안창호·이대위 등, 샌프란시스코에 친목회 조직 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 23 | 1903-09 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:06:25 | 2013-07-01 20:06:25 | 0 | 0 | 0 | manager01 | 2013-07-01 20:06:25 | <NA> | 2017-03-17 14:24:15 | <NA> |
5964 | 6227 | 역사박물관 | 국민소통실 | 0 | <한국일보>, | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 3 | 1956-03 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:35 | 2013-07-01 20:05:35 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:35 | <NA> | 2013-07-01 20:05:35 | <NA> |
10704 | 11040 | 역사박물관 | 국민소통실 | 0 | 일왕 히로이토, 항복 방송 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 15 | 1945-08 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:06:16 | 2013-07-01 20:06:16 | 0 | 0 | 0 | manager01 | 2013-07-01 20:06:16 | <NA> | 2013-07-01 20:06:16 | <NA> |
10309 | 10677 | 역사박물관 | 국민소통실 | 0 | 한국국제기아·질병·문맹퇴지기구, 북한 수해복구 첫 지원 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 3 | 2006-08 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:06:13 | 2013-07-01 20:06:13 | 0 | 0 | 0 | manager01 | 2013-07-01 20:06:13 | <NA> | 2013-07-01 20:06:13 | <NA> |
7884 | 8203 | 역사박물관 | 국민소통실 | 0 | 경남 남해군~사천 간 연륙교 개통 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 28 | 2003-04 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:52 | 2013-07-01 20:05:52 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:52 | <NA> | 2013-07-01 20:05:52 | <NA> |
6185 | 6498 | 역사박물관 | 국민소통실 | 0 | 김연아, 세계주니어피겨스케이팅선수권 대회에서 우승 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 10 | 2006-03 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:37 | 2013-07-01 20:05:37 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:37 | <NA> | 2013-07-01 20:05:37 | <NA> |
4871 | 5232 | 역사박물관 | 국민소통실 | 0 | 한일대륙붕협정 체결 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 30 | 1974-01 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:26 | 2013-07-01 20:05:26 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:26 | <NA> | 2013-07-01 20:05:26 | <NA> |
5455 | 5763 | 역사박물관 | 국민소통실 | 0 | 개정 병역법시행령 공포 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 18 | 1959-02 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:31 | 2013-07-01 20:05:31 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:31 | <NA> | 2013-07-01 20:05:31 | <NA> |
6643 | 7013 | 역사박물관 | 국민소통실 | 0 | 40년 만의 최악 황사, 초등학교 · 유치원 휴교 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 23 | 2002-03 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:41 | 2013-07-01 20:05:41 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:41 | photomanager | 2014-05-12 10:40:04 | <NA> |
기사글번호 | 주제코드 | 소속코드 | 부모기사글번호 | 기사글제목 | 기사글부제목 | 기사글내용 | 기사글태그정보 | 기자기수아이디 | 사진기제작자코드 | 사진기기기종류명 | 촬영지역명 | 촬영지역상세주소 | 촬영날짜정보 | 촬영행위자명 | 썸네일저장주소 | 역사일자 | 이력년월 | 대표사진내용 | 기사글분류코드 | 공공누리자유사용여부 | 공공누리유형코드 | 사진출처정보 | 부가정보 | 상세주소 | 상태코드 | 최초승인일시 | 승인일시 | 정렬순서 | 추천수 | 조회수 | 최초등록자아이디 | 최초등록일시 | 최종수정자아이디 | 최종수정일시 | 날짜표시구분 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
5889 | 6302 | 역사박물관 | 국민소통실 | 0 | 양도성 예금증서 발행 및 대출금리 자유화 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 5 | 1986-03 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:35 | 2013-07-01 20:05:35 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:35 | <NA> | 2013-07-01 20:05:35 | <NA> |
11656 | 12223 | 역사박물관 | 국민소통실 | 0 | 독립운동가 김학규 사망 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 20 | 1967-09 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:06:25 | 2013-07-01 20:06:25 | 0 | 0 | 0 | manager01 | 2013-07-01 20:06:25 | <NA> | 2017-03-17 14:24:15 | <NA> |
15210 | 16133 | 역사박물관 | 국민소통실 | 0 | 베토벤 탄생 2백주년 기념 서울시향 연주회 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 29 | 1969-12 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:06:41 | 2013-07-01 20:06:41 | 0 | 0 | 0 | manager01 | 2013-07-01 20:06:41 | <NA> | 2013-07-01 20:06:41 | <NA> |
8583 | 8938 | 역사박물관 | 국민소통실 | 0 | 한성농공은행 개업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 2 | 1906-06 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:57 | 2013-07-01 20:05:57 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:57 | <NA> | 2013-07-01 20:05:57 | <NA> |
3523 | 3741 | 국무총리 | 국무조정실 | 0 | 정 총리, 종로소방서 방문 | 정 총리, 종로소방서 방문 | 정홍원 국무총리가 2일 종로소방서를 방문 소방대원들과 기념촬영을 하고 있다.정홍원 국무총리가 2일 종로소방서를 방문 소방물품들을 살펴보고 있다.정홍원 국무총리가 2일 종로소방서를 방문 소방물품들을 살펴보고 있다.정홍원 국무총리가 2일 종로소방서를 방문 소방물품들을 살펴보고 있다. | 종로소방서 | <NA> | NIKON | NIKON D3X | 1 | 종로소방서 | 2013-03-02 | 변성주 | /admin2011/upload/photo/2013/03/84F6B8E3-8235-4A7C-A8A8-F8633F32DD0F_THUMB_1.jpg | <NA> | <NA> | <NA> | <NA> | 미적용 | <NA> | 문화체육관광부 | <NA> | <NA> | 승인 | 2013-03-07 14:39:42 | 2013-03-07 14:39:42 | 0 | 0 | 1925 | pmomanager | 2013-03-07 14:39:42 | <NA> | 2022-03-31 11:56:17 | <NA> |
6663 | 6993 | 역사박물관 | 국민소통실 | 0 | 미 국무부, 합리적 민정이양 절차안 제출을 희망하는 공식 견해 발표 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 23 | 1963-03 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:41 | 2013-07-01 20:05:41 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:41 | <NA> | 2013-07-01 20:05:41 | <NA> |
4356 | 4681 | 역사박물관 | 국민소통실 | 0 | 중화학공업 · 전기업 등에 총 2,870억 원 국민투자기금 지원 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 6 | 1978-01 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:05:22 | 2013-07-01 20:05:22 | 0 | 0 | 0 | manager01 | 2013-07-01 20:05:22 | photomanager | 2014-05-12 11:06:24 | <NA> |
2564 | 2722 | 정부부처 | 산림청 | 0 | 제21회 전국임업후계자 대회 | 제21회 전국임업후계자 대회 | 17일 오전 경기도 가평군 자라섬 일원에서 '제21회 전국임업후계자대회'가 열렸다.17일 오전 경기도 가평군 자라섬 일원에서 '제21회 전국임업후계자대회'가 열렸다. | 이돈구, 임업후계자 | <NA> | NIKON | D3 | 9 | 가평군 자라섬 | 2012-08-17 | 이래호 | /admin2011/upload/photo/2012/08/0FB0E3F2-90CB-437E-939C-7CCABD6CF563_THUMB_1.jpg | <NA> | <NA> | <NA> | <NA> | 미적용 | <NA> | 산림청 | <NA> | <NA> | 승인 | 2012-08-20 00:00:00 | 2012-08-20 00:00:00 | 0 | 0 | 682 | photo | 2012-08-20 08:28:38 | <NA> | 2012-08-20 08:28:38 | <NA> |
3696 | 3922 | 국민속으로 | 객원사진가 | 0 | 제94주년 대한민국임시정부수립 기념식 | <NA> | 박유철 광복회장이 13일 오전 서울 용산구 효창동 백범김구기념관에서 열린 제94주년 대한민국임시정부수립 기념식에 참석해 기념사를 하고 있다.박유철 광복회장이 13일 오전 서울 용산구 효창동 백범김구기념관에서 열린 제94주년 대한민국임시정부수립 기념식에서 참석해 기념사를 하고 있다.13일 오전 서울 용산구 효창동 백범김구기념관에서 열린제94주년 대한민국임시정부수립 기념식에 독립유공자 유족 각계대표 시민 학생 등이 참석해 자리를 빛냈다.정홍원 국무총리가 13일 오전 서울 용산구 효창동 백범김구기념관에서 열린 제94주년 대한민국임시정부수립 기념식에서 참석해 기념사를 하고 있다.정홍원 국무총리가 13일 오전 서울 용산구 효창동 백범김구기념관에서 열린 제94주년 대한민국임시정부수립 기념식에서 참석해 기념사를 하고 있다.13일 오전 서울 용산구 효창동 백범김구기념관에서 열린제94주년 대한민국임시정부수립 기념식에 독립유공자 유족 각계대표 시민 학생 등이 참석해 자리를 빛냈다.정홍원 국무총리가 13일 오전 서울 용산구 효창동 백범김구기념관에서 열린 제94주년 대한민국임시정부수립 기념식에서 참석해 기념사를 하고 있다.정홍원 국무총리가 13일 오전 서울 용산구 효창동 백범김구기념관에서 열린 제94주년 대한민국임시정부수립 기념식에서 참석해 기념사를 하고 있다.정홍원 국무총리가 13일 오전 서울 용산구 효창동 백범김구기념관에서 열린 제94주년 대한민국임시정부수립 기념식에서 참석해 기념사를 하고 있다.13일 오전 서울 용산구 효창동 백범김구기념관에서 열린제94주년 대한민국임시정부수립 기념식에 독립유공자 유족 각계대표 시민 학생 등이 참석해 자리를 빛냈다.13일 오전 서울 용산구 효창동 백범김구기념관에서 열린제94주년 대한민국임시정부수립 기념식에서 의정부시립합창단이 축하공연을 하고 있다.13일 오전 서울 용산구 효창동 백범김구기념관에서 열린제94주년 대한민국임시정부수립 기념식에서 의정부시립합창단이 축하공연을 하고 있다.13일 오전 서울 용산구 효창동 백범김구기념관에서 열린제94주년 대한민국임시정부수립 기념식에 참석한 정홍원 국 | <NA> | <NA> | CANON | canon 1D X | 1 | 용산구 효창동 백범김구기념관 | 2013-04-13 | 성혜련 | /admin2011/upload/photo/2013/04/01F487AF-00DB-4176-933F-E350CBD1755B_THUMB_1.jpg | <NA> | <NA> | 정홍원 국무총리가 13일 오전 서울 용산구 효창동 백범김구기념관에서 열린 제94주년 대한민국임시정부수립 기념식에서 참석해 기념사를 하고 있다. | 사회 | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-04-14 03:06:12 | 2013-04-14 03:06:12 | 0 | 3 | 807 | shrphoto | 2013-04-14 03:06:12 | gkswl | 2013-04-19 11:07:56 | <NA> |
14598 | 15574 | 역사박물관 | 국민소통실 | 0 | 대법원, 가정폭력 피해 74세 여성 노인 이혼소송 불허, 여성단체 등 반발 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 8 | 1999-12 | <NA> | <NA> | 미적용 | <NA> | <NA> | <NA> | <NA> | 승인 | 2013-07-01 20:06:38 | 2013-07-01 20:06:38 | 0 | 0 | 0 | manager01 | 2013-07-01 20:06:38 | <NA> | 2013-07-01 20:06:38 | <NA> |