Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 7273 |
Missing cells | 2 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 355.3 KiB |
Average record size in memory | 50.0 B |
Variable types
Text | 3 |
---|---|
Categorical | 1 |
Numeric | 2 |
Dataset
Description | 울산광역시도시공사에서 접수받고 처리했던 민원들을 가공처리 하여 만든 데이터로 민원 내용의 정보를 다루고 있는 데이터 |
---|---|
Author | 울산광역시도시공사 |
URL | https://www.data.go.kr/data/15109609/fileData.do |
Reproduction
Analysis started | 2023-12-16 16:01:48.401531 |
---|---|
Analysis finished | 2023-12-16 16:01:56.539639 |
Duration | 8.14 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
관리번호
Text
Distinct | 583 |
---|---|
Distinct (%) | 8.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 56.9 KiB |
Length
Max length | 14 |
---|---|
Median length | 11 |
Mean length | 11.378798 |
Min length | 10 |
Characters and Unicode
Total characters | 82758 |
---|---|
Distinct characters | 22 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | CD090128001 |
---|---|
2nd row | CD090128001 |
3rd row | CD090128001 |
4th row | CD090128001 |
5th row | CD090128001 |
Value | Count | Frequency (%) |
pa210119068 | 81 | 1.1% |
bp130409001 | 57 | 0.8% |
hb210927092 | 53 | 0.7% |
il170818020 | 52 | 0.7% |
il000000006 | 51 | 0.7% |
cd141224052 | 48 | 0.7% |
cd160329067 | 47 | 0.6% |
hb170315033 | 47 | 0.6% |
il000000017 | 46 | 0.6% |
cd130821043 | 45 | 0.6% |
Other values (573) | 6746 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 17438 | |
1 | 15798 | |
2 | 10289 | |
C | 4088 | 4.9% |
3 | 3684 | 4.5% |
9 | 3674 | 4.4% |
6 | 3081 | 3.7% |
4 | 3044 | 3.7% |
8 | 3033 | 3.7% |
5 | 2776 | 3.4% |
Other values (12) | 15853 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 65458 | |
Uppercase Letter | 17270 | 20.9% |
Space Separator | 30 | < 0.1% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
C | 4088 | |
D | 2726 | |
B | 2083 | |
A | 1730 | |
H | 1426 | 8.3% |
O | 1362 | 7.9% |
V | 1362 | 7.9% |
P | 903 | 5.2% |
L | 734 | 4.3% |
I | 734 | 4.3% |
Decimal Number
Value | Count | Frequency (%) |
0 | 17438 | |
1 | 15798 | |
2 | 10289 | |
3 | 3684 | 5.6% |
9 | 3674 | 5.6% |
6 | 3081 | 4.7% |
4 | 3044 | 4.7% |
8 | 3033 | 4.6% |
5 | 2776 | 4.2% |
7 | 2641 | 4.0% |
Space Separator
Value | Count | Frequency (%) |
30 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 65488 | |
Latin | 17270 | 20.9% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 17438 | |
1 | 15798 | |
2 | 10289 | |
3 | 3684 | 5.6% |
9 | 3674 | 5.6% |
6 | 3081 | 4.7% |
4 | 3044 | 4.6% |
8 | 3033 | 4.6% |
5 | 2776 | 4.2% |
7 | 2641 | 4.0% |
Latin
Value | Count | Frequency (%) |
C | 4088 | |
D | 2726 | |
B | 2083 | |
A | 1730 | |
H | 1426 | 8.3% |
O | 1362 | 7.9% |
V | 1362 | 7.9% |
P | 903 | 5.2% |
L | 734 | 4.3% |
I | 734 | 4.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 82758 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 17438 | |
1 | 15798 | |
2 | 10289 | |
C | 4088 | 4.9% |
3 | 3684 | 4.5% |
9 | 3674 | 4.4% |
6 | 3081 | 3.7% |
4 | 3044 | 3.7% |
8 | 3033 | 3.7% |
5 | 2776 | 3.4% |
Other values (12) | 15853 |
단락종류
Categorical
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 56.9 KiB |
본론 | |
---|---|
서론 | |
제목 | |
사족 | |
서론 | 12 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.0023374 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 제목 |
---|---|
2nd row | 서론 |
3rd row | 서론 |
4th row | 서론 |
5th row | 서론 |
Common Values
Value | Count | Frequency (%) |
본론 | 4146 | |
서론 | 1955 | |
제목 | 579 | 8.0% |
사족 | 576 | 7.9% |
서론 | 12 | 0.2% |
본론 | 5 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
본론 | 4151 | |
서론 | 1967 | |
제목 | 579 | 8.0% |
사족 | 576 | 7.9% |
문단번호
Real number (ℝ)
ZEROS
 
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.9307026 |
Minimum | 0 |
---|---|
Maximum | 17 |
Zeros | 408 |
Zeros (%) | 5.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 64.1 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 6 |
Maximum | 17 |
Range | 17 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 2.049547 |
---|---|
Coefficient of variation (CV) | 1.061555 |
Kurtosis | 12.401776 |
Mean | 1.9307026 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 3.1506552 |
Sum | 14042 |
Variance | 4.2006428 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 4146 | |
2 | 1267 | 17.4% |
3 | 563 | 7.7% |
0 | 408 | 5.6% |
4 | 301 | 4.1% |
5 | 173 | 2.4% |
6 | 103 | 1.4% |
7 | 87 | 1.2% |
8 | 48 | 0.7% |
10 | 42 | 0.6% |
Other values (8) | 135 | 1.9% |
Value | Count | Frequency (%) |
0 | 408 | 5.6% |
1 | 4146 | |
2 | 1267 | 17.4% |
3 | 563 | 7.7% |
4 | 301 | 4.1% |
5 | 173 | 2.4% |
6 | 103 | 1.4% |
7 | 87 | 1.2% |
8 | 48 | 0.7% |
9 | 40 | 0.5% |
Value | Count | Frequency (%) |
17 | 4 | 0.1% |
16 | 3 | < 0.1% |
15 | 11 | 0.2% |
14 | 5 | 0.1% |
13 | 26 | |
12 | 18 | 0.2% |
11 | 28 | |
10 | 42 | |
9 | 40 | |
8 | 48 |
문장번호
Real number (ℝ)
ZEROS
 
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.146707 |
Minimum | 0 |
---|---|
Maximum | 15 |
Zeros | 421 |
Zeros (%) | 5.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 64.1 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1 |
median | 2 |
Q3 | 3 |
95-th percentile | 6 |
Maximum | 15 |
Range | 15 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.7769017 |
---|---|
Coefficient of variation (CV) | 0.82773367 |
Kurtosis | 4.3733045 |
Mean | 2.146707 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.8211236 |
Sum | 15613 |
Variance | 3.1573795 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 3210 | |
2 | 1432 | |
3 | 941 | 12.9% |
4 | 554 | 7.6% |
0 | 421 | 5.8% |
5 | 315 | 4.3% |
6 | 159 | 2.2% |
7 | 104 | 1.4% |
8 | 59 | 0.8% |
9 | 39 | 0.5% |
Other values (6) | 39 | 0.5% |
Value | Count | Frequency (%) |
0 | 421 | 5.8% |
1 | 3210 | |
2 | 1432 | |
3 | 941 | 12.9% |
4 | 554 | 7.6% |
5 | 315 | 4.3% |
6 | 159 | 2.2% |
7 | 104 | 1.4% |
8 | 59 | 0.8% |
9 | 39 | 0.5% |
Value | Count | Frequency (%) |
15 | 1 | < 0.1% |
14 | 1 | < 0.1% |
13 | 1 | < 0.1% |
12 | 4 | 0.1% |
11 | 10 | 0.1% |
10 | 22 | 0.3% |
9 | 39 | 0.5% |
8 | 59 | 0.8% |
7 | 104 | |
6 | 159 |
원문
Text
Distinct | 4990 |
---|---|
Distinct (%) | 68.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 56.9 KiB |
Length
Max length | 760 |
---|---|
Median length | 315 |
Mean length | 40.745635 |
Min length | 1 |
Characters and Unicode
Total characters | 296343 |
---|---|
Distinct characters | 1192 |
Distinct categories | 15 ? |
Distinct scripts | 4 ? |
Distinct blocks | 12 ? |
Unique
Unique | 4876 ? |
---|---|
Unique (%) | 67.0% |
Sample
1st row | 없음 |
---|---|
2nd row | 안녕하십니까? 저희는 울산광역시 울주군 삼남면 교동리의 재결 및 이주생활 대책위원회입니다. |
3rd row | 지금 시행중인 경부고속철도 울산역세권 공사에 대한 보상협의 중에 있습니다. |
4th row | 그동안 울산 도시공사는 본 마을과 협상하면서 주변시세에 맞추어서 보상을 하겠다고 우리 교동리 주민들 한사람 한사람에게 약속을 하여 보상 협상에 임하게 하였고 또 마을을 대표하여 앞에서 열심히 일하는 협상대표자들을 이간질 하여 마을이 단합을 할 수 없도록 방해공작을 하였습니다. |
5th row | 없음 |
Value | Count | Frequency (%) |
없음 | 2156 | 3.2% |
및 | 324 | 0.5% |
있습니다 | 319 | 0.5% |
수 | 312 | 0.5% |
있는 | 242 | 0.4% |
1 | 241 | 0.4% |
240 | 0.4% | |
2 | 209 | 0.3% |
바랍니다 | 198 | 0.3% |
주소 | 188 | 0.3% |
Other values (26396) | 62785 |
Most occurring characters
Value | Count | Frequency (%) |
63095 | 21.3% | |
이 | 5804 | 2.0% |
. | 5023 | 1.7% |
다 | 4929 | 1.7% |
하 | 4892 | 1.7% |
지 | 4521 | 1.5% |
니 | 4164 | 1.4% |
에 | 4081 | 1.4% |
는 | 3918 | 1.3% |
고 | 3633 | 1.2% |
Other values (1182) | 192283 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 212569 | |
Space Separator | 63095 | 21.3% |
Other Punctuation | 8251 | 2.8% |
Decimal Number | 7004 | 2.4% |
Close Punctuation | 1917 | 0.6% |
Open Punctuation | 1784 | 0.6% |
Uppercase Letter | 641 | 0.2% |
Lowercase Letter | 623 | 0.2% |
Math Symbol | 184 | 0.1% |
Initial Punctuation | 89 | < 0.1% |
Other values (5) | 186 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 5804 | 2.7% |
다 | 4929 | 2.3% |
하 | 4892 | 2.3% |
지 | 4521 | 2.1% |
니 | 4164 | 2.0% |
에 | 4081 | 1.9% |
는 | 3918 | 1.8% |
고 | 3633 | 1.7% |
시 | 3377 | 1.6% |
을 | 3211 | 1.5% |
Other values (1057) | 170039 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 96 | |
H | 93 | |
A | 48 | 7.5% |
M | 45 | 7.0% |
L | 43 | 6.7% |
S | 40 | 6.2% |
T | 40 | 6.2% |
K | 39 | 6.1% |
X | 23 | 3.6% |
B | 23 | 3.6% |
Other values (15) | 151 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 211 | |
t | 39 | 6.3% |
o | 30 | 4.8% |
k | 29 | 4.7% |
c | 27 | 4.3% |
e | 23 | 3.7% |
s | 23 | 3.7% |
n | 22 | 3.5% |
a | 22 | 3.5% |
p | 22 | 3.5% |
Other values (14) | 175 |
Other Punctuation
Value | Count | Frequency (%) |
. | 5023 | |
, | 1748 | 21.2% |
? | 576 | 7.0% |
! | 185 | 2.2% |
: | 181 | 2.2% |
/ | 166 | 2.0% |
' | 141 | 1.7% |
" | 82 | 1.0% |
% | 56 | 0.7% |
* | 38 | 0.5% |
Other values (8) | 55 | 0.7% |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 29 | |
○ | 10 | 12.7% |
㈜ | 8 | 10.1% |
☞ | 7 | 8.9% |
□ | 7 | 8.9% |
◈ | 5 | 6.3% |
◎ | 3 | 3.8% |
☆ | 3 | 3.8% |
● | 2 | 2.5% |
■ | 2 | 2.5% |
Other values (2) | 3 | 3.8% |
Math Symbol
Value | Count | Frequency (%) |
~ | 108 | |
> | 27 | 14.7% |
= | 17 | 9.2% |
< | 13 | 7.1% |
→ | 5 | 2.7% |
× | 4 | 2.2% |
| | 4 | 2.2% |
⇒ | 3 | 1.6% |
+ | 1 | 0.5% |
∼ | 1 | 0.5% |
Decimal Number
Value | Count | Frequency (%) |
1 | 1555 | |
0 | 1435 | |
2 | 1364 | |
3 | 663 | |
4 | 442 | 6.3% |
5 | 406 | 5.8% |
6 | 323 | 4.6% |
8 | 310 | 4.4% |
7 | 285 | 4.1% |
9 | 221 | 3.2% |
Other Number
Value | Count | Frequency (%) |
① | 4 | |
② | 2 | |
⑥ | 1 | 7.7% |
⑧ | 1 | 7.7% |
③ | 1 | 7.7% |
④ | 1 | 7.7% |
⑨ | 1 | 7.7% |
⑤ | 1 | 7.7% |
⑦ | 1 | 7.7% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1832 | |
] | 69 | 3.6% |
」 | 12 | 0.6% |
』 | 3 | 0.2% |
〉 | 1 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1700 | |
[ | 68 | 3.8% |
「 | 12 | 0.7% |
『 | 4 | 0.2% |
Initial Punctuation
Value | Count | Frequency (%) |
“ | 57 | |
‘ | 32 |
Final Punctuation
Value | Count | Frequency (%) |
” | 50 | |
’ | 28 |
Space Separator
Value | Count | Frequency (%) |
63095 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 8 |
Modifier Symbol
Value | Count | Frequency (%) |
^ | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 212570 | |
Common | 82502 | 27.8% |
Latin | 1264 | 0.4% |
Han | 7 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 5804 | 2.7% |
다 | 4929 | 2.3% |
하 | 4892 | 2.3% |
지 | 4521 | 2.1% |
니 | 4164 | 2.0% |
에 | 4081 | 1.9% |
는 | 3918 | 1.8% |
고 | 3633 | 1.7% |
시 | 3377 | 1.6% |
을 | 3211 | 1.5% |
Other values (1051) | 170040 |
Common
Value | Count | Frequency (%) |
63095 | ||
. | 5023 | 6.1% |
) | 1832 | 2.2% |
, | 1748 | 2.1% |
( | 1700 | 2.1% |
1 | 1555 | 1.9% |
0 | 1435 | 1.7% |
2 | 1364 | 1.7% |
3 | 663 | 0.8% |
? | 576 | 0.7% |
Other values (65) | 3511 | 4.3% |
Latin
Value | Count | Frequency (%) |
m | 211 | 16.7% |
C | 96 | 7.6% |
H | 93 | 7.4% |
A | 48 | 3.8% |
M | 45 | 3.6% |
L | 43 | 3.4% |
S | 40 | 3.2% |
T | 40 | 3.2% |
K | 39 | 3.1% |
t | 39 | 3.1% |
Other values (39) | 570 |
Han
Value | Count | Frequency (%) |
次 | 1 | |
地 | 1 | |
見 | 1 | |
沓 | 1 | |
香 | 1 | |
之 | 1 | |
安 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 212533 | |
ASCII | 83428 | 28.2% |
Punctuation | 183 | 0.1% |
None | 69 | < 0.1% |
Geometric Shapes | 32 | < 0.1% |
CJK Compat | 29 | < 0.1% |
Compat Jamo | 29 | < 0.1% |
Enclosed Alphanum | 13 | < 0.1% |
Misc Symbols | 10 | < 0.1% |
Arrows | 9 | < 0.1% |
Other values (2) | 8 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
63095 | ||
. | 5023 | 6.0% |
) | 1832 | 2.2% |
, | 1748 | 2.1% |
( | 1700 | 2.0% |
1 | 1555 | 1.9% |
0 | 1435 | 1.7% |
2 | 1364 | 1.6% |
3 | 663 | 0.8% |
? | 576 | 0.7% |
Other values (76) | 4437 | 5.3% |
Hangul
Value | Count | Frequency (%) |
이 | 5804 | 2.7% |
다 | 4929 | 2.3% |
하 | 4892 | 2.3% |
지 | 4521 | 2.1% |
니 | 4164 | 2.0% |
에 | 4081 | 1.9% |
는 | 3918 | 1.8% |
고 | 3633 | 1.7% |
시 | 3377 | 1.6% |
을 | 3211 | 1.5% |
Other values (1036) | 170003 |
Punctuation
Value | Count | Frequency (%) |
“ | 57 | |
” | 50 | |
‘ | 32 | |
’ | 28 | |
※ | 11 | 6.0% |
… | 5 | 2.7% |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 29 |
None
Value | Count | Frequency (%) |
· | 20 | |
「 | 12 | |
」 | 12 | |
㈜ | 8 | 11.6% |
? | 5 | 7.2% |
『 | 4 | 5.8% |
× | 4 | 5.8% |
』 | 3 | 4.3% |
〉 | 1 | 1.4% |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 10 | |
□ | 7 | |
◈ | 5 | |
◎ | 3 | 9.4% |
● | 2 | 6.2% |
■ | 2 | 6.2% |
▶ | 2 | 6.2% |
▣ | 1 | 3.1% |
Misc Symbols
Value | Count | Frequency (%) |
☞ | 7 | |
☆ | 3 |
Compat Jamo
Value | Count | Frequency (%) |
ㄱ | 5 | |
ㅂ | 3 | |
ㄷ | 3 | |
ㄴ | 3 | |
ㅈ | 2 | 6.9% |
ㅡ | 2 | 6.9% |
ㄹ | 2 | 6.9% |
ㅁ | 2 | 6.9% |
ㅠ | 2 | 6.9% |
ㅣ | 1 | 3.4% |
Other values (4) | 4 |
Arrows
Value | Count | Frequency (%) |
→ | 5 | |
⇒ | 3 | |
↔ | 1 | 11.1% |
Enclosed Alphanum
Value | Count | Frequency (%) |
① | 4 | |
② | 2 | |
⑥ | 1 | 7.7% |
⑧ | 1 | 7.7% |
③ | 1 | 7.7% |
④ | 1 | 7.7% |
⑨ | 1 | 7.7% |
⑤ | 1 | 7.7% |
⑦ | 1 | 7.7% |
Math Operators
Value | Count | Frequency (%) |
∼ | 1 |
CJK
Value | Count | Frequency (%) |
次 | 1 | |
地 | 1 | |
見 | 1 | |
沓 | 1 | |
香 | 1 | |
之 | 1 | |
安 | 1 |
교정본
Text
Distinct | 6287 |
---|---|
Distinct (%) | 86.5% |
Missing | 2 |
Missing (%) | < 0.1% |
Memory size | 56.9 KiB |
Length
Max length | 380 |
---|---|
Median length | 143 |
Mean length | 42.272865 |
Min length | 2 |
Characters and Unicode
Total characters | 307366 |
---|---|
Distinct characters | 1076 |
Distinct categories | 14 ? |
Distinct scripts | 4 ? |
Distinct blocks | 11 ? |
Unique
Unique | 6189 ? |
---|---|
Unique (%) | 85.1% |
Sample
1st row | 경부고속철도 울산역세권 공사 관련 보상협의에 대한 탄원서 |
---|---|
2nd row | 우리는 울산광역시 울주군 삼남면 교동리의 재결 및 이주생활 대책위원회다. |
3rd row | 그리고 현재 경부고속철도 울산역세권 공사에 대한 보상협의 중에 있다. |
4th row | 그동안 울산도시공사는 주변시세에 맞추어 보상협상에 임하겠다고 우리 교동리 주민들 한사람 한사람과 약속을 하였다. |
5th row | 그러나 협상대표자들을 이간질하여 마을이 단합을 할 수 없도록 방해공작을 하였다. |
Value | Count | Frequency (%) |
없음 | 822 | 1.1% |
수 | 598 | 0.8% |
있다 | 569 | 0.8% |
바란다 | 542 | 0.7% |
및 | 465 | 0.6% |
있는 | 396 | 0.5% |
울산 | 381 | 0.5% |
대한 | 347 | 0.5% |
한다 | 310 | 0.4% |
것을 | 269 | 0.4% |
Other values (22015) | 69902 |
Most occurring characters
Value | Count | Frequency (%) |
71054 | 23.1% | |
이 | 7012 | 2.3% |
다 | 6990 | 2.3% |
하 | 6278 | 2.0% |
. | 6259 | 2.0% |
지 | 4819 | 1.6% |
에 | 4572 | 1.5% |
는 | 4264 | 1.4% |
을 | 3734 | 1.2% |
한 | 3705 | 1.2% |
Other values (1066) | 188679 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 216169 | |
Space Separator | 71054 | 23.1% |
Other Punctuation | 8638 | 2.8% |
Decimal Number | 6740 | 2.2% |
Close Punctuation | 1669 | 0.5% |
Open Punctuation | 1543 | 0.5% |
Uppercase Letter | 658 | 0.2% |
Lowercase Letter | 557 | 0.2% |
Initial Punctuation | 93 | < 0.1% |
Final Punctuation | 87 | < 0.1% |
Other values (4) | 158 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 7012 | 3.2% |
다 | 6990 | 3.2% |
하 | 6278 | 2.9% |
지 | 4819 | 2.2% |
에 | 4572 | 2.1% |
는 | 4264 | 2.0% |
을 | 3734 | 1.7% |
한 | 3705 | 1.7% |
사 | 3394 | 1.6% |
고 | 3261 | 1.5% |
Other values (954) | 168140 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 205 | |
t | 31 | 5.6% |
c | 29 | 5.2% |
o | 25 | 4.5% |
k | 23 | 4.1% |
e | 20 | 3.6% |
p | 19 | 3.4% |
d | 19 | 3.4% |
h | 19 | 3.4% |
b | 19 | 3.4% |
Other values (14) | 148 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 100 | |
H | 97 | |
K | 54 | |
T | 52 | |
L | 44 | 6.7% |
S | 42 | 6.4% |
A | 41 | 6.2% |
M | 40 | 6.1% |
X | 34 | 5.2% |
B | 25 | 3.8% |
Other values (14) | 129 |
Other Punctuation
Value | Count | Frequency (%) |
. | 6259 | |
, | 1834 | 21.2% |
: | 156 | 1.8% |
/ | 125 | 1.4% |
' | 95 | 1.1% |
· | 54 | 0.6% |
% | 28 | 0.3% |
" | 28 | 0.3% |
? | 24 | 0.3% |
* | 24 | 0.3% |
Other values (3) | 11 | 0.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 1485 | |
0 | 1350 | |
2 | 1339 | |
3 | 631 | |
4 | 428 | 6.4% |
5 | 387 | 5.7% |
6 | 316 | 4.7% |
8 | 304 | 4.5% |
7 | 281 | 4.2% |
9 | 219 | 3.2% |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 42 | |
㈜ | 10 | 12.7% |
☞ | 9 | 11.4% |
○ | 6 | 7.6% |
□ | 4 | 5.1% |
☆ | 2 | 2.5% |
▶ | 2 | 2.5% |
● | 2 | 2.5% |
■ | 2 | 2.5% |
Math Symbol
Value | Count | Frequency (%) |
~ | 19 | |
> | 14 | |
= | 11 | |
< | 9 | |
× | 4 | 6.1% |
→ | 4 | 6.1% |
⇒ | 3 | 4.5% |
+ | 1 | 1.5% |
↔ | 1 | 1.5% |
Other Number
Value | Count | Frequency (%) |
① | 3 | |
② | 2 | |
⑧ | 1 | 8.3% |
⑦ | 1 | 8.3% |
⑨ | 1 | 8.3% |
③ | 1 | 8.3% |
④ | 1 | 8.3% |
⑤ | 1 | 8.3% |
⑥ | 1 | 8.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1641 | |
] | 20 | 1.2% |
」 | 5 | 0.3% |
』 | 3 | 0.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1516 | |
[ | 19 | 1.2% |
「 | 5 | 0.3% |
『 | 3 | 0.2% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 62 | |
“ | 31 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 60 | |
” | 27 |
Space Separator
Value | Count | Frequency (%) |
71054 |
Control
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 216175 | |
Common | 89972 | |
Latin | 1215 | 0.4% |
Han | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 7012 | 3.2% |
다 | 6990 | 3.2% |
하 | 6278 | 2.9% |
지 | 4819 | 2.2% |
에 | 4572 | 2.1% |
는 | 4264 | 2.0% |
을 | 3734 | 1.7% |
한 | 3705 | 1.7% |
사 | 3394 | 1.6% |
고 | 3261 | 1.5% |
Other values (951) | 168146 |
Common
Value | Count | Frequency (%) |
71054 | ||
. | 6259 | 7.0% |
, | 1834 | 2.0% |
) | 1641 | 1.8% |
( | 1516 | 1.7% |
1 | 1485 | 1.7% |
0 | 1350 | 1.5% |
2 | 1339 | 1.5% |
3 | 631 | 0.7% |
4 | 428 | 0.5% |
Other values (53) | 2435 | 2.7% |
Latin
Value | Count | Frequency (%) |
m | 205 | |
C | 100 | 8.2% |
H | 97 | 8.0% |
K | 54 | 4.4% |
T | 52 | 4.3% |
L | 44 | 3.6% |
S | 42 | 3.5% |
A | 41 | 3.4% |
M | 40 | 3.3% |
X | 34 | 2.8% |
Other values (38) | 506 |
Han
Value | Count | Frequency (%) |
香 | 1 | |
沓 | 1 | |
安 | 1 | |
之 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 216149 | |
ASCII | 90836 | |
Punctuation | 188 | 0.1% |
None | 84 | < 0.1% |
CJK Compat | 42 | < 0.1% |
Geometric Shapes | 16 | < 0.1% |
Compat Jamo | 16 | < 0.1% |
Enclosed Alphanum | 12 | < 0.1% |
Misc Symbols | 11 | < 0.1% |
Arrows | 8 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
71054 | ||
. | 6259 | 6.9% |
, | 1834 | 2.0% |
) | 1641 | 1.8% |
( | 1516 | 1.7% |
1 | 1485 | 1.6% |
0 | 1350 | 1.5% |
2 | 1339 | 1.5% |
3 | 631 | 0.7% |
4 | 428 | 0.5% |
Other values (70) | 3299 | 3.6% |
Hangul
Value | Count | Frequency (%) |
이 | 7012 | 3.2% |
다 | 6990 | 3.2% |
하 | 6278 | 2.9% |
지 | 4819 | 2.2% |
에 | 4572 | 2.1% |
는 | 4264 | 2.0% |
을 | 3734 | 1.7% |
한 | 3705 | 1.7% |
사 | 3394 | 1.6% |
고 | 3261 | 1.5% |
Other values (944) | 168120 |
Punctuation
Value | Count | Frequency (%) |
‘ | 62 | |
’ | 60 | |
“ | 31 | |
” | 27 | |
※ | 8 | 4.3% |
None
Value | Count | Frequency (%) |
· | 54 | |
㈜ | 10 | 11.9% |
」 | 5 | 6.0% |
「 | 5 | 6.0% |
× | 4 | 4.8% |
『 | 3 | 3.6% |
』 | 3 | 3.6% |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 42 |
Misc Symbols
Value | Count | Frequency (%) |
☞ | 9 | |
☆ | 2 | 18.2% |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 6 | |
□ | 4 | |
▶ | 2 | 12.5% |
● | 2 | 12.5% |
■ | 2 | 12.5% |
Compat Jamo
Value | Count | Frequency (%) |
ㄱ | 5 | |
ㄷ | 3 | |
ㅁ | 2 | 12.5% |
ㅂ | 2 | 12.5% |
ㄹ | 2 | 12.5% |
ㄴ | 2 | 12.5% |
Arrows
Value | Count | Frequency (%) |
→ | 4 | |
⇒ | 3 | |
↔ | 1 | 12.5% |
Enclosed Alphanum
Value | Count | Frequency (%) |
① | 3 | |
② | 2 | |
⑧ | 1 | 8.3% |
⑦ | 1 | 8.3% |
⑨ | 1 | 8.3% |
③ | 1 | 8.3% |
④ | 1 | 8.3% |
⑤ | 1 | 8.3% |
⑥ | 1 | 8.3% |
CJK
Value | Count | Frequency (%) |
香 | 1 | |
沓 | 1 | |
安 | 1 | |
之 | 1 |
단락종류 | 문단번호 | 문장번호 | |
---|---|---|---|
단락종류 | 1.000 | 0.279 | 0.312 |
문단번호 | 0.279 | 1.000 | 0.128 |
문장번호 | 0.312 | 0.128 | 1.000 |
문단번호 | 문장번호 | 단락종류 | |
---|---|---|---|
문단번호 | 1.000 | 0.198 | 0.150 |
문장번호 | 0.198 | 1.000 | 0.169 |
단락종류 | 0.150 | 0.169 | 1.000 |
관리번호 | 단락종류 | 문단번호 | 문장번호 | 원문 | 교정본 | |
---|---|---|---|---|---|---|
0 | CD090128001 | 제목 | 1 | 1 | 없음 | 경부고속철도 울산역세권 공사 관련 보상협의에 대한 탄원서 |
1 | CD090128001 | 서론 | 1 | 1 | 안녕하십니까? 저희는 울산광역시 울주군 삼남면 교동리의 재결 및 이주생활 대책위원회입니다. | 우리는 울산광역시 울주군 삼남면 교동리의 재결 및 이주생활 대책위원회다. |
2 | CD090128001 | 서론 | 1 | 2 | 지금 시행중인 경부고속철도 울산역세권 공사에 대한 보상협의 중에 있습니다. | 그리고 현재 경부고속철도 울산역세권 공사에 대한 보상협의 중에 있다. |
3 | CD090128001 | 서론 | 1 | 3 | 그동안 울산 도시공사는 본 마을과 협상하면서 주변시세에 맞추어서 보상을 하겠다고 우리 교동리 주민들 한사람 한사람에게 약속을 하여 보상 협상에 임하게 하였고 또 마을을 대표하여 앞에서 열심히 일하는 협상대표자들을 이간질 하여 마을이 단합을 할 수 없도록 방해공작을 하였습니다. | 그동안 울산도시공사는 주변시세에 맞추어 보상협상에 임하겠다고 우리 교동리 주민들 한사람 한사람과 약속을 하였다. |
4 | CD090128001 | 서론 | 1 | 3 | 없음 | 그러나 협상대표자들을 이간질하여 마을이 단합을 할 수 없도록 방해공작을 하였다. |
5 | CD090128001 | 서론 | 1 | 4 | 그리고 이주 생활 대책은 말로만 할 뿐 서류 환 장 남길려고 하지 않고 묵묵부답입니다. | 거기다 이주 생활 대책은 구문으로만 이루어질 뿐, 서류로 정확히 증명하지 않고 있다. |
6 | CD090128001 | 서론 | 1 | 5 | 울주군 삼남면 농협 별관에 보상 사무실을 차려놓고 찾아 오는 나이 고하를 마론하고 주민들에게 반말로 이래라 저래라 하면서 거드럼을 피워가면서 보상이 많이 나왔다며 그 마을에 모아무개도 찾아 갔다며 부추기고 있습니다. | 울주군 삼남면 농협 별관에 보상 사무실을 차려 놓고 찾아오는 주민들에게 나이 고하를 막론하고 반말로 거드럼을 피운다. |
7 | CD090128001 | 서론 | 1 | 5 | 없음 | 또한 보상이 많이 나왔다며 그 마을에 모아무개도 찾아 갔다고 부추기고 있다. |
8 | CD090128001 | 서론 | 2 | 1 | 또한, 안내문에는 농협 별관이라는 안내도 없었고 건물 밖에 아무런 안내 표시도 하지 않았습니다. | 안내문에는 농협 별관이라는 안내도 없었다. |
9 | CD090128001 | 서론 | 2 | 1 | 없음 | 건물 밖에 아무런 안내 표시도 하지 않았다. |
관리번호 | 단락종류 | 문단번호 | 문장번호 | 원문 | 교정본 | |
---|---|---|---|---|---|---|
7263 | VOCA220107070 | 서론 | 1 | 4 | 검토를 한다고 한지 두달이 지나도록 아무런 검토와 진행이 이루어지지 않는것 같아 문의합니다. | 검토하겠다는 이야기가 나온 지 두 달이 지나도록 아무런 검토와 진행이 이루어지지 않는 것 같아 문의한다. |
7264 | VOCA220107070 | 본론 | 1 | 1 | 말로써만 검토한다 하지 마시고 공공기관인 도시공사는 책임감을 가지고 울산 시민이 건강하고 쾌적하게 살수있도록 조속한 이전 확정을 지어주시길 간곡히 바랍니다. | 말로만 검토한다고 하는 것은 그만하고, 공공기관인 도시공사는 책임감을 갖고 울산 시민이 건강하고 쾌적하게 살 수 있도록 조속히 이전을 확정하여 주기 바란다. |
7265 | VOCA220107070 | 본론 | 1 | 2 | 남측만 이전이 아닌 북측까지 2기 모두 이전 되어 전자파의 영향권에서 벗어날수 있도록 해주세요 | 남측과 북측의 2기 모두 이전하여 전자파의 영향권에서 벗어날 수 있도록 도움을 주었으면 한다. |
7266 | VOCA220109071 | 제목 | 1 | 1 | 없음 | 송전탑 문제 해결 방안 강구 요청 |
7267 | VOCA220109071 | 서론 | 1 | 1 | 율동 한신 더휴는 제가 부모님 모시고 살 제 생의 첫 집입니다. | 율동 한신더휴는 부모님을 모시고 살 나의 생애 첫 집이다. |
7268 | VOCA220109071 | 서론 | 1 | 2 | 제 생의 첫 청약, 당첨 되었던 그때의 기쁨을 아직도 잊을 수 없어요 | 첫 청약에 당첨되었던 그때의 기쁨을 아직도 잊을 수 없다. |
7269 | VOCA220109071 | 본론 | 1 | 1 | 그런데 미리 알지도 못했던 송전탑이 집 앞 근처 전방 50미터 안에 있다니요., | 그러나 미리 이야기를 듣지 못하였던 송전탑이 집 앞 전방 50m 내에 있다. |
7270 | VOCA220109071 | 본론 | 1 | 2 | 송전탑 관련해 검색해보니 발암 기사도 많이 나오는데, 부모님과 저, 저의 가족의 건강에 문제될까 너무 걱정되어 매일 잠을 이룰 수 없습니다. | 송전탑 관련하여 알아보니 발암 기사가 많다. |
7271 | VOCA220109071 | 본론 | 1 | 2 | 없음 | 가족 건강에 문제가 생길까 우려되어 매일 잠을 이룰 수 없다. |
7272 | VOCA220109071 | 본론 | 1 | 3 | 울산시민들이 내 집에서 건강하게 살 수 있게 해결방안을 꼭 검토해주십시오. | 울산 시민들이 자신의 집에서 건강하게 살 수 있도록 해결 방안을 검토하여 주기 바란다. |