Overview

Dataset statistics

Number of variables6
Number of observations7273
Missing cells2
Missing cells (%)< 0.1%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory355.3 KiB
Average record size in memory50.0 B

Variable types

Text3
Categorical1
Numeric2

Dataset

Description울산광역시도시공사에서 접수받고 처리했던 민원들을 가공처리 하여 만든 데이터로 민원 내용의 정보를 다루고 있는 데이터
Author울산광역시도시공사
URLhttps://www.data.go.kr/data/15109609/fileData.do

Alerts

문단번호 has 408 (5.6%) zerosZeros
문장번호 has 421 (5.8%) zerosZeros

Reproduction

Analysis started2023-12-16 16:01:48.401531
Analysis finished2023-12-16 16:01:56.539639
Duration8.14 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct583
Distinct (%)8.0%
Missing0
Missing (%)0.0%
Memory size56.9 KiB
2023-12-16T16:01:57.202681image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length14
Median length11
Mean length11.378798
Min length10

Characters and Unicode

Total characters82758
Distinct characters22
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st rowCD090128001
2nd rowCD090128001
3rd rowCD090128001
4th rowCD090128001
5th rowCD090128001
ValueCountFrequency (%)
pa210119068 81
 
1.1%
bp130409001 57
 
0.8%
hb210927092 53
 
0.7%
il170818020 52
 
0.7%
il000000006 51
 
0.7%
cd141224052 48
 
0.7%
cd160329067 47
 
0.6%
hb170315033 47
 
0.6%
il000000017 46
 
0.6%
cd130821043 45
 
0.6%
Other values (573) 6746
92.8%
2023-12-16T16:01:58.529300image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 17438
21.1%
1 15798
19.1%
2 10289
12.4%
C 4088
 
4.9%
3 3684
 
4.5%
9 3674
 
4.4%
6 3081
 
3.7%
4 3044
 
3.7%
8 3033
 
3.7%
5 2776
 
3.4%
Other values (12) 15853
19.2%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 65458
79.1%
Uppercase Letter 17270
 
20.9%
Space Separator 30
 
< 0.1%

Most frequent character per category

Uppercase Letter
ValueCountFrequency (%)
C 4088
23.7%
D 2726
15.8%
B 2083
12.1%
A 1730
10.0%
H 1426
 
8.3%
O 1362
 
7.9%
V 1362
 
7.9%
P 903
 
5.2%
L 734
 
4.3%
I 734
 
4.3%
Decimal Number
ValueCountFrequency (%)
0 17438
26.6%
1 15798
24.1%
2 10289
15.7%
3 3684
 
5.6%
9 3674
 
5.6%
6 3081
 
4.7%
4 3044
 
4.7%
8 3033
 
4.6%
5 2776
 
4.2%
7 2641
 
4.0%
Space Separator
ValueCountFrequency (%)
30
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 65488
79.1%
Latin 17270
 
20.9%

Most frequent character per script

Common
ValueCountFrequency (%)
0 17438
26.6%
1 15798
24.1%
2 10289
15.7%
3 3684
 
5.6%
9 3674
 
5.6%
6 3081
 
4.7%
4 3044
 
4.6%
8 3033
 
4.6%
5 2776
 
4.2%
7 2641
 
4.0%
Latin
ValueCountFrequency (%)
C 4088
23.7%
D 2726
15.8%
B 2083
12.1%
A 1730
10.0%
H 1426
 
8.3%
O 1362
 
7.9%
V 1362
 
7.9%
P 903
 
5.2%
L 734
 
4.3%
I 734
 
4.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 82758
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 17438
21.1%
1 15798
19.1%
2 10289
12.4%
C 4088
 
4.9%
3 3684
 
4.5%
9 3674
 
4.4%
6 3081
 
3.7%
4 3044
 
3.7%
8 3033
 
3.7%
5 2776
 
3.4%
Other values (12) 15853
19.2%

단락종류
Categorical

Distinct6
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size56.9 KiB
본론
4146 
서론
1955 
제목
579 
사족
576 
서론
 
12

Length

Max length3
Median length2
Mean length2.0023374
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row제목
2nd row서론
3rd row서론
4th row서론
5th row서론

Common Values

ValueCountFrequency (%)
본론 4146
57.0%
서론 1955
26.9%
제목 579
 
8.0%
사족 576
 
7.9%
서론 12
 
0.2%
본론 5
 
0.1%

Length

2023-12-16T16:01:58.965523image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-16T16:01:59.405199image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
본론 4151
57.1%
서론 1967
27.0%
제목 579
 
8.0%
사족 576
 
7.9%

문단번호
Real number (ℝ)

ZEROS 

Distinct18
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean1.9307026
Minimum0
Maximum17
Zeros408
Zeros (%)5.6%
Negative0
Negative (%)0.0%
Memory size64.1 KiB
2023-12-16T16:01:59.798882image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q11
median1
Q32
95-th percentile6
Maximum17
Range17
Interquartile range (IQR)1

Descriptive statistics

Standard deviation2.049547
Coefficient of variation (CV)1.061555
Kurtosis12.401776
Mean1.9307026
Median Absolute Deviation (MAD)0
Skewness3.1506552
Sum14042
Variance4.2006428
MonotonicityNot monotonic
2023-12-16T16:02:00.305324image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=18)
ValueCountFrequency (%)
1 4146
57.0%
2 1267
 
17.4%
3 563
 
7.7%
0 408
 
5.6%
4 301
 
4.1%
5 173
 
2.4%
6 103
 
1.4%
7 87
 
1.2%
8 48
 
0.7%
10 42
 
0.6%
Other values (8) 135
 
1.9%
ValueCountFrequency (%)
0 408
 
5.6%
1 4146
57.0%
2 1267
 
17.4%
3 563
 
7.7%
4 301
 
4.1%
5 173
 
2.4%
6 103
 
1.4%
7 87
 
1.2%
8 48
 
0.7%
9 40
 
0.5%
ValueCountFrequency (%)
17 4
 
0.1%
16 3
 
< 0.1%
15 11
 
0.2%
14 5
 
0.1%
13 26
0.4%
12 18
 
0.2%
11 28
0.4%
10 42
0.6%
9 40
0.5%
8 48
0.7%

문장번호
Real number (ℝ)

ZEROS 

Distinct16
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2.146707
Minimum0
Maximum15
Zeros421
Zeros (%)5.8%
Negative0
Negative (%)0.0%
Memory size64.1 KiB
2023-12-16T16:02:00.720592image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q11
median2
Q33
95-th percentile6
Maximum15
Range15
Interquartile range (IQR)2

Descriptive statistics

Standard deviation1.7769017
Coefficient of variation (CV)0.82773367
Kurtosis4.3733045
Mean2.146707
Median Absolute Deviation (MAD)1
Skewness1.8211236
Sum15613
Variance3.1573795
MonotonicityNot monotonic
2023-12-16T16:02:01.246312image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=16)
ValueCountFrequency (%)
1 3210
44.1%
2 1432
19.7%
3 941
 
12.9%
4 554
 
7.6%
0 421
 
5.8%
5 315
 
4.3%
6 159
 
2.2%
7 104
 
1.4%
8 59
 
0.8%
9 39
 
0.5%
Other values (6) 39
 
0.5%
ValueCountFrequency (%)
0 421
 
5.8%
1 3210
44.1%
2 1432
19.7%
3 941
 
12.9%
4 554
 
7.6%
5 315
 
4.3%
6 159
 
2.2%
7 104
 
1.4%
8 59
 
0.8%
9 39
 
0.5%
ValueCountFrequency (%)
15 1
 
< 0.1%
14 1
 
< 0.1%
13 1
 
< 0.1%
12 4
 
0.1%
11 10
 
0.1%
10 22
 
0.3%
9 39
 
0.5%
8 59
 
0.8%
7 104
1.4%
6 159
2.2%

원문
Text

Distinct4990
Distinct (%)68.6%
Missing0
Missing (%)0.0%
Memory size56.9 KiB
2023-12-16T16:02:03.094216image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length760
Median length315
Mean length40.745635
Min length1

Characters and Unicode

Total characters296343
Distinct characters1192
Distinct categories15 ?
Distinct scripts4 ?
Distinct blocks12 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique4876 ?
Unique (%)67.0%

Sample

1st row없음
2nd row안녕하십니까? 저희는 울산광역시 울주군 삼남면 교동리의 재결 및 이주생활 대책위원회입니다.
3rd row지금 시행중인 경부고속철도 울산역세권 공사에 대한 보상협의 중에 있습니다.
4th row그동안 울산 도시공사는 본 마을과 협상하면서 주변시세에 맞추어서 보상을 하겠다고 우리 교동리 주민들 한사람 한사람에게 약속을 하여 보상 협상에 임하게 하였고 또 마을을 대표하여 앞에서 열심히 일하는 협상대표자들을 이간질 하여 마을이 단합을 할 수 없도록 방해공작을 하였습니다.
5th row없음
ValueCountFrequency (%)
없음 2156
 
3.2%
324
 
0.5%
있습니다 319
 
0.5%
312
 
0.5%
있는 242
 
0.4%
1 241
 
0.4%
240
 
0.4%
2 209
 
0.3%
바랍니다 198
 
0.3%
주소 188
 
0.3%
Other values (26396) 62785
93.4%
2023-12-16T16:02:06.683226image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
63095
 
21.3%
5804
 
2.0%
. 5023
 
1.7%
4929
 
1.7%
4892
 
1.7%
4521
 
1.5%
4164
 
1.4%
4081
 
1.4%
3918
 
1.3%
3633
 
1.2%
Other values (1182) 192283
64.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 212569
71.7%
Space Separator 63095
 
21.3%
Other Punctuation 8251
 
2.8%
Decimal Number 7004
 
2.4%
Close Punctuation 1917
 
0.6%
Open Punctuation 1784
 
0.6%
Uppercase Letter 641
 
0.2%
Lowercase Letter 623
 
0.2%
Math Symbol 184
 
0.1%
Initial Punctuation 89
 
< 0.1%
Other values (5) 186
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
5804
 
2.7%
4929
 
2.3%
4892
 
2.3%
4521
 
2.1%
4164
 
2.0%
4081
 
1.9%
3918
 
1.8%
3633
 
1.7%
3377
 
1.6%
3211
 
1.5%
Other values (1057) 170039
80.0%
Uppercase Letter
ValueCountFrequency (%)
C 96
15.0%
H 93
14.5%
A 48
 
7.5%
M 45
 
7.0%
L 43
 
6.7%
S 40
 
6.2%
T 40
 
6.2%
K 39
 
6.1%
X 23
 
3.6%
B 23
 
3.6%
Other values (15) 151
23.6%
Lowercase Letter
ValueCountFrequency (%)
m 211
33.9%
t 39
 
6.3%
o 30
 
4.8%
k 29
 
4.7%
c 27
 
4.3%
e 23
 
3.7%
s 23
 
3.7%
n 22
 
3.5%
a 22
 
3.5%
p 22
 
3.5%
Other values (14) 175
28.1%
Other Punctuation
ValueCountFrequency (%)
. 5023
60.9%
, 1748
 
21.2%
? 576
 
7.0%
! 185
 
2.2%
: 181
 
2.2%
/ 166
 
2.0%
' 141
 
1.7%
" 82
 
1.0%
% 56
 
0.7%
* 38
 
0.5%
Other values (8) 55
 
0.7%
Other Symbol
ValueCountFrequency (%)
29
36.7%
10
 
12.7%
8
 
10.1%
7
 
8.9%
7
 
8.9%
5
 
6.3%
3
 
3.8%
3
 
3.8%
2
 
2.5%
2
 
2.5%
Other values (2) 3
 
3.8%
Math Symbol
ValueCountFrequency (%)
~ 108
58.7%
> 27
 
14.7%
= 17
 
9.2%
< 13
 
7.1%
5
 
2.7%
× 4
 
2.2%
| 4
 
2.2%
3
 
1.6%
+ 1
 
0.5%
1
 
0.5%
Decimal Number
ValueCountFrequency (%)
1 1555
22.2%
0 1435
20.5%
2 1364
19.5%
3 663
9.5%
4 442
 
6.3%
5 406
 
5.8%
6 323
 
4.6%
8 310
 
4.4%
7 285
 
4.1%
9 221
 
3.2%
Other Number
ValueCountFrequency (%)
4
30.8%
2
15.4%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
Close Punctuation
ValueCountFrequency (%)
) 1832
95.6%
] 69
 
3.6%
12
 
0.6%
3
 
0.2%
1
 
0.1%
Open Punctuation
ValueCountFrequency (%)
( 1700
95.3%
[ 68
 
3.8%
12
 
0.7%
4
 
0.2%
Initial Punctuation
ValueCountFrequency (%)
57
64.0%
32
36.0%
Final Punctuation
ValueCountFrequency (%)
50
64.1%
28
35.9%
Space Separator
ValueCountFrequency (%)
63095
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 8
100.0%
Modifier Symbol
ValueCountFrequency (%)
^ 8
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 212570
71.7%
Common 82502
 
27.8%
Latin 1264
 
0.4%
Han 7
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
5804
 
2.7%
4929
 
2.3%
4892
 
2.3%
4521
 
2.1%
4164
 
2.0%
4081
 
1.9%
3918
 
1.8%
3633
 
1.7%
3377
 
1.6%
3211
 
1.5%
Other values (1051) 170040
80.0%
Common
ValueCountFrequency (%)
63095
76.5%
. 5023
 
6.1%
) 1832
 
2.2%
, 1748
 
2.1%
( 1700
 
2.1%
1 1555
 
1.9%
0 1435
 
1.7%
2 1364
 
1.7%
3 663
 
0.8%
? 576
 
0.7%
Other values (65) 3511
 
4.3%
Latin
ValueCountFrequency (%)
m 211
 
16.7%
C 96
 
7.6%
H 93
 
7.4%
A 48
 
3.8%
M 45
 
3.6%
L 43
 
3.4%
S 40
 
3.2%
T 40
 
3.2%
K 39
 
3.1%
t 39
 
3.1%
Other values (39) 570
45.1%
Han
ValueCountFrequency (%)
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 212533
71.7%
ASCII 83428
 
28.2%
Punctuation 183
 
0.1%
None 69
 
< 0.1%
Geometric Shapes 32
 
< 0.1%
CJK Compat 29
 
< 0.1%
Compat Jamo 29
 
< 0.1%
Enclosed Alphanum 13
 
< 0.1%
Misc Symbols 10
 
< 0.1%
Arrows 9
 
< 0.1%
Other values (2) 8
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
63095
75.6%
. 5023
 
6.0%
) 1832
 
2.2%
, 1748
 
2.1%
( 1700
 
2.0%
1 1555
 
1.9%
0 1435
 
1.7%
2 1364
 
1.6%
3 663
 
0.8%
? 576
 
0.7%
Other values (76) 4437
 
5.3%
Hangul
ValueCountFrequency (%)
5804
 
2.7%
4929
 
2.3%
4892
 
2.3%
4521
 
2.1%
4164
 
2.0%
4081
 
1.9%
3918
 
1.8%
3633
 
1.7%
3377
 
1.6%
3211
 
1.5%
Other values (1036) 170003
80.0%
Punctuation
ValueCountFrequency (%)
57
31.1%
50
27.3%
32
17.5%
28
15.3%
11
 
6.0%
5
 
2.7%
CJK Compat
ValueCountFrequency (%)
29
100.0%
None
ValueCountFrequency (%)
· 20
29.0%
12
17.4%
12
17.4%
8
 
11.6%
5
 
7.2%
4
 
5.8%
× 4
 
5.8%
3
 
4.3%
1
 
1.4%
Geometric Shapes
ValueCountFrequency (%)
10
31.2%
7
21.9%
5
15.6%
3
 
9.4%
2
 
6.2%
2
 
6.2%
2
 
6.2%
1
 
3.1%
Misc Symbols
ValueCountFrequency (%)
7
70.0%
3
30.0%
Compat Jamo
ValueCountFrequency (%)
5
17.2%
3
10.3%
3
10.3%
3
10.3%
2
 
6.9%
2
 
6.9%
2
 
6.9%
2
 
6.9%
2
 
6.9%
1
 
3.4%
Other values (4) 4
13.8%
Arrows
ValueCountFrequency (%)
5
55.6%
3
33.3%
1
 
11.1%
Enclosed Alphanum
ValueCountFrequency (%)
4
30.8%
2
15.4%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
1
 
7.7%
Math Operators
ValueCountFrequency (%)
1
100.0%
CJK
ValueCountFrequency (%)
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
Distinct6287
Distinct (%)86.5%
Missing2
Missing (%)< 0.1%
Memory size56.9 KiB
2023-12-16T16:02:08.039423image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length380
Median length143
Mean length42.272865
Min length2

Characters and Unicode

Total characters307366
Distinct characters1076
Distinct categories14 ?
Distinct scripts4 ?
Distinct blocks11 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique6189 ?
Unique (%)85.1%

Sample

1st row경부고속철도 울산역세권 공사 관련 보상협의에 대한 탄원서
2nd row우리는 울산광역시 울주군 삼남면 교동리의 재결 및 이주생활 대책위원회다.
3rd row그리고 현재 경부고속철도 울산역세권 공사에 대한 보상협의 중에 있다.
4th row그동안 울산도시공사는 주변시세에 맞추어 보상협상에 임하겠다고 우리 교동리 주민들 한사람 한사람과 약속을 하였다.
5th row그러나 협상대표자들을 이간질하여 마을이 단합을 할 수 없도록 방해공작을 하였다.
ValueCountFrequency (%)
없음 822
 
1.1%
598
 
0.8%
있다 569
 
0.8%
바란다 542
 
0.7%
465
 
0.6%
있는 396
 
0.5%
울산 381
 
0.5%
대한 347
 
0.5%
한다 310
 
0.4%
것을 269
 
0.4%
Other values (22015) 69902
93.7%
2023-12-16T16:02:10.042198image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
71054
 
23.1%
7012
 
2.3%
6990
 
2.3%
6278
 
2.0%
. 6259
 
2.0%
4819
 
1.6%
4572
 
1.5%
4264
 
1.4%
3734
 
1.2%
3705
 
1.2%
Other values (1066) 188679
61.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 216169
70.3%
Space Separator 71054
 
23.1%
Other Punctuation 8638
 
2.8%
Decimal Number 6740
 
2.2%
Close Punctuation 1669
 
0.5%
Open Punctuation 1543
 
0.5%
Uppercase Letter 658
 
0.2%
Lowercase Letter 557
 
0.2%
Initial Punctuation 93
 
< 0.1%
Final Punctuation 87
 
< 0.1%
Other values (4) 158
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
7012
 
3.2%
6990
 
3.2%
6278
 
2.9%
4819
 
2.2%
4572
 
2.1%
4264
 
2.0%
3734
 
1.7%
3705
 
1.7%
3394
 
1.6%
3261
 
1.5%
Other values (954) 168140
77.8%
Lowercase Letter
ValueCountFrequency (%)
m 205
36.8%
t 31
 
5.6%
c 29
 
5.2%
o 25
 
4.5%
k 23
 
4.1%
e 20
 
3.6%
p 19
 
3.4%
d 19
 
3.4%
h 19
 
3.4%
b 19
 
3.4%
Other values (14) 148
26.6%
Uppercase Letter
ValueCountFrequency (%)
C 100
15.2%
H 97
14.7%
K 54
8.2%
T 52
7.9%
L 44
 
6.7%
S 42
 
6.4%
A 41
 
6.2%
M 40
 
6.1%
X 34
 
5.2%
B 25
 
3.8%
Other values (14) 129
19.6%
Other Punctuation
ValueCountFrequency (%)
. 6259
72.5%
, 1834
 
21.2%
: 156
 
1.8%
/ 125
 
1.4%
' 95
 
1.1%
· 54
 
0.6%
% 28
 
0.3%
" 28
 
0.3%
? 24
 
0.3%
* 24
 
0.3%
Other values (3) 11
 
0.1%
Decimal Number
ValueCountFrequency (%)
1 1485
22.0%
0 1350
20.0%
2 1339
19.9%
3 631
9.4%
4 428
 
6.4%
5 387
 
5.7%
6 316
 
4.7%
8 304
 
4.5%
7 281
 
4.2%
9 219
 
3.2%
Other Symbol
ValueCountFrequency (%)
42
53.2%
10
 
12.7%
9
 
11.4%
6
 
7.6%
4
 
5.1%
2
 
2.5%
2
 
2.5%
2
 
2.5%
2
 
2.5%
Math Symbol
ValueCountFrequency (%)
~ 19
28.8%
> 14
21.2%
= 11
16.7%
< 9
13.6%
× 4
 
6.1%
4
 
6.1%
3
 
4.5%
+ 1
 
1.5%
1
 
1.5%
Other Number
ValueCountFrequency (%)
3
25.0%
2
16.7%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
Close Punctuation
ValueCountFrequency (%)
) 1641
98.3%
] 20
 
1.2%
5
 
0.3%
3
 
0.2%
Open Punctuation
ValueCountFrequency (%)
( 1516
98.3%
[ 19
 
1.2%
5
 
0.3%
3
 
0.2%
Initial Punctuation
ValueCountFrequency (%)
62
66.7%
31
33.3%
Final Punctuation
ValueCountFrequency (%)
60
69.0%
27
31.0%
Space Separator
ValueCountFrequency (%)
71054
100.0%
Control
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 216175
70.3%
Common 89972
29.3%
Latin 1215
 
0.4%
Han 4
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
7012
 
3.2%
6990
 
3.2%
6278
 
2.9%
4819
 
2.2%
4572
 
2.1%
4264
 
2.0%
3734
 
1.7%
3705
 
1.7%
3394
 
1.6%
3261
 
1.5%
Other values (951) 168146
77.8%
Common
ValueCountFrequency (%)
71054
79.0%
. 6259
 
7.0%
, 1834
 
2.0%
) 1641
 
1.8%
( 1516
 
1.7%
1 1485
 
1.7%
0 1350
 
1.5%
2 1339
 
1.5%
3 631
 
0.7%
4 428
 
0.5%
Other values (53) 2435
 
2.7%
Latin
ValueCountFrequency (%)
m 205
16.9%
C 100
 
8.2%
H 97
 
8.0%
K 54
 
4.4%
T 52
 
4.3%
L 44
 
3.6%
S 42
 
3.5%
A 41
 
3.4%
M 40
 
3.3%
X 34
 
2.8%
Other values (38) 506
41.6%
Han
ValueCountFrequency (%)
1
25.0%
1
25.0%
1
25.0%
1
25.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 216149
70.3%
ASCII 90836
29.6%
Punctuation 188
 
0.1%
None 84
 
< 0.1%
CJK Compat 42
 
< 0.1%
Geometric Shapes 16
 
< 0.1%
Compat Jamo 16
 
< 0.1%
Enclosed Alphanum 12
 
< 0.1%
Misc Symbols 11
 
< 0.1%
Arrows 8
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
71054
78.2%
. 6259
 
6.9%
, 1834
 
2.0%
) 1641
 
1.8%
( 1516
 
1.7%
1 1485
 
1.6%
0 1350
 
1.5%
2 1339
 
1.5%
3 631
 
0.7%
4 428
 
0.5%
Other values (70) 3299
 
3.6%
Hangul
ValueCountFrequency (%)
7012
 
3.2%
6990
 
3.2%
6278
 
2.9%
4819
 
2.2%
4572
 
2.1%
4264
 
2.0%
3734
 
1.7%
3705
 
1.7%
3394
 
1.6%
3261
 
1.5%
Other values (944) 168120
77.8%
Punctuation
ValueCountFrequency (%)
62
33.0%
60
31.9%
31
16.5%
27
14.4%
8
 
4.3%
None
ValueCountFrequency (%)
· 54
64.3%
10
 
11.9%
5
 
6.0%
5
 
6.0%
× 4
 
4.8%
3
 
3.6%
3
 
3.6%
CJK Compat
ValueCountFrequency (%)
42
100.0%
Misc Symbols
ValueCountFrequency (%)
9
81.8%
2
 
18.2%
Geometric Shapes
ValueCountFrequency (%)
6
37.5%
4
25.0%
2
 
12.5%
2
 
12.5%
2
 
12.5%
Compat Jamo
ValueCountFrequency (%)
5
31.2%
3
18.8%
2
 
12.5%
2
 
12.5%
2
 
12.5%
2
 
12.5%
Arrows
ValueCountFrequency (%)
4
50.0%
3
37.5%
1
 
12.5%
Enclosed Alphanum
ValueCountFrequency (%)
3
25.0%
2
16.7%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
1
 
8.3%
CJK
ValueCountFrequency (%)
1
25.0%
1
25.0%
1
25.0%
1
25.0%

Interactions

2023-12-16T16:01:54.708910image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-16T16:01:53.754335image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-16T16:01:55.122721image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-16T16:01:54.120592image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-16T16:02:10.601234image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
단락종류문단번호문장번호
단락종류1.0000.2790.312
문단번호0.2791.0000.128
문장번호0.3120.1281.000
2023-12-16T16:02:11.002115image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
문단번호문장번호단락종류
문단번호1.0000.1980.150
문장번호0.1981.0000.169
단락종류0.1500.1691.000

Missing values

2023-12-16T16:01:55.821538image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-16T16:01:56.325650image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

관리번호단락종류문단번호문장번호원문교정본
0CD090128001제목11없음경부고속철도 울산역세권 공사 관련 보상협의에 대한 탄원서
1CD090128001서론11안녕하십니까? 저희는 울산광역시 울주군 삼남면 교동리의 재결 및 이주생활 대책위원회입니다.우리는 울산광역시 울주군 삼남면 교동리의 재결 및 이주생활 대책위원회다.
2CD090128001서론12지금 시행중인 경부고속철도 울산역세권 공사에 대한 보상협의 중에 있습니다.그리고 현재 경부고속철도 울산역세권 공사에 대한 보상협의 중에 있다.
3CD090128001서론13그동안 울산 도시공사는 본 마을과 협상하면서 주변시세에 맞추어서 보상을 하겠다고 우리 교동리 주민들 한사람 한사람에게 약속을 하여 보상 협상에 임하게 하였고 또 마을을 대표하여 앞에서 열심히 일하는 협상대표자들을 이간질 하여 마을이 단합을 할 수 없도록 방해공작을 하였습니다.그동안 울산도시공사는 주변시세에 맞추어 보상협상에 임하겠다고 우리 교동리 주민들 한사람 한사람과 약속을 하였다.
4CD090128001서론13없음그러나 협상대표자들을 이간질하여 마을이 단합을 할 수 없도록 방해공작을 하였다.
5CD090128001서론14그리고 이주 생활 대책은 말로만 할 뿐 서류 환 장 남길려고 하지 않고 묵묵부답입니다.거기다 이주 생활 대책은 구문으로만 이루어질 뿐, 서류로 정확히 증명하지 않고 있다.
6CD090128001서론15울주군 삼남면 농협 별관에 보상 사무실을 차려놓고 찾아 오는 나이 고하를 마론하고 주민들에게 반말로 이래라 저래라 하면서 거드럼을 피워가면서 보상이 많이 나왔다며 그 마을에 모아무개도 찾아 갔다며 부추기고 있습니다.울주군 삼남면 농협 별관에 보상 사무실을 차려 놓고 찾아오는 주민들에게 나이 고하를 막론하고 반말로 거드럼을 피운다.
7CD090128001서론15없음또한 보상이 많이 나왔다며 그 마을에 모아무개도 찾아 갔다고 부추기고 있다.
8CD090128001서론21또한, 안내문에는 농협 별관이라는 안내도 없었고 건물 밖에 아무런 안내 표시도 하지 않았습니다.안내문에는 농협 별관이라는 안내도 없었다.
9CD090128001서론21없음건물 밖에 아무런 안내 표시도 하지 않았다.
관리번호단락종류문단번호문장번호원문교정본
7263VOCA220107070서론14검토를 한다고 한지 두달이 지나도록 아무런 검토와 진행이 이루어지지 않는것 같아 문의합니다.검토하겠다는 이야기가 나온 지 두 달이 지나도록 아무런 검토와 진행이 이루어지지 않는 것 같아 문의한다.
7264VOCA220107070본론11말로써만 검토한다 하지 마시고 공공기관인 도시공사는 책임감을 가지고 울산 시민이 건강하고 쾌적하게 살수있도록 조속한 이전 확정을 지어주시길 간곡히 바랍니다.말로만 검토한다고 하는 것은 그만하고, 공공기관인 도시공사는 책임감을 갖고 울산 시민이 건강하고 쾌적하게 살 수 있도록 조속히 이전을 확정하여 주기 바란다.
7265VOCA220107070본론12남측만 이전이 아닌 북측까지 2기 모두 이전 되어 전자파의 영향권에서 벗어날수 있도록 해주세요남측과 북측의 2기 모두 이전하여 전자파의 영향권에서 벗어날 수 있도록 도움을 주었으면 한다.
7266VOCA220109071제목11없음송전탑 문제 해결 방안 강구 요청
7267VOCA220109071서론11율동 한신 더휴는 제가 부모님 모시고 살 제 생의 첫 집입니다.율동 한신더휴는 부모님을 모시고 살 나의 생애 첫 집이다.
7268VOCA220109071서론12제 생의 첫 청약, 당첨 되었던 그때의 기쁨을 아직도 잊을 수 없어요첫 청약에 당첨되었던 그때의 기쁨을 아직도 잊을 수 없다.
7269VOCA220109071본론11그런데 미리 알지도 못했던 송전탑이 집 앞 근처 전방 50미터 안에 있다니요.,그러나 미리 이야기를 듣지 못하였던 송전탑이 집 앞 전방 50m 내에 있다.
7270VOCA220109071본론12송전탑 관련해 검색해보니 발암 기사도 많이 나오는데, 부모님과 저, 저의 가족의 건강에 문제될까 너무 걱정되어 매일 잠을 이룰 수 없습니다.송전탑 관련하여 알아보니 발암 기사가 많다.
7271VOCA220109071본론12없음가족 건강에 문제가 생길까 우려되어 매일 잠을 이룰 수 없다.
7272VOCA220109071본론13울산시민들이 내 집에서 건강하게 살 수 있게 해결방안을 꼭 검토해주십시오.울산 시민들이 자신의 집에서 건강하게 살 수 있도록 해결 방안을 검토하여 주기 바란다.