Overview

Dataset statistics

Number of variables7
Number of observations100
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory5.7 KiB
Average record size in memory58.3 B

Variable types

Numeric1
Text5
Categorical1

Alerts

연번 is highly overall correlated with 보도날짜High correlation
보도날짜 is highly overall correlated with 연번High correlation
연번 has unique valuesUnique

Reproduction

Analysis started2023-12-10 10:44:57.429066
Analysis finished2023-12-10 10:44:59.798821
Duration2.37 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연번
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct100
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean50.5
Minimum1
Maximum100
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.0 KiB
2023-12-10T19:44:59.954051image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile5.95
Q125.75
median50.5
Q375.25
95-th percentile95.05
Maximum100
Range99
Interquartile range (IQR)49.5

Descriptive statistics

Standard deviation29.011492
Coefficient of variation (CV)0.57448499
Kurtosis-1.2
Mean50.5
Median Absolute Deviation (MAD)25
Skewness0
Sum5050
Variance841.66667
MonotonicityStrictly increasing
2023-12-10T19:45:00.267427image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
1.0%
65 1
 
1.0%
75 1
 
1.0%
74 1
 
1.0%
73 1
 
1.0%
72 1
 
1.0%
71 1
 
1.0%
70 1
 
1.0%
69 1
 
1.0%
68 1
 
1.0%
Other values (90) 90
90.0%
ValueCountFrequency (%)
1 1
1.0%
2 1
1.0%
3 1
1.0%
4 1
1.0%
5 1
1.0%
6 1
1.0%
7 1
1.0%
8 1
1.0%
9 1
1.0%
10 1
1.0%
ValueCountFrequency (%)
100 1
1.0%
99 1
1.0%
98 1
1.0%
97 1
1.0%
96 1
1.0%
95 1
1.0%
94 1
1.0%
93 1
1.0%
92 1
1.0%
91 1
1.0%
Distinct83
Distinct (%)83.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
2023-12-10T19:45:00.762005image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length12
Median length10
Mean length5.83
Min length2

Characters and Unicode

Total characters583
Distinct characters175
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique70 ?
Unique (%)70.0%

Sample

1st row영풍
2nd row영풍
3rd row한국원자력연구원
4th row지에스리테일
5th row비지에프리테일
ValueCountFrequency (%)
한국토지주택공사 4
 
3.9%
한국수력원자력 3
 
2.9%
수도권매립지관리공사 3
 
2.9%
삼성전자 2
 
1.9%
롯데건설 2
 
1.9%
한국수자원공사 2
 
1.9%
서희건설 2
 
1.9%
대우건설 2
 
1.9%
포스코건설 2
 
1.9%
영풍 2
 
1.9%
Other values (76) 79
76.7%
2023-12-10T19:45:01.537596image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
22
 
3.8%
22
 
3.8%
22
 
3.8%
21
 
3.6%
16
 
2.7%
15
 
2.6%
15
 
2.6%
14
 
2.4%
11
 
1.9%
10
 
1.7%
Other values (165) 415
71.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 544
93.3%
Uppercase Letter 31
 
5.3%
Space Separator 3
 
0.5%
Other Punctuation 2
 
0.3%
Decimal Number 2
 
0.3%
Dash Punctuation 1
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
22
 
4.0%
22
 
4.0%
22
 
4.0%
21
 
3.9%
16
 
2.9%
15
 
2.8%
15
 
2.8%
14
 
2.6%
11
 
2.0%
10
 
1.8%
Other values (148) 376
69.1%
Uppercase Letter
ValueCountFrequency (%)
S 8
25.8%
G 5
16.1%
L 4
12.9%
K 4
12.9%
C 2
 
6.5%
E 2
 
6.5%
I 1
 
3.2%
O 1
 
3.2%
T 1
 
3.2%
N 1
 
3.2%
Other values (2) 2
 
6.5%
Decimal Number
ValueCountFrequency (%)
2 1
50.0%
4 1
50.0%
Space Separator
ValueCountFrequency (%)
3
100.0%
Other Punctuation
ValueCountFrequency (%)
& 2
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 544
93.3%
Latin 31
 
5.3%
Common 8
 
1.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
22
 
4.0%
22
 
4.0%
22
 
4.0%
21
 
3.9%
16
 
2.9%
15
 
2.8%
15
 
2.8%
14
 
2.6%
11
 
2.0%
10
 
1.8%
Other values (148) 376
69.1%
Latin
ValueCountFrequency (%)
S 8
25.8%
G 5
16.1%
L 4
12.9%
K 4
12.9%
C 2
 
6.5%
E 2
 
6.5%
I 1
 
3.2%
O 1
 
3.2%
T 1
 
3.2%
N 1
 
3.2%
Other values (2) 2
 
6.5%
Common
ValueCountFrequency (%)
3
37.5%
& 2
25.0%
- 1
 
12.5%
2 1
 
12.5%
4 1
 
12.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 544
93.3%
ASCII 39
 
6.7%

Most frequent character per block

Hangul
ValueCountFrequency (%)
22
 
4.0%
22
 
4.0%
22
 
4.0%
21
 
3.9%
16
 
2.9%
15
 
2.8%
15
 
2.8%
14
 
2.6%
11
 
2.0%
10
 
1.8%
Other values (148) 376
69.1%
ASCII
ValueCountFrequency (%)
S 8
20.5%
G 5
12.8%
L 4
10.3%
K 4
10.3%
3
 
7.7%
& 2
 
5.1%
C 2
 
5.1%
E 2
 
5.1%
I 1
 
2.6%
O 1
 
2.6%
Other values (7) 7
17.9%
Distinct85
Distinct (%)85.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
2023-12-10T19:45:01.982946image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length25
Median length12
Mean length6.15
Min length2

Characters and Unicode

Total characters615
Distinct characters181
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique73 ?
Unique (%)73.0%

Sample

1st row영풍 석포제련소
2nd row영풍 석포제련소
3rd row한국원자력연구원
4th rowGS25
5th rowCU
ValueCountFrequency (%)
한국토지주택공사 4
 
3.5%
수도권매립지관리공사 3
 
2.6%
서희건설 2
 
1.8%
석포제련소 2
 
1.8%
롯데건설 2
 
1.8%
한국수자원공사 2
 
1.8%
대우건설 2
 
1.8%
영풍 2
 
1.8%
한국수력원자력 2
 
1.8%
현대건설 2
 
1.8%
Other values (87) 91
79.8%
2023-12-10T19:45:02.740079image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
24
 
3.9%
22
 
3.6%
20
 
3.3%
19
 
3.1%
16
 
2.6%
15
 
2.4%
15
 
2.4%
15
 
2.4%
14
 
2.3%
10
 
1.6%
Other values (171) 445
72.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 558
90.7%
Uppercase Letter 35
 
5.7%
Space Separator 15
 
2.4%
Decimal Number 4
 
0.7%
Other Punctuation 2
 
0.3%
Dash Punctuation 1
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
24
 
4.3%
22
 
3.9%
20
 
3.6%
19
 
3.4%
16
 
2.9%
15
 
2.7%
15
 
2.7%
14
 
2.5%
10
 
1.8%
10
 
1.8%
Other values (152) 393
70.4%
Uppercase Letter
ValueCountFrequency (%)
S 9
25.7%
G 6
17.1%
K 4
11.4%
L 4
11.4%
C 3
 
8.6%
E 2
 
5.7%
I 1
 
2.9%
O 1
 
2.9%
T 1
 
2.9%
U 1
 
2.9%
Other values (3) 3
 
8.6%
Decimal Number
ValueCountFrequency (%)
2 2
50.0%
4 1
25.0%
5 1
25.0%
Space Separator
ValueCountFrequency (%)
15
100.0%
Other Punctuation
ValueCountFrequency (%)
& 2
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 558
90.7%
Latin 35
 
5.7%
Common 22
 
3.6%

Most frequent character per script

Hangul
ValueCountFrequency (%)
24
 
4.3%
22
 
3.9%
20
 
3.6%
19
 
3.4%
16
 
2.9%
15
 
2.7%
15
 
2.7%
14
 
2.5%
10
 
1.8%
10
 
1.8%
Other values (152) 393
70.4%
Latin
ValueCountFrequency (%)
S 9
25.7%
G 6
17.1%
K 4
11.4%
L 4
11.4%
C 3
 
8.6%
E 2
 
5.7%
I 1
 
2.9%
O 1
 
2.9%
T 1
 
2.9%
U 1
 
2.9%
Other values (3) 3
 
8.6%
Common
ValueCountFrequency (%)
15
68.2%
& 2
 
9.1%
2 2
 
9.1%
- 1
 
4.5%
4 1
 
4.5%
5 1
 
4.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 558
90.7%
ASCII 57
 
9.3%

Most frequent character per block

Hangul
ValueCountFrequency (%)
24
 
4.3%
22
 
3.9%
20
 
3.6%
19
 
3.4%
16
 
2.9%
15
 
2.7%
15
 
2.7%
14
 
2.5%
10
 
1.8%
10
 
1.8%
Other values (152) 393
70.4%
ASCII
ValueCountFrequency (%)
15
26.3%
S 9
15.8%
G 6
 
10.5%
K 4
 
7.0%
L 4
 
7.0%
C 3
 
5.3%
& 2
 
3.5%
2 2
 
3.5%
E 2
 
3.5%
I 1
 
1.8%
Other values (9) 9
15.8%

보도날짜
Categorical

HIGH CORRELATION 

Distinct49
Distinct (%)49.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
2022.09.21
20 
2022.09.27
 
6
2022.09.17
 
5
2022.12.22
 
5
2022.09.29
 
4
Other values (44)
60 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique35 ?
Unique (%)35.0%

Sample

1st row2022.12.28
2nd row2022.12.27
3rd row2022.12.23
4th row2022.12.22
5th row2022.12.22

Common Values

ValueCountFrequency (%)
2022.09.21 20
20.0%
2022.09.27 6
 
6.0%
2022.09.17 5
 
5.0%
2022.12.22 5
 
5.0%
2022.09.29 4
 
4.0%
2022.10.28 4
 
4.0%
2022.10.11 4
 
4.0%
2022.06.21 3
 
3.0%
2022.03.27 3
 
3.0%
2022.07.14 3
 
3.0%
Other values (39) 43
43.0%

Length

2023-12-10T19:45:03.107508image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
2022.09.21 20
20.0%
2022.09.27 6
 
6.0%
2022.09.17 5
 
5.0%
2022.12.22 5
 
5.0%
2022.09.29 4
 
4.0%
2022.10.28 4
 
4.0%
2022.10.11 4
 
4.0%
2022.06.21 3
 
3.0%
2022.03.27 3
 
3.0%
2022.07.14 3
 
3.0%
Other values (39) 43
43.0%
Distinct59
Distinct (%)59.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
2023-12-10T19:45:03.583828image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length40
Median length36
Mean length32.86
Min length19

Characters and Unicode

Total characters3286
Distinct characters369
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique49 ?
Unique (%)49.0%

Sample

1st row봉화 영풍석포제련소 운영 허가에 시민단체 "환경부가 환경오염 업체 두둔"
2nd row영풍 석포제련소, 조건부 사업 허가
3rd row원자력연 보관 방사성폐기물 260드럼 반출…올해 총 482드럼
4th row‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니
5th row‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니
ValueCountFrequency (%)
최다 25
 
3.6%
lh 22
 
3.1%
7년간 20
 
2.9%
건설폐기물법 20
 
2.9%
위반…과태료도 20
 
2.9%
4억3천만원으로 20
 
2.9%
1위 20
 
2.9%
최근 20
 
2.9%
온실가스 8
 
1.1%
기준치 8
 
1.1%
Other values (365) 516
73.8%
2023-12-10T19:45:04.367959image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
599
 
18.2%
64
 
1.9%
" 48
 
1.5%
46
 
1.4%
46
 
1.4%
43
 
1.3%
43
 
1.3%
, 41
 
1.2%
41
 
1.2%
39
 
1.2%
Other values (359) 2276
69.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2240
68.2%
Space Separator 599
 
18.2%
Other Punctuation 224
 
6.8%
Decimal Number 129
 
3.9%
Uppercase Letter 55
 
1.7%
Final Punctuation 14
 
0.4%
Initial Punctuation 14
 
0.4%
Open Punctuation 4
 
0.1%
Close Punctuation 4
 
0.1%
Other Symbol 1
 
< 0.1%
Other values (2) 2
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
64
 
2.9%
46
 
2.1%
46
 
2.1%
43
 
1.9%
41
 
1.8%
39
 
1.7%
39
 
1.7%
37
 
1.7%
32
 
1.4%
31
 
1.4%
Other values (320) 1822
81.3%
Other Punctuation
ValueCountFrequency (%)
" 48
21.4%
43
19.2%
, 41
18.3%
· 39
17.4%
' 33
14.7%
% 11
 
4.9%
? 4
 
1.8%
. 3
 
1.3%
1
 
0.4%
& 1
 
0.4%
Uppercase Letter
ValueCountFrequency (%)
L 24
43.6%
H 22
40.0%
S 2
 
3.6%
G 2
 
3.6%
C 1
 
1.8%
K 1
 
1.8%
E 1
 
1.8%
R 1
 
1.8%
N 1
 
1.8%
Decimal Number
ValueCountFrequency (%)
1 37
28.7%
3 24
18.6%
4 22
17.1%
7 20
15.5%
6 9
 
7.0%
0 8
 
6.2%
2 6
 
4.7%
8 3
 
2.3%
Final Punctuation
ValueCountFrequency (%)
12
85.7%
2
 
14.3%
Initial Punctuation
ValueCountFrequency (%)
12
85.7%
2
 
14.3%
Open Punctuation
ValueCountFrequency (%)
[ 2
50.0%
( 2
50.0%
Close Punctuation
ValueCountFrequency (%)
] 2
50.0%
) 2
50.0%
Space Separator
ValueCountFrequency (%)
599
100.0%
Other Symbol
ValueCountFrequency (%)
1
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%
Math Symbol
ValueCountFrequency (%)
~ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2240
68.2%
Common 991
30.2%
Latin 55
 
1.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
64
 
2.9%
46
 
2.1%
46
 
2.1%
43
 
1.9%
41
 
1.8%
39
 
1.7%
39
 
1.7%
37
 
1.7%
32
 
1.4%
31
 
1.4%
Other values (320) 1822
81.3%
Common
ValueCountFrequency (%)
599
60.4%
" 48
 
4.8%
43
 
4.3%
, 41
 
4.1%
· 39
 
3.9%
1 37
 
3.7%
' 33
 
3.3%
3 24
 
2.4%
4 22
 
2.2%
7 20
 
2.0%
Other values (20) 85
 
8.6%
Latin
ValueCountFrequency (%)
L 24
43.6%
H 22
40.0%
S 2
 
3.6%
G 2
 
3.6%
C 1
 
1.8%
K 1
 
1.8%
E 1
 
1.8%
R 1
 
1.8%
N 1
 
1.8%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2240
68.2%
ASCII 934
28.4%
Punctuation 72
 
2.2%
None 39
 
1.2%
CJK Compat 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
599
64.1%
" 48
 
5.1%
, 41
 
4.4%
1 37
 
4.0%
' 33
 
3.5%
L 24
 
2.6%
3 24
 
2.6%
4 22
 
2.4%
H 22
 
2.4%
7 20
 
2.1%
Other values (21) 64
 
6.9%
Hangul
ValueCountFrequency (%)
64
 
2.9%
46
 
2.1%
46
 
2.1%
43
 
1.9%
41
 
1.8%
39
 
1.7%
39
 
1.7%
37
 
1.7%
32
 
1.4%
31
 
1.4%
Other values (320) 1822
81.3%
Punctuation
ValueCountFrequency (%)
43
59.7%
12
 
16.7%
12
 
16.7%
2
 
2.8%
2
 
2.8%
1
 
1.4%
None
ValueCountFrequency (%)
· 39
100.0%
CJK Compat
ValueCountFrequency (%)
1
100.0%
Distinct62
Distinct (%)62.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
2023-12-10T19:45:04.964610image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length222
Median length132
Mean length107.75
Min length52

Characters and Unicode

Total characters10775
Distinct characters500
Distinct categories14 ?
Distinct scripts3 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique51 ?
Unique (%)51.0%

Sample

1st row낙동강 상류에서 카드뮴, 납 등 중금속을 배출해 환경오염을 야기한다는 지적을 받는 경북 봉화군 영풍석포제련소가 환경오염물질 저감시설 개선을 조건으로 운영 허가를 받자 환경단체가 반발하고 있다.
2nd row수년간 카드뮴과 납으로 오염된 물을 낙동강 최상류에서 불법 방류해 낙동강 환경오염의 주범으로 지목됐던 영풍 석포제련소에 대해 환경부가 허가 배출기준과 허가조건을 최대 3년내 이행하는 것을 전제로 허가했다.
3rd row23일 대전시에 따르면 한국원자력연구원에 보관 중이던 중·저준위 방사성폐기물 260드럼이 이날 새벽 2시께 운반차량 6대에 실려 경주 최종 처분장으로 출발했다. 원자력연구원에서는 지난 8월에도 222드럼을 반출했으며, 이로써 올해 계획했던 400드럼보다 82드럼이 더 반출됐다.
4th row서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다.
5th row서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다.
ValueCountFrequency (%)
것으로 25
 
1.2%
순으로 23
 
1.1%
나타났다 19
 
0.9%
등의 19
 
0.9%
17
 
0.8%
가장 14
 
0.7%
곳은 11
 
0.5%
있는 11
 
0.5%
위반한 11
 
0.5%
일회용 10
 
0.5%
Other values (1046) 1853
92.1%
2023-12-10T19:45:05.868846image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1917
 
17.8%
306
 
2.8%
, 225
 
2.1%
( 215
 
2.0%
) 215
 
2.0%
180
 
1.7%
167
 
1.5%
154
 
1.4%
139
 
1.3%
2 134
 
1.2%
Other values (490) 7123
66.1%

Most occurring categories

ValueCountFrequency (%)
Other Letter 7205
66.9%
Space Separator 1917
 
17.8%
Decimal Number 590
 
5.5%
Other Punctuation 418
 
3.9%
Open Punctuation 215
 
2.0%
Close Punctuation 215
 
2.0%
Uppercase Letter 177
 
1.6%
Initial Punctuation 9
 
0.1%
Final Punctuation 9
 
0.1%
Other Symbol 9
 
0.1%
Other values (4) 11
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
306
 
4.2%
180
 
2.5%
167
 
2.3%
154
 
2.1%
139
 
1.9%
133
 
1.8%
120
 
1.7%
119
 
1.7%
112
 
1.6%
111
 
1.5%
Other values (441) 5664
78.6%
Uppercase Letter
ValueCountFrequency (%)
S 36
20.3%
L 35
19.8%
H 22
12.4%
G 21
11.9%
D 12
 
6.8%
C 7
 
4.0%
U 7
 
4.0%
E 6
 
3.4%
K 5
 
2.8%
O 5
 
2.8%
Other values (7) 21
11.9%
Decimal Number
ValueCountFrequency (%)
2 134
22.7%
1 86
14.6%
0 67
11.4%
7 60
10.2%
6 50
 
8.5%
3 48
 
8.1%
9 43
 
7.3%
5 42
 
7.1%
4 38
 
6.4%
8 22
 
3.7%
Other Punctuation
ValueCountFrequency (%)
, 225
53.8%
. 120
28.7%
· 43
 
10.3%
" 24
 
5.7%
% 3
 
0.7%
' 2
 
0.5%
& 1
 
0.2%
Lowercase Letter
ValueCountFrequency (%)
e 1
33.3%
t 1
33.3%
1
33.3%
Initial Punctuation
ValueCountFrequency (%)
8
88.9%
1
 
11.1%
Final Punctuation
ValueCountFrequency (%)
8
88.9%
1
 
11.1%
Other Symbol
ValueCountFrequency (%)
7
77.8%
2
 
22.2%
Space Separator
ValueCountFrequency (%)
1917
100.0%
Open Punctuation
ValueCountFrequency (%)
( 215
100.0%
Close Punctuation
ValueCountFrequency (%)
) 215
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 6
100.0%
Control
ValueCountFrequency (%)
1
100.0%
Math Symbol
ValueCountFrequency (%)
~ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 7207
66.9%
Common 3388
31.4%
Latin 180
 
1.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
306
 
4.2%
180
 
2.5%
167
 
2.3%
154
 
2.1%
139
 
1.9%
133
 
1.8%
120
 
1.7%
119
 
1.7%
112
 
1.6%
111
 
1.5%
Other values (442) 5666
78.6%
Common
ValueCountFrequency (%)
1917
56.6%
, 225
 
6.6%
( 215
 
6.3%
) 215
 
6.3%
2 134
 
4.0%
. 120
 
3.5%
1 86
 
2.5%
0 67
 
2.0%
7 60
 
1.8%
6 50
 
1.5%
Other values (18) 299
 
8.8%
Latin
ValueCountFrequency (%)
S 36
20.0%
L 35
19.4%
H 22
12.2%
G 21
11.7%
D 12
 
6.7%
C 7
 
3.9%
U 7
 
3.9%
E 6
 
3.3%
K 5
 
2.8%
O 5
 
2.8%
Other values (10) 24
13.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 7205
66.9%
ASCII 3499
32.5%
None 46
 
0.4%
Punctuation 18
 
0.2%
Geometric Shapes 7
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1917
54.8%
, 225
 
6.4%
( 215
 
6.1%
) 215
 
6.1%
2 134
 
3.8%
. 120
 
3.4%
1 86
 
2.5%
0 67
 
1.9%
7 60
 
1.7%
6 50
 
1.4%
Other values (31) 410
 
11.7%
Hangul
ValueCountFrequency (%)
306
 
4.2%
180
 
2.5%
167
 
2.3%
154
 
2.1%
139
 
1.9%
133
 
1.8%
120
 
1.7%
119
 
1.7%
112
 
1.6%
111
 
1.5%
Other values (441) 5664
78.6%
None
ValueCountFrequency (%)
· 43
93.5%
2
 
4.3%
1
 
2.2%
Punctuation
ValueCountFrequency (%)
8
44.4%
8
44.4%
1
 
5.6%
1
 
5.6%
Geometric Shapes
ValueCountFrequency (%)
7
100.0%
Distinct59
Distinct (%)59.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
2023-12-10T19:45:06.353059image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length84
Median length78
Mean length54.11
Min length37

Characters and Unicode

Total characters5411
Distinct characters61
Distinct categories7 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique49 ?
Unique (%)49.0%

Sample

1st rowhttps://n.news.naver.com/mnews/article/421/0006545234?sid=102
2nd rowhttps://n.news.naver.com/mnews/article/014/0004947614?sid=102
3rd rowhttps://n.news.naver.com/mnews/article/001/0013658708?sid=102
4th rowhttps://n.news.naver.com/mnews/article/032/0003194551?sid=102
5th rowhttps://n.news.naver.com/mnews/article/032/0003194551?sid=102
ValueCountFrequency (%)
https://www.news1.kr/articles/4808855 20
20.0%
https://www.yna.co.kr/view/akr20220927133600530?input=1195m 6
 
6.0%
https://n.news.naver.com/mnews/article/032/0003194551?sid=102 5
 
5.0%
https://www.yonhapnewstv.co.kr/news/myh20220917005600038?input=1825m 5
 
5.0%
https://www.khan.co.kr/environment/environment-general/article/202210281549001 3
 
3.0%
https://www.yna.co.kr/view/akr20220326024500530?input=1195m 3
 
3.0%
https://www.yna.co.kr/view/akr20220929048800064?input=1195m 3
 
3.0%
https://www.news1.kr/articles/?4718459 2
 
2.0%
https://www.yna.co.kr/view/akr20220420086700064?input=1195m 2
 
2.0%
https://www.yna.co.kr/view/akr20221011154651054?input=1195m 2
 
2.0%
Other values (49) 49
49.0%
2023-12-10T19:45:06.942409image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
/ 433
 
8.0%
0 400
 
7.4%
w 374
 
6.9%
t 313
 
5.8%
1 269
 
5.0%
. 264
 
4.9%
2 245
 
4.5%
s 217
 
4.0%
n 213
 
3.9%
e 205
 
3.8%
Other values (51) 2478
45.8%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 2697
49.8%
Decimal Number 1575
29.1%
Other Punctuation 876
 
16.2%
Uppercase Letter 183
 
3.4%
Math Symbol 73
 
1.3%
Connector Punctuation 4
 
0.1%
Dash Punctuation 3
 
0.1%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
w 374
13.9%
t 313
11.6%
s 217
 
8.0%
n 213
 
7.9%
e 205
 
7.6%
i 177
 
6.6%
p 159
 
5.9%
r 158
 
5.9%
c 127
 
4.7%
a 120
 
4.4%
Other values (14) 634
23.5%
Uppercase Letter
ValueCountFrequency (%)
R 41
22.4%
A 41
22.4%
K 40
21.9%
I 12
 
6.6%
D 8
 
4.4%
H 6
 
3.3%
N 6
 
3.3%
Y 5
 
2.7%
M 5
 
2.7%
X 4
 
2.2%
Other values (9) 15
 
8.2%
Decimal Number
ValueCountFrequency (%)
0 400
25.4%
1 269
17.1%
2 245
15.6%
5 169
10.7%
8 119
 
7.6%
9 93
 
5.9%
4 89
 
5.7%
3 79
 
5.0%
6 66
 
4.2%
7 46
 
2.9%
Other Punctuation
ValueCountFrequency (%)
/ 433
49.4%
. 264
30.1%
: 100
 
11.4%
? 68
 
7.8%
& 11
 
1.3%
Math Symbol
ValueCountFrequency (%)
= 73
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 4
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 2880
53.2%
Common 2531
46.8%

Most frequent character per script

Latin
ValueCountFrequency (%)
w 374
13.0%
t 313
 
10.9%
s 217
 
7.5%
n 213
 
7.4%
e 205
 
7.1%
i 177
 
6.1%
p 159
 
5.5%
r 158
 
5.5%
c 127
 
4.4%
a 120
 
4.2%
Other values (33) 817
28.4%
Common
ValueCountFrequency (%)
/ 433
17.1%
0 400
15.8%
1 269
10.6%
. 264
10.4%
2 245
9.7%
5 169
 
6.7%
8 119
 
4.7%
: 100
 
4.0%
9 93
 
3.7%
4 89
 
3.5%
Other values (8) 350
13.8%

Most occurring blocks

ValueCountFrequency (%)
ASCII 5411
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
/ 433
 
8.0%
0 400
 
7.4%
w 374
 
6.9%
t 313
 
5.8%
1 269
 
5.0%
. 264
 
4.9%
2 245
 
4.5%
s 217
 
4.0%
n 213
 
3.9%
e 205
 
3.8%
Other values (51) 2478
45.8%

Interactions

2023-12-10T19:44:59.176677image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-10T19:45:07.103210image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연번법인명사업장명보도날짜기사제목기사요약정보출처주소
연번1.0000.5790.6480.9790.9810.9990.981
법인명0.5791.0001.0000.8730.7370.0000.737
사업장명0.6481.0001.0000.9350.8940.0000.894
보도날짜0.9790.8730.9351.0001.0001.0001.000
기사제목0.9810.7370.8941.0001.0001.0001.000
기사요약0.9990.0000.0001.0001.0001.0001.000
정보출처주소0.9810.7370.8941.0001.0001.0001.000
2023-12-10T19:45:07.320344image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연번보도날짜
연번1.0000.631
보도날짜0.6311.000

Missing values

2023-12-10T19:44:59.479439image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-10T19:44:59.707989image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연번법인명사업장명보도날짜기사제목기사요약정보출처주소
01영풍영풍 석포제련소2022.12.28봉화 영풍석포제련소 운영 허가에 시민단체 "환경부가 환경오염 업체 두둔"낙동강 상류에서 카드뮴, 납 등 중금속을 배출해 환경오염을 야기한다는 지적을 받는 경북 봉화군 영풍석포제련소가 환경오염물질 저감시설 개선을 조건으로 운영 허가를 받자 환경단체가 반발하고 있다.https://n.news.naver.com/mnews/article/421/0006545234?sid=102
12영풍영풍 석포제련소2022.12.27영풍 석포제련소, 조건부 사업 허가수년간 카드뮴과 납으로 오염된 물을 낙동강 최상류에서 불법 방류해 낙동강 환경오염의 주범으로 지목됐던 영풍 석포제련소에 대해 환경부가 허가 배출기준과 허가조건을 최대 3년내 이행하는 것을 전제로 허가했다.https://n.news.naver.com/mnews/article/014/0004947614?sid=102
23한국원자력연구원한국원자력연구원2022.12.23원자력연 보관 방사성폐기물 260드럼 반출…올해 총 482드럼23일 대전시에 따르면 한국원자력연구원에 보관 중이던 중·저준위 방사성폐기물 260드럼이 이날 새벽 2시께 운반차량 6대에 실려 경주 최종 처분장으로 출발했다. 원자력연구원에서는 지난 8월에도 222드럼을 반출했으며, 이로써 올해 계획했던 400드럼보다 82드럼이 더 반출됐다.https://n.news.naver.com/mnews/article/001/0013658708?sid=102
34지에스리테일GS252022.12.22‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다.https://n.news.naver.com/mnews/article/032/0003194551?sid=102
45비지에프리테일CU2022.12.22‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다.https://n.news.naver.com/mnews/article/032/0003194551?sid=102
56이마트24이마트242022.12.22‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다.https://n.news.naver.com/mnews/article/032/0003194551?sid=102
67한국미니스톱미니스톱2022.12.22‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다.https://n.news.naver.com/mnews/article/032/0003194551?sid=102
78코리아세븐세븐일레븐2022.12.22‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다.https://n.news.naver.com/mnews/article/032/0003194551?sid=102
89블랙이글스블랙이글스2022.12.07"블랙이글스 내뿜는 소음·오염물질 고통에서 벗어나고 싶다"공중곡예특수 비행팀 블랙이글스가 내는 소음과 경유 스모크 환경오염 피해로 고통받는 원주횡성주민들의 1인 시위가 꼬박 2년을 맞았다.https://www.yna.co.kr/view/AKR20221207090600062?input=1195m
910삼척블루파워삼척블루파워2022.11.30"삼척블루파워 최초 점화 멈춰라" 탈석탄단체 반발탈석탄법제정을위한시민사회연대 등 탈석탄 단체는 30일 강원 삼척시 남양동 삼척블루파워 앞에서 기자회견을 열고 "삼척블루파워 1호기 최초점화를 중단하라"고 촉구했다.https://www.news1.kr/articles/4880960
연번법인명사업장명보도날짜기사제목기사요약정보출처주소
9091농협흙사랑농협 흙사랑2022.04.20괴산메가폴리스산단 유치위 "사리면 일대 돈사 이전하라"충북 괴산메가폴리스산업단지유치위원회는 20일 "악취를 유발하는 사리면 일대 돈사는 조속히 이전하라"고 촉구했다.https://www.yna.co.kr/view/AKR20220420086700064?input=1195m
9192엘디팜영농조합법인엘디팜영농조합법인2022.04.20괴산메가폴리스산단 유치위 "사리면 일대 돈사 이전하라"충북 괴산메가폴리스산업단지유치위원회는 20일 "악취를 유발하는 사리면 일대 돈사는 조속히 이전하라"고 촉구했다.https://www.yna.co.kr/view/AKR20220420086700064?input=1195m
9293수도권매립지관리공사수도권매립지관리공사2022.04.12인천 서구 "수도권매립지공사 골프장 추가 조성 반대"인천 서구는 12일 보도자료를 통해 SL공사는 지역주민과 환경 정의는 안중에도 없이 조직 존립을 위해 골프장을 설립하는 것은 이기적인 생각이라며 SL공사의 사업 추진을 비난했다.https://www.news1.kr/articles/?4645947
9394수도권매립지관리공사수도권매립지관리공사2022.04.06매립지공사 사업영역 확대 놓고 공사-시민단체 갈등수도권매립지관리공사(이하 매립지공사)가 자사의 사업영역을 확대하는 법 개정을 둘러싸고 인천시·시민단체와 갈등을 빚고 있다.https://www.yna.co.kr/view/AKR20220406057100065?input=1195m
9495대흥알앤티대흥알앤티2022.03.27정부, 공업용 세척제 제조·수입·유통업체 점검최근 유성케미칼이라는 업체가 제조한 세척액을 사용한 두성산업과 대흥알앤티에서 노동자들이 유해화학물질에 중독된 사건이 발생했다.https://www.yna.co.kr/view/AKR20220326024500530?input=1195m
9596유성케미칼유성케미칼2022.03.27정부, 공업용 세척제 제조·수입·유통업체 점검최근 유성케미칼이라는 업체가 제조한 세척액을 사용한 두성산업과 대흥알앤티에서 노동자들이 유해화학물질에 중독된 사건이 발생했다.https://www.yna.co.kr/view/AKR20220326024500530?input=1195m
9697두성산업두성산업2022.03.27정부, 공업용 세척제 제조·수입·유통업체 점검최근 유성케미칼이라는 업체가 제조한 세척액을 사용한 두성산업과 대흥알앤티에서 노동자들이 유해화학물질에 중독된 사건이 발생했다.https://www.yna.co.kr/view/AKR20220326024500530?input=1195m
9798한국수력원자력월성원자력발전소2022.03.23월성원전 일부 지하수서 고농도 삼중수소 검출…"누설 의심"경북 경주의 월성원전 부지 내 일부 지하수에서 꽤 높은 수준의 방사성물질인 삼중수소가 검출된 것으로 나타났다.https://www.yna.co.kr/view/AKR20220323122800053?input=1195m
9899한국토지주택공사한국토지주택공사2022.03.22LH, 고덕신도시 내 오염 토사 2만㎥ 불법 반출…관계자 고발한국토지주택공사(LH)가 경기 평택 고덕국제화지구 내 폐업 폐기물처리업체 부지에 있던 오염 토사를 정화하지 않고 불법 반출한 사실이 평택시 조사 결과 드러났다.https://www.yna.co.kr/view/AKR20220322081600061?input=1195m
99100광주도시공사광주도시공사2022.03.19광주 영락공원 화장장 '대기측정 유예, 적정했나'…경찰 수사광주 영락공원 화장장이 과거 10개월간 대기오염물질 자가측정을 진행하지 않아 경찰의 수사를 받는 것으로 확인됐다.https://www.yna.co.kr/view/AKR20220318113800054?input=1195m