Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 5.7 KiB |
Average record size in memory | 58.3 B |
Variable types
Numeric | 1 |
---|---|
Text | 5 |
Categorical | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 에코앤파트너스 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=d2a374f0-f0fa-11eb-8532-03c16b175e55 |
Reproduction
Analysis started | 2023-12-10 10:44:57.429066 |
---|---|
Analysis finished | 2023-12-10 10:44:59.798821 |
Duration | 2.37 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 50.5 |
Minimum | 1 |
---|---|
Maximum | 100 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 5.95 |
Q1 | 25.75 |
median | 50.5 |
Q3 | 75.25 |
95-th percentile | 95.05 |
Maximum | 100 |
Range | 99 |
Interquartile range (IQR) | 49.5 |
Descriptive statistics
Standard deviation | 29.011492 |
---|---|
Coefficient of variation (CV) | 0.57448499 |
Kurtosis | -1.2 |
Mean | 50.5 |
Median Absolute Deviation (MAD) | 25 |
Skewness | 0 |
Sum | 5050 |
Variance | 841.66667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 1.0% |
65 | 1 | 1.0% |
75 | 1 | 1.0% |
74 | 1 | 1.0% |
73 | 1 | 1.0% |
72 | 1 | 1.0% |
71 | 1 | 1.0% |
70 | 1 | 1.0% |
69 | 1 | 1.0% |
68 | 1 | 1.0% |
Other values (90) | 90 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
100 | 1 | |
99 | 1 | |
98 | 1 | |
97 | 1 | |
96 | 1 | |
95 | 1 | |
94 | 1 | |
93 | 1 | |
92 | 1 | |
91 | 1 |
법인명
Text
Distinct | 83 |
---|---|
Distinct (%) | 83.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
한국토지주택공사 | 4 | 3.9% |
한국수력원자력 | 3 | 2.9% |
수도권매립지관리공사 | 3 | 2.9% |
삼성전자 | 2 | 1.9% |
롯데건설 | 2 | 1.9% |
한국수자원공사 | 2 | 1.9% |
서희건설 | 2 | 1.9% |
대우건설 | 2 | 1.9% |
포스코건설 | 2 | 1.9% |
영풍 | 2 | 1.9% |
Other values (76) | 79 |
Most occurring characters
Value | Count | Frequency (%) |
한 | 22 | 3.8% |
공 | 22 | 3.8% |
사 | 22 | 3.8% |
국 | 21 | 3.6% |
건 | 16 | 2.7% |
설 | 15 | 2.6% |
대 | 15 | 2.6% |
스 | 14 | 2.4% |
수 | 11 | 1.9% |
자 | 10 | 1.7% |
Other values (165) | 415 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 544 | |
Uppercase Letter | 31 | 5.3% |
Space Separator | 3 | 0.5% |
Other Punctuation | 2 | 0.3% |
Decimal Number | 2 | 0.3% |
Dash Punctuation | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
한 | 22 | 4.0% |
공 | 22 | 4.0% |
사 | 22 | 4.0% |
국 | 21 | 3.9% |
건 | 16 | 2.9% |
설 | 15 | 2.8% |
대 | 15 | 2.8% |
스 | 14 | 2.6% |
수 | 11 | 2.0% |
자 | 10 | 1.8% |
Other values (148) | 376 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 8 | |
G | 5 | |
L | 4 | |
K | 4 | |
C | 2 | 6.5% |
E | 2 | 6.5% |
I | 1 | 3.2% |
O | 1 | 3.2% |
T | 1 | 3.2% |
N | 1 | 3.2% |
Other values (2) | 2 | 6.5% |
Decimal Number
Value | Count | Frequency (%) |
2 | 1 | |
4 | 1 |
Space Separator
Value | Count | Frequency (%) |
3 |
Other Punctuation
Value | Count | Frequency (%) |
& | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 544 | |
Latin | 31 | 5.3% |
Common | 8 | 1.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
한 | 22 | 4.0% |
공 | 22 | 4.0% |
사 | 22 | 4.0% |
국 | 21 | 3.9% |
건 | 16 | 2.9% |
설 | 15 | 2.8% |
대 | 15 | 2.8% |
스 | 14 | 2.6% |
수 | 11 | 2.0% |
자 | 10 | 1.8% |
Other values (148) | 376 |
Latin
Value | Count | Frequency (%) |
S | 8 | |
G | 5 | |
L | 4 | |
K | 4 | |
C | 2 | 6.5% |
E | 2 | 6.5% |
I | 1 | 3.2% |
O | 1 | 3.2% |
T | 1 | 3.2% |
N | 1 | 3.2% |
Other values (2) | 2 | 6.5% |
Common
Value | Count | Frequency (%) |
3 | ||
& | 2 | |
- | 1 | 12.5% |
2 | 1 | 12.5% |
4 | 1 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 544 | |
ASCII | 39 | 6.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
한 | 22 | 4.0% |
공 | 22 | 4.0% |
사 | 22 | 4.0% |
국 | 21 | 3.9% |
건 | 16 | 2.9% |
설 | 15 | 2.8% |
대 | 15 | 2.8% |
스 | 14 | 2.6% |
수 | 11 | 2.0% |
자 | 10 | 1.8% |
Other values (148) | 376 |
ASCII
Value | Count | Frequency (%) |
S | 8 | |
G | 5 | |
L | 4 | |
K | 4 | |
3 | 7.7% | |
& | 2 | 5.1% |
C | 2 | 5.1% |
E | 2 | 5.1% |
I | 1 | 2.6% |
O | 1 | 2.6% |
Other values (7) | 7 |
사업장명
Text
Distinct | 85 |
---|---|
Distinct (%) | 85.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
한국토지주택공사 | 4 | 3.5% |
수도권매립지관리공사 | 3 | 2.6% |
서희건설 | 2 | 1.8% |
석포제련소 | 2 | 1.8% |
롯데건설 | 2 | 1.8% |
한국수자원공사 | 2 | 1.8% |
대우건설 | 2 | 1.8% |
영풍 | 2 | 1.8% |
한국수력원자력 | 2 | 1.8% |
현대건설 | 2 | 1.8% |
Other values (87) | 91 |
Most occurring characters
Value | Count | Frequency (%) |
공 | 24 | 3.9% |
사 | 22 | 3.6% |
한 | 20 | 3.3% |
국 | 19 | 3.1% |
건 | 16 | 2.6% |
대 | 15 | 2.4% |
15 | 2.4% | |
설 | 15 | 2.4% |
스 | 14 | 2.3% |
수 | 10 | 1.6% |
Other values (171) | 445 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 558 | |
Uppercase Letter | 35 | 5.7% |
Space Separator | 15 | 2.4% |
Decimal Number | 4 | 0.7% |
Other Punctuation | 2 | 0.3% |
Dash Punctuation | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
공 | 24 | 4.3% |
사 | 22 | 3.9% |
한 | 20 | 3.6% |
국 | 19 | 3.4% |
건 | 16 | 2.9% |
대 | 15 | 2.7% |
설 | 15 | 2.7% |
스 | 14 | 2.5% |
수 | 10 | 1.8% |
지 | 10 | 1.8% |
Other values (152) | 393 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 9 | |
G | 6 | |
K | 4 | |
L | 4 | |
C | 3 | 8.6% |
E | 2 | 5.7% |
I | 1 | 2.9% |
O | 1 | 2.9% |
T | 1 | 2.9% |
U | 1 | 2.9% |
Other values (3) | 3 | 8.6% |
Decimal Number
Value | Count | Frequency (%) |
2 | 2 | |
4 | 1 | |
5 | 1 |
Space Separator
Value | Count | Frequency (%) |
15 |
Other Punctuation
Value | Count | Frequency (%) |
& | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 558 | |
Latin | 35 | 5.7% |
Common | 22 | 3.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
공 | 24 | 4.3% |
사 | 22 | 3.9% |
한 | 20 | 3.6% |
국 | 19 | 3.4% |
건 | 16 | 2.9% |
대 | 15 | 2.7% |
설 | 15 | 2.7% |
스 | 14 | 2.5% |
수 | 10 | 1.8% |
지 | 10 | 1.8% |
Other values (152) | 393 |
Latin
Value | Count | Frequency (%) |
S | 9 | |
G | 6 | |
K | 4 | |
L | 4 | |
C | 3 | 8.6% |
E | 2 | 5.7% |
I | 1 | 2.9% |
O | 1 | 2.9% |
T | 1 | 2.9% |
U | 1 | 2.9% |
Other values (3) | 3 | 8.6% |
Common
Value | Count | Frequency (%) |
15 | ||
& | 2 | 9.1% |
2 | 2 | 9.1% |
- | 1 | 4.5% |
4 | 1 | 4.5% |
5 | 1 | 4.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 558 | |
ASCII | 57 | 9.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
공 | 24 | 4.3% |
사 | 22 | 3.9% |
한 | 20 | 3.6% |
국 | 19 | 3.4% |
건 | 16 | 2.9% |
대 | 15 | 2.7% |
설 | 15 | 2.7% |
스 | 14 | 2.5% |
수 | 10 | 1.8% |
지 | 10 | 1.8% |
Other values (152) | 393 |
ASCII
Value | Count | Frequency (%) |
15 | ||
S | 9 | |
G | 6 | 10.5% |
K | 4 | 7.0% |
L | 4 | 7.0% |
C | 3 | 5.3% |
& | 2 | 3.5% |
2 | 2 | 3.5% |
E | 2 | 3.5% |
I | 1 | 1.8% |
Other values (9) | 9 |
보도날짜
Categorical
HIGH CORRELATION
 
Distinct | 49 |
---|---|
Distinct (%) | 49.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
2022.09.21 | |
---|---|
2022.09.27 | 6 |
2022.09.17 | 5 |
2022.12.22 | 5 |
2022.09.29 | 4 |
Other values (44) |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 35 ? |
---|---|
Unique (%) | 35.0% |
Sample
1st row | 2022.12.28 |
---|---|
2nd row | 2022.12.27 |
3rd row | 2022.12.23 |
4th row | 2022.12.22 |
5th row | 2022.12.22 |
Common Values
Value | Count | Frequency (%) |
2022.09.21 | 20 | |
2022.09.27 | 6 | 6.0% |
2022.09.17 | 5 | 5.0% |
2022.12.22 | 5 | 5.0% |
2022.09.29 | 4 | 4.0% |
2022.10.28 | 4 | 4.0% |
2022.10.11 | 4 | 4.0% |
2022.06.21 | 3 | 3.0% |
2022.03.27 | 3 | 3.0% |
2022.07.14 | 3 | 3.0% |
Other values (39) | 43 |
Length
Value | Count | Frequency (%) |
2022.09.21 | 20 | |
2022.09.27 | 6 | 6.0% |
2022.09.17 | 5 | 5.0% |
2022.12.22 | 5 | 5.0% |
2022.09.29 | 4 | 4.0% |
2022.10.28 | 4 | 4.0% |
2022.10.11 | 4 | 4.0% |
2022.06.21 | 3 | 3.0% |
2022.03.27 | 3 | 3.0% |
2022.07.14 | 3 | 3.0% |
Other values (39) | 43 |
기사제목
Text
Distinct | 59 |
---|---|
Distinct (%) | 59.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Length
Max length | 40 |
---|---|
Median length | 36 |
Mean length | 32.86 |
Min length | 19 |
Characters and Unicode
Total characters | 3286 |
---|---|
Distinct characters | 369 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 49 ? |
---|---|
Unique (%) | 49.0% |
Sample
1st row | 봉화 영풍석포제련소 운영 허가에 시민단체 "환경부가 환경오염 업체 두둔" |
---|---|
2nd row | 영풍 석포제련소, 조건부 사업 허가 |
3rd row | 원자력연 보관 방사성폐기물 260드럼 반출…올해 총 482드럼 |
4th row | ‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니 |
5th row | ‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니 |
Value | Count | Frequency (%) |
최다 | 25 | 3.6% |
lh | 22 | 3.1% |
7년간 | 20 | 2.9% |
건설폐기물법 | 20 | 2.9% |
위반…과태료도 | 20 | 2.9% |
4억3천만원으로 | 20 | 2.9% |
1위 | 20 | 2.9% |
최근 | 20 | 2.9% |
온실가스 | 8 | 1.1% |
기준치 | 8 | 1.1% |
Other values (365) | 516 |
Most occurring characters
Value | Count | Frequency (%) |
599 | 18.2% | |
기 | 64 | 1.9% |
" | 48 | 1.5% |
최 | 46 | 1.4% |
위 | 46 | 1.4% |
도 | 43 | 1.3% |
… | 43 | 1.3% |
, | 41 | 1.2% |
사 | 41 | 1.2% |
가 | 39 | 1.2% |
Other values (359) | 2276 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2240 | |
Space Separator | 599 | 18.2% |
Other Punctuation | 224 | 6.8% |
Decimal Number | 129 | 3.9% |
Uppercase Letter | 55 | 1.7% |
Final Punctuation | 14 | 0.4% |
Initial Punctuation | 14 | 0.4% |
Open Punctuation | 4 | 0.1% |
Close Punctuation | 4 | 0.1% |
Other Symbol | 1 | < 0.1% |
Other values (2) | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 64 | 2.9% |
최 | 46 | 2.1% |
위 | 46 | 2.1% |
도 | 43 | 1.9% |
사 | 41 | 1.8% |
가 | 39 | 1.7% |
물 | 39 | 1.7% |
설 | 37 | 1.7% |
반 | 32 | 1.4% |
원 | 31 | 1.4% |
Other values (320) | 1822 |
Other Punctuation
Value | Count | Frequency (%) |
" | 48 | |
… | 43 | |
, | 41 | |
· | 39 | |
' | 33 | |
% | 11 | 4.9% |
? | 4 | 1.8% |
. | 3 | 1.3% |
‧ | 1 | 0.4% |
& | 1 | 0.4% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 24 | |
H | 22 | |
S | 2 | 3.6% |
G | 2 | 3.6% |
C | 1 | 1.8% |
K | 1 | 1.8% |
E | 1 | 1.8% |
R | 1 | 1.8% |
N | 1 | 1.8% |
Decimal Number
Value | Count | Frequency (%) |
1 | 37 | |
3 | 24 | |
4 | 22 | |
7 | 20 | |
6 | 9 | 7.0% |
0 | 8 | 6.2% |
2 | 6 | 4.7% |
8 | 3 | 2.3% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 12 | |
” | 2 | 14.3% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 12 | |
“ | 2 | 14.3% |
Open Punctuation
Value | Count | Frequency (%) |
[ | 2 | |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
] | 2 | |
) | 2 |
Space Separator
Value | Count | Frequency (%) |
599 |
Other Symbol
Value | Count | Frequency (%) |
㎥ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2240 | |
Common | 991 | |
Latin | 55 | 1.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 64 | 2.9% |
최 | 46 | 2.1% |
위 | 46 | 2.1% |
도 | 43 | 1.9% |
사 | 41 | 1.8% |
가 | 39 | 1.7% |
물 | 39 | 1.7% |
설 | 37 | 1.7% |
반 | 32 | 1.4% |
원 | 31 | 1.4% |
Other values (320) | 1822 |
Common
Value | Count | Frequency (%) |
599 | ||
" | 48 | 4.8% |
… | 43 | 4.3% |
, | 41 | 4.1% |
· | 39 | 3.9% |
1 | 37 | 3.7% |
' | 33 | 3.3% |
3 | 24 | 2.4% |
4 | 22 | 2.2% |
7 | 20 | 2.0% |
Other values (20) | 85 | 8.6% |
Latin
Value | Count | Frequency (%) |
L | 24 | |
H | 22 | |
S | 2 | 3.6% |
G | 2 | 3.6% |
C | 1 | 1.8% |
K | 1 | 1.8% |
E | 1 | 1.8% |
R | 1 | 1.8% |
N | 1 | 1.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2240 | |
ASCII | 934 | |
Punctuation | 72 | 2.2% |
None | 39 | 1.2% |
CJK Compat | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
599 | ||
" | 48 | 5.1% |
, | 41 | 4.4% |
1 | 37 | 4.0% |
' | 33 | 3.5% |
L | 24 | 2.6% |
3 | 24 | 2.6% |
4 | 22 | 2.4% |
H | 22 | 2.4% |
7 | 20 | 2.1% |
Other values (21) | 64 | 6.9% |
Hangul
Value | Count | Frequency (%) |
기 | 64 | 2.9% |
최 | 46 | 2.1% |
위 | 46 | 2.1% |
도 | 43 | 1.9% |
사 | 41 | 1.8% |
가 | 39 | 1.7% |
물 | 39 | 1.7% |
설 | 37 | 1.7% |
반 | 32 | 1.4% |
원 | 31 | 1.4% |
Other values (320) | 1822 |
Punctuation
Value | Count | Frequency (%) |
… | 43 | |
’ | 12 | 16.7% |
‘ | 12 | 16.7% |
” | 2 | 2.8% |
“ | 2 | 2.8% |
‧ | 1 | 1.4% |
None
Value | Count | Frequency (%) |
· | 39 |
CJK Compat
Value | Count | Frequency (%) |
㎥ | 1 |
기사요약
Text
Distinct | 62 |
---|---|
Distinct (%) | 62.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Length
Max length | 222 |
---|---|
Median length | 132 |
Mean length | 107.75 |
Min length | 52 |
Characters and Unicode
Total characters | 10775 |
---|---|
Distinct characters | 500 |
Distinct categories | 14 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 51 ? |
---|---|
Unique (%) | 51.0% |
Sample
1st row | 낙동강 상류에서 카드뮴, 납 등 중금속을 배출해 환경오염을 야기한다는 지적을 받는 경북 봉화군 영풍석포제련소가 환경오염물질 저감시설 개선을 조건으로 운영 허가를 받자 환경단체가 반발하고 있다. |
---|---|
2nd row | 수년간 카드뮴과 납으로 오염된 물을 낙동강 최상류에서 불법 방류해 낙동강 환경오염의 주범으로 지목됐던 영풍 석포제련소에 대해 환경부가 허가 배출기준과 허가조건을 최대 3년내 이행하는 것을 전제로 허가했다. |
3rd row | 23일 대전시에 따르면 한국원자력연구원에 보관 중이던 중·저준위 방사성폐기물 260드럼이 이날 새벽 2시께 운반차량 6대에 실려 경주 최종 처분장으로 출발했다. 원자력연구원에서는 지난 8월에도 222드럼을 반출했으며, 이로써 올해 계획했던 400드럼보다 82드럼이 더 반출됐다. |
4th row | 서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다. |
5th row | 서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다. |
Value | Count | Frequency (%) |
것으로 | 25 | 1.2% |
순으로 | 23 | 1.1% |
나타났다 | 19 | 0.9% |
등의 | 19 | 0.9% |
중 | 17 | 0.8% |
가장 | 14 | 0.7% |
곳은 | 11 | 0.5% |
있는 | 11 | 0.5% |
위반한 | 11 | 0.5% |
일회용 | 10 | 0.5% |
Other values (1046) | 1853 |
Most occurring characters
Value | Count | Frequency (%) |
1917 | 17.8% | |
건 | 306 | 2.8% |
, | 225 | 2.1% |
( | 215 | 2.0% |
) | 215 | 2.0% |
사 | 180 | 1.7% |
이 | 167 | 1.5% |
다 | 154 | 1.4% |
설 | 139 | 1.3% |
2 | 134 | 1.2% |
Other values (490) | 7123 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 7205 | |
Space Separator | 1917 | 17.8% |
Decimal Number | 590 | 5.5% |
Other Punctuation | 418 | 3.9% |
Open Punctuation | 215 | 2.0% |
Close Punctuation | 215 | 2.0% |
Uppercase Letter | 177 | 1.6% |
Initial Punctuation | 9 | 0.1% |
Final Punctuation | 9 | 0.1% |
Other Symbol | 9 | 0.1% |
Other values (4) | 11 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
건 | 306 | 4.2% |
사 | 180 | 2.5% |
이 | 167 | 2.3% |
다 | 154 | 2.1% |
설 | 139 | 1.9% |
공 | 133 | 1.8% |
가 | 120 | 1.7% |
대 | 119 | 1.7% |
는 | 112 | 1.6% |
로 | 111 | 1.5% |
Other values (441) | 5664 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 36 | |
L | 35 | |
H | 22 | |
G | 21 | |
D | 12 | 6.8% |
C | 7 | 4.0% |
U | 7 | 4.0% |
E | 6 | 3.4% |
K | 5 | 2.8% |
O | 5 | 2.8% |
Other values (7) | 21 |
Decimal Number
Value | Count | Frequency (%) |
2 | 134 | |
1 | 86 | |
0 | 67 | |
7 | 60 | |
6 | 50 | 8.5% |
3 | 48 | 8.1% |
9 | 43 | 7.3% |
5 | 42 | 7.1% |
4 | 38 | 6.4% |
8 | 22 | 3.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 225 | |
. | 120 | |
· | 43 | 10.3% |
" | 24 | 5.7% |
% | 3 | 0.7% |
' | 2 | 0.5% |
& | 1 | 0.2% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1 | |
t | 1 | |
m | 1 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 8 | |
“ | 1 | 11.1% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 8 | |
” | 1 | 11.1% |
Other Symbol
Value | Count | Frequency (%) |
△ | 7 | |
㈜ | 2 | 22.2% |
Space Separator
Value | Count | Frequency (%) |
1917 |
Open Punctuation
Value | Count | Frequency (%) |
( | 215 |
Close Punctuation
Value | Count | Frequency (%) |
) | 215 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Control
Value | Count | Frequency (%) |
1 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 7207 | |
Common | 3388 | |
Latin | 180 | 1.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
건 | 306 | 4.2% |
사 | 180 | 2.5% |
이 | 167 | 2.3% |
다 | 154 | 2.1% |
설 | 139 | 1.9% |
공 | 133 | 1.8% |
가 | 120 | 1.7% |
대 | 119 | 1.7% |
는 | 112 | 1.6% |
로 | 111 | 1.5% |
Other values (442) | 5666 |
Common
Value | Count | Frequency (%) |
1917 | ||
, | 225 | 6.6% |
( | 215 | 6.3% |
) | 215 | 6.3% |
2 | 134 | 4.0% |
. | 120 | 3.5% |
1 | 86 | 2.5% |
0 | 67 | 2.0% |
7 | 60 | 1.8% |
6 | 50 | 1.5% |
Other values (18) | 299 | 8.8% |
Latin
Value | Count | Frequency (%) |
S | 36 | |
L | 35 | |
H | 22 | |
G | 21 | |
D | 12 | 6.7% |
C | 7 | 3.9% |
U | 7 | 3.9% |
E | 6 | 3.3% |
K | 5 | 2.8% |
O | 5 | 2.8% |
Other values (10) | 24 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 7205 | |
ASCII | 3499 | |
None | 46 | 0.4% |
Punctuation | 18 | 0.2% |
Geometric Shapes | 7 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1917 | ||
, | 225 | 6.4% |
( | 215 | 6.1% |
) | 215 | 6.1% |
2 | 134 | 3.8% |
. | 120 | 3.4% |
1 | 86 | 2.5% |
0 | 67 | 1.9% |
7 | 60 | 1.7% |
6 | 50 | 1.4% |
Other values (31) | 410 | 11.7% |
Hangul
Value | Count | Frequency (%) |
건 | 306 | 4.2% |
사 | 180 | 2.5% |
이 | 167 | 2.3% |
다 | 154 | 2.1% |
설 | 139 | 1.9% |
공 | 133 | 1.8% |
가 | 120 | 1.7% |
대 | 119 | 1.7% |
는 | 112 | 1.6% |
로 | 111 | 1.5% |
Other values (441) | 5664 |
None
Value | Count | Frequency (%) |
· | 43 | |
㈜ | 2 | 4.3% |
m | 1 | 2.2% |
Punctuation
Value | Count | Frequency (%) |
‘ | 8 | |
’ | 8 | |
“ | 1 | 5.6% |
” | 1 | 5.6% |
Geometric Shapes
Value | Count | Frequency (%) |
△ | 7 |
정보출처주소
Text
Distinct | 59 |
---|---|
Distinct (%) | 59.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Length
Max length | 84 |
---|---|
Median length | 78 |
Mean length | 54.11 |
Min length | 37 |
Characters and Unicode
Total characters | 5411 |
---|---|
Distinct characters | 61 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 49 ? |
---|---|
Unique (%) | 49.0% |
Sample
1st row | https://n.news.naver.com/mnews/article/421/0006545234?sid=102 |
---|---|
2nd row | https://n.news.naver.com/mnews/article/014/0004947614?sid=102 |
3rd row | https://n.news.naver.com/mnews/article/001/0013658708?sid=102 |
4th row | https://n.news.naver.com/mnews/article/032/0003194551?sid=102 |
5th row | https://n.news.naver.com/mnews/article/032/0003194551?sid=102 |
Value | Count | Frequency (%) |
https://www.news1.kr/articles/4808855 | 20 | |
https://www.yna.co.kr/view/akr20220927133600530?input=1195m | 6 | 6.0% |
https://n.news.naver.com/mnews/article/032/0003194551?sid=102 | 5 | 5.0% |
https://www.yonhapnewstv.co.kr/news/myh20220917005600038?input=1825m | 5 | 5.0% |
https://www.khan.co.kr/environment/environment-general/article/202210281549001 | 3 | 3.0% |
https://www.yna.co.kr/view/akr20220326024500530?input=1195m | 3 | 3.0% |
https://www.yna.co.kr/view/akr20220929048800064?input=1195m | 3 | 3.0% |
https://www.news1.kr/articles/?4718459 | 2 | 2.0% |
https://www.yna.co.kr/view/akr20220420086700064?input=1195m | 2 | 2.0% |
https://www.yna.co.kr/view/akr20221011154651054?input=1195m | 2 | 2.0% |
Other values (49) | 49 |
Most occurring characters
Value | Count | Frequency (%) |
/ | 433 | 8.0% |
0 | 400 | 7.4% |
w | 374 | 6.9% |
t | 313 | 5.8% |
1 | 269 | 5.0% |
. | 264 | 4.9% |
2 | 245 | 4.5% |
s | 217 | 4.0% |
n | 213 | 3.9% |
e | 205 | 3.8% |
Other values (51) | 2478 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 2697 | |
Decimal Number | 1575 | |
Other Punctuation | 876 | 16.2% |
Uppercase Letter | 183 | 3.4% |
Math Symbol | 73 | 1.3% |
Connector Punctuation | 4 | 0.1% |
Dash Punctuation | 3 | 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
w | 374 | |
t | 313 | |
s | 217 | 8.0% |
n | 213 | 7.9% |
e | 205 | 7.6% |
i | 177 | 6.6% |
p | 159 | 5.9% |
r | 158 | 5.9% |
c | 127 | 4.7% |
a | 120 | 4.4% |
Other values (14) | 634 |
Uppercase Letter
Value | Count | Frequency (%) |
R | 41 | |
A | 41 | |
K | 40 | |
I | 12 | 6.6% |
D | 8 | 4.4% |
H | 6 | 3.3% |
N | 6 | 3.3% |
Y | 5 | 2.7% |
M | 5 | 2.7% |
X | 4 | 2.2% |
Other values (9) | 15 | 8.2% |
Decimal Number
Value | Count | Frequency (%) |
0 | 400 | |
1 | 269 | |
2 | 245 | |
5 | 169 | |
8 | 119 | 7.6% |
9 | 93 | 5.9% |
4 | 89 | 5.7% |
3 | 79 | 5.0% |
6 | 66 | 4.2% |
7 | 46 | 2.9% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 433 | |
. | 264 | |
: | 100 | 11.4% |
? | 68 | 7.8% |
& | 11 | 1.3% |
Math Symbol
Value | Count | Frequency (%) |
= | 73 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 4 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 2880 | |
Common | 2531 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
w | 374 | |
t | 313 | 10.9% |
s | 217 | 7.5% |
n | 213 | 7.4% |
e | 205 | 7.1% |
i | 177 | 6.1% |
p | 159 | 5.5% |
r | 158 | 5.5% |
c | 127 | 4.4% |
a | 120 | 4.2% |
Other values (33) | 817 |
Common
Value | Count | Frequency (%) |
/ | 433 | |
0 | 400 | |
1 | 269 | |
. | 264 | |
2 | 245 | |
5 | 169 | 6.7% |
8 | 119 | 4.7% |
: | 100 | 4.0% |
9 | 93 | 3.7% |
4 | 89 | 3.5% |
Other values (8) | 350 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 5411 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
/ | 433 | 8.0% |
0 | 400 | 7.4% |
w | 374 | 6.9% |
t | 313 | 5.8% |
1 | 269 | 5.0% |
. | 264 | 4.9% |
2 | 245 | 4.5% |
s | 217 | 4.0% |
n | 213 | 3.9% |
e | 205 | 3.8% |
Other values (51) | 2478 |
연번 | 법인명 | 사업장명 | 보도날짜 | 기사제목 | 기사요약 | 정보출처주소 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.579 | 0.648 | 0.979 | 0.981 | 0.999 | 0.981 |
법인명 | 0.579 | 1.000 | 1.000 | 0.873 | 0.737 | 0.000 | 0.737 |
사업장명 | 0.648 | 1.000 | 1.000 | 0.935 | 0.894 | 0.000 | 0.894 |
보도날짜 | 0.979 | 0.873 | 0.935 | 1.000 | 1.000 | 1.000 | 1.000 |
기사제목 | 0.981 | 0.737 | 0.894 | 1.000 | 1.000 | 1.000 | 1.000 |
기사요약 | 0.999 | 0.000 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 |
정보출처주소 | 0.981 | 0.737 | 0.894 | 1.000 | 1.000 | 1.000 | 1.000 |
연번 | 보도날짜 | |
---|---|---|
연번 | 1.000 | 0.631 |
보도날짜 | 0.631 | 1.000 |
연번 | 법인명 | 사업장명 | 보도날짜 | 기사제목 | 기사요약 | 정보출처주소 | |
---|---|---|---|---|---|---|---|
0 | 1 | 영풍 | 영풍 석포제련소 | 2022.12.28 | 봉화 영풍석포제련소 운영 허가에 시민단체 "환경부가 환경오염 업체 두둔" | 낙동강 상류에서 카드뮴, 납 등 중금속을 배출해 환경오염을 야기한다는 지적을 받는 경북 봉화군 영풍석포제련소가 환경오염물질 저감시설 개선을 조건으로 운영 허가를 받자 환경단체가 반발하고 있다. | https://n.news.naver.com/mnews/article/421/0006545234?sid=102 |
1 | 2 | 영풍 | 영풍 석포제련소 | 2022.12.27 | 영풍 석포제련소, 조건부 사업 허가 | 수년간 카드뮴과 납으로 오염된 물을 낙동강 최상류에서 불법 방류해 낙동강 환경오염의 주범으로 지목됐던 영풍 석포제련소에 대해 환경부가 허가 배출기준과 허가조건을 최대 3년내 이행하는 것을 전제로 허가했다. | https://n.news.naver.com/mnews/article/014/0004947614?sid=102 |
2 | 3 | 한국원자력연구원 | 한국원자력연구원 | 2022.12.23 | 원자력연 보관 방사성폐기물 260드럼 반출…올해 총 482드럼 | 23일 대전시에 따르면 한국원자력연구원에 보관 중이던 중·저준위 방사성폐기물 260드럼이 이날 새벽 2시께 운반차량 6대에 실려 경주 최종 처분장으로 출발했다. 원자력연구원에서는 지난 8월에도 222드럼을 반출했으며, 이로써 올해 계획했던 400드럼보다 82드럼이 더 반출됐다. | https://n.news.naver.com/mnews/article/001/0013658708?sid=102 |
3 | 4 | 지에스리테일 | GS25 | 2022.12.22 | ‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니 | 서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다. | https://n.news.naver.com/mnews/article/032/0003194551?sid=102 |
4 | 5 | 비지에프리테일 | CU | 2022.12.22 | ‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니 | 서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다. | https://n.news.naver.com/mnews/article/032/0003194551?sid=102 |
5 | 6 | 이마트24 | 이마트24 | 2022.12.22 | ‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니 | 서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다. | https://n.news.naver.com/mnews/article/032/0003194551?sid=102 |
6 | 7 | 한국미니스톱 | 미니스톱 | 2022.12.22 | ‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니 | 서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다. | https://n.news.naver.com/mnews/article/032/0003194551?sid=102 |
7 | 8 | 코리아세븐 | 세븐일레븐 | 2022.12.22 | ‘일회용품 사용금지’ 계도기간은 ‘사용허가’···직접 찾아가보니 | 서울 강동구·동대문구·마포구·성동구·용산구·중구·종로구 일대의 편의점 28곳 중 ‘금지’된 일회용 비닐봉지를 사용하지 않는 곳은 5곳에 불과했다. 일회용 비닐봉지를 사용하고 있는 편의점에는 5대 편의점(GS25, CU, 이마트24, 미니스톱, 세븐일레븐) 모두가 포함돼 있었다. | https://n.news.naver.com/mnews/article/032/0003194551?sid=102 |
8 | 9 | 블랙이글스 | 블랙이글스 | 2022.12.07 | "블랙이글스 내뿜는 소음·오염물질 고통에서 벗어나고 싶다" | 공중곡예특수 비행팀 블랙이글스가 내는 소음과 경유 스모크 환경오염 피해로 고통받는 원주횡성주민들의 1인 시위가 꼬박 2년을 맞았다. | https://www.yna.co.kr/view/AKR20221207090600062?input=1195m |
9 | 10 | 삼척블루파워 | 삼척블루파워 | 2022.11.30 | "삼척블루파워 최초 점화 멈춰라" 탈석탄단체 반발 | 탈석탄법제정을위한시민사회연대 등 탈석탄 단체는 30일 강원 삼척시 남양동 삼척블루파워 앞에서 기자회견을 열고 "삼척블루파워 1호기 최초점화를 중단하라"고 촉구했다. | https://www.news1.kr/articles/4880960 |
연번 | 법인명 | 사업장명 | 보도날짜 | 기사제목 | 기사요약 | 정보출처주소 | |
---|---|---|---|---|---|---|---|
90 | 91 | 농협흙사랑 | 농협 흙사랑 | 2022.04.20 | 괴산메가폴리스산단 유치위 "사리면 일대 돈사 이전하라" | 충북 괴산메가폴리스산업단지유치위원회는 20일 "악취를 유발하는 사리면 일대 돈사는 조속히 이전하라"고 촉구했다. | https://www.yna.co.kr/view/AKR20220420086700064?input=1195m |
91 | 92 | 엘디팜영농조합법인 | 엘디팜영농조합법인 | 2022.04.20 | 괴산메가폴리스산단 유치위 "사리면 일대 돈사 이전하라" | 충북 괴산메가폴리스산업단지유치위원회는 20일 "악취를 유발하는 사리면 일대 돈사는 조속히 이전하라"고 촉구했다. | https://www.yna.co.kr/view/AKR20220420086700064?input=1195m |
92 | 93 | 수도권매립지관리공사 | 수도권매립지관리공사 | 2022.04.12 | 인천 서구 "수도권매립지공사 골프장 추가 조성 반대" | 인천 서구는 12일 보도자료를 통해 SL공사는 지역주민과 환경 정의는 안중에도 없이 조직 존립을 위해 골프장을 설립하는 것은 이기적인 생각이라며 SL공사의 사업 추진을 비난했다. | https://www.news1.kr/articles/?4645947 |
93 | 94 | 수도권매립지관리공사 | 수도권매립지관리공사 | 2022.04.06 | 매립지공사 사업영역 확대 놓고 공사-시민단체 갈등 | 수도권매립지관리공사(이하 매립지공사)가 자사의 사업영역을 확대하는 법 개정을 둘러싸고 인천시·시민단체와 갈등을 빚고 있다. | https://www.yna.co.kr/view/AKR20220406057100065?input=1195m |
94 | 95 | 대흥알앤티 | 대흥알앤티 | 2022.03.27 | 정부, 공업용 세척제 제조·수입·유통업체 점검 | 최근 유성케미칼이라는 업체가 제조한 세척액을 사용한 두성산업과 대흥알앤티에서 노동자들이 유해화학물질에 중독된 사건이 발생했다. | https://www.yna.co.kr/view/AKR20220326024500530?input=1195m |
95 | 96 | 유성케미칼 | 유성케미칼 | 2022.03.27 | 정부, 공업용 세척제 제조·수입·유통업체 점검 | 최근 유성케미칼이라는 업체가 제조한 세척액을 사용한 두성산업과 대흥알앤티에서 노동자들이 유해화학물질에 중독된 사건이 발생했다. | https://www.yna.co.kr/view/AKR20220326024500530?input=1195m |
96 | 97 | 두성산업 | 두성산업 | 2022.03.27 | 정부, 공업용 세척제 제조·수입·유통업체 점검 | 최근 유성케미칼이라는 업체가 제조한 세척액을 사용한 두성산업과 대흥알앤티에서 노동자들이 유해화학물질에 중독된 사건이 발생했다. | https://www.yna.co.kr/view/AKR20220326024500530?input=1195m |
97 | 98 | 한국수력원자력 | 월성원자력발전소 | 2022.03.23 | 월성원전 일부 지하수서 고농도 삼중수소 검출…"누설 의심" | 경북 경주의 월성원전 부지 내 일부 지하수에서 꽤 높은 수준의 방사성물질인 삼중수소가 검출된 것으로 나타났다. | https://www.yna.co.kr/view/AKR20220323122800053?input=1195m |
98 | 99 | 한국토지주택공사 | 한국토지주택공사 | 2022.03.22 | LH, 고덕신도시 내 오염 토사 2만㎥ 불법 반출…관계자 고발 | 한국토지주택공사(LH)가 경기 평택 고덕국제화지구 내 폐업 폐기물처리업체 부지에 있던 오염 토사를 정화하지 않고 불법 반출한 사실이 평택시 조사 결과 드러났다. | https://www.yna.co.kr/view/AKR20220322081600061?input=1195m |
99 | 100 | 광주도시공사 | 광주도시공사 | 2022.03.19 | 광주 영락공원 화장장 '대기측정 유예, 적정했나'…경찰 수사 | 광주 영락공원 화장장이 과거 10개월간 대기오염물질 자가측정을 진행하지 않아 경찰의 수사를 받는 것으로 확인됐다. | https://www.yna.co.kr/view/AKR20220318113800054?input=1195m |