Overview

Dataset statistics

Number of variables13
Number of observations534
Missing cells2138
Missing cells (%)30.8%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory55.4 KiB
Average record size in memory106.2 B

Variable types

Text8
Categorical2
Numeric2
Boolean1

Dataset

Description과제요청번호,과제명,과제영문명,국내외연구사례,연구내용및방법,연구내용및방법,기대효과 및 활용방안,연구책임자,담당부서,연구시작일,연구종료일,예산승인상태,보안과제여부
Author서울특별시
URLhttps://data.seoul.go.kr/dataList/OA-22154/S/1/datasetView.do

Alerts

예산승인상태 has constant value ""Constant
보안과제여부 has constant value ""Constant
연구시작일 is highly overall correlated with 연구종료일High correlation
연구종료일 is highly overall correlated with 연구시작일High correlation
과제영문명 has 510 (95.5%) missing valuesMissing
국내외연구사례 has 484 (90.6%) missing valuesMissing
연구내용및방법 has 184 (34.5%) missing valuesMissing
연구내용및방법.1 has 480 (89.9%) missing valuesMissing
기대효과 및 활용방안 has 480 (89.9%) missing valuesMissing
과제요청번호 has unique valuesUnique

Reproduction

Analysis started2024-05-18 01:42:02.459307
Analysis finished2024-05-18 01:42:09.462021
Duration7 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

과제요청번호
Text

UNIQUE 

Distinct534
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size4.3 KiB
2024-05-18T10:42:10.111088image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length7
Median length7
Mean length7
Min length7

Characters and Unicode

Total characters3738
Distinct characters13
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique534 ?
Unique (%)100.0%

Sample

1st rowPLA0810
2nd rowPLA0796
3rd rowPLA0798
4th rowPLA0766
5th rowPLA0761
ValueCountFrequency (%)
pla0810 1
 
0.2%
pla0208 1
 
0.2%
pla0213 1
 
0.2%
pla0167 1
 
0.2%
pla0168 1
 
0.2%
pla0171 1
 
0.2%
pla0172 1
 
0.2%
pla0173 1
 
0.2%
pla0174 1
 
0.2%
pla0196 1
 
0.2%
Other values (524) 524
98.1%
2024-05-18T10:42:11.780500image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 733
19.6%
P 534
14.3%
L 534
14.3%
A 534
14.3%
2 213
 
5.7%
1 199
 
5.3%
3 193
 
5.2%
4 192
 
5.1%
5 161
 
4.3%
7 125
 
3.3%
Other values (3) 320
8.6%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 2136
57.1%
Uppercase Letter 1602
42.9%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
0 733
34.3%
2 213
 
10.0%
1 199
 
9.3%
3 193
 
9.0%
4 192
 
9.0%
5 161
 
7.5%
7 125
 
5.9%
6 121
 
5.7%
8 100
 
4.7%
9 99
 
4.6%
Uppercase Letter
ValueCountFrequency (%)
P 534
33.3%
L 534
33.3%
A 534
33.3%

Most occurring scripts

ValueCountFrequency (%)
Common 2136
57.1%
Latin 1602
42.9%

Most frequent character per script

Common
ValueCountFrequency (%)
0 733
34.3%
2 213
 
10.0%
1 199
 
9.3%
3 193
 
9.0%
4 192
 
9.0%
5 161
 
7.5%
7 125
 
5.9%
6 121
 
5.7%
8 100
 
4.7%
9 99
 
4.6%
Latin
ValueCountFrequency (%)
P 534
33.3%
L 534
33.3%
A 534
33.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 3738
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 733
19.6%
P 534
14.3%
L 534
14.3%
A 534
14.3%
2 213
 
5.7%
1 199
 
5.3%
3 193
 
5.2%
4 192
 
5.1%
5 161
 
4.3%
7 125
 
3.3%
Other values (3) 320
8.6%
Distinct533
Distinct (%)99.8%
Missing0
Missing (%)0.0%
Memory size4.3 KiB
2024-05-18T10:42:12.925541image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length66
Median length47
Mean length22.985019
Min length3

Characters and Unicode

Total characters12274
Distinct characters417
Distinct categories11 ?
Distinct scripts4 ?
Distinct blocks6 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique532 ?
Unique (%)99.6%

Sample

1st row상수도관 전기부식 방지 최적 방안 연구
2nd row상수원 상류 조류 영향과 효율적 맛?냄새물질 제거방안 연구
3rd row대형 상수도관 누수 원인 규명 및 지도 개발 연구
4th row경사판 침전지 개량을 위한 침전효율 향상방안 연구
5th row정수처리공정 응집제 주입률 결정 연구
ValueCountFrequency (%)
연구 129
 
4.6%
114
 
4.1%
수질검사 78
 
2.8%
조사 58
 
2.1%
관한 42
 
1.5%
36
 
1.3%
수질조사 33
 
1.2%
수돗물 32
 
1.2%
보고서 23
 
0.8%
수도꼭지 21
 
0.8%
Other values (1109) 2215
79.6%
2024-05-18T10:42:14.520543image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2275
 
18.5%
640
 
5.2%
0 299
 
2.4%
267
 
2.2%
222
 
1.8%
200
 
1.6%
2 197
 
1.6%
197
 
1.6%
194
 
1.6%
192
 
1.6%
Other values (407) 7591
61.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 8676
70.7%
Space Separator 2275
 
18.5%
Decimal Number 723
 
5.9%
Lowercase Letter 177
 
1.4%
Uppercase Letter 157
 
1.3%
Open Punctuation 80
 
0.7%
Close Punctuation 80
 
0.7%
Other Punctuation 62
 
0.5%
Dash Punctuation 37
 
0.3%
Math Symbol 6
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
640
 
7.4%
267
 
3.1%
222
 
2.6%
200
 
2.3%
197
 
2.3%
194
 
2.2%
192
 
2.2%
185
 
2.1%
168
 
1.9%
162
 
1.9%
Other values (344) 6249
72.0%
Uppercase Letter
ValueCountFrequency (%)
C 26
16.6%
P 16
 
10.2%
A 12
 
7.6%
T 12
 
7.6%
O 12
 
7.6%
H 9
 
5.7%
D 8
 
5.1%
M 7
 
4.5%
S 7
 
4.5%
E 6
 
3.8%
Other values (14) 42
26.8%
Lowercase Letter
ValueCountFrequency (%)
a 25
14.1%
o 18
10.2%
e 14
 
7.9%
r 14
 
7.9%
m 13
 
7.3%
i 12
 
6.8%
l 11
 
6.2%
n 10
 
5.6%
c 9
 
5.1%
y 8
 
4.5%
Other values (10) 43
24.3%
Decimal Number
ValueCountFrequency (%)
0 299
41.4%
2 197
27.2%
1 84
 
11.6%
9 46
 
6.4%
3 26
 
3.6%
5 18
 
2.5%
8 18
 
2.5%
4 13
 
1.8%
6 12
 
1.7%
7 10
 
1.4%
Other Punctuation
ValueCountFrequency (%)
? 38
61.3%
, 20
32.3%
/ 4
 
6.5%
Space Separator
ValueCountFrequency (%)
2275
100.0%
Open Punctuation
ValueCountFrequency (%)
( 80
100.0%
Close Punctuation
ValueCountFrequency (%)
) 80
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 37
100.0%
Math Symbol
ValueCountFrequency (%)
~ 6
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 8654
70.5%
Common 3263
 
26.6%
Latin 335
 
2.7%
Han 22
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
640
 
7.4%
267
 
3.1%
222
 
2.6%
200
 
2.3%
197
 
2.3%
194
 
2.2%
192
 
2.2%
185
 
2.1%
168
 
1.9%
162
 
1.9%
Other values (336) 6227
72.0%
Latin
ValueCountFrequency (%)
C 26
 
7.8%
a 25
 
7.5%
o 18
 
5.4%
P 16
 
4.8%
e 14
 
4.2%
r 14
 
4.2%
m 13
 
3.9%
i 12
 
3.6%
A 12
 
3.6%
T 12
 
3.6%
Other values (35) 173
51.6%
Common
ValueCountFrequency (%)
2275
69.7%
0 299
 
9.2%
2 197
 
6.0%
1 84
 
2.6%
( 80
 
2.5%
) 80
 
2.5%
9 46
 
1.4%
? 38
 
1.2%
- 37
 
1.1%
3 26
 
0.8%
Other values (8) 101
 
3.1%
Han
ValueCountFrequency (%)
8
36.4%
8
36.4%
1
 
4.5%
1
 
4.5%
1
 
4.5%
1
 
4.5%
1
 
4.5%
1
 
4.5%

Most occurring blocks

ValueCountFrequency (%)
Hangul 8653
70.5%
ASCII 3597
29.3%
CJK 21
 
0.2%
CJK Compat Ideographs 1
 
< 0.1%
Number Forms 1
 
< 0.1%
Compat Jamo 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2275
63.2%
0 299
 
8.3%
2 197
 
5.5%
1 84
 
2.3%
( 80
 
2.2%
) 80
 
2.2%
9 46
 
1.3%
? 38
 
1.1%
- 37
 
1.0%
3 26
 
0.7%
Other values (52) 435
 
12.1%
Hangul
ValueCountFrequency (%)
640
 
7.4%
267
 
3.1%
222
 
2.6%
200
 
2.3%
197
 
2.3%
194
 
2.2%
192
 
2.2%
185
 
2.1%
168
 
1.9%
162
 
1.9%
Other values (335) 6226
72.0%
CJK
ValueCountFrequency (%)
8
38.1%
8
38.1%
1
 
4.8%
1
 
4.8%
1
 
4.8%
1
 
4.8%
1
 
4.8%
CJK Compat Ideographs
ValueCountFrequency (%)
1
100.0%
Number Forms
ValueCountFrequency (%)
1
100.0%
Compat Jamo
ValueCountFrequency (%)
1
100.0%

과제영문명
Text

MISSING 

Distinct23
Distinct (%)95.8%
Missing510
Missing (%)95.5%
Memory size4.3 KiB
2024-05-18T10:42:15.532562image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length121
Median length82.5
Mean length76.125
Min length21

Characters and Unicode

Total characters1827
Distinct characters56
Distinct categories9 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique22 ?
Unique (%)91.7%

Sample

1st rowA study on the effect of algae in the upstream of the water source and the effective removal of taste and odor substances
2nd rowA study on the determination of coagulant injection rate in water treatment process
3rd rowStudy on the aging characteristics of polymer epoxy resin in the distribution system
4th rowAnalysis of Fluctuation in Water Usage and Countermeasures for Water Supply
5th rowDeveloping indicators of the level of service for waterworks facilities
ValueCountFrequency (%)
of 22
 
8.1%
the 19
 
7.0%
on 15
 
5.5%
water 14
 
5.2%
study 13
 
4.8%
in 10
 
3.7%
a 8
 
3.0%
and 7
 
2.6%
for 6
 
2.2%
distribution 5
 
1.8%
Other values (115) 152
56.1%
2024-05-18T10:42:17.036857image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
261
14.3%
t 156
 
8.5%
e 155
 
8.5%
o 145
 
7.9%
i 121
 
6.6%
r 119
 
6.5%
n 111
 
6.1%
a 100
 
5.5%
s 84
 
4.6%
u 55
 
3.0%
Other values (46) 520
28.5%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 1455
79.6%
Space Separator 261
 
14.3%
Uppercase Letter 98
 
5.4%
Open Punctuation 3
 
0.2%
Close Punctuation 3
 
0.2%
Decimal Number 3
 
0.2%
Dash Punctuation 2
 
0.1%
Other Punctuation 1
 
0.1%
Letter Number 1
 
0.1%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
t 156
10.7%
e 155
10.7%
o 145
10.0%
i 121
 
8.3%
r 119
 
8.2%
n 111
 
7.6%
a 100
 
6.9%
s 84
 
5.8%
u 55
 
3.8%
d 54
 
3.7%
Other values (16) 355
24.4%
Uppercase Letter
ValueCountFrequency (%)
S 24
24.5%
W 10
10.2%
A 9
 
9.2%
F 8
 
8.2%
D 7
 
7.1%
C 7
 
7.1%
R 4
 
4.1%
P 4
 
4.1%
T 3
 
3.1%
O 3
 
3.1%
Other values (11) 19
19.4%
Decimal Number
ValueCountFrequency (%)
8 1
33.3%
3 1
33.3%
2 1
33.3%
Space Separator
ValueCountFrequency (%)
261
100.0%
Open Punctuation
ValueCountFrequency (%)
( 3
100.0%
Close Punctuation
ValueCountFrequency (%)
) 3
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 2
100.0%
Other Punctuation
ValueCountFrequency (%)
/ 1
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 1554
85.1%
Common 273
 
14.9%

Most frequent character per script

Latin
ValueCountFrequency (%)
t 156
 
10.0%
e 155
 
10.0%
o 145
 
9.3%
i 121
 
7.8%
r 119
 
7.7%
n 111
 
7.1%
a 100
 
6.4%
s 84
 
5.4%
u 55
 
3.5%
d 54
 
3.5%
Other values (38) 454
29.2%
Common
ValueCountFrequency (%)
261
95.6%
( 3
 
1.1%
) 3
 
1.1%
- 2
 
0.7%
/ 1
 
0.4%
8 1
 
0.4%
3 1
 
0.4%
2 1
 
0.4%

Most occurring blocks

ValueCountFrequency (%)
ASCII 1826
99.9%
Number Forms 1
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
261
14.3%
t 156
 
8.5%
e 155
 
8.5%
o 145
 
7.9%
i 121
 
6.6%
r 119
 
6.5%
n 111
 
6.1%
a 100
 
5.5%
s 84
 
4.6%
u 55
 
3.0%
Other values (45) 519
28.4%
Number Forms
ValueCountFrequency (%)
1
100.0%

국내외연구사례
Text

MISSING 

Distinct49
Distinct (%)98.0%
Missing484
Missing (%)90.6%
Memory size4.3 KiB
2024-05-18T10:42:17.731999image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length1024
Median length270.5
Mean length268.34
Min length2

Characters and Unicode

Total characters13417
Distinct characters497
Distinct categories15 ?
Distinct scripts3 ?
Distinct blocks9 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique48 ?
Unique (%)96.0%

Sample

1st row o 냄새물질 발생 경향과 영향인자 분석, 김은정, 2019 o Individual-based modelling of cyanobacteria blooms: physical and physiological processes, David P. Hamilton et al., Science of The Total Environment, 10. 2021
2nd row ○ 최적화된 경사판을 이용한 침전분리기술과 적용사례 (한국상하수도협회) ○ 경사판 침전지의 수리학적 특성에 대한 구조물 영향 (대한상하수도학회)
3rd row○ 수도시설 관리 효율화를 위한 인공지능 기반 의사결정 시스템 개발(2018, 한국수자원공사) ○ 정수장 약품 최적 주입률 결정을 위한 지능형 제어기 개발(2015, 한국수자원공사) ○ 원수조건에 따른 상수도 응집제 종류와 주입률 결정을 위한 데이터 마이닝 및 신경회로망의 적용(2004, 부산대학교) ○ 지능알고리즘을 이용한 정수처리공정의 응집제 주입률 결정(2004,충남대학교)
4th row- Development of predictive models for geosmin-related taste and odor in Kansas, USA, drinking water reservoir (Dzialowski et al., 2009) - Development of models for predicting the predominant taste and odor compounds in Taihu lake, China (Qi et al., 2012) - Modelling geosmin concentrations in three sources of raw water Quebec, Canada (Parinet et al., 2013) - Who smells? Forecasting taste and odor in a drinking water reservoir (Kehoe et al., 2015) - Predicting taste and odor compounds in a shallow reservoir using a three-dimensional hydrodynamic ecological model (Chong et al., 2018)
5th row ○ 질산화, 탈질, 탈인 등을 통한 생물학적 질소?인 제거기술인 MLE, A2O, SBR 등 다양한 공법이 국내외에 개발되어 실공정에 적용 ○ 고도처리 공법에 대한 최적화 연구가 지속적으로 진행되고 있으나 국내 실정에 맞는 최적화 적용사례 부족 ○ 유입하수 중 유기탄소원 부족과 겨울철 수온 저하에 따른 질소, 인 처리효율 감소로 이러한 문제점을 극복하기 위한 연구가 국내외적으로 진행 ○ 대규모 하수처리시설을 대상으로 계절별, 유입수 성상에 따른 MLE공법에 대한 최적화 연구사례 부족
ValueCountFrequency (%)
112
 
4.4%
74
 
2.9%
30
 
1.2%
and 20
 
0.8%
et 19
 
0.8%
water 18
 
0.7%
al 18
 
0.7%
of 17
 
0.7%
in 15
 
0.6%
14
 
0.6%
Other values (1649) 2195
86.7%
2024-05-18T10:42:19.157692image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
3083
 
23.0%
e 309
 
2.3%
a 263
 
2.0%
, 257
 
1.9%
n 225
 
1.7%
o 217
 
1.6%
i 215
 
1.6%
r 202
 
1.5%
t 201
 
1.5%
186
 
1.4%
Other values (487) 8259
61.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 5685
42.4%
Space Separator 3083
23.0%
Lowercase Letter 2593
19.3%
Decimal Number 676
 
5.0%
Uppercase Letter 520
 
3.9%
Other Punctuation 431
 
3.2%
Dash Punctuation 114
 
0.8%
Close Punctuation 105
 
0.8%
Open Punctuation 103
 
0.8%
Other Symbol 76
 
0.6%
Other values (5) 31
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
186
 
3.3%
112
 
2.0%
102
 
1.8%
97
 
1.7%
96
 
1.7%
90
 
1.6%
88
 
1.5%
87
 
1.5%
86
 
1.5%
82
 
1.4%
Other values (393) 4659
82.0%
Uppercase Letter
ValueCountFrequency (%)
A 55
 
10.6%
S 40
 
7.7%
C 38
 
7.3%
M 36
 
6.9%
R 33
 
6.3%
W 33
 
6.3%
P 31
 
6.0%
N 29
 
5.6%
E 28
 
5.4%
O 24
 
4.6%
Other values (16) 173
33.3%
Lowercase Letter
ValueCountFrequency (%)
e 309
11.9%
a 263
10.1%
n 225
 
8.7%
o 217
 
8.4%
i 215
 
8.3%
r 202
 
7.8%
t 201
 
7.8%
l 150
 
5.8%
s 135
 
5.2%
d 97
 
3.7%
Other values (15) 579
22.3%
Other Punctuation
ValueCountFrequency (%)
, 257
59.6%
. 91
 
21.1%
: 29
 
6.7%
? 20
 
4.6%
/ 18
 
4.2%
; 7
 
1.6%
4
 
0.9%
' 2
 
0.5%
% 2
 
0.5%
& 1
 
0.2%
Decimal Number
ValueCountFrequency (%)
0 169
25.0%
2 141
20.9%
1 128
18.9%
9 44
 
6.5%
4 39
 
5.8%
3 39
 
5.8%
5 38
 
5.6%
6 30
 
4.4%
8 27
 
4.0%
7 21
 
3.1%
Math Symbol
ValueCountFrequency (%)
~ 6
35.3%
+ 4
23.5%
3
17.6%
> 1
 
5.9%
< 1
 
5.9%
1
 
5.9%
1
 
5.9%
Close Punctuation
ValueCountFrequency (%)
) 98
93.3%
5
 
4.8%
] 2
 
1.9%
Open Punctuation
ValueCountFrequency (%)
( 97
94.2%
5
 
4.9%
[ 1
 
1.0%
Other Symbol
ValueCountFrequency (%)
75
98.7%
1
 
1.3%
Initial Punctuation
ValueCountFrequency (%)
3
50.0%
3
50.0%
Final Punctuation
ValueCountFrequency (%)
3
60.0%
2
40.0%
Space Separator
ValueCountFrequency (%)
3083
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 114
100.0%
Control
ValueCountFrequency (%)
2
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 5685
42.4%
Common 4618
34.4%
Latin 3114
23.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
186
 
3.3%
112
 
2.0%
102
 
1.8%
97
 
1.7%
96
 
1.7%
90
 
1.6%
88
 
1.5%
87
 
1.5%
86
 
1.5%
82
 
1.4%
Other values (393) 4659
82.0%
Latin
ValueCountFrequency (%)
e 309
 
9.9%
a 263
 
8.4%
n 225
 
7.2%
o 217
 
7.0%
i 215
 
6.9%
r 202
 
6.5%
t 201
 
6.5%
l 150
 
4.8%
s 135
 
4.3%
d 97
 
3.1%
Other values (42) 1100
35.3%
Common
ValueCountFrequency (%)
3083
66.8%
, 257
 
5.6%
0 169
 
3.7%
2 141
 
3.1%
1 128
 
2.8%
- 114
 
2.5%
) 98
 
2.1%
( 97
 
2.1%
. 91
 
2.0%
75
 
1.6%
Other values (32) 365
 
7.9%

Most occurring blocks

ValueCountFrequency (%)
ASCII 7625
56.8%
Hangul 5685
42.4%
Geometric Shapes 75
 
0.6%
Punctuation 15
 
0.1%
None 10
 
0.1%
Arrows 4
 
< 0.1%
CJK Compat 1
 
< 0.1%
Math Operators 1
 
< 0.1%
Number Forms 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
3083
40.4%
e 309
 
4.1%
a 263
 
3.4%
, 257
 
3.4%
n 225
 
3.0%
o 217
 
2.8%
i 215
 
2.8%
r 202
 
2.6%
t 201
 
2.6%
0 169
 
2.2%
Other values (71) 2484
32.6%
Hangul
ValueCountFrequency (%)
186
 
3.3%
112
 
2.0%
102
 
1.8%
97
 
1.7%
96
 
1.7%
90
 
1.6%
88
 
1.5%
87
 
1.5%
86
 
1.5%
82
 
1.4%
Other values (393) 4659
82.0%
Geometric Shapes
ValueCountFrequency (%)
75
100.0%
None
ValueCountFrequency (%)
5
50.0%
5
50.0%
Punctuation
ValueCountFrequency (%)
4
26.7%
3
20.0%
3
20.0%
3
20.0%
2
13.3%
Arrows
ValueCountFrequency (%)
3
75.0%
1
 
25.0%
CJK Compat
ValueCountFrequency (%)
1
100.0%
Math Operators
ValueCountFrequency (%)
1
100.0%
Number Forms
ValueCountFrequency (%)
1
100.0%

연구내용및방법
Text

MISSING 

Distinct322
Distinct (%)92.0%
Missing184
Missing (%)34.5%
Memory size4.3 KiB
2024-05-18T10:42:20.062302image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length891
Median length218.5
Mean length145.96
Min length5

Characters and Unicode

Total characters51086
Distinct characters641
Distinct categories15 ?
Distinct scripts4 ?
Distinct blocks11 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique309 ?
Unique (%)88.3%

Sample

1st rowo 목 적 - 상수원 상류 다목적댐 저수율 감소 등에 따른 조류 발생경향을 분석하고 조류 대량 발생 시 효율적인 맛?냄새물질 제거방안 연구 o 필요성 - 기후변화 등으로 인해 상수원에 조류가 대량 발생할 수 있어 조류 및 조류 분비물질로 인한 수처리 장해와 수돗물 맛?냄새물질 대책 필요
2nd row ○ 정수센터 순환정비 및 재건설 계획(안)에 따른 정수공정 개량필요 ○ 침전지 효율분석을 통한 고효율?집약화가 가능한 침전지 개량방안 마련 ? 2021년 소형생물 침전효율 분석결과, 침전형식에서 경사판이 우수한 효과를 나타냄 ※ 경사판 97%, 장방형 91%, 맥동식 83%
3rd row○ 사물인터넷(IoT), 빅데이터, 인공지능(AI)을 활용한 지능화 및 자동화된 생산시스템의 구현은 현대의 수요 대응 고도화에 필수적임 ○ 서울시에서도 현장 운영 데이터를 기반으로 한 정수처리공정 프로그램을 일부 적용하고 있으며, 한 단계 더 발전하기 위해서는 인공지능을 활용한 예측시스템에 대한 연구가 필요함 ○ 정수장 빅데이터 분석 및 인공지능 예측 모델 개발을 통해 약품주입, 운영관리 고도화에 필요한 핵심 기술을 개발하여 스마트 정수장 구축에 기여하고자 함
4th row- 2-MIB와 지오스민(Geosmin)은 먹는물에서 불쾌한 냄새(흙냄새, 곰팡이 냄새)를 유발하는 맛?냄새 물질이며, 맛냄새 물질이 제대로 처리되지 않을 경우 수돗물에 대한 민원발생 및 불신감을 유발할 수 있음 - 서울시는 모든 정수장에 고도처리를 도입하여 대응하고 있으나, 최근 고도처리 효율이 낮아지는 저수온기에 냄새물질이 대량 증가하는 사례가 발생하고 있으며(‘18.11 맛?냄새 관리기준 ’경계‘단계 발령), 기후변화로 인한 가뭄과 수온상승 등으로 기존보다 고농도 맛?냄새 물질 발생 가능성이 높아지고 있음 - 정수처리공정에서 효율적이고 선제적인 대응을 위해서는 취수원수 맛?냄새 물질 농도의 사전 예측정보가 필요하지만, 명확한 발생 기작이 규명되지 않았고 모형구축 및 운영이 복잡하여 수치모형(결정론적 모델)을 이용한 예측에는 어려움이 존재함 - 본 연구에서는 여러 가지 통계적 기법 및 머신러닝 기법의 적용성을 검토한 후 취수원수 맛?냄새 물질 농도를 사전에 예측하는 최적모델을 개발하고자 함 - 개발된 모델은 현재 가용자료를 기반으로 취수원 지점별 맛?냄새 물질 농도를 미리 예측함으로써 고농도 발생 시 정수센터의 효율적 운영 및 본부 수질관리대책 수립에 활용될 것으로 기대됨
5th row ○ 하수도법 개정에 따라 생물학적산소요구량, 총질소 및 총인의 수질기준 강화 ○ 서울시 물재생센터에 도입된 MLE 공법은 생물학적 질소 제거와 응집제를 이용한 인 제거 특성을 가짐 ○ 총인처리시설 도입 전까지 MLE 공법을 통하여 최대한 방류수 수질기준을 충족시키는 방안 필요 ○ 계절별 유입수 성상에 따른 MLE공법에 대한 최적화 연구 필요
ValueCountFrequency (%)
224
 
2.0%
대한 125
 
1.1%
117
 
1.0%
있는 89
 
0.8%
86
 
0.8%
상수원 78
 
0.7%
위한 74
 
0.7%
수돗물의 65
 
0.6%
60
 
0.5%
수돗물 57
 
0.5%
Other values (4678) 10172
91.3%
2024-05-18T10:42:21.167746image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
11490
 
22.5%
1785
 
3.5%
1086
 
2.1%
917
 
1.8%
856
 
1.7%
659
 
1.3%
604
 
1.2%
574
 
1.1%
570
 
1.1%
566
 
1.1%
Other values (631) 31979
62.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 36524
71.5%
Space Separator 11490
 
22.5%
Other Punctuation 1069
 
2.1%
Decimal Number 744
 
1.5%
Lowercase Letter 434
 
0.8%
Uppercase Letter 373
 
0.7%
Dash Punctuation 141
 
0.3%
Open Punctuation 91
 
0.2%
Close Punctuation 91
 
0.2%
Other Symbol 91
 
0.2%
Other values (5) 38
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
1785
 
4.9%
1086
 
3.0%
917
 
2.5%
856
 
2.3%
659
 
1.8%
604
 
1.7%
574
 
1.6%
570
 
1.6%
566
 
1.5%
522
 
1.4%
Other values (535) 28385
77.7%
Lowercase Letter
ValueCountFrequency (%)
e 46
10.6%
a 45
10.4%
m 40
9.2%
t 36
8.3%
r 33
 
7.6%
o 33
 
7.6%
n 32
 
7.4%
i 29
 
6.7%
s 28
 
6.5%
c 28
 
6.5%
Other values (15) 84
19.4%
Uppercase Letter
ValueCountFrequency (%)
P 44
11.8%
C 41
11.0%
A 33
 
8.8%
T 31
 
8.3%
S 27
 
7.2%
O 26
 
7.0%
D 24
 
6.4%
M 23
 
6.2%
L 17
 
4.6%
E 16
 
4.3%
Other values (14) 91
24.4%
Decimal Number
ValueCountFrequency (%)
0 230
30.9%
1 140
18.8%
2 98
13.2%
3 76
 
10.2%
8 71
 
9.5%
9 40
 
5.4%
5 29
 
3.9%
4 29
 
3.9%
6 19
 
2.6%
7 12
 
1.6%
Other Punctuation
ValueCountFrequency (%)
, 511
47.8%
. 351
32.8%
? 154
 
14.4%
' 14
 
1.3%
: 13
 
1.2%
% 13
 
1.2%
/ 8
 
0.7%
; 3
 
0.3%
2
 
0.2%
Other Number
ValueCountFrequency (%)
1
14.3%
1
14.3%
³ 1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
Open Punctuation
ValueCountFrequency (%)
( 87
95.6%
2
 
2.2%
[ 1
 
1.1%
1
 
1.1%
Close Punctuation
ValueCountFrequency (%)
) 87
95.6%
2
 
2.2%
] 1
 
1.1%
1
 
1.1%
Other Symbol
ValueCountFrequency (%)
86
94.5%
3
 
3.3%
2
 
2.2%
Math Symbol
ValueCountFrequency (%)
~ 10
58.8%
5
29.4%
+ 2
 
11.8%
Initial Punctuation
ValueCountFrequency (%)
6
85.7%
1
 
14.3%
Final Punctuation
ValueCountFrequency (%)
5
83.3%
1
 
16.7%
Space Separator
ValueCountFrequency (%)
11490
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 141
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 36521
71.5%
Common 13754
 
26.9%
Latin 808
 
1.6%
Han 3
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
1785
 
4.9%
1086
 
3.0%
917
 
2.5%
856
 
2.3%
659
 
1.8%
604
 
1.7%
574
 
1.6%
570
 
1.6%
566
 
1.5%
522
 
1.4%
Other values (532) 28382
77.7%
Latin
ValueCountFrequency (%)
e 46
 
5.7%
a 45
 
5.6%
P 44
 
5.4%
C 41
 
5.1%
m 40
 
5.0%
t 36
 
4.5%
A 33
 
4.1%
r 33
 
4.1%
o 33
 
4.1%
n 32
 
4.0%
Other values (40) 425
52.6%
Common
ValueCountFrequency (%)
11490
83.5%
, 511
 
3.7%
. 351
 
2.6%
0 230
 
1.7%
? 154
 
1.1%
- 141
 
1.0%
1 140
 
1.0%
2 98
 
0.7%
( 87
 
0.6%
) 87
 
0.6%
Other values (36) 465
 
3.4%
Han
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 36520
71.5%
ASCII 14437
 
28.3%
Geometric Shapes 86
 
0.2%
Punctuation 15
 
< 0.1%
None 9
 
< 0.1%
Arrows 5
 
< 0.1%
CJK Compat 5
 
< 0.1%
Enclosed Alphanum 4
 
< 0.1%
CJK 3
 
< 0.1%
Compat Jamo 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
11490
79.6%
, 511
 
3.5%
. 351
 
2.4%
0 230
 
1.6%
? 154
 
1.1%
- 141
 
1.0%
1 140
 
1.0%
2 98
 
0.7%
( 87
 
0.6%
) 87
 
0.6%
Other values (65) 1148
 
8.0%
Hangul
ValueCountFrequency (%)
1785
 
4.9%
1086
 
3.0%
917
 
2.5%
856
 
2.3%
659
 
1.8%
604
 
1.7%
574
 
1.6%
570
 
1.6%
566
 
1.5%
522
 
1.4%
Other values (531) 28381
77.7%
Geometric Shapes
ValueCountFrequency (%)
86
100.0%
Punctuation
ValueCountFrequency (%)
6
40.0%
5
33.3%
2
 
13.3%
1
 
6.7%
1
 
6.7%
Arrows
ValueCountFrequency (%)
5
100.0%
CJK Compat
ValueCountFrequency (%)
3
60.0%
2
40.0%
None
ValueCountFrequency (%)
2
22.2%
2
22.2%
1
11.1%
1
11.1%
³ 1
11.1%
1
11.1%
1
11.1%
Compat Jamo
ValueCountFrequency (%)
1
100.0%
Enclosed Alphanum
ValueCountFrequency (%)
1
25.0%
1
25.0%
1
25.0%
1
25.0%
CJK
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%
Number Forms
ValueCountFrequency (%)
1
100.0%
Distinct54
Distinct (%)100.0%
Missing480
Missing (%)89.9%
Memory size4.3 KiB
2024-05-18T10:42:21.778738image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length1024
Median length284.5
Mean length328.7963
Min length15

Characters and Unicode

Total characters17755
Distinct characters467
Distinct categories13 ?
Distinct scripts4 ?
Distinct blocks9 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique54 ?
Unique (%)100.0%

Sample

1st rowo 내 용 : 조류 발생의 영향인자 분석 및 조류분비 맛?냄새물질 제거방안 확립 - 상류댐 저수율 관리현황 및 저수율 등에 따른 조류 발생경향 실태조사 - 계절별 고도정수처리 공정에서 맛?냄새물질 제거 한계농도 분석 - 조류 대발생 시 효율적인 맛?냄새물질 기준 이내 관리를 위한 제거방안 마련 o 세부 연구개발방법 - 과거자료 : 과거 기상 수문, 수질 등과 냄새물질 제거 운전?수질자료 등 - 추진방법 : 과거실적 통계분석과 비교평가(최적화 기법) 등
2nd row ○ 침전지 형식별 시설?운영현황 및 데이터 분석 ○ 침전지 형식에 따른 설계인자 분석 (표면부하율, 위어부하율, 하부상승유속) ○ 침전지 형식별 소형생물, 탁도 제거율 평가 ○ 경사판 침전지 설계(안) 검토: 경사판 규격(길이, 두께, 각도, 위치) 및 부지저감비율 ○ CFD 진단을 활용한 침전지 흐름 및 효율평가 ? 침전지 효율적 개량방안 도출
3rd row○ 정수장 응집제 주입률 결정 프로그램 개발 - 응집제(PAC,PAHCS)별 원수 수질에 대한 영향 인자 분석 - 머신러닝 학습을 통한 응집제 주입률 예측 모델 검토 - 모델 구조 적합도 평가 및 최적화 - AI 시스템을 활용한 응집제 주입 자동화 구축 방안 연구 ○ 정수장 후염소 주입률 결정 프로그램 개발 - 정수장 후염소 송수 및 수도꼭지 수질에 대한 영향인자 분석 - 머신러닝 학습을 통한 후염소 주입률 예측 모델 검토 - 모델 구조 적합도 평가 및 최적화 - AI 시스템을 활용한 후염소 주입 자동화 구축 방안 연구
4th row- 적용가능한 통계적 기법 및 머신러닝 기법 검토 ? 관련 국내외 문헌 및 적용사례 검토 ? 통계적 기법: MLR(Multi Linear Regression), stepwise-MLR, PCA-MLR, ARIMA... ? 머신러닝 기법: ANN(Artificial Neural network), Decision tree, Random forest, ... - 예측 기법에 따른 활용 데이터 선정 및 정리 ? 예측지점 및 예측주기 설정 ? 현재 가용 데이터를 고려한 입력 데이터 선정 및 정리 - 통계적 기법 적용 및 머신러닝 기법 예측모델 개발 ? 입력데이터 구축 ? 모델 개발 및 검증(training and testing) ? 개발 도구: SPSS statistics, R(오픈소스 통계 프로그램 패키지) - 최적 예측모델 선정 ? 선정 모델에 따른 예측 정확도 비교 ? 예측 적용 시 데이터 구성 용이성, 모델구동 시간 등 비교 ? 종합비교결과에 따른 최적 예측모델 선정 - 활용방안 및 보완사항 검토 ? 예측결과 활용방안 및 정확도 향상을 위한 보완사항 제시
5th row1. 중랑센터 고도처리공법 현황 및 실공정 분석 ○ MLE공법 도입 후 가동률, 처리효율 등 공정운영 실태조사 ○ 유입수, 반응조, 처리수의 수질분석을 통한 MLE 실공정 운영효율 분석 ? 채수지점 : 유입수, 일차처리수, 무산소조, 호기조, 이차처리수 5지점 ? 분석항목 : COD, 총질소, 총인 등 15항목 ? 분석주기 : 2회/월 2. 생물반응조 현장 모형장치 설치 ○ 처리용량 : 5㎥/일(중랑물재생센터) ○ 주요장치 : 반응기, 계측기, 감시제어시스템 등 ? 2계열 비교실험, 유지관리 편리성 등 고려 ? 실공정 분석 반응조 계열과 동일한 유입수로 실험 3. 현장 모형실험을 통한 최적 운전조건 및 개선방안 제시 ○ 포기조건, 고형물 체류시간, 반송률 등 계절별 최적운전조건 산정 ? 겨울철, 봄?가을철, 여름철 등 계절별 운전조건 산정 ? 특히 겨울철 수온저하에 대한 수질 개선방안 제시 ? 분석주기 : 2회/주(채수지점, 분석항목 실공정과 동일) ○ 유량, 수질, 수온 등 운영조건 변화를 고려한 운전방안 제시 ? 강우, 연휴기간 등 저부하시기 수질 개선방안 마련 ? 일차침전지 운전조건 등 유입수 부하 조절방식 제시 4. 실공정 적용을 통한 처리효율 개선 및 매뉴얼 개발 ○ 실공정 분석결과를 센터와 협의를 통해 단기 개선방안 적용 평가 ○ 최적 운전조건 실험결과를 실공정에 적용하여 처리효율 개선 평가 ? 실공정 분석 반응조를 대상으로 최적운전조건 적용 및 분석 ? 분석주기 : 2회/주(채수지점, 분석항목 실공정과 동일) ○ 하수 유입수 성상에 따른 MLE 실공정 효율평가 및 운전조건 설정 ? 개선방안에 따른 유입수 부하 조절방식 적용 및 평가
ValueCountFrequency (%)
421
 
10.5%
174
 
4.4%
95
 
2.4%
61
 
1.5%
분석 58
 
1.5%
평가 39
 
1.0%
따른 39
 
1.0%
조사 37
 
0.9%
위한 32
 
0.8%
최적 22
 
0.6%
Other values (1615) 3015
75.5%
2024-05-18T10:42:22.844136image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
5843
32.9%
333
 
1.9%
- 262
 
1.5%
, 237
 
1.3%
206
 
1.2%
193
 
1.1%
174
 
1.0%
172
 
1.0%
168
 
0.9%
? 162
 
0.9%
Other values (457) 10005
56.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 9974
56.2%
Space Separator 5843
32.9%
Other Punctuation 568
 
3.2%
Uppercase Letter 316
 
1.8%
Dash Punctuation 262
 
1.5%
Lowercase Letter 259
 
1.5%
Decimal Number 174
 
1.0%
Close Punctuation 121
 
0.7%
Open Punctuation 113
 
0.6%
Other Symbol 97
 
0.5%
Other values (3) 28
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
333
 
3.3%
206
 
2.1%
193
 
1.9%
174
 
1.7%
172
 
1.7%
168
 
1.7%
160
 
1.6%
146
 
1.5%
142
 
1.4%
139
 
1.4%
Other values (378) 8141
81.6%
Lowercase Letter
ValueCountFrequency (%)
e 40
15.4%
i 27
10.4%
t 25
9.7%
n 20
 
7.7%
r 20
 
7.7%
o 19
 
7.3%
a 18
 
6.9%
s 16
 
6.2%
c 9
 
3.5%
g 9
 
3.5%
Other values (13) 56
21.6%
Uppercase Letter
ValueCountFrequency (%)
C 38
12.0%
O 37
11.7%
A 27
 
8.5%
S 27
 
8.5%
M 26
 
8.2%
P 24
 
7.6%
D 18
 
5.7%
T 17
 
5.4%
N 17
 
5.4%
L 13
 
4.1%
Other values (12) 72
22.8%
Other Punctuation
ValueCountFrequency (%)
, 237
41.7%
? 162
28.5%
: 88
 
15.5%
. 48
 
8.5%
/ 14
 
2.5%
6
 
1.1%
· 6
 
1.1%
' 4
 
0.7%
% 2
 
0.4%
; 1
 
0.2%
Decimal Number
ValueCountFrequency (%)
1 48
27.6%
2 41
23.6%
0 22
12.6%
3 17
 
9.8%
5 15
 
8.6%
4 10
 
5.7%
6 10
 
5.7%
8 5
 
2.9%
7 4
 
2.3%
9 2
 
1.1%
Math Symbol
ValueCountFrequency (%)
~ 9
50.0%
4
22.2%
3
 
16.7%
+ 2
 
11.1%
Other Symbol
ValueCountFrequency (%)
95
97.9%
2
 
2.1%
Final Punctuation
ValueCountFrequency (%)
7
87.5%
1
 
12.5%
Initial Punctuation
ValueCountFrequency (%)
1
50.0%
1
50.0%
Space Separator
ValueCountFrequency (%)
5843
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 262
100.0%
Close Punctuation
ValueCountFrequency (%)
) 121
100.0%
Open Punctuation
ValueCountFrequency (%)
( 113
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 9973
56.2%
Common 7206
40.6%
Latin 575
 
3.2%
Han 1
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
333
 
3.3%
206
 
2.1%
193
 
1.9%
174
 
1.7%
172
 
1.7%
168
 
1.7%
160
 
1.6%
146
 
1.5%
142
 
1.4%
139
 
1.4%
Other values (377) 8140
81.6%
Latin
ValueCountFrequency (%)
e 40
 
7.0%
C 38
 
6.6%
O 37
 
6.4%
A 27
 
4.7%
S 27
 
4.7%
i 27
 
4.7%
M 26
 
4.5%
t 25
 
4.3%
P 24
 
4.2%
n 20
 
3.5%
Other values (35) 284
49.4%
Common
ValueCountFrequency (%)
5843
81.1%
- 262
 
3.6%
, 237
 
3.3%
? 162
 
2.2%
) 121
 
1.7%
( 113
 
1.6%
95
 
1.3%
: 88
 
1.2%
. 48
 
0.7%
1 48
 
0.7%
Other values (24) 189
 
2.6%
Han
ValueCountFrequency (%)
1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 9971
56.2%
ASCII 7655
43.1%
Geometric Shapes 95
 
0.5%
Punctuation 16
 
0.1%
Arrows 7
 
< 0.1%
None 6
 
< 0.1%
CJK Compat 2
 
< 0.1%
Compat Jamo 2
 
< 0.1%
CJK 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
5843
76.3%
- 262
 
3.4%
, 237
 
3.1%
? 162
 
2.1%
) 121
 
1.6%
( 113
 
1.5%
: 88
 
1.1%
. 48
 
0.6%
1 48
 
0.6%
2 41
 
0.5%
Other values (59) 692
 
9.0%
Hangul
ValueCountFrequency (%)
333
 
3.3%
206
 
2.1%
193
 
1.9%
174
 
1.7%
172
 
1.7%
168
 
1.7%
160
 
1.6%
146
 
1.5%
142
 
1.4%
139
 
1.4%
Other values (375) 8138
81.6%
Geometric Shapes
ValueCountFrequency (%)
95
100.0%
Punctuation
ValueCountFrequency (%)
7
43.8%
6
37.5%
1
 
6.2%
1
 
6.2%
1
 
6.2%
None
ValueCountFrequency (%)
· 6
100.0%
Arrows
ValueCountFrequency (%)
4
57.1%
3
42.9%
CJK Compat
ValueCountFrequency (%)
2
100.0%
CJK
ValueCountFrequency (%)
1
100.0%
Compat Jamo
ValueCountFrequency (%)
1
50.0%
1
50.0%
Distinct54
Distinct (%)100.0%
Missing480
Missing (%)89.9%
Memory size4.3 KiB
2024-05-18T10:42:23.485606image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length705
Median length97
Mean length111.38889
Min length32

Characters and Unicode

Total characters6015
Distinct characters348
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks7 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique54 ?
Unique (%)100.0%

Sample

1st rowo 상수원 상류 조류발생 경향에 따른 한강, 취수원 조류 농도 예측 o 남조류 및 맛?냄새물질 대량발생 대비 정수처리 매뉴얼 작성, 정비 o 조류 및 맛?냄새물질 추가 제거방안 검토
2nd row ○ 정수장 순환정비에 따른 침전지 개량 기초 설계자료 제공 ○ 침전지 효율적인 개선안 제시로 정수공정 고효율?집약화 달성
3rd row○ 대부분 수동으로 운영되는 약품 주입률 결정에 인공지능 자동 예측 시스템 도입 ○ 실시간 측정 데이터를 활용한 실시간 대응으로 정수처리공정 약품 주입 효율 향상 ○ 상수도 분야 4차 산업 기술 역량 확보
4th row- 예측결과를 정기적으로 상수도사업본부 및 정수센터와 공유하여 고농도 맛?냄새 물질 발생 예측시 고도정수처리시설 최적운영조건 설정과 분말활성탄 준비 등 선제적 대응과 수질관리대책 수립에 활용 - 인공지능을 활용한 물환경 관리시스템 개발을 위한 기반기술로 활용
5th row ○ 고도처리 MLE 적정 운영관리방안 제시 ○ 하수 처리수 처리효율 향상을 통한 수질개선
ValueCountFrequency (%)
91
 
6.4%
61
 
4.3%
44
 
3.1%
활용 23
 
1.6%
상수원 18
 
1.3%
위한 16
 
1.1%
통한 13
 
0.9%
12
 
0.8%
안전성 10
 
0.7%
서울시 10
 
0.7%
Other values (792) 1129
79.1%
2024-05-18T10:42:24.708594image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1709
28.4%
198
 
3.3%
91
 
1.5%
87
 
1.4%
78
 
1.3%
74
 
1.2%
71
 
1.2%
71
 
1.2%
. 68
 
1.1%
66
 
1.1%
Other values (338) 3502
58.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 3831
63.7%
Space Separator 1709
28.4%
Decimal Number 165
 
2.7%
Other Punctuation 124
 
2.1%
Other Symbol 91
 
1.5%
Close Punctuation 26
 
0.4%
Dash Punctuation 23
 
0.4%
Open Punctuation 21
 
0.3%
Uppercase Letter 11
 
0.2%
Math Symbol 10
 
0.2%
Other values (2) 4
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
198
 
5.2%
87
 
2.3%
78
 
2.0%
74
 
1.9%
71
 
1.9%
71
 
1.9%
66
 
1.7%
61
 
1.6%
61
 
1.6%
58
 
1.5%
Other values (301) 3006
78.5%
Decimal Number
ValueCountFrequency (%)
1 50
30.3%
2 50
30.3%
0 26
15.8%
3 20
 
12.1%
4 9
 
5.5%
5 2
 
1.2%
9 2
 
1.2%
7 2
 
1.2%
8 2
 
1.2%
6 2
 
1.2%
Uppercase Letter
ValueCountFrequency (%)
M 2
18.2%
D 2
18.2%
F 1
9.1%
P 1
9.1%
B 1
9.1%
E 1
9.1%
L 1
9.1%
R 1
9.1%
T 1
9.1%
Other Punctuation
ValueCountFrequency (%)
. 68
54.8%
, 25
 
20.2%
? 12
 
9.7%
: 12
 
9.7%
3
 
2.4%
/ 2
 
1.6%
* 1
 
0.8%
% 1
 
0.8%
Close Punctuation
ValueCountFrequency (%)
) 25
96.2%
1
 
3.8%
Open Punctuation
ValueCountFrequency (%)
( 20
95.2%
1
 
4.8%
Space Separator
ValueCountFrequency (%)
1709
100.0%
Other Symbol
ValueCountFrequency (%)
91
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 23
100.0%
Math Symbol
ValueCountFrequency (%)
~ 10
100.0%
Lowercase Letter
ValueCountFrequency (%)
o 3
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 3831
63.7%
Common 2169
36.1%
Latin 15
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
198
 
5.2%
87
 
2.3%
78
 
2.0%
74
 
1.9%
71
 
1.9%
71
 
1.9%
66
 
1.7%
61
 
1.6%
61
 
1.6%
58
 
1.5%
Other values (301) 3006
78.5%
Common
ValueCountFrequency (%)
1709
78.8%
91
 
4.2%
. 68
 
3.1%
1 50
 
2.3%
2 50
 
2.3%
0 26
 
1.2%
, 25
 
1.2%
) 25
 
1.2%
- 23
 
1.1%
( 20
 
0.9%
Other values (16) 82
 
3.8%
Latin
ValueCountFrequency (%)
o 3
20.0%
M 2
13.3%
D 2
13.3%
F 1
 
6.7%
P 1
 
6.7%
B 1
 
6.7%
1
 
6.7%
E 1
 
6.7%
L 1
 
6.7%
R 1
 
6.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 3830
63.7%
ASCII 2087
34.7%
Geometric Shapes 91
 
1.5%
Punctuation 3
 
< 0.1%
None 2
 
< 0.1%
Number Forms 1
 
< 0.1%
Compat Jamo 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1709
81.9%
. 68
 
3.3%
1 50
 
2.4%
2 50
 
2.4%
0 26
 
1.2%
, 25
 
1.2%
) 25
 
1.2%
- 23
 
1.1%
( 20
 
1.0%
3 20
 
1.0%
Other values (22) 71
 
3.4%
Hangul
ValueCountFrequency (%)
198
 
5.2%
87
 
2.3%
78
 
2.0%
74
 
1.9%
71
 
1.9%
71
 
1.9%
66
 
1.7%
61
 
1.6%
61
 
1.6%
58
 
1.5%
Other values (300) 3005
78.5%
Geometric Shapes
ValueCountFrequency (%)
91
100.0%
Punctuation
ValueCountFrequency (%)
3
100.0%
Number Forms
ValueCountFrequency (%)
1
100.0%
None
ValueCountFrequency (%)
1
50.0%
1
50.0%
Compat Jamo
ValueCountFrequency (%)
1
100.0%
Distinct121
Distinct (%)22.7%
Missing0
Missing (%)0.0%
Memory size4.3 KiB
2024-05-18T10:42:25.423543image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length7
Median length3
Mean length2.9962547
Min length2

Characters and Unicode

Total characters1600
Distinct characters112
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique45 ?
Unique (%)8.4%

Sample

1st row한금석
2nd row송만식
3rd row한금석
4th row김태균
5th row강문숙
ValueCountFrequency (%)
박창민 29
 
5.4%
이준호 17
 
3.2%
정관조 17
 
3.2%
정종순 17
 
3.2%
김상은 17
 
3.2%
송만식 16
 
3.0%
김세철 16
 
3.0%
안재찬 13
 
2.4%
조석주 12
 
2.2%
이옥재 12
 
2.2%
Other values (111) 368
68.9%
2024-05-18T10:42:26.591996image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
105
 
6.6%
102
 
6.4%
60
 
3.8%
58
 
3.6%
52
 
3.2%
50
 
3.1%
44
 
2.8%
42
 
2.6%
41
 
2.6%
40
 
2.5%
Other values (102) 1006
62.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1597
99.8%
Other Punctuation 3
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
105
 
6.6%
102
 
6.4%
60
 
3.8%
58
 
3.6%
52
 
3.3%
50
 
3.1%
44
 
2.8%
42
 
2.6%
41
 
2.6%
40
 
2.5%
Other values (101) 1003
62.8%
Other Punctuation
ValueCountFrequency (%)
, 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1597
99.8%
Common 3
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
105
 
6.6%
102
 
6.4%
60
 
3.8%
58
 
3.6%
52
 
3.3%
50
 
3.1%
44
 
2.8%
42
 
2.6%
41
 
2.6%
40
 
2.5%
Other values (101) 1003
62.8%
Common
ValueCountFrequency (%)
, 3
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1597
99.8%
ASCII 3
 
0.2%

Most frequent character per block

Hangul
ValueCountFrequency (%)
105
 
6.6%
102
 
6.4%
60
 
3.8%
58
 
3.6%
52
 
3.3%
50
 
3.1%
44
 
2.8%
42
 
2.6%
41
 
2.6%
40
 
2.5%
Other values (101) 1003
62.8%
ASCII
ValueCountFrequency (%)
, 3
100.0%

담당부서
Categorical

Distinct10
Distinct (%)1.9%
Missing0
Missing (%)0.0%
Memory size4.3 KiB
먹는물분석과
119 
수처리연구과
107 
미생물검사과
94 
배급수연구과
63 
수질연구과
60 
Other values (5)
91 

Length

Max length8
Median length6
Mean length5.9419476
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row배급수연구과
2nd row수질연구과
3rd row배급수연구과
4th row수처리연구과
5th row스마트기술연구과

Common Values

ValueCountFrequency (%)
먹는물분석과 119
22.3%
수처리연구과 107
20.0%
미생물검사과 94
17.6%
배급수연구과 63
11.8%
수질연구과 60
11.2%
신물질분석과 36
 
6.7%
스마트기술연구과 28
 
5.2%
재료연구과 18
 
3.4%
전략연구과 7
 
1.3%
연구기획과 2
 
0.4%

Length

2024-05-18T10:42:27.046135image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-05-18T10:42:27.377838image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
먹는물분석과 119
22.3%
수처리연구과 107
20.0%
미생물검사과 94
17.6%
배급수연구과 63
11.8%
수질연구과 60
11.2%
신물질분석과 36
 
6.7%
스마트기술연구과 28
 
5.2%
재료연구과 18
 
3.4%
전략연구과 7
 
1.3%
연구기획과 2
 
0.4%

연구시작일
Real number (ℝ)

HIGH CORRELATION 

Distinct89
Distinct (%)16.7%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean20038759
Minimum19920101
Maximum20240101
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size4.8 KiB
2024-05-18T10:42:27.753955image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum19920101
5-th percentile19940101
Q119970101
median20040101
Q320100101
95-th percentile20150201
Maximum20240101
Range320000
Interquartile range (IQR)130000

Descriptive statistics

Standard deviation73210.3
Coefficient of variation (CV)0.0036534347
Kurtosis-0.84216059
Mean20038759
Median Absolute Deviation (MAD)60000
Skewness0.19912739
Sum1.0700698 × 1010
Variance5.359748 × 109
MonotonicityNot monotonic
2024-05-18T10:42:28.559262image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
19940101 32
 
6.0%
19960101 28
 
5.2%
19950101 28
 
5.2%
20100101 23
 
4.3%
20060101 23
 
4.3%
19920101 22
 
4.1%
20090101 22
 
4.1%
20030101 22
 
4.1%
20070101 22
 
4.1%
20110101 20
 
3.7%
Other values (79) 292
54.7%
ValueCountFrequency (%)
19920101 22
4.1%
19930101 1
 
0.2%
19930301 1
 
0.2%
19940101 32
6.0%
19950101 28
5.2%
19950401 1
 
0.2%
19950701 1
 
0.2%
19951101 1
 
0.2%
19960101 28
5.2%
19960401 1
 
0.2%
ValueCountFrequency (%)
20240101 1
 
0.2%
20230101 2
 
0.4%
20220101 1
 
0.2%
20210101 1
 
0.2%
20200701 1
 
0.2%
20200101 6
1.1%
20190101 3
0.6%
20180301 1
 
0.2%
20180101 1
 
0.2%
20170401 1
 
0.2%

연구종료일
Real number (ℝ)

HIGH CORRELATION 

Distinct95
Distinct (%)17.8%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean20046085
Minimum19940701
Maximum20251231
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size4.8 KiB
2024-05-18T10:42:29.068022image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum19940701
5-th percentile19941231
Q119980701
median20051201
Q320101201
95-th percentile20161231
Maximum20251231
Range310530
Interquartile range (IQR)120500

Descriptive statistics

Standard deviation74106.903
Coefficient of variation (CV)0.0036968268
Kurtosis-0.89249836
Mean20046085
Median Absolute Deviation (MAD)60000
Skewness0.2570986
Sum1.0704609 × 1010
Variance5.4918331 × 109
MonotonicityNot monotonic
2024-05-18T10:42:29.585618image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
19951231 50
 
9.4%
19941231 32
 
6.0%
20101201 27
 
5.1%
20091201 27
 
5.1%
19961231 26
 
4.9%
19991201 22
 
4.1%
20031201 19
 
3.6%
20081201 19
 
3.6%
20061201 19
 
3.6%
20051201 19
 
3.6%
Other values (85) 274
51.3%
ValueCountFrequency (%)
19940701 1
 
0.2%
19941231 32
6.0%
19951231 50
9.4%
19960201 1
 
0.2%
19960501 1
 
0.2%
19960904 1
 
0.2%
19961001 1
 
0.2%
19961101 1
 
0.2%
19961231 26
4.9%
19970701 1
 
0.2%
ValueCountFrequency (%)
20251231 1
 
0.2%
20241231 1
 
0.2%
20231231 1
 
0.2%
20221231 3
0.6%
20211231 2
0.4%
20210630 1
 
0.2%
20201231 4
0.7%
20200630 1
 
0.2%
20191231 3
0.6%
20191031 1
 
0.2%

예산승인상태
Categorical

CONSTANT 

Distinct1
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size4.3 KiB
미등록
534 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row미등록
2nd row미등록
3rd row미등록
4th row미등록
5th row미등록

Common Values

ValueCountFrequency (%)
미등록 534
100.0%

Length

2024-05-18T10:42:30.140857image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-05-18T10:42:30.459299image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
미등록 534
100.0%

보안과제여부
Boolean

CONSTANT 

Distinct1
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size666.0 B
False
534 
ValueCountFrequency (%)
False 534
100.0%
2024-05-18T10:42:30.696038image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Interactions

2024-05-18T10:42:07.164256image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-05-18T10:42:06.396334image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-05-18T10:42:07.559438image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-05-18T10:42:06.763060image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-05-18T10:42:30.908081image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
과제영문명국내외연구사례연구내용및방법.1기대효과 및 활용방안담당부서연구시작일연구종료일
과제영문명1.0001.0001.0001.0001.0001.0001.000
국내외연구사례1.0001.0001.0001.0001.0001.0000.873
연구내용및방법.11.0001.0001.0001.0001.0001.0001.000
기대효과 및 활용방안1.0001.0001.0001.0001.0001.0001.000
담당부서1.0001.0001.0001.0001.0000.4710.458
연구시작일1.0001.0001.0001.0000.4711.0000.978
연구종료일1.0000.8731.0001.0000.4580.9781.000
2024-05-18T10:42:31.252001image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연구시작일연구종료일담당부서
연구시작일1.0000.9880.163
연구종료일0.9881.0000.155
담당부서0.1630.1551.000

Missing values

2024-05-18T10:42:07.995529image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-05-18T10:42:08.775514image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2024-05-18T10:42:09.216730image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

과제요청번호과제명과제영문명국내외연구사례연구내용및방법연구내용및방법.1기대효과 및 활용방안연구책임자담당부서연구시작일연구종료일예산승인상태보안과제여부
0PLA0810상수도관 전기부식 방지 최적 방안 연구<NA><NA><NA><NA><NA>한금석배급수연구과2024010120251231미등록N
1PLA0796상수원 상류 조류 영향과 효율적 맛?냄새물질 제거방안 연구A study on the effect of algae in the upstream of the water source and the effective removal of taste and odor substanceso 냄새물질 발생 경향과 영향인자 분석, 김은정, 2019 o Individual-based modelling of cyanobacteria blooms: physical and physiological processes, David P. Hamilton et al., Science of The Total Environment, 10. 2021o 목 적 - 상수원 상류 다목적댐 저수율 감소 등에 따른 조류 발생경향을 분석하고 조류 대량 발생 시 효율적인 맛?냄새물질 제거방안 연구 o 필요성 - 기후변화 등으로 인해 상수원에 조류가 대량 발생할 수 있어 조류 및 조류 분비물질로 인한 수처리 장해와 수돗물 맛?냄새물질 대책 필요o 내 용 : 조류 발생의 영향인자 분석 및 조류분비 맛?냄새물질 제거방안 확립 - 상류댐 저수율 관리현황 및 저수율 등에 따른 조류 발생경향 실태조사 - 계절별 고도정수처리 공정에서 맛?냄새물질 제거 한계농도 분석 - 조류 대발생 시 효율적인 맛?냄새물질 기준 이내 관리를 위한 제거방안 마련 o 세부 연구개발방법 - 과거자료 : 과거 기상 수문, 수질 등과 냄새물질 제거 운전?수질자료 등 - 추진방법 : 과거실적 통계분석과 비교평가(최적화 기법) 등o 상수원 상류 조류발생 경향에 따른 한강, 취수원 조류 농도 예측 o 남조류 및 맛?냄새물질 대량발생 대비 정수처리 매뉴얼 작성, 정비 o 조류 및 맛?냄새물질 추가 제거방안 검토송만식수질연구과2023010120231231미등록N
2PLA0798대형 상수도관 누수 원인 규명 및 지도 개발 연구<NA><NA><NA><NA><NA>한금석배급수연구과2023010120241231미등록N
3PLA0766경사판 침전지 개량을 위한 침전효율 향상방안 연구<NA>○ 최적화된 경사판을 이용한 침전분리기술과 적용사례 (한국상하수도협회) ○ 경사판 침전지의 수리학적 특성에 대한 구조물 영향 (대한상하수도학회)○ 정수센터 순환정비 및 재건설 계획(안)에 따른 정수공정 개량필요 ○ 침전지 효율분석을 통한 고효율?집약화가 가능한 침전지 개량방안 마련 ? 2021년 소형생물 침전효율 분석결과, 침전형식에서 경사판이 우수한 효과를 나타냄 ※ 경사판 97%, 장방형 91%, 맥동식 83%○ 침전지 형식별 시설?운영현황 및 데이터 분석 ○ 침전지 형식에 따른 설계인자 분석 (표면부하율, 위어부하율, 하부상승유속) ○ 침전지 형식별 소형생물, 탁도 제거율 평가 ○ 경사판 침전지 설계(안) 검토: 경사판 규격(길이, 두께, 각도, 위치) 및 부지저감비율 ○ CFD 진단을 활용한 침전지 흐름 및 효율평가 ? 침전지 효율적 개량방안 도출○ 정수장 순환정비에 따른 침전지 개량 기초 설계자료 제공 ○ 침전지 효율적인 개선안 제시로 정수공정 고효율?집약화 달성김태균수처리연구과2022010120221231미등록N
4PLA0761정수처리공정 응집제 주입률 결정 연구A study on the determination of coagulant injection rate in water treatment process○ 수도시설 관리 효율화를 위한 인공지능 기반 의사결정 시스템 개발(2018, 한국수자원공사) ○ 정수장 약품 최적 주입률 결정을 위한 지능형 제어기 개발(2015, 한국수자원공사) ○ 원수조건에 따른 상수도 응집제 종류와 주입률 결정을 위한 데이터 마이닝 및 신경회로망의 적용(2004, 부산대학교) ○ 지능알고리즘을 이용한 정수처리공정의 응집제 주입률 결정(2004,충남대학교)○ 사물인터넷(IoT), 빅데이터, 인공지능(AI)을 활용한 지능화 및 자동화된 생산시스템의 구현은 현대의 수요 대응 고도화에 필수적임 ○ 서울시에서도 현장 운영 데이터를 기반으로 한 정수처리공정 프로그램을 일부 적용하고 있으며, 한 단계 더 발전하기 위해서는 인공지능을 활용한 예측시스템에 대한 연구가 필요함 ○ 정수장 빅데이터 분석 및 인공지능 예측 모델 개발을 통해 약품주입, 운영관리 고도화에 필요한 핵심 기술을 개발하여 스마트 정수장 구축에 기여하고자 함○ 정수장 응집제 주입률 결정 프로그램 개발 - 응집제(PAC,PAHCS)별 원수 수질에 대한 영향 인자 분석 - 머신러닝 학습을 통한 응집제 주입률 예측 모델 검토 - 모델 구조 적합도 평가 및 최적화 - AI 시스템을 활용한 응집제 주입 자동화 구축 방안 연구 ○ 정수장 후염소 주입률 결정 프로그램 개발 - 정수장 후염소 송수 및 수도꼭지 수질에 대한 영향인자 분석 - 머신러닝 학습을 통한 후염소 주입률 예측 모델 검토 - 모델 구조 적합도 평가 및 최적화 - AI 시스템을 활용한 후염소 주입 자동화 구축 방안 연구○ 대부분 수동으로 운영되는 약품 주입률 결정에 인공지능 자동 예측 시스템 도입 ○ 실시간 측정 데이터를 활용한 실시간 대응으로 정수처리공정 약품 주입 효율 향상 ○ 상수도 분야 4차 산업 기술 역량 확보강문숙스마트기술연구과2021010120221231미등록N
5PLA0743맛?냄새 물질 사전대응 가능한 한강 원수 예측 모델 개발<NA>- Development of predictive models for geosmin-related taste and odor in Kansas, USA, drinking water reservoir (Dzialowski et al., 2009) - Development of models for predicting the predominant taste and odor compounds in Taihu lake, China (Qi et al., 2012) - Modelling geosmin concentrations in three sources of raw water Quebec, Canada (Parinet et al., 2013) - Who smells? Forecasting taste and odor in a drinking water reservoir (Kehoe et al., 2015) - Predicting taste and odor compounds in a shallow reservoir using a three-dimensional hydrodynamic ecological model (Chong et al., 2018)- 2-MIB와 지오스민(Geosmin)은 먹는물에서 불쾌한 냄새(흙냄새, 곰팡이 냄새)를 유발하는 맛?냄새 물질이며, 맛냄새 물질이 제대로 처리되지 않을 경우 수돗물에 대한 민원발생 및 불신감을 유발할 수 있음 - 서울시는 모든 정수장에 고도처리를 도입하여 대응하고 있으나, 최근 고도처리 효율이 낮아지는 저수온기에 냄새물질이 대량 증가하는 사례가 발생하고 있으며(‘18.11 맛?냄새 관리기준 ’경계‘단계 발령), 기후변화로 인한 가뭄과 수온상승 등으로 기존보다 고농도 맛?냄새 물질 발생 가능성이 높아지고 있음 - 정수처리공정에서 효율적이고 선제적인 대응을 위해서는 취수원수 맛?냄새 물질 농도의 사전 예측정보가 필요하지만, 명확한 발생 기작이 규명되지 않았고 모형구축 및 운영이 복잡하여 수치모형(결정론적 모델)을 이용한 예측에는 어려움이 존재함 - 본 연구에서는 여러 가지 통계적 기법 및 머신러닝 기법의 적용성을 검토한 후 취수원수 맛?냄새 물질 농도를 사전에 예측하는 최적모델을 개발하고자 함 - 개발된 모델은 현재 가용자료를 기반으로 취수원 지점별 맛?냄새 물질 농도를 미리 예측함으로써 고농도 발생 시 정수센터의 효율적 운영 및 본부 수질관리대책 수립에 활용될 것으로 기대됨- 적용가능한 통계적 기법 및 머신러닝 기법 검토 ? 관련 국내외 문헌 및 적용사례 검토 ? 통계적 기법: MLR(Multi Linear Regression), stepwise-MLR, PCA-MLR, ARIMA... ? 머신러닝 기법: ANN(Artificial Neural network), Decision tree, Random forest, ... - 예측 기법에 따른 활용 데이터 선정 및 정리 ? 예측지점 및 예측주기 설정 ? 현재 가용 데이터를 고려한 입력 데이터 선정 및 정리 - 통계적 기법 적용 및 머신러닝 기법 예측모델 개발 ? 입력데이터 구축 ? 모델 개발 및 검증(training and testing) ? 개발 도구: SPSS statistics, R(오픈소스 통계 프로그램 패키지) - 최적 예측모델 선정 ? 선정 모델에 따른 예측 정확도 비교 ? 예측 적용 시 데이터 구성 용이성, 모델구동 시간 등 비교 ? 종합비교결과에 따른 최적 예측모델 선정 - 활용방안 및 보완사항 검토 ? 예측결과 활용방안 및 정확도 향상을 위한 보완사항 제시- 예측결과를 정기적으로 상수도사업본부 및 정수센터와 공유하여 고농도 맛?냄새 물질 발생 예측시 고도정수처리시설 최적운영조건 설정과 분말활성탄 준비 등 선제적 대응과 수질관리대책 수립에 활용 - 인공지능을 활용한 물환경 관리시스템 개발을 위한 기반기술로 활용김은정수질연구과2020070120221231미등록N
6PLA0510하수고도처리 MLE공법 최적화 연구<NA>○ 질산화, 탈질, 탈인 등을 통한 생물학적 질소?인 제거기술인 MLE, A2O, SBR 등 다양한 공법이 국내외에 개발되어 실공정에 적용 ○ 고도처리 공법에 대한 최적화 연구가 지속적으로 진행되고 있으나 국내 실정에 맞는 최적화 적용사례 부족 ○ 유입하수 중 유기탄소원 부족과 겨울철 수온 저하에 따른 질소, 인 처리효율 감소로 이러한 문제점을 극복하기 위한 연구가 국내외적으로 진행 ○ 대규모 하수처리시설을 대상으로 계절별, 유입수 성상에 따른 MLE공법에 대한 최적화 연구사례 부족○ 하수도법 개정에 따라 생물학적산소요구량, 총질소 및 총인의 수질기준 강화 ○ 서울시 물재생센터에 도입된 MLE 공법은 생물학적 질소 제거와 응집제를 이용한 인 제거 특성을 가짐 ○ 총인처리시설 도입 전까지 MLE 공법을 통하여 최대한 방류수 수질기준을 충족시키는 방안 필요 ○ 계절별 유입수 성상에 따른 MLE공법에 대한 최적화 연구 필요1. 중랑센터 고도처리공법 현황 및 실공정 분석 ○ MLE공법 도입 후 가동률, 처리효율 등 공정운영 실태조사 ○ 유입수, 반응조, 처리수의 수질분석을 통한 MLE 실공정 운영효율 분석 ? 채수지점 : 유입수, 일차처리수, 무산소조, 호기조, 이차처리수 5지점 ? 분석항목 : COD, 총질소, 총인 등 15항목 ? 분석주기 : 2회/월 2. 생물반응조 현장 모형장치 설치 ○ 처리용량 : 5㎥/일(중랑물재생센터) ○ 주요장치 : 반응기, 계측기, 감시제어시스템 등 ? 2계열 비교실험, 유지관리 편리성 등 고려 ? 실공정 분석 반응조 계열과 동일한 유입수로 실험 3. 현장 모형실험을 통한 최적 운전조건 및 개선방안 제시 ○ 포기조건, 고형물 체류시간, 반송률 등 계절별 최적운전조건 산정 ? 겨울철, 봄?가을철, 여름철 등 계절별 운전조건 산정 ? 특히 겨울철 수온저하에 대한 수질 개선방안 제시 ? 분석주기 : 2회/주(채수지점, 분석항목 실공정과 동일) ○ 유량, 수질, 수온 등 운영조건 변화를 고려한 운전방안 제시 ? 강우, 연휴기간 등 저부하시기 수질 개선방안 마련 ? 일차침전지 운전조건 등 유입수 부하 조절방식 제시 4. 실공정 적용을 통한 처리효율 개선 및 매뉴얼 개발 ○ 실공정 분석결과를 센터와 협의를 통해 단기 개선방안 적용 평가 ○ 최적 운전조건 실험결과를 실공정에 적용하여 처리효율 개선 평가 ? 실공정 분석 반응조를 대상으로 최적운전조건 적용 및 분석 ? 분석주기 : 2회/주(채수지점, 분석항목 실공정과 동일) ○ 하수 유입수 성상에 따른 MLE 실공정 효율평가 및 운전조건 설정 ? 개선방안에 따른 유입수 부하 조절방식 적용 및 평가○ 고도처리 MLE 적정 운영관리방안 제시 ○ 하수 처리수 처리효율 향상을 통한 수질개선장신요스마트기술연구과2015020120161231미등록N
7PLA0735빅데이터 분석을 통한 고도정수처리 운영관리개선연구<NA>○ 물관리에서 빅데이터 활용사례(물정책.경제 제24호) - 네덜란드의 디지털 델타 : 강수량, 수위, 수질, 수로센서 정보, 밀물상황 등의 빅데이터 분석을 통해 수질과 수위를 신속하게 예측, 필요대책수립으로 효율적 물관리 방안 모색 - 미국 사우스밴드의 하수처리와 빅데이터 : 도시전체 하수망 센서설치, 네트워크 연결로 필요한 정보 수집, 적절한 소프트웨어로 분석하여 폭우시 오수를 강물로 보내거나 오수의 가정집 역류 방지 ○ 잔류염소 제어를 위한 빅데이터활용 공간분석사례(서울물연구원, 2019) - 법정수도꼭지 잔류염소 약400점을 대상으로 서울시 전역의 잔류염소 공간분석을 통한 염소취약지역 개선- 서울시 고도정수처리도입 4~9년 경과, 축적된 고도정수처리 운영데이터 분석필요 - 센터별 고도정수처리 효율분석에 따른 문제점 도출 및 개선방안필요 : 고도정수처리 빅데이터 분석을 통한 목표수질/처리농도 재설정○ 6개 정수센터 고도정수처리 빅데이터 분석 . 수질분야 : 맛.냄새, TOC, 소독부산물 등 . 활성탄 운영분야 : 누적통수량, 품질변화, 역세척 방법 등 . 오존/AOP 처리효율 : 사용농도별 수처리효율 분석 ○ 프로그램 : 서울시 빅데이터 활용시스템(Power BI) ※ Power BI : 사용자가 빠르게 데이터를 시각화(그래프, 차트) 가능한 MS사 개발프로그램○ 서울시 고도정수처리 목표수질재설정 및 공정개선방안마련 ○ 서울시 고도정수처리 운영매뉴얼(Ⅲ) 개정백영애수처리연구과2020010120201231미등록N
8PLA0762배급수계통에서 고분자 에폭시 도료의 경년변화 특성 연구Study on the aging characteristics of polymer epoxy resin in the distribution system<NA><NA><NA><NA>장도일신물질분석과2020010120211231미등록N
9PLA0746물 사용량 변동요인 분석과 상수도 대응방안 연구Analysis of Fluctuation in Water Usage and Countermeasures for Water Supply1. Kein Gan, Michael Redhead, 2013, Melbourne Residential Water Use Stuides 멜버른 시의 3개의 수도국에서 거주하는 시민들이 사용하는 물 사용기기, 물 사용습관을 연구 2. 미국 물연구재단(WRF), 2016, Residential End Uses of Water 설문조사와 실측조사를 통해서 미국과 캐나다의 주요 도시 가정에서 실내와 실외에서 얼마나 많은 물의 양이 사용되는지, 1인당, 1가구 당 물 사용량은 얼마나 되는지 파악 3. Ideal Standard International, 2016, Waterwise-Ideal Standard Water Efficiency Annal Tracker Survey Summary Report : A Water Saving Report 시간이 지남에 따라 사람들의 물 사용 행동의 경향을 관찰하기 위해서 국가별 데이타를 수집. 이를통해 집에서 물 사용에 대한 사람들의 인식, 물 절약 행동의식 등을 파악- 폭염, 가뭄, 1인 가구 증가, 고령화 등 물 사용 환경과 패턴 변화 - 사용단계의 절수 관리방안 마련으로 수돗물 공급 시설의 부담 완화1. 수돗물 용도별 사용량 조사, 분석 - 국외 대도시 수돗물 사용량 조사사례 분석 - 미래인구 추계를 반영한 물 사용량 변화 예측 - 실측, 설문조사 등을 통한 물사용 특성 조사 2. 사용단계 절수관리 방안 마련 ㅁ;ㅊ 분석 - 절수기기 등급제 시행에 따른 물 절약 잠재량 분석 - 절수기기 설치 촉진을 위한 조례 도입 방안 연구 - 합리적인 수돗물 사용 가이드라인 제시- 수돗물 수요 변화 예측과 관리로 지속 가능한 수돗물 공급에 기여 - 수돗물 합리적인 사용 습관과 지식 공유를 통한 시민 공감 강화김나은전략연구과2020010120210630미등록N
과제요청번호과제명과제영문명국내외연구사례연구내용및방법연구내용및방법.1기대효과 및 활용방안연구책임자담당부서연구시작일연구종료일예산승인상태보안과제여부
524PLA0067응집제(PAC) 최적 주입량 비교 실험<NA><NA>모형실험을 통하여 뚝도 정수사업소에서 연구된 연산식에 대해 응집제주입량의 편차를 파악<NA><NA>조석주수처리연구과1992010119951231미등록N
525PLA0068응집제(PAC, PACS)의 효능 비교<NA><NA>PAC, PACS의 응집효율과 오탁물질의 제거 효율의 비교를 통한 응집제 성능조사<NA><NA>이성재재료연구과1992010119951231미등록N
526PLA0069응집지 및 침전지에서의 부상플럭 제거를 위한 조사<NA><NA>구의정수사업소에서 floc부상의 원인은 기체과포화에 관한 것이었으며 그 조사과정과 원인을 규명함<NA><NA>곽은숙수처리연구과1992010119951231미등록N
527PLA0070이산화염소 종류별 수처리 효율 비교실험<NA><NA>이산화염소의 제조방법에 따른 제품성능 및 효과와 현재 사용중인 안정화이산화염소와 신개발품인 활성화 이산화염소의 성능비교<NA><NA>김중구수처리연구과1992010119951231미등록N
528PLA0058수온변화에 따른 적정 역세척 속도<NA><NA>각 정수장의 조건에 맞는 역세속도산출 후 수온대별로 적용하여 역세척효율의 효과 증가<NA><NA>이용우수처리연구과1992010119951231미등록N
529PLA0072자기처리에 의한 수질변화 및 식물성장에 관한 고찰<NA><NA>수돗물의 자기처리(자화수)에 따른 수질변화 및 식물성장 상태를 관찰하여 수돗물과 비교 검토함.<NA><NA>신인철수질연구과1992010119951231미등록N
530PLA0073전기분해 실험장치에 의한 수돗물의 앙금 발생원인 조사<NA><NA>전기분해장치에 의한 수돗물의 앙금발생에 대한 원인 조사 및 규명<NA><NA>신인철먹는물분석과1992010119951231미등록N
531PLA0077정수사업소 여과사 보사에 따른 수질개선 효과 조사<NA><NA>현재 정수사업소에서 추진중이거나 완료된 여과사층보사에 따른 수질 개선 효과분석.<NA><NA>함영국재료연구과1992010119951231미등록N
532PLA0082혼화조건에 대한 흐름 해석<NA><NA>모형실험을 통해 약품주입 및 혼합공정을 혼합조건에 따른 흐름의 양상을 평가해 완전혼합을 이루는 주변조건 추적<NA><NA>김성헌수처리연구과1992010119951231미등록N
533PLA0083혼화지의 효율적 운영 방안<NA><NA>혼화공정의 운전조건을 실험하여 문제점도출 및 혼화시스템 개선사항 제시<NA><NA>이용우수처리연구과1992010119951231미등록N