Overview

Dataset statistics

Number of variables4
Number of observations23
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory891.0 B
Average record size in memory38.7 B

Variable types

Categorical2
Text2

Dataset

Description한국동서발전 주식회사에서 추진하여 진행 또는 완료된 정보화 사업에 대한 목록입니다. 해당 사업의 연도와 사업개요, 그리고 관리부서가 명시되어 있습니다.
URLhttps://www.data.go.kr/data/15028801/fileData.do

Alerts

관리부서 is highly imbalanced (56.3%)Imbalance
사업명 has unique valuesUnique
사업개요 has unique valuesUnique

Reproduction

Analysis started2023-12-12 06:03:18.948764
Analysis finished2023-12-12 06:03:19.410361
Duration0.46 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연도
Categorical

Distinct3
Distinct (%)13.0%
Missing0
Missing (%)0.0%
Memory size316.0 B
2020
2022
2021

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2020
2nd row2020
3rd row2020
4th row2020
5th row2020

Common Values

ValueCountFrequency (%)
2020 9
39.1%
2022 8
34.8%
2021 6
26.1%

Length

2023-12-12T15:03:19.481953image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T15:03:19.596409image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2020 9
39.1%
2022 8
34.8%
2021 6
26.1%

사업명
Text

UNIQUE 

Distinct23
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size316.0 B
2023-12-12T15:03:19.874480image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length33
Median length23
Mean length19.043478
Min length10

Characters and Unicode

Total characters438
Distinct characters134
Distinct categories7 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique23 ?
Unique (%)100.0%

Sample

1st rowEWP 모바일 오피스 개선
2nd row통합로그관리시스템 보강
3rd row인터넷망 가상화PC 구축
4th rowCCTV 설비 상태 모니터링 시스템 구축
5th row인터넷망 가상화PC 보강
ValueCountFrequency (%)
구축 10
 
9.7%
보강 4
 
3.9%
용역 4
 
3.9%
통합 3
 
2.9%
기반 3
 
2.9%
사업 3
 
2.9%
설비 2
 
1.9%
데이터센터 2
 
1.9%
고도화 2
 
1.9%
시스템 2
 
1.9%
Other values (64) 68
66.0%
2023-12-12T15:03:20.319928image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
80
 
18.3%
14
 
3.2%
13
 
3.0%
13
 
3.0%
12
 
2.7%
11
 
2.5%
8
 
1.8%
8
 
1.8%
7
 
1.6%
7
 
1.6%
Other values (124) 265
60.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 312
71.2%
Space Separator 80
 
18.3%
Uppercase Letter 33
 
7.5%
Open Punctuation 4
 
0.9%
Close Punctuation 4
 
0.9%
Decimal Number 4
 
0.9%
Dash Punctuation 1
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
14
 
4.5%
13
 
4.2%
13
 
4.2%
12
 
3.8%
11
 
3.5%
8
 
2.6%
8
 
2.6%
7
 
2.2%
7
 
2.2%
7
 
2.2%
Other values (102) 212
67.9%
Uppercase Letter
ValueCountFrequency (%)
P 5
15.2%
C 5
15.2%
D 4
12.1%
E 3
9.1%
T 3
9.1%
B 2
 
6.1%
L 2
 
6.1%
A 2
 
6.1%
O 1
 
3.0%
R 1
 
3.0%
Other values (5) 5
15.2%
Decimal Number
ValueCountFrequency (%)
2 2
50.0%
1 1
25.0%
0 1
25.0%
Space Separator
ValueCountFrequency (%)
80
100.0%
Open Punctuation
ValueCountFrequency (%)
( 4
100.0%
Close Punctuation
ValueCountFrequency (%)
) 4
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 312
71.2%
Common 93
 
21.2%
Latin 33
 
7.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
14
 
4.5%
13
 
4.2%
13
 
4.2%
12
 
3.8%
11
 
3.5%
8
 
2.6%
8
 
2.6%
7
 
2.2%
7
 
2.2%
7
 
2.2%
Other values (102) 212
67.9%
Latin
ValueCountFrequency (%)
P 5
15.2%
C 5
15.2%
D 4
12.1%
E 3
9.1%
T 3
9.1%
B 2
 
6.1%
L 2
 
6.1%
A 2
 
6.1%
O 1
 
3.0%
R 1
 
3.0%
Other values (5) 5
15.2%
Common
ValueCountFrequency (%)
80
86.0%
( 4
 
4.3%
) 4
 
4.3%
2 2
 
2.2%
1 1
 
1.1%
0 1
 
1.1%
- 1
 
1.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 312
71.2%
ASCII 126
28.8%

Most frequent character per block

ASCII
ValueCountFrequency (%)
80
63.5%
P 5
 
4.0%
C 5
 
4.0%
D 4
 
3.2%
( 4
 
3.2%
) 4
 
3.2%
E 3
 
2.4%
T 3
 
2.4%
B 2
 
1.6%
2 2
 
1.6%
Other values (12) 14
 
11.1%
Hangul
ValueCountFrequency (%)
14
 
4.5%
13
 
4.2%
13
 
4.2%
12
 
3.8%
11
 
3.5%
8
 
2.6%
8
 
2.6%
7
 
2.2%
7
 
2.2%
7
 
2.2%
Other values (102) 212
67.9%

사업개요
Text

UNIQUE 

Distinct23
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size316.0 B
2023-12-12T15:03:20.710132image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length69
Median length39
Mean length38.391304
Min length21

Characters and Unicode

Total characters883
Distinct characters212
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique23 ?
Unique (%)100.0%

Sample

1st row모바일 앱 기능개선 및 적용 기기 확대
2nd row정부기관 정보보안평가 대응 및 법적 권고사항 준수
3rd row스마트오피스 및 재택근무 지원을 위한 가상화PC 도입
4th rowCCTV 운영 관련 설비 상태 감시 시스템 구축
5th row코로나19 사태로 비대면 업무(화상회의, 동영상교육 등) 증가에 따른 설비 보강
ValueCountFrequency (%)
11
 
5.1%
구축 8
 
3.7%
7
 
3.2%
위한 6
 
2.8%
시스템 6
 
2.8%
기반 5
 
2.3%
설비 4
 
1.9%
운영 4
 
1.9%
통합 3
 
1.4%
증가에 2
 
0.9%
Other values (145) 160
74.1%
2023-12-12T15:03:21.196992image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
198
 
22.4%
19
 
2.2%
19
 
2.2%
15
 
1.7%
14
 
1.6%
13
 
1.5%
13
 
1.5%
11
 
1.2%
11
 
1.2%
11
 
1.2%
Other values (202) 559
63.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 614
69.5%
Space Separator 198
 
22.4%
Uppercase Letter 30
 
3.4%
Other Punctuation 15
 
1.7%
Lowercase Letter 10
 
1.1%
Open Punctuation 6
 
0.7%
Close Punctuation 6
 
0.7%
Decimal Number 3
 
0.3%
Dash Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
19
 
3.1%
19
 
3.1%
15
 
2.4%
14
 
2.3%
13
 
2.1%
13
 
2.1%
11
 
1.8%
11
 
1.8%
11
 
1.8%
11
 
1.8%
Other values (170) 477
77.7%
Uppercase Letter
ValueCountFrequency (%)
C 5
16.7%
P 5
16.7%
T 4
13.3%
A 3
10.0%
L 2
 
6.7%
E 2
 
6.7%
R 2
 
6.7%
D 2
 
6.7%
O 2
 
6.7%
B 1
 
3.3%
Other values (2) 2
 
6.7%
Lowercase Letter
ValueCountFrequency (%)
e 2
20.0%
r 2
20.0%
a 1
10.0%
c 1
10.0%
l 1
10.0%
i 1
10.0%
b 1
10.0%
o 1
10.0%
Other Punctuation
ValueCountFrequency (%)
, 10
66.7%
/ 3
 
20.0%
" 2
 
13.3%
Decimal Number
ValueCountFrequency (%)
9 1
33.3%
1 1
33.3%
5 1
33.3%
Open Punctuation
ValueCountFrequency (%)
( 5
83.3%
[ 1
 
16.7%
Close Punctuation
ValueCountFrequency (%)
) 5
83.3%
] 1
 
16.7%
Space Separator
ValueCountFrequency (%)
198
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 614
69.5%
Common 229
 
25.9%
Latin 40
 
4.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
19
 
3.1%
19
 
3.1%
15
 
2.4%
14
 
2.3%
13
 
2.1%
13
 
2.1%
11
 
1.8%
11
 
1.8%
11
 
1.8%
11
 
1.8%
Other values (170) 477
77.7%
Latin
ValueCountFrequency (%)
C 5
12.5%
P 5
12.5%
T 4
 
10.0%
A 3
 
7.5%
L 2
 
5.0%
E 2
 
5.0%
R 2
 
5.0%
D 2
 
5.0%
O 2
 
5.0%
e 2
 
5.0%
Other values (10) 11
27.5%
Common
ValueCountFrequency (%)
198
86.5%
, 10
 
4.4%
( 5
 
2.2%
) 5
 
2.2%
/ 3
 
1.3%
" 2
 
0.9%
[ 1
 
0.4%
] 1
 
0.4%
9 1
 
0.4%
1 1
 
0.4%
Other values (2) 2
 
0.9%

Most occurring blocks

ValueCountFrequency (%)
Hangul 614
69.5%
ASCII 269
30.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
198
73.6%
, 10
 
3.7%
( 5
 
1.9%
C 5
 
1.9%
P 5
 
1.9%
) 5
 
1.9%
T 4
 
1.5%
/ 3
 
1.1%
A 3
 
1.1%
L 2
 
0.7%
Other values (22) 29
 
10.8%
Hangul
ValueCountFrequency (%)
19
 
3.1%
19
 
3.1%
15
 
2.4%
14
 
2.3%
13
 
2.1%
13
 
2.1%
11
 
1.8%
11
 
1.8%
11
 
1.8%
11
 
1.8%
Other values (170) 477
77.7%

관리부서
Categorical

IMBALANCE 

Distinct5
Distinct (%)21.7%
Missing0
Missing (%)0.0%
Memory size316.0 B
ICT기획부
19 
총무부
 
1
그린전략실
 
1
울산발전
 
1
디지털보안부
 
1

Length

Max length6
Median length6
Mean length5.7391304
Min length3

Unique

Unique4 ?
Unique (%)17.4%

Sample

1st rowICT기획부
2nd rowICT기획부
3rd rowICT기획부
4th rowICT기획부
5th rowICT기획부

Common Values

ValueCountFrequency (%)
ICT기획부 19
82.6%
총무부 1
 
4.3%
그린전략실 1
 
4.3%
울산발전 1
 
4.3%
디지털보안부 1
 
4.3%

Length

2023-12-12T15:03:21.338409image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T15:03:21.475389image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
ict기획부 19
82.6%
총무부 1
 
4.3%
그린전략실 1
 
4.3%
울산발전 1
 
4.3%
디지털보안부 1
 
4.3%

Correlations

2023-12-12T15:03:21.547759image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연도사업명사업개요관리부서
연도1.0001.0001.0000.456
사업명1.0001.0001.0001.000
사업개요1.0001.0001.0001.000
관리부서0.4561.0001.0001.000
2023-12-12T15:03:21.647595image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
관리부서연도
관리부서1.0000.358
연도0.3581.000
2023-12-12T15:03:21.756028image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연도관리부서
연도1.0000.358
관리부서0.3581.000

Missing values

2023-12-12T15:03:19.265257image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T15:03:19.372171image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연도사업명사업개요관리부서
02020EWP 모바일 오피스 개선모바일 앱 기능개선 및 적용 기기 확대ICT기획부
12020통합로그관리시스템 보강정부기관 정보보안평가 대응 및 법적 권고사항 준수ICT기획부
22020인터넷망 가상화PC 구축스마트오피스 및 재택근무 지원을 위한 가상화PC 도입ICT기획부
32020CCTV 설비 상태 모니터링 시스템 구축CCTV 운영 관련 설비 상태 감시 시스템 구축ICT기획부
42020인터넷망 가상화PC 보강코로나19 사태로 비대면 업무(화상회의, 동영상교육 등) 증가에 따른 설비 보강ICT기획부
52020공공데이터 운영 및 품질관리 컨설팅 추진공공데이터 개방 및 활용 확대로 데이터경제 활성화 기반 마련ICT기획부
62020ICT 데이터센터 환경개선 사업 추진데이터센터 기반설비 보강 및 역할 재정립ICT기획부
72020소프트웨어 정의 네트워크(SDN) 고도화 사업서버 가상화 대상 소프트웨어 기반 개방형 네트워크 구축ICT기획부
82020전용 무선통신(P-LTE) 기반 스마트 무전시스템 구범 구축P-LTE망을 활용한 스마트 무전 시스템 시범 도입ICT기획부
920212021년도 사업소 기록물 전산화(DB) 구축 용역사업소 기록물 전산화를 위한 신규 데이터베이스 구축총무부
연도사업명사업개요관리부서
132021품질정보 통합관리시스템 구축 용역스마트 시험성적서 등 5종의 품질업무 효율성 향상을 위한 시스템 구축ICT기획부
142021한국동서발전(주) 건설관리시스템 재구축 사업건설관리 공정율, 자료관리 등 기존 시스템 재구축 사업ICT기획부
152022고화질 LED방식 영상표시설비 회의실 보강고화질 LED방식 영상설비 기반 최적의 디지택트 업무환경 구축ICT기획부
162022본사 데이터센터 환경 개선전사 ICT 설비 증가에 따른 데이터센터 운영 효율성 및 안정성 확보를 위한 설비 재배치 및 인프라 고도화ICT기획부
172022포트 취약점 분석시스템 구축현황 관리 및 불필요한 서비스 포트 점검으로 효율적인 정보시스템 운영ICT기획부
182022RPA 기반 업무 자동화 시스템 구축RPA 적용/테스트 및 운영체제 구축으로 RPA 업무 자동화 기반 마련ICT기획부
192022전사 OA 설비 구매전사 노후 OA 설비(클라우드 복합기, 프린터, 가상화단말기 등) 교체 및 신규 요청사항(직제변경, 신입직원 등) 반영 구매ICT기획부
202022디지택트 기반 무선 회의시스템 구축태블릿 PC, 스마트기기 등 모바일 기기를 활용하여 사내 인트라넷과 연계된 디지택트 기반 무선 회의시스템 구축ICT기획부
212022업무시스템 통합 DB 고도화업무시스템 통합 DB(데이터베이스, Oracle/Tibero) 솔루션 및 운영설비 고도화ICT기획부
222022급전지령시스템 보강[전력시장 운영규칙, "비상용 대체 통신수단 설치기준"] 위성망 활용 급전전화(전력러래소)비상 대제통신수단 확보ICT기획부