Overview

Dataset statistics

Number of variables5
Number of observations2042
Missing cells0
Missing cells (%)0.0%
Duplicate rows106
Duplicate rows (%)5.2%
Total size in memory81.9 KiB
Average record size in memory41.1 B

Variable types

Categorical3
Text2

Dataset

Description이 자료는 충북혁신도시 이전기관 (한국고용정보원, 한국소비자원, 한국가스안전공사) 기관에서이행했던 사회공헌사업 활동내역을하나의 자료로 통합하여 제공한다.
Author한국고용정보원
URLhttps://www.data.go.kr/data/15105722/fileData.do

Alerts

Dataset has 106 (5.2%) duplicate rowsDuplicates
기관 is highly imbalanced (78.3%)Imbalance
구분 is highly imbalanced (94.1%)Imbalance

Reproduction

Analysis started2023-12-12 16:28:11.249143
Analysis finished2023-12-12 16:28:12.071862
Duration0.82 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

기관
Categorical

IMBALANCE 

Distinct3
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size16.1 KiB
한국가스안전공사
1937 
한국소비자원
 
58
한국고용정보원
 
47

Length

Max length8
Median length8
Mean length7.9201763
Min length6

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row한국소비자원
2nd row한국소비자원
3rd row한국소비자원
4th row한국소비자원
5th row한국소비자원

Common Values

ValueCountFrequency (%)
한국가스안전공사 1937
94.9%
한국소비자원 58
 
2.8%
한국고용정보원 47
 
2.3%

Length

2023-12-13T01:28:12.145886image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:28:12.251948image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
한국가스안전공사 1937
94.9%
한국소비자원 58
 
2.8%
한국고용정보원 47
 
2.3%

연도
Categorical

Distinct5
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size16.1 KiB
2017
798 
2018
679 
2019
211 
2020
207 
2021
147 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2017
2nd row2017
3rd row2017
4th row2017
5th row2017

Common Values

ValueCountFrequency (%)
2017 798
39.1%
2018 679
33.3%
2019 211
 
10.3%
2020 207
 
10.1%
2021 147
 
7.2%

Length

2023-12-13T01:28:12.357281image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:28:12.480976image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2017 798
39.1%
2018 679
33.3%
2019 211
 
10.3%
2020 207
 
10.1%
2021 147
 
7.2%

구분
Categorical

IMBALANCE 

Distinct2
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size16.1 KiB
수시
2028 
정기
 
14

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row정기
2nd row수시
3rd row수시
4th row수시
5th row수시

Common Values

ValueCountFrequency (%)
수시 2028
99.3%
정기 14
 
0.7%

Length

2023-12-13T01:28:12.661686image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:28:12.820682image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
수시 2028
99.3%
정기 14
 
0.7%
Distinct1329
Distinct (%)65.1%
Missing0
Missing (%)0.0%
Memory size16.1 KiB
2023-12-13T01:28:13.118177image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length58
Median length41
Mean length18.697845
Min length2

Characters and Unicode

Total characters38181
Distinct characters535
Distinct categories10 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1154 ?
Unique (%)56.5%

Sample

1st row새빛맹인선교회
2nd row신입직원 사랑의 봉사활동
3rd row설맞이 음성·진천지역 소년소녀가장 등 초청 격려금 및 생필품 전달
4th row설맞이 지역경제 활성화를 위한 농특산물 직거래 장터 운영(음성군 합동)
5th row5월 가정의달 맞이 지역 경로당 방문 및 발전기금 전달
ValueCountFrequency (%)
308
 
3.8%
가스안전교육 223
 
2.8%
소외계층 163
 
2.0%
대상 137
 
1.7%
실시 125
 
1.5%
찾아가는 123
 
1.5%
123
 
1.5%
배달 123
 
1.5%
도시락 117
 
1.4%
사회공헌활동 116
 
1.4%
Other values (1761) 6527
80.7%
2023-12-13T01:28:13.667062image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
6088
 
15.9%
1043
 
2.7%
1039
 
2.7%
878
 
2.3%
862
 
2.3%
793
 
2.1%
693
 
1.8%
667
 
1.7%
645
 
1.7%
645
 
1.7%
Other values (525) 24828
65.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 29466
77.2%
Space Separator 6088
 
15.9%
Decimal Number 1066
 
2.8%
Open Punctuation 520
 
1.4%
Close Punctuation 520
 
1.4%
Uppercase Letter 200
 
0.5%
Lowercase Letter 177
 
0.5%
Other Punctuation 127
 
0.3%
Connector Punctuation 16
 
< 0.1%
Math Symbol 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
1043
 
3.5%
1039
 
3.5%
878
 
3.0%
862
 
2.9%
793
 
2.7%
693
 
2.4%
667
 
2.3%
645
 
2.2%
645
 
2.2%
544
 
1.8%
Other values (465) 21657
73.5%
Uppercase Letter
ValueCountFrequency (%)
P 40
20.0%
L 37
18.5%
G 27
13.5%
S 21
10.5%
O 9
 
4.5%
V 9
 
4.5%
K 8
 
4.0%
H 7
 
3.5%
C 6
 
3.0%
T 6
 
3.0%
Other values (9) 30
15.0%
Lowercase Letter
ValueCountFrequency (%)
o 31
17.5%
e 22
12.4%
l 17
9.6%
p 17
9.6%
h 17
9.6%
c 14
7.9%
g 11
 
6.2%
a 10
 
5.6%
y 10
 
5.6%
r 8
 
4.5%
Other values (9) 20
11.3%
Decimal Number
ValueCountFrequency (%)
1 275
25.8%
2 267
25.0%
0 234
22.0%
7 94
 
8.8%
8 74
 
6.9%
9 40
 
3.8%
3 27
 
2.5%
5 27
 
2.5%
4 17
 
1.6%
6 11
 
1.0%
Other Punctuation
ValueCountFrequency (%)
, 69
54.3%
· 38
29.9%
" 8
 
6.3%
' 6
 
4.7%
: 4
 
3.1%
. 1
 
0.8%
/ 1
 
0.8%
Space Separator
ValueCountFrequency (%)
6088
100.0%
Open Punctuation
ValueCountFrequency (%)
( 520
100.0%
Close Punctuation
ValueCountFrequency (%)
) 520
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 16
100.0%
Math Symbol
ValueCountFrequency (%)
~ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 29466
77.2%
Common 8338
 
21.8%
Latin 377
 
1.0%

Most frequent character per script

Hangul
ValueCountFrequency (%)
1043
 
3.5%
1039
 
3.5%
878
 
3.0%
862
 
2.9%
793
 
2.7%
693
 
2.4%
667
 
2.3%
645
 
2.2%
645
 
2.2%
544
 
1.8%
Other values (465) 21657
73.5%
Latin
ValueCountFrequency (%)
P 40
 
10.6%
L 37
 
9.8%
o 31
 
8.2%
G 27
 
7.2%
e 22
 
5.8%
S 21
 
5.6%
l 17
 
4.5%
p 17
 
4.5%
h 17
 
4.5%
c 14
 
3.7%
Other values (28) 134
35.5%
Common
ValueCountFrequency (%)
6088
73.0%
( 520
 
6.2%
) 520
 
6.2%
1 275
 
3.3%
2 267
 
3.2%
0 234
 
2.8%
7 94
 
1.1%
8 74
 
0.9%
, 69
 
0.8%
9 40
 
0.5%
Other values (12) 157
 
1.9%

Most occurring blocks

ValueCountFrequency (%)
Hangul 29461
77.2%
ASCII 8677
 
22.7%
None 38
 
0.1%
Compat Jamo 5
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
6088
70.2%
( 520
 
6.0%
) 520
 
6.0%
1 275
 
3.2%
2 267
 
3.1%
0 234
 
2.7%
7 94
 
1.1%
8 74
 
0.9%
, 69
 
0.8%
P 40
 
0.5%
Other values (49) 496
 
5.7%
Hangul
ValueCountFrequency (%)
1043
 
3.5%
1039
 
3.5%
878
 
3.0%
862
 
2.9%
793
 
2.7%
693
 
2.4%
667
 
2.3%
645
 
2.2%
645
 
2.2%
544
 
1.8%
Other values (464) 21652
73.5%
None
ValueCountFrequency (%)
· 38
100.0%
Compat Jamo
ValueCountFrequency (%)
5
100.0%
Distinct1472
Distinct (%)72.1%
Missing0
Missing (%)0.0%
Memory size16.1 KiB
2023-12-13T01:28:14.051312image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length199
Median length116
Mean length29.836435
Min length2

Characters and Unicode

Total characters60926
Distinct characters671
Distinct categories10 ?
Distinct scripts4 ?
Distinct blocks7 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1316 ?
Unique (%)64.4%

Sample

1st row청소봉사 11회
2nd row꽃동네사랑의연수원(부랑인요양원, 심신장애인요양원)
3rd row설맞이 음성·진천지역 소년소녀가장 등 초청 격려금 및 생필품 전달
4th row설맞이 지역경제 활성화를 위한 농특산물 직거래 장터 운영(음성군 합동)
5th row5월 가정의달 맞이 지역 경로당 방문 및 발전기금 전달
ValueCountFrequency (%)
617
 
4.9%
가스안전교육 250
 
2.0%
실시 228
 
1.8%
189
 
1.5%
대상 169
 
1.3%
전달 167
 
1.3%
가스시설 149
 
1.2%
가스안전 133
 
1.0%
찾아가는 133
 
1.0%
연계 108
 
0.9%
Other values (3740) 10527
83.1%
2023-12-13T01:28:14.669588image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
10818
 
17.8%
1526
 
2.5%
1423
 
2.3%
1267
 
2.1%
1173
 
1.9%
1101
 
1.8%
1090
 
1.8%
888
 
1.5%
854
 
1.4%
792
 
1.3%
Other values (661) 39994
65.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 44207
72.6%
Space Separator 10818
 
17.8%
Decimal Number 2504
 
4.1%
Other Punctuation 1347
 
2.2%
Open Punctuation 776
 
1.3%
Close Punctuation 775
 
1.3%
Uppercase Letter 353
 
0.6%
Lowercase Letter 121
 
0.2%
Math Symbol 18
 
< 0.1%
Connector Punctuation 7
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
1526
 
3.5%
1423
 
3.2%
1267
 
2.9%
1173
 
2.7%
1101
 
2.5%
1090
 
2.5%
888
 
2.0%
854
 
1.9%
792
 
1.8%
676
 
1.5%
Other values (585) 33417
75.6%
Uppercase Letter
ValueCountFrequency (%)
P 54
15.3%
L 53
15.0%
O 47
13.3%
U 41
11.6%
M 40
11.3%
G 29
8.2%
S 21
 
5.9%
V 14
 
4.0%
C 12
 
3.4%
K 6
 
1.7%
Other values (11) 36
10.2%
Lowercase Letter
ValueCountFrequency (%)
o 28
23.1%
l 19
15.7%
c 14
11.6%
h 13
10.7%
g 12
9.9%
p 7
 
5.8%
k 6
 
5.0%
t 3
 
2.5%
a 3
 
2.5%
e 3
 
2.5%
Other values (10) 13
10.7%
Other Punctuation
ValueCountFrequency (%)
, 661
49.1%
· 306
22.7%
. 127
 
9.4%
: 101
 
7.5%
/ 45
 
3.3%
* 35
 
2.6%
" 30
 
2.2%
' 23
 
1.7%
\ 8
 
0.6%
4
 
0.3%
Other values (4) 7
 
0.5%
Decimal Number
ValueCountFrequency (%)
0 780
31.2%
1 439
17.5%
2 352
14.1%
5 205
 
8.2%
3 196
 
7.8%
4 150
 
6.0%
8 107
 
4.3%
7 107
 
4.3%
9 96
 
3.8%
6 72
 
2.9%
Math Symbol
ValueCountFrequency (%)
~ 9
50.0%
+ 5
27.8%
> 3
 
16.7%
1
 
5.6%
Open Punctuation
ValueCountFrequency (%)
( 774
99.7%
{ 1
 
0.1%
[ 1
 
0.1%
Close Punctuation
ValueCountFrequency (%)
) 774
99.9%
] 1
 
0.1%
Space Separator
ValueCountFrequency (%)
10818
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 7
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 44206
72.6%
Common 16245
 
26.7%
Latin 474
 
0.8%
Han 1
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
1526
 
3.5%
1423
 
3.2%
1267
 
2.9%
1173
 
2.7%
1101
 
2.5%
1090
 
2.5%
888
 
2.0%
854
 
1.9%
792
 
1.8%
676
 
1.5%
Other values (584) 33416
75.6%
Latin
ValueCountFrequency (%)
P 54
11.4%
L 53
11.2%
O 47
 
9.9%
U 41
 
8.6%
M 40
 
8.4%
G 29
 
6.1%
o 28
 
5.9%
S 21
 
4.4%
l 19
 
4.0%
c 14
 
3.0%
Other values (31) 128
27.0%
Common
ValueCountFrequency (%)
10818
66.6%
0 780
 
4.8%
) 774
 
4.8%
( 774
 
4.8%
, 661
 
4.1%
1 439
 
2.7%
2 352
 
2.2%
· 306
 
1.9%
5 205
 
1.3%
3 196
 
1.2%
Other values (25) 940
 
5.8%
Han
ValueCountFrequency (%)
1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 44186
72.5%
ASCII 16408
 
26.9%
None 306
 
0.5%
Compat Jamo 20
 
< 0.1%
Punctuation 4
 
< 0.1%
Math Operators 1
 
< 0.1%
CJK 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
10818
65.9%
0 780
 
4.8%
) 774
 
4.7%
( 774
 
4.7%
, 661
 
4.0%
1 439
 
2.7%
2 352
 
2.1%
5 205
 
1.2%
3 196
 
1.2%
4 150
 
0.9%
Other values (63) 1259
 
7.7%
Hangul
ValueCountFrequency (%)
1526
 
3.5%
1423
 
3.2%
1267
 
2.9%
1173
 
2.7%
1101
 
2.5%
1090
 
2.5%
888
 
2.0%
854
 
1.9%
792
 
1.8%
676
 
1.5%
Other values (581) 33396
75.6%
None
ValueCountFrequency (%)
· 306
100.0%
Compat Jamo
ValueCountFrequency (%)
15
75.0%
4
 
20.0%
1
 
5.0%
Punctuation
ValueCountFrequency (%)
4
100.0%
Math Operators
ValueCountFrequency (%)
1
100.0%
CJK
ValueCountFrequency (%)
1
100.0%

Correlations

2023-12-13T01:28:14.777107image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
기관연도구분
기관1.0000.1600.249
연도0.1601.0000.027
구분0.2490.0271.000
2023-12-13T01:28:14.891918image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분기관연도
구분1.0000.4060.032
기관0.4061.0000.121
연도0.0320.1211.000
2023-12-13T01:28:15.010990image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
기관연도구분
기관1.0000.1210.406
연도0.1211.0000.032
구분0.4060.0321.000

Missing values

2023-12-13T01:28:11.952613image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T01:28:12.035217image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

기관연도구분활동명활동내역
0한국소비자원2017정기새빛맹인선교회청소봉사 11회
1한국소비자원2017수시신입직원 사랑의 봉사활동꽃동네사랑의연수원(부랑인요양원, 심신장애인요양원)
2한국소비자원2017수시설맞이 음성·진천지역 소년소녀가장 등 초청 격려금 및 생필품 전달설맞이 음성·진천지역 소년소녀가장 등 초청 격려금 및 생필품 전달
3한국소비자원2017수시설맞이 지역경제 활성화를 위한 농특산물 직거래 장터 운영(음성군 합동)설맞이 지역경제 활성화를 위한 농특산물 직거래 장터 운영(음성군 합동)
4한국소비자원2017수시5월 가정의달 맞이 지역 경로당 방문 및 발전기금 전달5월 가정의달 맞이 지역 경로당 방문 및 발전기금 전달
5한국소비자원2017수시갑산체리마을 체리축제 행사 지원어린이 티셔츠(핸드페인팅) 만들기 등
6한국소비자원2017수시보은노인장애인복지관 방문 및 발전기금 전달보은노인장애인복지관 방문 및 발전기금 전달
7한국소비자원2017수시장애인 생산 수제화 판매 진행바오로장애인직업재활원
8한국소비자원2017수시청주 수해지역 긴급 복구 지원흥덕구 복대1동 및 복대2동 일대
9한국소비자원2017수시충청북도혈액원 요청 사랑의 헌혈 참여충청북도혈액원 요청 사랑의 헌혈 참여
기관연도구분활동명활동내역
2032한국가스안전공사2021수시추석명절 맞이 사회복지시설 사회공헌활동온누리상품권 50만원 기부 및 가스시설 무료점검
2033한국가스안전공사2021수시가스안전마을(하가리마을) 사회공헌활동더럭분교 숙소동 20세대 타이머콕 설치
2034한국가스안전공사2021수시유관기관 연계 사회공헌활동(대정읍)·쌀(농산물) 사회복지관 후원 및 시설점검, 개선·제주지역본부·5551(2021.12.13., 유관기관 연계 사회공헌활동 결과 보고)
2035한국가스안전공사2021수시2021년 연말연시 지역 소외계층 지원기부금전달
2036한국가스안전공사2021수시달년 설명절 맞이 소외계층 쌀 전달영월군 쌀 구입(15포)후 영월군 면사무소 복지팀 전달
2037한국가스안전공사2021수시2021년 추석맞이 소외계층 사랑의 쌀 나눔 실시에안센터 소재지 주천면 소외계층을 위해 물품지급(물품배부는 주천면사무소 복지계에서 실시)
2038한국가스안전공사2021수시2021년 연말맞이 사회공헌활동 실시관내 소외계층 대상 생필품 전달
2039한국가스안전공사2021수시충주시 사라의 집 사회공헌활동보호시설 운영 간 애로사항 청취, 추후 가스안전 및 사회공헌 활동 협의, 후원물품(금품) 전달 등
2040한국가스안전공사2021수시가스안전선행 특산물 구입 및 기부가스안전선행 업무협약체결 농촌마을인 도담행복마을 특산물 구입 후 취약계층인 노인들을 위해 단양노인전문요양원에 물품 기부
2041한국가스안전공사2021수시취약계층 겨울나기 지원(노인복지관 2곳)노인복지관에 생필품 꾸러미 200개 전달 생필품꾸러미 구성품: 김치 5kg(2만원), 쌀2.8kg(1만원), 참기름320ml(1만원), 김세트(1만원)

Duplicate rows

Most frequently occurring

기관연도구분활동명활동내역# duplicates
29한국가스안전공사2017수시생활 속 가스안전교육(민방위대원)생활 속 가스안전교육(민방위대원)33
1한국가스안전공사2017수시2017년 여름철 (우기)대비 특별점검(사회복지)대구경북 지자체 점검요청31
28한국가스안전공사2017수시산업단지 내 가스시설 무료안전진단한국산업단지공단과 MOU체결을 통한 후속조치로 외국인 투자,거주지역 산업단지 내 가스시설 무료안전진단 실시29
55한국가스안전공사2018수시2018년 동절기(겨울철)특별점검(지자체 등)2018년 동절기(겨울철)특별점검(지자체 등)· 대구경북 지자체 점검요청26
74한국가스안전공사2018수시유치원 순회교육관내 공립유치원 대상 찾아가는 가스안전교육26
0한국가스안전공사2017수시2017년 동절기(겨울철)특별점검(지자체 등)대구경북 지자체 점검요청25
62한국가스안전공사2018수시독거노인 대상 도시락 배달 등도시락 배달 및 시설점검, 안전교육 등22
67한국가스안전공사2018수시소외계층 무료 도시락 배달안동시종합사회복지관 연계21
5한국가스안전공사2017수시가스안전교육가스안전교육15
37한국가스안전공사2017수시유치원 가스안전교육유치원 가스안전교육12