Overview

Dataset statistics

Number of variables8
Number of observations10000
Missing cells0
Missing cells (%)0.0%
Duplicate rows1527
Duplicate rows (%)15.3%
Total size in memory712.9 KiB
Average record size in memory73.0 B

Variable types

Categorical8

Dataset

Description근로복지공단의 산재보상 승인자료를 활용하여 발생 연도가 아닌 "승인 연도 기준"으로 산출한 "2022년 사고재해자 개별자료"임. 동 자료에는 전체 재해자 중 질병 재해자를 제외한 사고재해자를 기준으로 작성한 것임
Author공공데이터포털
URLhttps://www.data.go.kr/data/15117558/fileData.do

Alerts

연도 has constant value ""Constant
Dataset has 1527 (15.3%) duplicate rowsDuplicates
재해자구분 is highly imbalanced (92.5%)Imbalance

Reproduction

Analysis started2024-04-18 05:21:12.565854
Analysis finished2024-04-18 05:21:15.197069
Duration2.63 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연도
Categorical

CONSTANT 

Distinct1
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2022
10000 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2022
2nd row2022
3rd row2022
4th row2022
5th row2022

Common Values

ValueCountFrequency (%)
2022 10000
100.0%

Length

2024-04-18T14:21:15.256098image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-18T14:21:15.349506image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2022 10000
100.0%

성별
Categorical

Distinct2
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
7478 
2522 

Length

Max length1
Median length1
Mean length1
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row
2nd row
3rd row
4th row
5th row

Common Values

ValueCountFrequency (%)
7478
74.8%
2522
 
25.2%

Length

2024-04-18T14:21:15.450514image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-18T14:21:15.574117image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
7478
74.8%
2522
 
25.2%

연령대
Categorical

Distinct6
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
60대 이상
3021 
50대
2762 
40대
1794 
30대
1373 
20대
1024 

Length

Max length6
Median length3
Mean length3.9063
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row20대
2nd row30대
3rd row50대
4th row40대
5th row50대

Common Values

ValueCountFrequency (%)
60대 이상 3021
30.2%
50대 2762
27.6%
40대 1794
17.9%
30대 1373
13.7%
20대 1024
 
10.2%
10대 26
 
0.3%

Length

2024-04-18T14:21:15.677681image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-18T14:21:15.785047image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
60대 3021
23.2%
이상 3021
23.2%
50대 2762
21.2%
40대 1794
13.8%
30대 1373
10.5%
20대 1024
 
7.9%
10대 26
 
0.2%

근속기간
Categorical

Distinct8
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
6개월 미만
5383 
6개월~1년
1164 
1년~2년
1005 
5년~10년
657 
10년 이상
597 
Other values (3)
1194 

Length

Max length6
Median length6
Mean length5.7801
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row6개월 미만
2nd row6개월 미만
3rd row6개월 미만
4th row6개월~1년
5th row6개월~1년

Common Values

ValueCountFrequency (%)
6개월 미만 5383
53.8%
6개월~1년 1164
 
11.6%
1년~2년 1005
 
10.1%
5년~10년 657
 
6.6%
10년 이상 597
 
6.0%
2년~3년 513
 
5.1%
3년~4년 406
 
4.1%
4년~5년 275
 
2.8%

Length

2024-04-18T14:21:15.898806image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-18T14:21:16.008541image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
6개월 5383
33.7%
미만 5383
33.7%
6개월~1년 1164
 
7.3%
1년~2년 1005
 
6.3%
5년~10년 657
 
4.1%
10년 597
 
3.7%
이상 597
 
3.7%
2년~3년 513
 
3.2%
3년~4년 406
 
2.5%
4년~5년 275
 
1.7%

대업종
Categorical

Distinct10
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
기타의사업
3939 
건설업
2552 
제조업
2147 
운수·창고·통신업
1130 
임 업
 
88
Other values (5)
 
144

Length

Max length13
Median length9
Mean length4.5072
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row기타의사업
2nd row운수·창고·통신업
3rd row건설업
4th row운수·창고·통신업
5th row기타의사업

Common Values

ValueCountFrequency (%)
기타의사업 3939
39.4%
건설업 2552
25.5%
제조업 2147
21.5%
운수·창고·통신업 1130
 
11.3%
임 업 88
 
0.9%
농 업 67
 
0.7%
금융및보험업 46
 
0.5%
광 업 16
 
0.2%
전기·가스·증기·수도사업 10
 
0.1%
어 업 5
 
0.1%

Length

2024-04-18T14:21:16.135684image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-18T14:21:16.252782image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
기타의사업 3939
38.7%
건설업 2552
25.1%
제조업 2147
21.1%
운수·창고·통신업 1130
 
11.1%
176
 
1.7%
88
 
0.9%
67
 
0.7%
금융및보험업 46
 
0.5%
16
 
0.2%
전기·가스·증기·수도사업 10
 
0.1%

사업장규모
Categorical

Distinct10
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
5인 미만
3282 
10인~19인
1358 
5인~9인
1286 
100인~299인
879 
30인~49인
796 
Other values (5)
2399 

Length

Max length9
Median length7
Mean length6.4532
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row5인 미만
2nd row20인~29인
3rd row100인~299인
4th row5인 미만
5th row5인 미만

Common Values

ValueCountFrequency (%)
5인 미만 3282
32.8%
10인~19인 1358
13.6%
5인~9인 1286
 
12.9%
100인~299인 879
 
8.8%
30인~49인 796
 
8.0%
20인~29인 722
 
7.2%
50인~99인 722
 
7.2%
1,000인 이상 566
 
5.7%
300인~499인 236
 
2.4%
500인~999인 153
 
1.5%

Length

2024-04-18T14:21:16.397840image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-18T14:21:16.519228image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
5인 3282
23.7%
미만 3282
23.7%
10인~19인 1358
9.8%
5인~9인 1286
 
9.3%
100인~299인 879
 
6.3%
30인~49인 796
 
5.7%
20인~29인 722
 
5.2%
50인~99인 722
 
5.2%
1,000인 566
 
4.1%
이상 566
 
4.1%
Other values (2) 389
 
2.8%

재해자구분
Categorical

IMBALANCE 

Distinct2
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
사고부상자
9908 
사고사망자
 
92

Length

Max length5
Median length5
Mean length5
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row사고부상자
2nd row사고부상자
3rd row사고부상자
4th row사고부상자
5th row사고부상자

Common Values

ValueCountFrequency (%)
사고부상자 9908
99.1%
사고사망자 92
 
0.9%

Length

2024-04-18T14:21:16.665092image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-18T14:21:16.776557image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
사고부상자 9908
99.1%
사고사망자 92
 
0.9%

재해유형
Categorical

Distinct21
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
넘어짐
2313 
떨어짐
1306 
끼임
1245 
절단베임찔림
932 
부딪힘
924 
Other values (16)
3280 

Length

Max length9
Median length8
Mean length4.1758
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row절단베임찔림
2nd row사업장외교통사고
3rd row부딪힘
4th row사업장외교통사고
5th row깔림뒤집힘

Common Values

ValueCountFrequency (%)
넘어짐 2313
23.1%
떨어짐 1306
13.1%
끼임 1245
12.4%
절단베임찔림 932
9.3%
부딪힘 924
 
9.2%
사업장외교통사고 779
 
7.8%
맞음 758
 
7.6%
불균형및무리한동작 687
 
6.9%
이상온도물체접촉 403
 
4.0%
깔림뒤집힘 275
 
2.8%
Other values (11) 378
 
3.8%

Length

2024-04-18T14:21:16.879164image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
넘어짐 2313
23.1%
떨어짐 1306
13.1%
끼임 1245
12.4%
절단베임찔림 932
9.3%
부딪힘 924
 
9.2%
사업장외교통사고 779
 
7.8%
맞음 758
 
7.6%
불균형및무리한동작 687
 
6.9%
이상온도물체접촉 403
 
4.0%
깔림뒤집힘 275
 
2.8%
Other values (11) 378
 
3.8%

Correlations

2024-04-18T14:21:16.959228image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
성별연령대근속기간대업종사업장규모재해자구분재해유형
성별1.0000.1610.2290.6150.1790.0810.404
연령대0.1611.0000.1610.2610.1650.0710.309
근속기간0.2290.1611.0000.3850.2240.0190.199
대업종0.6150.2610.3851.0000.4010.0930.575
사업장규모0.1790.1650.2240.4011.0000.0000.289
재해자구분0.0810.0710.0190.0930.0001.0000.260
재해유형0.4040.3090.1990.5750.2890.2601.000
2024-04-18T14:21:17.074860image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
성별사업장규모재해자구분연령대대업종근속기간재해유형
성별1.0000.1370.0510.1160.4760.1720.355
사업장규모0.1371.0000.0000.0870.1330.1080.111
재해자구분0.0510.0001.0000.0510.0710.0140.228
연령대0.1160.0870.0511.0000.1400.0900.144
대업종0.4760.1330.0710.1401.0000.1950.253
근속기간0.1720.1080.0140.0900.1951.0000.083
재해유형0.3550.1110.2280.1440.2530.0831.000
2024-04-18T14:21:17.271272image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
성별연령대근속기간대업종사업장규모재해자구분재해유형
성별1.0000.1160.1720.4760.1370.0510.355
연령대0.1161.0000.0900.1400.0870.0510.144
근속기간0.1720.0901.0000.1950.1080.0140.083
대업종0.4760.1400.1951.0000.1330.0710.253
사업장규모0.1370.0870.1080.1331.0000.0000.111
재해자구분0.0510.0510.0140.0710.0001.0000.228
재해유형0.3550.1440.0830.2530.1110.2281.000

Missing values

2024-04-18T14:21:15.128462image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연도성별연령대근속기간대업종사업장규모재해자구분재해유형
2161202220대6개월 미만기타의사업5인 미만사고부상자절단베임찔림
10749202230대6개월 미만운수·창고·통신업20인~29인사고부상자사업장외교통사고
96940202250대6개월 미만건설업100인~299인사고부상자부딪힘
15161202240대6개월~1년운수·창고·통신업5인 미만사고부상자사업장외교통사고
57763202250대6개월~1년기타의사업5인 미만사고부상자깔림뒤집힘
21744202240대6개월~1년기타의사업10인~19인사고부상자불균형및무리한동작
41653202250대6개월 미만건설업5인 미만사고부상자절단베임찔림
25635202230대1년~2년기타의사업100인~299인사고부상자넘어짐
18706202260대 이상6개월 미만기타의사업5인~9인사고부상자넘어짐
29762202230대6개월 미만제조업5인 미만사고부상자넘어짐
연도성별연령대근속기간대업종사업장규모재해자구분재해유형
75877202220대6개월 미만기타의사업5인 미만사고부상자사업장외교통사고
13786202260대 이상6개월~1년운수·창고·통신업1,000인 이상사고부상자넘어짐
79729202250대6개월 미만제조업5인~9인사고부상자끼임
45745202240대6개월 미만건설업5인 미만사고부상자넘어짐
44814202250대10년 이상제조업1,000인 이상사고부상자끼임
48971202250대10년 이상제조업1,000인 이상사고부상자끼임
3686202220대6개월~1년건설업30인~49인사고부상자넘어짐
4117202250대6개월 미만건설업5인 미만사고부상자맞음
3517202260대 이상2년~3년기타의사업100인~299인사고부상자넘어짐
98245202250대1년~2년기타의사업50인~99인사고부상자끼임

Duplicate rows

Most frequently occurring

연도성별연령대근속기간대업종사업장규모재해자구분재해유형# duplicates
993202260대 이상6개월 미만건설업5인 미만사고부상자떨어짐140
729202250대6개월 미만건설업5인 미만사고부상자떨어짐108
992202260대 이상6개월 미만건설업5인 미만사고부상자넘어짐59
994202260대 이상6개월 미만건설업5인 미만사고부상자맞음57
1487202260대 이상6개월 미만기타의사업5인 미만사고부상자넘어짐55
998202260대 이상6개월 미만건설업5인 미만사고부상자절단베임찔림51
459202240대6개월 미만건설업5인 미만사고부상자떨어짐44
508202240대6개월 미만운수·창고·통신업1,000인 이상사고부상자사업장외교통사고43
953202260대 이상6개월 미만건설업10인~19인사고부상자떨어짐43
520202240대6개월 미만운수·창고·통신업5인 미만사고부상자사업장외교통사고41