Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1527 |
Duplicate rows (%) | 15.3% |
Total size in memory | 712.9 KiB |
Average record size in memory | 73.0 B |
Variable types
Categorical | 8 |
---|
Dataset
Description | 근로복지공단의 산재보상 승인자료를 활용하여 발생 연도가 아닌 "승인 연도 기준"으로 산출한 "2022년 사고재해자 개별자료"임. 동 자료에는 전체 재해자 중 질병 재해자를 제외한 사고재해자를 기준으로 작성한 것임 |
---|---|
Author | 공공데이터포털 |
URL | https://www.data.go.kr/data/15117558/fileData.do |
연도 has constant value "" | Constant |
Dataset has 1527 (15.3%) duplicate rows | Duplicates |
재해자구분 is highly imbalanced (92.5%) | Imbalance |
Reproduction
Analysis started | 2024-04-18 05:21:12.565854 |
---|---|
Analysis finished | 2024-04-18 05:21:15.197069 |
Duration | 2.63 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2022 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2022 |
---|---|
2nd row | 2022 |
3rd row | 2022 |
4th row | 2022 |
5th row | 2022 |
Common Values
Value | Count | Frequency (%) |
2022 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2022 | 10000 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
남 | |
---|---|
여 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 남 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
남 | 7478 | |
여 | 2522 | 25.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 7478 | |
여 | 2522 | 25.2% |
연령대
Categorical
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
60대 이상 | |
---|---|
50대 | |
40대 | |
30대 | |
20대 |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.9063 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 20대 |
---|---|
2nd row | 30대 |
3rd row | 50대 |
4th row | 40대 |
5th row | 50대 |
Common Values
Value | Count | Frequency (%) |
60대 이상 | 3021 | |
50대 | 2762 | |
40대 | 1794 | |
30대 | 1373 | |
20대 | 1024 | 10.2% |
10대 | 26 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
60대 | 3021 | |
이상 | 3021 | |
50대 | 2762 | |
40대 | 1794 | |
30대 | 1373 | |
20대 | 1024 | 7.9% |
10대 | 26 | 0.2% |
근속기간
Categorical
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
6개월 미만 | |
---|---|
6개월~1년 | |
1년~2년 | |
5년~10년 | |
10년 이상 | |
Other values (3) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.7801 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 6개월 미만 |
---|---|
2nd row | 6개월 미만 |
3rd row | 6개월 미만 |
4th row | 6개월~1년 |
5th row | 6개월~1년 |
Common Values
Value | Count | Frequency (%) |
6개월 미만 | 5383 | |
6개월~1년 | 1164 | 11.6% |
1년~2년 | 1005 | 10.1% |
5년~10년 | 657 | 6.6% |
10년 이상 | 597 | 6.0% |
2년~3년 | 513 | 5.1% |
3년~4년 | 406 | 4.1% |
4년~5년 | 275 | 2.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
6개월 | 5383 | |
미만 | 5383 | |
6개월~1년 | 1164 | 7.3% |
1년~2년 | 1005 | 6.3% |
5년~10년 | 657 | 4.1% |
10년 | 597 | 3.7% |
이상 | 597 | 3.7% |
2년~3년 | 513 | 3.2% |
3년~4년 | 406 | 2.5% |
4년~5년 | 275 | 1.7% |
대업종
Categorical
Distinct | 10 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
기타의사업 | |
---|---|
건설업 | |
제조업 | |
운수·창고·통신업 | |
임 업 | 88 |
Other values (5) | 144 |
Length
Max length | 13 |
---|---|
Median length | 9 |
Mean length | 4.5072 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기타의사업 |
---|---|
2nd row | 운수·창고·통신업 |
3rd row | 건설업 |
4th row | 운수·창고·통신업 |
5th row | 기타의사업 |
Common Values
Value | Count | Frequency (%) |
기타의사업 | 3939 | |
건설업 | 2552 | |
제조업 | 2147 | |
운수·창고·통신업 | 1130 | 11.3% |
임 업 | 88 | 0.9% |
농 업 | 67 | 0.7% |
금융및보험업 | 46 | 0.5% |
광 업 | 16 | 0.2% |
전기·가스·증기·수도사업 | 10 | 0.1% |
어 업 | 5 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
기타의사업 | 3939 | |
건설업 | 2552 | |
제조업 | 2147 | |
운수·창고·통신업 | 1130 | 11.1% |
업 | 176 | 1.7% |
임 | 88 | 0.9% |
농 | 67 | 0.7% |
금융및보험업 | 46 | 0.5% |
광 | 16 | 0.2% |
전기·가스·증기·수도사업 | 10 | 0.1% |
사업장규모
Categorical
Distinct | 10 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
5인 미만 | |
---|---|
10인~19인 | |
5인~9인 | |
100인~299인 | |
30인~49인 | |
Other values (5) |
Length
Max length | 9 |
---|---|
Median length | 7 |
Mean length | 6.4532 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 5인 미만 |
---|---|
2nd row | 20인~29인 |
3rd row | 100인~299인 |
4th row | 5인 미만 |
5th row | 5인 미만 |
Common Values
Value | Count | Frequency (%) |
5인 미만 | 3282 | |
10인~19인 | 1358 | |
5인~9인 | 1286 | 12.9% |
100인~299인 | 879 | 8.8% |
30인~49인 | 796 | 8.0% |
20인~29인 | 722 | 7.2% |
50인~99인 | 722 | 7.2% |
1,000인 이상 | 566 | 5.7% |
300인~499인 | 236 | 2.4% |
500인~999인 | 153 | 1.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
5인 | 3282 | |
미만 | 3282 | |
10인~19인 | 1358 | |
5인~9인 | 1286 | 9.3% |
100인~299인 | 879 | 6.3% |
30인~49인 | 796 | 5.7% |
20인~29인 | 722 | 5.2% |
50인~99인 | 722 | 5.2% |
1,000인 | 566 | 4.1% |
이상 | 566 | 4.1% |
Other values (2) | 389 | 2.8% |
재해자구분
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
사고부상자 | |
---|---|
사고사망자 | 92 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 사고부상자 |
---|---|
2nd row | 사고부상자 |
3rd row | 사고부상자 |
4th row | 사고부상자 |
5th row | 사고부상자 |
Common Values
Value | Count | Frequency (%) |
사고부상자 | 9908 | |
사고사망자 | 92 | 0.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
사고부상자 | 9908 | |
사고사망자 | 92 | 0.9% |
재해유형
Categorical
Distinct | 21 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
넘어짐 | |
---|---|
떨어짐 | |
끼임 | |
절단베임찔림 | |
부딪힘 | |
Other values (16) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 4.1758 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 절단베임찔림 |
---|---|
2nd row | 사업장외교통사고 |
3rd row | 부딪힘 |
4th row | 사업장외교통사고 |
5th row | 깔림뒤집힘 |
Common Values
Value | Count | Frequency (%) |
넘어짐 | 2313 | |
떨어짐 | 1306 | |
끼임 | 1245 | |
절단베임찔림 | 932 | |
부딪힘 | 924 | 9.2% |
사업장외교통사고 | 779 | 7.8% |
맞음 | 758 | 7.6% |
불균형및무리한동작 | 687 | 6.9% |
이상온도물체접촉 | 403 | 4.0% |
깔림뒤집힘 | 275 | 2.8% |
Other values (11) | 378 | 3.8% |
Length
Value | Count | Frequency (%) |
넘어짐 | 2313 | |
떨어짐 | 1306 | |
끼임 | 1245 | |
절단베임찔림 | 932 | |
부딪힘 | 924 | 9.2% |
사업장외교통사고 | 779 | 7.8% |
맞음 | 758 | 7.6% |
불균형및무리한동작 | 687 | 6.9% |
이상온도물체접촉 | 403 | 4.0% |
깔림뒤집힘 | 275 | 2.8% |
Other values (11) | 378 | 3.8% |
성별 | 연령대 | 근속기간 | 대업종 | 사업장규모 | 재해자구분 | 재해유형 | |
---|---|---|---|---|---|---|---|
성별 | 1.000 | 0.161 | 0.229 | 0.615 | 0.179 | 0.081 | 0.404 |
연령대 | 0.161 | 1.000 | 0.161 | 0.261 | 0.165 | 0.071 | 0.309 |
근속기간 | 0.229 | 0.161 | 1.000 | 0.385 | 0.224 | 0.019 | 0.199 |
대업종 | 0.615 | 0.261 | 0.385 | 1.000 | 0.401 | 0.093 | 0.575 |
사업장규모 | 0.179 | 0.165 | 0.224 | 0.401 | 1.000 | 0.000 | 0.289 |
재해자구분 | 0.081 | 0.071 | 0.019 | 0.093 | 0.000 | 1.000 | 0.260 |
재해유형 | 0.404 | 0.309 | 0.199 | 0.575 | 0.289 | 0.260 | 1.000 |
성별 | 사업장규모 | 재해자구분 | 연령대 | 대업종 | 근속기간 | 재해유형 | |
---|---|---|---|---|---|---|---|
성별 | 1.000 | 0.137 | 0.051 | 0.116 | 0.476 | 0.172 | 0.355 |
사업장규모 | 0.137 | 1.000 | 0.000 | 0.087 | 0.133 | 0.108 | 0.111 |
재해자구분 | 0.051 | 0.000 | 1.000 | 0.051 | 0.071 | 0.014 | 0.228 |
연령대 | 0.116 | 0.087 | 0.051 | 1.000 | 0.140 | 0.090 | 0.144 |
대업종 | 0.476 | 0.133 | 0.071 | 0.140 | 1.000 | 0.195 | 0.253 |
근속기간 | 0.172 | 0.108 | 0.014 | 0.090 | 0.195 | 1.000 | 0.083 |
재해유형 | 0.355 | 0.111 | 0.228 | 0.144 | 0.253 | 0.083 | 1.000 |
성별 | 연령대 | 근속기간 | 대업종 | 사업장규모 | 재해자구분 | 재해유형 | |
---|---|---|---|---|---|---|---|
성별 | 1.000 | 0.116 | 0.172 | 0.476 | 0.137 | 0.051 | 0.355 |
연령대 | 0.116 | 1.000 | 0.090 | 0.140 | 0.087 | 0.051 | 0.144 |
근속기간 | 0.172 | 0.090 | 1.000 | 0.195 | 0.108 | 0.014 | 0.083 |
대업종 | 0.476 | 0.140 | 0.195 | 1.000 | 0.133 | 0.071 | 0.253 |
사업장규모 | 0.137 | 0.087 | 0.108 | 0.133 | 1.000 | 0.000 | 0.111 |
재해자구분 | 0.051 | 0.051 | 0.014 | 0.071 | 0.000 | 1.000 | 0.228 |
재해유형 | 0.355 | 0.144 | 0.083 | 0.253 | 0.111 | 0.228 | 1.000 |
연도 | 성별 | 연령대 | 근속기간 | 대업종 | 사업장규모 | 재해자구분 | 재해유형 | |
---|---|---|---|---|---|---|---|---|
2161 | 2022 | 남 | 20대 | 6개월 미만 | 기타의사업 | 5인 미만 | 사고부상자 | 절단베임찔림 |
10749 | 2022 | 남 | 30대 | 6개월 미만 | 운수·창고·통신업 | 20인~29인 | 사고부상자 | 사업장외교통사고 |
96940 | 2022 | 남 | 50대 | 6개월 미만 | 건설업 | 100인~299인 | 사고부상자 | 부딪힘 |
15161 | 2022 | 남 | 40대 | 6개월~1년 | 운수·창고·통신업 | 5인 미만 | 사고부상자 | 사업장외교통사고 |
57763 | 2022 | 남 | 50대 | 6개월~1년 | 기타의사업 | 5인 미만 | 사고부상자 | 깔림뒤집힘 |
21744 | 2022 | 여 | 40대 | 6개월~1년 | 기타의사업 | 10인~19인 | 사고부상자 | 불균형및무리한동작 |
41653 | 2022 | 남 | 50대 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 절단베임찔림 |
25635 | 2022 | 남 | 30대 | 1년~2년 | 기타의사업 | 100인~299인 | 사고부상자 | 넘어짐 |
18706 | 2022 | 여 | 60대 이상 | 6개월 미만 | 기타의사업 | 5인~9인 | 사고부상자 | 넘어짐 |
29762 | 2022 | 남 | 30대 | 6개월 미만 | 제조업 | 5인 미만 | 사고부상자 | 넘어짐 |
연도 | 성별 | 연령대 | 근속기간 | 대업종 | 사업장규모 | 재해자구분 | 재해유형 | |
---|---|---|---|---|---|---|---|---|
75877 | 2022 | 남 | 20대 | 6개월 미만 | 기타의사업 | 5인 미만 | 사고부상자 | 사업장외교통사고 |
13786 | 2022 | 남 | 60대 이상 | 6개월~1년 | 운수·창고·통신업 | 1,000인 이상 | 사고부상자 | 넘어짐 |
79729 | 2022 | 남 | 50대 | 6개월 미만 | 제조업 | 5인~9인 | 사고부상자 | 끼임 |
45745 | 2022 | 남 | 40대 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 넘어짐 |
44814 | 2022 | 남 | 50대 | 10년 이상 | 제조업 | 1,000인 이상 | 사고부상자 | 끼임 |
48971 | 2022 | 남 | 50대 | 10년 이상 | 제조업 | 1,000인 이상 | 사고부상자 | 끼임 |
3686 | 2022 | 남 | 20대 | 6개월~1년 | 건설업 | 30인~49인 | 사고부상자 | 넘어짐 |
4117 | 2022 | 남 | 50대 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 맞음 |
3517 | 2022 | 남 | 60대 이상 | 2년~3년 | 기타의사업 | 100인~299인 | 사고부상자 | 넘어짐 |
98245 | 2022 | 여 | 50대 | 1년~2년 | 기타의사업 | 50인~99인 | 사고부상자 | 끼임 |
Most frequently occurring
연도 | 성별 | 연령대 | 근속기간 | 대업종 | 사업장규모 | 재해자구분 | 재해유형 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
993 | 2022 | 남 | 60대 이상 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 떨어짐 | 140 |
729 | 2022 | 남 | 50대 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 떨어짐 | 108 |
992 | 2022 | 남 | 60대 이상 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 넘어짐 | 59 |
994 | 2022 | 남 | 60대 이상 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 맞음 | 57 |
1487 | 2022 | 여 | 60대 이상 | 6개월 미만 | 기타의사업 | 5인 미만 | 사고부상자 | 넘어짐 | 55 |
998 | 2022 | 남 | 60대 이상 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 절단베임찔림 | 51 |
459 | 2022 | 남 | 40대 | 6개월 미만 | 건설업 | 5인 미만 | 사고부상자 | 떨어짐 | 44 |
508 | 2022 | 남 | 40대 | 6개월 미만 | 운수·창고·통신업 | 1,000인 이상 | 사고부상자 | 사업장외교통사고 | 43 |
953 | 2022 | 남 | 60대 이상 | 6개월 미만 | 건설업 | 10인~19인 | 사고부상자 | 떨어짐 | 43 |
520 | 2022 | 남 | 40대 | 6개월 미만 | 운수·창고·통신업 | 5인 미만 | 사고부상자 | 사업장외교통사고 | 41 |