Overview

Dataset statistics

Number of variables9
Number of observations4607
Missing cells0
Missing cells (%)0.0%
Duplicate rows65
Duplicate rows (%)1.4%
Total size in memory324.1 KiB
Average record size in memory72.0 B

Variable types

Categorical8
DateTime1

Dataset

Description2017년~2023년 10월 5일 기준 연안사고 이력에 관한 데이터로 지방청,해경서,발생일자,발생요일,사고유형_세분류,장소유형,발생지역,사고원인1차,위험구역지정 등의 항목을 제공합니다.
Author해양경찰청
URLhttps://www.data.go.kr/data/15088402/fileData.do

Alerts

Dataset has 65 (1.4%) duplicate rowsDuplicates
지방청 is highly overall correlated with 해경서 and 1 other fieldsHigh correlation
해경서 is highly overall correlated with 지방청 and 1 other fieldsHigh correlation
발생지역 is highly overall correlated with 지방청 and 1 other fieldsHigh correlation
위험구역지정 is highly imbalanced (59.5%)Imbalance

Reproduction

Analysis started2023-12-12 13:41:53.748178
Analysis finished2023-12-12 13:41:54.719017
Duration0.97 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

지방청
Categorical

HIGH CORRELATION 

Distinct5
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
중부 지방청
1480 
남해 지방청
959 
서해 지방청
876 
동해 지방청
702 
제주 지방청
590 

Length

Max length6
Median length6
Mean length6
Min length6

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row서해 지방청
2nd row제주 지방청
3rd row제주 지방청
4th row서해 지방청
5th row제주 지방청

Common Values

ValueCountFrequency (%)
중부 지방청 1480
32.1%
남해 지방청 959
20.8%
서해 지방청 876
19.0%
동해 지방청 702
15.2%
제주 지방청 590
 
12.8%

Length

2023-12-12T22:41:54.782844image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T22:41:54.898844image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
지방청 4607
50.0%
중부 1480
 
16.1%
남해 959
 
10.4%
서해 876
 
9.5%
동해 702
 
7.6%
제주 590
 
6.4%

해경서
Categorical

HIGH CORRELATION 

Distinct20
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
인천
661 
태안
447 
통영
323 
제주
302 
부산
301 
Other values (15)
2573 

Length

Max length3
Median length2
Mean length2.0625136
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row목포
2nd row서귀포
3rd row서귀포
4th row목포
5th row서귀포

Common Values

ValueCountFrequency (%)
인천 661
14.3%
태안 447
 
9.7%
통영 323
 
7.0%
제주 302
 
6.6%
부산 301
 
6.5%
서귀포 288
 
6.3%
목포 258
 
5.6%
여수 240
 
5.2%
속초 234
 
5.1%
동해 217
 
4.7%
Other values (10) 1336
29.0%

Length

2023-12-12T22:41:55.022628image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
인천 661
14.3%
태안 447
 
9.7%
통영 323
 
7.0%
제주 302
 
6.6%
부산 301
 
6.5%
서귀포 288
 
6.3%
목포 258
 
5.6%
여수 240
 
5.2%
속초 234
 
5.1%
동해 217
 
4.7%
Other values (10) 1336
29.0%
Distinct1841
Distinct (%)40.0%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
Minimum2017-01-01 00:00:00
Maximum2023-10-03 00:00:00
2023-12-12T22:41:55.143430image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T22:41:55.272838image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

발생요일
Categorical

Distinct8
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
일요일
1023 
월요일
919 
화요일
564 
토요일
543 
금요일
517 
Other values (3)
1041 

Length

Max length4
Median length3
Mean length3.0175819
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row월요일
2nd row월요일
3rd row월요일
4th row월요일
5th row수요일

Common Values

ValueCountFrequency (%)
일요일 1023
22.2%
월요일 919
19.9%
화요일 564
12.2%
토요일 543
11.8%
금요일 517
11.2%
수요일 497
10.8%
목요일 463
10.0%
<NA> 81
 
1.8%

Length

2023-12-12T22:41:55.426773image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T22:41:55.566002image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
일요일 1023
22.2%
월요일 919
19.9%
화요일 564
12.2%
토요일 543
11.8%
금요일 517
11.2%
수요일 497
10.8%
목요일 463
10.0%
na 81
 
1.8%
Distinct12
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
고립
1244 
추락익수
1123 
기타익수
669 
추락
468 
수상레저익수
352 
Other values (7)
751 

Length

Max length6
Median length4
Mean length3.3045366
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row추락익수
2nd row고립
3rd row고립
4th row고립
5th row고립

Common Values

ValueCountFrequency (%)
고립 1244
27.0%
추락익수 1123
24.4%
기타익수 669
14.5%
추락 468
 
10.2%
수상레저익수 352
 
7.6%
표류 258
 
5.6%
기타 177
 
3.8%
수중레저익수 144
 
3.1%
고립익수 122
 
2.6%
수중산업익수 43
 
0.9%
Other values (2) 7
 
0.2%

Length

2023-12-12T22:41:55.717809image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
고립 1244
27.0%
추락익수 1123
24.4%
기타익수 669
14.5%
추락 468
 
10.2%
수상레저익수 352
 
7.6%
표류 258
 
5.6%
기타 177
 
3.8%
수중레저익수 144
 
3.1%
고립익수 122
 
2.6%
수중산업익수 43
 
0.9%
Other values (2) 7
 
0.2%

장소유형
Categorical

Distinct10
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
해안가
1059 
항포구
947 
갯바위
874 
해양
389 
갯벌
371 
Other values (5)
967 

Length

Max length5
Median length3
Mean length3.0290862
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row항포구
2nd row갯바위
3rd row갯바위
4th row무인도서
5th row갯바위

Common Values

ValueCountFrequency (%)
해안가 1059
23.0%
항포구 947
20.6%
갯바위 874
19.0%
해양 389
 
8.4%
갯벌 371
 
8.1%
테트라포드 269
 
5.8%
해수욕장 243
 
5.3%
방파제 242
 
5.3%
무인도서 163
 
3.5%
기타 50
 
1.1%

Length

2023-12-12T22:41:55.885099image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T22:41:56.037081image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
해안가 1059
23.0%
항포구 947
20.6%
갯바위 874
19.0%
해양 389
 
8.4%
갯벌 371
 
8.1%
테트라포드 269
 
5.8%
해수욕장 243
 
5.3%
방파제 242
 
5.3%
무인도서 163
 
3.5%
기타 50
 
1.1%

발생지역
Categorical

HIGH CORRELATION 

Distinct49
Distinct (%)1.1%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
충청남도
662 
전라남도
613 
인천광역시
581 
제주특별자치도
551 
경상남도
425 
Other values (44)
1775 

Length

Max length7
Median length6
Mean length4.4354244
Min length2

Unique

Unique21 ?
Unique (%)0.5%

Sample

1st row전라남도
2nd row제주특별자치도
3rd row제주특별자치도
4th row전라남도
5th row제주특별자치도

Common Values

ValueCountFrequency (%)
충청남도 662
14.4%
전라남도 613
13.3%
인천광역시 581
12.6%
제주특별자치도 551
12.0%
경상남도 425
9.2%
강원도 358
7.8%
부산광역시 348
7.6%
경상북도 268
5.8%
전라북도 232
 
5.0%
울산광역시 117
 
2.5%
Other values (39) 452
9.8%

Length

2023-12-12T22:41:56.210883image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
충청남도 662
14.4%
전라남도 613
13.3%
인천광역시 581
12.6%
제주특별자치도 551
12.0%
경상남도 425
9.2%
강원도 359
7.8%
부산광역시 348
7.6%
경상북도 268
5.8%
전라북도 232
 
5.0%
울산광역시 117
 
2.5%
Other values (38) 451
9.8%

사고원인1차
Categorical

Distinct13
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
부주의
2441 
조석 미인지
639 
음주
588 
운전 부주의
 
192
수영미숙
 
186
Other values (8)
561 

Length

Max length6
Median length3
Mean length3.519644
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row부주의
2nd row부주의
3rd row부주의
4th row안전미준수
5th row부주의

Common Values

ValueCountFrequency (%)
부주의 2441
53.0%
조석 미인지 639
 
13.9%
음주 588
 
12.8%
운전 부주의 192
 
4.2%
수영미숙 186
 
4.0%
낚시 186
 
4.0%
안전미준수 169
 
3.7%
기상불량 139
 
3.0%
질병 39
 
0.8%
타인부주의 14
 
0.3%
Other values (3) 14
 
0.3%

Length

2023-12-12T22:41:56.375633image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
부주의 2633
48.4%
조석 639
 
11.8%
미인지 639
 
11.8%
음주 588
 
10.8%
운전 192
 
3.5%
수영미숙 186
 
3.4%
낚시 186
 
3.4%
안전미준수 169
 
3.1%
기상불량 139
 
2.6%
질병 39
 
0.7%
Other values (4) 28
 
0.5%

위험구역지정
Categorical

IMBALANCE 

Distinct8
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size36.1 KiB
없음
3469 
연안사고 다발구역
406 
연안사고 위험구역
389 
사망사고 발생구역
 
333
<NA>
 
6
Other values (3)
 
4

Length

Max length9
Median length2
Mean length3.7171695
Min length1

Unique

Unique2 ?
Unique (%)< 0.1%

Sample

1st row없음
2nd row없음
3rd row없음
4th row없음
5th row없음

Common Values

ValueCountFrequency (%)
없음 3469
75.3%
연안사고 다발구역 406
 
8.8%
연안사고 위험구역 389
 
8.4%
사망사고 발생구역 333
 
7.2%
<NA> 6
 
0.1%
적용 2
 
< 0.1%
N 1
 
< 0.1%
출입통제구역 1
 
< 0.1%

Length

2023-12-12T22:41:56.538049image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T22:41:56.682850image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
없음 3469
60.5%
연안사고 795
 
13.9%
다발구역 406
 
7.1%
위험구역 389
 
6.8%
사망사고 333
 
5.8%
발생구역 333
 
5.8%
na 6
 
0.1%
적용 2
 
< 0.1%
n 1
 
< 0.1%
출입통제구역 1
 
< 0.1%

Correlations

2023-12-12T22:41:56.803286image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
지방청해경서발생요일사고유형_세분류장소유형발생지역사고원인1차위험구역지정
지방청1.0001.0000.0690.5190.5611.0000.3850.156
해경서1.0001.0000.1090.5330.5520.9680.4190.287
발생요일0.0690.1091.0000.1020.0940.1310.0780.027
사고유형_세분류0.5190.5330.1021.0000.7040.5670.5220.130
장소유형0.5610.5520.0940.7041.0000.5230.4670.142
발생지역1.0000.9680.1310.5670.5231.0000.4470.260
사고원인1차0.3850.4190.0780.5220.4670.4471.0000.084
위험구역지정0.1560.2870.0270.1300.1420.2600.0841.000
2023-12-12T22:41:56.961409image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
지방청사고유형_세분류해경서위험구역지정사고원인1차장소유형발생지역발생요일
지방청1.0000.3180.9980.1000.2200.2660.9940.044
사고유형_세분류0.3181.0000.2240.0640.2390.3940.2200.050
해경서0.9980.2241.0000.1280.1540.2050.6740.047
위험구역지정0.1000.0640.1281.0000.0390.0720.1000.016
사고원인1차0.2200.2390.1540.0391.0000.2140.1490.036
장소유형0.2660.3940.2050.0720.2141.0000.2040.047
발생지역0.9940.2200.6740.1000.1490.2041.0000.052
발생요일0.0440.0500.0470.0160.0360.0470.0521.000
2023-12-12T22:41:57.114888image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
지방청해경서발생요일사고유형_세분류장소유형발생지역사고원인1차위험구역지정
지방청1.0000.9980.0440.3180.2660.9940.2200.100
해경서0.9981.0000.0470.2240.2050.6740.1540.128
발생요일0.0440.0471.0000.0500.0470.0520.0360.016
사고유형_세분류0.3180.2240.0501.0000.3940.2200.2390.064
장소유형0.2660.2050.0470.3941.0000.2040.2140.072
발생지역0.9940.6740.0520.2200.2041.0000.1490.100
사고원인1차0.2200.1540.0360.2390.2140.1491.0000.039
위험구역지정0.1000.1280.0160.0640.0720.1000.0391.000

Missing values

2023-12-12T22:41:54.508128image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T22:41:54.661885image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

지방청해경서발생일자발생요일사고유형_세분류장소유형발생지역사고원인1차위험구역지정
0서해 지방청목포2017-01-01월요일추락익수항포구전라남도부주의없음
1제주 지방청서귀포2017-01-01월요일고립갯바위제주특별자치도부주의없음
2제주 지방청서귀포2017-01-01월요일고립갯바위제주특별자치도부주의없음
3서해 지방청목포2017-01-01월요일고립무인도서전라남도안전미준수없음
4제주 지방청서귀포2017-01-03수요일고립갯바위제주특별자치도부주의없음
5서해 지방청완도2017-01-04목요일추락익수항포구전라남도부주의없음
6제주 지방청서귀포2017-01-04목요일기타해안가제주특별자치도안전미준수없음
7제주 지방청서귀포2017-01-05금요일고립갯바위제주특별자치도부주의없음
8제주 지방청서귀포2017-01-06토요일고립갯바위제주특별자치도부주의없음
9중부 지방청인천2017-01-06토요일추락익수해양인천광역시음주없음
지방청해경서발생일자발생요일사고유형_세분류장소유형발생지역사고원인1차위험구역지정
4597동해 지방청동해2023-10-01<NA>추락테트라포드강원특별자치도안전미준수사망사고 발생구역
4598중부 지방청인천2023-10-01<NA>고립해안가인천광역시부주의연안사고 다발구역
4599남해 지방청사천2023-10-01일요일추락익수해양경상남도부주의없음
4600중부 지방청인천2023-10-02<NA>기타해안가인천광역시조석 미인지연안사고 다발구역
4601중부 지방청인천2023-10-02<NA>고립갯벌인천광역시조석 미인지사망사고 발생구역
4602중부 지방청인천2023-10-02월요일고립갯벌인천광역시조석 미인지없음
4603중부 지방청인천2023-10-02월요일기타해안가경기도부주의없음
4604중부 지방청인천2023-10-02월요일고립해안가인천광역시조석 미인지사망사고 발생구역
4605서해 지방청목포2023-10-03<NA>고립갯바위전라남도조석 미인지없음
4606서해 지방청여수2023-10-03화요일추락익수방파제전라남도부주의없음

Duplicate rows

Most frequently occurring

지방청해경서발생일자발생요일사고유형_세분류장소유형발생지역사고원인1차위험구역지정# duplicates
15동해 지방청속초2023-07-01일요일표류해안가강원특별자치도부주의없음5
4남해 지방청창원2018-07-21일요일수상레저익수해수욕장경상남도수영미숙없음4
14동해 지방청속초2023-06-24일요일표류해안가강원특별자치도부주의없음3
28제주 지방청제주2018-06-15토요일수상레저익수해안가제주특별자치도부주의없음3
29제주 지방청제주2022-06-18일요일표류해양제주특별자치도부주의연안사고 다발구역3
30제주 지방청제주2022-06-26월요일표류해양제주특별자치도부주의없음3
0남해 지방청부산2018-04-04목요일추락익수항포구부산광역시운전 부주의없음2
1남해 지방청부산2021-05-06금요일추락익수항포구부산시부주의없음2
2남해 지방청부산2022-04-27목요일수상레저익수해양부산광역시기상불량사망사고 발생구역2
3남해 지방청울산2019-09-09화요일추락익수테트라포드부산광역시부주의없음2