Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 2741 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 187.5 KiB |
Average record size in memory | 70.0 B |
Variable types
Categorical | 1 |
---|---|
Text | 1 |
Numeric | 6 |
Dataset
Description | - 시군구별, 월별 교통사고 통계 - 경찰에서 조사, 처리한 교통사고에 대한 통계 정보로 인적 피해가 있는 사고만 집계 됨 - 교통사고분석시스템(http://taas.koroad.or.kr)의 데이터를 바탕으로 함 |
---|---|
URL | https://www.data.go.kr/data/15070295/fileData.do |
사고건수 is highly overall correlated with 중상자수 and 2 other fields | High correlation |
중상자수 is highly overall correlated with 사고건수 and 2 other fields | High correlation |
경상자수 is highly overall correlated with 사고건수 and 2 other fields | High correlation |
부상신고자수 is highly overall correlated with 사고건수 and 2 other fields | High correlation |
사망자수 has 1252 (45.7%) zeros | Zeros |
중상자수 has 40 (1.5%) zeros | Zeros |
부상신고자수 has 682 (24.9%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 08:55:56.221831 |
---|---|
Analysis finished | 2023-12-12 08:56:03.335648 |
Duration | 7.11 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 21.5 KiB |
경기 | |
---|---|
서울 | |
경북 | |
전남 | |
강원 | |
Other values (12) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울 |
---|---|
2nd row | 서울 |
3rd row | 서울 |
4th row | 서울 |
5th row | 서울 |
Common Values
Value | Count | Frequency (%) |
경기 | 372 | |
서울 | 300 | |
경북 | 270 | |
전남 | 264 | |
강원 | 216 | |
경남 | 216 | |
부산 | 192 | |
충남 | 180 | |
전북 | 168 | 6.1% |
충북 | 132 | 4.8% |
Other values (7) | 431 |
Length
Value | Count | Frequency (%) |
경기 | 372 | |
서울 | 300 | |
경북 | 270 | |
전남 | 264 | |
강원 | 216 | |
경남 | 216 | |
부산 | 192 | |
충남 | 180 | |
전북 | 168 | 6.1% |
충북 | 132 | 4.8% |
Other values (7) | 431 |
시군구
Text
Distinct | 207 |
---|---|
Distinct (%) | 7.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 21.5 KiB |
Value | Count | Frequency (%) |
중구 | 72 | 2.6% |
동구 | 72 | 2.6% |
서구 | 60 | 2.2% |
북구 | 48 | 1.8% |
남구 | 48 | 1.8% |
강서구 | 24 | 0.9% |
고성군 | 24 | 0.9% |
담양군 | 12 | 0.4% |
보성군 | 12 | 0.4% |
고흥군 | 12 | 0.4% |
Other values (197) | 2357 |
Most occurring characters
Value | Count | Frequency (%) |
군 | 1013 | 12.5% |
시 | 948 | 11.7% |
구 | 888 | 11.0% |
천 | 264 | 3.3% |
주 | 240 | 3.0% |
양 | 216 | 2.7% |
성 | 216 | 2.7% |
동 | 204 | 2.5% |
산 | 192 | 2.4% |
서 | 156 | 1.9% |
Other values (125) | 3754 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8067 | |
Close Punctuation | 12 | 0.1% |
Open Punctuation | 12 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 1013 | 12.6% |
시 | 948 | 11.8% |
구 | 888 | 11.0% |
천 | 264 | 3.3% |
주 | 240 | 3.0% |
양 | 216 | 2.7% |
성 | 216 | 2.7% |
동 | 204 | 2.5% |
산 | 192 | 2.4% |
서 | 156 | 1.9% |
Other values (123) | 3730 |
Close Punctuation
Value | Count | Frequency (%) |
) | 12 |
Open Punctuation
Value | Count | Frequency (%) |
( | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8067 | |
Common | 24 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 1013 | 12.6% |
시 | 948 | 11.8% |
구 | 888 | 11.0% |
천 | 264 | 3.3% |
주 | 240 | 3.0% |
양 | 216 | 2.7% |
성 | 216 | 2.7% |
동 | 204 | 2.5% |
산 | 192 | 2.4% |
서 | 156 | 1.9% |
Other values (123) | 3730 |
Common
Value | Count | Frequency (%) |
) | 12 | |
( | 12 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8067 | |
ASCII | 24 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
군 | 1013 | 12.6% |
시 | 948 | 11.8% |
구 | 888 | 11.0% |
천 | 264 | 3.3% |
주 | 240 | 3.0% |
양 | 216 | 2.7% |
성 | 216 | 2.7% |
동 | 204 | 2.5% |
산 | 192 | 2.4% |
서 | 156 | 1.9% |
Other values (123) | 3730 |
ASCII
Value | Count | Frequency (%) |
) | 12 | |
( | 12 |
발생월
Real number (ℝ)
Distinct | 12 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.5016417 |
Minimum | 1 |
---|---|
Maximum | 12 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 4 |
median | 7 |
Q3 | 9 |
95-th percentile | 12 |
Maximum | 12 |
Range | 11 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 3.4501266 |
---|---|
Coefficient of variation (CV) | 0.53065467 |
Kurtosis | -1.214655 |
Mean | 6.5016417 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.00080494677 |
Sum | 17821 |
Variance | 11.903373 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4 | 229 | |
5 | 229 | |
6 | 229 | |
7 | 229 | |
8 | 229 | |
10 | 229 | |
1 | 228 | |
2 | 228 | |
9 | 228 | |
11 | 228 | |
Other values (2) | 455 |
Value | Count | Frequency (%) |
1 | 228 | |
2 | 228 | |
3 | 227 | |
4 | 229 | |
5 | 229 | |
6 | 229 | |
7 | 229 | |
8 | 229 | |
9 | 228 | |
10 | 229 |
Value | Count | Frequency (%) |
12 | 228 | |
11 | 228 | |
10 | 229 | |
9 | 228 | |
8 | 229 | |
7 | 229 | |
6 | 229 | |
5 | 229 | |
4 | 229 | |
3 | 227 |
사고건수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 313 |
---|---|
Distinct (%) | 11.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 71.811748 |
Minimum | 1 |
---|---|
Maximum | 484 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 6 |
Q1 | 18 |
median | 47 |
Q3 | 97 |
95-th percentile | 232 |
Maximum | 484 |
Range | 483 |
Interquartile range (IQR) | 79 |
Descriptive statistics
Standard deviation | 74.735424 |
---|---|
Coefficient of variation (CV) | 1.0407131 |
Kurtosis | 3.7218739 |
Mean | 71.811748 |
Median Absolute Deviation (MAD) | 34 |
Skewness | 1.8476771 |
Sum | 196836 |
Variance | 5585.3835 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
11 | 62 | 2.3% |
9 | 59 | 2.2% |
10 | 58 | 2.1% |
8 | 53 | 1.9% |
16 | 52 | 1.9% |
12 | 51 | 1.9% |
14 | 50 | 1.8% |
19 | 45 | 1.6% |
15 | 40 | 1.5% |
7 | 38 | 1.4% |
Other values (303) | 2233 |
Value | Count | Frequency (%) |
1 | 15 | 0.5% |
2 | 16 | 0.6% |
3 | 24 | |
4 | 31 | |
5 | 28 | |
6 | 35 | |
7 | 38 | |
8 | 53 | |
9 | 59 | |
10 | 58 |
Value | Count | Frequency (%) |
484 | 1 | |
471 | 1 | |
430 | 1 | |
416 | 1 | |
412 | 1 | |
398 | 1 | |
393 | 1 | |
387 | 1 | |
385 | 1 | |
384 | 2 |
사망자수
Real number (ℝ)
ZEROS
 
Distinct | 12 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.99781102 |
Minimum | 0 |
---|---|
Maximum | 12 |
Zeros | 1252 |
Zeros (%) | 45.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.2 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 1 |
Q3 | 2 |
95-th percentile | 3 |
Maximum | 12 |
Range | 12 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.2869342 |
---|---|
Coefficient of variation (CV) | 1.2897574 |
Kurtosis | 6.6466429 |
Mean | 0.99781102 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 2.0068786 |
Sum | 2735 |
Variance | 1.6561996 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 1252 | |
1 | 792 | |
2 | 392 | 14.3% |
3 | 177 | 6.5% |
4 | 67 | 2.4% |
5 | 30 | 1.1% |
6 | 22 | 0.8% |
8 | 4 | 0.1% |
7 | 2 | 0.1% |
12 | 1 | < 0.1% |
Other values (2) | 2 | 0.1% |
Value | Count | Frequency (%) |
0 | 1252 | |
1 | 792 | |
2 | 392 | 14.3% |
3 | 177 | 6.5% |
4 | 67 | 2.4% |
5 | 30 | 1.1% |
6 | 22 | 0.8% |
7 | 2 | 0.1% |
8 | 4 | 0.1% |
9 | 1 | < 0.1% |
Value | Count | Frequency (%) |
12 | 1 | < 0.1% |
11 | 1 | < 0.1% |
9 | 1 | < 0.1% |
8 | 4 | 0.1% |
7 | 2 | 0.1% |
6 | 22 | 0.8% |
5 | 30 | 1.1% |
4 | 67 | 2.4% |
3 | 177 | |
2 | 392 |
중상자수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 96 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 18.867202 |
Minimum | 0 |
---|---|
Maximum | 113 |
Zeros | 40 |
Zeros (%) | 1.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.2 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 2 |
Q1 | 7 |
median | 14 |
Q3 | 24 |
95-th percentile | 56 |
Maximum | 113 |
Range | 113 |
Interquartile range (IQR) | 17 |
Descriptive statistics
Standard deviation | 17.271635 |
---|---|
Coefficient of variation (CV) | 0.91543171 |
Kurtosis | 3.9880797 |
Mean | 18.867202 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 1.8212301 |
Sum | 51715 |
Variance | 298.30937 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 117 | 4.3% |
4 | 110 | 4.0% |
6 | 109 | 4.0% |
8 | 107 | 3.9% |
5 | 106 | 3.9% |
9 | 99 | 3.6% |
7 | 98 | 3.6% |
11 | 96 | 3.5% |
14 | 95 | 3.5% |
15 | 92 | 3.4% |
Other values (86) | 1712 |
Value | Count | Frequency (%) |
0 | 40 | 1.5% |
1 | 87 | |
2 | 92 | |
3 | 117 | |
4 | 110 | |
5 | 106 | |
6 | 109 | |
7 | 98 | |
8 | 107 | |
9 | 99 |
Value | Count | Frequency (%) |
113 | 1 | < 0.1% |
112 | 1 | < 0.1% |
106 | 4 | |
102 | 1 | < 0.1% |
97 | 1 | < 0.1% |
95 | 2 | |
90 | 1 | < 0.1% |
89 | 2 | |
87 | 2 | |
86 | 3 |
경상자수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 351 |
---|---|
Distinct (%) | 12.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 77.500912 |
Minimum | 0 |
---|---|
Maximum | 572 |
Zeros | 12 |
Zeros (%) | 0.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.2 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 5 |
Q1 | 18 |
median | 50 |
Q3 | 103 |
95-th percentile | 261 |
Maximum | 572 |
Range | 572 |
Interquartile range (IQR) | 85 |
Descriptive statistics
Standard deviation | 84.193406 |
---|---|
Coefficient of variation (CV) | 1.0863537 |
Kurtosis | 3.8613825 |
Mean | 77.500912 |
Median Absolute Deviation (MAD) | 37 |
Skewness | 1.8967047 |
Sum | 212430 |
Variance | 7088.5297 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
8 | 60 | 2.2% |
9 | 49 | 1.8% |
13 | 49 | 1.8% |
14 | 47 | 1.7% |
5 | 47 | 1.7% |
11 | 46 | 1.7% |
4 | 44 | 1.6% |
6 | 43 | 1.6% |
12 | 40 | 1.5% |
10 | 40 | 1.5% |
Other values (341) | 2276 |
Value | Count | Frequency (%) |
0 | 12 | 0.4% |
1 | 19 | 0.7% |
2 | 31 | |
3 | 21 | 0.8% |
4 | 44 | |
5 | 47 | |
6 | 43 | |
7 | 36 | |
8 | 60 | |
9 | 49 |
Value | Count | Frequency (%) |
572 | 1 | |
514 | 1 | |
463 | 1 | |
452 | 1 | |
448 | 1 | |
447 | 1 | |
443 | 1 | |
440 | 1 | |
434 | 1 | |
433 | 1 |
부상신고자수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 61 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.4421744 |
Minimum | 0 |
---|---|
Maximum | 79 |
Zeros | 682 |
Zeros (%) | 24.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 24.2 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1 |
median | 3 |
Q3 | 9 |
95-th percentile | 25 |
Maximum | 79 |
Range | 79 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 9.2954365 |
---|---|
Coefficient of variation (CV) | 1.4429036 |
Kurtosis | 9.4549177 |
Mean | 6.4421744 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 2.6686964 |
Sum | 17658 |
Variance | 86.40514 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 682 | |
1 | 361 | |
2 | 246 | 9.0% |
3 | 184 | 6.7% |
4 | 169 | 6.2% |
5 | 133 | 4.9% |
6 | 118 | 4.3% |
9 | 80 | 2.9% |
7 | 79 | 2.9% |
8 | 71 | 2.6% |
Other values (51) | 618 |
Value | Count | Frequency (%) |
0 | 682 | |
1 | 361 | |
2 | 246 | 9.0% |
3 | 184 | 6.7% |
4 | 169 | 6.2% |
5 | 133 | 4.9% |
6 | 118 | 4.3% |
7 | 79 | 2.9% |
8 | 71 | 2.6% |
9 | 80 | 2.9% |
Value | Count | Frequency (%) |
79 | 1 | < 0.1% |
78 | 1 | < 0.1% |
67 | 1 | < 0.1% |
63 | 2 | |
60 | 1 | < 0.1% |
57 | 2 | |
54 | 1 | < 0.1% |
53 | 3 | |
52 | 1 | < 0.1% |
51 | 4 |
시도 | 발생월 | 사고건수 | 사망자수 | 중상자수 | 경상자수 | 부상신고자수 | |
---|---|---|---|---|---|---|---|
시도 | 1.000 | 0.000 | 0.572 | 0.207 | 0.488 | 0.547 | 0.518 |
발생월 | 0.000 | 1.000 | 0.000 | 0.053 | 0.053 | 0.000 | 0.000 |
사고건수 | 0.572 | 0.000 | 1.000 | 0.353 | 0.904 | 0.969 | 0.787 |
사망자수 | 0.207 | 0.053 | 0.353 | 1.000 | 0.412 | 0.338 | 0.380 |
중상자수 | 0.488 | 0.053 | 0.904 | 0.412 | 1.000 | 0.873 | 0.723 |
경상자수 | 0.547 | 0.000 | 0.969 | 0.338 | 0.873 | 1.000 | 0.775 |
부상신고자수 | 0.518 | 0.000 | 0.787 | 0.380 | 0.723 | 0.775 | 1.000 |
발생월 | 사고건수 | 사망자수 | 중상자수 | 경상자수 | 부상신고자수 | 시도 | |
---|---|---|---|---|---|---|---|
발생월 | 1.000 | 0.070 | 0.101 | 0.065 | 0.072 | 0.060 | 0.000 |
사고건수 | 0.070 | 1.000 | 0.332 | 0.921 | 0.983 | 0.804 | 0.264 |
사망자수 | 0.101 | 0.332 | 1.000 | 0.329 | 0.314 | 0.234 | 0.082 |
중상자수 | 0.065 | 0.921 | 0.329 | 1.000 | 0.879 | 0.735 | 0.213 |
경상자수 | 0.072 | 0.983 | 0.314 | 0.879 | 1.000 | 0.776 | 0.247 |
부상신고자수 | 0.060 | 0.804 | 0.234 | 0.735 | 0.776 | 1.000 | 0.230 |
시도 | 0.000 | 0.264 | 0.082 | 0.213 | 0.247 | 0.230 | 1.000 |
시도 | 시군구 | 발생월 | 사고건수 | 사망자수 | 중상자수 | 경상자수 | 부상신고자수 | |
---|---|---|---|---|---|---|---|---|
0 | 서울 | 종로구 | 1 | 65 | 0 | 15 | 61 | 13 |
1 | 서울 | 종로구 | 2 | 59 | 0 | 15 | 68 | 4 |
2 | 서울 | 종로구 | 3 | 70 | 0 | 19 | 60 | 9 |
3 | 서울 | 종로구 | 4 | 90 | 0 | 21 | 102 | 10 |
4 | 서울 | 종로구 | 5 | 88 | 1 | 20 | 98 | 12 |
5 | 서울 | 종로구 | 6 | 78 | 1 | 17 | 70 | 12 |
6 | 서울 | 종로구 | 7 | 109 | 0 | 25 | 102 | 19 |
7 | 서울 | 종로구 | 8 | 77 | 1 | 23 | 70 | 12 |
8 | 서울 | 종로구 | 9 | 99 | 0 | 27 | 104 | 7 |
9 | 서울 | 종로구 | 10 | 81 | 0 | 13 | 97 | 8 |
시도 | 시군구 | 발생월 | 사고건수 | 사망자수 | 중상자수 | 경상자수 | 부상신고자수 | |
---|---|---|---|---|---|---|---|---|
2731 | 세종 | 세종시 | 3 | 63 | 0 | 13 | 51 | 24 |
2732 | 세종 | 세종시 | 4 | 78 | 4 | 19 | 67 | 37 |
2733 | 세종 | 세종시 | 5 | 85 | 1 | 22 | 71 | 20 |
2734 | 세종 | 세종시 | 6 | 103 | 3 | 33 | 79 | 34 |
2735 | 세종 | 세종시 | 7 | 78 | 1 | 23 | 52 | 33 |
2736 | 세종 | 세종시 | 8 | 77 | 3 | 18 | 72 | 12 |
2737 | 세종 | 세종시 | 9 | 87 | 1 | 20 | 62 | 44 |
2738 | 세종 | 세종시 | 10 | 105 | 2 | 27 | 82 | 51 |
2739 | 세종 | 세종시 | 11 | 88 | 0 | 19 | 75 | 40 |
2740 | 세종 | 세종시 | 12 | 78 | 1 | 15 | 56 | 41 |