Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 2924 |
Missing cells | 1 |
Missing cells (%) | < 0.1% |
Duplicate rows | 531 |
Duplicate rows (%) | 18.2% |
Total size in memory | 240.0 KiB |
Average record size in memory | 84.0 B |
Variable types
DateTime | 1 |
---|---|
Categorical | 3 |
Unsupported | 3 |
Numeric | 3 |
Dataset
Description | 저희 도로교통공단에서는 법규위반, 사고, 음주운전, 난폭, 보복운전 등으로 운전면허 행정처분을 받은 대상자를 대상으로 특별교통안전교육을 진행하고 있습니다. 고령운전자교육 관련 교육일정 및 예약정보 관련 자료입니다. |
---|---|
Author | 도로교통공단 |
URL | https://www.data.go.kr/data/15087808/fileData.do |
Dataset has 531 (18.2%) duplicate rows | Duplicates |
강의실정원 is highly overall correlated with 지부코드 | High correlation |
지부코드 is highly overall correlated with 강의실정원 | High correlation |
시간표구분 is highly imbalanced (99.6%) | Imbalance |
교육반코드 is highly imbalanced (56.0%) | Imbalance |
강의실번호 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
강의시작시간 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
강의종료시간 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
강의실정원 has 450 (15.4%) zeros | Zeros |
예약정원 has 2129 (72.8%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 13:14:12.168604 |
---|---|
Analysis finished | 2023-12-12 13:14:13.545981 |
Duration | 1.38 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
교육일자
Date
Distinct | 236 |
---|---|
Distinct (%) | 8.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 23.0 KiB |
Minimum | 2020-01-02 00:00:00 |
---|---|
Maximum | 2020-12-30 00:00:00 |
지부코드
Categorical
HIGH CORRELATION
 
Distinct | 35 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 23.0 KiB |
전북시험장 | |
---|---|
도봉시험장 | |
강남시험장 | |
제주시험장 | 163 |
대구시험장 | 163 |
Other values (30) |
Length
Max length | 8 |
---|---|
Median length | 5 |
Mean length | 5.0123119 |
Min length | 4 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 도봉시험장 |
---|---|
2nd row | 도봉시험장 |
3rd row | 제주시험장 |
4th row | 제주시험장 |
5th row | 전남시험장 |
Common Values
Value | Count | Frequency (%) |
전북시험장 | 379 | 13.0% |
도봉시험장 | 334 | 11.4% |
강남시험장 | 196 | 6.7% |
제주시험장 | 163 | 5.6% |
대구시험장 | 163 | 5.6% |
포항시험장 | 143 | 4.9% |
북부시험장 | 131 | 4.5% |
강서시험장 | 130 | 4.4% |
문경시험장 | 111 | 3.8% |
인천시험장 | 108 | 3.7% |
Other values (25) | 1066 |
Length
Value | Count | Frequency (%) |
전북시험장 | 379 | 13.0% |
도봉시험장 | 334 | 11.4% |
강남시험장 | 196 | 6.7% |
제주시험장 | 163 | 5.6% |
대구시험장 | 163 | 5.6% |
포항시험장 | 143 | 4.9% |
북부시험장 | 131 | 4.5% |
강서시험장 | 130 | 4.4% |
문경시험장 | 111 | 3.8% |
인천시험장 | 108 | 3.7% |
Other values (25) | 1066 |
시간표구분
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 23.0 KiB |
4 | |
---|---|
1 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 4 |
---|---|
2nd row | 4 |
3rd row | 4 |
4th row | 4 |
5th row | 4 |
Common Values
Value | Count | Frequency (%) |
4 | 2923 | |
1 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
4 | 2923 | |
1 | 1 | < 0.1% |
교육반코드
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 23.0 KiB |
고령자교육(의무) | |
---|---|
고령자교육(권장) |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 고령자교육(의무) |
---|---|
2nd row | 고령자교육(의무) |
3rd row | 고령자교육(의무) |
4th row | 고령자교육(의무) |
5th row | 고령자교육(의무) |
Common Values
Value | Count | Frequency (%) |
고령자교육(의무) | 2658 | |
고령자교육(권장) | 266 | 9.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
고령자교육(의무 | 2658 | |
고령자교육(권장 | 266 | 9.1% |
강의실번호
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 0 |
---|---|
Missing (%) | 0.0% |
Memory size | 23.0 KiB |
강의시작시간
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 0 |
---|---|
Missing (%) | 0.0% |
Memory size | 23.0 KiB |
순번
Real number (ℝ)
Distinct | 44 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.7592339 |
Minimum | 1 |
---|---|
Maximum | 44 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 3 |
95-th percentile | 24 |
Maximum | 44 |
Range | 43 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 7.9286612 |
---|---|
Coefficient of variation (CV) | 1.6659532 |
Kurtosis | 5.4358189 |
Mean | 4.7592339 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 2.4161975 |
Sum | 13916 |
Variance | 62.863668 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1997 | |
2 | 184 | 6.3% |
7 | 43 | 1.5% |
8 | 40 | 1.4% |
5 | 40 | 1.4% |
6 | 38 | 1.3% |
15 | 34 | 1.2% |
12 | 34 | 1.2% |
14 | 33 | 1.1% |
9 | 32 | 1.1% |
Other values (34) | 449 | 15.4% |
Value | Count | Frequency (%) |
1 | 1997 | |
2 | 184 | 6.3% |
3 | 32 | 1.1% |
4 | 31 | 1.1% |
5 | 40 | 1.4% |
6 | 38 | 1.3% |
7 | 43 | 1.5% |
8 | 40 | 1.4% |
9 | 32 | 1.1% |
10 | 17 | 0.6% |
Value | Count | Frequency (%) |
44 | 1 | < 0.1% |
43 | 1 | < 0.1% |
42 | 3 | 0.1% |
41 | 2 | 0.1% |
40 | 1 | < 0.1% |
39 | 7 | |
38 | 6 | |
37 | 7 | |
36 | 8 | |
35 | 7 |
강의종료시간
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 0 |
---|---|
Missing (%) | 0.0% |
Memory size | 23.0 KiB |
강의실정원
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 33 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 16.780096 |
Minimum | 0 |
---|---|
Maximum | 100 |
Zeros | 450 |
Zeros (%) | 15.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.8 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 9 |
median | 15 |
Q3 | 30 |
95-th percentile | 35 |
Maximum | 100 |
Range | 100 |
Interquartile range (IQR) | 21 |
Descriptive statistics
Standard deviation | 14.333351 |
---|---|
Coefficient of variation (CV) | 0.85418768 |
Kurtosis | 11.688623 |
Mean | 16.780096 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 2.3829006 |
Sum | 49065 |
Variance | 205.44495 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
30 | 523 | |
0 | 450 | |
15 | 396 | |
10 | 217 | |
17 | 185 | 6.3% |
16 | 175 | 6.0% |
35 | 155 | 5.3% |
11 | 109 | 3.7% |
12 | 91 | 3.1% |
14 | 86 | 2.9% |
Other values (23) | 537 |
Value | Count | Frequency (%) |
0 | 450 | |
1 | 19 | 0.6% |
2 | 52 | 1.8% |
3 | 34 | 1.2% |
4 | 4 | 0.1% |
5 | 20 | 0.7% |
6 | 47 | 1.6% |
7 | 74 | 2.5% |
8 | 15 | 0.5% |
9 | 22 | 0.8% |
Value | Count | Frequency (%) |
100 | 36 | 1.2% |
39 | 1 | < 0.1% |
37 | 2 | 0.1% |
36 | 30 | 1.0% |
35 | 155 | 5.3% |
34 | 1 | < 0.1% |
31 | 2 | 0.1% |
30 | 523 | |
29 | 5 | 0.2% |
28 | 55 | 1.9% |
예약정원
Real number (ℝ)
ZEROS
 
Distinct | 34 |
---|---|
Distinct (%) | 1.2% |
Missing | 1 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.8693124 |
Minimum | 0 |
---|---|
Maximum | 50 |
Zeros | 2129 |
Zeros (%) | 72.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.8 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 1 |
95-th percentile | 28 |
Maximum | 50 |
Range | 50 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 8.3713045 |
---|---|
Coefficient of variation (CV) | 2.1635122 |
Kurtosis | 6.3272603 |
Mean | 3.8693124 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 2.5196693 |
Sum | 11310 |
Variance | 70.07874 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 2129 | |
15 | 123 | 4.2% |
1 | 84 | 2.9% |
10 | 80 | 2.7% |
30 | 77 | 2.6% |
7 | 56 | 1.9% |
2 | 40 | 1.4% |
16 | 37 | 1.3% |
17 | 35 | 1.2% |
11 | 34 | 1.2% |
Other values (24) | 228 | 7.8% |
Value | Count | Frequency (%) |
0 | 2129 | |
1 | 84 | 2.9% |
2 | 40 | 1.4% |
3 | 17 | 0.6% |
4 | 4 | 0.1% |
5 | 16 | 0.5% |
6 | 15 | 0.5% |
7 | 56 | 1.9% |
8 | 9 | 0.3% |
9 | 25 | 0.9% |
Value | Count | Frequency (%) |
50 | 9 | 0.3% |
37 | 1 | < 0.1% |
36 | 13 | 0.4% |
35 | 26 | 0.9% |
34 | 1 | < 0.1% |
31 | 1 | < 0.1% |
30 | 77 | |
29 | 5 | 0.2% |
28 | 19 | 0.6% |
27 | 1 | < 0.1% |
지부코드 | 시간표구분 | 교육반코드 | 순번 | 강의실정원 | 예약정원 | |
---|---|---|---|---|---|---|
지부코드 | 1.000 | 0.000 | 0.460 | 0.629 | 0.905 | 0.699 |
시간표구분 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.058 |
교육반코드 | 0.460 | 0.000 | 1.000 | 0.155 | 0.171 | 0.049 |
순번 | 0.629 | 0.000 | 0.155 | 1.000 | 0.242 | 0.104 |
강의실정원 | 0.905 | 0.000 | 0.171 | 0.242 | 1.000 | 0.689 |
예약정원 | 0.699 | 0.058 | 0.049 | 0.104 | 0.689 | 1.000 |
시간표구분 | 교육반코드 | 지부코드 | |
---|---|---|---|
시간표구분 | 1.000 | 0.000 | 0.000 |
교육반코드 | 0.000 | 1.000 | 0.388 |
지부코드 | 0.000 | 0.388 | 1.000 |
순번 | 강의실정원 | 예약정원 | 지부코드 | 시간표구분 | 교육반코드 | |
---|---|---|---|---|---|---|
순번 | 1.000 | -0.048 | -0.090 | 0.268 | 0.000 | 0.119 |
강의실정원 | -0.048 | 1.000 | 0.043 | 0.699 | 0.000 | 0.233 |
예약정원 | -0.090 | 0.043 | 1.000 | 0.307 | 0.044 | 0.070 |
지부코드 | 0.268 | 0.699 | 0.307 | 1.000 | 0.000 | 0.388 |
시간표구분 | 0.000 | 0.000 | 0.044 | 0.000 | 1.000 | 0.000 |
교육반코드 | 0.119 | 0.233 | 0.070 | 0.388 | 0.000 | 1.000 |
교육일자 | 지부코드 | 시간표구분 | 교육반코드 | 강의실번호 | 강의시작시간 | 순번 | 강의종료시간 | 강의실정원 | 예약정원 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 2020-01-02 | 도봉시험장 | 4 | 고령자교육(의무) | 1 | 09:30:00 | 1 | 11:30:00 | 30 | 30 |
1 | 2020-01-02 | 도봉시험장 | 4 | 고령자교육(의무) | 2 | 14:00:00 | 1 | 16:00:00 | 20 | 20 |
2 | 2020-01-02 | 제주시험장 | 4 | 고령자교육(의무) | A | 10:00:00 | 1 | 12:00:00 | 12 | 11 |
3 | 2020-01-02 | 제주시험장 | 4 | 고령자교육(의무) | B | 14:00:00 | 1 | 16:00:00 | 12 | 11 |
4 | 2020-01-02 | 전남시험장 | 4 | 고령자교육(의무) | 1 | 09:30:00 | 1 | 11:30:00 | 15 | 15 |
5 | 2020-01-02 | 전남시험장 | 4 | 고령자교육(의무) | 1 | 14:00:00 | 2 | 16:00:00 | 15 | 15 |
6 | 2020-01-02 | 북부시험장 | 4 | 고령자교육(의무) | 1 | 10:00:00 | 1 | 12:00:00 | 7 | 7 |
7 | 2020-01-02 | 북부시험장 | 4 | 고령자교육(의무) | 2 | 14:00:00 | 1 | 16:00:00 | 7 | 7 |
8 | 2020-01-02 | 강남시험장 | 4 | 고령자교육(의무) | 1 | 09:30:00 | 1 | 11:30:00 | 35 | 35 |
9 | 2020-01-02 | 강남시험장 | 4 | 고령자교육(의무) | 2 | 14:00:00 | 1 | 16:00:00 | 35 | 35 |
교육일자 | 지부코드 | 시간표구분 | 교육반코드 | 강의실번호 | 강의시작시간 | 순번 | 강의종료시간 | 강의실정원 | 예약정원 | |
---|---|---|---|---|---|---|---|---|---|---|
2914 | 2020-12-23 | 강남시험장 | 4 | 고령자교육(의무) | A | 09:30:00 | 1 | 11:30:00 | 2 | 2 |
2915 | 2020-12-23 | 강남시험장 | 4 | 고령자교육(의무) | B | 14:00:00 | 1 | 16:00:00 | 2 | 2 |
2916 | 2020-12-23 | 안동교육장 | 4 | 고령자교육(의무) | 1 | 10:00:00 | 1 | 12:00:00 | 10 | 6 |
2917 | 2020-12-24 | 원주시험장 | 4 | 고령자교육(의무) | 1 | 10:00:00 | 1 | 12:00:00 | 100 | 1 |
2918 | 2020-12-24 | 북부시험장 | 4 | 고령자교육(의무) | A | 10:00:00 | 1 | 12:00:00 | 5 | 5 |
2919 | 2020-12-24 | 울산경남지부 | 4 | 고령자교육(의무) | 1 | 10:00:00 | 1 | 12:00:00 | 0 | 0 |
2920 | 2020-12-24 | 북부시험장 | 4 | 고령자교육(의무) | 1 | 14:00:00 | 1 | 16:00:00 | 8 | 8 |
2921 | 2020-12-28 | 광주전남지부 | 4 | 고령자교육(의무) | 1 | 10:00:00 | 1 | 12:00:00 | 10 | 9 |
2922 | 2020-12-28 | 광주전남지부 | 4 | 고령자교육(의무) | 1 | 14:00:00 | 2 | 16:00:00 | 10 | 10 |
2923 | 2020-12-30 | 인천지부 | 4 | 고령자교육(의무) | 1 | 10:00:00 | 1 | 12:00:00 | 0 | 0 |
Most frequently occurring
교육일자 | 지부코드 | 시간표구분 | 교육반코드 | 순번 | 강의실정원 | 예약정원 | # duplicates | |
---|---|---|---|---|---|---|---|---|
327 | 2020-04-01 | 인천시험장 | 4 | 고령자교육(의무) | 1 | 17 | 0 | 3 |
0 | 2020-01-02 | 강남시험장 | 4 | 고령자교육(의무) | 1 | 35 | 35 | 2 |
1 | 2020-01-02 | 북부시험장 | 4 | 고령자교육(의무) | 1 | 7 | 7 | 2 |
2 | 2020-01-02 | 안산시험장 | 4 | 고령자교육(의무) | 1 | 12 | 12 | 2 |
3 | 2020-01-02 | 용인시험장 | 4 | 고령자교육(의무) | 1 | 36 | 36 | 2 |
4 | 2020-01-02 | 전북시험장 | 4 | 고령자교육(의무) | 1 | 15 | 15 | 2 |
5 | 2020-01-02 | 제주시험장 | 4 | 고령자교육(의무) | 1 | 12 | 11 | 2 |
6 | 2020-01-02 | 포항시험장 | 4 | 고령자교육(의무) | 1 | 16 | 16 | 2 |
7 | 2020-01-03 | 대구시험장 | 4 | 고령자교육(의무) | 1 | 30 | 30 | 2 |
8 | 2020-01-03 | 도봉시험장 | 4 | 고령자교육(의무) | 1 | 30 | 30 | 2 |