Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 732.4 KiB |
Average record size in memory | 75.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 4 |
Text | 2 |
Dataset
Description | 대전광역시 서구 어린이보호구역 불법주정차 단속현황입니다.(순번, 차량구분, 위반연도, 위반월, 위반시간, 단속위치, 단속동명, 신고구분) |
---|---|
URL | https://www.data.go.kr/data/15104525/fileData.do |
순번 is highly overall correlated with 위반연도 | High correlation |
위반월 is highly overall correlated with 위반연도 | High correlation |
위반연도 is highly overall correlated with 순번 and 1 other fields | High correlation |
차량구분 is highly imbalanced (76.6%) | Imbalance |
신고구분 is highly imbalanced (73.4%) | Imbalance |
순번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 09:07:19.703169 |
---|---|
Analysis finished | 2023-12-12 09:07:21.553822 |
Duration | 1.85 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14330.534 |
Minimum | 10 |
---|---|
Maximum | 28869 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 10 |
---|---|
5-th percentile | 1452.9 |
Q1 | 7154.75 |
median | 14300 |
Q3 | 21414.5 |
95-th percentile | 27345.4 |
Maximum | 28869 |
Range | 28859 |
Interquartile range (IQR) | 14259.75 |
Descriptive statistics
Standard deviation | 8285.2682 |
---|---|
Coefficient of variation (CV) | 0.57815489 |
Kurtosis | -1.1853452 |
Mean | 14330.534 |
Median Absolute Deviation (MAD) | 7130 |
Skewness | 0.015942795 |
Sum | 1.4330534 × 108 |
Variance | 68645669 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
17556 | 1 | < 0.1% |
16356 | 1 | < 0.1% |
25492 | 1 | < 0.1% |
20553 | 1 | < 0.1% |
10660 | 1 | < 0.1% |
18586 | 1 | < 0.1% |
5790 | 1 | < 0.1% |
21829 | 1 | < 0.1% |
18352 | 1 | < 0.1% |
2321 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
10 | 1 | |
14 | 1 | |
17 | 1 | |
24 | 1 | |
25 | 1 | |
36 | 1 | |
37 | 1 | |
38 | 1 | |
39 | 1 | |
43 | 1 |
Value | Count | Frequency (%) |
28869 | 1 | |
28868 | 1 | |
28866 | 1 | |
28865 | 1 | |
28864 | 1 | |
28854 | 1 | |
28851 | 1 | |
28850 | 1 | |
28843 | 1 | |
28834 | 1 |
차량구분
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
승용 | |
---|---|
화물4톤이하 | 612 |
승합 | 229 |
화물4톤초과 | 32 |
건설,중기,특수 | 26 |
Length
Max length | 8 |
---|---|
Median length | 2 |
Mean length | 2.2732 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 승용 |
---|---|
2nd row | 승용 |
3rd row | 승용 |
4th row | 승용 |
5th row | 승용 |
Common Values
Value | Count | Frequency (%) |
승용 | 9101 | |
화물4톤이하 | 612 | 6.1% |
승합 | 229 | 2.3% |
화물4톤초과 | 32 | 0.3% |
건설,중기,특수 | 26 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
승용 | 9101 | |
화물4톤이하 | 612 | 6.1% |
승합 | 229 | 2.3% |
화물4톤초과 | 32 | 0.3% |
건설,중기,특수 | 26 | 0.3% |
위반연도
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2023 | |
---|---|
2022 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023 |
---|---|
2nd row | 2023 |
3rd row | 2022 |
4th row | 2023 |
5th row | 2022 |
Common Values
Value | Count | Frequency (%) |
2023 | 5446 | |
2022 | 4554 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023 | 5446 | |
2022 | 4554 |
위반월
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.5112 |
Minimum | 1 |
---|---|
Maximum | 12 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 5 |
Q3 | 7 |
95-th percentile | 11 |
Maximum | 12 |
Range | 11 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.842619 |
---|---|
Coefficient of variation (CV) | 0.51578948 |
Kurtosis | -0.24527673 |
Mean | 5.5112 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.61998515 |
Sum | 55112 |
Variance | 8.0804826 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 1506 | |
4 | 1422 | |
5 | 1403 | |
6 | 1354 | |
7 | 1195 | |
2 | 621 | |
1 | 569 | 5.7% |
11 | 441 | 4.4% |
12 | 437 | 4.4% |
10 | 410 | 4.1% |
Other values (2) | 642 |
Value | Count | Frequency (%) |
1 | 569 | 5.7% |
2 | 621 | |
3 | 1506 | |
4 | 1422 | |
5 | 1403 | |
6 | 1354 | |
7 | 1195 | |
8 | 382 | 3.8% |
9 | 260 | 2.6% |
10 | 410 | 4.1% |
Value | Count | Frequency (%) |
12 | 437 | 4.4% |
11 | 441 | 4.4% |
10 | 410 | 4.1% |
9 | 260 | 2.6% |
8 | 382 | 3.8% |
7 | 1195 | |
6 | 1354 | |
5 | 1403 | |
4 | 1422 | |
3 | 1506 |
위반시간
Text
Distinct | 669 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
08:34:00 | 118 | 1.2% |
08:33:00 | 105 | 1.0% |
08:35:00 | 98 | 1.0% |
08:32:00 | 84 | 0.8% |
08:23:00 | 80 | 0.8% |
08:36:00 | 78 | 0.8% |
08:40:00 | 71 | 0.7% |
08:37:00 | 69 | 0.7% |
08:39:00 | 69 | 0.7% |
08:38:00 | 59 | 0.6% |
Other values (662) | 9172 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 25231 | |
: | 19997 | |
1 | 10189 | |
4 | 4061 | 5.1% |
8 | 3704 | 4.6% |
5 | 3523 | 4.4% |
3 | 3379 | 4.2% |
2 | 3097 | 3.9% |
9 | 2940 | 3.7% |
7 | 1963 | 2.5% |
Other values (2) | 1916 | 2.4% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 60000 | |
Other Punctuation | 19997 | 25.0% |
Space Separator | 3 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 25231 | |
1 | 10189 | |
4 | 4061 | 6.8% |
8 | 3704 | 6.2% |
5 | 3523 | 5.9% |
3 | 3379 | 5.6% |
2 | 3097 | 5.2% |
9 | 2940 | 4.9% |
7 | 1963 | 3.3% |
6 | 1913 | 3.2% |
Other Punctuation
Value | Count | Frequency (%) |
: | 19997 |
Space Separator
Value | Count | Frequency (%) |
3 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 80000 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 25231 | |
: | 19997 | |
1 | 10189 | |
4 | 4061 | 5.1% |
8 | 3704 | 4.6% |
5 | 3523 | 4.4% |
3 | 3379 | 4.2% |
2 | 3097 | 3.9% |
9 | 2940 | 3.7% |
7 | 1963 | 2.5% |
Other values (2) | 1916 | 2.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 80000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 25231 | |
: | 19997 | |
1 | 10189 | |
4 | 4061 | 5.1% |
8 | 3704 | 4.6% |
5 | 3523 | 4.4% |
3 | 3379 | 4.2% |
2 | 3097 | 3.9% |
9 | 2940 | 3.7% |
7 | 1963 | 2.5% |
Other values (2) | 1916 | 2.4% |
단속위치
Text
Distinct | 248 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
둔산동학원가 | 1862 | 17.5% |
둔산초등학교 | 642 | 6.0% |
문정초등학교 | 433 | 4.1% |
수밋들공원 | 386 | 3.6% |
봉산초등학교 | 359 | 3.4% |
순복음예광교회(선암초교 | 359 | 3.4% |
은새유치원 | 337 | 3.2% |
만년초등학교 | 268 | 2.5% |
유천초등학교 | 216 | 2.0% |
정림초등학교 | 214 | 2.0% |
Other values (237) | 5563 |
Most occurring characters
Value | Count | Frequency (%) |
학 | 7208 | 10.3% |
교 | 6410 | 9.2% |
초 | 5828 | 8.4% |
등 | 5011 | 7.2% |
원 | 4192 | 6.0% |
산 | 3152 | 4.5% |
둔 | 2849 | 4.1% |
가 | 2276 | 3.3% |
동 | 2268 | 3.3% |
유 | 1308 | 1.9% |
Other values (174) | 29235 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 66183 | |
Open Punctuation | 1307 | 1.9% |
Close Punctuation | 1307 | 1.9% |
Space Separator | 644 | 0.9% |
Decimal Number | 281 | 0.4% |
Lowercase Letter | 15 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 7208 | 10.9% |
교 | 6410 | 9.7% |
초 | 5828 | 8.8% |
등 | 5011 | 7.6% |
원 | 4192 | 6.3% |
산 | 3152 | 4.8% |
둔 | 2849 | 4.3% |
가 | 2276 | 3.4% |
동 | 2268 | 3.4% |
유 | 1308 | 2.0% |
Other values (161) | 25681 |
Decimal Number
Value | Count | Frequency (%) |
2 | 171 | |
1 | 65 | 23.1% |
7 | 31 | 11.0% |
8 | 5 | 1.8% |
5 | 3 | 1.1% |
9 | 2 | 0.7% |
4 | 2 | 0.7% |
0 | 1 | 0.4% |
3 | 1 | 0.4% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1307 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1307 |
Space Separator
Value | Count | Frequency (%) |
644 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 15 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 66183 | |
Common | 3539 | 5.1% |
Latin | 15 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 7208 | 10.9% |
교 | 6410 | 9.7% |
초 | 5828 | 8.8% |
등 | 5011 | 7.6% |
원 | 4192 | 6.3% |
산 | 3152 | 4.8% |
둔 | 2849 | 4.3% |
가 | 2276 | 3.4% |
동 | 2268 | 3.4% |
유 | 1308 | 2.0% |
Other values (161) | 25681 |
Common
Value | Count | Frequency (%) |
( | 1307 | |
) | 1307 | |
644 | ||
2 | 171 | 4.8% |
1 | 65 | 1.8% |
7 | 31 | 0.9% |
8 | 5 | 0.1% |
5 | 3 | 0.1% |
9 | 2 | 0.1% |
4 | 2 | 0.1% |
Other values (2) | 2 | 0.1% |
Latin
Value | Count | Frequency (%) |
e | 15 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 66183 | |
ASCII | 3554 | 5.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
학 | 7208 | 10.9% |
교 | 6410 | 9.7% |
초 | 5828 | 8.8% |
등 | 5011 | 7.6% |
원 | 4192 | 6.3% |
산 | 3152 | 4.8% |
둔 | 2849 | 4.3% |
가 | 2276 | 3.4% |
동 | 2268 | 3.4% |
유 | 1308 | 2.0% |
Other values (161) | 25681 |
ASCII
Value | Count | Frequency (%) |
( | 1307 | |
) | 1307 | |
644 | ||
2 | 171 | 4.8% |
1 | 65 | 1.8% |
7 | 31 | 0.9% |
e | 15 | 0.4% |
8 | 5 | 0.1% |
5 | 3 | 0.1% |
9 | 2 | 0.1% |
Other values (3) | 4 | 0.1% |
단속동명
Categorical
Distinct | 28 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
둔산동 | |
---|---|
관저동 | |
탄방동 | |
정림동 | |
도마동 | |
Other values (23) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0262 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 도마동 |
---|---|
2nd row | 갈마동 |
3rd row | 둔산동 |
4th row | 탄방동 |
5th row | 괴정동 |
Common Values
Value | Count | Frequency (%) |
둔산동 | 3708 | |
관저동 | 1186 | 11.9% |
탄방동 | 823 | 8.2% |
정림동 | 683 | 6.8% |
도마동 | 459 | 4.6% |
월평동 | 459 | 4.6% |
갈마동 | 411 | 4.1% |
괴정동 | 399 | 4.0% |
만년동 | 358 | 3.6% |
복수동 | 289 | 2.9% |
Other values (18) | 1225 | 12.2% |
Length
Value | Count | Frequency (%) |
둔산동 | 3708 | |
관저동 | 1186 | 11.9% |
탄방동 | 823 | 8.2% |
정림동 | 683 | 6.8% |
도마동 | 459 | 4.6% |
월평동 | 459 | 4.6% |
갈마동 | 411 | 4.1% |
괴정동 | 399 | 4.0% |
만년동 | 358 | 3.6% |
복수동 | 289 | 2.9% |
Other values (18) | 1225 | 12.2% |
신고구분
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
고정형CCTV | |
---|---|
주행형CCTV | 779 |
안전신문고 | 224 |
버스장착형CCTV | 73 |
PDA | 8 |
Length
Max length | 9 |
---|---|
Median length | 7 |
Mean length | 6.9666 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 고정형CCTV |
---|---|
2nd row | 고정형CCTV |
3rd row | 고정형CCTV |
4th row | 고정형CCTV |
5th row | 고정형CCTV |
Common Values
Value | Count | Frequency (%) |
고정형CCTV | 8916 | |
주행형CCTV | 779 | 7.8% |
안전신문고 | 224 | 2.2% |
버스장착형CCTV | 73 | 0.7% |
PDA | 8 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
고정형cctv | 8916 | |
주행형cctv | 779 | 7.8% |
안전신문고 | 224 | 2.2% |
버스장착형cctv | 73 | 0.7% |
pda | 8 | 0.1% |
순번 | 차량구분 | 위반연도 | 위반월 | 단속동명 | 신고구분 | |
---|---|---|---|---|---|---|
순번 | 1.000 | 0.065 | 0.997 | 0.953 | 0.261 | 0.246 |
차량구분 | 0.065 | 1.000 | 0.022 | 0.018 | 0.343 | 0.172 |
위반연도 | 0.997 | 0.022 | 1.000 | 0.735 | 0.202 | 0.143 |
위반월 | 0.953 | 0.018 | 0.735 | 1.000 | 0.213 | 0.168 |
단속동명 | 0.261 | 0.343 | 0.202 | 0.213 | 1.000 | 0.699 |
신고구분 | 0.246 | 0.172 | 0.143 | 0.168 | 0.699 | 1.000 |
위반연도 | 단속동명 | 신고구분 | 차량구분 | |
---|---|---|---|---|
위반연도 | 1.000 | 0.160 | 0.175 | 0.027 |
단속동명 | 0.160 | 1.000 | 0.425 | 0.172 |
신고구분 | 0.175 | 0.425 | 1.000 | 0.065 |
차량구분 | 0.027 | 0.172 | 0.065 | 1.000 |
순번 | 위반월 | 차량구분 | 위반연도 | 단속동명 | 신고구분 | |
---|---|---|---|---|---|---|
순번 | 1.000 | 0.075 | 0.027 | 0.948 | 0.096 | 0.104 |
위반월 | 0.075 | 1.000 | 0.008 | 0.576 | 0.078 | 0.070 |
차량구분 | 0.027 | 0.008 | 1.000 | 0.027 | 0.172 | 0.065 |
위반연도 | 0.948 | 0.576 | 0.027 | 1.000 | 0.160 | 0.175 |
단속동명 | 0.096 | 0.078 | 0.172 | 0.160 | 1.000 | 0.425 |
신고구분 | 0.104 | 0.070 | 0.065 | 0.175 | 0.425 | 1.000 |
순번 | 차량구분 | 위반연도 | 위반월 | 위반시간 | 단속위치 | 단속동명 | 신고구분 | |
---|---|---|---|---|---|---|---|---|
17555 | 17556 | 승용 | 2023 | 3 | 08:26:00 | 유천초등학교 | 도마동 | 고정형CCTV |
16688 | 16689 | 승용 | 2023 | 3 | 17:40:00 | 봉산초등학교 | 갈마동 | 고정형CCTV |
218 | 219 | 승용 | 2022 | 3 | 08:48:00 | 둔산동학원가 | 둔산동 | 고정형CCTV |
17495 | 17496 | 승용 | 2023 | 3 | 10:43:00 | 은새유치원 | 탄방동 | 고정형CCTV |
7331 | 7332 | 승용 | 2022 | 7 | 09:37:00 | 백운초등학교 | 괴정동 | 고정형CCTV |
315 | 316 | 승용 | 2022 | 3 | 19:52:00 | 둔산동학원가 | 둔산동 | 고정형CCTV |
16974 | 16975 | 승용 | 2023 | 3 | 14:24:00 | 은새유치원 | 탄방동 | 고정형CCTV |
3304 | 3305 | 승용 | 2022 | 4 | 09:11:00 | 원앙초등학교 나은유치원 | 관저동 | 고정형CCTV |
28058 | 28059 | 승용 | 2023 | 7 | 18:50:00 | 문정초등학교 | 둔산동 | 고정형CCTV |
888 | 889 | 화물4톤이하 | 2022 | 3 | 08:46:00 | 도마초등학교 | 도마동 | 안전신문고 |
순번 | 차량구분 | 위반연도 | 위반월 | 위반시간 | 단속위치 | 단속동명 | 신고구분 | |
---|---|---|---|---|---|---|---|---|
10670 | 10671 | 승용 | 2022 | 11 | 08:37:00 | 한밭초등학교 | 둔산동 | 고정형CCTV |
2461 | 2462 | 승용 | 2022 | 4 | 19:51:00 | 순복음예광교회(선암초교) | 관저동 | 고정형CCTV |
18587 | 18588 | 승용 | 2023 | 3 | 19:24:00 | 내동초등학교 | 내동 | 고정형CCTV |
14958 | 14959 | 승용 | 2023 | 2 | 14:50:00 | 수밋들공원 | 정림동 | 고정형CCTV |
316 | 317 | 승용 | 2022 | 3 | 08:30:00 | 목련어린이집 | 내동 | 고정형CCTV |
23746 | 23747 | 승용 | 2023 | 5 | 19:39:00 | 문정초등학교 | 둔산동 | 고정형CCTV |
16265 | 16266 | 승용 | 2023 | 3 | 08:23:00 | 신계초등학교2 | 복수동 | 고정형CCTV |
26990 | 26991 | 승용 | 2023 | 7 | 09:35:00 | 둔산동학원가 | 둔산동 | 고정형CCTV |
3185 | 3186 | 승용 | 2022 | 4 | 14:40:00 | 수미초등학교 | 괴곡동 | 고정형CCTV |
15239 | 15240 | 승용 | 2023 | 2 | 11:16:00 | 순복음예광교회(선암초교) | 관저동 | 고정형CCTV |