Dataset statistics
Number of variables | 23 |
---|---|
Number of observations | 10000 |
Missing cells | 20809 |
Missing cells (%) | 9.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.9 MiB |
Average record size in memory | 201.0 B |
Variable types
Text | 10 |
---|---|
Categorical | 6 |
Numeric | 6 |
DateTime | 1 |
Dataset
Description | 공공데이터 제공 표준데이터 속성정보(허용값, 표현형식/단위 등)는 [공공데이터 제공 표준] 전문을 참고하시기 바랍니다.(공공데이터포털>정보공유>자료실) 각 기관에서 등록한 표준데이터를 취합하여 제공하기 때문에 갱신주기는 개별 파일마다 다릅니다.(기관에서 등록한 데이터를 취합한 것으로 개별 파일별 갱신시점이 다름) ※ 데이터의 취합 기간중 무인교통단속장비 수치가 변경되어(속도, 위치 등) 차이가 있을 수 있습니다. 교통 환경의 변화에 유의하여 주시기 바랍니다. 『도로교통법』에 따라 법규 위반 사실을 기록·증명하기 위하여 설치·관리되는 고정식 무인교통단속카메라에 대한 정보(이동식 무인교통단속카메라는 제외하며 속도, 신호, 통행위반, 불법주정차, 기타 등 단속) (경찰청 : 속도, 신호, 통행위반, 기타 / 지방자치단체 : 버스전용차로, 불법주정차, 기타) |
---|---|
Author | 경찰청(지방경찰청 기초자료 입력), 지방자치단체 |
URL | https://www.data.go.kr/data/15028200/standard.do |
단속구간위치구분 is highly imbalanced (90.7%) | Imbalance |
도로노선번호 has 2687 (26.9%) missing values | Missing |
소재지도로명주소 has 5507 (55.1%) missing values | Missing |
소재지지번주소 has 1043 (10.4%) missing values | Missing |
과속단속구간길이 has 9819 (98.2%) missing values | Missing |
설치연도 has 1719 (17.2%) missing values | Missing |
제한속도 has 2254 (22.5%) zeros | Zeros |
Reproduction
Analysis started | 2023-09-11 03:22:46.771370 |
---|---|
Analysis finished | 2023-09-11 03:22:48.895778 |
Duration | 2.12 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
무인교통단속카메라관리번호
Text
Distinct | 8950 |
---|---|
Distinct (%) | 89.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 20 |
---|---|
Median length | 5 |
Mean length | 5.0288 |
Min length | 1 |
Characters and Unicode
Total characters | 50288 |
---|---|
Distinct characters | 226 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.
Unique
Unique | 8602 ? |
---|---|
Unique (%) | 86.0% |
Sample
1st row | SP-7227 |
---|---|
2nd row | G1625 |
3rd row | G7423 |
4th row | 101 |
5th row | PE01205 |
Value | Count | Frequency (%) |
주정차 | 29 | 0.3% |
29 | 0.3% | |
단속 | 29 | 0.3% |
2 | 26 | 0.3% |
3 | 24 | 0.2% |
1 | 23 | 0.2% |
13 | 20 | 0.2% |
20 | 20 | 0.2% |
7 | 17 | 0.2% |
12 | 17 | 0.2% |
Other values (8962) | 9895 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 4588 | 9.1% |
1 | 4391 | 8.7% |
2 | 3862 | 7.7% |
3 | 3533 | 7.0% |
7 | 3523 | 7.0% |
4 | 3498 | 7.0% |
G | 3469 | 6.9% |
6 | 3357 | 6.7% |
8 | 3310 | 6.6% |
5 | 3282 | 6.5% |
Other values (216) | 13475 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 36550 | |
Uppercase Letter | 8506 | 16.9% |
Other Letter | 3585 | 7.1% |
Dash Punctuation | 1219 | 2.4% |
Lowercase Letter | 208 | 0.4% |
Space Separator | 132 | 0.3% |
Connector Punctuation | 40 | 0.1% |
Open Punctuation | 23 | < 0.1% |
Other Punctuation | 13 | < 0.1% |
Close Punctuation | 12 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 270 | 7.5% |
정 | 244 | 6.8% |
차 | 233 | 6.5% |
구 | 127 | 3.5% |
서 | 126 | 3.5% |
동 | 125 | 3.5% |
천 | 120 | 3.3% |
남 | 113 | 3.2% |
안 | 104 | 2.9% |
산 | 99 | 2.8% |
Other values (174) | 2024 |
Uppercase Letter
Value | Count | Frequency (%) |
G | 3469 | |
H | 2517 | |
F | 1392 | |
P | 309 | 3.6% |
E | 168 | 2.0% |
N | 131 | 1.5% |
O | 127 | 1.5% |
C | 97 | 1.1% |
D | 89 | 1.0% |
I | 81 | 1.0% |
Other values (10) | 126 | 1.5% |
Decimal Number
Value | Count | Frequency (%) |
0 | 4588 | |
1 | 4391 | |
2 | 3862 | |
3 | 3533 | |
7 | 3523 | |
4 | 3498 | |
6 | 3357 | |
8 | 3310 | |
5 | 3282 | |
9 | 3206 |
Lowercase Letter
Value | Count | Frequency (%) |
c | 52 | |
a | 52 | |
m | 26 | |
e | 26 | |
r | 26 | |
g | 26 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1219 |
Space Separator
Value | Count | Frequency (%) |
132 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 40 |
Open Punctuation
Value | Count | Frequency (%) |
( | 23 |
Other Punctuation
Value | Count | Frequency (%) |
. | 13 |
Close Punctuation
Value | Count | Frequency (%) |
) | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 37989 | |
Latin | 8714 | 17.3% |
Hangul | 3585 | 7.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 270 | 7.5% |
정 | 244 | 6.8% |
차 | 233 | 6.5% |
구 | 127 | 3.5% |
서 | 126 | 3.5% |
동 | 125 | 3.5% |
천 | 120 | 3.3% |
남 | 113 | 3.2% |
안 | 104 | 2.9% |
산 | 99 | 2.8% |
Other values (174) | 2024 |
Latin
Value | Count | Frequency (%) |
G | 3469 | |
H | 2517 | |
F | 1392 | |
P | 309 | 3.5% |
E | 168 | 1.9% |
N | 131 | 1.5% |
O | 127 | 1.5% |
C | 97 | 1.1% |
D | 89 | 1.0% |
I | 81 | 0.9% |
Other values (16) | 334 | 3.8% |
Common
Value | Count | Frequency (%) |
0 | 4588 | |
1 | 4391 | |
2 | 3862 | |
3 | 3533 | |
7 | 3523 | |
4 | 3498 | |
6 | 3357 | |
8 | 3310 | |
5 | 3282 | |
9 | 3206 | |
Other values (6) | 1439 | 3.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 46703 | |
Hangul | 3584 | 7.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 4588 | |
1 | 4391 | |
2 | 3862 | 8.3% |
3 | 3533 | 7.6% |
7 | 3523 | 7.5% |
4 | 3498 | 7.5% |
G | 3469 | 7.4% |
6 | 3357 | 7.2% |
8 | 3310 | 7.1% |
5 | 3282 | 7.0% |
Other values (32) | 9890 |
Hangul
Value | Count | Frequency (%) |
주 | 270 | 7.5% |
정 | 244 | 6.8% |
차 | 233 | 6.5% |
구 | 127 | 3.5% |
서 | 126 | 3.5% |
동 | 125 | 3.5% |
천 | 120 | 3.3% |
남 | 113 | 3.2% |
안 | 104 | 2.9% |
산 | 99 | 2.8% |
Other values (173) | 2023 |
Compat Jamo
Value | Count | Frequency (%) |
ㅗ | 1 |
시도명
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
경상남도 | |
충청남도 | |
전라북도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.084 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경기도 |
---|---|
2nd row | 경기도 |
3rd row | 경상북도 |
4th row | 경상남도 |
5th row | 경기도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 2397 | |
서울특별시 | 1129 | |
경상남도 | 810 | 8.1% |
충청남도 | 722 | 7.2% |
전라북도 | 701 | 7.0% |
경상북도 | 593 | 5.9% |
전라남도 | 569 | 5.7% |
강원도 | 493 | 4.9% |
인천광역시 | 431 | 4.3% |
대전광역시 | 431 | 4.3% |
Other values (7) | 1724 |
Length
Histogram of lengths of the category
Value | Count | Frequency (%) |
경기도 | 2397 | |
서울특별시 | 1129 | |
경상남도 | 810 | 8.1% |
충청남도 | 722 | 7.2% |
전라북도 | 701 | 7.0% |
경상북도 | 593 | 5.9% |
전라남도 | 569 | 5.7% |
강원도 | 493 | 4.9% |
대전광역시 | 431 | 4.3% |
인천광역시 | 431 | 4.3% |
Other values (7) | 1724 |
시군구명
Text
Distinct | 218 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 3.066 |
Min length | 2 |
Characters and Unicode
Total characters | 30660 |
---|---|
Distinct characters | 134 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 고양시 |
---|---|
2nd row | 여주시 |
3rd row | 경산시 |
4th row | 진해구 |
5th row | 안산시 단원구 |
Value | Count | Frequency (%) |
고양시 | 257 | 2.5% |
서구 | 239 | 2.3% |
천안시 | 209 | 2.0% |
동구 | 190 | 1.8% |
성남시 | 183 | 1.8% |
화성시 | 181 | 1.8% |
중구 | 172 | 1.7% |
북구 | 159 | 1.5% |
아산시 | 150 | 1.5% |
유성구 | 146 | 1.4% |
Other values (207) | 8400 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 5198 | 17.0% |
구 | 3545 | 11.6% |
군 | 1742 | 5.7% |
주 | 1265 | 4.1% |
산 | 1052 | 3.4% |
천 | 996 | 3.2% |
성 | 960 | 3.1% |
양 | 889 | 2.9% |
남 | 817 | 2.7% |
서 | 753 | 2.5% |
Other values (124) | 13443 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 30374 | |
Space Separator | 286 | 0.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 5198 | 17.1% |
구 | 3545 | 11.7% |
군 | 1742 | 5.7% |
주 | 1265 | 4.2% |
산 | 1052 | 3.5% |
천 | 996 | 3.3% |
성 | 960 | 3.2% |
양 | 889 | 2.9% |
남 | 817 | 2.7% |
서 | 753 | 2.5% |
Other values (123) | 13157 |
Space Separator
Value | Count | Frequency (%) |
286 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 30374 | |
Common | 286 | 0.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 5198 | 17.1% |
구 | 3545 | 11.7% |
군 | 1742 | 5.7% |
주 | 1265 | 4.2% |
산 | 1052 | 3.5% |
천 | 996 | 3.3% |
성 | 960 | 3.2% |
양 | 889 | 2.9% |
남 | 817 | 2.7% |
서 | 753 | 2.5% |
Other values (123) | 13157 |
Common
Value | Count | Frequency (%) |
286 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 30374 | |
ASCII | 286 | 0.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 5198 | 17.1% |
구 | 3545 | 11.7% |
군 | 1742 | 5.7% |
주 | 1265 | 4.2% |
산 | 1052 | 3.5% |
천 | 996 | 3.3% |
성 | 960 | 3.2% |
양 | 889 | 2.9% |
남 | 817 | 2.7% |
서 | 753 | 2.5% |
Other values (123) | 13157 |
ASCII
Value | Count | Frequency (%) |
286 |
도로종류
Categorical
Distinct | 9 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
시도 | |
---|---|
일반국도 | |
특별시도 | |
지방도 | |
기타 | |
Other values (4) |
Length
Max length | 7 |
---|---|
Median length | 2 |
Mean length | 2.6915 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 시도 |
---|---|
2nd row | 지방도 |
3rd row | 시도 |
4th row | 시도 |
5th row | 시도 |
Common Values
Value | Count | Frequency (%) |
시도 | 4368 | |
일반국도 | 1551 | 15.5% |
특별시도 | 1151 | 11.5% |
지방도 | 1001 | 10.0% |
기타 | 635 | 6.3% |
구도 | 558 | 5.6% |
군도 | 502 | 5.0% |
고속국도 | 220 | 2.2% |
국가지원지방도 | 14 | 0.1% |
Length
Histogram of lengths of the category
Common Values (Plot)
Value | Count | Frequency (%) |
시도 | 4368 | |
일반국도 | 1551 | 15.5% |
특별시도 | 1151 | 11.5% |
지방도 | 1001 | 10.0% |
기타 | 635 | 6.3% |
구도 | 558 | 5.6% |
군도 | 502 | 5.0% |
고속국도 | 220 | 2.2% |
국가지원지방도 | 14 | 0.1% |
도로노선번호
Text
MISSING
 
Distinct | 274 |
---|---|
Distinct (%) | 3.7% |
Missing | 2687 |
Missing (%) | 26.9% |
Memory size | 156.2 KiB |