Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2659 |
Missing cells | 3 |
Missing cells (%) | < 0.1% |
Duplicate rows | 3 |
Duplicate rows (%) | 0.1% |
Total size in memory | 150.7 KiB |
Average record size in memory | 58.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 3 |
Text | 2 |
Dataset
Description | 한국도로공사 본선 도로관리용 CCTV 관련 정보를 제공한다.(노선번호, 노선명, CCTV명, 이정, 방향, 설치목적, 운영상태) |
---|---|
Author | 한국도로공사 |
URL | https://www.data.go.kr/data/15102134/fileData.do |
Dataset has 3 (0.1%) duplicate rows | Duplicates |
노선번호 is highly overall correlated with 노선명 | High correlation |
노선명 is highly overall correlated with 노선번호 | High correlation |
설치목적 is highly imbalanced (95.0%) | Imbalance |
운영상태 is highly imbalanced (98.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-11 23:24:12.468889 |
---|---|
Analysis finished | 2023-12-11 23:24:13.760319 |
Duration | 1.29 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
노선번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 37 |
---|---|
Distinct (%) | 1.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 74.49041 |
Minimum | 1 |
---|---|
Maximum | 651 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 23.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 15 |
median | 45 |
Q3 | 65 |
95-th percentile | 251 |
Maximum | 651 |
Range | 650 |
Interquartile range (IQR) | 50 |
Descriptive statistics
Standard deviation | 109.86602 |
---|---|
Coefficient of variation (CV) | 1.4749015 |
Kurtosis | 12.684366 |
Mean | 74.49041 |
Median Absolute Deviation (MAD) | 25 |
Skewness | 3.3669063 |
Sum | 198070 |
Variance | 12070.542 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 280 | 10.5% |
50 | 200 | 7.5% |
35 | 199 | 7.5% |
15 | 199 | 7.5% |
45 | 193 | 7.3% |
55 | 179 | 6.7% |
30 | 133 | 5.0% |
10 | 124 | 4.7% |
251 | 120 | 4.5% |
100 | 114 | 4.3% |
Other values (27) | 918 |
Value | Count | Frequency (%) |
1 | 280 | |
10 | 124 | |
12 | 74 | 2.8% |
15 | 199 | |
16 | 12 | 0.5% |
20 | 60 | 2.3% |
25 | 46 | 1.7% |
27 | 44 | 1.7% |
29 | 22 | 0.8% |
30 | 133 |
Value | Count | Frequency (%) |
651 | 29 | 1.1% |
600 | 23 | 0.9% |
551 | 7 | 0.3% |
451 | 25 | 0.9% |
400 | 2 | 0.1% |
351 | 4 | 0.2% |
301 | 9 | 0.3% |
300 | 8 | 0.3% |
253 | 14 | 0.5% |
251 | 120 |
노선명
Categorical
HIGH CORRELATION
 
Distinct | 39 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
경부선 | |
---|---|
서해안선 | |
영동선 | |
중부내륙선 | |
중앙선 | |
Other values (34) |
Length
Max length | 8 |
---|---|
Median length | 7 |
Mean length | 4.1259872 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 중부선 |
---|---|
2nd row | 중부선 |
3rd row | 중부선 |
4th row | 중부선 |
5th row | 중부선 |
Common Values
Value | Count | Frequency (%) |
경부선 | 310 | 11.7% |
서해안선 | 226 | 8.5% |
영동선 | 200 | 7.5% |
중부내륙선 | 193 | 7.3% |
중앙선 | 179 | 6.7% |
호남선 | 130 | 4.9% |
남해선 | 124 | 4.7% |
광주대구선 | 121 | 4.6% |
중부선 | 116 | 4.4% |
동해선 | 91 | 3.4% |
Other values (29) | 969 |
Length
Value | Count | Frequency (%) |
경부선 | 310 | 11.7% |
서해안선 | 226 | 8.5% |
영동선 | 200 | 7.5% |
중부내륙선 | 193 | 7.3% |
중앙선 | 179 | 6.7% |
호남선 | 130 | 4.9% |
남해선 | 124 | 4.7% |
광주대구선 | 121 | 4.6% |
중부선 | 116 | 4.4% |
동해선 | 91 | 3.4% |
Other values (29) | 969 |
CCTV명
Text
Distinct | 2564 |
---|---|
Distinct (%) | 96.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
Value | Count | Frequency (%) |
죽령졸음쉼터 | 4 | 0.1% |
졸음쉼터 | 3 | 0.1% |
검단 | 3 | 0.1% |
여주분기점 | 3 | 0.1% |
용산 | 2 | 0.1% |
광천 | 2 | 0.1% |
문학 | 2 | 0.1% |
강릉분기점 | 2 | 0.1% |
광명 | 2 | 0.1% |
옥포분기점 | 2 | 0.1% |
Other values (2564) | 2663 |
Most occurring characters
Value | Count | Frequency (%) |
교 | 1044 | 10.2% |
천 | 314 | 3.1% |
2 | 292 | 2.9% |
1 | 282 | 2.8% |
산 | 235 | 2.3% |
소 | 221 | 2.2% |
터 | 192 | 1.9% |
점 | 180 | 1.8% |
기 | 175 | 1.7% |
동 | 174 | 1.7% |
Other values (355) | 7098 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9090 | |
Decimal Number | 698 | 6.8% |
Uppercase Letter | 160 | 1.6% |
Open Punctuation | 87 | 0.9% |
Close Punctuation | 87 | 0.9% |
Space Separator | 48 | 0.5% |
Connector Punctuation | 16 | 0.2% |
Other Punctuation | 11 | 0.1% |
Dash Punctuation | 8 | 0.1% |
Lowercase Letter | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
교 | 1044 | 11.5% |
천 | 314 | 3.5% |
산 | 235 | 2.6% |
소 | 221 | 2.4% |
터 | 192 | 2.1% |
점 | 180 | 2.0% |
기 | 175 | 1.9% |
동 | 174 | 1.9% |
널 | 161 | 1.8% |
분 | 153 | 1.7% |
Other values (325) | 6241 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 63 | |
I | 49 | |
J | 15 | 9.4% |
S | 9 | 5.6% |
T | 5 | 3.1% |
P | 5 | 3.1% |
A | 4 | 2.5% |
B | 4 | 2.5% |
F | 2 | 1.2% |
G | 2 | 1.2% |
Other values (2) | 2 | 1.2% |
Decimal Number
Value | Count | Frequency (%) |
2 | 292 | |
1 | 282 | |
3 | 68 | 9.7% |
4 | 32 | 4.6% |
5 | 8 | 1.1% |
7 | 7 | 1.0% |
6 | 6 | 0.9% |
8 | 2 | 0.3% |
0 | 1 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
# | 6 | |
, | 5 |
Lowercase Letter
Value | Count | Frequency (%) |
c | 1 | |
t | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 87 |
Close Punctuation
Value | Count | Frequency (%) |
) | 87 |
Space Separator
Value | Count | Frequency (%) |
48 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 16 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9090 | |
Common | 955 | 9.4% |
Latin | 162 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
교 | 1044 | 11.5% |
천 | 314 | 3.5% |
산 | 235 | 2.6% |
소 | 221 | 2.4% |
터 | 192 | 2.1% |
점 | 180 | 2.0% |
기 | 175 | 1.9% |
동 | 174 | 1.9% |
널 | 161 | 1.8% |
분 | 153 | 1.7% |
Other values (325) | 6241 |
Common
Value | Count | Frequency (%) |
2 | 292 | |
1 | 282 | |
( | 87 | 9.1% |
) | 87 | 9.1% |
3 | 68 | 7.1% |
48 | 5.0% | |
4 | 32 | 3.4% |
_ | 16 | 1.7% |
- | 8 | 0.8% |
5 | 8 | 0.8% |
Other values (6) | 27 | 2.8% |
Latin
Value | Count | Frequency (%) |
C | 63 | |
I | 49 | |
J | 15 | 9.3% |
S | 9 | 5.6% |
T | 5 | 3.1% |
P | 5 | 3.1% |
A | 4 | 2.5% |
B | 4 | 2.5% |
F | 2 | 1.2% |
G | 2 | 1.2% |
Other values (4) | 4 | 2.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9090 | |
ASCII | 1117 | 10.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
교 | 1044 | 11.5% |
천 | 314 | 3.5% |
산 | 235 | 2.6% |
소 | 221 | 2.4% |
터 | 192 | 2.1% |
점 | 180 | 2.0% |
기 | 175 | 1.9% |
동 | 174 | 1.9% |
널 | 161 | 1.8% |
분 | 153 | 1.7% |
Other values (325) | 6241 |
ASCII
Value | Count | Frequency (%) |
2 | 292 | |
1 | 282 | |
( | 87 | 7.8% |
) | 87 | 7.8% |
3 | 68 | 6.1% |
C | 63 | 5.6% |
I | 49 | 4.4% |
48 | 4.3% | |
4 | 32 | 2.9% |
_ | 16 | 1.4% |
Other values (20) | 93 | 8.3% |
이정
Real number (ℝ)
Distinct | 2280 |
---|---|
Distinct (%) | 85.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 122.24659 |
Minimum | 0 |
---|---|
Maximum | 1906 |
Zeros | 1 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 23.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 5.2 |
Q1 | 33.251 |
median | 88.3 |
Q3 | 185.2 |
95-th percentile | 335.84 |
Maximum | 1906 |
Range | 1906 |
Interquartile range (IQR) | 151.949 |
Descriptive statistics
Standard deviation | 112.26601 |
---|---|
Coefficient of variation (CV) | 0.91835698 |
Kurtosis | 23.21761 |
Mean | 122.24659 |
Median Absolute Deviation (MAD) | 64.9 |
Skewness | 2.2575722 |
Sum | 325053.69 |
Variance | 12603.657 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.1 | 6 | 0.2% |
14.1 | 6 | 0.2% |
5.2 | 5 | 0.2% |
24.5 | 5 | 0.2% |
15.6 | 5 | 0.2% |
13.3 | 5 | 0.2% |
0.6 | 4 | 0.2% |
17.7 | 4 | 0.2% |
13.5 | 4 | 0.2% |
40.5 | 4 | 0.2% |
Other values (2270) | 2611 |
Value | Count | Frequency (%) |
0.0 | 1 | < 0.1% |
0.018 | 1 | < 0.1% |
0.02 | 1 | < 0.1% |
0.05 | 1 | < 0.1% |
0.1 | 6 | |
0.11 | 1 | < 0.1% |
0.184 | 1 | < 0.1% |
0.2 | 1 | < 0.1% |
0.27 | 2 | 0.1% |
0.3 | 1 | < 0.1% |
Value | Count | Frequency (%) |
1906.0 | 1 | |
418.6 | 1 | |
415.5 | 1 | |
413.2 | 1 | |
412.5 | 1 | |
411.4 | 1 | |
410.3 | 1 | |
409.4 | 1 | |
409.3 | 1 | |
409.1 | 1 |
방향
Text
Distinct | 65 |
---|---|
Distinct (%) | 2.4% |
Missing | 3 |
Missing (%) | 0.1% |
Memory size | 20.9 KiB |
Value | Count | Frequency (%) |
서울 | 367 | 13.8% |
부산 | 265 | 10.0% |
순천 | 170 | 6.4% |
인천 | 132 | 5.0% |
춘천 | 119 | 4.5% |
창원 | 109 | 4.1% |
양평 | 105 | 4.0% |
목포 | 96 | 3.6% |
강릉 | 87 | 3.3% |
대구 | 82 | 3.1% |
Other values (54) | 1124 |
Most occurring characters
Value | Count | Frequency (%) |
천 | 553 | 10.3% |
울 | 409 | 7.6% |
서 | 402 | 7.5% |
산 | 382 | 7.1% |
부 | 265 | 5.0% |
양 | 171 | 3.2% |
순 | 170 | 3.2% |
주 | 170 | 3.2% |
대 | 152 | 2.8% |
평 | 147 | 2.7% |
Other values (70) | 2532 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5352 | |
Space Separator | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
천 | 553 | 10.3% |
울 | 409 | 7.6% |
서 | 402 | 7.5% |
산 | 382 | 7.1% |
부 | 265 | 5.0% |
양 | 171 | 3.2% |
순 | 170 | 3.2% |
주 | 170 | 3.2% |
대 | 152 | 2.8% |
평 | 147 | 2.7% |
Other values (69) | 2531 |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5352 | |
Common | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
천 | 553 | 10.3% |
울 | 409 | 7.6% |
서 | 402 | 7.5% |
산 | 382 | 7.1% |
부 | 265 | 5.0% |
양 | 171 | 3.2% |
순 | 170 | 3.2% |
주 | 170 | 3.2% |
대 | 152 | 2.8% |
평 | 147 | 2.7% |
Other values (69) | 2531 |
Common
Value | Count | Frequency (%) |
1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5352 | |
ASCII | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
천 | 553 | 10.3% |
울 | 409 | 7.6% |
서 | 402 | 7.5% |
산 | 382 | 7.1% |
부 | 265 | 5.0% |
양 | 171 | 3.2% |
순 | 170 | 3.2% |
주 | 170 | 3.2% |
대 | 152 | 2.8% |
평 | 147 | 2.7% |
Other values (69) | 2531 |
ASCII
Value | Count | Frequency (%) |
1 |
설치목적
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
교통관리 | |
---|---|
교통관리/졸음쉼터 | 15 |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 4.0282061 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 교통관리 |
---|---|
2nd row | 교통관리 |
3rd row | 교통관리 |
4th row | 교통관리 |
5th row | 교통관리 |
Common Values
Value | Count | Frequency (%) |
교통관리 | 2644 | |
교통관리/졸음쉼터 | 15 | 0.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
교통관리 | 2644 | |
교통관리/졸음쉼터 | 15 | 0.6% |
운영상태
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
정상 | |
---|---|
<NA> | 4 |
가동중지 | 1 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0037608 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 정상 |
---|---|
2nd row | 정상 |
3rd row | 정상 |
4th row | 정상 |
5th row | 정상 |
Common Values
Value | Count | Frequency (%) |
정상 | 2654 | |
<NA> | 4 | 0.2% |
가동중지 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정상 | 2654 | |
na | 4 | 0.2% |
가동중지 | 1 | < 0.1% |
노선번호 | 노선명 | 이정 | 방향 | 설치목적 | 운영상태 | |
---|---|---|---|---|---|---|
노선번호 | 1.000 | 0.984 | 0.243 | 0.948 | 0.000 | 0.000 |
노선명 | 0.984 | 1.000 | 0.655 | 0.994 | 0.063 | 0.000 |
이정 | 0.243 | 0.655 | 1.000 | 0.582 | 0.000 | 0.000 |
방향 | 0.948 | 0.994 | 0.582 | 1.000 | 0.041 | 0.000 |
설치목적 | 0.000 | 0.063 | 0.000 | 0.041 | 1.000 | 0.000 |
운영상태 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
설치목적 | 운영상태 | 노선명 | |
---|---|---|---|
설치목적 | 1.000 | 0.000 | 0.052 |
운영상태 | 0.000 | 1.000 | 0.000 |
노선명 | 0.052 | 0.000 | 1.000 |
노선번호 | 이정 | 노선명 | 설치목적 | 운영상태 | |
---|---|---|---|---|---|
노선번호 | 1.000 | -0.388 | 0.877 | 0.000 | 0.000 |
이정 | -0.388 | 1.000 | 0.393 | 0.000 | 0.000 |
노선명 | 0.877 | 0.393 | 1.000 | 0.052 | 0.000 |
설치목적 | 0.000 | 0.000 | 0.052 | 1.000 | 0.000 |
운영상태 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
노선번호 | 노선명 | CCTV명 | 이정 | 방향 | 설치목적 | 운영상태 | |
---|---|---|---|---|---|---|---|
0 | 35 | 중부선 | 호법분기점 | 323.745 | 하남 | 교통관리 | 정상 |
1 | 35 | 중부선 | 안평 | 325.3 | 하남 | 교통관리 | 정상 |
2 | 35 | 중부선 | 마장분기점 | 325.981 | 남이 | 교통관리 | 정상 |
3 | 35 | 중부선 | 서이천 | 329.825 | 남이 | 교통관리 | 정상 |
4 | 35 | 중부선 | 이천휴게소 | 331.57 | 하남 | 교통관리 | 정상 |
5 | 35 | 중부선 | 용면교 | 332.359 | 남이 | 교통관리 | 정상 |
6 | 35 | 중부선 | 용면 | 333.734 | 하남 | 교통관리 | 정상 |
7 | 35 | 중부선 | 진우 | 335.004 | 남이 | 교통관리 | 정상 |
8 | 35 | 중부선 | 곤지암 | 339.916 | 남이 | 교통관리 | 정상 |
9 | 35 | 중부선 | 늑현육교 | 341.834 | 하남 | 교통관리 | 정상 |
노선번호 | 노선명 | CCTV명 | 이정 | 방향 | 설치목적 | 운영상태 | |
---|---|---|---|---|---|---|---|
2649 | 16 | 울산선 | 울산시점 | 1.3 | 울산 | 교통관리 | 정상 |
2650 | 16 | 울산선 | 장촌 | 2.4 | 울산 | 교통관리 | 정상 |
2651 | 55 | 중앙선 | 원창4교 | 378.14 | 부산 | 교통관리 | 정상 |
2652 | 16 | 울산선 | 울산졸음쉼터 | 4.0 | 울산 | 교통관리 | 정상 |
2653 | 16 | 울산선 | 반연육교 | 5.0 | 울산 | 교통관리 | 정상 |
2654 | 15 | 서해안선 | 홍원육교 | 287.51 | 목포 | 교통관리 | 정상 |
2655 | 15 | 서해안선 | 구포2교 | 312.03 | 서울 | 교통관리 | 정상 |
2656 | 16 | 울산선 | 입암 | 9.5 | 언양 | 교통관리 | 정상 |
2657 | 40 | 평택제천선 | 청룡교 | 22.0 | 제천 | 교통관리 | 정상 |
2658 | 16 | 울산선 | 울산종점 | 13.53 | 언양 | 교통관리 | 정상 |
Most frequently occurring
노선번호 | 노선명 | CCTV명 | 이정 | 방향 | 설치목적 | 운영상태 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 55 | 중앙선 | 죽령졸음쉼터 | 243.8 | 부산 | 교통관리/졸음쉼터 | 정상 | 2 |
1 | 55 | 중앙선 | 죽령졸음쉼터 | 244.1 | 춘천 | 교통관리/졸음쉼터 | 정상 | 2 |
2 | 60 | 서울양양선 | 남춘천영업소 | 56.27 | 서울 | 교통관리 | 정상 | 2 |