Overview

Dataset statistics

Number of variables3
Number of observations160
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory4.0 KiB
Average record size in memory25.8 B

Variable types

Numeric1
Text2

Dataset

Description외국어 운전면허 학과시험 용어 해설집(베트남어) 외국어 학과시험을 준비하는 외국인의 이해를 돕기 위해 만든 용어 해설집 입니다
URLhttps://www.data.go.kr/data/15044316/fileData.do

Alerts

순번 has unique valuesUnique
해설 has unique valuesUnique

Reproduction

Analysis started2023-12-12 07:56:32.088325
Analysis finished2023-12-12 07:56:32.468740
Duration0.38 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

순번
Real number (ℝ)

UNIQUE 

Distinct160
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean80.5
Minimum1
Maximum160
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.5 KiB
2023-12-12T16:56:32.554461image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile8.95
Q140.75
median80.5
Q3120.25
95-th percentile152.05
Maximum160
Range159
Interquartile range (IQR)79.5

Descriptive statistics

Standard deviation46.332134
Coefficient of variation (CV)0.57555446
Kurtosis-1.2
Mean80.5
Median Absolute Deviation (MAD)40
Skewness0
Sum12880
Variance2146.6667
MonotonicityStrictly increasing
2023-12-12T16:56:32.712195image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
0.6%
82 1
 
0.6%
104 1
 
0.6%
105 1
 
0.6%
106 1
 
0.6%
107 1
 
0.6%
108 1
 
0.6%
109 1
 
0.6%
110 1
 
0.6%
111 1
 
0.6%
Other values (150) 150
93.8%
ValueCountFrequency (%)
1 1
0.6%
2 1
0.6%
3 1
0.6%
4 1
0.6%
5 1
0.6%
6 1
0.6%
7 1
0.6%
8 1
0.6%
9 1
0.6%
10 1
0.6%
ValueCountFrequency (%)
160 1
0.6%
159 1
0.6%
158 1
0.6%
157 1
0.6%
156 1
0.6%
155 1
0.6%
154 1
0.6%
153 1
0.6%
152 1
0.6%
151 1
0.6%

용어
Text

Distinct157
Distinct (%)98.1%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
2023-12-12T16:56:33.113777image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length42
Median length26
Mean length16.975
Min length6

Characters and Unicode

Total characters2716
Distinct characters101
Distinct categories5 ?
Distinct scripts2 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique154 ?
Unique (%)96.2%

Sample

1st rowKhu vực lề đường
2nd rowXe 2 bánh
3rd rowĐường 2 chiều
4th rowLàn đường tăng tốc
5th rowTầm nhìn xa
ValueCountFrequency (%)
xe 37
 
5.8%
đường 29
 
4.6%
đèn 13
 
2.0%
độ 13
 
2.0%
lái 13
 
2.0%
khu 12
 
1.9%
báo 12
 
1.9%
vực 11
 
1.7%
tốc 11
 
1.7%
bộ 8
 
1.3%
Other values (261) 477
75.0%
2023-12-12T16:56:34.026940image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
529
19.5%
n 253
 
9.3%
h 177
 
6.5%
g 139
 
5.1%
i 127
 
4.7%
t 116
 
4.3%
c 94
 
3.5%
ư 62
 
2.3%
u 61
 
2.2%
á 59
 
2.2%
Other values (91) 1099
40.5%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 2022
74.4%
Space Separator 529
 
19.5%
Uppercase Letter 161
 
5.9%
Decimal Number 3
 
0.1%
Dash Punctuation 1
 
< 0.1%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
n 253
 
12.5%
h 177
 
8.8%
g 139
 
6.9%
i 127
 
6.3%
t 116
 
5.7%
c 94
 
4.6%
ư 62
 
3.1%
u 61
 
3.0%
á 59
 
2.9%
o 55
 
2.7%
Other values (70) 879
43.5%
Uppercase Letter
ValueCountFrequency (%)
Đ 39
24.2%
K 23
14.3%
B 20
12.4%
T 15
 
9.3%
X 14
 
8.7%
L 8
 
5.0%
C 8
 
5.0%
H 6
 
3.7%
V 6
 
3.7%
G 4
 
2.5%
Other values (8) 18
11.2%
Space Separator
ValueCountFrequency (%)
529
100.0%
Decimal Number
ValueCountFrequency (%)
2 3
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 2183
80.4%
Common 533
 
19.6%

Most frequent character per script

Latin
ValueCountFrequency (%)
n 253
 
11.6%
h 177
 
8.1%
g 139
 
6.4%
i 127
 
5.8%
t 116
 
5.3%
c 94
 
4.3%
ư 62
 
2.8%
u 61
 
2.8%
á 59
 
2.7%
o 55
 
2.5%
Other values (88) 1040
47.6%
Common
ValueCountFrequency (%)
529
99.2%
2 3
 
0.6%
- 1
 
0.2%

Most occurring blocks

ValueCountFrequency (%)
ASCII 2064
76.0%
Latin Ext Additional 327
 
12.0%
None 325
 
12.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
529
25.6%
n 253
12.3%
h 177
 
8.6%
g 139
 
6.7%
i 127
 
6.2%
t 116
 
5.6%
c 94
 
4.6%
u 61
 
3.0%
o 55
 
2.7%
a 54
 
2.6%
Other values (31) 459
22.2%
None
ValueCountFrequency (%)
ư 62
19.1%
á 59
18.2%
đ 45
13.8%
Đ 39
12.0%
ô 19
 
5.8%
à 19
 
5.8%
í 14
 
4.3%
è 14
 
4.3%
ê 12
 
3.7%
â 7
 
2.2%
Other values (12) 35
10.8%
Latin Ext Additional
ValueCountFrequency (%)
39
 
11.9%
29
 
8.9%
23
 
7.0%
21
 
6.4%
20
 
6.1%
19
 
5.8%
18
 
5.5%
17
 
5.2%
15
 
4.6%
15
 
4.6%
Other values (28) 111
33.9%

해설
Text

UNIQUE 

Distinct160
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
2023-12-12T16:56:34.444015image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length241
Median length114
Mean length82.775
Min length6

Characters and Unicode

Total characters13244
Distinct characters114
Distinct categories7 ?
Distinct scripts2 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique160 ?
Unique (%)100.0%

Sample

1st rowLà phần lề đường biểu thị ranh giới biểu thị an toàn nhằm xác định sự an toàn của người bộ hành ở những làn đường không phân biệt lòng đường và vỉa hè
2nd rowLà các loại xe hai bánh được chế tạo thích hợp để trở 2 người trên 1 xe hoặc các loại xe có gắn thêm 1 bánh xe nữa
3rd rowLà khái niệm để phân biệt rõ rệt với đường một chiều
4th rowLàn đường thay đổi tốc độ ở khu vực tăng tốc nhằm nâng cao tốc dộ của xe nhập vào làn đường chính đến tốc độ nhập vào một cách an toàn
5th rowLà khoảng cách người lái xe có thể nhìn bằng mắt
ValueCountFrequency (%)
xe 145
 
4.7%
96
 
3.1%
đường 79
 
2.6%
của 57
 
1.9%
được 48
 
1.6%
cho 47
 
1.5%
47
 
1.5%
43
 
1.4%
thông 40
 
1.3%
lái 40
 
1.3%
Other values (581) 2427
79.1%
2023-12-12T16:56:35.010967image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2940
22.2%
n 1108
 
8.4%
h 884
 
6.7%
t 628
 
4.7%
c 626
 
4.7%
i 622
 
4.7%
g 608
 
4.6%
đ 339
 
2.6%
a 295
 
2.2%
ư 276
 
2.1%
Other values (104) 4918
37.1%

Most occurring categories

ValueCountFrequency (%)
Lowercase Letter 10103
76.3%
Space Separator 2940
 
22.2%
Uppercase Letter 172
 
1.3%
Decimal Number 19
 
0.1%
Other Punctuation 4
 
< 0.1%
Close Punctuation 3
 
< 0.1%
Open Punctuation 3
 
< 0.1%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
n 1108
 
11.0%
h 884
 
8.7%
t 628
 
6.2%
c 626
 
6.2%
i 622
 
6.2%
g 608
 
6.0%
đ 339
 
3.4%
a 295
 
2.9%
ư 276
 
2.7%
à 253
 
2.5%
Other values (75) 4464
44.2%
Uppercase Letter
ValueCountFrequency (%)
L 101
58.7%
Đ 14
 
8.1%
T 12
 
7.0%
B 11
 
6.4%
K 8
 
4.7%
H 6
 
3.5%
C 3
 
1.7%
D 3
 
1.7%
V 3
 
1.7%
G 2
 
1.2%
Other values (6) 9
 
5.2%
Decimal Number
ValueCountFrequency (%)
1 5
26.3%
0 4
21.1%
2 3
15.8%
4 2
 
10.5%
5 2
 
10.5%
6 1
 
5.3%
3 1
 
5.3%
9 1
 
5.3%
Other Punctuation
ValueCountFrequency (%)
/ 3
75.0%
: 1
 
25.0%
Space Separator
ValueCountFrequency (%)
2940
100.0%
Close Punctuation
ValueCountFrequency (%)
) 3
100.0%
Open Punctuation
ValueCountFrequency (%)
( 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Latin 10275
77.6%
Common 2969
 
22.4%

Most frequent character per script

Latin
ValueCountFrequency (%)
n 1108
 
10.8%
h 884
 
8.6%
t 628
 
6.1%
c 626
 
6.1%
i 622
 
6.1%
g 608
 
5.9%
đ 339
 
3.3%
a 295
 
2.9%
ư 276
 
2.7%
à 253
 
2.5%
Other values (91) 4636
45.1%
Common
ValueCountFrequency (%)
2940
99.0%
1 5
 
0.2%
0 4
 
0.1%
/ 3
 
0.1%
2 3
 
0.1%
) 3
 
0.1%
( 3
 
0.1%
4 2
 
0.1%
5 2
 
0.1%
6 1
 
< 0.1%
Other values (3) 3
 
0.1%

Most occurring blocks

ValueCountFrequency (%)
ASCII 10110
76.3%
None 1570
 
11.9%
Latin Ext Additional 1564
 
11.8%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2940
29.1%
n 1108
 
11.0%
h 884
 
8.7%
t 628
 
6.2%
c 626
 
6.2%
i 622
 
6.2%
g 608
 
6.0%
a 295
 
2.9%
o 253
 
2.5%
u 196
 
1.9%
Other values (40) 1950
19.3%
None
ValueCountFrequency (%)
đ 339
21.6%
ư 276
17.6%
à 253
16.1%
á 202
12.9%
ô 91
 
5.8%
ê 62
 
3.9%
ó 60
 
3.8%
í 49
 
3.1%
â 45
 
2.9%
ì 34
 
2.2%
Other values (14) 159
10.1%
Latin Ext Additional
ValueCountFrequency (%)
141
 
9.0%
135
 
8.6%
110
 
7.0%
104
 
6.6%
91
 
5.8%
86
 
5.5%
69
 
4.4%
ế 66
 
4.2%
63
 
4.0%
62
 
4.0%
Other values (30) 637
40.7%

Interactions

2023-12-12T16:56:32.233459image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Missing values

2023-12-12T16:56:32.372708image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T16:56:32.441975image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

순번용어해설
01Khu vực lề đườngLà phần lề đường biểu thị ranh giới biểu thị an toàn nhằm xác định sự an toàn của người bộ hành ở những làn đường không phân biệt lòng đường và vỉa hè
12Xe 2 bánhLà các loại xe hai bánh được chế tạo thích hợp để trở 2 người trên 1 xe hoặc các loại xe có gắn thêm 1 bánh xe nữa
23Đường 2 chiềuLà khái niệm để phân biệt rõ rệt với đường một chiều
34Làn đường tăng tốcLàn đường thay đổi tốc độ ở khu vực tăng tốc nhằm nâng cao tốc dộ của xe nhập vào làn đường chính đến tốc độ nhập vào một cách an toàn
45Tầm nhìn xaLà khoảng cách người lái xe có thể nhìn bằng mắt
56Tỉ lệ truyền sángLà tỉ lệ truyền sáng sau khi dán phim lên kính xe
67Đường vành đaiLà phần rìa đường của lòng đường được xây dựng để xe có thể chạy trên đường dành riêng cho ô tô hoặc đường cao tốc
78Đường giao nhau với đường tàuBộ phận giao nhau giữa đường bộ và đường sắt
89Luật quản lí máy móc xây dựngLà bộ luật quy định các nội dung cần thiết liên quan đến đăng kí kiểm tra công nhận hình thức của các loại máy móc xây dựng nhằm thúc đẩy máy móc hóa cho các công trình xây dựng
910Bằng lái máy móc xây dựngLà bằng lái cần có để điều khiển các loại thiết bị máy móc xây dựng
순번용어해설
150151Xe nối thêmLà loại xe có gắn thêm vào xe hai bánh như xe đạp động cơ hay xe đạp
151152Khả năng tiếp đất cuả bánh xeLà độ tiếp đất của bánh xe
152153Bằng lái đặc biệtLà loại bằng lái cần có để để lái các loại xe như xe nén
153154Xe ô tô đặc biệtLà loại ô tô có cấu tạo đặc biệt
154155Dán phimLà việc dán phim vào kính xe để ngăn tia ánh xạ giảm bớt độ phản xạ và bảo vệ đời sống riêng tư
155156Hiện tượng nghẽn phanhLà hiện tượng đạp phanh khi xe chạy với tốc độ nhanh nhưng phanh hoạt động không được tốt
156157Còi báo hỏa hoạnLà thiết bị được tạo từ máy nhận và nghi lại tín hiệu nhận thông tin từ máy báo thông báo khi phát sinh hoả hoạn còi báo âm thanh
157158Làn đường quay vòngLà một trong những phương thức giao làn trên đường
158159Vạch sang đườngLà nơi biểu thị bộ phận được xây dựng dể người bộ hànhqua đường dựa vào biến báo đường bộ theo Luật giao thông và đường bộ
159160Kính chiếu hậuLà kính được gắn phía bên ngoài tấm kính ở phía sau của xe giúp người lái xe có thể nhìn các xe sau được rõ hơn