Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 499 |
Missing cells | 545 |
Missing cells (%) | 27.3% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.2% |
Total size in memory | 16.7 KiB |
Average record size in memory | 34.3 B |
Variable types
Text | 2 |
---|---|
Numeric | 2 |
Dataset
Description | 2020년 4/4분기(12월말 기준) 전국에 소재한 자동차 운전전문학원 목록 현황(학원명, 주소, 부지면적, 교육생 정원) 자료입니다. |
---|---|
Author | 경찰청 |
URL | https://www.data.go.kr/data/15029970/fileData.do |
Dataset has 1 (0.2%) duplicate rows | Duplicates |
학원명 has 135 (27.1%) missing values | Missing |
주 소 has 136 (27.3%) missing values | Missing |
총부지면적(㎡) has 137 (27.5%) missing values | Missing |
교육생정원(명) has 137 (27.5%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 22:28:44.090693 |
---|---|
Analysis finished | 2023-12-12 22:28:45.110275 |
Duration | 1.02 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
학원명
Text
MISSING
 
Distinct | 334 |
---|---|
Distinct (%) | 91.8% |
Missing | 135 |
Missing (%) | 27.1% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
신진 | 6 | 1.6% |
대성 | 4 | 1.1% |
쌍용 | 3 | 0.8% |
대우 | 3 | 0.8% |
신세계 | 3 | 0.8% |
한일 | 3 | 0.8% |
신삼성 | 2 | 0.5% |
영동 | 2 | 0.5% |
삼성 | 2 | 0.5% |
제일 | 2 | 0.5% |
Other values (324) | 336 |
Most occurring characters
Value | Count | Frequency (%) |
( | 57 | 5.2% |
) | 57 | 5.2% |
주 | 45 | 4.1% |
성 | 44 | 4.0% |
대 | 37 | 3.4% |
신 | 35 | 3.2% |
천 | 30 | 2.8% |
동 | 30 | 2.8% |
일 | 28 | 2.6% |
양 | 22 | 2.0% |
Other values (179) | 703 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 960 | |
Open Punctuation | 57 | 5.2% |
Close Punctuation | 57 | 5.2% |
Uppercase Letter | 6 | 0.6% |
Decimal Number | 4 | 0.4% |
Space Separator | 2 | 0.2% |
Lowercase Letter | 2 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 45 | 4.7% |
성 | 44 | 4.6% |
대 | 37 | 3.9% |
신 | 35 | 3.6% |
천 | 30 | 3.1% |
동 | 30 | 3.1% |
일 | 28 | 2.9% |
양 | 22 | 2.3% |
영 | 21 | 2.2% |
남 | 21 | 2.2% |
Other values (167) | 647 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 1 | |
K | 1 | |
O | 1 | |
W | 1 | |
E | 1 | |
N | 1 |
Decimal Number
Value | Count | Frequency (%) |
2 | 3 | |
1 | 1 | 25.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 57 |
Close Punctuation
Value | Count | Frequency (%) |
) | 57 |
Space Separator
Value | Count | Frequency (%) |
2 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 960 | |
Common | 120 | 11.0% |
Latin | 8 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 45 | 4.7% |
성 | 44 | 4.6% |
대 | 37 | 3.9% |
신 | 35 | 3.6% |
천 | 30 | 3.1% |
동 | 30 | 3.1% |
일 | 28 | 2.9% |
양 | 22 | 2.3% |
영 | 21 | 2.2% |
남 | 21 | 2.2% |
Other values (167) | 647 |
Latin
Value | Count | Frequency (%) |
e | 2 | |
C | 1 | |
K | 1 | |
O | 1 | |
W | 1 | |
E | 1 | |
N | 1 |
Common
Value | Count | Frequency (%) |
( | 57 | |
) | 57 | |
2 | 3 | 2.5% |
2 | 1.7% | |
1 | 1 | 0.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 960 | |
ASCII | 128 | 11.8% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 57 | |
) | 57 | |
2 | 3 | 2.3% |
2 | 1.6% | |
e | 2 | 1.6% |
C | 1 | 0.8% |
1 | 1 | 0.8% |
K | 1 | 0.8% |
O | 1 | 0.8% |
W | 1 | 0.8% |
Other values (2) | 2 | 1.6% |
Hangul
Value | Count | Frequency (%) |
주 | 45 | 4.7% |
성 | 44 | 4.6% |
대 | 37 | 3.9% |
신 | 35 | 3.6% |
천 | 30 | 3.1% |
동 | 30 | 3.1% |
일 | 28 | 2.9% |
양 | 22 | 2.3% |
영 | 21 | 2.2% |
남 | 21 | 2.2% |
Other values (167) | 647 |
주 소
Text
MISSING
 
Distinct | 362 |
---|---|
Distinct (%) | 99.7% |
Missing | 136 |
Missing (%) | 27.3% |
Memory size | 4.0 KiB |
Length
Max length | 46 |
---|---|
Median length | 36 |
Mean length | 26.721763 |
Min length | 11 |
Characters and Unicode
Total characters | 9700 |
---|---|
Distinct characters | 323 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 361 ? |
---|---|
Unique (%) | 99.4% |
Sample
1st row | 서울 강남구 헌릉로 733, (세곡동, 광일자동차운전학원) |
---|---|
2nd row | 서울 강남구 헌릉로 736, (세곡동, 삼일자동차운전학원) |
3rd row | 서울 도봉구 도봉로136다길 4, (창동, 창동운전전문학원) |
4th row | 서울 노원구 마들로5길 91, (월계동, 녹천자동차운전학원) |
5th row | 서울 서초구 과천대로 904-6, (방배동, 사당자동차운전면허학원) |
Value | Count | Frequency (%) |
경기 | 70 | 3.5% |
경북 | 40 | 2.0% |
경남 | 32 | 1.6% |
충남 | 27 | 1.4% |
전남 | 26 | 1.3% |
전북 | 23 | 1.2% |
강원 | 23 | 1.2% |
충북 | 20 | 1.0% |
부산 | 18 | 0.9% |
인천 | 17 | 0.9% |
Other values (1286) | 1697 |
Most occurring characters
Value | Count | Frequency (%) |
1630 | 16.8% | |
동 | 405 | 4.2% |
, | 342 | 3.5% |
) | 254 | 2.6% |
( | 254 | 2.6% |
로 | 253 | 2.6% |
전 | 250 | 2.6% |
1 | 241 | 2.5% |
원 | 230 | 2.4% |
시 | 211 | 2.2% |
Other values (313) | 5630 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5785 | |
Space Separator | 1630 | 16.8% |
Decimal Number | 1314 | 13.5% |
Other Punctuation | 343 | 3.5% |
Close Punctuation | 254 | 2.6% |
Open Punctuation | 254 | 2.6% |
Dash Punctuation | 110 | 1.1% |
Lowercase Letter | 5 | 0.1% |
Uppercase Letter | 4 | < 0.1% |
Other Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 405 | 7.0% |
로 | 253 | 4.4% |
전 | 250 | 4.3% |
원 | 230 | 4.0% |
시 | 211 | 3.6% |
경 | 176 | 3.0% |
학 | 171 | 3.0% |
자 | 160 | 2.8% |
구 | 158 | 2.7% |
차 | 150 | 2.6% |
Other values (288) | 3621 |
Decimal Number
Value | Count | Frequency (%) |
1 | 241 | |
2 | 204 | |
3 | 160 | |
6 | 122 | |
4 | 113 | |
5 | 108 | |
7 | 98 | |
0 | 94 | 7.2% |
8 | 88 | 6.7% |
9 | 86 | 6.5% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 2 | |
o | 1 | |
k | 1 | |
c | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 1 | |
S | 1 | |
C | 1 | |
L | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 342 | |
. | 1 | 0.3% |
Space Separator
Value | Count | Frequency (%) |
1630 |
Close Punctuation
Value | Count | Frequency (%) |
) | 254 |
Open Punctuation
Value | Count | Frequency (%) |
( | 254 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 110 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5786 | |
Common | 3905 | |
Latin | 9 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 405 | 7.0% |
로 | 253 | 4.4% |
전 | 250 | 4.3% |
원 | 230 | 4.0% |
시 | 211 | 3.6% |
경 | 176 | 3.0% |
학 | 171 | 3.0% |
자 | 160 | 2.8% |
구 | 158 | 2.7% |
차 | 150 | 2.6% |
Other values (289) | 3622 |
Common
Value | Count | Frequency (%) |
1630 | ||
, | 342 | 8.8% |
) | 254 | 6.5% |
( | 254 | 6.5% |
1 | 241 | 6.2% |
2 | 204 | 5.2% |
3 | 160 | 4.1% |
6 | 122 | 3.1% |
4 | 113 | 2.9% |
- | 110 | 2.8% |
Other values (6) | 475 | 12.2% |
Latin
Value | Count | Frequency (%) |
e | 2 | |
K | 1 | |
S | 1 | |
o | 1 | |
k | 1 | |
C | 1 | |
L | 1 | |
c | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5785 | |
ASCII | 3914 | |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1630 | ||
, | 342 | 8.7% |
) | 254 | 6.5% |
( | 254 | 6.5% |
1 | 241 | 6.2% |
2 | 204 | 5.2% |
3 | 160 | 4.1% |
6 | 122 | 3.1% |
4 | 113 | 2.9% |
- | 110 | 2.8% |
Other values (14) | 484 | 12.4% |
Hangul
Value | Count | Frequency (%) |
동 | 405 | 7.0% |
로 | 253 | 4.4% |
전 | 250 | 4.3% |
원 | 230 | 4.0% |
시 | 211 | 3.6% |
경 | 176 | 3.0% |
학 | 171 | 3.0% |
자 | 160 | 2.8% |
구 | 158 | 2.7% |
차 | 150 | 2.6% |
Other values (288) | 3621 |
None
Value | Count | Frequency (%) |
㈜ | 1 |
총부지면적(㎡)
Real number (ℝ)
MISSING
 
Distinct | 350 |
---|---|
Distinct (%) | 96.7% |
Missing | 137 |
Missing (%) | 27.5% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 11917.019 |
Minimum | 0 |
---|---|
Maximum | 150514 |
Zeros | 1 |
Zeros (%) | 0.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 6715.4 |
Q1 | 8612 |
median | 9981 |
Q3 | 13375.25 |
95-th percentile | 19678.8 |
Maximum | 150514 |
Range | 150514 |
Interquartile range (IQR) | 4763.25 |
Descriptive statistics
Standard deviation | 9912.9423 |
---|---|
Coefficient of variation (CV) | 0.83183068 |
Kurtosis | 130.06917 |
Mean | 11917.019 |
Median Absolute Deviation (MAD) | 2066 |
Skewness | 10.264978 |
Sum | 4313961 |
Variance | 98266426 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
9900 | 3 | 0.6% |
9208 | 2 | 0.4% |
6909 | 2 | 0.4% |
11330 | 2 | 0.4% |
8972 | 2 | 0.4% |
6700 | 2 | 0.4% |
6817 | 2 | 0.4% |
14576 | 2 | 0.4% |
11219 | 2 | 0.4% |
9927 | 2 | 0.4% |
Other values (340) | 341 | |
(Missing) | 137 |
Value | Count | Frequency (%) |
0 | 1 | |
169 | 1 | |
196 | 1 | |
210 | 1 | |
3244 | 1 | |
3907 | 1 | |
6546 | 1 | |
6618 | 1 | |
6619 | 1 | |
6637 | 1 |
Value | Count | Frequency (%) |
150514 | 1 | |
108310 | 1 | |
38160 | 1 | |
32016 | 1 | |
26471 | 1 | |
25850 | 1 | |
23288 | 1 | |
22008 | 1 | |
21795 | 1 | |
21629 | 1 |
교육생정원(명)
Real number (ℝ)
MISSING
 
Distinct | 130 |
---|---|
Distinct (%) | 35.9% |
Missing | 137 |
Missing (%) | 27.5% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 210.11326 |
Minimum | 0 |
---|---|
Maximum | 1024 |
Zeros | 3 |
Zeros (%) | 0.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 56 |
Q1 | 109 |
median | 168.5 |
Q3 | 252 |
95-th percentile | 577.9 |
Maximum | 1024 |
Range | 1024 |
Interquartile range (IQR) | 143 |
Descriptive statistics
Standard deviation | 158.46392 |
---|---|
Coefficient of variation (CV) | 0.75418336 |
Kurtosis | 4.7788725 |
Mean | 210.11326 |
Median Absolute Deviation (MAD) | 69.5 |
Skewness | 1.9976094 |
Sum | 76061 |
Variance | 25110.815 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
56 | 23 | 4.6% |
196 | 18 | 3.6% |
168 | 12 | 2.4% |
182 | 11 | 2.2% |
84 | 11 | 2.2% |
192 | 11 | 2.2% |
112 | 10 | 2.0% |
96 | 10 | 2.0% |
126 | 10 | 2.0% |
98 | 9 | 1.8% |
Other values (120) | 237 | |
(Missing) | 137 |
Value | Count | Frequency (%) |
0 | 3 | 0.6% |
28 | 1 | 0.2% |
32 | 1 | 0.2% |
42 | 1 | 0.2% |
45 | 1 | 0.2% |
48 | 2 | 0.4% |
56 | 23 | |
58 | 1 | 0.2% |
60 | 3 | 0.6% |
64 | 4 | 0.8% |
Value | Count | Frequency (%) |
1024 | 1 | |
908 | 1 | |
833 | 1 | |
792 | 1 | |
780 | 1 | |
748 | 1 | |
742 | 1 | |
728 | 1 | |
648 | 1 | |
640 | 1 |
총부지면적(㎡) | 교육생정원(명) | |
---|---|---|
총부지면적(㎡) | 1.000 | 0.232 |
교육생정원(명) | 0.232 | 1.000 |
총부지면적(㎡) | 교육생정원(명) | |
---|---|---|
총부지면적(㎡) | 1.000 | 0.245 |
교육생정원(명) | 0.245 | 1.000 |
학원명 | 주 소 | 총부지면적(㎡) | 교육생정원(명) | |
---|---|---|---|---|
0 | 광연 | 서울 강남구 헌릉로 733, (세곡동, 광일자동차운전학원) | 12771 | 405 |
1 | 삼일 | 서울 강남구 헌릉로 736, (세곡동, 삼일자동차운전학원) | 13586 | 578 |
2 | 창동 | 서울 도봉구 도봉로136다길 4, (창동, 창동운전전문학원) | 17914 | 416 |
3 | 녹천 | 서울 노원구 마들로5길 91, (월계동, 녹천자동차운전학원) | 8232 | 630 |
4 | 사당 | 서울 서초구 과천대로 904-6, (방배동, 사당자동차운전면허학원) | 11013 | 640 |
5 | 서울 | 서울 강서구 남부순환로 222, (외발산동, 서울자동차학원) | 10491 | 792 |
6 | 온수역 | 서울 구로구 부일로1가길 18-44, (온수동) | 8383 | 432 |
7 | 중랑 | 서울 중랑구 상봉로 117, (상봉동, 상봉시외버스터미널) | 6905 | 416 |
8 | 양재 | 서울 서초구 남부순환로342길 62-26, (양재동, 양재자동차운전학원) | 8389 | 476 |
9 | 신도림 | 서울 구로구 신도림로19길 68, (신도림동, 신도림자동차전문학원) | 17195 | 1024 |
학원명 | 주 소 | 총부지면적(㎡) | 교육생정원(명) | |
---|---|---|---|---|
489 | <NA> | <NA> | <NA> | <NA> |
490 | <NA> | <NA> | <NA> | <NA> |
491 | <NA> | <NA> | <NA> | <NA> |
492 | <NA> | <NA> | <NA> | <NA> |
493 | <NA> | <NA> | <NA> | <NA> |
494 | <NA> | <NA> | <NA> | <NA> |
495 | <NA> | <NA> | <NA> | <NA> |
496 | <NA> | <NA> | <NA> | <NA> |
497 | <NA> | <NA> | <NA> | <NA> |
498 | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
학원명 | 주 소 | 총부지면적(㎡) | 교육생정원(명) | # duplicates | |
---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | 135 |