Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 2585 |
Missing cells (%) | 4.3% |
Duplicate rows | 259 |
Duplicate rows (%) | 2.6% |
Total size in memory | 556.6 KiB |
Average record size in memory | 57.0 B |
Variable types
DateTime | 2 |
---|---|
Text | 2 |
Categorical | 1 |
Numeric | 1 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-21245/F/1/datasetView.do |
기준년월 has constant value "" | Constant |
Dataset has 259 (2.6%) duplicate rows | Duplicates |
연료 is highly imbalanced (81.5%) | Imbalance |
현소유자의출생년도 has 2582 (25.8%) missing values | Missing |
Reproduction
Analysis started | 2024-03-13 07:47:35.110577 |
---|---|
Analysis finished | 2024-03-13 07:47:35.983475 |
Duration | 0.87 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기준년월
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2016-12-01 00:00:00 |
---|---|
Maximum | 2016-12-01 00:00:00 |
사용본거지시읍면동_행정동기준
Text
Distinct | 424 |
---|---|
Distinct (%) | 4.2% |
Missing | 3 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 21 |
---|---|
Median length | 14 |
Mean length | 13.846754 |
Min length | 11 |
Characters and Unicode
Total characters | 138426 |
---|---|
Distinct characters | 194 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 서울특별시 성북구 정릉1동 |
---|---|
2nd row | 서울특별시 양천구 목2동 |
3rd row | 서울특별시 강서구 화곡3동 |
4th row | 서울특별시 금천구 시흥3동 |
5th row | 서울특별시 강동구 성내2동 |
Value | Count | Frequency (%) |
서울특별시 | 9997 | |
강남구 | 1357 | 4.5% |
서초구 | 966 | 3.2% |
강서구 | 847 | 2.8% |
송파구 | 726 | 2.4% |
역삼1동 | 593 | 2.0% |
영등포구 | 563 | 1.9% |
마포구 | 445 | 1.5% |
강동구 | 383 | 1.3% |
양천구 | 380 | 1.3% |
Other values (439) | 13734 |
Most occurring characters
Value | Count | Frequency (%) |
19994 | ||
서 | 12323 | 8.9% |
동 | 11237 | 8.1% |
구 | 10656 | 7.7% |
시 | 10082 | 7.3% |
별 | 9997 | 7.2% |
울 | 9997 | 7.2% |
특 | 9997 | 7.2% |
1 | 3182 | 2.3% |
강 | 2858 | 2.1% |
Other values (184) | 38103 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 111417 | |
Space Separator | 19994 | 14.4% |
Decimal Number | 6862 | 5.0% |
Other Punctuation | 153 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 12323 | 11.1% |
동 | 11237 | 10.1% |
구 | 10656 | 9.6% |
시 | 10082 | 9.0% |
별 | 9997 | 9.0% |
울 | 9997 | 9.0% |
특 | 9997 | 9.0% |
강 | 2858 | 2.6% |
남 | 1449 | 1.3% |
양 | 1261 | 1.1% |
Other values (172) | 31560 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3182 | |
2 | 2020 | |
3 | 754 | 11.0% |
4 | 475 | 6.9% |
5 | 154 | 2.2% |
6 | 122 | 1.8% |
7 | 98 | 1.4% |
8 | 38 | 0.6% |
0 | 10 | 0.1% |
9 | 9 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
19994 |
Other Punctuation
Value | Count | Frequency (%) |
. | 153 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 111417 | |
Common | 27009 | 19.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 12323 | 11.1% |
동 | 11237 | 10.1% |
구 | 10656 | 9.6% |
시 | 10082 | 9.0% |
별 | 9997 | 9.0% |
울 | 9997 | 9.0% |
특 | 9997 | 9.0% |
강 | 2858 | 2.6% |
남 | 1449 | 1.3% |
양 | 1261 | 1.1% |
Other values (172) | 31560 |
Common
Value | Count | Frequency (%) |
19994 | ||
1 | 3182 | 11.8% |
2 | 2020 | 7.5% |
3 | 754 | 2.8% |
4 | 475 | 1.8% |
5 | 154 | 0.6% |
. | 153 | 0.6% |
6 | 122 | 0.5% |
7 | 98 | 0.4% |
8 | 38 | 0.1% |
Other values (2) | 19 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 111417 | |
ASCII | 27009 | 19.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
19994 | ||
1 | 3182 | 11.8% |
2 | 2020 | 7.5% |
3 | 754 | 2.8% |
4 | 475 | 1.8% |
5 | 154 | 0.6% |
. | 153 | 0.6% |
6 | 122 | 0.5% |
7 | 98 | 0.4% |
8 | 38 | 0.1% |
Other values (2) | 19 | 0.1% |
Hangul
Value | Count | Frequency (%) |
서 | 12323 | 11.1% |
동 | 11237 | 10.1% |
구 | 10656 | 9.6% |
시 | 10082 | 9.0% |
별 | 9997 | 9.0% |
울 | 9997 | 9.0% |
특 | 9997 | 9.0% |
강 | 2858 | 2.6% |
남 | 1449 | 1.3% |
양 | 1261 | 1.1% |
Other values (172) | 31560 |
차명
Text
Distinct | 103 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 24 |
---|---|
Median length | 20 |
Mean length | 13.3635 |
Min length | 2 |
Characters and Unicode
Total characters | 133635 |
---|---|
Distinct characters | 141 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 35 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | K5 하이브리드 |
---|---|
2nd row | 쏘나타 하이브리드(SONATA HYB |
3rd row | 쏘나타(SONATA) 하이브리드 |
4th row | 아반떼 하이브리드(AVANTE HYB |
5th row | 쏘나타(SONATA) 하이브리드 |
Value | Count | Frequency (%) |
하이브리드 | 4705 | |
렉서스 | 1970 | 8.4% |
쏘나타 | 1506 | 6.4% |
es300h | 1304 | 5.6% |
토요타 | 1256 | 5.4% |
k5 | 1171 | 5.0% |
hyb | 1114 | 4.8% |
하이브리드(sonata | 830 | 3.6% |
prius | 761 | 3.3% |
sonata | 668 | 2.9% |
Other values (116) | 8074 |
Most occurring characters
Value | Count | Frequency (%) |
13928 | 10.4% | |
이 | 6654 | 5.0% |
리 | 6247 | 4.7% |
드 | 6246 | 4.7% |
A | 6224 | 4.7% |
하 | 6219 | 4.7% |
브 | 6216 | 4.7% |
S | 4288 | 3.2% |
N | 4285 | 3.2% |
( | 3952 | 3.0% |
Other values (131) | 69376 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 55896 | |
Uppercase Letter | 42899 | |
Space Separator | 13928 | 10.4% |
Decimal Number | 7992 | 6.0% |
Lowercase Letter | 6799 | 5.1% |
Open Punctuation | 3952 | 3.0% |
Close Punctuation | 1918 | 1.4% |
Other Punctuation | 230 | 0.2% |
Dash Punctuation | 21 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 6654 | |
리 | 6247 | |
드 | 6246 | |
하 | 6219 | |
브 | 6216 | |
타 | 3340 | 6.0% |
나 | 2137 | 3.8% |
쏘 | 2097 | 3.8% |
렉 | 2066 | 3.7% |
스 | 2020 | 3.6% |
Other values (70) | 12654 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 6224 | |
S | 4288 | |
N | 4285 | |
R | 3581 | 8.3% |
E | 3198 | 7.5% |
T | 2643 | 6.2% |
O | 2444 | 5.7% |
H | 2060 | 4.8% |
U | 1822 | 4.2% |
I | 1672 | 3.9% |
Other values (15) | 10682 |
Lowercase Letter
Value | Count | Frequency (%) |
h | 2002 | |
r | 975 | |
y | 828 | |
i | 817 | |
b | 598 | 8.8% |
d | 592 | 8.7% |
a | 242 | 3.6% |
m | 235 | 3.5% |
u | 146 | 2.1% |
s | 140 | 2.1% |
Other values (10) | 224 | 3.3% |
Decimal Number
Value | Count | Frequency (%) |
0 | 3882 | |
3 | 1666 | |
5 | 1427 | 17.9% |
4 | 361 | 4.5% |
7 | 314 | 3.9% |
2 | 240 | 3.0% |
6 | 55 | 0.7% |
8 | 30 | 0.4% |
1 | 11 | 0.1% |
9 | 6 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 229 | |
, | 1 | 0.4% |
Space Separator
Value | Count | Frequency (%) |
13928 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3952 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1918 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 21 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 55896 | |
Latin | 49698 | |
Common | 28041 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 6654 | |
리 | 6247 | |
드 | 6246 | |
하 | 6219 | |
브 | 6216 | |
타 | 3340 | 6.0% |
나 | 2137 | 3.8% |
쏘 | 2097 | 3.8% |
렉 | 2066 | 3.7% |
스 | 2020 | 3.6% |
Other values (70) | 12654 |
Latin
Value | Count | Frequency (%) |
A | 6224 | 12.5% |
S | 4288 | 8.6% |
N | 4285 | 8.6% |
R | 3581 | 7.2% |
E | 3198 | 6.4% |
T | 2643 | 5.3% |
O | 2444 | 4.9% |
H | 2060 | 4.1% |
h | 2002 | 4.0% |
U | 1822 | 3.7% |
Other values (35) | 17151 |
Common
Value | Count | Frequency (%) |
13928 | ||
( | 3952 | 14.1% |
0 | 3882 | 13.8% |
) | 1918 | 6.8% |
3 | 1666 | 5.9% |
5 | 1427 | 5.1% |
4 | 361 | 1.3% |
7 | 314 | 1.1% |
2 | 240 | 0.9% |
. | 229 | 0.8% |
Other values (6) | 124 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 77739 | |
Hangul | 55896 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
13928 | ||
A | 6224 | 8.0% |
S | 4288 | 5.5% |
N | 4285 | 5.5% |
( | 3952 | 5.1% |
0 | 3882 | 5.0% |
R | 3581 | 4.6% |
E | 3198 | 4.1% |
T | 2643 | 3.4% |
O | 2444 | 3.1% |
Other values (51) | 29314 |
Hangul
Value | Count | Frequency (%) |
이 | 6654 | |
리 | 6247 | |
드 | 6246 | |
하 | 6219 | |
브 | 6216 | |
타 | 3340 | 6.0% |
나 | 2137 | 3.8% |
쏘 | 2097 | 3.8% |
렉 | 2066 | 3.7% |
스 | 2020 | 3.6% |
Other values (70) | 12654 |
연료
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
하이브리드(휘발유+전기) | |
---|---|
하이브리드(LPG+전기) | 433 |
전기 | 311 |
하이브리드(CNG+전기) | 11 |
하이브리드(경유+전기) | 7 |
Length
Max length | 13 |
---|---|
Median length | 13 |
Mean length | 12.6561 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 하이브리드(휘발유+전기) |
---|---|
2nd row | 하이브리드(휘발유+전기) |
3rd row | 하이브리드(휘발유+전기) |
4th row | 하이브리드(LPG+전기) |
5th row | 하이브리드(휘발유+전기) |
Common Values
Value | Count | Frequency (%) |
하이브리드(휘발유+전기) | 9237 | |
하이브리드(LPG+전기) | 433 | 4.3% |
전기 | 311 | 3.1% |
하이브리드(CNG+전기) | 11 | 0.1% |
하이브리드(경유+전기) | 7 | 0.1% |
수소 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
하이브리드(휘발유+전기 | 9237 | |
하이브리드(lpg+전기 | 433 | 4.3% |
전기 | 311 | 3.1% |
하이브리드(cng+전기 | 11 | 0.1% |
하이브리드(경유+전기 | 7 | 0.1% |
수소 | 1 | < 0.1% |
최초등록일
Date
Distinct | 1830 |
---|---|
Distinct (%) | 18.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2005-10-27 00:00:00 |
---|---|
Maximum | 2016-12-30 00:00:00 |
현소유자의출생년도
Real number (ℝ)
MISSING
 
Distinct | 73 |
---|---|
Distinct (%) | 1.0% |
Missing | 2582 |
Missing (%) | 25.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1970.5898 |
Minimum | 1924 |
---|---|
Maximum | 2015 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1924 |
---|---|
5-th percentile | 1950 |
Q1 | 1962 |
median | 1972 |
Q3 | 1980 |
95-th percentile | 1987 |
Maximum | 2015 |
Range | 91 |
Interquartile range (IQR) | 18 |
Descriptive statistics
Standard deviation | 11.547492 |
---|---|
Coefficient of variation (CV) | 0.0058599168 |
Kurtosis | -0.28950047 |
Mean | 1970.5898 |
Median Absolute Deviation (MAD) | 9 |
Skewness | -0.43416319 |
Sum | 14617835 |
Variance | 133.34457 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1981 | 271 | 2.7% |
1983 | 260 | 2.6% |
1982 | 253 | 2.5% |
1980 | 240 | 2.4% |
1971 | 239 | 2.4% |
1977 | 238 | 2.4% |
1972 | 238 | 2.4% |
1979 | 237 | 2.4% |
1975 | 235 | 2.4% |
1974 | 234 | 2.3% |
Other values (63) | 4973 | |
(Missing) | 2582 |
Value | Count | Frequency (%) |
1924 | 1 | < 0.1% |
1927 | 1 | < 0.1% |
1929 | 2 | < 0.1% |
1930 | 1 | < 0.1% |
1931 | 1 | < 0.1% |
1932 | 1 | < 0.1% |
1933 | 1 | < 0.1% |
1934 | 3 | |
1935 | 5 | |
1936 | 6 |
Value | Count | Frequency (%) |
2015 | 1 | < 0.1% |
2011 | 4 | < 0.1% |
2001 | 3 | < 0.1% |
1996 | 1 | < 0.1% |
1995 | 2 | < 0.1% |
1994 | 4 | < 0.1% |
1993 | 6 | 0.1% |
1992 | 18 | |
1991 | 25 | |
1990 | 36 |
연료 | 현소유자의출생년도 | |
---|---|---|
연료 | 1.000 | 0.000 |
현소유자의출생년도 | 0.000 | 1.000 |
현소유자의출생년도 | 연료 | |
---|---|---|
현소유자의출생년도 | 1.000 | 0.000 |
연료 | 0.000 | 1.000 |
기준년월 | 사용본거지시읍면동_행정동기준 | 차명 | 연료 | 최초등록일 | 현소유자의출생년도 | |
---|---|---|---|---|---|---|
7979 | 2016-12 | 서울특별시 성북구 정릉1동 | K5 하이브리드 | 하이브리드(휘발유+전기) | 2014-07-11 | <NA> |
27645 | 2016-12 | 서울특별시 양천구 목2동 | 쏘나타 하이브리드(SONATA HYB | 하이브리드(휘발유+전기) | 2015-11-18 | 1974 |
28013 | 2016-12 | 서울특별시 강서구 화곡3동 | 쏘나타(SONATA) 하이브리드 | 하이브리드(휘발유+전기) | 2013-12-09 | 1966 |
18814 | 2016-12 | 서울특별시 금천구 시흥3동 | 아반떼 하이브리드(AVANTE HYB | 하이브리드(LPG+전기) | 2009-08-18 | 1964 |
35640 | 2016-12 | 서울특별시 강동구 성내2동 | 쏘나타(SONATA) 하이브리드 | 하이브리드(휘발유+전기) | 2013-01-02 | 1954 |
14860 | 2016-12 | 서울특별시 마포구 상암동 | 렉서스 CT200h | 하이브리드(휘발유+전기) | 2015-05-18 | 1969 |
15266 | 2016-12 | 서울특별시 강서구 가양1동 | 그랜저 하이브리드 (GRANDEUR | 하이브리드(휘발유+전기) | 2015-04-23 | <NA> |
35485 | 2016-12 | 서울특별시 강서구 발산1동 | 쏘나타 (SONATA) 하이브리드 | 하이브리드(휘발유+전기) | 2012-11-28 | 1985 |
45792 | 2016-12 | 서울특별시 서초구 반포4동 | 렉서스 NX300h | 하이브리드(휘발유+전기) | 2016-04-29 | 1972 |
14498 | 2016-12 | 서울특별시 서초구 양재2동 | K5 하이브리드 | 하이브리드(휘발유+전기) | 2016-01-13 | <NA> |
기준년월 | 사용본거지시읍면동_행정동기준 | 차명 | 연료 | 최초등록일 | 현소유자의출생년도 | |
---|---|---|---|---|---|---|
34079 | 2016-12 | 서울특별시 서대문구 북아현동 | 포르테하이브리드 | 하이브리드(LPG+전기) | 2011-03-15 | <NA> |
43598 | 2016-12 | 서울특별시 노원구 중계본동 | 렉서스 ES300h | 하이브리드(휘발유+전기) | 2013-11-18 | 1976 |
4667 | 2016-12 | 서울특별시 강남구 역삼1동 | 렉서스 ES300h | 하이브리드(휘발유+전기) | 2014-06-26 | <NA> |
20788 | 2016-12 | 서울특별시 동대문구 휘경1동 | 렉서스 ES300h | 하이브리드(휘발유+전기) | 2013-06-21 | 1970 |
41619 | 2016-12 | 서울특별시 송파구 삼전동 | 렉서스 ES300h | 하이브리드(휘발유+전기) | 2016-07-27 | 1974 |
11459 | 2016-12 | 서울특별시 강서구 가양1동 | 쏘나타(SONATA) 하이브리드 | 하이브리드(휘발유+전기) | 2013-12-16 | <NA> |
34857 | 2016-12 | 서울특별시 광진구 화양동 | K5 하이브리드 | 하이브리드(휘발유+전기) | 2016-05-10 | 1988 |
30535 | 2016-12 | 서울특별시 강서구 화곡본동 | 아이오닉 하이브리드(IONIQ HY | 하이브리드(휘발유+전기) | 2016-09-07 | <NA> |
35731 | 2016-12 | 서울특별시 중구 다산동 | 토요타 CAMRY Hybrid | 하이브리드(휘발유+전기) | 2012-05-23 | 1957 |
12644 | 2016-12 | 서울특별시 강남구 역삼1동 | 렉서스 ES300h | 하이브리드(휘발유+전기) | 2016-10-21 | <NA> |
Most frequently occurring
기준년월 | 사용본거지시읍면동_행정동기준 | 차명 | 연료 | 최초등록일 | 현소유자의출생년도 | # duplicates | |
---|---|---|---|---|---|---|---|
208 | 2016-12 | 서울특별시 서초구 양재2동 | K5 하이브리드 | 하이브리드(휘발유+전기) | 2016-01-12 | <NA> | 35 |
209 | 2016-12 | 서울특별시 서초구 양재2동 | K5 하이브리드 | 하이브리드(휘발유+전기) | 2016-01-13 | <NA> | 34 |
196 | 2016-12 | 서울특별시 서초구 양재1동 | 쏘나타 하이브리드(SONATA HYB | 하이브리드(휘발유+전기) | 2014-12-24 | <NA> | 31 |
193 | 2016-12 | 서울특별시 서초구 양재1동 | 쏘나타 하이브리드(SONATA HYB | 하이브리드(휘발유+전기) | 2014-12-19 | <NA> | 29 |
195 | 2016-12 | 서울특별시 서초구 양재1동 | 쏘나타 하이브리드(SONATA HYB | 하이브리드(휘발유+전기) | 2014-12-23 | <NA> | 20 |
120 | 2016-12 | 서울특별시 강서구 가양1동 | 그랜저(GRANDEUR) 하이브리드 | 하이브리드(휘발유+전기) | 2014-01-24 | <NA> | 14 |
189 | 2016-12 | 서울특별시 서초구 양재1동 | K7 하이브리드 | 하이브리드(휘발유+전기) | 2016-11-24 | <NA> | 14 |
197 | 2016-12 | 서울특별시 서초구 양재1동 | 쏘나타 하이브리드(SONATA HYB | 하이브리드(휘발유+전기) | 2014-12-26 | <NA> | 13 |
194 | 2016-12 | 서울특별시 서초구 양재1동 | 쏘나타 하이브리드(SONATA HYB | 하이브리드(휘발유+전기) | 2014-12-22 | <NA> | 12 |
162 | 2016-12 | 서울특별시 구로구 구로1동 | K5 하이브리드 | 하이브리드(휘발유+전기) | 2015-02-26 | <NA> | 10 |