Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 36 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.6 KiB |
Average record size in memory | 72.7 B |
Variable types
Text | 1 |
---|---|
Categorical | 5 |
Numeric | 2 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-20299/F/1/datasetView.do |
화 물 has constant value "" | Constant |
특 수 has constant value "" | Constant |
승 합 is highly overall correlated with 승 용 and 2 other fields | High correlation |
용도별 is highly overall correlated with 연료별 | High correlation |
연료별 is highly overall correlated with 승 용 and 3 other fields | High correlation |
승 용 is highly overall correlated with 계 and 2 other fields | High correlation |
계 is highly overall correlated with 승 용 and 2 other fields | High correlation |
연료별 is highly imbalanced (81.7%) | Imbalance |
승 합 is highly imbalanced (69.0%) | Imbalance |
Reproduction
Analysis started | 2024-03-13 11:09:17.886741 |
---|---|
Analysis finished | 2024-03-13 11:09:18.574925 |
Duration | 0.69 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군구별
Text
Distinct | 26 |
---|---|
Distinct (%) | 72.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 420.0 B |
Value | Count | Frequency (%) |
강동구 | 2 | 5.6% |
동대문구 | 2 | 5.6% |
영등포구 | 2 | 5.6% |
강남구 | 2 | 5.6% |
광진구 | 2 | 5.6% |
서초구 | 2 | 5.6% |
은평구 | 2 | 5.6% |
금천구 | 2 | 5.6% |
강서구 | 2 | 5.6% |
양천구 | 2 | 5.6% |
Other values (16) | 16 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 36 | |
강 | 7 | 6.3% |
동 | 6 | 5.4% |
서 | 5 | 4.5% |
천 | 4 | 3.6% |
포 | 3 | 2.7% |
대 | 3 | 2.7% |
문 | 3 | 2.7% |
진 | 2 | 1.8% |
로 | 2 | 1.8% |
Other values (28) | 40 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 111 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 36 | |
강 | 7 | 6.3% |
동 | 6 | 5.4% |
서 | 5 | 4.5% |
천 | 4 | 3.6% |
포 | 3 | 2.7% |
대 | 3 | 2.7% |
문 | 3 | 2.7% |
진 | 2 | 1.8% |
로 | 2 | 1.8% |
Other values (28) | 40 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 111 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 36 | |
강 | 7 | 6.3% |
동 | 6 | 5.4% |
서 | 5 | 4.5% |
천 | 4 | 3.6% |
포 | 3 | 2.7% |
대 | 3 | 2.7% |
문 | 3 | 2.7% |
진 | 2 | 1.8% |
로 | 2 | 1.8% |
Other values (28) | 40 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 111 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 36 | |
강 | 7 | 6.3% |
동 | 6 | 5.4% |
서 | 5 | 4.5% |
천 | 4 | 3.6% |
포 | 3 | 2.7% |
대 | 3 | 2.7% |
문 | 3 | 2.7% |
진 | 2 | 1.8% |
로 | 2 | 1.8% |
Other values (28) | 40 |
연료별
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 5.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 420.0 B |
수소 | |
---|---|
<NA> | 1 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0555556 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 2.8% |
Sample
1st row | <NA> |
---|---|
2nd row | 수소 |
3rd row | 수소 |
4th row | 수소 |
5th row | 수소 |
Common Values
Value | Count | Frequency (%) |
수소 | 35 | |
<NA> | 1 | 2.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
수소 | 35 | |
na | 1 | 2.8% |
용도별
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 8.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 420.0 B |
비사업용 | |
---|---|
사업용 | |
<NA> | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.7222222 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 2.8% |
Sample
1st row | <NA> |
---|---|
2nd row | 비사업용 |
3rd row | 비사업용 |
4th row | 비사업용 |
5th row | 비사업용 |
Common Values
Value | Count | Frequency (%) |
비사업용 | 25 | |
사업용 | 10 | 27.8% |
<NA> | 1 | 2.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
비사업용 | 25 | |
사업용 | 10 | 27.8% |
na | 1 | 2.8% |
승 용
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 30 |
---|---|
Distinct (%) | 83.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 65.666667 |
Minimum | 1 |
---|---|
Maximum | 1182 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 456.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 8 |
median | 24 |
Q3 | 51.5 |
95-th percentile | 103 |
Maximum | 1182 |
Range | 1181 |
Interquartile range (IQR) | 43.5 |
Descriptive statistics
Standard deviation | 193.91382 |
---|---|
Coefficient of variation (CV) | 2.9530024 |
Kurtosis | 33.984707 |
Mean | 65.666667 |
Median Absolute Deviation (MAD) | 20 |
Skewness | 5.7583971 |
Sum | 2364 |
Variance | 37602.571 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 4 | 11.1% |
22 | 2 | 5.6% |
29 | 2 | 5.6% |
8 | 2 | 5.6% |
1182 | 1 | 2.8% |
35 | 1 | 2.8% |
43 | 1 | 2.8% |
17 | 1 | 2.8% |
73 | 1 | 2.8% |
51 | 1 | 2.8% |
Other values (20) | 20 |
Value | Count | Frequency (%) |
1 | 4 | |
2 | 1 | 2.8% |
3 | 1 | 2.8% |
5 | 1 | 2.8% |
7 | 1 | 2.8% |
8 | 2 | |
10 | 1 | 2.8% |
15 | 1 | 2.8% |
17 | 1 | 2.8% |
18 | 1 | 2.8% |
Value | Count | Frequency (%) |
1182 | 1 | |
127 | 1 | |
95 | 1 | |
92 | 1 | |
85 | 1 | |
73 | 1 | |
66 | 1 | |
61 | 1 | |
53 | 1 | |
51 | 1 |
승 합
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 5.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 420.0 B |
0 | |
---|---|
2 | 2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2 |
---|---|
2nd row | 2 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 34 | |
2 | 2 | 5.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 34 | |
2 | 2 | 5.6% |
화 물
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 420.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 36 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 36 |
특 수
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 420.0 B |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 36 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 36 |
계
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 30 |
---|---|
Distinct (%) | 83.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 65.777778 |
Minimum | 1 |
---|---|
Maximum | 1184 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 456.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 8 |
median | 24 |
Q3 | 51.5 |
95-th percentile | 103 |
Maximum | 1184 |
Range | 1183 |
Interquartile range (IQR) | 43.5 |
Descriptive statistics
Standard deviation | 194.2361 |
---|---|
Coefficient of variation (CV) | 2.9529137 |
Kurtosis | 33.989181 |
Mean | 65.777778 |
Median Absolute Deviation (MAD) | 20.5 |
Skewness | 5.7589003 |
Sum | 2368 |
Variance | 37727.663 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 4 | 11.1% |
22 | 2 | 5.6% |
29 | 2 | 5.6% |
8 | 2 | 5.6% |
1184 | 1 | 2.8% |
35 | 1 | 2.8% |
43 | 1 | 2.8% |
17 | 1 | 2.8% |
73 | 1 | 2.8% |
51 | 1 | 2.8% |
Other values (20) | 20 |
Value | Count | Frequency (%) |
1 | 4 | |
2 | 1 | 2.8% |
3 | 1 | 2.8% |
5 | 1 | 2.8% |
7 | 1 | 2.8% |
8 | 2 | |
10 | 1 | 2.8% |
15 | 1 | 2.8% |
17 | 1 | 2.8% |
18 | 1 | 2.8% |
Value | Count | Frequency (%) |
1184 | 1 | |
127 | 1 | |
95 | 1 | |
92 | 1 | |
85 | 1 | |
73 | 1 | |
66 | 1 | |
61 | 1 | |
53 | 1 | |
51 | 1 |
시군구별 | 용도별 | 승 용 | 승 합 | 계 | |
---|---|---|---|---|---|
시군구별 | 1.000 | 0.000 | 0.616 | 1.000 | 0.616 |
용도별 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
승 용 | 0.616 | 0.000 | 1.000 | 0.433 | 1.000 |
승 합 | 1.000 | 0.000 | 0.433 | 1.000 | 0.433 |
계 | 0.616 | 0.000 | 1.000 | 0.433 | 1.000 |
승 합 | 용도별 | 연료별 | |
---|---|---|---|
승 합 | 1.000 | 0.000 | 1.000 |
용도별 | 0.000 | 1.000 | 1.000 |
연료별 | 1.000 | 1.000 | 1.000 |
승 용 | 계 | 연료별 | 용도별 | 승 합 | |
---|---|---|---|---|---|
승 용 | 1.000 | 1.000 | 1.000 | 0.000 | 0.665 |
계 | 1.000 | 1.000 | 1.000 | 0.000 | 0.665 |
연료별 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
용도별 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
승 합 | 0.665 | 0.665 | 1.000 | 0.000 | 1.000 |
시군구별 | 연료별 | 용도별 | 승 용 | 승 합 | 화 물 | 특 수 | 계 | |
---|---|---|---|---|---|---|---|---|
0 | 합계 | <NA> | <NA> | 1182 | 2 | 0 | 0 | 1184 |
1 | 종로구 | 수소 | 비사업용 | 42 | 2 | 0 | 0 | 44 |
2 | 중구 | 수소 | 비사업용 | 22 | 0 | 0 | 0 | 22 |
3 | 용산구 | 수소 | 비사업용 | 29 | 0 | 0 | 0 | 29 |
4 | 성동구 | 수소 | 비사업용 | 29 | 0 | 0 | 0 | 29 |
5 | 광진구 | 수소 | 비사업용 | 19 | 0 | 0 | 0 | 19 |
6 | 광진구 | 수소 | 사업용 | 1 | 0 | 0 | 0 | 1 |
7 | 동대문구 | 수소 | 비사업용 | 22 | 0 | 0 | 0 | 22 |
8 | 동대문구 | 수소 | 사업용 | 7 | 0 | 0 | 0 | 7 |
9 | 중랑구 | 수소 | 비사업용 | 15 | 0 | 0 | 0 | 15 |
시군구별 | 연료별 | 용도별 | 승 용 | 승 합 | 화 물 | 특 수 | 계 | |
---|---|---|---|---|---|---|---|---|
26 | 영등포구 | 수소 | 사업용 | 8 | 0 | 0 | 0 | 8 |
27 | 동작구 | 수소 | 비사업용 | 51 | 0 | 0 | 0 | 51 |
28 | 관악구 | 수소 | 비사업용 | 35 | 0 | 0 | 0 | 35 |
29 | 서초구 | 수소 | 비사업용 | 127 | 0 | 0 | 0 | 127 |
30 | 서초구 | 수소 | 사업용 | 8 | 0 | 0 | 0 | 8 |
31 | 강남구 | 수소 | 비사업용 | 95 | 0 | 0 | 0 | 95 |
32 | 강남구 | 수소 | 사업용 | 1 | 0 | 0 | 0 | 1 |
33 | 송파구 | 수소 | 비사업용 | 92 | 0 | 0 | 0 | 92 |
34 | 강동구 | 수소 | 비사업용 | 85 | 0 | 0 | 0 | 85 |
35 | 강동구 | 수소 | 사업용 | 3 | 0 | 0 | 0 | 3 |