Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 163 |
Missing cells | 169 |
Missing cells (%) | 25.9% |
Duplicate rows | 30 |
Duplicate rows (%) | 18.4% |
Total size in memory | 5.2 KiB |
Average record size in memory | 32.8 B |
Variable types
Categorical | 2 |
---|---|
Unsupported | 1 |
Text | 1 |
Dataset
Description | 홍성군 시외버스 현황 제공 |
---|---|
Author | 충청남도 홍성군 |
URL | https://www.data.go.kr/data/3073599/fileData.do |
Dataset has 30 (18.4%) duplicate rows | Duplicates |
Unnamed: 1 has 18 (11.0%) missing values | Missing |
Unnamed: 3 has 151 (92.6%) missing values | Missing |
Unnamed: 1 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-13 00:41:07.031603 |
---|---|
Analysis finished | 2023-12-13 00:41:07.378855 |
Duration | 0.35 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시외버스 시간표
Categorical
Distinct | 36 |
---|---|
Distinct (%) | 22.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.4 KiB |
천안 | |
---|---|
보령 | |
태안 | |
홍성 | |
서산 | |
Other values (31) |
Length
Max length | 17 |
---|---|
Median length | 2 |
Mean length | 3.0613497 |
Min length | 2 |
Unique
Unique | 16 ? |
---|---|
Unique (%) | 9.8% |
Sample
1st row | <NA> |
---|---|
2nd row | 천안직행 (충37,금12,한1) |
3rd row | 천안직행 시외버스 운행안내 |
4th row | 시발지 |
5th row | 홍성 |
Common Values
Value | Count | Frequency (%) |
천안 | 26 | |
보령 | 18 | |
태안 | 17 | 10.4% |
홍성 | 15 | 9.2% |
서산 | 15 | 9.2% |
<NA> | 6 | 3.7% |
공대전 | 6 | 3.7% |
시발지 | 6 | 3.7% |
동서울 | 5 | 3.1% |
청대전 | 5 | 3.1% |
Other values (26) | 44 |
Length
Value | Count | Frequency (%) |
천안 | 26 | |
보령 | 18 | 9.9% |
태안 | 17 | 9.3% |
서산 | 15 | 8.2% |
홍성 | 15 | 8.2% |
운행안내 | 6 | 3.3% |
na | 6 | 3.3% |
공대전 | 6 | 3.3% |
시발지 | 6 | 3.3% |
시외버스 | 6 | 3.3% |
Other values (31) | 61 |
Unnamed: 1
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 18 |
---|---|
Missing (%) | 11.0% |
Memory size | 1.4 KiB |
Unnamed: 2
Categorical
Distinct | 20 |
---|---|
Distinct (%) | 12.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.4 KiB |
천안 | |
---|---|
서산 | |
보령 | |
<NA> | |
태안 | |
Other values (15) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.3803681 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 1.8% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 행선지 |
5th row | 천안 |
Common Values
Value | Count | Frequency (%) |
천안 | 31 | |
서산 | 25 | |
보령 | 20 | |
<NA> | 18 | |
태안 | 13 | |
공대전 | 9 | 5.5% |
청대전 | 8 | 4.9% |
행선지 | 6 | 3.7% |
군산 | 5 | 3.1% |
안산 | 5 | 3.1% |
Other values (10) | 23 |
Length
Value | Count | Frequency (%) |
천안 | 31 | |
서산 | 25 | |
보령 | 20 | |
na | 18 | |
태안 | 13 | |
공대전 | 9 | 5.5% |
청대전 | 8 | 4.9% |
행선지 | 6 | 3.7% |
군산 | 5 | 3.1% |
안산 | 5 | 3.1% |
Other values (10) | 23 |
Unnamed: 3
Text
MISSING
 
Distinct | 6 |
---|---|
Distinct (%) | 50.0% |
Missing | 151 |
Missing (%) | 92.6% |
Memory size | 1.4 KiB |
Value | Count | Frequency (%) |
비고 | 6 | |
직통 | 2 | 15.4% |
신양 | 1 | 7.7% |
i.c | 1 | 7.7% |
산양i.c | 1 | 7.7% |
장항 | 1 | 7.7% |
서천 | 1 | 7.7% |
Most occurring characters
Value | Count | Frequency (%) |
비 | 6 | |
고 | 6 | |
직 | 2 | 6.5% |
통 | 2 | 6.5% |
양 | 2 | 6.5% |
I | 2 | 6.5% |
. | 2 | 6.5% |
C | 2 | 6.5% |
신 | 1 | 3.2% |
1 | 3.2% | |
Other values (5) | 5 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 24 | |
Uppercase Letter | 4 | 12.9% |
Other Punctuation | 2 | 6.5% |
Space Separator | 1 | 3.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
비 | 6 | |
고 | 6 | |
직 | 2 | 8.3% |
통 | 2 | 8.3% |
양 | 2 | 8.3% |
신 | 1 | 4.2% |
산 | 1 | 4.2% |
장 | 1 | 4.2% |
항 | 1 | 4.2% |
서 | 1 | 4.2% |
Uppercase Letter
Value | Count | Frequency (%) |
I | 2 | |
C | 2 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 24 | |
Latin | 4 | 12.9% |
Common | 3 | 9.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
비 | 6 | |
고 | 6 | |
직 | 2 | 8.3% |
통 | 2 | 8.3% |
양 | 2 | 8.3% |
신 | 1 | 4.2% |
산 | 1 | 4.2% |
장 | 1 | 4.2% |
항 | 1 | 4.2% |
서 | 1 | 4.2% |
Latin
Value | Count | Frequency (%) |
I | 2 | |
C | 2 |
Common
Value | Count | Frequency (%) |
. | 2 | |
1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 24 | |
ASCII | 7 | 22.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
비 | 6 | |
고 | 6 | |
직 | 2 | 8.3% |
통 | 2 | 8.3% |
양 | 2 | 8.3% |
신 | 1 | 4.2% |
산 | 1 | 4.2% |
장 | 1 | 4.2% |
항 | 1 | 4.2% |
서 | 1 | 4.2% |
ASCII
Value | Count | Frequency (%) |
I | 2 | |
. | 2 | |
C | 2 | |
1 |
시외버스 시간표 | Unnamed: 2 | Unnamed: 3 | |
---|---|---|---|
시외버스 시간표 | 1.000 | 0.854 | 1.000 |
Unnamed: 2 | 0.854 | 1.000 | 1.000 |
Unnamed: 3 | 1.000 | 1.000 | 1.000 |
Unnamed: 2 | 시외버스 시간표 | |
---|---|---|
Unnamed: 2 | 1.000 | 0.424 |
시외버스 시간표 | 0.424 | 1.000 |
시외버스 시간표 | Unnamed: 2 | |
---|---|---|
시외버스 시간표 | 1.000 | 0.424 |
Unnamed: 2 | 0.424 | 1.000 |
시외버스 시간표 | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | |
---|---|---|---|---|
0 | <NA> | NaN | <NA> | <NA> |
1 | 천안직행 (충37,금12,한1) | NaN | <NA> | <NA> |
2 | 천안직행 시외버스 운행안내 | NaN | <NA> | <NA> |
3 | 시발지 | 시간 | 행선지 | 비고 |
4 | 홍성 | 06:40:00 | 천안 | <NA> |
5 | 홍성 | 07:10:00 | 천안 | <NA> |
6 | 서산 | 07:33:00 | 천안 | <NA> |
7 | 홍성 | 07:38:00 | 공대전 | 신양 I.C |
8 | 홍성 | 07:43:00 | 청주 | <NA> |
9 | 태안 | 08:05:00 | 천안 | <NA> |
시외버스 시간표 | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | |
---|---|---|---|---|
153 | 동서울 | 21:50:00 | 보령 | <NA> |
154 | <NA> | NaN | <NA> | <NA> |
155 | 안산행 (금5) | NaN | <NA> | <NA> |
156 | 안산행 시외버스 운행안내 | NaN | <NA> | <NA> |
157 | 시발지 | 시간 | 행선지 | 비고 |
158 | 보령 | 08:51:00 | 안산 | <NA> |
159 | 보령 | 11:09(직) | 안산 | <NA> |
160 | 보령 | 15:24:00 | 안산 | <NA> |
161 | 보령 | 16:32:00 | 안산 | <NA> |
162 | 보령 | 18:10(직) | 안산 | <NA> |
Most frequently occurring
시외버스 시간표 | Unnamed: 2 | Unnamed: 3 | # duplicates | |
---|---|---|---|---|
24 | 태안 | 천안 | <NA> | 11 |
19 | 천안 | 서산 | <NA> | 10 |
8 | 보령 | 천안 | <NA> | 6 |
14 | 시발지 | 행선지 | 비고 | 6 |
20 | 천안 | 태안 | <NA> | 6 |
29 | <NA> | <NA> | <NA> | 6 |
0 | 공대전 | 서산 | <NA> | 5 |
4 | 동서울 | 보령 | <NA> | 5 |
6 | 보령 | 안산 | <NA> | 5 |
10 | 서산 | 공대전 | <NA> | 5 |