Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 297 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 12.3 KiB |
Average record size in memory | 42.4 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Numeric | 1 |
DateTime | 1 |
Dataset
Description | 경상남도 진주시에서 운영하는 버스정보시스템의 버스정보 테이블(제공항목 : 버스회사, 정원, 차량번호, 버스아이디) 정보를 제공합니다. 참고사항 : 2022년 공공데이터 중장기 개방계획 수립 완료한 개방대상테이블 2023년 개방 이행 자료 입니다. |
---|---|
URL | https://www.data.go.kr/data/15117457/fileData.do |
데이터기준일자 has constant value "" | Constant |
버스ID is highly overall correlated with 버스회사 and 1 other fields | High correlation |
버스회사 is highly overall correlated with 버스ID and 1 other fields | High correlation |
정원 is highly overall correlated with 버스ID and 1 other fields | High correlation |
정원 is highly imbalanced (74.4%) | Imbalance |
차량번호 has unique values | Unique |
버스ID has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 08:44:16.072258 |
---|---|
Analysis finished | 2023-12-12 08:44:16.501783 |
Duration | 0.43 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
버스회사
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
삼성교통 | |
---|---|
시민버스 | |
부일교통 | |
부산교통 | |
경전여객 | 8 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 삼성교통 |
---|---|
2nd row | 시민버스 |
3rd row | 삼성교통 |
4th row | 부산교통 |
5th row | 삼성교통 |
Common Values
Value | Count | Frequency (%) |
삼성교통 | 100 | |
시민버스 | 97 | |
부일교통 | 49 | |
부산교통 | 39 | 13.1% |
경전여객 | 8 | 2.7% |
경원여객 | 4 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
삼성교통 | 100 | |
시민버스 | 97 | |
부일교통 | 49 | |
부산교통 | 39 | 13.1% |
경전여객 | 8 | 2.7% |
경원여객 | 4 | 1.3% |
정원
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
48 | |
---|---|
41 | 11 |
53 | 6 |
45 | 5 |
46 | 4 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 48 |
---|---|
2nd row | 48 |
3rd row | 48 |
4th row | 48 |
5th row | 48 |
Common Values
Value | Count | Frequency (%) |
48 | 271 | |
41 | 11 | 3.7% |
53 | 6 | 2.0% |
45 | 5 | 1.7% |
46 | 4 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
48 | 271 | |
41 | 11 | 3.7% |
53 | 6 | 2.0% |
45 | 5 | 1.7% |
46 | 4 | 1.3% |
차량번호
Text
UNIQUE
 
Distinct | 297 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
Value | Count | Frequency (%) |
경남71자5793 | 1 | 0.3% |
경남71자5407 | 1 | 0.3% |
경남71자5405 | 1 | 0.3% |
경남71자5404 | 1 | 0.3% |
경남71자5403 | 1 | 0.3% |
경남71자5402 | 1 | 0.3% |
경남71자5401 | 1 | 0.3% |
경남71자5592 | 1 | 0.3% |
경남71자5591 | 1 | 0.3% |
경남71자5590 | 1 | 0.3% |
Other values (287) | 287 |
Most occurring characters
Value | Count | Frequency (%) |
5 | 386 | |
7 | 351 | |
1 | 332 | |
경 | 297 | |
남 | 297 | |
자 | 278 | |
8 | 150 | 5.6% |
4 | 149 | 5.6% |
6 | 124 | 4.6% |
9 | 100 | 3.7% |
Other values (4) | 209 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1782 | |
Other Letter | 891 |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
5 | 386 | |
7 | 351 | |
1 | 332 | |
8 | 150 | 8.4% |
4 | 149 | 8.4% |
6 | 124 | 7.0% |
9 | 100 | 5.6% |
0 | 76 | 4.3% |
3 | 58 | 3.3% |
2 | 56 | 3.1% |
Other Letter
Value | Count | Frequency (%) |
경 | 297 | |
남 | 297 | |
자 | 278 | |
아 | 19 | 2.1% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1782 | |
Hangul | 891 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
5 | 386 | |
7 | 351 | |
1 | 332 | |
8 | 150 | 8.4% |
4 | 149 | 8.4% |
6 | 124 | 7.0% |
9 | 100 | 5.6% |
0 | 76 | 4.3% |
3 | 58 | 3.3% |
2 | 56 | 3.1% |
Hangul
Value | Count | Frequency (%) |
경 | 297 | |
남 | 297 | |
자 | 278 | |
아 | 19 | 2.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1782 | |
Hangul | 891 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
5 | 386 | |
7 | 351 | |
1 | 332 | |
8 | 150 | 8.4% |
4 | 149 | 8.4% |
6 | 124 | 7.0% |
9 | 100 | 5.6% |
0 | 76 | 4.3% |
3 | 58 | 3.3% |
2 | 56 | 3.1% |
Hangul
Value | Count | Frequency (%) |
경 | 297 | |
남 | 297 | |
자 | 278 | |
아 | 19 | 2.1% |
버스ID
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 297 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 63505790 |
Minimum | 38105401 |
---|---|
Maximum | 3.810067 × 108 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 38105401 |
---|---|
5-th percentile | 38105416 |
Q1 | 38105479 |
median | 38105635 |
Q3 | 38105847 |
95-th percentile | 3.8100526 × 108 |
Maximum | 3.810067 × 108 |
Range | 3.4290129 × 108 |
Interquartile range (IQR) | 368 |
Descriptive statistics
Standard deviation | 89954165 |
---|---|
Coefficient of variation (CV) | 1.4164719 |
Kurtosis | 8.7466925 |
Mean | 63505790 |
Median Absolute Deviation (MAD) | 185 |
Skewness | 3.2692257 |
Sum | 1.886122 × 1010 |
Variance | 8.0917519 × 1015 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
38105793 | 1 | 0.3% |
38105408 | 1 | 0.3% |
38105406 | 1 | 0.3% |
38105405 | 1 | 0.3% |
38105404 | 1 | 0.3% |
38105403 | 1 | 0.3% |
38105402 | 1 | 0.3% |
38105401 | 1 | 0.3% |
38105592 | 1 | 0.3% |
38105591 | 1 | 0.3% |
Other values (287) | 287 |
Value | Count | Frequency (%) |
38105401 | 1 | |
38105402 | 1 | |
38105403 | 1 | |
38105404 | 1 | |
38105405 | 1 | |
38105406 | 1 | |
38105407 | 1 | |
38105408 | 1 | |
38105409 | 1 | |
38105410 | 1 |
Value | Count | Frequency (%) |
381006695 | 1 | |
381006694 | 1 | |
381006693 | 1 | |
381006692 | 1 | |
381006590 | 1 | |
381006554 | 1 | |
381006526 | 1 | |
381006500 | 1 | |
381006181 | 1 | |
381006145 | 1 |
데이터기준일자
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
Minimum | 2023-07-28 00:00:00 |
---|---|
Maximum | 2023-07-28 00:00:00 |
버스회사 | 정원 | 버스ID | |
---|---|---|---|
버스회사 | 1.000 | 0.795 | 0.938 |
정원 | 0.795 | 1.000 | 0.825 |
버스ID | 0.938 | 0.825 | 1.000 |
버스회사 | 정원 | |
---|---|---|
버스회사 | 1.000 | 0.680 |
정원 | 0.680 | 1.000 |
버스ID | 버스회사 | 정원 | |
---|---|---|---|
버스ID | 1.000 | 0.773 | 0.944 |
버스회사 | 0.773 | 1.000 | 0.680 |
정원 | 0.944 | 0.680 | 1.000 |
버스회사 | 정원 | 차량번호 | 버스ID | 데이터기준일자 | |
---|---|---|---|---|---|
0 | 삼성교통 | 48 | 경남71자5793 | 38105793 | 2023-07-28 |
1 | 시민버스 | 48 | 경남99자9991 | 38109991 | 2023-07-28 |
2 | 삼성교통 | 48 | 경남71자5795 | 38105795 | 2023-07-28 |
3 | 부산교통 | 48 | 경남71자5667 | 38105667 | 2023-07-28 |
4 | 삼성교통 | 48 | 경남71자5797 | 38105797 | 2023-07-28 |
5 | 삼성교통 | 48 | 경남71자5798 | 38105798 | 2023-07-28 |
6 | 삼성교통 | 48 | 경남71자5799 | 38105799 | 2023-07-28 |
7 | 삼성교통 | 48 | 경남71자5800 | 38105800 | 2023-07-28 |
8 | 삼성교통 | 48 | 경남71자5801 | 38105801 | 2023-07-28 |
9 | 삼성교통 | 48 | 경남71자5802 | 38105802 | 2023-07-28 |
버스회사 | 정원 | 차량번호 | 버스ID | 데이터기준일자 | |
---|---|---|---|---|---|
287 | 경전여객 | 41 | 경남70아6693 | 381006693 | 2023-07-28 |
288 | 삼성교통 | 48 | 경남71자5496 | 38105496 | 2023-07-28 |
289 | 삼성교통 | 48 | 경남71자5497 | 38105497 | 2023-07-28 |
290 | 시민버스 | 48 | 경남71자5491 | 38105491 | 2023-07-28 |
291 | 경전여객 | 41 | 경남70아6694 | 381006694 | 2023-07-28 |
292 | 부산교통 | 41 | 경남70아5188 | 381005188 | 2023-07-28 |
293 | 경전여객 | 41 | 경남70아6695 | 381006695 | 2023-07-28 |
294 | 부일교통 | 48 | 경남71자5550 | 381005550 | 2023-07-28 |
295 | 경전여객 | 41 | 경남70아6500 | 381006500 | 2023-07-28 |
296 | 부산교통 | 48 | 경남71자5656 | 381005656 | 2023-07-28 |