Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
DateTime | 1 |
---|---|
Text | 1 |
Categorical | 1 |
Numeric | 2 |
Dataset
Description | 한국철공사의 정차역별(서울, 용산, 영등포, 안양, 수원, 오산, 서정리, 평택, 성환, 천안 등), 상하행구분별 승하차인원수 데이터를 제공합니다. |
---|---|
Author | 한국철도공사 |
URL | https://www.data.go.kr/data/15088873/fileData.do |
Reproduction
Analysis started | 2023-12-12 15:42:51.955601 |
---|---|
Analysis finished | 2023-12-12 15:42:52.928007 |
Duration | 0.97 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
운행일자
Date
Distinct | 234 |
---|---|
Distinct (%) | 2.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2020-01-01 00:00:00 |
---|---|
Maximum | 2020-08-21 00:00:00 |
정차역
Text
Distinct | 225 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
아산 | 63 | 0.6% |
공주 | 62 | 0.6% |
논산 | 60 | 0.6% |
화본 | 60 | 0.6% |
신해운대 | 59 | 0.6% |
일로 | 59 | 0.6% |
포항 | 59 | 0.6% |
옥천 | 59 | 0.6% |
서울 | 59 | 0.6% |
다시 | 58 | 0.6% |
Other values (215) | 9402 |
Most occurring characters
Value | Count | Frequency (%) |
천 | 1128 | 5.0% |
주 | 831 | 3.7% |
산 | 791 | 3.5% |
구 | 572 | 2.6% |
동 | 566 | 2.5% |
성 | 563 | 2.5% |
양 | 546 | 2.4% |
신 | 524 | 2.3% |
원 | 436 | 2.0% |
진 | 379 | 1.7% |
Other values (166) | 16011 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 22347 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
천 | 1128 | 5.0% |
주 | 831 | 3.7% |
산 | 791 | 3.5% |
구 | 572 | 2.6% |
동 | 566 | 2.5% |
성 | 563 | 2.5% |
양 | 546 | 2.4% |
신 | 524 | 2.3% |
원 | 436 | 2.0% |
진 | 379 | 1.7% |
Other values (166) | 16011 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 22347 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
천 | 1128 | 5.0% |
주 | 831 | 3.7% |
산 | 791 | 3.5% |
구 | 572 | 2.6% |
동 | 566 | 2.5% |
성 | 563 | 2.5% |
양 | 546 | 2.4% |
신 | 524 | 2.3% |
원 | 436 | 2.0% |
진 | 379 | 1.7% |
Other values (166) | 16011 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 22347 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
천 | 1128 | 5.0% |
주 | 831 | 3.7% |
산 | 791 | 3.5% |
구 | 572 | 2.6% |
동 | 566 | 2.5% |
성 | 563 | 2.5% |
양 | 546 | 2.4% |
신 | 524 | 2.3% |
원 | 436 | 2.0% |
진 | 379 | 1.7% |
Other values (166) | 16011 |
상행하행구분
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
상행 | |
---|---|
하행 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 하행 |
---|---|
2nd row | 상행 |
3rd row | 상행 |
4th row | 하행 |
5th row | 하행 |
Common Values
Value | Count | Frequency (%) |
상행 | 5039 | |
하행 | 4961 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
상행 | 5039 | |
하행 | 4961 |
승차인원수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 1796 |
---|---|
Distinct (%) | 18.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 570.0901 |
Minimum | 0 |
---|---|
Maximum | 51992 |
Zeros | 629 |
Zeros (%) | 6.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 8 |
median | 42 |
Q3 | 240 |
95-th percentile | 2779.05 |
Maximum | 51992 |
Range | 51992 |
Interquartile range (IQR) | 232 |
Descriptive statistics
Standard deviation | 2238.5145 |
---|---|
Coefficient of variation (CV) | 3.9265978 |
Kurtosis | 150.39725 |
Mean | 570.0901 |
Median Absolute Deviation (MAD) | 41 |
Skewness | 10.440243 |
Sum | 5700901 |
Variance | 5010947.3 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 629 | 6.3% |
1 | 431 | 4.3% |
2 | 321 | 3.2% |
3 | 296 | 3.0% |
4 | 237 | 2.4% |
5 | 208 | 2.1% |
7 | 188 | 1.9% |
6 | 179 | 1.8% |
8 | 171 | 1.7% |
12 | 135 | 1.4% |
Other values (1786) | 7205 |
Value | Count | Frequency (%) |
0 | 629 | |
1 | 431 | |
2 | 321 | |
3 | 296 | |
4 | 237 | 2.4% |
5 | 208 | 2.1% |
6 | 179 | 1.8% |
7 | 188 | 1.9% |
8 | 171 | 1.7% |
9 | 128 | 1.3% |
Value | Count | Frequency (%) |
51992 | 1 | |
46215 | 1 | |
43194 | 1 | |
39519 | 1 | |
38177 | 1 | |
36596 | 1 | |
35662 | 1 | |
34846 | 1 | |
33816 | 1 | |
33791 | 1 |
하차인원수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 1810 |
---|---|
Distinct (%) | 18.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 595.5279 |
Minimum | 0 |
---|---|
Maximum | 73214 |
Zeros | 618 |
Zeros (%) | 6.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 7 |
median | 41 |
Q3 | 242.25 |
95-th percentile | 2756.3 |
Maximum | 73214 |
Range | 73214 |
Interquartile range (IQR) | 235.25 |
Descriptive statistics
Standard deviation | 2638.8877 |
---|---|
Coefficient of variation (CV) | 4.431174 |
Kurtosis | 222.80421 |
Mean | 595.5279 |
Median Absolute Deviation (MAD) | 40 |
Skewness | 12.832177 |
Sum | 5955279 |
Variance | 6963728.4 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 618 | 6.2% |
1 | 477 | 4.8% |
2 | 378 | 3.8% |
3 | 315 | 3.1% |
4 | 245 | 2.5% |
5 | 209 | 2.1% |
6 | 191 | 1.9% |
7 | 177 | 1.8% |
9 | 155 | 1.6% |
8 | 151 | 1.5% |
Other values (1800) | 7084 |
Value | Count | Frequency (%) |
0 | 618 | |
1 | 477 | |
2 | 378 | |
3 | 315 | |
4 | 245 | 2.5% |
5 | 209 | 2.1% |
6 | 191 | 1.9% |
7 | 177 | 1.8% |
8 | 151 | 1.5% |
9 | 155 | 1.6% |
Value | Count | Frequency (%) |
73214 | 1 | |
64258 | 1 | |
51563 | 1 | |
51542 | 1 | |
51052 | 1 | |
46348 | 1 | |
46329 | 1 | |
45967 | 1 | |
43895 | 1 | |
41431 | 1 |
상행하행구분 | 승차인원수 | 하차인원수 | |
---|---|---|---|
상행하행구분 | 1.000 | 0.053 | 0.050 |
승차인원수 | 0.053 | 1.000 | 0.233 |
하차인원수 | 0.050 | 0.233 | 1.000 |
승차인원수 | 하차인원수 | 상행하행구분 | |
---|---|---|---|
승차인원수 | 1.000 | 0.623 | 0.040 |
하차인원수 | 0.623 | 1.000 | 0.038 |
상행하행구분 | 0.040 | 0.038 | 1.000 |
운행일자 | 정차역 | 상행하행구분 | 승차인원수 | 하차인원수 | |
---|---|---|---|---|---|
73120 | 2020-06-19 | 영등포 | 하행 | 10400 | 18 |
23322 | 2020-02-23 | 목포 | 상행 | 1612 | 0 |
43248 | 2020-04-10 | 임성리 | 상행 | 12 | 0 |
65620 | 2020-06-01 | 예산 | 하행 | 108 | 590 |
63226 | 2020-05-26 | 포항 | 하행 | 146 | 1852 |
96124 | 2020-08-12 | 곡성 | 상행 | 146 | 84 |
85437 | 2020-07-17 | 함안 | 하행 | 20 | 75 |
86825 | 2020-07-21 | 부강 | 하행 | 25 | 78 |
71265 | 2020-06-14 | 도계 | 상행 | 42 | 38 |
28332 | 2020-03-06 | 서경주 | 하행 | 38 | 38 |
운행일자 | 정차역 | 상행하행구분 | 승차인원수 | 하차인원수 | |
---|---|---|---|---|---|
23172 | 2020-02-23 | 신탄진 | 하행 | 250 | 927 |
70639 | 2020-06-13 | 매곡 | 하행 | 1 | 13 |
40697 | 2020-04-04 | 여천 | 상행 | 554 | 2 |
29181 | 2020-03-08 | 논산 | 하행 | 124 | 441 |
44560 | 2020-04-13 | 오근장 | 상행 | 70 | 168 |
12845 | 2020-01-30 | 영주 | 하행 | 193 | 323 |
30979 | 2020-03-12 | 용궁 | 상행 | 1 | 1 |
74507 | 2020-06-22 | 반곡 | 상행 | 70 | 9 |
27955 | 2020-03-05 | 임성리 | 상행 | 12 | 0 |
33149 | 2020-03-17 | 태백 | 상행 | 121 | 21 |