Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 5330 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 270.8 KiB |
Average record size in memory | 52.0 B |
Variable types
Text | 2 |
---|---|
Numeric | 4 |
Dataset
Description | 한국철도공사여객열차정보에대해2010에서2020년까지역사별승하차KTX상행및하행열차이용객의통계정보입니다. |
---|---|
Author | 한국철도공사 |
URL | https://www.data.go.kr/data/15108119/fileData.do |
하행_승차인원수 is highly overall correlated with 상행_하차인원수 | High correlation |
하행_하차인원수 is highly overall correlated with 상행_승차인원수 | High correlation |
상행_승차인원수 is highly overall correlated with 하행_하차인원수 | High correlation |
상행_하차인원수 is highly overall correlated with 하행_승차인원수 | High correlation |
하행_승차인원수 has 644 (12.1%) zeros | Zeros |
하행_하차인원수 has 179 (3.4%) zeros | Zeros |
상행_승차인원수 has 183 (3.4%) zeros | Zeros |
상행_하차인원수 has 630 (11.8%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 16:11:06.538761 |
---|---|
Analysis finished | 2023-12-12 16:11:09.133829 |
Duration | 2.6 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
운행년월
Text
Distinct | 132 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 41.8 KiB |
Value | Count | Frequency (%) |
2020년 | 630 | 5.9% |
2019년 | 584 | 5.5% |
2018년 | 576 | 5.4% |
2017년 | 477 | 4.5% |
2013년 | 471 | 4.4% |
2015년 | 471 | 4.4% |
2016년 | 469 | 4.4% |
2014년 | 468 | 4.4% |
12월 | 463 | 4.3% |
2012년 | 455 | 4.3% |
Other values (13) | 5596 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 10703 | |
1 | 7364 | |
2 | 7316 | |
년 | 5330 | |
5330 | ||
월 | 5330 | |
9 | 1026 | 2.1% |
8 | 1014 | 2.1% |
7 | 914 | 1.9% |
6 | 914 | 1.9% |
Other values (3) | 2729 | 5.7% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 31980 | |
Other Letter | 10660 | 22.2% |
Space Separator | 5330 | 11.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 10703 | |
1 | 7364 | |
2 | 7316 | |
9 | 1026 | 3.2% |
8 | 1014 | 3.2% |
7 | 914 | 2.9% |
6 | 914 | 2.9% |
3 | 911 | 2.8% |
5 | 910 | 2.8% |
4 | 908 | 2.8% |
Other Letter
Value | Count | Frequency (%) |
년 | 5330 | |
월 | 5330 |
Space Separator
Value | Count | Frequency (%) |
5330 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 37310 | |
Hangul | 10660 | 22.2% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 10703 | |
1 | 7364 | |
2 | 7316 | |
5330 | ||
9 | 1026 | 2.7% |
8 | 1014 | 2.7% |
7 | 914 | 2.4% |
6 | 914 | 2.4% |
3 | 911 | 2.4% |
5 | 910 | 2.4% |
Hangul
Value | Count | Frequency (%) |
년 | 5330 | |
월 | 5330 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 37310 | |
Hangul | 10660 | 22.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 10703 | |
1 | 7364 | |
2 | 7316 | |
5330 | ||
9 | 1026 | 2.7% |
8 | 1014 | 2.7% |
7 | 914 | 2.4% |
6 | 914 | 2.4% |
3 | 911 | 2.4% |
5 | 910 | 2.4% |
Hangul
Value | Count | Frequency (%) |
년 | 5330 | |
월 | 5330 |
정차역
Text
Distinct | 55 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 41.8 KiB |
Value | Count | Frequency (%) |
서울 | 132 | 2.5% |
광명 | 132 | 2.5% |
행신 | 132 | 2.5% |
익산 | 132 | 2.5% |
용산 | 132 | 2.5% |
나주 | 132 | 2.5% |
창원 | 132 | 2.5% |
논산 | 132 | 2.5% |
정읍 | 132 | 2.5% |
계룡 | 132 | 2.5% |
Other values (45) | 4010 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 1030 | 8.1% |
주 | 678 | 5.3% |
구 | 610 | 4.8% |
포 | 574 | 4.5% |
원 | 500 | 3.9% |
천 | 492 | 3.9% |
대 | 396 | 3.1% |
전 | 384 | 3.0% |
창 | 290 | 2.3% |
정 | 274 | 2.2% |
Other values (61) | 7459 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 12687 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 1030 | 8.1% |
주 | 678 | 5.3% |
구 | 610 | 4.8% |
포 | 574 | 4.5% |
원 | 500 | 3.9% |
천 | 492 | 3.9% |
대 | 396 | 3.1% |
전 | 384 | 3.0% |
창 | 290 | 2.3% |
정 | 274 | 2.2% |
Other values (61) | 7459 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 12687 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 1030 | 8.1% |
주 | 678 | 5.3% |
구 | 610 | 4.8% |
포 | 574 | 4.5% |
원 | 500 | 3.9% |
천 | 492 | 3.9% |
대 | 396 | 3.1% |
전 | 384 | 3.0% |
창 | 290 | 2.3% |
정 | 274 | 2.2% |
Other values (61) | 7459 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 12687 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 1030 | 8.1% |
주 | 678 | 5.3% |
구 | 610 | 4.8% |
포 | 574 | 4.5% |
원 | 500 | 3.9% |
천 | 492 | 3.9% |
대 | 396 | 3.1% |
전 | 384 | 3.0% |
창 | 290 | 2.3% |
정 | 274 | 2.2% |
Other values (61) | 7459 |
하행_승차인원수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 3546 |
---|---|
Distinct (%) | 66.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 57711.536 |
Minimum | 0 |
---|---|
Maximum | 1408589 |
Zeros | 644 |
Zeros (%) | 12.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 47.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 182 |
median | 1591.5 |
Q3 | 19791 |
95-th percentile | 288362.2 |
Maximum | 1408589 |
Range | 1408589 |
Interquartile range (IQR) | 19609 |
Descriptive statistics
Standard deviation | 180947.93 |
---|---|
Coefficient of variation (CV) | 3.1353858 |
Kurtosis | 26.843396 |
Mean | 57711.536 |
Median Absolute Deviation (MAD) | 1591.5 |
Skewness | 5.0236399 |
Sum | 3.0760248 × 108 |
Variance | 3.2742154 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 644 | 12.1% |
1 | 50 | 0.9% |
2 | 18 | 0.3% |
5 | 12 | 0.2% |
9 | 11 | 0.2% |
41 | 11 | 0.2% |
37 | 10 | 0.2% |
6 | 10 | 0.2% |
38 | 9 | 0.2% |
8 | 9 | 0.2% |
Other values (3536) | 4546 |
Value | Count | Frequency (%) |
0 | 644 | |
1 | 50 | 0.9% |
2 | 18 | 0.3% |
3 | 7 | 0.1% |
4 | 8 | 0.2% |
5 | 12 | 0.2% |
6 | 10 | 0.2% |
7 | 5 | 0.1% |
8 | 9 | 0.2% |
9 | 11 | 0.2% |
Value | Count | Frequency (%) |
1408589 | 1 | |
1354245 | 1 | |
1351184 | 1 | |
1345961 | 1 | |
1331063 | 1 | |
1311093 | 1 | |
1297578 | 1 | |
1291957 | 1 | |
1284399 | 1 | |
1277939 | 1 |
하행_하차인원수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 4740 |
---|---|
Distinct (%) | 88.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 57347.875 |
Minimum | 0 |
---|---|
Maximum | 693168 |
Zeros | 179 |
Zeros (%) | 3.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 47.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 10 |
Q1 | 3676.25 |
median | 15646 |
Q3 | 52105 |
95-th percentile | 284314.5 |
Maximum | 693168 |
Range | 693168 |
Interquartile range (IQR) | 48428.75 |
Descriptive statistics
Standard deviation | 108433.16 |
---|---|
Coefficient of variation (CV) | 1.8907964 |
Kurtosis | 10.745773 |
Mean | 57347.875 |
Median Absolute Deviation (MAD) | 15046 |
Skewness | 3.1801588 |
Sum | 3.0566417 × 108 |
Variance | 1.1757749 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 179 | 3.4% |
1 | 31 | 0.6% |
2 | 17 | 0.3% |
11 | 11 | 0.2% |
10 | 10 | 0.2% |
8 | 10 | 0.2% |
12 | 8 | 0.2% |
16 | 7 | 0.1% |
13 | 7 | 0.1% |
7 | 6 | 0.1% |
Other values (4730) | 5044 |
Value | Count | Frequency (%) |
0 | 179 | |
1 | 31 | 0.6% |
2 | 17 | 0.3% |
3 | 5 | 0.1% |
4 | 3 | 0.1% |
5 | 5 | 0.1% |
6 | 3 | 0.1% |
7 | 6 | 0.1% |
8 | 10 | 0.2% |
9 | 6 | 0.1% |
Value | Count | Frequency (%) |
693168 | 1 | |
679711 | 1 | |
671027 | 1 | |
667878 | 1 | |
665728 | 1 | |
665158 | 1 | |
664584 | 1 | |
656957 | 1 | |
650780 | 1 | |
644080 | 1 |
상행_승차인원수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 4762 |
---|---|
Distinct (%) | 89.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 58006.363 |
Minimum | 0 |
---|---|
Maximum | 710283 |
Zeros | 183 |
Zeros (%) | 3.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 47.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 7.45 |
Q1 | 3825.75 |
median | 16208.5 |
Q3 | 52103.25 |
95-th percentile | 285638.1 |
Maximum | 710283 |
Range | 710283 |
Interquartile range (IQR) | 48277.5 |
Descriptive statistics
Standard deviation | 109591.26 |
---|---|
Coefficient of variation (CV) | 1.8892972 |
Kurtosis | 10.765298 |
Mean | 58006.363 |
Median Absolute Deviation (MAD) | 15435.5 |
Skewness | 3.1838495 |
Sum | 3.0917391 × 108 |
Variance | 1.2010244 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 183 | 3.4% |
1 | 36 | 0.7% |
2 | 12 | 0.2% |
9 | 10 | 0.2% |
4 | 10 | 0.2% |
10 | 9 | 0.2% |
5 | 9 | 0.2% |
11 | 9 | 0.2% |
8 | 8 | 0.2% |
13 | 8 | 0.2% |
Other values (4752) | 5036 |
Value | Count | Frequency (%) |
0 | 183 | |
1 | 36 | 0.7% |
2 | 12 | 0.2% |
3 | 7 | 0.1% |
4 | 10 | 0.2% |
5 | 9 | 0.2% |
6 | 5 | 0.1% |
7 | 5 | 0.1% |
8 | 8 | 0.2% |
9 | 10 | 0.2% |
Value | Count | Frequency (%) |
710283 | 1 | |
703494 | 1 | |
703384 | 1 | |
672877 | 1 | |
669181 | 1 | |
665730 | 1 | |
664317 | 1 | |
664195 | 1 | |
662751 | 1 | |
661586 | 1 |
상행_하차인원수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 3530 |
---|---|
Distinct (%) | 66.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 58379.617 |
Minimum | 0 |
---|---|
Maximum | 1411126 |
Zeros | 630 |
Zeros (%) | 11.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 47.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 163 |
median | 1537.5 |
Q3 | 19048.75 |
95-th percentile | 293824.5 |
Maximum | 1411126 |
Range | 1411126 |
Interquartile range (IQR) | 18885.75 |
Descriptive statistics
Standard deviation | 184341.26 |
---|---|
Coefficient of variation (CV) | 3.1576306 |
Kurtosis | 26.768975 |
Mean | 58379.617 |
Median Absolute Deviation (MAD) | 1537.5 |
Skewness | 5.0207773 |
Sum | 3.1116336 × 108 |
Variance | 3.3981702 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 630 | 11.8% |
1 | 67 | 1.3% |
2 | 30 | 0.6% |
3 | 16 | 0.3% |
4 | 13 | 0.2% |
10 | 10 | 0.2% |
6 | 10 | 0.2% |
5 | 10 | 0.2% |
99 | 9 | 0.2% |
14 | 8 | 0.2% |
Other values (3520) | 4527 |
Value | Count | Frequency (%) |
0 | 630 | |
1 | 67 | 1.3% |
2 | 30 | 0.6% |
3 | 16 | 0.3% |
4 | 13 | 0.2% |
5 | 10 | 0.2% |
6 | 10 | 0.2% |
7 | 7 | 0.1% |
8 | 6 | 0.1% |
9 | 7 | 0.1% |
Value | Count | Frequency (%) |
1411126 | 1 | |
1379432 | 1 | |
1372094 | 1 | |
1365292 | 1 | |
1360470 | 1 | |
1349659 | 1 | |
1327643 | 1 | |
1322281 | 1 | |
1301637 | 1 | |
1293797 | 1 |
정차역 | 하행_승차인원수 | 하행_하차인원수 | 상행_승차인원수 | 상행_하차인원수 | |
---|---|---|---|---|---|
정차역 | 1.000 | 0.844 | 0.910 | 0.912 | 0.850 |
하행_승차인원수 | 0.844 | 1.000 | 0.456 | 0.449 | 0.962 |
하행_하차인원수 | 0.910 | 0.456 | 1.000 | 0.996 | 0.335 |
상행_승차인원수 | 0.912 | 0.449 | 0.996 | 1.000 | 0.337 |
상행_하차인원수 | 0.850 | 0.962 | 0.335 | 0.337 | 1.000 |
하행_승차인원수 | 하행_하차인원수 | 상행_승차인원수 | 상행_하차인원수 | |
---|---|---|---|---|
하행_승차인원수 | 1.000 | 0.061 | 0.066 | 0.997 |
하행_하차인원수 | 0.061 | 1.000 | 0.998 | 0.064 |
상행_승차인원수 | 0.066 | 0.998 | 1.000 | 0.069 |
상행_하차인원수 | 0.997 | 0.064 | 0.069 | 1.000 |
운행년월 | 정차역 | 하행_승차인원수 | 하행_하차인원수 | 상행_승차인원수 | 상행_하차인원수 | |
---|---|---|---|---|---|---|
0 | 2010년 01월 | 서울 | 837659 | 103 | 263 | 893007 |
1 | 2010년 01월 | 용산 | 183799 | 19 | 86 | 202844 |
2 | 2010년 01월 | 영등포 | 0 | 0 | 0 | 1 |
3 | 2010년 01월 | 수원 | 1 | 0 | 0 | 4 |
4 | 2010년 01월 | 대전 | 127187 | 214317 | 226219 | 129055 |
5 | 2010년 01월 | 동대구 | 85129 | 416075 | 436833 | 81403 |
6 | 2010년 01월 | 경산 | 0 | 0 | 3 | 0 |
7 | 2010년 01월 | 밀양 | 5739 | 45833 | 49264 | 4778 |
8 | 2010년 01월 | 구포 | 336 | 125795 | 126044 | 265 |
9 | 2010년 01월 | 부산 | 1 | 455849 | 473546 | 1 |
운행년월 | 정차역 | 하행_승차인원수 | 하행_하차인원수 | 상행_승차인원수 | 상행_하차인원수 | |
---|---|---|---|---|---|---|
5320 | 2020년 12월 | 신경주 | 2360 | 20738 | 19784 | 2391 |
5321 | 2020년 12월 | 울산 | 8100 | 69541 | 65611 | 8666 |
5322 | 2020년 12월 | 상봉 | 7017 | 74 | 83 | 7972 |
5323 | 2020년 12월 | 창원중앙 | 668 | 31006 | 31489 | 527 |
5324 | 2020년 12월 | 공주 | 1326 | 2597 | 2359 | 1143 |
5325 | 2020년 12월 | 포항 | 0 | 51350 | 51016 | 0 |
5326 | 2020년 12월 | 횡성 | 681 | 3904 | 3803 | 669 |
5327 | 2020년 12월 | 둔내 | 170 | 2111 | 1929 | 182 |
5328 | 2020년 12월 | 평창 | 749 | 4019 | 3794 | 726 |
5329 | 2020년 12월 | 진부 | 529 | 5135 | 4941 | 542 |