Overview

Dataset statistics

Number of variables4
Number of observations280
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory9.2 KiB
Average record size in memory33.5 B

Variable types

Categorical3
Numeric1

Dataset

Description한국철도공사에서 운영중인 열차의 열차종별(KTX, 새마을, 무궁화 등), 노선별(경부선, 호남선, 전라선, 경전선, 동해선, 강릉선, 경부선, 중앙선 등), 여객수송실적을 제공합니다.
Author한국철도공사
URLhttps://www.data.go.kr/data/15088862/fileData.do

Alerts

열차종 is highly overall correlated with 노선High correlation
노선 is highly overall correlated with 열차종High correlation
여객수송실적 has 25 (8.9%) zerosZeros

Reproduction

Analysis started2023-12-13 00:25:56.929845
Analysis finished2023-12-13 00:25:57.496197
Duration0.57 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

날짜
Categorical

Distinct10
Distinct (%)3.6%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
2020년 01월
28 
2020년 02월
28 
2020년 03월
28 
2020년 04월
28 
2020년 05월
28 
Other values (5)
140 

Length

Max length9
Median length9
Mean length9
Min length9

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2020년 01월
2nd row2020년 01월
3rd row2020년 01월
4th row2020년 01월
5th row2020년 01월

Common Values

ValueCountFrequency (%)
2020년 01월 28
10.0%
2020년 02월 28
10.0%
2020년 03월 28
10.0%
2020년 04월 28
10.0%
2020년 05월 28
10.0%
2020년 06월 28
10.0%
2020년 07월 28
10.0%
2020년 08월 28
10.0%
2020년 09월 28
10.0%
2020년 10월 28
10.0%

Length

2023-12-13T09:25:57.543396image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T09:25:57.635513image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2020년 280
50.0%
01월 28
 
5.0%
02월 28
 
5.0%
03월 28
 
5.0%
04월 28
 
5.0%
05월 28
 
5.0%
06월 28
 
5.0%
07월 28
 
5.0%
08월 28
 
5.0%
09월 28
 
5.0%

열차종
Categorical

HIGH CORRELATION 

Distinct5
Distinct (%)1.8%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
무궁화
140 
새마을
60 
KTX
50 
통근열차
20 
준고속
 
10

Length

Max length4
Median length3
Mean length3.0714286
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st rowKTX
2nd rowKTX
3rd rowKTX
4th rowKTX
5th rowKTX

Common Values

ValueCountFrequency (%)
무궁화 140
50.0%
새마을 60
21.4%
KTX 50
 
17.9%
통근열차 20
 
7.1%
준고속 10
 
3.6%

Length

2023-12-13T09:25:57.741673image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T09:25:57.819838image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
무궁화 140
50.0%
새마을 60
21.4%
ktx 50
 
17.9%
통근열차 20
 
7.1%
준고속 10
 
3.6%

노선
Categorical

HIGH CORRELATION 

Distinct16
Distinct (%)5.7%
Missing0
Missing (%)0.0%
Memory size2.3 KiB
호남선
40 
경부선
30 
전라선
30 
경전선
20 
동해선
20 
Other values (11)
140 

Length

Max length5
Median length3
Mean length3.0714286
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경부선
2nd row호남선
3rd row전라선
4th row경전선
5th row동해선

Common Values

ValueCountFrequency (%)
호남선 40
14.3%
경부선 30
10.7%
전라선 30
10.7%
경전선 20
 
7.1%
동해선 20
 
7.1%
중앙선 20
 
7.1%
장항선 20
 
7.1%
기타선 20
 
7.1%
강릉선 10
 
3.6%
태백선 10
 
3.6%
Other values (6) 60
21.4%

Length

2023-12-13T09:25:57.932399image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
호남선 40
14.3%
경부선 30
10.7%
전라선 30
10.7%
경전선 20
 
7.1%
동해선 20
 
7.1%
중앙선 20
 
7.1%
장항선 20
 
7.1%
기타선 20
 
7.1%
강릉선 10
 
3.6%
태백선 10
 
3.6%
Other values (6) 60
21.4%

여객수송실적
Real number (ℝ)

ZEROS 

Distinct256
Distinct (%)91.4%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean256633.34
Minimum0
Maximum3055250
Zeros25
Zeros (%)8.9%
Negative0
Negative (%)0.0%
Memory size2.6 KiB
2023-12-13T09:25:58.031874image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q119317.25
median120581.5
Q3305906.25
95-th percentile1241619.8
Maximum3055250
Range3055250
Interquartile range (IQR)286589

Descriptive statistics

Standard deviation407501.03
Coefficient of variation (CV)1.5878726
Kurtosis13.248722
Mean256633.34
Median Absolute Deviation (MAD)111800.5
Skewness3.2967418
Sum71857334
Variance1.6605709 × 1011
MonotonicityNot monotonic
2023-12-13T09:25:58.137605image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
0 25
 
8.9%
3055250 1
 
0.4%
99621 1
 
0.4%
114202 1
 
0.4%
1400948 1
 
0.4%
284941 1
 
0.4%
377067 1
 
0.4%
164115 1
 
0.4%
312985 1
 
0.4%
108300 1
 
0.4%
Other values (246) 246
87.9%
ValueCountFrequency (%)
0 25
8.9%
2307 1
 
0.4%
3786 1
 
0.4%
4805 1
 
0.4%
4844 1
 
0.4%
5344 1
 
0.4%
5673 1
 
0.4%
6597 1
 
0.4%
6748 1
 
0.4%
6984 1
 
0.4%
ValueCountFrequency (%)
3055250 1
0.4%
2094858 1
0.4%
1947832 1
0.4%
1934642 1
0.4%
1908758 1
0.4%
1811557 1
0.4%
1741482 1
0.4%
1659920 1
0.4%
1400948 1
0.4%
1370092 1
0.4%

Interactions

2023-12-13T09:25:57.075885image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T09:25:58.207596image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
날짜열차종노선여객수송실적
날짜1.0000.0000.0000.000
열차종0.0001.0000.8850.455
노선0.0000.8851.0000.595
여객수송실적0.0000.4550.5951.000
2023-12-13T09:25:58.278601image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
열차종날짜노선
열차종1.0000.0000.688
날짜0.0001.0000.000
노선0.6880.0001.000
2023-12-13T09:25:58.346255image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
여객수송실적날짜열차종노선
여객수송실적1.0000.0000.2980.246
날짜0.0001.0000.0000.000
열차종0.2980.0001.0000.688
노선0.2460.0000.6881.000

Missing values

2023-12-13T09:25:57.388583image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T09:25:57.467307image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

날짜열차종노선여객수송실적
02020년 01월KTX경부선3055250
12020년 01월KTX호남선937494
22020년 01월KTX전라선611654
32020년 01월KTX경전선588507
42020년 01월KTX동해선493506
52020년 01월준고속강릉선427874
62020년 01월새마을경부선507773
72020년 01월새마을호남선178593
82020년 01월새마을전라선67825
92020년 01월새마을중앙선21880
날짜열차종노선여객수송실적
2702020년 10월무궁화영동선52721
2712020년 10월무궁화충북선165406
2722020년 10월무궁화경북선19530
2732020년 10월무궁화대구선25795
2742020년 10월무궁화동해남부선243254
2752020년 10월무궁화동해선10423
2762020년 10월무궁화경전선106049
2772020년 10월무궁화기타선0
2782020년 10월통근열차경원선0
2792020년 10월통근열차호남선11504