Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 742.2 KiB |
Average record size in memory | 76.0 B |
Variable types
Numeric | 4 |
---|---|
DateTime | 1 |
Categorical | 2 |
Text | 1 |
Dataset
Description | 서울교통공사 1~8호선 역별 일별 승객유형별 수송인원(환승유입인원 포함) 정보입니다. 해당 데이터는 연번, 날짜 호선, 역변호, 역명, 승객유형, 승차인원, 환승유입인원 데이터로 구성되어 있습니다. |
---|---|
URL | https://www.data.go.kr/data/15104835/fileData.do |
역번호 is highly overall correlated with 호선 | High correlation |
승차인원 is highly overall correlated with 환승유입인원 | High correlation |
환승유입인원 is highly overall correlated with 승차인원 | High correlation |
호선 is highly overall correlated with 역번호 | High correlation |
연번 has unique values | Unique |
승차인원 has 436 (4.4%) zeros | Zeros |
환승유입인원 has 1120 (11.2%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 21:56:56.612958 |
---|---|
Analysis finished | 2023-12-12 21:56:59.561406 |
Duration | 2.95 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 47516.656 |
Minimum | 21 |
---|---|
Maximum | 95274 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 21 |
---|---|
5-th percentile | 4772.7 |
Q1 | 23435.75 |
median | 47384 |
Q3 | 71382 |
95-th percentile | 90499.1 |
Maximum | 95274 |
Range | 95253 |
Interquartile range (IQR) | 47946.25 |
Descriptive statistics
Standard deviation | 27605.836 |
---|---|
Coefficient of variation (CV) | 0.58097177 |
Kurtosis | -1.2069809 |
Mean | 47516.656 |
Median Absolute Deviation (MAD) | 23979.5 |
Skewness | 0.012799 |
Sum | 4.7516656 × 108 |
Variance | 7.6208217 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
82755 | 1 | < 0.1% |
63500 | 1 | < 0.1% |
63185 | 1 | < 0.1% |
70734 | 1 | < 0.1% |
52793 | 1 | < 0.1% |
87546 | 1 | < 0.1% |
72040 | 1 | < 0.1% |
92823 | 1 | < 0.1% |
13270 | 1 | < 0.1% |
61001 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
21 | 1 | |
22 | 1 | |
30 | 1 | |
55 | 1 | |
72 | 1 | |
86 | 1 | |
88 | 1 | |
111 | 1 | |
115 | 1 | |
145 | 1 |
Value | Count | Frequency (%) |
95274 | 1 | |
95270 | 1 | |
95262 | 1 | |
95243 | 1 | |
95239 | 1 | |
95212 | 1 | |
95207 | 1 | |
95200 | 1 | |
95190 | 1 | |
95189 | 1 |
날짜
Date
Distinct | 55 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2022-01-01 00:00:00 |
---|---|
Maximum | 2022-02-24 00:00:00 |
호선
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2호선 | |
---|---|
5호선 | |
7호선 | |
6호선 | |
3호선 | |
Other values (3) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 5호선 |
---|---|
2nd row | 4호선 |
3rd row | 6호선 |
4th row | 7호선 |
5th row | 7호선 |
Common Values
Value | Count | Frequency (%) |
2호선 | 2084 | |
5호선 | 1931 | |
7호선 | 1456 | |
6호선 | 1272 | |
3호선 | 1239 | |
4호선 | 1025 | |
8호선 | 619 | 6.2% |
1호선 | 374 | 3.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2호선 | 2084 | |
5호선 | 1931 | |
7호선 | 1456 | |
6호선 | 1272 | |
3호선 | 1239 | |
4호선 | 1025 | |
8호선 | 619 | 6.2% |
1호선 | 374 | 3.7% |
역번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 279 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1532.9507 |
Minimum | 150 |
---|---|
Maximum | 2828 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 150 |
---|---|
5-th percentile | 203 |
Q1 | 310 |
median | 2519 |
Q3 | 2635 |
95-th percentile | 2814 |
Maximum | 2828 |
Range | 2678 |
Interquartile range (IQR) | 2325 |
Descriptive statistics
Standard deviation | 1181.0751 |
---|---|
Coefficient of variation (CV) | 0.77045861 |
Kurtosis | -1.9633683 |
Mean | 1532.9507 |
Median Absolute Deviation (MAD) | 301 |
Skewness | -0.10750144 |
Sum | 15329507 |
Variance | 1394938.3 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
424 | 63 | 0.6% |
240 | 57 | 0.6% |
206 | 57 | 0.6% |
230 | 55 | 0.5% |
318 | 54 | 0.5% |
2534 | 53 | 0.5% |
239 | 52 | 0.5% |
2624 | 52 | 0.5% |
208 | 52 | 0.5% |
420 | 52 | 0.5% |
Other values (269) | 9453 |
Value | Count | Frequency (%) |
150 | 40 | |
151 | 51 | |
152 | 41 | |
153 | 42 | |
154 | 25 | |
155 | 42 | |
156 | 33 | |
157 | 36 | |
158 | 34 | |
159 | 30 |
Value | Count | Frequency (%) |
2828 | 30 | |
2827 | 28 | |
2826 | 36 | |
2825 | 36 | |
2824 | 27 | |
2823 | 36 | |
2822 | 33 | |
2821 | 29 | |
2820 | 38 | |
2819 | 33 |
역명
Text
Distinct | 244 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
종로3가 | 137 | 1.4% |
동대문역사문화공원(ddp | 124 | 1.2% |
시청 | 102 | 1.0% |
신당 | 94 | 0.9% |
고속터미널 | 94 | 0.9% |
합정 | 93 | 0.9% |
왕십리(성동구청 | 88 | 0.9% |
공덕 | 88 | 0.9% |
동대문 | 83 | 0.8% |
태릉입구 | 82 | 0.8% |
Other values (234) | 9015 |
Most occurring characters
Value | Count | Frequency (%) |
( | 2258 | 5.1% |
) | 2258 | 5.1% |
구 | 1834 | 4.2% |
대 | 1722 | 3.9% |
동 | 1234 | 2.8% |
청 | 1111 | 2.5% |
신 | 941 | 2.1% |
문 | 803 | 1.8% |
원 | 783 | 1.8% |
입 | 723 | 1.6% |
Other values (231) | 30272 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 38608 | |
Open Punctuation | 2258 | 5.1% |
Close Punctuation | 2258 | 5.1% |
Uppercase Letter | 372 | 0.8% |
Decimal Number | 308 | 0.7% |
Other Punctuation | 135 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 1834 | 4.8% |
대 | 1722 | 4.5% |
동 | 1234 | 3.2% |
청 | 1111 | 2.9% |
신 | 941 | 2.4% |
문 | 803 | 2.1% |
원 | 783 | 2.0% |
입 | 723 | 1.9% |
산 | 707 | 1.8% |
로 | 633 | 1.6% |
Other values (222) | 28117 |
Decimal Number
Value | Count | Frequency (%) |
3 | 219 | |
4 | 64 | 20.8% |
5 | 25 | 8.1% |
Uppercase Letter
Value | Count | Frequency (%) |
D | 248 | |
P | 124 |
Other Punctuation
Value | Count | Frequency (%) |
. | 96 | |
· | 39 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2258 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2258 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 38608 | |
Common | 4959 | 11.3% |
Latin | 372 | 0.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 1834 | 4.8% |
대 | 1722 | 4.5% |
동 | 1234 | 3.2% |
청 | 1111 | 2.9% |
신 | 941 | 2.4% |
문 | 803 | 2.1% |
원 | 783 | 2.0% |
입 | 723 | 1.9% |
산 | 707 | 1.8% |
로 | 633 | 1.6% |
Other values (222) | 28117 |
Common
Value | Count | Frequency (%) |
( | 2258 | |
) | 2258 | |
3 | 219 | 4.4% |
. | 96 | 1.9% |
4 | 64 | 1.3% |
· | 39 | 0.8% |
5 | 25 | 0.5% |
Latin
Value | Count | Frequency (%) |
D | 248 | |
P | 124 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 38608 | |
ASCII | 5292 | 12.0% |
None | 39 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 2258 | |
) | 2258 | |
D | 248 | 4.7% |
3 | 219 | 4.1% |
P | 124 | 2.3% |
. | 96 | 1.8% |
4 | 64 | 1.2% |
5 | 25 | 0.5% |
Hangul
Value | Count | Frequency (%) |
구 | 1834 | 4.8% |
대 | 1722 | 4.5% |
동 | 1234 | 3.2% |
청 | 1111 | 2.9% |
신 | 941 | 2.4% |
문 | 803 | 2.1% |
원 | 783 | 2.0% |
입 | 723 | 1.9% |
산 | 707 | 1.8% |
로 | 633 | 1.6% |
Other values (222) | 28117 |
None
Value | Count | Frequency (%) |
· | 39 |
승객유형
Categorical
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
우대권 | |
---|---|
어린이 | |
직원 | |
일반 | |
청소년 | |
Other values (7) |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 2.9355 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 어린이 |
---|---|
2nd row | 직원 |
3rd row | 우대권 |
4th row | 어린이 |
5th row | 직원 |
Common Values
Value | Count | Frequency (%) |
우대권 | 1587 | |
어린이 | 1579 | |
직원 | 1570 | |
일반 | 1541 | |
청소년 | 1497 | |
중고생 | 1196 | |
영어 일반 | 604 | 6.0% |
중국어 일반 | 247 | 2.5% |
영어 어린이 | 102 | 1.0% |
일어 일반 | 43 | 0.4% |
Other values (2) | 34 | 0.3% |
Length
Value | Count | Frequency (%) |
일반 | 2435 | |
어린이 | 1715 | |
우대권 | 1587 | |
직원 | 1570 | |
청소년 | 1497 | |
중고생 | 1196 | |
영어 | 706 | 6.4% |
중국어 | 270 | 2.4% |
일어 | 54 | 0.5% |
승차인원
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 3091 |
---|---|
Distinct (%) | 30.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1975.7037 |
Minimum | 0 |
---|---|
Maximum | 81847 |
Zeros | 436 |
Zeros (%) | 4.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 14 |
median | 93 |
Q3 | 1283.5 |
95-th percentile | 11151.3 |
Maximum | 81847 |
Range | 81847 |
Interquartile range (IQR) | 1269.5 |
Descriptive statistics
Standard deviation | 5416.6099 |
---|---|
Coefficient of variation (CV) | 2.7416104 |
Kurtosis | 45.286366 |
Mean | 1975.7037 |
Median Absolute Deviation (MAD) | 92 |
Skewness | 5.6597064 |
Sum | 19757037 |
Variance | 29339662 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 890 | 8.9% |
0 | 436 | 4.4% |
2 | 407 | 4.1% |
3 | 231 | 2.3% |
4 | 114 | 1.1% |
5 | 74 | 0.7% |
6 | 64 | 0.6% |
23 | 58 | 0.6% |
36 | 55 | 0.5% |
28 | 55 | 0.5% |
Other values (3081) | 7616 |
Value | Count | Frequency (%) |
0 | 436 | |
1 | 890 | |
2 | 407 | |
3 | 231 | 2.3% |
4 | 114 | 1.1% |
5 | 74 | 0.7% |
6 | 64 | 0.6% |
7 | 53 | 0.5% |
8 | 33 | 0.3% |
9 | 32 | 0.3% |
Value | Count | Frequency (%) |
81847 | 1 | |
81791 | 1 | |
77976 | 1 | |
71488 | 1 | |
59240 | 1 | |
58197 | 1 | |
56506 | 1 | |
56045 | 1 | |
55197 | 1 | |
54623 | 1 |
환승유입인원
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 2525 |
---|---|
Distinct (%) | 25.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1016.7829 |
Minimum | 0 |
---|---|
Maximum | 34544 |
Zeros | 1120 |
Zeros (%) | 11.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 4 |
median | 27 |
Q3 | 606 |
95-th percentile | 5881.75 |
Maximum | 34544 |
Range | 34544 |
Interquartile range (IQR) | 602 |
Descriptive statistics
Standard deviation | 2817.5008 |
---|---|
Coefficient of variation (CV) | 2.7709955 |
Kurtosis | 36.432653 |
Mean | 1016.7829 |
Median Absolute Deviation (MAD) | 27 |
Skewness | 5.255116 |
Sum | 10167829 |
Variance | 7938310.9 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 1120 | 11.2% |
1 | 768 | 7.7% |
2 | 341 | 3.4% |
3 | 199 | 2.0% |
7 | 191 | 1.9% |
4 | 187 | 1.9% |
6 | 187 | 1.9% |
5 | 184 | 1.8% |
8 | 168 | 1.7% |
9 | 166 | 1.7% |
Other values (2515) | 6489 |
Value | Count | Frequency (%) |
0 | 1120 | |
1 | 768 | |
2 | 341 | 3.4% |
3 | 199 | 2.0% |
4 | 187 | 1.9% |
5 | 184 | 1.8% |
6 | 187 | 1.9% |
7 | 191 | 1.9% |
8 | 168 | 1.7% |
9 | 166 | 1.7% |
Value | Count | Frequency (%) |
34544 | 1 | |
33715 | 1 | |
33295 | 1 | |
31479 | 1 | |
30888 | 1 | |
30069 | 1 | |
29835 | 1 | |
29650 | 1 | |
29410 | 1 | |
28243 | 1 |
연번 | 날짜 | 호선 | 역번호 | 승객유형 | 승차인원 | 환승유입인원 | |
---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.998 | 0.064 | 0.062 | 0.000 | 0.063 | 0.069 |
날짜 | 0.998 | 1.000 | 0.059 | 0.094 | 0.000 | 0.098 | 0.084 |
호선 | 0.064 | 0.059 | 1.000 | 0.995 | 0.136 | 0.145 | 0.135 |
역번호 | 0.062 | 0.094 | 0.995 | 1.000 | 0.143 | 0.124 | 0.126 |
승객유형 | 0.000 | 0.000 | 0.136 | 0.143 | 1.000 | 0.460 | 0.496 |
승차인원 | 0.063 | 0.098 | 0.145 | 0.124 | 0.460 | 1.000 | 0.938 |
환승유입인원 | 0.069 | 0.084 | 0.135 | 0.126 | 0.496 | 0.938 | 1.000 |
호선 | 승객유형 | |
---|---|---|
호선 | 1.000 | 0.058 |
승객유형 | 0.058 | 1.000 |
연번 | 역번호 | 승차인원 | 환승유입인원 | 호선 | 승객유형 | |
---|---|---|---|---|---|---|
연번 | 1.000 | -0.001 | 0.009 | 0.006 | 0.030 | 0.000 |
역번호 | -0.001 | 1.000 | 0.006 | 0.021 | 0.906 | 0.067 |
승차인원 | 0.009 | 0.006 | 1.000 | 0.977 | 0.069 | 0.212 |
환승유입인원 | 0.006 | 0.021 | 0.977 | 1.000 | 0.065 | 0.234 |
호선 | 0.030 | 0.906 | 0.069 | 0.065 | 1.000 | 0.058 |
승객유형 | 0.000 | 0.067 | 0.212 | 0.234 | 0.058 | 1.000 |
연번 | 날짜 | 호선 | 역번호 | 역명 | 승객유형 | 승차인원 | 환승유입인원 | |
---|---|---|---|---|---|---|---|---|
82754 | 82755 | 2022-02-17 | 5호선 | 2523 | 양평 | 어린이 | 9 | 2 |
73870 | 73871 | 2022-02-12 | 4호선 | 420 | 혜화 | 직원 | 108 | 14 |
32834 | 32835 | 2022-01-19 | 6호선 | 2635 | 청구 | 우대권 | 600 | 350 |
64303 | 64304 | 2022-02-06 | 7호선 | 2742 | 장승배기 | 어린이 | 39 | 10 |
78269 | 78270 | 2022-02-14 | 7호선 | 2749 | 철산 | 직원 | 107 | 55 |
66522 | 66523 | 2022-02-08 | 2호선 | 233 | 대림(구로구청) | 직원 | 125 | 35 |
34581 | 34582 | 2022-01-20 | 6호선 | 2638 | 창신 | 청소년 | 69 | 39 |
80828 | 80829 | 2022-02-16 | 4호선 | 417 | 길음 | 일반 | 14189 | 8217 |
43267 | 43268 | 2022-01-25 | 6호선 | 2635 | 청구 | 우대권 | 662 | 358 |
25015 | 25016 | 2022-01-15 | 3호선 | 320 | 을지로3가 | 어린이 | 19 | 4 |
연번 | 날짜 | 호선 | 역번호 | 역명 | 승객유형 | 승차인원 | 환승유입인원 | |
---|---|---|---|---|---|---|---|---|
23749 | 23750 | 2022-01-14 | 5호선 | 2539 | 신금호 | 직원 | 26 | 11 |
10389 | 10390 | 2022-01-06 | 7호선 | 2741 | 상도 | 직원 | 39 | 15 |
25682 | 25683 | 2022-01-15 | 6호선 | 2611 | 응암 | 어린이 | 110 | 41 |
9228 | 9229 | 2022-01-06 | 2호선 | 248 | 양천구청 | 직원 | 126 | 42 |
25432 | 25433 | 2022-01-15 | 5호선 | 2527 | 여의도 | 일반 | 11386 | 6367 |
90429 | 90430 | 2022-02-21 | 7호선 | 2733 | 학동 | 중고생 | 1 | 0 |
68908 | 68909 | 2022-02-09 | 5호선 | 2538 | 청구 | 청소년 | 65 | 32 |
58168 | 58169 | 2022-02-03 | 4호선 | 413 | 쌍문 | 어린이 | 99 | 12 |
55307 | 55308 | 2022-02-01 | 6호선 | 2623 | 합정 | 청소년 | 114 | 30 |
47384 | 47385 | 2022-01-28 | 2호선 | 222 | 강남 | 중고생 | 18 | 8 |