Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 111 |
Missing cells (%) | 0.2% |
Duplicate rows | 14 |
Duplicate rows (%) | 0.1% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
Text | 2 |
---|---|
Numeric | 1 |
Categorical | 2 |
Dataset
Description | 한국철도공사에서 매년 발간되는 통계연보의 수도권 전철 역간 여객발착 수송량 대한 데이터로 출발역,도착역,인원,단위 항목을 제공합니다. |
---|---|
Author | 한국철도공사 |
URL | https://www.data.go.kr/data/3037647/fileData.do |
단위 has constant value "" | Constant |
연도 has constant value "" | Constant |
Dataset has 14 (0.1%) duplicate rows | Duplicates |
도착역 has 111 (1.1%) missing values | Missing |
인원 has 2026 (20.3%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 21:51:27.629325 |
---|---|
Analysis finished | 2023-12-12 21:51:28.189260 |
Duration | 0.56 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
출발
Text
Distinct | 337 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
수서 | 46 | 0.5% |
선릉(2 | 45 | 0.4% |
종합운동장 | 44 | 0.4% |
기흥 | 43 | 0.4% |
봉명 | 43 | 0.4% |
창동(4 | 42 | 0.4% |
김유정 | 42 | 0.4% |
용답 | 42 | 0.4% |
가좌 | 41 | 0.4% |
당산 | 41 | 0.4% |
Other values (327) | 9571 |
Most occurring characters
Value | Count | Frequency (%) |
( | 1778 | 5.5% |
) | 1778 | 5.5% |
대 | 1153 | 3.5% |
신 | 807 | 2.5% |
구 | 771 | 2.4% |
천 | 638 | 2.0% |
산 | 620 | 1.9% |
동 | 606 | 1.9% |
정 | 578 | 1.8% |
수 | 578 | 1.8% |
Other values (227) | 23258 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 27291 | |
Open Punctuation | 1778 | 5.5% |
Close Punctuation | 1778 | 5.5% |
Decimal Number | 1544 | 4.7% |
Uppercase Letter | 174 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 1153 | 4.2% |
신 | 807 | 3.0% |
구 | 771 | 2.8% |
천 | 638 | 2.3% |
산 | 620 | 2.3% |
동 | 606 | 2.2% |
정 | 578 | 2.1% |
수 | 578 | 2.1% |
원 | 550 | 2.0% |
서 | 486 | 1.8% |
Other values (218) | 20504 |
Decimal Number
Value | Count | Frequency (%) |
2 | 533 | |
3 | 519 | |
4 | 299 | |
1 | 169 | 10.9% |
5 | 24 | 1.6% |
Uppercase Letter
Value | Count | Frequency (%) |
D | 116 | |
P | 58 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1778 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1778 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 27291 | |
Common | 5100 | 15.7% |
Latin | 174 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 1153 | 4.2% |
신 | 807 | 3.0% |
구 | 771 | 2.8% |
천 | 638 | 2.3% |
산 | 620 | 2.3% |
동 | 606 | 2.2% |
정 | 578 | 2.1% |
수 | 578 | 2.1% |
원 | 550 | 2.0% |
서 | 486 | 1.8% |
Other values (218) | 20504 |
Common
Value | Count | Frequency (%) |
( | 1778 | |
) | 1778 | |
2 | 533 | 10.5% |
3 | 519 | 10.2% |
4 | 299 | 5.9% |
1 | 169 | 3.3% |
5 | 24 | 0.5% |
Latin
Value | Count | Frequency (%) |
D | 116 | |
P | 58 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 27291 | |
ASCII | 5274 | 16.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 1778 | |
) | 1778 | |
2 | 533 | 10.1% |
3 | 519 | 9.8% |
4 | 299 | 5.7% |
1 | 169 | 3.2% |
D | 116 | 2.2% |
P | 58 | 1.1% |
5 | 24 | 0.5% |
Hangul
Value | Count | Frequency (%) |
대 | 1153 | 4.2% |
신 | 807 | 3.0% |
구 | 771 | 2.8% |
천 | 638 | 2.3% |
산 | 620 | 2.3% |
동 | 606 | 2.2% |
정 | 578 | 2.1% |
수 | 578 | 2.1% |
원 | 550 | 2.0% |
서 | 486 | 1.8% |
Other values (218) | 20504 |
도착역
Text
MISSING
 
Distinct | 294 |
---|---|
Distinct (%) | 3.0% |
Missing | 111 |
Missing (%) | 1.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
세마 | 49 | 0.5% |
신해운대 | 49 | 0.5% |
독산 | 48 | 0.5% |
화전 | 46 | 0.5% |
신촌 | 46 | 0.5% |
석계 | 46 | 0.5% |
연수 | 46 | 0.5% |
상록수 | 46 | 0.5% |
중랑 | 46 | 0.5% |
아신 | 44 | 0.4% |
Other values (284) | 9423 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 878 | 3.4% |
천 | 850 | 3.2% |
대 | 759 | 2.9% |
정 | 650 | 2.5% |
신 | 583 | 2.2% |
원 | 576 | 2.2% |
수 | 519 | 2.0% |
동 | 434 | 1.7% |
구 | 430 | 1.6% |
) | 426 | 1.6% |
Other values (201) | 20093 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 25346 | |
Close Punctuation | 426 | 1.6% |
Open Punctuation | 426 | 1.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 878 | 3.5% |
천 | 850 | 3.4% |
대 | 759 | 3.0% |
정 | 650 | 2.6% |
신 | 583 | 2.3% |
원 | 576 | 2.3% |
수 | 519 | 2.0% |
동 | 434 | 1.7% |
구 | 430 | 1.7% |
서 | 390 | 1.5% |
Other values (199) | 19277 |
Close Punctuation
Value | Count | Frequency (%) |
) | 426 |
Open Punctuation
Value | Count | Frequency (%) |
( | 426 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 25346 | |
Common | 852 | 3.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 878 | 3.5% |
천 | 850 | 3.4% |
대 | 759 | 3.0% |
정 | 650 | 2.6% |
신 | 583 | 2.3% |
원 | 576 | 2.3% |
수 | 519 | 2.0% |
동 | 434 | 1.7% |
구 | 430 | 1.7% |
서 | 390 | 1.5% |
Other values (199) | 19277 |
Common
Value | Count | Frequency (%) |
) | 426 | |
( | 426 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 25346 | |
ASCII | 852 | 3.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 878 | 3.5% |
천 | 850 | 3.4% |
대 | 759 | 3.0% |
정 | 650 | 2.6% |
신 | 583 | 2.3% |
원 | 576 | 2.3% |
수 | 519 | 2.0% |
동 | 434 | 1.7% |
구 | 430 | 1.7% |
서 | 390 | 1.5% |
Other values (199) | 19277 |
ASCII
Value | Count | Frequency (%) |
) | 426 | |
( | 426 |
인원
Real number (ℝ)
ZEROS
 
Distinct | 3767 |
---|---|
Distinct (%) | 37.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5059.5196 |
Minimum | 0 |
---|---|
Maximum | 418320 |
Zeros | 2026 |
Zeros (%) | 20.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 10 |
median | 278.5 |
Q3 | 2001.75 |
95-th percentile | 23093.3 |
Maximum | 418320 |
Range | 418320 |
Interquartile range (IQR) | 1991.75 |
Descriptive statistics
Standard deviation | 19547.631 |
---|---|
Coefficient of variation (CV) | 3.863535 |
Kurtosis | 106.72548 |
Mean | 5059.5196 |
Median Absolute Deviation (MAD) | 278.5 |
Skewness | 8.8002708 |
Sum | 50595196 |
Variance | 3.8210987 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 2026 | 20.3% |
1 | 93 | 0.9% |
2 | 68 | 0.7% |
3 | 53 | 0.5% |
4 | 52 | 0.5% |
6 | 49 | 0.5% |
5 | 45 | 0.4% |
7 | 41 | 0.4% |
9 | 39 | 0.4% |
14 | 33 | 0.3% |
Other values (3757) | 7501 |
Value | Count | Frequency (%) |
0 | 2026 | |
1 | 93 | 0.9% |
2 | 68 | 0.7% |
3 | 53 | 0.5% |
4 | 52 | 0.5% |
5 | 45 | 0.4% |
6 | 49 | 0.5% |
7 | 41 | 0.4% |
8 | 32 | 0.3% |
9 | 39 | 0.4% |
Value | Count | Frequency (%) |
418320 | 1 | |
381920 | 1 | |
339350 | 1 | |
337803 | 1 | |
298012 | 1 | |
292246 | 1 | |
263491 | 1 | |
260666 | 1 | |
259045 | 1 | |
249718 | 1 |
단위
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
명 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 명 |
---|---|
2nd row | 명 |
3rd row | 명 |
4th row | 명 |
5th row | 명 |
Common Values
Value | Count | Frequency (%) |
명 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
명 | 10000 |
연도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2022 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2022 |
---|---|
2nd row | 2022 |
3rd row | 2022 |
4th row | 2022 |
5th row | 2022 |
Common Values
Value | Count | Frequency (%) |
2022 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2022 | 10000 |
출발 | 도착역 | 인원 | 단위 | 연도 | |
---|---|---|---|---|---|
87486 | 송내 | 오류동 | 51630 | 명 | 2022 |
20727 | 안국 | 도봉산 | 7846 | 명 | 2022 |
33215 | 충무로(4) | 원흥 | 0 | 명 | 2022 |
22677 | 옥수(3) | 경마공원 | 1741 | 명 | 2022 |
78352 | 오산대 | 덕계 | 41 | 명 | 2022 |
41771 | 석계 | 선정릉 | 6864 | 명 | 2022 |
31340 | 길음 | 대야미 | 1388 | 명 | 2022 |
44588 | 대모산입구 | 덕소 | 432 | 명 | 2022 |
51773 | 서울(경의선) | 남춘천 | 2 | 명 | 2022 |
27776 | 오금(3) | 대야미 | 97 | 명 | 2022 |
출발 | 도착역 | 인원 | 단위 | 연도 | |
---|---|---|---|---|---|
39173 | 서빙고 | 신현 | 13 | 명 | 2022 |
88927 | 제물포 | 가산디지털단지 | 24277 | 명 | 2022 |
77951 | 세마 | 세류 | 10143 | 명 | 2022 |
84866 | 안산 | 소래포구 | 32052 | 명 | 2022 |
14316 | 홍대입구 | 화전 | 0 | 명 | 2022 |
97740 | 기흥 | 대모산입구 | 7138 | 명 | 2022 |
50446 | 오빈 | 대곡 | 8 | 명 | 2022 |
13890 | 당산 | 인하대 | 359 | 명 | 2022 |
92660 | 서울숲 | 망양 | 0 | 명 | 2022 |
45579 | 신길 | 병점 | 9509 | 명 | 2022 |
Most frequently occurring
출발 | 도착역 | 인원 | 단위 | 연도 | # duplicates | |
---|---|---|---|---|---|---|
0 | 강남 | <NA> | 0 | 명 | 2022 | 2 |
1 | 경마공원 | <NA> | 0 | 명 | 2022 | 2 |
2 | 교대(2) | <NA> | 0 | 명 | 2022 | 2 |
3 | 대모산입구 | <NA> | 0 | 명 | 2022 | 2 |
4 | 사릉 | <NA> | 0 | 명 | 2022 | 2 |
5 | 서울(4) | <NA> | 0 | 명 | 2022 | 2 |
6 | 양천구청 | <NA> | 0 | 명 | 2022 | 2 |
7 | 역삼 | <NA> | 0 | 명 | 2022 | 2 |
8 | 온수 | <NA> | 0 | 명 | 2022 | 2 |
9 | 운천 | <NA> | 0 | 명 | 2022 | 2 |