Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 736 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 36.8 KiB |
Average record size in memory | 51.2 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 2 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 서울시(스마트카드사) |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=13 |
교통운영기관명(CORP_NM) is highly overall correlated with 교통운영기관ID(CORP_ID) and 3 other fields | High correlation |
호선명(LINE_NM) is highly overall correlated with 교통운영기관ID(CORP_ID) and 3 other fields | High correlation |
교통운영기관ID(CORP_ID) is highly overall correlated with 호선코드(LINE_CD) and 3 other fields | High correlation |
호선코드(LINE_CD) is highly overall correlated with 교통운영기관ID(CORP_ID) and 3 other fields | High correlation |
역ID(STATION_ID) is highly overall correlated with 교통운영기관ID(CORP_ID) and 3 other fields | High correlation |
역ID(STATION_ID) has unique values | Unique |
Reproduction
Analysis started | 2024-04-17 19:24:57.823440 |
---|---|
Analysis finished | 2024-04-17 19:24:58.933294 |
Duration | 1.11 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
교통운영기관ID(CORP_ID)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2147.3152 |
Minimum | 2110 |
---|---|
Maximum | 2413 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.6 KiB |
Quantile statistics
Minimum | 2110 |
---|---|
5-th percentile | 2110 |
Q1 | 2110 |
median | 2111 |
Q3 | 2120 |
95-th percentile | 2411 |
Maximum | 2413 |
Range | 303 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 87.111336 |
---|---|
Coefficient of variation (CV) | 0.040567559 |
Kurtosis | 3.6313372 |
Mean | 2147.3152 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 2.261919 |
Sum | 1580424 |
Variance | 7588.3849 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2110 | 283 | |
2111 | 264 | |
2283 | 30 | 4.1% |
2284 | 29 | 3.9% |
2120 | 25 | 3.4% |
2410 | 15 | 2.0% |
2411 | 15 | 2.0% |
2121 | 14 | 1.9% |
2125 | 13 | 1.8% |
2412 | 13 | 1.8% |
Other values (4) | 35 | 4.8% |
Value | Count | Frequency (%) |
2110 | 283 | |
2111 | 264 | |
2120 | 25 | 3.4% |
2121 | 14 | 1.9% |
2123 | 6 | 0.8% |
2125 | 13 | 1.8% |
2126 | 7 | 1.0% |
2127 | 12 | 1.6% |
2283 | 30 | 4.1% |
2284 | 29 | 3.9% |
Value | Count | Frequency (%) |
2413 | 10 | 1.4% |
2412 | 13 | |
2411 | 15 | |
2410 | 15 | |
2284 | 29 | |
2283 | 30 | |
2127 | 12 | 1.6% |
2126 | 7 | 1.0% |
2125 | 13 | |
2123 | 6 | 0.8% |
교통운영기관명(CORP_NM)
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
서울교통공사 | |
---|---|
한국철도공사 | |
인천교통공사 | |
인천도시철도2호선 | |
서울메트로9호선 | 25 |
Other values (9) |
Length
Max length | 17 |
---|---|
Median length | 6 |
Mean length | 6.4116848 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울교통공사 |
---|---|
2nd row | 서울교통공사 |
3rd row | 서울교통공사 |
4th row | 서울교통공사 |
5th row | 서울교통공사 |
Common Values
Value | Count | Frequency (%) |
서울교통공사 | 283 | |
한국철도공사 | 264 | |
인천교통공사 | 30 | 4.1% |
인천도시철도2호선 | 29 | 3.9% |
서울메트로9호선 | 25 | 3.4% |
용인경량전철 | 15 | 2.0% |
의정부경전철 | 15 | 2.0% |
공항철도 | 14 | 1.9% |
서울교통공사(9호선 2~3단계) | 13 | 1.8% |
우이신설경전철 | 13 | 1.8% |
Other values (4) | 35 | 4.8% |
Length
Value | Count | Frequency (%) |
서울교통공사 | 283 | |
한국철도공사 | 264 | |
인천교통공사 | 30 | 4.0% |
인천도시철도2호선 | 29 | 3.9% |
서울메트로9호선 | 25 | 3.3% |
용인경량전철 | 15 | 2.0% |
의정부경전철 | 15 | 2.0% |
공항철도 | 14 | 1.9% |
서울교통공사(9호선 | 13 | 1.7% |
2~3단계 | 13 | 1.7% |
Other values (5) | 48 | 6.4% |
호선코드(LINE_CD)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 33 |
---|---|
Distinct (%) | 4.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 175.10598 |
Minimum | 1 |
---|---|
Maximum | 409 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.6 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 103 |
median | 112 |
Q3 | 208 |
95-th percentile | 406 |
Maximum | 409 |
Range | 408 |
Interquartile range (IQR) | 105 |
Descriptive statistics
Standard deviation | 128.7186 |
---|---|
Coefficient of variation (CV) | 0.73508971 |
Kurtosis | -0.74065505 |
Mean | 175.10598 |
Median Absolute Deviation (MAD) | 94 |
Skewness | 0.53977491 |
Sum | 128878 |
Variance | 16568.479 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
205 | 56 | 7.6% |
207 | 51 | 6.9% |
2 | 50 | 6.8% |
101 | 39 | 5.3% |
206 | 39 | 5.3% |
106 | 35 | 4.8% |
3 | 34 | 4.6% |
110 | 33 | 4.5% |
103 | 30 | 4.1% |
301 | 30 | 4.1% |
Other values (23) | 339 |
Value | Count | Frequency (%) |
1 | 10 | 1.4% |
2 | 50 | |
3 | 34 | |
4 | 26 | |
101 | 39 | |
102 | 20 | 2.7% |
103 | 30 | |
104 | 13 | 1.8% |
105 | 8 | 1.1% |
106 | 35 |
Value | Count | Frequency (%) |
409 | 10 | 1.4% |
408 | 13 | |
407 | 7 | 1.0% |
406 | 15 | |
405 | 15 | |
404 | 13 | |
403 | 6 | 0.8% |
402 | 14 | |
401 | 25 | |
302 | 29 |
호선명(LINE_NM)
Categorical
HIGH CORRELATION
 
Distinct | 33 |
---|---|
Distinct (%) | 4.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
5호선 | |
---|---|
7호선 | |
2호선 | 50 |
경부선 | 39 |
6호선 | 39 |
Other values (28) |
Length
Max length | 8 |
---|---|
Median length | 3 |
Mean length | 3.5597826 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1호선 |
---|---|
2nd row | 1호선 |
3rd row | 1호선 |
4th row | 1호선 |
5th row | 1호선 |
Common Values
Value | Count | Frequency (%) |
5호선 | 56 | 7.6% |
7호선 | 51 | 6.9% |
2호선 | 50 | 6.8% |
경부선 | 39 | 5.3% |
6호선 | 39 | 5.3% |
분당선 | 35 | 4.8% |
3호선 | 34 | 4.6% |
경의선 | 33 | 4.5% |
인천1호선 | 30 | 4.1% |
경원선 | 30 | 4.1% |
Other values (23) | 339 |
Length
Value | Count | Frequency (%) |
5호선 | 56 | 7.5% |
7호선 | 51 | 6.8% |
2호선 | 50 | 6.7% |
경부선 | 39 | 5.2% |
6호선 | 39 | 5.2% |
분당선 | 35 | 4.7% |
3호선 | 34 | 4.5% |
경의선 | 33 | 4.4% |
경원선 | 30 | 4.0% |
인천1호선 | 30 | 4.0% |
Other values (23) | 353 |
역ID(STATION_ID)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 736 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2227.4293 |
Minimum | 150 |
---|---|
Maximum | 4929 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.6 KiB |
Quantile statistics
Minimum | 150 |
---|---|
5-th percentile | 227.75 |
Q1 | 1271.75 |
median | 1911.5 |
Q3 | 3114.25 |
95-th percentile | 4613.25 |
Maximum | 4929 |
Range | 4779 |
Interquartile range (IQR) | 1842.5 |
Descriptive statistics
Standard deviation | 1344.9106 |
---|---|
Coefficient of variation (CV) | 0.60379493 |
Kurtosis | -0.78834098 |
Mean | 2227.4293 |
Median Absolute Deviation (MAD) | 839 |
Skewness | 0.29038684 |
Sum | 1639388 |
Variance | 1808784.4 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
150 | 1 | 0.1% |
2727 | 1 | 0.1% |
2718 | 1 | 0.1% |
2719 | 1 | 0.1% |
2720 | 1 | 0.1% |
2721 | 1 | 0.1% |
2722 | 1 | 0.1% |
2723 | 1 | 0.1% |
2724 | 1 | 0.1% |
2725 | 1 | 0.1% |
Other values (726) | 726 |
Value | Count | Frequency (%) |
150 | 1 | |
151 | 1 | |
152 | 1 | |
153 | 1 | |
154 | 1 | |
155 | 1 | |
156 | 1 | |
157 | 1 | |
158 | 1 | |
159 | 1 |
Value | Count | Frequency (%) |
4929 | 1 | |
4928 | 1 | |
4927 | 1 | |
4926 | 1 | |
4925 | 1 | |
4924 | 1 | |
4923 | 1 | |
4922 | 1 | |
4921 | 1 | |
4920 | 1 |
역명(STATION_NM)
Text
Distinct | 626 |
---|---|
Distinct (%) | 85.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
Value | Count | Frequency (%) |
서울역 | 6 | 0.8% |
김포공항 | 5 | 0.7% |
공덕 | 5 | 0.7% |
디지털미디어시티 | 4 | 0.5% |
홍대입구 | 4 | 0.5% |
신설동 | 3 | 0.4% |
동대문역사문화공원(ddp | 3 | 0.4% |
고속터미널 | 3 | 0.4% |
검암 | 3 | 0.4% |
계양 | 3 | 0.4% |
Other values (616) | 697 |
Most occurring characters
Value | Count | Frequency (%) |
) | 89 | 3.3% |
( | 89 | 3.3% |
대 | 87 | 3.2% |
구 | 80 | 3.0% |
동 | 59 | 2.2% |
청 | 56 | 2.1% |
산 | 55 | 2.0% |
원 | 50 | 1.9% |
신 | 50 | 1.9% |
천 | 45 | 1.7% |
Other values (307) | 2033 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2485 | |
Close Punctuation | 89 | 3.3% |
Open Punctuation | 89 | 3.3% |
Decimal Number | 13 | 0.5% |
Uppercase Letter | 9 | 0.3% |
Other Punctuation | 8 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 87 | 3.5% |
구 | 80 | 3.2% |
동 | 59 | 2.4% |
청 | 56 | 2.3% |
산 | 55 | 2.2% |
원 | 50 | 2.0% |
신 | 50 | 2.0% |
천 | 45 | 1.8% |
정 | 43 | 1.7% |
시 | 40 | 1.6% |
Other values (295) | 1920 |
Decimal Number
Value | Count | Frequency (%) |
3 | 5 | |
4 | 3 | |
1 | 2 | 15.4% |
9 | 1 | 7.7% |
2 | 1 | 7.7% |
5 | 1 | 7.7% |
Other Punctuation
Value | Count | Frequency (%) |
. | 7 | |
· | 1 | 12.5% |
Uppercase Letter
Value | Count | Frequency (%) |
D | 6 | |
P | 3 |
Close Punctuation
Value | Count | Frequency (%) |
) | 89 |
Open Punctuation
Value | Count | Frequency (%) |
( | 89 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2485 | |
Common | 199 | 7.4% |
Latin | 9 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 87 | 3.5% |
구 | 80 | 3.2% |
동 | 59 | 2.4% |
청 | 56 | 2.3% |
산 | 55 | 2.2% |
원 | 50 | 2.0% |
신 | 50 | 2.0% |
천 | 45 | 1.8% |
정 | 43 | 1.7% |
시 | 40 | 1.6% |
Other values (295) | 1920 |
Common
Value | Count | Frequency (%) |
) | 89 | |
( | 89 | |
. | 7 | 3.5% |
3 | 5 | 2.5% |
4 | 3 | 1.5% |
1 | 2 | 1.0% |
9 | 1 | 0.5% |
2 | 1 | 0.5% |
· | 1 | 0.5% |
5 | 1 | 0.5% |
Latin
Value | Count | Frequency (%) |
D | 6 | |
P | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2485 | |
ASCII | 207 | 7.7% |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
) | 89 | |
( | 89 | |
. | 7 | 3.4% |
D | 6 | 2.9% |
3 | 5 | 2.4% |
P | 3 | 1.4% |
4 | 3 | 1.4% |
1 | 2 | 1.0% |
9 | 1 | 0.5% |
2 | 1 | 0.5% |
Hangul
Value | Count | Frequency (%) |
대 | 87 | 3.5% |
구 | 80 | 3.2% |
동 | 59 | 2.4% |
청 | 56 | 2.3% |
산 | 55 | 2.2% |
원 | 50 | 2.0% |
신 | 50 | 2.0% |
천 | 45 | 1.8% |
정 | 43 | 1.7% |
시 | 40 | 1.6% |
Other values (295) | 1920 |
None
Value | Count | Frequency (%) |
· | 1 |
교통운영기관ID(CORP_ID) | 교통운영기관명(CORP_NM) | 호선코드(LINE_CD) | 호선명(LINE_NM) | 역ID(STATION_ID) | |
---|---|---|---|---|---|
교통운영기관ID(CORP_ID) | 1.000 | 1.000 | 0.980 | 1.000 | 0.929 |
교통운영기관명(CORP_NM) | 1.000 | 1.000 | 0.919 | 1.000 | 0.901 |
호선코드(LINE_CD) | 0.980 | 0.919 | 1.000 | 1.000 | 0.973 |
호선명(LINE_NM) | 1.000 | 1.000 | 1.000 | 1.000 | 0.977 |
역ID(STATION_ID) | 0.929 | 0.901 | 0.973 | 0.977 | 1.000 |
교통운영기관명(CORP_NM) | 호선명(LINE_NM) | |
---|---|---|
교통운영기관명(CORP_NM) | 1.000 | 0.987 |
호선명(LINE_NM) | 0.987 | 1.000 |
교통운영기관ID(CORP_ID) | 호선코드(LINE_CD) | 역ID(STATION_ID) | 교통운영기관명(CORP_NM) | 호선명(LINE_NM) | |
---|---|---|---|---|---|
교통운영기관ID(CORP_ID) | 1.000 | 0.533 | 0.562 | 0.992 | 0.979 |
호선코드(LINE_CD) | 0.533 | 1.000 | 0.929 | 0.766 | 0.981 |
역ID(STATION_ID) | 0.562 | 0.929 | 1.000 | 0.660 | 0.837 |
교통운영기관명(CORP_NM) | 0.992 | 0.766 | 0.660 | 1.000 | 0.987 |
호선명(LINE_NM) | 0.979 | 0.981 | 0.837 | 0.987 | 1.000 |
교통운영기관ID(CORP_ID) | 교통운영기관명(CORP_NM) | 호선코드(LINE_CD) | 호선명(LINE_NM) | 역ID(STATION_ID) | 역명(STATION_NM) | |
---|---|---|---|---|---|---|
0 | 2110 | 서울교통공사 | 1 | 1호선 | 150 | 서울역 |
1 | 2110 | 서울교통공사 | 1 | 1호선 | 151 | 시청 |
2 | 2110 | 서울교통공사 | 1 | 1호선 | 152 | 종각 |
3 | 2110 | 서울교통공사 | 1 | 1호선 | 153 | 종로3가 |
4 | 2110 | 서울교통공사 | 1 | 1호선 | 154 | 종로5가 |
5 | 2110 | 서울교통공사 | 1 | 1호선 | 155 | 동대문 |
6 | 2110 | 서울교통공사 | 1 | 1호선 | 156 | 신설동 |
7 | 2110 | 서울교통공사 | 1 | 1호선 | 157 | 제기동 |
8 | 2110 | 서울교통공사 | 1 | 1호선 | 158 | 청량리(서울시립대입구) |
9 | 2110 | 서울교통공사 | 1 | 1호선 | 159 | 동묘앞 |
교통운영기관ID(CORP_ID) | 교통운영기관명(CORP_NM) | 호선코드(LINE_CD) | 호선명(LINE_NM) | 역ID(STATION_ID) | 역명(STATION_NM) | |
---|---|---|---|---|---|---|
726 | 2413 | 김포시청 | 409 | 김포골드라인 | 4920 | 양촌 |
727 | 2413 | 김포시청 | 409 | 김포골드라인 | 4921 | 구래 |
728 | 2413 | 김포시청 | 409 | 김포골드라인 | 4922 | 마산 |
729 | 2413 | 김포시청 | 409 | 김포골드라인 | 4923 | 장기 |
730 | 2413 | 김포시청 | 409 | 김포골드라인 | 4924 | 운양 |
731 | 2413 | 김포시청 | 409 | 김포골드라인 | 4925 | 걸포북변 |
732 | 2413 | 김포시청 | 409 | 김포골드라인 | 4926 | 사우(김포시청) |
733 | 2413 | 김포시청 | 409 | 김포골드라인 | 4927 | 풍무 |
734 | 2413 | 김포시청 | 409 | 김포골드라인 | 4928 | 고촌 |
735 | 2413 | 김포시청 | 409 | 김포골드라인 | 4929 | 김포공항 |