Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 66 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.7 KiB |
Average record size in memory | 42.0 B |
Variable types
Categorical | 2 |
---|---|
Text | 3 |
Dataset
Description | 한국철도공사에서 관리하는 전국 고속철도역들의 철도운영기관명, 선명, 역명, 지번주소, 도로명주소의 데이터가 있습니다. |
---|---|
Author | 국가철도공단 |
URL | https://www.data.go.kr/data/15096786/fileData.do |
Reproduction
Analysis started | 2023-12-12 20:13:25.278736 |
---|---|
Analysis finished | 2023-12-12 20:13:25.843099 |
Duration | 0.56 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
철도운영기관명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
한국철도공사 | |
---|---|
주식회사 에스알 | 3 |
Length
Max length | 8 |
---|---|
Median length | 6 |
Mean length | 6.0909091 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 한국철도공사 |
---|---|
2nd row | 한국철도공사 |
3rd row | 한국철도공사 |
4th row | 한국철도공사 |
5th row | 한국철도공사 |
Common Values
Value | Count | Frequency (%) |
한국철도공사 | 63 | |
주식회사 에스알 | 3 | 4.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
한국철도공사 | 63 | |
주식회사 | 3 | 4.3% |
에스알 | 3 | 4.3% |
선명
Categorical
HIGH CORRELATION
 
Distinct | 15 |
---|---|
Distinct (%) | 22.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
경부선 | |
---|---|
호남선 | |
중앙선 | |
전라선 | |
강릉선 | |
Other values (10) |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 3.3333333 |
Min length | 3 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 6.1% |
Sample
1st row | 경부선 |
---|---|
2nd row | 경의선 |
3rd row | 경부선 |
4th row | 경부고속 |
5th row | 경부선 |
Common Values
Value | Count | Frequency (%) |
경부선 | 14 | |
호남선 | 8 | |
중앙선 | 8 | |
전라선 | 7 | |
강릉선 | 7 | |
경전선 | 5 | 7.6% |
영동선 | 3 | 4.5% |
중부내륙선 | 3 | 4.5% |
수서평택고속선 | 3 | 4.5% |
경부고속 | 2 | 3.0% |
Other values (5) | 6 |
Length
Value | Count | Frequency (%) |
경부선 | 14 | |
호남선 | 8 | |
중앙선 | 8 | |
전라선 | 7 | |
강릉선 | 7 | |
경전선 | 5 | 7.6% |
영동선 | 3 | 4.5% |
중부내륙선 | 3 | 4.5% |
수서평택고속선 | 3 | 4.5% |
경부고속 | 2 | 3.0% |
Other values (5) | 6 |
역명
Text
UNIQUE
 
Distinct | 66 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
Value | Count | Frequency (%) |
서울 | 1 | 1.5% |
정동진 | 1 | 1.5% |
지제 | 1 | 1.5% |
구례구 | 1 | 1.5% |
순천 | 1 | 1.5% |
여천 | 1 | 1.5% |
여수엑스포 | 1 | 1.5% |
청량리 | 1 | 1.5% |
상봉 | 1 | 1.5% |
양평 | 1 | 1.5% |
Other values (56) | 56 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 10 | 6.2% |
산 | 8 | 4.9% |
원 | 7 | 4.3% |
천 | 6 | 3.7% |
구 | 6 | 3.7% |
동 | 5 | 3.1% |
대 | 5 | 3.1% |
서 | 5 | 3.1% |
포 | 5 | 3.1% |
진 | 4 | 2.5% |
Other values (72) | 101 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 160 | |
Open Punctuation | 1 | 0.6% |
Close Punctuation | 1 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 10 | 6.2% |
산 | 8 | 5.0% |
원 | 7 | 4.4% |
천 | 6 | 3.8% |
구 | 6 | 3.8% |
동 | 5 | 3.1% |
대 | 5 | 3.1% |
서 | 5 | 3.1% |
포 | 5 | 3.1% |
진 | 4 | 2.5% |
Other values (70) | 99 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 160 | |
Common | 2 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 10 | 6.2% |
산 | 8 | 5.0% |
원 | 7 | 4.4% |
천 | 6 | 3.8% |
구 | 6 | 3.8% |
동 | 5 | 3.1% |
대 | 5 | 3.1% |
서 | 5 | 3.1% |
포 | 5 | 3.1% |
진 | 4 | 2.5% |
Other values (70) | 99 |
Common
Value | Count | Frequency (%) |
( | 1 | |
) | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 160 | |
ASCII | 2 | 1.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 10 | 6.2% |
산 | 8 | 5.0% |
원 | 7 | 4.4% |
천 | 6 | 3.8% |
구 | 6 | 3.8% |
동 | 5 | 3.1% |
대 | 5 | 3.1% |
서 | 5 | 3.1% |
포 | 5 | 3.1% |
진 | 4 | 2.5% |
Other values (70) | 99 |
ASCII
Value | Count | Frequency (%) |
( | 1 | |
) | 1 |
지번주소
Text
UNIQUE
 
Distinct | 66 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
Length
Max length | 27 |
---|---|
Median length | 23 |
Mean length | 19.863636 |
Min length | 14 |
Characters and Unicode
Total characters | 1311 |
---|---|
Distinct characters | 149 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 66 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 서울특별시 용산구 동자동 43-205 |
---|---|
2nd row | 경기도 고양시 덕양구 행신동 812 |
3rd row | 서울특별시 영등포구 영등포동 618-496 |
4th row | 경기도 광명시 일직동 276-1 |
5th row | 경기도 수원시 팔달구 매산로1가 18 |
Value | Count | Frequency (%) |
강원도 | 11 | 3.7% |
경기도 | 8 | 2.7% |
전라남도 | 7 | 2.3% |
서울특별시 | 6 | 2.0% |
경상남도 | 6 | 2.0% |
경상북도 | 6 | 2.0% |
충청북도 | 5 | 1.7% |
충청남도 | 4 | 1.3% |
전라북도 | 4 | 1.3% |
원주시 | 3 | 1.0% |
Other values (218) | 238 |
Most occurring characters
Value | Count | Frequency (%) |
232 | 17.7% | |
1 | 64 | 4.9% |
시 | 58 | 4.4% |
도 | 51 | 3.9% |
동 | 50 | 3.8% |
- | 50 | 3.8% |
3 | 35 | 2.7% |
2 | 26 | 2.0% |
6 | 26 | 2.0% |
0 | 26 | 2.0% |
Other values (139) | 693 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 757 | |
Decimal Number | 272 | 20.7% |
Space Separator | 232 | 17.7% |
Dash Punctuation | 50 | 3.8% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 58 | 7.7% |
도 | 51 | 6.7% |
동 | 50 | 6.6% |
리 | 25 | 3.3% |
구 | 24 | 3.2% |
남 | 23 | 3.0% |
산 | 21 | 2.8% |
경 | 21 | 2.8% |
원 | 20 | 2.6% |
북 | 18 | 2.4% |
Other values (127) | 446 |
Decimal Number
Value | Count | Frequency (%) |
1 | 64 | |
3 | 35 | |
2 | 26 | |
6 | 26 | |
0 | 26 | |
4 | 23 | 8.5% |
7 | 22 | 8.1% |
9 | 20 | 7.4% |
8 | 16 | 5.9% |
5 | 14 | 5.1% |
Space Separator
Value | Count | Frequency (%) |
232 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 50 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 757 | |
Common | 554 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 58 | 7.7% |
도 | 51 | 6.7% |
동 | 50 | 6.6% |
리 | 25 | 3.3% |
구 | 24 | 3.2% |
남 | 23 | 3.0% |
산 | 21 | 2.8% |
경 | 21 | 2.8% |
원 | 20 | 2.6% |
북 | 18 | 2.4% |
Other values (127) | 446 |
Common
Value | Count | Frequency (%) |
232 | ||
1 | 64 | 11.6% |
- | 50 | 9.0% |
3 | 35 | 6.3% |
2 | 26 | 4.7% |
6 | 26 | 4.7% |
0 | 26 | 4.7% |
4 | 23 | 4.2% |
7 | 22 | 4.0% |
9 | 20 | 3.6% |
Other values (2) | 30 | 5.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 757 | |
ASCII | 554 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
232 | ||
1 | 64 | 11.6% |
- | 50 | 9.0% |
3 | 35 | 6.3% |
2 | 26 | 4.7% |
6 | 26 | 4.7% |
0 | 26 | 4.7% |
4 | 23 | 4.2% |
7 | 22 | 4.0% |
9 | 20 | 3.6% |
Other values (2) | 30 | 5.4% |
Hangul
Value | Count | Frequency (%) |
시 | 58 | 7.7% |
도 | 51 | 6.7% |
동 | 50 | 6.6% |
리 | 25 | 3.3% |
구 | 24 | 3.2% |
남 | 23 | 3.0% |
산 | 21 | 2.8% |
경 | 21 | 2.8% |
원 | 20 | 2.6% |
북 | 18 | 2.4% |
Other values (127) | 446 |
도로명주소
Text
Distinct | 65 |
---|---|
Distinct (%) | 98.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
Length
Max length | 26 |
---|---|
Median length | 22 |
Mean length | 18.409091 |
Min length | 1 |
Characters and Unicode
Total characters | 1215 |
---|---|
Distinct characters | 149 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 64 ? |
---|---|
Unique (%) | 97.0% |
Sample
1st row | 서울특별시 용산구 한강대로 405(동자동) |
---|---|
2nd row | 경기도 고양시 덕양구 소원로 102 |
3rd row | 서울특별시 영등포구 경인로 846 |
4th row | 경기도 광명시 광명역로 21(일직동) |
5th row | 경기도 수원시 팔달구 덕영대로 924 |
Value | Count | Frequency (%) |
강원도 | 11 | 3.8% |
경기도 | 7 | 2.4% |
전라남도 | 7 | 2.4% |
경상북도 | 6 | 2.1% |
서울특별시 | 6 | 2.1% |
경상남도 | 6 | 2.1% |
충청북도 | 5 | 1.7% |
충청남도 | 4 | 1.4% |
전라북도 | 4 | 1.4% |
원주시 | 3 | 1.0% |
Other values (207) | 229 |
Most occurring characters
Value | Count | Frequency (%) |
226 | 18.6% | |
시 | 58 | 4.8% |
로 | 57 | 4.7% |
도 | 51 | 4.2% |
1 | 41 | 3.4% |
2 | 29 | 2.4% |
동 | 25 | 2.1% |
구 | 25 | 2.1% |
원 | 24 | 2.0% |
경 | 23 | 1.9% |
Other values (139) | 656 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 786 | |
Space Separator | 226 | 18.6% |
Decimal Number | 180 | 14.8% |
Close Punctuation | 9 | 0.7% |
Open Punctuation | 9 | 0.7% |
Dash Punctuation | 5 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 58 | 7.4% |
로 | 57 | 7.3% |
도 | 51 | 6.5% |
동 | 25 | 3.2% |
구 | 25 | 3.2% |
원 | 24 | 3.1% |
경 | 23 | 2.9% |
남 | 23 | 2.9% |
역 | 19 | 2.4% |
대 | 18 | 2.3% |
Other values (125) | 463 |
Decimal Number
Value | Count | Frequency (%) |
1 | 41 | |
2 | 29 | |
0 | 22 | |
5 | 18 | |
6 | 14 | 7.8% |
3 | 14 | 7.8% |
9 | 13 | 7.2% |
8 | 12 | 6.7% |
7 | 11 | 6.1% |
4 | 6 | 3.3% |
Space Separator
Value | Count | Frequency (%) |
226 |
Close Punctuation
Value | Count | Frequency (%) |
) | 9 |
Open Punctuation
Value | Count | Frequency (%) |
( | 9 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 786 | |
Common | 429 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 58 | 7.4% |
로 | 57 | 7.3% |
도 | 51 | 6.5% |
동 | 25 | 3.2% |
구 | 25 | 3.2% |
원 | 24 | 3.1% |
경 | 23 | 2.9% |
남 | 23 | 2.9% |
역 | 19 | 2.4% |
대 | 18 | 2.3% |
Other values (125) | 463 |
Common
Value | Count | Frequency (%) |
226 | ||
1 | 41 | 9.6% |
2 | 29 | 6.8% |
0 | 22 | 5.1% |
5 | 18 | 4.2% |
6 | 14 | 3.3% |
3 | 14 | 3.3% |
9 | 13 | 3.0% |
8 | 12 | 2.8% |
7 | 11 | 2.6% |
Other values (4) | 29 | 6.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 786 | |
ASCII | 429 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
226 | ||
1 | 41 | 9.6% |
2 | 29 | 6.8% |
0 | 22 | 5.1% |
5 | 18 | 4.2% |
6 | 14 | 3.3% |
3 | 14 | 3.3% |
9 | 13 | 3.0% |
8 | 12 | 2.8% |
7 | 11 | 2.6% |
Other values (4) | 29 | 6.8% |
Hangul
Value | Count | Frequency (%) |
시 | 58 | 7.4% |
로 | 57 | 7.3% |
도 | 51 | 6.5% |
동 | 25 | 3.2% |
구 | 25 | 3.2% |
원 | 24 | 3.1% |
경 | 23 | 2.9% |
남 | 23 | 2.9% |
역 | 19 | 2.4% |
대 | 18 | 2.3% |
Other values (125) | 463 |
철도운영기관명 | 선명 | 역명 | 지번주소 | 도로명주소 | |
---|---|---|---|---|---|
철도운영기관명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
선명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
역명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
지번주소 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
도로명주소 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
철도운영기관명 | 선명 | |
---|---|---|
철도운영기관명 | 1.000 | 0.893 |
선명 | 0.893 | 1.000 |
철도운영기관명 | 선명 | |
---|---|---|
철도운영기관명 | 1.000 | 0.893 |
선명 | 0.893 | 1.000 |
철도운영기관명 | 선명 | 역명 | 지번주소 | 도로명주소 | |
---|---|---|---|---|---|
0 | 한국철도공사 | 경부선 | 서울 | 서울특별시 용산구 동자동 43-205 | 서울특별시 용산구 한강대로 405(동자동) |
1 | 한국철도공사 | 경의선 | 행신 | 경기도 고양시 덕양구 행신동 812 | 경기도 고양시 덕양구 소원로 102 |
2 | 한국철도공사 | 경부선 | 영등포 | 서울특별시 영등포구 영등포동 618-496 | 서울특별시 영등포구 경인로 846 |
3 | 한국철도공사 | 경부고속 | 광명 | 경기도 광명시 일직동 276-1 | 경기도 광명시 광명역로 21(일직동) |
4 | 한국철도공사 | 경부선 | 수원 | 경기도 수원시 팔달구 매산로1가 18 | 경기도 수원시 팔달구 덕영대로 924 |
5 | 한국철도공사 | 경부고속 | 천안아산 | 충청남도 아산시 배방읍 장재리 364-4 | 충청남도 아산시 배방읍 희망로 100 |
6 | 한국철도공사 | 충북선 | 오송 | 충청북도 청주시 흥덕구 오송읍 봉산리 370-31 | 충청북도 청주시 흥덕구 오송읍 오송가락로 123 |
7 | 한국철도공사 | 경부선 | 대전 | 대전광역시 동구 중동 317 | 대전광역시 동구 중앙로 218 |
8 | 한국철도공사 | 경부선 | 김천구미 | 경상북도 김천시 남면 옥산리 787-1 | 경상북도 김천시 남면 혁신1로 51 |
9 | 한국철도공사 | 경부선 | 서대구 | 대구광역시 서구 이현동 232-1 | 대구광역시 서구 와룡로 527 |
철도운영기관명 | 선명 | 역명 | 지번주소 | 도로명주소 | |
---|---|---|---|---|---|
56 | 한국철도공사 | 중앙선 | 영주 | 경상북도 영주시 휴천동 257 | 경상북도 영주시 선비로 64 |
57 | 한국철도공사 | 중앙선 | 안동 | 경상북도 안동시 송현동 646-1 | 경상북도 안동시 경동로 122-16 |
58 | 한국철도공사 | 강릉선 | 부발 | 경기도 이천시 부발읍 아미리 505-7 | 경기도 이천시 부발읍 신아로 87 |
59 | 한국철도공사 | 중부내륙선 | 가남 | 경기도 여주시 가남읍 태평리 516 | |
60 | 한국철도공사 | 중부내륙선 | 감곡장호원 | 충북 음성군 감곡면 왕장리 312-2 | |
61 | 한국철도공사 | 중부내륙선 | 앙성온천 | 충청북도 충주시 앙성면 돈산리 317 | 충청북도 충주시 앙성면 가곡로 1390-22 |
62 | 한국철도공사 | 충북선 | 충주 | 충청북도 충주시 봉방동 409 | 충청북도 충주시 충원대로 539 |
63 | 주식회사 에스알 | 수서평택고속선 | 수서 | 서울특별시 강남구 수서동 214-3 | 서울특별시 강남구 밤고개로 99 |
64 | 주식회사 에스알 | 수서평택고속선 | 지제 | 경기도 평택시 지제동 202-6 | 경기도 평택시 지제로 21 |
65 | 주식회사 에스알 | 수서평택고속선 | 동탄 | 경기도 화성시 오산동 967-164 | 경기도 화성시 동탄역로 지하 151 |