Overview

Dataset statistics

Number of variables5
Number of observations731
Missing cells7
Missing cells (%)0.2%
Duplicate rows1
Duplicate rows (%)0.1%
Total size in memory28.7 KiB
Average record size in memory40.2 B

Variable types

Categorical3
Text1
Unsupported1

Dataset

Description철도관련 기업의 발주계획 정보를 제공합니다. (공사, 용역, 구매설치 등에 대한 정보) (기관명, 내용, 제목 등을 제공합니다)
Author국가철도공단
URLhttps://www.data.go.kr/data/15088603/fileData.do

Alerts

Dataset has 1 (0.1%) duplicate rowsDuplicates
발주계획 목록 is highly overall correlated with Unnamed: 1 and 1 other fieldsHigh correlation
Unnamed: 1 is highly overall correlated with 발주계획 목록 and 1 other fieldsHigh correlation
Unnamed: 2 is highly overall correlated with 발주계획 목록 and 1 other fieldsHigh correlation
Unnamed: 2 is highly imbalanced (67.9%)Imbalance
Unnamed: 4 is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2023-12-12 06:35:40.842587
Analysis finished2023-12-12 06:35:41.583930
Duration0.74 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

발주계획 목록
Categorical

HIGH CORRELATION 

Distinct31
Distinct (%)4.2%
Missing0
Missing (%)0.0%
Memory size5.8 KiB
2021.02.10
113 
2022.02.08
92 
2021.04.26
66 
2021.03.11
64 
2021.05.12
48 
Other values (26)
348 

Length

Max length36
Median length10
Mean length10.005472
Min length4

Unique

Unique3 ?
Unique (%)0.4%

Sample

1st row<NA>
2nd row게시물등록일
3rd row2022.09.29
4th row2022.09.29
5th row2022.09.29

Common Values

ValueCountFrequency (%)
2021.02.10 113
15.5%
2022.02.08 92
12.6%
2021.04.26 66
 
9.0%
2021.03.11 64
 
8.8%
2021.05.12 48
 
6.6%
2021.07.19 45
 
6.2%
2021.06.16 35
 
4.8%
2022.01.18 28
 
3.8%
2021.09.23 23
 
3.1%
2021.10.20 21
 
2.9%
Other values (21) 196
26.8%

Length

2023-12-12T15:35:41.660767image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
2021.02.10 113
15.4%
2022.02.08 92
12.5%
2021.04.26 66
 
9.0%
2021.03.11 64
 
8.7%
2021.05.12 48
 
6.5%
2021.07.19 45
 
6.1%
2021.06.16 35
 
4.8%
2022.01.18 28
 
3.8%
2021.09.23 23
 
3.1%
2021.10.20 21
 
2.9%
Other values (26) 201
27.3%

Unnamed: 1
Categorical

HIGH CORRELATION 

Distinct6
Distinct (%)0.8%
Missing0
Missing (%)0.0%
Memory size5.8 KiB
공사
413 
용역
267 
구매설치
43 
<NA>
 
4
용역, 공사
 
3

Length

Max length6
Median length2
Mean length2.1450068
Min length2

Unique

Unique1 ?
Unique (%)0.1%

Sample

1st row<NA>
2nd row구분
3rd row용역
4th row용역
5th row용역

Common Values

ValueCountFrequency (%)
공사 413
56.5%
용역 267
36.5%
구매설치 43
 
5.9%
<NA> 4
 
0.5%
용역, 공사 3
 
0.4%
구분 1
 
0.1%

Length

2023-12-12T15:35:41.807713image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T15:35:41.931533image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
공사 416
56.7%
용역 270
36.8%
구매설치 43
 
5.9%
na 4
 
0.5%
구분 1
 
0.1%

Unnamed: 2
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct8
Distinct (%)1.1%
Missing0
Missing (%)0.0%
Memory size5.8 KiB
한국철도공사
609 
국가철도공단
74 
인천교통공사
 
15
서울교통공사
 
10
광주도시철도공사
 
10
Other values (3)
 
13

Length

Max length8
Median length6
Mean length6.001368
Min length3

Unique

Unique1 ?
Unique (%)0.1%

Sample

1st row<NA>
2nd row기관명
3rd row한국철도공사
4th row한국철도공사
5th row한국철도공사

Common Values

ValueCountFrequency (%)
한국철도공사 609
83.3%
국가철도공단 74
 
10.1%
인천교통공사 15
 
2.1%
서울교통공사 10
 
1.4%
광주도시철도공사 10
 
1.4%
국토교통부 8
 
1.1%
<NA> 4
 
0.5%
기관명 1
 
0.1%

Length

2023-12-12T15:35:42.042745image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T15:35:42.154071image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
한국철도공사 609
83.3%
국가철도공단 74
 
10.1%
인천교통공사 15
 
2.1%
서울교통공사 10
 
1.4%
광주도시철도공사 10
 
1.4%
국토교통부 8
 
1.1%
na 4
 
0.5%
기관명 1
 
0.1%
Distinct722
Distinct (%)99.3%
Missing4
Missing (%)0.5%
Memory size5.8 KiB
2023-12-12T15:35:42.412493image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length245
Median length183
Mean length139.06327
Min length2

Characters and Unicode

Total characters101099
Distinct characters465
Distinct categories13 ?
Distinct scripts3 ?
Distinct blocks6 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique718 ?
Unique (%)98.8%

Sample

1st row내용
2nd row년도 : 2022 유형 : 단년도 업무구분 : 용역 상세구분 : 일반용역 사업명 : 자유석 셀프체크 시범운영을 위한 QR코드 부착 용역 발주계획번호 : 17750 발주소속 : 본사공통 계약방법 : 수의계약 발주예정(월) : 10 배정예산(천원) : 20,000
3rd row년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 미전선 미전~낙동강간 외 1개소 궤도 정밀진단 및 성능평가 용역(총체 및 1차) 발주계획번호 : 17805 발주소속 : 부산경남본부 계약방법 : 일반경쟁 발주예정(월) : 10 배정예산(천원) : 728,971
4th row년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 경부선 화명~부산간 궤도 정밀진단 및 성능평가 용역(총체 및 1차) 발주계획번호 : 17804 발주소속 : 부산경남본부 계약방법 : 일반경쟁 발주예정(월) : 10 배정예산(천원) : 880,354
5th row년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 경부선 상동~화명간 궤도 정밀진단 및 성능평가 용역(총체 및 1차) 발주계획번호 : 17803 발주소속 : 부산경남본부 계약방법 : 일반경쟁 발주예정(월) : 10 배정예산(천원) : 723,043
ValueCountFrequency (%)
6155
28.0%
년도 599
 
2.7%
사업명 582
 
2.7%
업무구분 582
 
2.7%
계약방법 581
 
2.6%
유형 581
 
2.6%
상세구분 580
 
2.6%
배정예산(천원 580
 
2.6%
발주계획번호 580
 
2.6%
발주소속 580
 
2.6%
Other values (2695) 10546
48.1%
2023-12-12T15:35:42.822189image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
17040
 
16.9%
7037
 
7.0%
: 6164
 
6.1%
0 3100
 
3.1%
2802
 
2.8%
2 2744
 
2.7%
2122
 
2.1%
2040
 
2.0%
1 1982
 
2.0%
1926
 
1.9%
Other values (455) 54142
53.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 51800
51.2%
Space Separator 17040
 
16.9%
Decimal Number 11899
 
11.8%
Control 9839
 
9.7%
Other Punctuation 7023
 
6.9%
Open Punctuation 1486
 
1.5%
Close Punctuation 1483
 
1.5%
Uppercase Letter 214
 
0.2%
Dash Punctuation 125
 
0.1%
Lowercase Letter 97
 
0.1%
Other values (3) 93
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2122
 
4.1%
2040
 
3.9%
1926
 
3.7%
1508
 
2.9%
1465
 
2.8%
1442
 
2.8%
1427
 
2.8%
1377
 
2.7%
1364
 
2.6%
1303
 
2.5%
Other values (397) 35826
69.2%
Uppercase Letter
ValueCountFrequency (%)
P 31
14.5%
A 27
12.6%
S 27
12.6%
R 21
9.8%
E 17
7.9%
C 17
7.9%
K 13
6.1%
B 12
 
5.6%
I 9
 
4.2%
D 9
 
4.2%
Other values (14) 31
14.5%
Decimal Number
ValueCountFrequency (%)
0 3100
26.1%
2 2744
23.1%
1 1982
16.7%
3 845
 
7.1%
5 656
 
5.5%
4 632
 
5.3%
6 574
 
4.8%
7 506
 
4.3%
8 468
 
3.9%
9 392
 
3.3%
Other Punctuation
ValueCountFrequency (%)
: 6164
87.8%
, 729
 
10.4%
. 94
 
1.3%
' 10
 
0.1%
/ 8
 
0.1%
· 6
 
0.1%
# 6
 
0.1%
4
 
0.1%
* 2
 
< 0.1%
Lowercase Letter
ValueCountFrequency (%)
k 54
55.7%
m 41
42.3%
b 1
 
1.0%
r 1
 
1.0%
Math Symbol
ValueCountFrequency (%)
~ 50
96.2%
> 1
 
1.9%
+ 1
 
1.9%
Control
ValueCountFrequency (%)
7037
71.5%
2802
 
28.5%
Space Separator
ValueCountFrequency (%)
17040
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1486
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1483
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 125
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 39
100.0%
Other Symbol
ValueCountFrequency (%)
2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 51800
51.2%
Common 48988
48.5%
Latin 311
 
0.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2122
 
4.1%
2040
 
3.9%
1926
 
3.7%
1508
 
2.9%
1465
 
2.8%
1442
 
2.8%
1427
 
2.8%
1377
 
2.7%
1364
 
2.6%
1303
 
2.5%
Other values (397) 35826
69.2%
Common
ValueCountFrequency (%)
17040
34.8%
7037
14.4%
: 6164
 
12.6%
0 3100
 
6.3%
2802
 
5.7%
2 2744
 
5.6%
1 1982
 
4.0%
( 1486
 
3.0%
) 1483
 
3.0%
3 845
 
1.7%
Other values (20) 4305
 
8.8%
Latin
ValueCountFrequency (%)
k 54
17.4%
m 41
13.2%
P 31
10.0%
A 27
8.7%
S 27
8.7%
R 21
 
6.8%
E 17
 
5.5%
C 17
 
5.5%
K 13
 
4.2%
B 12
 
3.9%
Other values (18) 51
16.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 51799
51.2%
ASCII 49287
48.8%
None 6
 
< 0.1%
Punctuation 4
 
< 0.1%
Geometric Shapes 2
 
< 0.1%
Compat Jamo 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
17040
34.6%
7037
14.3%
: 6164
 
12.5%
0 3100
 
6.3%
2802
 
5.7%
2 2744
 
5.6%
1 1982
 
4.0%
( 1486
 
3.0%
) 1483
 
3.0%
3 845
 
1.7%
Other values (45) 4604
 
9.3%
Hangul
ValueCountFrequency (%)
2122
 
4.1%
2040
 
3.9%
1926
 
3.7%
1508
 
2.9%
1465
 
2.8%
1442
 
2.8%
1427
 
2.8%
1377
 
2.7%
1364
 
2.6%
1303
 
2.5%
Other values (396) 35825
69.2%
None
ValueCountFrequency (%)
· 6
100.0%
Punctuation
ValueCountFrequency (%)
4
100.0%
Geometric Shapes
ValueCountFrequency (%)
2
100.0%
Compat Jamo
ValueCountFrequency (%)
1
100.0%

Unnamed: 4
Unsupported

REJECTED  UNSUPPORTED 

Missing3
Missing (%)0.4%
Memory size5.8 KiB

Correlations

2023-12-12T15:35:42.922360image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
발주계획 목록Unnamed: 1Unnamed: 2
발주계획 목록1.0000.8150.875
Unnamed: 10.8151.0000.772
Unnamed: 20.8750.7721.000
2023-12-12T15:35:43.008823image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Unnamed: 1Unnamed: 2발주계획 목록
Unnamed: 11.0000.6400.544
Unnamed: 20.6401.0000.594
발주계획 목록0.5440.5941.000
2023-12-12T15:35:43.095122image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
발주계획 목록Unnamed: 1Unnamed: 2
발주계획 목록1.0000.5440.594
Unnamed: 10.5441.0000.640
Unnamed: 20.5940.6401.000

Missing values

2023-12-12T15:35:41.276336image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T15:35:41.385068image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-12T15:35:41.506560image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

발주계획 목록Unnamed: 1Unnamed: 2Unnamed: 3Unnamed: 4
0<NA><NA><NA><NA>NaN
1게시물등록일구분기관명내용제목
22022.09.29용역한국철도공사년도 : 2022 유형 : 단년도 업무구분 : 용역 상세구분 : 일반용역 사업명 : 자유석 셀프체크 시범운영을 위한 QR코드 부착 용역 발주계획번호 : 17750 발주소속 : 본사공통 계약방법 : 수의계약 발주예정(월) : 10 배정예산(천원) : 20,000자유석 셀프체크 시범운영을 위한 QR코드 부착 용역
32022.09.29용역한국철도공사년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 미전선 미전~낙동강간 외 1개소 궤도 정밀진단 및 성능평가 용역(총체 및 1차) 발주계획번호 : 17805 발주소속 : 부산경남본부 계약방법 : 일반경쟁 발주예정(월) : 10 배정예산(천원) : 728,971미전선 미전~낙동강간 외 1개소 궤도 정밀진단 및 성능평가 용역(총체 및 1차)
42022.09.29용역한국철도공사년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 경부선 화명~부산간 궤도 정밀진단 및 성능평가 용역(총체 및 1차) 발주계획번호 : 17804 발주소속 : 부산경남본부 계약방법 : 일반경쟁 발주예정(월) : 10 배정예산(천원) : 880,354경부선 화명~부산간 궤도 정밀진단 및 성능평가 용역(총체 및 1차)
52022.09.29용역한국철도공사년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 경부선 상동~화명간 궤도 정밀진단 및 성능평가 용역(총체 및 1차) 발주계획번호 : 17803 발주소속 : 부산경남본부 계약방법 : 일반경쟁 발주예정(월) : 10 배정예산(천원) : 723,043경부선 상동~화명간 궤도 정밀진단 및 성능평가 용역(총체 및 1차)
62022.09.29용역한국철도공사년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 2022 고속차량 전호업무 위탁 용역 발주계획번호 : 17822 발주소속 : 본사공통 계약방법 : 수의계약 발주예정(월) : 10 배정예산(천원) : 1,200,693.852022 고속차량 전호업무 위탁 용역
72022.09.29용역한국철도공사년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 영주종합사업소 신축공사에 따른 건설폐기물처리용역(총체 및 1차) 발주계획번호 : 17832 발주소속 : 대구경북본부 계약방법 : 제한경쟁 발주예정(월) : 10 배정예산(천원) : 200,000영주종합사업소 신축공사에 따른 건설폐기물처리용역(총체 및 1차)
82022.09.29용역한국철도공사년도 : 2022 유형 : 장기(신규) 업무구분 : 용역 상세구분 : 일반용역 사업명 : 퍼스널모빌리티-철도 연계교통 사용자 경험에 기반한 서비스 평가체계 구축 발주계획번호 : 17852 발주소속 : 본사공통 계약방법 : 일반경쟁 발주예정(월) : 10 배정예산(천원) : 39,860퍼스널모빌리티-철도 연계교통 사용자 경험에 기반한 서비스 평가체계 구축
92022.09.29공사한국철도공사년도 : 2022 유형 : 장기(신규) 업무구분 : 공사 상세구분 소방공사 사업명 : 경부선 밀양역 신축에 따른 소방공사(총체 및 1차) 발주계획번호 : 17811 발주소속 : 부산경남본부 계약방법 : 일반경쟁 발주예정(월) : 10 배정예산(천원) : 955,260경부선 밀양역 신축에 따른 소방공사(총체 및 1차)
발주계획 목록Unnamed: 1Unnamed: 2Unnamed: 3Unnamed: 4
7212017.11.30용역국가철도공단입찰건명 : 철도시설 이력관리 종합정보시스템 구축용역 발주시기 : 2017년 12월 계약의목적 : 정부의 경제혁신 3개년 계획 실천방안인 공공기관 정상화 일환으로 공공기관 기능조정방안이 추진됨에 따라 철도시설공단의 관리감독기능 강화를 위한 유지보수기반 구축 필요하여 철도시설물의 체계적인 이력관리를 위한 시스템 구축이 필요함 계약 물량/규모 : 철도시설 이력관리 종합정보시스템 1식 예산액 : 19,794,000,000원철도시설 이력관리 종합정보시스템 구축용역
7222017.11.30구매설치국가철도공단입찰건명 : 철도건설공사 및 궤도유지보수용 궤도다짐기 구매 발주시기 : 2018년 05월 계약의목적 : 철도건설공사 및 궤도유지보수용 궤도다짐기 구매 계약 물량/규모 : 궤도다짐기 1대 예산액 : 2,061,000,000원철도건설공사 및 궤도유지보수용 궤도다짐기 구매
7232017.11.30공사한국철도공사년도 : 2017 유형 : 단년도 업무구분 : 공사 상세구분 : 통신공사 사업명 : 전라선 남원역 등 12개소 선로전환기용 영상감시설비 보수 기타공사 발주계획번호 : 3733 발주소속 : 전북본부 계약방법 : 제한경쟁 발주예정(월) : 12 배정예산(천원) : 150,000전라선 남원역 등 12개소 선로전환기용 영상감시설비 보수 기타공사
7242017.11.30공사한국철도공사년도 : 2017 유형 : 단년도 업무구분 : 공사 상세구분 : 전기공사 사업명 : 영주차량 동력차검수고 DL일상선 조명설비 교체 기타공사 발주계획번호 : 3732 발주소속 : 경북본부 계약방법 : 수의계약 발주예정(월) : 12 배정예산(천원) : 10,000영주차량 동력차검수고 DL일상선 조명설비 교체 기타공사
7252017.11.30공사한국철도공사년도 : 2017 유형 : 단년도 업무구분 : 공사 상세구분 : 통신공사 사업명 : 2호선 신도림역 역무자동화설비 철거 기타공사 발주계획번호 : 3744 발주소속 : 서울통신사무소 계약방법 : 제한경쟁 발주예정(월) : 12 배정예산(천원) : 4,0002호선 신도림역 역무자동화설비 철거 기타공사
7262017.11.30공사한국철도공사년도 : 2017 유형 : 단년도 업무구분 : 공사 상세구분 : 전기공사 사업명 : 경북선백원~점촌간외1개소레일개량에따른지장신호설비철거설치공사 발주계획번호 : 3742 발주소속 : 경북본부 계약방법 : 제한경쟁 발주예정(월) : 12 배정예산(천원) : 71,000경북선백원~점촌간외1개소레일개량에따른지장신호설비철거에 따른 지장신호설비 철거 설치공사
7272017.11.30공사한국철도공사년도 : 2017 유형 : 단년도 업무구분 : 공사 상세구분 : 통신공사 사업명 : 경부선 신암역외 1개소 선로전환기용 영상감시설비 신설공사 발주계획번호 : 3747 발주소속 : 대구본부 계약방법 : 제한경쟁 발주예정(월) : 12 배정예산(천원) : 78,000경부선 신암역외 1개소 선로전환기용 영상감시설비 신설공사
728<NA><NA><NA><NA>NaN
729<NA><NA><NA><NA>NaN
730Copyright ⓒ KRIC All Right Reserved.<NA><NA><NA>2022-10-03 15:14:59.262000

Duplicate rows

Most frequently occurring

발주계획 목록Unnamed: 1Unnamed: 2Unnamed: 3# duplicates
0<NA><NA><NA><NA>3