Overview

Dataset statistics

Number of variables5
Number of observations129
Missing cells0
Missing cells (%)0.0%
Duplicate rows2
Duplicate rows (%)1.6%
Total size in memory5.2 KiB
Average record size in memory41.0 B

Variable types

Categorical4
Text1

Dataset

Description한국남부발전(주)_설계기술용역 시공도급계약 현황(안동)에 대한 데이터로 구분, 계약번호, 계약명, 계약자 등의 항목을 제공합니다.
Author한국남부발전(주)
URLhttps://www.data.go.kr/data/15043392/fileData.do

Alerts

Dataset has 2 (1.6%) duplicate rowsDuplicates
계약번호 is highly overall correlated with 구분 and 2 other fieldsHigh correlation
계약명 is highly overall correlated with 구분 and 2 other fieldsHigh correlation
계약자 is highly overall correlated with 구분 and 2 other fieldsHigh correlation
구분 is highly overall correlated with 계약번호 and 2 other fieldsHigh correlation
구분 is highly imbalanced (80.1%)Imbalance
계약번호 is highly imbalanced (52.5%)Imbalance

Reproduction

Analysis started2024-04-06 08:34:53.903122
Analysis finished2024-04-06 08:34:54.818568
Duration0.92 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

구분
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)1.6%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
시공도급계약
125 
설계기술용역
 
4

Length

Max length6
Median length6
Mean length6
Min length6

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row설계기술용역
2nd row설계기술용역
3rd row설계기술용역
4th row설계기술용역
5th row시공도급계약

Common Values

ValueCountFrequency (%)
시공도급계약 125
96.9%
설계기술용역 4
 
3.1%

Length

2024-04-06T17:34:54.937533image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-04-06T17:34:55.112716image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
시공도급계약 125
96.9%
설계기술용역 4
 
3.1%

계약번호
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct14
Distinct (%)10.9%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
PAD-P-11EF1
60 
2012-03-01
54 
PAD-P-M02
 
2
제2011-3-05호
 
2
PAD-P-M01
 
2
Other values (9)

Length

Max length13
Median length11
Mean length10.534884
Min length9

Unique

Unique9 ?
Unique (%)7.0%

Sample

1st rowC0993-11-2012
2nd rowPAD-P-M02
3rd row제2011-3-05호
4th row제2011-3-05호
5th row2012-03-01

Common Values

ValueCountFrequency (%)
PAD-P-11EF1 60
46.5%
2012-03-01 54
41.9%
PAD-P-M02 2
 
1.6%
제2011-3-05호 2
 
1.6%
PAD-P-M01 2
 
1.6%
C0993-11-2012 1
 
0.8%
C8200-12-1001 1
 
0.8%
C8200121002 1
 
0.8%
C8200121003 1
 
0.8%
C8200121004 1
 
0.8%
Other values (4) 4
 
3.1%

Length

2024-04-06T17:34:55.380620image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
pad-p-11ef1 60
46.5%
2012-03-01 54
41.9%
pad-p-m02 2
 
1.6%
제2011-3-05호 2
 
1.6%
pad-p-m01 2
 
1.6%
c0993-11-2012 1
 
0.8%
c8200-12-1001 1
 
0.8%
c8200121002 1
 
0.8%
c8200121003 1
 
0.8%
c8200121004 1
 
0.8%
Other values (4) 4
 
3.1%

계약명
Categorical

HIGH CORRELATION 

Distinct17
Distinct (%)13.2%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
안동주기기구매_GS(보험포함, 잠정분)
30 
안동주기기_롯데건설(보험포험, 잠정분불포함)
30 
안동천연가스발전소 야드 건설공사(경일건설)
18 
안동천연가스발전소 야드 건설공사(동아건설)
18 
안동천연가스발전소 야드 건설공사(롯데건설)
18 
Other values (12)
15 

Length

Max length26
Median length25
Mean length22.333333
Min length9

Unique

Unique9 ?
Unique (%)7.0%

Sample

1st row안동천연가스발전소 사택신축 설계 용역
2nd row안동천연가스발전소 보조보일러 설치조건부 구매계약
3rd row안동천연가스발전소 건설 설계기술용역
4th row안동천연가스발전소 건설 설계기술용역
5th row안동천연가스발전소 야드 건설공사(경일건설)

Common Values

ValueCountFrequency (%)
안동주기기구매_GS(보험포함, 잠정분) 30
23.3%
안동주기기_롯데건설(보험포험, 잠정분불포함) 30
23.3%
안동천연가스발전소 야드 건설공사(경일건설) 18
14.0%
안동천연가스발전소 야드 건설공사(동아건설) 18
14.0%
안동천연가스발전소 야드 건설공사(롯데건설) 18
14.0%
안동천연가스발전소 건설 설계기술용역 2
 
1.6%
안동천연가스발전소 수폐수처리설비 구매 2
 
1.6%
안동천연가스발전소 보조보일러 설치조건부 구매계약 2
 
1.6%
신축사택 전기공사 1
 
0.8%
기계공작실 및 종합창고 신축공사 1
 
0.8%
Other values (7) 7
 
5.4%

Length

2024-04-06T17:34:55.643370image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
안동천연가스발전소 62
18.5%
야드 54
16.1%
안동주기기구매_gs(보험포함 30
9.0%
잠정분 30
9.0%
안동주기기_롯데건설(보험포험 30
9.0%
잠정분불포함 30
9.0%
건설공사(경일건설 18
 
5.4%
건설공사(동아건설 18
 
5.4%
건설공사(롯데건설 18
 
5.4%
4
 
1.2%
Other values (24) 41
12.2%

계약자
Categorical

HIGH CORRELATION 

Distinct16
Distinct (%)12.4%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
롯데건설(주)
48 
지에스건설(주)
30 
경일건설 주식회사
18 
동아건설산업(주)
18 
한신보일러(주)
 
2
Other values (11)
13 

Length

Max length16
Median length10
Mean length7.9844961
Min length4

Unique

Unique9 ?
Unique (%)7.0%

Sample

1st row(주)유탑엔지니어링건축사사무소
2nd row한신보일러(주)
3rd row현대엔지니어링(주)
4th row현대엔지니어링(주)
5th row경일건설 주식회사

Common Values

ValueCountFrequency (%)
롯데건설(주) 48
37.2%
지에스건설(주) 30
23.3%
경일건설 주식회사 18
 
14.0%
동아건설산업(주) 18
 
14.0%
한신보일러(주) 2
 
1.6%
현대엔지니어링(주) 2
 
1.6%
한성크린텍(주) 2
 
1.6%
(주)유탑엔지니어링건축사사무소 1
 
0.8%
유창종합건설(주) 1
 
0.8%
태성전력 주식회사 1
 
0.8%
Other values (6) 6
 
4.7%

Length

2024-04-06T17:34:55.892166image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
롯데건설(주 48
32.0%
지에스건설(주 30
20.0%
주식회사 21
14.0%
경일건설 18
 
12.0%
동아건설산업(주 18
 
12.0%
한신보일러(주 2
 
1.3%
현대엔지니어링(주 2
 
1.3%
한성크린텍(주 2
 
1.3%
주성전기통신(주 1
 
0.7%
신진종합건설(주 1
 
0.7%
Other values (7) 7
 
4.7%
Distinct58
Distinct (%)45.0%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
2024-04-06T17:34:56.247702image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length43
Median length32
Mean length26.705426
Min length11

Characters and Unicode

Total characters3445
Distinct characters157
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique6 ?
Unique (%)4.7%

Sample

1st rowXA02 안동-사택신축 공사(별도발주)
2nd rowBM02 안동-보조보일러 구매
3rd rowA 안동-설계기술용역
4th rowA 안동-설계기술용역
5th rowYJ01 안동-(YARD)계측제어설비 공사
ValueCountFrequency (%)
60
 
11.3%
설치공사 29
 
5.5%
신축공사 23
 
4.3%
기초공사 14
 
2.6%
공사 10
 
1.9%
건물 10
 
1.9%
축조공사 8
 
1.5%
기기 7
 
1.3%
안동-(설치조건)hrsg 6
 
1.1%
부속설비 6
 
1.1%
Other values (154) 359
67.5%
2024-04-06T17:34:56.897153image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
403
 
11.7%
167
 
4.8%
A 155
 
4.5%
139
 
4.0%
135
 
3.9%
132
 
3.8%
129
 
3.7%
- 129
 
3.7%
0 127
 
3.7%
) 122
 
3.5%
Other values (147) 1807
52.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1877
54.5%
Uppercase Letter 534
 
15.5%
Space Separator 403
 
11.7%
Decimal Number 254
 
7.4%
Dash Punctuation 129
 
3.7%
Close Punctuation 122
 
3.5%
Open Punctuation 122
 
3.5%
Other Punctuation 4
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
167
 
8.9%
139
 
7.4%
135
 
7.2%
132
 
7.0%
129
 
6.9%
99
 
5.3%
87
 
4.6%
81
 
4.3%
81
 
4.3%
60
 
3.2%
Other values (109) 767
40.9%
Uppercase Letter
ValueCountFrequency (%)
A 155
29.0%
Y 108
20.2%
R 64
12.0%
D 56
 
10.5%
C 36
 
6.7%
E 30
 
5.6%
M 29
 
5.4%
B 7
 
1.3%
G 6
 
1.1%
S 6
 
1.1%
Other values (12) 37
 
6.9%
Decimal Number
ValueCountFrequency (%)
0 127
50.0%
1 31
 
12.2%
2 28
 
11.0%
3 18
 
7.1%
4 14
 
5.5%
5 11
 
4.3%
6 9
 
3.5%
7 7
 
2.8%
8 7
 
2.8%
9 2
 
0.8%
Other Punctuation
ValueCountFrequency (%)
/ 2
50.0%
, 2
50.0%
Space Separator
ValueCountFrequency (%)
403
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 129
100.0%
Close Punctuation
ValueCountFrequency (%)
) 122
100.0%
Open Punctuation
ValueCountFrequency (%)
( 122
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1877
54.5%
Common 1034
30.0%
Latin 534
 
15.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
167
 
8.9%
139
 
7.4%
135
 
7.2%
132
 
7.0%
129
 
6.9%
99
 
5.3%
87
 
4.6%
81
 
4.3%
81
 
4.3%
60
 
3.2%
Other values (109) 767
40.9%
Latin
ValueCountFrequency (%)
A 155
29.0%
Y 108
20.2%
R 64
12.0%
D 56
 
10.5%
C 36
 
6.7%
E 30
 
5.6%
M 29
 
5.4%
B 7
 
1.3%
G 6
 
1.1%
S 6
 
1.1%
Other values (12) 37
 
6.9%
Common
ValueCountFrequency (%)
403
39.0%
- 129
 
12.5%
0 127
 
12.3%
) 122
 
11.8%
( 122
 
11.8%
1 31
 
3.0%
2 28
 
2.7%
3 18
 
1.7%
4 14
 
1.4%
5 11
 
1.1%
Other values (6) 29
 
2.8%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1877
54.5%
ASCII 1568
45.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
403
25.7%
A 155
 
9.9%
- 129
 
8.2%
0 127
 
8.1%
) 122
 
7.8%
( 122
 
7.8%
Y 108
 
6.9%
R 64
 
4.1%
D 56
 
3.6%
C 36
 
2.3%
Other values (28) 246
15.7%
Hangul
ValueCountFrequency (%)
167
 
8.9%
139
 
7.4%
135
 
7.2%
132
 
7.0%
129
 
6.9%
99
 
5.3%
87
 
4.6%
81
 
4.3%
81
 
4.3%
60
 
3.2%
Other values (109) 767
40.9%

Correlations

2024-04-06T17:34:57.056286image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분계약번호계약명계약자단위공사명
구분1.0000.9930.9400.9920.942
계약번호0.9931.0001.0000.9980.974
계약명0.9401.0001.0001.0000.936
계약자0.9920.9981.0001.0000.940
단위공사명0.9420.9740.9360.9401.000
2024-04-06T17:34:57.257802image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
계약번호계약명계약자구분
계약번호1.0000.9870.9740.881
계약명0.9871.0000.9960.867
계약자0.9740.9961.0000.872
구분0.8810.8670.8721.000
2024-04-06T17:34:57.441754image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분계약번호계약명계약자
구분1.0000.8810.8670.872
계약번호0.8811.0000.9870.974
계약명0.8670.9871.0000.996
계약자0.8720.9740.9961.000

Missing values

2024-04-06T17:34:54.560540image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-04-06T17:34:54.746053image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

구분계약번호계약명계약자단위공사명
0설계기술용역C0993-11-2012안동천연가스발전소 사택신축 설계 용역(주)유탑엔지니어링건축사사무소XA02 안동-사택신축 공사(별도발주)
1설계기술용역PAD-P-M02안동천연가스발전소 보조보일러 설치조건부 구매계약한신보일러(주)BM02 안동-보조보일러 구매
2설계기술용역제2011-3-05호안동천연가스발전소 건설 설계기술용역현대엔지니어링(주)A 안동-설계기술용역
3설계기술용역제2011-3-05호안동천연가스발전소 건설 설계기술용역현대엔지니어링(주)A 안동-설계기술용역
4시공도급계약2012-03-01안동천연가스발전소 야드 건설공사(경일건설)경일건설 주식회사YJ01 안동-(YARD)계측제어설비 공사
5시공도급계약2012-03-01안동천연가스발전소 야드 건설공사(경일건설)경일건설 주식회사YM02 안동-(YARD)공용설비설치 및 기타부대공사
6시공도급계약2012-03-01안동천연가스발전소 야드 건설공사(경일건설)경일건설 주식회사YC07 안동-(YARD)구내도로 및 배수공사
7시공도급계약2012-03-01안동천연가스발전소 야드 건설공사(경일건설)경일건설 주식회사YC08 안동-(YARD)기타부대공사
8시공도급계약2012-03-01안동천연가스발전소 야드 건설공사(경일건설)경일건설 주식회사YC02 안동-(YARD)발전용수 취수시설 및 관로 축조공사
9시공도급계약2012-03-01안동천연가스발전소 야드 건설공사(경일건설)경일건설 주식회사YA04 안동-(YARD)보안 및 기타부대공사
구분계약번호계약명계약자단위공사명
119시공도급계약PAD-P-11EF1안동주기기구매_GS(보험포함, 잠정분)지에스건설(주)AM03 안동-(설치조건)증기터빈 및 부속설비 설치공사
120시공도급계약PAD-P-11EF1안동주기기구매_GS(보험포함, 잠정분)지에스건설(주)AE03 안동-(설치조건)케이블 트레이 및 전선관 설치공사
121시공도급계약PAD-P-11EF1안동주기기구매_GS(보험포함, 잠정분)지에스건설(주)AE04 안동-(설치조건)케이블 포설공사
122시공도급계약PAD-P-11EF1안동주기기구매_GS(보험포함, 잠정분)지에스건설(주)AA01 안동-(설치조건)터빈 건물 신축공사
123시공도급계약PAD-P-11EF1안동주기기구매_GS(보험포함, 잠정분)지에스건설(주)AA02 안동-(설치조건)터빈 발전기 및 옥내기기 기초공사
124시공도급계약PAD-P-11EF1안동주기기구매_GS(보험포함, 잠정분)지에스건설(주)AM05 안동-(설치조건)플랜트 배관공사
125시공도급계약PAD-P-M01안동천연가스발전소 수폐수처리설비 구매한성크린텍(주)BM01 안동-(설치조건)수폐수처리설비 설치공사
126시공도급계약PAD-P-M01안동천연가스발전소 수폐수처리설비 구매한성크린텍(주)BM01 안동-(설치조건)수폐수처리설비 설치공사
127시공도급계약PAD-P-M02안동천연가스발전소 보조보일러 설치조건부 구매계약한신보일러(주)BM02 안동-(설치조건)보조보일러 설치공사
128시공도급계약PAD-P-M05안동천연가스발전소 탈질설비 설치조건부 구매계약(주)코캣BM03 안동-탈질설비 구매

Duplicate rows

Most frequently occurring

구분계약번호계약명계약자단위공사명# duplicates
0설계기술용역제2011-3-05호안동천연가스발전소 건설 설계기술용역현대엔지니어링(주)A 안동-설계기술용역2
1시공도급계약PAD-P-M01안동천연가스발전소 수폐수처리설비 구매한성크린텍(주)BM01 안동-(설치조건)수폐수처리설비 설치공사2