Overview

Dataset statistics

Number of variables5
Number of observations120
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory4.9 KiB
Average record size in memory42.1 B

Variable types

Numeric1
Categorical3
Text1

Dataset

Description국토안전관리원에서 15종 기반시설 관련 실무자 중심의 정책 발굴 및 의견 수렴을 위해 운영하는 "국가 기반시설 지속가능 협의체"의 기반시설, 소속기관별 실무자 참여현황 등이 포함된 CSV형식 파일데이터입니다.
Author국토안전관리원
URLhttps://www.data.go.kr/data/15125671/fileData.do

Alerts

소속구분 is highly overall correlated with 전문분야High correlation
전문분야 is highly overall correlated with 소속구분High correlation
순번 has unique valuesUnique

Reproduction

Analysis started2023-12-23 07:33:25.280761
Analysis finished2023-12-23 07:33:29.815799
Duration4.54 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

순번
Real number (ℝ)

UNIQUE 

Distinct120
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean60.5
Minimum1
Maximum120
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.2 KiB
2023-12-23T07:33:30.235379image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile6.95
Q130.75
median60.5
Q390.25
95-th percentile114.05
Maximum120
Range119
Interquartile range (IQR)59.5

Descriptive statistics

Standard deviation34.785054
Coefficient of variation (CV)0.57495957
Kurtosis-1.2
Mean60.5
Median Absolute Deviation (MAD)30
Skewness0
Sum7260
Variance1210
MonotonicityStrictly increasing
2023-12-23T07:33:31.362749image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
0.8%
62 1
 
0.8%
90 1
 
0.8%
89 1
 
0.8%
88 1
 
0.8%
87 1
 
0.8%
86 1
 
0.8%
85 1
 
0.8%
84 1
 
0.8%
83 1
 
0.8%
Other values (110) 110
91.7%
ValueCountFrequency (%)
1 1
0.8%
2 1
0.8%
3 1
0.8%
4 1
0.8%
5 1
0.8%
6 1
0.8%
7 1
0.8%
8 1
0.8%
9 1
0.8%
10 1
0.8%
ValueCountFrequency (%)
120 1
0.8%
119 1
0.8%
118 1
0.8%
117 1
0.8%
116 1
0.8%
115 1
0.8%
114 1
0.8%
113 1
0.8%
112 1
0.8%
111 1
0.8%

소속구분
Categorical

HIGH CORRELATION 

Distinct10
Distinct (%)8.3%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
04 공공기관
32 
05 지방공기업
31 
06 민간관리주체
25 
02 지자체(광역)
12 
03 지자체(기초)
Other values (5)
12 

Length

Max length10
Median length9
Mean length8.1916667
Min length5

Unique

Unique2 ?
Unique (%)1.7%

Sample

1st row02 지자체(광역)
2nd row02 지자체(광역)
3rd row02 지자체(광역)
4th row02 지자체(광역)
5th row04 공공기관

Common Values

ValueCountFrequency (%)
04 공공기관 32
26.7%
05 지방공기업 31
25.8%
06 민간관리주체 25
20.8%
02 지자체(광역) 12
 
10.0%
03 지자체(기초) 8
 
6.7%
10 학·협회 4
 
3.3%
08 연구기관 3
 
2.5%
09 대학(학계) 3
 
2.5%
01 국가 1
 
0.8%
11 기타 1
 
0.8%

Length

2023-12-23T07:33:32.270335image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-23T07:33:33.082144image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
04 32
13.3%
공공기관 32
13.3%
05 31
12.9%
지방공기업 31
12.9%
06 25
10.4%
민간관리주체 25
10.4%
02 12
 
5.0%
지자체(광역 12
 
5.0%
03 8
 
3.3%
지자체(기초 8
 
3.3%
Other values (10) 24
10.0%

전문분야
Categorical

HIGH CORRELATION 

Distinct18
Distinct (%)15.0%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
02 철도
35 
09 열
21 
01 도로
13 
00 총괄
03 항만
Other values (13)
36 

Length

Max length8
Median length5
Mean length4.9166667
Min length4

Unique

Unique3 ?
Unique (%)2.5%

Sample

1st row00 총괄
2nd row00 총괄
3rd row00 총괄
4th row00 총괄
5th row01 도로

Common Values

ValueCountFrequency (%)
02 철도 35
29.2%
09 열 21
17.5%
01 도로 13
 
10.8%
00 총괄 9
 
7.5%
03 항만 6
 
5.0%
08 가스 5
 
4.2%
16 하수도 4
 
3.3%
06 수도 4
 
3.3%
07 전기 4
 
3.3%
15 댐 4
 
3.3%
Other values (8) 15
12.5%

Length

2023-12-23T07:33:34.189288image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
02 35
14.6%
철도 35
14.6%
09 21
 
8.8%
21
 
8.8%
01 13
 
5.4%
도로 13
 
5.4%
00 9
 
3.8%
총괄 9
 
3.8%
03 6
 
2.5%
항만 6
 
2.5%
Other values (26) 72
30.0%
Distinct32
Distinct (%)26.7%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
1년
15 
20년
14 
<NA>
11 
3년
10 
10년 이상
Other values (27)
61 

Length

Max length12
Median length11
Mean length3.5416667
Min length2

Unique

Unique12 ?
Unique (%)10.0%

Sample

1st row2년
2nd row0년
3rd row20년
4th row10년
5th row10년 이상

Common Values

ValueCountFrequency (%)
1년 15
12.5%
20년 14
 
11.7%
<NA> 11
 
9.2%
3년 10
 
8.3%
10년 이상 9
 
7.5%
2년 6
 
5.0%
18년 6
 
5.0%
6년 5
 
4.2%
3년 이상 7년 미만 5
 
4.2%
15년 3
 
2.5%
Other values (22) 36
30.0%

Length

2023-12-23T07:33:34.932756image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
1년 18
11.5%
이상 17
10.9%
3년 16
10.3%
10년 14
9.0%
20년 14
9.0%
na 11
 
7.1%
7년 10
 
6.4%
미만 9
 
5.8%
2년 7
 
4.5%
18년 6
 
3.8%
Other values (19) 34
21.8%
Distinct67
Distinct (%)55.8%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
2023-12-23T07:33:35.844120image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length19
Median length14
Mean length7.125
Min length2

Characters and Unicode

Total characters855
Distinct characters124
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique35 ?
Unique (%)29.2%

Sample

1st row경기도
2nd row경기도
3rd row경상남도
4th row경상남도
5th row한국도로공사
ValueCountFrequency (%)
대구교통공사 10
 
7.2%
경기도 6
 
4.3%
한국전력공사 4
 
2.9%
서울에너지공사 4
 
2.9%
괴산군청 4
 
2.9%
한국어촌어항공단 3
 
2.2%
대전광역시 3
 
2.2%
한국상하수도협회 3
 
2.2%
kt 3
 
2.2%
한국철도기술연구원 3
 
2.2%
Other values (65) 95
68.8%
2023-12-23T07:33:37.802325image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
60
 
7.0%
50
 
5.8%
36
 
4.2%
34
 
4.0%
31
 
3.6%
29
 
3.4%
25
 
2.9%
22
 
2.6%
22
 
2.6%
21
 
2.5%
Other values (114) 525
61.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 806
94.3%
Space Separator 18
 
2.1%
Other Symbol 11
 
1.3%
Uppercase Letter 10
 
1.2%
Open Punctuation 4
 
0.5%
Close Punctuation 4
 
0.5%
Other Punctuation 1
 
0.1%
Decimal Number 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
60
 
7.4%
50
 
6.2%
36
 
4.5%
34
 
4.2%
31
 
3.8%
29
 
3.6%
25
 
3.1%
22
 
2.7%
22
 
2.7%
21
 
2.6%
Other values (103) 476
59.1%
Uppercase Letter
ValueCountFrequency (%)
T 4
40.0%
K 3
30.0%
J 1
 
10.0%
B 1
 
10.0%
F 1
 
10.0%
Space Separator
ValueCountFrequency (%)
18
100.0%
Other Symbol
ValueCountFrequency (%)
11
100.0%
Open Punctuation
ValueCountFrequency (%)
( 4
100.0%
Close Punctuation
ValueCountFrequency (%)
) 4
100.0%
Other Punctuation
ValueCountFrequency (%)
, 1
100.0%
Decimal Number
ValueCountFrequency (%)
9 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 817
95.6%
Common 28
 
3.3%
Latin 10
 
1.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
60
 
7.3%
50
 
6.1%
36
 
4.4%
34
 
4.2%
31
 
3.8%
29
 
3.5%
25
 
3.1%
22
 
2.7%
22
 
2.7%
21
 
2.6%
Other values (104) 487
59.6%
Common
ValueCountFrequency (%)
18
64.3%
( 4
 
14.3%
) 4
 
14.3%
, 1
 
3.6%
9 1
 
3.6%
Latin
ValueCountFrequency (%)
T 4
40.0%
K 3
30.0%
J 1
 
10.0%
B 1
 
10.0%
F 1
 
10.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 806
94.3%
ASCII 38
 
4.4%
None 11
 
1.3%

Most frequent character per block

Hangul
ValueCountFrequency (%)
60
 
7.4%
50
 
6.2%
36
 
4.5%
34
 
4.2%
31
 
3.8%
29
 
3.6%
25
 
3.1%
22
 
2.7%
22
 
2.7%
21
 
2.6%
Other values (103) 476
59.1%
ASCII
ValueCountFrequency (%)
18
47.4%
( 4
 
10.5%
) 4
 
10.5%
T 4
 
10.5%
K 3
 
7.9%
, 1
 
2.6%
J 1
 
2.6%
B 1
 
2.6%
F 1
 
2.6%
9 1
 
2.6%
None
ValueCountFrequency (%)
11
100.0%

Interactions

2023-12-23T07:33:27.237181image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-23T07:33:38.381034image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
순번소속구분전문분야전문분야 업무기간소속기관명
순번1.0000.7650.7680.7500.969
소속구분0.7651.0000.8520.5160.997
전문분야0.7680.8521.0000.8220.995
전문분야 업무기간0.7500.5160.8221.0000.889
소속기관명0.9690.9970.9950.8891.000
2023-12-23T07:33:38.684960image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
소속구분전문분야 업무기간전문분야
소속구분1.0000.1780.521
전문분야 업무기간0.1781.0000.349
전문분야0.5210.3491.000
2023-12-23T07:33:39.201499image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
순번소속구분전문분야전문분야 업무기간
순번1.0000.3310.4080.330
소속구분0.3311.0000.5210.178
전문분야0.4080.5211.0000.349
전문분야 업무기간0.3300.1780.3491.000

Missing values

2023-12-23T07:33:28.504602image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-23T07:33:29.490692image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

순번소속구분전문분야전문분야 업무기간소속기관명
0102 지자체(광역)00 총괄2년경기도
1202 지자체(광역)00 총괄0년경기도
2302 지자체(광역)00 총괄20년경상남도
3402 지자체(광역)00 총괄10년경상남도
4504 공공기관01 도로10년 이상한국도로공사
5605 지방공기업01 도로10년 이상대구시설공단
6705 지방공기업01 도로20년서울시설공단
7805 지방공기업01 도로<NA>서울시설공단
8906 민간관리주체01 도로16년㈜마창대교
91006 민간관리주체01 도로12년㈜마창대교
순번소속구분전문분야전문분야 업무기간소속기관명
11011106 민간관리주체01 도로15년수원순환고속도로㈜
11111206 민간관리주체02 철도5년김포골드라인운영㈜
11211306 민간관리주체02 철도5년김포골드라인운영㈜
11311405 지방공기업03 항만<NA>울산항만공사
11411504 공공기관07 전기<NA>한국전력공사
11511602 지자체(광역)00 총괄<NA>경기도
11611706 민간관리주체09 열<NA>석문에너지
11711804 공공기관04 어항<NA>한국어촌어항공단
11811904 공공기관02 철도20년국가철도공단
11912004 공공기관12 송유<NA>한국석유공사