Overview

Dataset statistics

Number of variables2
Number of observations211
Missing cells45
Missing cells (%)10.7%
Duplicate rows1
Duplicate rows (%)0.5%
Total size in memory3.4 KiB
Average record size in memory16.6 B

Variable types

Categorical1
Text1

Dataset

Description핵심전략기술 및 핵심전략기술과 관련된 품목, 핵심전략기술 선정·재검토 세부절차 등에 관한 고시 [산업통상자원부고시 제2022-173호, 2022. 10. 18., 일부개정]와 관련하여 핵심전략기술 목록(분야, 대상기술)을 제공합니다. (제4조제1항 관련)
Author한국산업기술기획평가원
URLhttps://www.data.go.kr/data/15121632/fileData.do

Alerts

Dataset has 1 (0.5%) duplicate rowsDuplicates
대상기술 has 45 (21.3%) missing valuesMissing

Reproduction

Analysis started2023-12-13 01:00:00.755566
Analysis finished2023-12-13 01:00:01.025167
Duration0.27 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

분야
Categorical

Distinct15
Distinct (%)7.1%
Missing0
Missing (%)0.0%
Memory size1.8 KiB
기계금속(44개)
50 
<NA>
39 
반도체(32개)
35 
전기전자(25개)
28 
디스플레이(14개)
16 
Other values (10)
43 

Length

Max length10
Median length9
Mean length7.7440758
Min length4

Unique

Unique7 ?
Unique (%)3.3%

Sample

1st row관계법령
2nd row반도체(32개)
3rd row반도체(32개)
4th row반도체(32개)
5th row반도체(32개)

Common Values

ValueCountFrequency (%)
기계금속(44개) 50
23.7%
<NA> 39
18.5%
반도체(32개) 35
16.6%
전기전자(25개) 28
13.3%
디스플레이(14개) 16
 
7.6%
자동차(15개) 16
 
7.6%
기초화학(15개) 15
 
7.1%
바이오(5개) 5
 
2.4%
관계법령 1
 
0.5%
마. 전기전자 1
 
0.5%
Other values (5) 5
 
2.4%

Length

2023-12-13T10:00:01.077332image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
기계금속(44개 50
23.4%
na 39
18.2%
반도체(32개 35
16.4%
전기전자(25개 28
13.1%
디스플레이(14개 16
 
7.5%
자동차(15개 16
 
7.5%
기초화학(15개 15
 
7.0%
바이오(5개 5
 
2.3%
기초화학 1
 
0.5%
바이오 1
 
0.5%
Other values (8) 8
 
3.7%

대상기술
Text

MISSING 

Distinct164
Distinct (%)98.8%
Missing45
Missing (%)21.3%
Memory size1.8 KiB
2023-12-13T10:00:01.336482image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length178
Median length94
Mean length65.566265
Min length20

Characters and Unicode

Total characters10884
Distinct characters423
Distinct categories11 ?
Distinct scripts3 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique162 ?
Unique (%)97.6%

Sample

1st row핵심전략기술 및 핵심전략기술과 관련된 품목, 핵심전략기술 선정·재검토 세부절차 등에 관한 고시, [시행 2022. 10. 18.] [산업통상자원부고시 제2022-173호, 2022. 10. 18., 일부개정], [별표] 핵심전략기술 목록(제4조제1항 관련)
2nd row1) 반도체 기초소재 제조 기술 : 메모리와 시스템반도체 제조에 필요한 기초 소재 제조 기술
3rd row2) 반도체 패턴용 공정 소재 제조 기술 : 회로 이미지 패턴을 형성하는데 사용하는 소재 제조 기술
4th row3) 반도체 제조용 박막 소재 제조 기술 : 반도체 제조에 필수적으로 사용되는 다층박막 소재 제조 기술
5th row4) 반도체용 불소화합물 제조 기술 : 기체 혹은 액체 형태로 에칭과 식각 등의 반도체 공정에 사용되는 불소화합물 제조 기술
ValueCountFrequency (%)
기술 298
 
10.3%
제조 275
 
9.5%
150
 
5.2%
96
 
3.3%
소재 81
 
2.8%
부품 56
 
1.9%
반도체 47
 
1.6%
위한 37
 
1.3%
장비 31
 
1.1%
9 19
 
0.7%
Other values (1049) 1795
62.2%
2023-12-13T10:00:01.766894image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2722
25.0%
420
 
3.9%
371
 
3.4%
315
 
2.9%
307
 
2.8%
) 190
 
1.7%
176
 
1.6%
160
 
1.5%
: 150
 
1.4%
138
 
1.3%
Other values (413) 5935
54.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 6882
63.2%
Space Separator 2722
 
25.0%
Decimal Number 399
 
3.7%
Other Punctuation 329
 
3.0%
Close Punctuation 197
 
1.8%
Lowercase Letter 185
 
1.7%
Uppercase Letter 109
 
1.0%
Open Punctuation 26
 
0.2%
Math Symbol 26
 
0.2%
Dash Punctuation 7
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
420
 
6.1%
371
 
5.4%
315
 
4.6%
307
 
4.5%
176
 
2.6%
160
 
2.3%
138
 
2.0%
132
 
1.9%
128
 
1.9%
120
 
1.7%
Other values (350) 4615
67.1%
Lowercase Letter
ValueCountFrequency (%)
e 23
12.4%
i 20
10.8%
r 16
8.6%
n 15
8.1%
a 15
8.1%
o 15
8.1%
t 12
 
6.5%
l 12
 
6.5%
s 11
 
5.9%
c 9
 
4.9%
Other values (10) 37
20.0%
Uppercase Letter
ValueCountFrequency (%)
D 13
11.9%
L 12
11.0%
A 11
10.1%
M 10
9.2%
C 9
8.3%
I 9
8.3%
P 9
8.3%
E 8
7.3%
R 5
 
4.6%
N 5
 
4.6%
Other values (8) 18
16.5%
Decimal Number
ValueCountFrequency (%)
2 96
24.1%
1 78
19.5%
0 57
14.3%
3 39
9.8%
4 31
 
7.8%
9 27
 
6.8%
5 20
 
5.0%
6 17
 
4.3%
7 17
 
4.3%
8 17
 
4.3%
Other Punctuation
ValueCountFrequency (%)
: 150
45.6%
, 86
26.1%
. 45
 
13.7%
· 36
 
10.9%
/ 11
 
3.3%
? 1
 
0.3%
Close Punctuation
ValueCountFrequency (%)
) 190
96.4%
] 7
 
3.6%
Open Punctuation
ValueCountFrequency (%)
( 19
73.1%
[ 7
 
26.9%
Math Symbol
ValueCountFrequency (%)
< 13
50.0%
> 13
50.0%
Space Separator
ValueCountFrequency (%)
2722
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 7
100.0%
Other Symbol
ValueCountFrequency (%)
2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 6882
63.2%
Common 3708
34.1%
Latin 294
 
2.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
420
 
6.1%
371
 
5.4%
315
 
4.6%
307
 
4.5%
176
 
2.6%
160
 
2.3%
138
 
2.0%
132
 
1.9%
128
 
1.9%
120
 
1.7%
Other values (350) 4615
67.1%
Latin
ValueCountFrequency (%)
e 23
 
7.8%
i 20
 
6.8%
r 16
 
5.4%
n 15
 
5.1%
a 15
 
5.1%
o 15
 
5.1%
D 13
 
4.4%
L 12
 
4.1%
t 12
 
4.1%
l 12
 
4.1%
Other values (28) 141
48.0%
Common
ValueCountFrequency (%)
2722
73.4%
) 190
 
5.1%
: 150
 
4.0%
2 96
 
2.6%
, 86
 
2.3%
1 78
 
2.1%
0 57
 
1.5%
. 45
 
1.2%
3 39
 
1.1%
· 36
 
1.0%
Other values (15) 209
 
5.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 6881
63.2%
ASCII 3964
36.4%
None 36
 
0.3%
CJK Compat 2
 
< 0.1%
Compat Jamo 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
2722
68.7%
) 190
 
4.8%
: 150
 
3.8%
2 96
 
2.4%
, 86
 
2.2%
1 78
 
2.0%
0 57
 
1.4%
. 45
 
1.1%
3 39
 
1.0%
4 31
 
0.8%
Other values (51) 470
 
11.9%
Hangul
ValueCountFrequency (%)
420
 
6.1%
371
 
5.4%
315
 
4.6%
307
 
4.5%
176
 
2.6%
160
 
2.3%
138
 
2.0%
132
 
1.9%
128
 
1.9%
120
 
1.7%
Other values (349) 4614
67.1%
None
ValueCountFrequency (%)
· 36
100.0%
CJK Compat
ValueCountFrequency (%)
2
100.0%
Compat Jamo
ValueCountFrequency (%)
1
100.0%

Missing values

2023-12-13T10:00:00.954781image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T10:00:01.005521image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

분야대상기술
0관계법령핵심전략기술 및 핵심전략기술과 관련된 품목, 핵심전략기술 선정·재검토 세부절차 등에 관한 고시, [시행 2022. 10. 18.] [산업통상자원부고시 제2022-173호, 2022. 10. 18., 일부개정], [별표] 핵심전략기술 목록(제4조제1항 관련)
1반도체(32개)1) 반도체 기초소재 제조 기술 : 메모리와 시스템반도체 제조에 필요한 기초 소재 제조 기술
2반도체(32개)2) 반도체 패턴용 공정 소재 제조 기술 : 회로 이미지 패턴을 형성하는데 사용하는 소재 제조 기술
3반도체(32개)3) 반도체 제조용 박막 소재 제조 기술 : 반도체 제조에 필수적으로 사용되는 다층박막 소재 제조 기술
4반도체(32개)4) 반도체용 불소화합물 제조 기술 : 기체 혹은 액체 형태로 에칭과 식각 등의 반도체 공정에 사용되는 불소화합물 제조 기술
5반도체(32개)5) 삭제 <2022. 9. 00.>
6반도체(32개)6) 반도체 보호 소재 제조 기술 : 반도체 회로 손상 또는 크랙을 방지하기 위한 보호막 소재 제조 기술
7반도체(32개)7) 반도체용 세라믹 소재 제조 기술 : 반도체 기초소재 제조를 위한 세라믹 소재 제조 기술
8반도체(32개)8) 삭제 <2022. 9. 00.>
9반도체(32개)9) 반도체 제조용 가스 소재 제조 기술 : 반도체 제조시 사용하는 가스 소재 제조 및 안정화 기술
분야대상기술
201<NA><NA>
202<NA><NA>
203<NA><NA>
204<NA><NA>
205마. 전기전자<NA>
206(25개)<NA>
207바. 기초화학<NA>
208(15개)<NA>
209사. 바이오<NA>
210(5개)<NA>

Duplicate rows

Most frequently occurring

분야대상기술# duplicates
0<NA><NA>39