Overview

Dataset statistics

Number of variables4
Number of observations87
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.9 KiB
Average record size in memory34.5 B

Variable types

Numeric1
Categorical2
Text1

Dataset

Description특정활동(E-7) 자격은 대한민국 내의 공‧사기관 등과의 계약에 의하여 법무부장관이 특히 지정하는 활동에 종사하고자 하는 전문 외국인력을 대상으로 발급되는 사증으로 특정활동(E-7)이 허용되는 직종에 대한 코드 자료를 제공
Author법무부
URLhttps://www.data.go.kr/data/15103564/fileData.do

Alerts

직 종 분 류 is highly overall correlated with 순번 and 1 other fieldsHigh correlation
구 분 is highly overall correlated with 순번 and 1 other fieldsHigh correlation
순번 is highly overall correlated with 구 분 and 1 other fieldsHigh correlation
순번 has unique valuesUnique
직 종 코 드 has unique valuesUnique

Reproduction

Analysis started2023-12-12 13:59:31.130880
Analysis finished2023-12-12 13:59:31.593652
Duration0.46 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

순번
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct87
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean44
Minimum1
Maximum87
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size915.0 B
2023-12-12T22:59:31.688405image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile5.3
Q122.5
median44
Q365.5
95-th percentile82.7
Maximum87
Range86
Interquartile range (IQR)43

Descriptive statistics

Standard deviation25.258662
Coefficient of variation (CV)0.5740605
Kurtosis-1.2
Mean44
Median Absolute Deviation (MAD)22
Skewness0
Sum3828
Variance638
MonotonicityStrictly increasing
2023-12-12T22:59:31.834229image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
1.1%
2 1
 
1.1%
65 1
 
1.1%
64 1
 
1.1%
63 1
 
1.1%
62 1
 
1.1%
61 1
 
1.1%
60 1
 
1.1%
59 1
 
1.1%
58 1
 
1.1%
Other values (77) 77
88.5%
ValueCountFrequency (%)
1 1
1.1%
2 1
1.1%
3 1
1.1%
4 1
1.1%
5 1
1.1%
6 1
1.1%
7 1
1.1%
8 1
1.1%
9 1
1.1%
10 1
1.1%
ValueCountFrequency (%)
87 1
1.1%
86 1
1.1%
85 1
1.1%
84 1
1.1%
83 1
1.1%
82 1
1.1%
81 1
1.1%
80 1
1.1%
79 1
1.1%
78 1
1.1%

구 분
Categorical

HIGH CORRELATION 

Distinct4
Distinct (%)4.6%
Missing0
Missing (%)0.0%
Memory size828.0 B
1. 전문인력(E-7-1)
67 
2. 준전문인력(E-7-2)
3. 일반기능인력(E-7-3)
4. 숙련기능 점수제인력(E-7-4)
 
3

Length

Max length20
Median length15
Mean length15.264368
Min length15

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row1. 전문인력(E-7-1)
2nd row1. 전문인력(E-7-1)
3rd row1. 전문인력(E-7-1)
4th row1. 전문인력(E-7-1)
5th row1. 전문인력(E-7-1)

Common Values

ValueCountFrequency (%)
1. 전문인력(E-7-1) 67
77.0%
2. 준전문인력(E-7-2) 9
 
10.3%
3. 일반기능인력(E-7-3) 8
 
9.2%
4. 숙련기능 점수제인력(E-7-4) 3
 
3.4%

Length

2023-12-12T22:59:31.966636image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T22:59:32.063903image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
1 67
37.9%
전문인력(e-7-1 67
37.9%
2 9
 
5.1%
준전문인력(e-7-2 9
 
5.1%
3 8
 
4.5%
일반기능인력(e-7-3 8
 
4.5%
4 3
 
1.7%
숙련기능 3
 
1.7%
점수제인력(e-7-4 3
 
1.7%

직 종 분 류
Categorical

HIGH CORRELATION 

Distinct6
Distinct (%)6.9%
Missing0
Missing (%)0.0%
Memory size828.0 B
나. 전문가 및 관련종사자 : 52개 직종 => E-7-1
52 
가. 관리자 : 15개 직종 => E-7-1
15 
가. 일반 기능 인력 : 8개 직종 => E-7-3
가. 사무종사자 : 5개직종 => E-7-2
 
5
나. 서비스 종사자 : 4개 직종 => E-7-2
 
4

Length

Max length32
Median length32
Mean length29.563218
Min length24

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row가. 관리자 : 15개 직종 => E-7-1
2nd row가. 관리자 : 15개 직종 => E-7-1
3rd row가. 관리자 : 15개 직종 => E-7-1
4th row가. 관리자 : 15개 직종 => E-7-1
5th row가. 관리자 : 15개 직종 => E-7-1

Common Values

ValueCountFrequency (%)
나. 전문가 및 관련종사자 : 52개 직종 => E-7-1 52
59.8%
가. 관리자 : 15개 직종 => E-7-1 15
 
17.2%
가. 일반 기능 인력 : 8개 직종 => E-7-3 8
 
9.2%
가. 사무종사자 : 5개직종 => E-7-2 5
 
5.7%
나. 서비스 종사자 : 4개 직종 => E-7-2 4
 
4.6%
나. 숙련기능 인력(점수제) : 3개 직종 => E-7-4 3
 
3.4%

Length

2023-12-12T22:59:32.179162image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T22:59:32.297266image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
174
23.8%
직종 82
11.2%
e-7-1 67
 
9.2%
59
 
8.1%
52
 
7.1%
관련종사자 52
 
7.1%
52개 52
 
7.1%
전문가 52
 
7.1%
28
 
3.8%
관리자 15
 
2.1%
Other values (16) 98
13.4%

직 종 코 드
Text

UNIQUE 

Distinct87
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size828.0 B
2023-12-12T22:59:32.490376image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length38
Median length29
Mean length20.390805
Min length13

Characters and Unicode

Total characters1774
Distinct characters188
Distinct categories8 ?
Distinct scripts4 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique87 ?
Unique (%)100.0%

Sample

1st row1) 경제이익단체 고위임원(S110)
2nd row2) 기업 고위임원(1120)
3rd row3) 경영지원 관리자(1212 舊1202)
4th row4) 교육 관리자(1312)
5th row5) 보험 및 금융관리자(1320)
ValueCountFrequency (%)
15
 
4.7%
1 6
 
1.9%
2 6
 
1.9%
3 6
 
1.9%
4 5
 
1.6%
5 4
 
1.3%
관련 3
 
0.9%
6 3
 
0.9%
8 3
 
0.9%
7 3
 
0.9%
Other values (252) 264
83.0%
2023-12-12T22:59:32.836288image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
232
 
13.1%
) 174
 
9.8%
2 154
 
8.7%
1 106
 
6.0%
3 95
 
5.4%
( 87
 
4.9%
4 47
 
2.6%
5 41
 
2.3%
40
 
2.3%
33
 
1.9%
Other values (178) 765
43.1%

Most occurring categories

ValueCountFrequency (%)
Other Letter 706
39.8%
Decimal Number 551
31.1%
Space Separator 232
 
13.1%
Close Punctuation 174
 
9.8%
Open Punctuation 87
 
4.9%
Other Punctuation 14
 
0.8%
Uppercase Letter 9
 
0.5%
Dash Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
40
 
5.7%
33
 
4.7%
28
 
4.0%
24
 
3.4%
23
 
3.3%
22
 
3.1%
21
 
3.0%
21
 
3.0%
19
 
2.7%
17
 
2.4%
Other values (162) 458
64.9%
Decimal Number
ValueCountFrequency (%)
2 154
27.9%
1 106
19.2%
3 95
17.2%
4 47
 
8.5%
5 41
 
7.4%
7 27
 
4.9%
0 25
 
4.5%
9 24
 
4.4%
6 19
 
3.4%
8 13
 
2.4%
Space Separator
ValueCountFrequency (%)
232
100.0%
Close Punctuation
ValueCountFrequency (%)
) 174
100.0%
Open Punctuation
ValueCountFrequency (%)
( 87
100.0%
Other Punctuation
ValueCountFrequency (%)
· 14
100.0%
Uppercase Letter
ValueCountFrequency (%)
S 9
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 1059
59.7%
Hangul 690
38.9%
Han 16
 
0.9%
Latin 9
 
0.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
40
 
5.8%
33
 
4.8%
28
 
4.1%
24
 
3.5%
23
 
3.3%
22
 
3.2%
21
 
3.0%
21
 
3.0%
19
 
2.8%
17
 
2.5%
Other values (161) 442
64.1%
Common
ValueCountFrequency (%)
232
21.9%
) 174
16.4%
2 154
14.5%
1 106
10.0%
3 95
9.0%
( 87
 
8.2%
4 47
 
4.4%
5 41
 
3.9%
7 27
 
2.5%
0 25
 
2.4%
Other values (5) 71
 
6.7%
Han
ValueCountFrequency (%)
16
100.0%
Latin
ValueCountFrequency (%)
S 9
100.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 1054
59.4%
Hangul 690
38.9%
CJK 16
 
0.9%
None 14
 
0.8%

Most frequent character per block

ASCII
ValueCountFrequency (%)
232
22.0%
) 174
16.5%
2 154
14.6%
1 106
10.1%
3 95
9.0%
( 87
 
8.3%
4 47
 
4.5%
5 41
 
3.9%
7 27
 
2.6%
0 25
 
2.4%
Other values (5) 66
 
6.3%
Hangul
ValueCountFrequency (%)
40
 
5.8%
33
 
4.8%
28
 
4.1%
24
 
3.5%
23
 
3.3%
22
 
3.2%
21
 
3.0%
21
 
3.0%
19
 
2.8%
17
 
2.5%
Other values (161) 442
64.1%
CJK
ValueCountFrequency (%)
16
100.0%
None
ValueCountFrequency (%)
· 14
100.0%

Interactions

2023-12-12T22:59:31.363586image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T22:59:32.923780image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
순번구 분직 종 분 류직 종 코 드
순번1.0000.8340.8441.000
구 분0.8341.0001.0001.000
직 종 분 류0.8441.0001.0001.000
직 종 코 드1.0001.0001.0001.000
2023-12-12T22:59:33.025848image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
직 종 분 류구 분
직 종 분 류1.0000.988
구 분0.9881.000
2023-12-12T22:59:33.113299image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
순번구 분직 종 분 류
순번1.0000.6470.637
구 분0.6471.0000.988
직 종 분 류0.6370.9881.000

Missing values

2023-12-12T22:59:31.470410image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T22:59:31.552135image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

순번구 분직 종 분 류직 종 코 드
011. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-11) 경제이익단체 고위임원(S110)
121. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-12) 기업 고위임원(1120)
231. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-13) 경영지원 관리자(1212 舊1202)
341. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-14) 교육 관리자(1312)
451. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-15) 보험 및 금융관리자(1320)
561. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-16) 문화·예술·디자인 및 영상관련 관리자(1340)
671. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-17) 정보통신관련 관리자(1350)
781. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-18) 기타 전문서비스 관리자(1390)
891. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-19) 건설 및 광업 관련 관리자(1411)
9101. 전문인력(E-7-1)가. 관리자 : 15개 직종 => E-7-110) 제품 생산관련 관리자(1413)
순번구 분직 종 분 류직 종 코 드
77783. 일반기능인력(E-7-3)가. 일반 기능 인력 : 8개 직종 => E-7-32) 양식기술자(6301)
78793. 일반기능인력(E-7-3)가. 일반 기능 인력 : 8개 직종 => E-7-33) 할랄 도축원(7103)
79803. 일반기능인력(E-7-3)가. 일반 기능 인력 : 8개 직종 => E-7-34) 악기제조 및 조율사(7303)
80813. 일반기능인력(E-7-3)가. 일반 기능 인력 : 8개 직종 => E-7-35) 조선용접공(7430)
81823. 일반기능인력(E-7-3)가. 일반 기능 인력 : 8개 직종 => E-7-36) 항공기 정비원(7521)
82833. 일반기능인력(E-7-3)가. 일반 기능 인력 : 8개 직종 => E-7-37) 선박 도장공(78369)
83843. 일반기능인력(E-7-3)가. 일반 기능 인력 : 8개 직종 => E-7-38) 선박 전기원(76212)
84854. 숙련기능 점수제인력(E-7-4)나. 숙련기능 인력(점수제) : 3개 직종 => E-7-41) 뿌리산업체 숙련기능공(S740)
85864. 숙련기능 점수제인력(E-7-4)나. 숙련기능 인력(점수제) : 3개 직종 => E-7-42) 농림축산어업 숙련기능인(S610)
86874. 숙련기능 점수제인력(E-7-4)나. 숙련기능 인력(점수제) : 3개 직종 => E-7-43) 일반 제조업체 및 건설업체 숙련기능공(S700)