Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 810.5 KiB |
Average record size in memory | 83.0 B |
Variable types
Categorical | 6 |
---|---|
Numeric | 2 |
Text | 1 |
Dataset
Description | 2013년에서 2021년까지의 국가자격취득자 현황 정보입니다. 취득연도, 취득월, 지역명, 연령대, 자격구분명, 계열명, 족명, 취득 수로 데이터가 구성되어 있습니다. |
---|---|
Author | 한국산업인력공단 |
URL | https://www.data.go.kr/data/15088896/fileData.do |
Reproduction
Analysis started | 2023-12-12 12:49:09.542001 |
---|---|
Analysis finished | 2023-12-12 12:49:11.279515 |
Duration | 1.74 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
취득년도
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2014 | |
---|---|
2015 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2014 |
---|---|
2nd row | 2015 |
3rd row | 2015 |
4th row | 2015 |
5th row | 2014 |
Common Values
Value | Count | Frequency (%) |
2014 | 5801 | |
2015 | 4199 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2014 | 5801 | |
2015 | 4199 |
취득월
Real number (ℝ)
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 7.21 |
Minimum | 1 |
---|---|
Maximum | 12 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 3 |
Q1 | 5 |
median | 7 |
Q3 | 10 |
95-th percentile | 12 |
Maximum | 12 |
Range | 11 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 2.8518964 |
---|---|
Coefficient of variation (CV) | 0.39554736 |
Kurtosis | -0.89621589 |
Mean | 7.21 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.1007945 |
Sum | 72100 |
Variance | 8.1333133 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
6 | 1443 | |
8 | 1397 | |
5 | 1387 | |
4 | 1157 | |
12 | 1055 | |
10 | 887 | |
9 | 722 | |
7 | 670 | |
11 | 586 | |
2 | 283 | 2.8% |
Other values (2) | 413 | 4.1% |
Value | Count | Frequency (%) |
1 | 133 | 1.3% |
2 | 283 | 2.8% |
3 | 280 | 2.8% |
4 | 1157 | |
5 | 1387 | |
6 | 1443 | |
7 | 670 | |
8 | 1397 | |
9 | 722 | |
10 | 887 |
Value | Count | Frequency (%) |
12 | 1055 | |
11 | 586 | |
10 | 887 | |
9 | 722 | |
8 | 1397 | |
7 | 670 | |
6 | 1443 | |
5 | 1387 | |
4 | 1157 | |
3 | 280 | 2.8% |
지역명
Categorical
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기 | |
---|---|
서울 | |
경남 | |
인천 | |
충남 | |
Other values (13) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 1.985 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경남 |
---|---|
2nd row | |
3rd row | 전남 |
4th row | 전남 |
5th row | 경북 |
Common Values
Value | Count | Frequency (%) |
경기 | 1045 | 10.4% |
서울 | 925 | 9.2% |
경남 | 659 | 6.6% |
인천 | 640 | 6.4% |
충남 | 638 | 6.4% |
경북 | 624 | 6.2% |
대구 | 611 | 6.1% |
부산 | 592 | 5.9% |
전북 | 573 | 5.7% |
대전 | 524 | 5.2% |
Other values (8) | 3169 |
Length
Value | Count | Frequency (%) |
경기 | 1045 | 10.6% |
서울 | 925 | 9.4% |
경남 | 659 | 6.7% |
인천 | 640 | 6.5% |
충남 | 638 | 6.5% |
경북 | 624 | 6.3% |
대구 | 611 | 6.2% |
부산 | 592 | 6.0% |
전북 | 573 | 5.8% |
대전 | 524 | 5.3% |
Other values (7) | 3019 |
연령대
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
20대 | |
---|---|
30대 | |
40대 | |
10대 | |
50대 | |
Other values (2) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 40대 |
---|---|
2nd row | 20대 |
3rd row | 20대 |
4th row | 10대 |
5th row | 10대 |
Common Values
Value | Count | Frequency (%) |
20대 | 2741 | |
30대 | 2109 | |
40대 | 1839 | |
10대 | 1734 | |
50대 | 1154 | |
60대 | 411 | 4.1% |
70대 | 12 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20대 | 2741 | |
30대 | 2109 | |
40대 | 1839 | |
10대 | 1734 | |
50대 | 1154 | |
60대 | 411 | 4.1% |
70대 | 12 | 0.1% |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
남성 | |
---|---|
여성 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남성 |
---|---|
2nd row | 여성 |
3rd row | 남성 |
4th row | 남성 |
5th row | 남성 |
Common Values
Value | Count | Frequency (%) |
남성 | 6594 | |
여성 | 3406 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남성 | 6594 | |
여성 | 3406 |
자격구분명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
국가기술자격 | |
---|---|
일학습병행자격 | 1 |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 6.0001 |
Min length | 6 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 국가기술자격 |
---|---|
2nd row | 국가기술자격 |
3rd row | 국가기술자격 |
4th row | 국가기술자격 |
5th row | 국가기술자격 |
Common Values
Value | Count | Frequency (%) |
국가기술자격 | 9999 | |
일학습병행자격 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국가기술자격 | 9999 | |
일학습병행자격 | 1 | < 0.1% |
계열명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
기능사 | |
---|---|
기사 | |
기능장 | 199 |
기술사 | 133 |
L2 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.7046 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 기술사 |
---|---|
2nd row | 기능사 |
3rd row | 기사 |
4th row | 기능사 |
5th row | 기능사 |
Common Values
Value | Count | Frequency (%) |
기능사 | 6714 | |
기사 | 2953 | |
기능장 | 199 | 2.0% |
기술사 | 133 | 1.3% |
L2 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
기능사 | 6714 | |
기사 | 2953 | |
기능장 | 199 | 2.0% |
기술사 | 133 | 1.3% |
l2 | 1 | < 0.1% |
종목명
Text
Distinct | 415 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
한식조리기능사 | 366 | 3.7% |
양식조리기능사 | 341 | 3.4% |
제빵기능사 | 296 | 3.0% |
미용사(일반 | 282 | 2.8% |
지게차운전기능사 | 255 | 2.5% |
중식조리기능사 | 229 | 2.3% |
굴삭기운전기능사 | 228 | 2.3% |
제과기능사 | 217 | 2.2% |
미용사(피부 | 212 | 2.1% |
정보처리기능사 | 196 | 2.0% |
Other values (405) | 7378 |
Most occurring characters
Value | Count | Frequency (%) |
기 | 11300 | 15.8% |
사 | 10285 | 14.4% |
능 | 6321 | 8.8% |
리 | 2039 | 2.8% |
전 | 1956 | 2.7% |
산 | 1922 | 2.7% |
조 | 1658 | 2.3% |
업 | 1613 | 2.3% |
용 | 1376 | 1.9% |
식 | 1352 | 1.9% |
Other values (234) | 31731 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 69959 | |
Open Punctuation | 719 | 1.0% |
Close Punctuation | 719 | 1.0% |
Decimal Number | 154 | 0.2% |
Connector Punctuation | 1 | < 0.1% |
Uppercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 11300 | 16.2% |
사 | 10285 | 14.7% |
능 | 6321 | 9.0% |
리 | 2039 | 2.9% |
전 | 1956 | 2.8% |
산 | 1922 | 2.7% |
조 | 1658 | 2.4% |
업 | 1613 | 2.3% |
용 | 1376 | 2.0% |
식 | 1352 | 1.9% |
Other values (228) | 30137 |
Decimal Number
Value | Count | Frequency (%) |
2 | 146 | |
1 | 8 | 5.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 719 |
Close Punctuation
Value | Count | Frequency (%) |
) | 719 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 69959 | |
Common | 1593 | 2.2% |
Latin | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 11300 | 16.2% |
사 | 10285 | 14.7% |
능 | 6321 | 9.0% |
리 | 2039 | 2.9% |
전 | 1956 | 2.8% |
산 | 1922 | 2.7% |
조 | 1658 | 2.4% |
업 | 1613 | 2.3% |
용 | 1376 | 2.0% |
식 | 1352 | 1.9% |
Other values (228) | 30137 |
Common
Value | Count | Frequency (%) |
( | 719 | |
) | 719 | |
2 | 146 | 9.2% |
1 | 8 | 0.5% |
_ | 1 | 0.1% |
Latin
Value | Count | Frequency (%) |
L | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 69959 | |
ASCII | 1594 | 2.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
기 | 11300 | 16.2% |
사 | 10285 | 14.7% |
능 | 6321 | 9.0% |
리 | 2039 | 2.9% |
전 | 1956 | 2.8% |
산 | 1922 | 2.7% |
조 | 1658 | 2.4% |
업 | 1613 | 2.3% |
용 | 1376 | 2.0% |
식 | 1352 | 1.9% |
Other values (228) | 30137 |
ASCII
Value | Count | Frequency (%) |
( | 719 | |
) | 719 | |
2 | 146 | 9.2% |
1 | 8 | 0.5% |
_ | 1 | 0.1% |
L | 1 | 0.1% |
취득 수
Real number (ℝ)
Distinct | 159 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 8.6512 |
Minimum | 1 |
---|---|
Maximum | 1125 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 7 |
95-th percentile | 37 |
Maximum | 1125 |
Range | 1124 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 24.031906 |
---|---|
Coefficient of variation (CV) | 2.7778696 |
Kurtosis | 591.07679 |
Mean | 8.6512 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 17.219656 |
Sum | 86512 |
Variance | 577.53249 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 3577 | |
2 | 1469 | |
3 | 939 | 9.4% |
4 | 615 | 6.2% |
5 | 421 | 4.2% |
6 | 345 | 3.5% |
7 | 261 | 2.6% |
8 | 243 | 2.4% |
9 | 197 | 2.0% |
10 | 156 | 1.6% |
Other values (149) | 1777 |
Value | Count | Frequency (%) |
1 | 3577 | |
2 | 1469 | |
3 | 939 | 9.4% |
4 | 615 | 6.2% |
5 | 421 | 4.2% |
6 | 345 | 3.5% |
7 | 261 | 2.6% |
8 | 243 | 2.4% |
9 | 197 | 2.0% |
10 | 156 | 1.6% |
Value | Count | Frequency (%) |
1125 | 1 | |
720 | 1 | |
474 | 1 | |
396 | 1 | |
389 | 1 | |
363 | 1 | |
307 | 1 | |
278 | 1 | |
265 | 1 | |
248 | 1 |
취득년도 | 취득월 | 지역명 | 연령대 | 성별 | 자격구분명 | 계열명 | 취득 수 | |
---|---|---|---|---|---|---|---|---|
취득년도 | 1.000 | 0.556 | 0.009 | 0.000 | 0.012 | 0.000 | 0.038 | 0.000 |
취득월 | 0.556 | 1.000 | 0.088 | 0.276 | 0.162 | 0.000 | 0.742 | 0.074 |
지역명 | 0.009 | 0.088 | 1.000 | 0.070 | 0.036 | 0.046 | 0.118 | 0.064 |
연령대 | 0.000 | 0.276 | 0.070 | 1.000 | 0.084 | 0.000 | 0.270 | 0.055 |
성별 | 0.012 | 0.162 | 0.036 | 0.084 | 1.000 | 0.000 | 0.083 | 0.004 |
자격구분명 | 0.000 | 0.000 | 0.046 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
계열명 | 0.038 | 0.742 | 0.118 | 0.270 | 0.083 | 1.000 | 1.000 | 0.000 |
취득 수 | 0.000 | 0.074 | 0.064 | 0.055 | 0.004 | 0.000 | 0.000 | 1.000 |
계열명 | 지역명 | 자격구분명 | 성별 | 취득년도 | 연령대 | |
---|---|---|---|---|---|---|
계열명 | 1.000 | 0.060 | 1.000 | 0.101 | 0.046 | 0.176 |
지역명 | 0.060 | 1.000 | 0.036 | 0.028 | 0.007 | 0.031 |
자격구분명 | 1.000 | 0.036 | 1.000 | 0.000 | 0.000 | 0.000 |
성별 | 0.101 | 0.028 | 0.000 | 1.000 | 0.008 | 0.090 |
취득년도 | 0.046 | 0.007 | 0.000 | 0.008 | 1.000 | 0.000 |
연령대 | 0.176 | 0.031 | 0.000 | 0.090 | 0.000 | 1.000 |
취득월 | 취득 수 | 취득년도 | 지역명 | 연령대 | 성별 | 자격구분명 | 계열명 | |
---|---|---|---|---|---|---|---|---|
취득월 | 1.000 | -0.006 | 0.429 | 0.034 | 0.143 | 0.124 | 0.000 | 0.400 |
취득 수 | -0.006 | 1.000 | 0.000 | 0.029 | 0.019 | 0.004 | 0.000 | 0.000 |
취득년도 | 0.429 | 0.000 | 1.000 | 0.007 | 0.000 | 0.008 | 0.000 | 0.046 |
지역명 | 0.034 | 0.029 | 0.007 | 1.000 | 0.031 | 0.028 | 0.036 | 0.060 |
연령대 | 0.143 | 0.019 | 0.000 | 0.031 | 1.000 | 0.090 | 0.000 | 0.176 |
성별 | 0.124 | 0.004 | 0.008 | 0.028 | 0.090 | 1.000 | 0.000 | 0.101 |
자격구분명 | 0.000 | 0.000 | 0.000 | 0.036 | 0.000 | 0.000 | 1.000 | 1.000 |
계열명 | 0.400 | 0.000 | 0.046 | 0.060 | 0.176 | 0.101 | 1.000 | 1.000 |
취득년도 | 취득월 | 지역명 | 연령대 | 성별 | 자격구분명 | 계열명 | 종목명 | 취득 수 | |
---|---|---|---|---|---|---|---|---|---|
13581 | 2014 | 5 | 경남 | 40대 | 남성 | 국가기술자격 | 기술사 | 건축시공기술사 | 1 |
57236 | 2015 | 3 | 20대 | 여성 | 국가기술자격 | 기능사 | 미용사(일반) | 1 | |
69759 | 2015 | 5 | 전남 | 20대 | 남성 | 국가기술자격 | 기사 | 폐기물처리산업기사 | 1 |
69610 | 2015 | 5 | 전남 | 10대 | 남성 | 국가기술자격 | 기능사 | 컴퓨터응용선반기능사 | 1 |
18562 | 2014 | 6 | 경북 | 10대 | 남성 | 국가기술자격 | 기능사 | 위험물기능사 | 2 |
66158 | 2015 | 5 | 충남 | 30대 | 남성 | 국가기술자격 | 기사 | 에너지관리기사 | 11 |
46611 | 2014 | 12 | 인천 | 10대 | 여성 | 국가기술자격 | 기능사 | 생산자동화기능사 | 1 |
79388 | 2015 | 7 | 경북 | 10대 | 여성 | 국가기술자격 | 기능사 | 전기기능사 | 6 |
54221 | 2014 | 12 | 세종 | 20대 | 남성 | 국가기술자격 | 기능사 | 승강기기능사 | 2 |
8533 | 2014 | 4 | 광주 | 30대 | 남성 | 국가기술자격 | 기능사 | 천공기운전기능사 | 1 |
취득년도 | 취득월 | 지역명 | 연령대 | 성별 | 자격구분명 | 계열명 | 종목명 | 취득 수 | |
---|---|---|---|---|---|---|---|---|---|
88388 | 2015 | 9 | 경기 | 30대 | 여성 | 국가기술자격 | 기능사 | 사진기능사 | 1 |
49920 | 2014 | 12 | 경북 | 50대 | 남성 | 국가기술자격 | 기능사 | 플라스틱창호기능사 | 1 |
25229 | 2014 | 7 | 10대 | 여성 | 국가기술자격 | 기능사 | 전자기기기능사 | 7 | |
83587 | 2015 | 8 | 충북 | 40대 | 남성 | 국가기술자격 | 기사 | 산업안전기사 | 6 |
81395 | 2015 | 8 | 서울 | 20대 | 남성 | 국가기술자격 | 기사 | 식품산업기사 | 6 |
31117 | 2014 | 8 | 전남 | 20대 | 여성 | 국가기술자격 | 기능사 | 전자출판기능사 | 1 |
92731 | 2015 | 9 | 10대 | 남성 | 국가기술자격 | 기능사 | 일식조리기능사 | 1 | |
53587 | 2014 | 12 | 전남 | 30대 | 남성 | 국가기술자격 | 기사 | 침투비파괴검사산업기사 | 1 |
84639 | 2015 | 8 | 경북 | 40대 | 여성 | 국가기술자격 | 기능사 | 양식조리기능사 | 9 |
83177 | 2015 | 8 | 강원 | 30대 | 남성 | 국가기술자격 | 기사 | 에너지관리기사 | 3 |