Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 4043 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 331.8 KiB |
Average record size in memory | 84.0 B |
Variable types
Numeric | 4 |
---|---|
Categorical | 6 |
Dataset
Description | 의지보조기기사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15083489/fileData.do |
직종 has constant value "" | Constant |
연도 is highly overall correlated with 회차 and 1 other fields | High correlation |
회차 is highly overall correlated with 연도 and 1 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 1 other fields | High correlation |
응시지역 is highly imbalanced (99.0%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 18:15:54.520051 |
---|---|
Analysis finished | 2023-12-12 18:15:57.553546 |
Duration | 3.03 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2008.6973 |
Minimum | 2000 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 35.7 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2000 |
Q1 | 2000 |
median | 2009 |
Q3 | 2015 |
95-th percentile | 2021 |
Maximum | 2022 |
Range | 22 |
Interquartile range (IQR) | 15 |
Descriptive statistics
Standard deviation | 7.5158984 |
---|---|
Coefficient of variation (CV) | 0.003741678 |
Kurtosis | -1.3138833 |
Mean | 2008.6973 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0.25210249 |
Sum | 8121163 |
Variance | 56.488728 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
2000 | 1022 | |
2013 | 258 | 6.4% |
2001 | 255 | 6.3% |
2002 | 206 | 5.1% |
2009 | 189 | 4.7% |
2011 | 170 | 4.2% |
2022 | 165 | 4.1% |
2010 | 162 | 4.0% |
2020 | 149 | 3.7% |
2021 | 145 | 3.6% |
Other values (12) | 1322 |
Value | Count | Frequency (%) |
2000 | 1022 | |
2001 | 255 | 6.3% |
2002 | 206 | 5.1% |
2004 | 55 | 1.4% |
2005 | 75 | 1.9% |
2006 | 107 | 2.6% |
2007 | 129 | 3.2% |
2008 | 130 | 3.2% |
2009 | 189 | 4.7% |
2010 | 162 | 4.0% |
Value | Count | Frequency (%) |
2022 | 165 | |
2021 | 145 | |
2020 | 149 | |
2019 | 127 | |
2018 | 129 | |
2017 | 113 | |
2016 | 113 | |
2015 | 116 | |
2014 | 88 | 2.2% |
2013 | 258 |
직종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.7 KiB |
의지·보조기기사 |
---|
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 8 |
Min length | 8 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 의지·보조기기사 |
---|---|
2nd row | 의지·보조기기사 |
3rd row | 의지·보조기기사 |
4th row | 의지·보조기기사 |
5th row | 의지·보조기기사 |
Common Values
Value | Count | Frequency (%) |
의지·보조기기사 | 4043 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
의지·보조기기사 | 4043 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 23 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9.3771952 |
Minimum | 1 |
---|---|
Maximum | 23 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 35.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 9 |
Q3 | 16 |
95-th percentile | 22 |
Maximum | 23 |
Range | 22 |
Interquartile range (IQR) | 15 |
Descriptive statistics
Standard deviation | 7.51136 |
---|---|
Coefficient of variation (CV) | 0.80102417 |
Kurtosis | -1.256271 |
Mean | 9.3771952 |
Median Absolute Deviation (MAD) | 7 |
Skewness | 0.36552678 |
Sum | 37912 |
Variance | 56.420529 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1022 | |
2 | 255 | 6.3% |
3 | 206 | 5.1% |
9 | 189 | 4.7% |
11 | 170 | 4.2% |
23 | 165 | 4.1% |
10 | 162 | 4.0% |
21 | 149 | 3.7% |
22 | 145 | 3.6% |
12 | 140 | 3.5% |
Other values (13) | 1440 |
Value | Count | Frequency (%) |
1 | 1022 | |
2 | 255 | 6.3% |
3 | 206 | 5.1% |
4 | 55 | 1.4% |
5 | 75 | 1.9% |
6 | 107 | 2.6% |
7 | 129 | 3.2% |
8 | 130 | 3.2% |
9 | 189 | 4.7% |
10 | 162 | 4.0% |
Value | Count | Frequency (%) |
23 | 165 | |
22 | 145 | |
21 | 149 | |
20 | 127 | |
19 | 129 | |
18 | 113 | |
17 | 113 | |
16 | 116 | |
15 | 88 | |
14 | 121 |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 4043 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2022 |
Minimum | 1 |
---|---|
Maximum | 4043 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 35.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 203.1 |
Q1 | 1011.5 |
median | 2022 |
Q3 | 3032.5 |
95-th percentile | 3840.9 |
Maximum | 4043 |
Range | 4042 |
Interquartile range (IQR) | 2021 |
Descriptive statistics
Standard deviation | 1167.2579 |
---|---|
Coefficient of variation (CV) | 0.57727888 |
Kurtosis | -1.2 |
Mean | 2022 |
Median Absolute Deviation (MAD) | 1011 |
Skewness | 0 |
Sum | 8174946 |
Variance | 1362491 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
2807 | 1 | < 0.1% |
2666 | 1 | < 0.1% |
2801 | 1 | < 0.1% |
2802 | 1 | < 0.1% |
2667 | 1 | < 0.1% |
2668 | 1 | < 0.1% |
2803 | 1 | < 0.1% |
2669 | 1 | < 0.1% |
2670 | 1 | < 0.1% |
Other values (4033) | 4033 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
4043 | 1 | |
4042 | 1 | |
4041 | 1 | |
4040 | 1 | |
4039 | 1 | |
4038 | 1 | |
4037 | 1 | |
4036 | 1 | |
4035 | 1 | |
4034 | 1 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.7 KiB |
남 | |
---|---|
여 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 남 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
남 | 2599 | |
여 | 1444 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 2599 | |
여 | 1444 |
연령대
Real number (ℝ)
Distinct | 7 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 23.673015 |
Minimum | 10 |
---|---|
Maximum | 70 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 35.7 KiB |
Quantile statistics
Minimum | 10 |
---|---|
5-th percentile | 20 |
Q1 | 20 |
median | 20 |
Q3 | 30 |
95-th percentile | 40 |
Maximum | 70 |
Range | 60 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 7.3868795 |
---|---|
Coefficient of variation (CV) | 0.31203797 |
Kurtosis | 5.4815615 |
Mean | 23.673015 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 2.2809603 |
Sum | 95710 |
Variance | 54.565989 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20 | 3026 | |
30 | 663 | 16.4% |
40 | 250 | 6.2% |
50 | 75 | 1.9% |
60 | 24 | 0.6% |
10 | 4 | 0.1% |
70 | 1 | < 0.1% |
Value | Count | Frequency (%) |
10 | 4 | 0.1% |
20 | 3026 | |
30 | 663 | 16.4% |
40 | 250 | 6.2% |
50 | 75 | 1.9% |
60 | 24 | 0.6% |
70 | 1 | < 0.1% |
Value | Count | Frequency (%) |
70 | 1 | < 0.1% |
60 | 24 | 0.6% |
50 | 75 | 1.9% |
40 | 250 | 6.2% |
30 | 663 | 16.4% |
20 | 3026 | |
10 | 4 | 0.1% |
응시지역
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.7 KiB |
서울특별시 | |
---|---|
대구광역시 | 3 |
광주광역시 | 3 |
부산광역시 | 1 |
대전광역시 | 1 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 4035 | |
대구광역시 | 3 | 0.1% |
광주광역시 | 3 | 0.1% |
부산광역시 | 1 | < 0.1% |
대전광역시 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 4035 | |
대구광역시 | 3 | 0.1% |
광주광역시 | 3 | 0.1% |
부산광역시 | 1 | < 0.1% |
대전광역시 | 1 | < 0.1% |
졸업여부
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.7 KiB |
졸업예정 | |
---|---|
졸업 | |
200 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.1387583 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업 |
---|---|
2nd row | 졸업 |
3rd row | 졸업 |
4th row | 졸업 |
5th row | 졸업 |
Common Values
Value | Count | Frequency (%) |
졸업예정 | 2402 | |
졸업 | 1441 | |
200 | 4.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업예정 | 2402 | |
졸업 | 1441 |
합격여부
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.7 KiB |
불합격 | |
---|---|
합격 | |
결시 | |
응시결격 | 5 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.5152115 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 합격 |
3rd row | 합격 |
4th row | 합격 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
불합격 | 2073 | |
합격 | 1665 | |
결시 | 300 | 7.4% |
응시결격 | 5 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
불합격 | 2073 | |
합격 | 1665 | |
결시 | 300 | 7.4% |
응시결격 | 5 | 0.1% |
학교소재지
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.7 KiB |
충청남도 | |
---|---|
경기도 | |
경상북도 | |
기타 | |
전라남도 | |
Other values (12) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.5560228 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기타 |
---|---|
2nd row | 기타 |
3rd row | 기타 |
4th row | 기타 |
5th row | 기타 |
Common Values
Value | Count | Frequency (%) |
충청남도 | 1119 | |
경기도 | 764 | |
경상북도 | 643 | |
기타 | 569 | |
전라남도 | 309 | 7.6% |
충청북도 | 241 | 6.0% |
강원도 | 98 | 2.4% |
서울특별시 | 87 | 2.2% |
광주광역시 | 64 | 1.6% |
전라북도 | 41 | 1.0% |
Other values (7) | 108 | 2.7% |
Length
Value | Count | Frequency (%) |
충청남도 | 1119 | |
경기도 | 764 | |
경상북도 | 643 | |
기타 | 569 | |
전라남도 | 309 | 7.6% |
충청북도 | 241 | 6.0% |
강원도 | 98 | 2.4% |
서울특별시 | 87 | 2.2% |
광주광역시 | 64 | 1.6% |
전라북도 | 41 | 1.0% |
Other values (7) | 108 | 2.7% |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.997 | 0.938 | 0.268 | 0.373 | NaN | 0.551 | 0.203 | 0.672 |
회차 | 0.997 | 1.000 | 0.976 | 0.162 | 0.312 | 0.000 | 0.475 | 0.192 | 0.620 |
일련번호 | 0.938 | 0.976 | 1.000 | 0.228 | 0.363 | 0.090 | 0.515 | 0.289 | 0.681 |
성별 | 0.268 | 0.162 | 0.228 | 1.000 | 0.290 | 0.002 | 0.118 | 0.177 | 0.340 |
연령대 | 0.373 | 0.312 | 0.363 | 0.290 | 1.000 | 0.000 | 0.490 | 0.166 | 0.501 |
응시지역 | NaN | 0.000 | 0.090 | 0.002 | 0.000 | 1.000 | 0.000 | 0.033 | 0.268 |
졸업여부 | 0.551 | 0.475 | 0.515 | 0.118 | 0.490 | 0.000 | 1.000 | 0.134 | 0.624 |
합격여부 | 0.203 | 0.192 | 0.289 | 0.177 | 0.166 | 0.033 | 0.134 | 1.000 | 0.445 |
학교소재지 | 0.672 | 0.620 | 0.681 | 0.340 | 0.501 | 0.268 | 0.624 | 0.445 | 1.000 |
성별 | 합격여부 | 학교소재지 | 응시지역 | 졸업여부 | |
---|---|---|---|---|---|
성별 | 1.000 | 0.117 | 0.304 | 0.003 | 0.195 |
합격여부 | 0.117 | 1.000 | 0.262 | 0.027 | 0.127 |
학교소재지 | 0.304 | 0.262 | 1.000 | 0.141 | 0.424 |
응시지역 | 0.003 | 0.027 | 0.141 | 1.000 | 0.000 |
졸업여부 | 0.195 | 0.127 | 0.424 | 0.000 | 1.000 |
연도 | 회차 | 일련번호 | 연령대 | 성별 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.991 | -0.339 | 0.121 | 0.000 | 0.325 | 0.123 | 0.296 |
회차 | 1.000 | 1.000 | 0.991 | -0.339 | 0.123 | 0.000 | 0.325 | 0.118 | 0.295 |
일련번호 | 0.991 | 0.991 | 1.000 | -0.375 | 0.175 | 0.037 | 0.360 | 0.176 | 0.345 |
연령대 | -0.339 | -0.339 | -0.375 | 1.000 | 0.310 | 0.000 | 0.377 | 0.115 | 0.252 |
성별 | 0.121 | 0.123 | 0.175 | 0.310 | 1.000 | 0.003 | 0.195 | 0.117 | 0.304 |
응시지역 | 0.000 | 0.000 | 0.037 | 0.000 | 0.003 | 1.000 | 0.000 | 0.027 | 0.141 |
졸업여부 | 0.325 | 0.325 | 0.360 | 0.377 | 0.195 | 0.000 | 1.000 | 0.127 | 0.424 |
합격여부 | 0.123 | 0.118 | 0.176 | 0.115 | 0.117 | 0.027 | 0.127 | 1.000 | 0.262 |
학교소재지 | 0.296 | 0.295 | 0.345 | 0.252 | 0.304 | 0.141 | 0.424 | 0.262 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 2000 | 의지·보조기기사 | 1 | 1 | 남 | 40 | 서울특별시 | 졸업 | 합격 | 기타 |
1 | 2000 | 의지·보조기기사 | 1 | 2 | 남 | 60 | 서울특별시 | 졸업 | 합격 | 기타 |
2 | 2000 | 의지·보조기기사 | 1 | 3 | 남 | 40 | 서울특별시 | 졸업 | 합격 | 기타 |
3 | 2000 | 의지·보조기기사 | 1 | 4 | 남 | 40 | 서울특별시 | 졸업 | 합격 | 기타 |
4 | 2000 | 의지·보조기기사 | 1 | 5 | 남 | 30 | 서울특별시 | 졸업 | 합격 | 기타 |
5 | 2000 | 의지·보조기기사 | 1 | 6 | 남 | 30 | 서울특별시 | 졸업 | 합격 | 기타 |
6 | 2000 | 의지·보조기기사 | 1 | 7 | 남 | 40 | 서울특별시 | 졸업 | 합격 | 기타 |
7 | 2000 | 의지·보조기기사 | 1 | 8 | 남 | 50 | 서울특별시 | 졸업 | 합격 | 기타 |
8 | 2000 | 의지·보조기기사 | 1 | 9 | 남 | 30 | 서울특별시 | 졸업 | 합격 | 기타 |
9 | 2000 | 의지·보조기기사 | 1 | 10 | 남 | 30 | 서울특별시 | 졸업 | 합격 | 기타 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
4033 | 2022 | 의지·보조기기사 | 23 | 4034 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 경기도 |
4034 | 2022 | 의지·보조기기사 | 23 | 4035 | 여 | 20 | 서울특별시 | 졸업 | 불합격 | 충청남도 |
4035 | 2022 | 의지·보조기기사 | 23 | 4036 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 경기도 |
4036 | 2022 | 의지·보조기기사 | 23 | 4037 | 남 | 20 | 서울특별시 | 졸업예정 | 불합격 | 충청북도 |
4037 | 2022 | 의지·보조기기사 | 23 | 4038 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 충청남도 |
4038 | 2022 | 의지·보조기기사 | 23 | 4039 | 남 | 20 | 서울특별시 | 졸업예정 | 불합격 | 경기도 |
4039 | 2022 | 의지·보조기기사 | 23 | 4040 | 남 | 20 | 서울특별시 | 졸업예정 | 결시 | 충청남도 |
4040 | 2022 | 의지·보조기기사 | 23 | 4041 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 경기도 |
4041 | 2022 | 의지·보조기기사 | 23 | 4042 | 남 | 20 | 서울특별시 | 졸업 | 불합격 | 전라남도 |
4042 | 2022 | 의지·보조기기사 | 23 | 4043 | 여 | 20 | 서울특별시 | 졸업예정 | 불합격 | 충청남도 |