Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 898.4 KiB |
Average record size in memory | 92.0 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 7 |
Dataset
Description | 의사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15060455/fileData.do |
연도 is highly overall correlated with 회차 and 2 other fields | High correlation |
회차 is highly overall correlated with 연도 and 2 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 2 other fields | High correlation |
직종 is highly overall correlated with 연도 and 2 other fields | High correlation |
응시지역 is highly overall correlated with 학교소재지 | High correlation |
학교소재지 is highly overall correlated with 응시지역 | High correlation |
연령대 is highly imbalanced (58.6%) | Imbalance |
졸업여부 is highly imbalanced (64.3%) | Imbalance |
합격여부 is highly imbalanced (82.7%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 13:57:22.415796 |
---|---|
Analysis finished | 2023-12-12 13:57:24.839306 |
Duration | 2.42 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 23 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2011.8152 |
Minimum | 2001 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2001 |
---|---|
5-th percentile | 2002 |
Q1 | 2007 |
median | 2012 |
Q3 | 2016 |
95-th percentile | 2022 |
Maximum | 2023 |
Range | 22 |
Interquartile range (IQR) | 9 |
Descriptive statistics
Standard deviation | 5.9381794 |
---|---|
Coefficient of variation (CV) | 0.0029516525 |
Kurtosis | -0.82540647 |
Mean | 2011.8152 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 0.020265671 |
Sum | 20118152 |
Variance | 35.261975 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2012 | 698 | 7.0% |
2013 | 693 | 6.9% |
2010 | 673 | 6.7% |
2011 | 659 | 6.6% |
2014 | 657 | 6.6% |
2015 | 652 | 6.5% |
2004 | 405 | 4.0% |
2007 | 403 | 4.0% |
2005 | 396 | 4.0% |
2008 | 396 | 4.0% |
Other values (13) | 4368 |
Value | Count | Frequency (%) |
2001 | 331 | |
2002 | 355 | |
2003 | 359 | |
2004 | 405 | |
2005 | 396 | |
2006 | 337 | |
2007 | 403 | |
2008 | 396 | |
2009 | 383 | |
2010 | 673 |
Value | Count | Frequency (%) |
2023 | 325 | |
2022 | 335 | |
2021 | 282 | |
2020 | 318 | |
2019 | 358 | |
2018 | 308 | |
2017 | 329 | |
2016 | 348 | |
2015 | 652 | |
2014 | 657 |
직종
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
의사(필기) | |
---|---|
의사 | |
의사(실기) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 4.654 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 의사(필기) |
---|---|
2nd row | 의사(실기) |
3rd row | 의사 |
4th row | 의사(필기) |
5th row | 의사 |
Common Values
Value | Count | Frequency (%) |
의사(필기) | 4616 | |
의사 | 3365 | |
의사(실기) | 2019 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
의사(필기 | 4616 | |
의사 | 3365 | |
의사(실기 | 2019 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 23 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 75.8152 |
Minimum | 65 |
---|---|
Maximum | 87 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 65 |
---|---|
5-th percentile | 66 |
Q1 | 71 |
median | 76 |
Q3 | 80 |
95-th percentile | 86 |
Maximum | 87 |
Range | 22 |
Interquartile range (IQR) | 9 |
Descriptive statistics
Standard deviation | 5.9381794 |
---|---|
Coefficient of variation (CV) | 0.078324392 |
Kurtosis | -0.82540647 |
Mean | 75.8152 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 0.020265671 |
Sum | 758152 |
Variance | 35.261975 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
76 | 698 | 7.0% |
77 | 693 | 6.9% |
74 | 673 | 6.7% |
75 | 659 | 6.6% |
78 | 657 | 6.6% |
79 | 652 | 6.5% |
68 | 405 | 4.0% |
71 | 403 | 4.0% |
69 | 396 | 4.0% |
72 | 396 | 4.0% |
Other values (13) | 4368 |
Value | Count | Frequency (%) |
65 | 331 | |
66 | 355 | |
67 | 359 | |
68 | 405 | |
69 | 396 | |
70 | 337 | |
71 | 403 | |
72 | 396 | |
73 | 383 | |
74 | 673 |
Value | Count | Frequency (%) |
87 | 325 | |
86 | 335 | |
85 | 282 | |
84 | 318 | |
83 | 358 | |
82 | 308 | |
81 | 329 | |
80 | 348 | |
79 | 652 | |
78 | 657 |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 49894.037 |
Minimum | 10 |
---|---|
Maximum | 99986 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 10 |
---|---|
5-th percentile | 5107.35 |
Q1 | 25067 |
median | 49932.5 |
Q3 | 74630 |
95-th percentile | 94495.55 |
Maximum | 99986 |
Range | 99976 |
Interquartile range (IQR) | 49563 |
Descriptive statistics
Standard deviation | 28688.819 |
---|---|
Coefficient of variation (CV) | 0.57499496 |
Kurtosis | -1.1873194 |
Mean | 49894.037 |
Median Absolute Deviation (MAD) | 24775 |
Skewness | -0.00086459543 |
Sum | 4.9894037 × 108 |
Variance | 8.2304835 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
70122 | 1 | < 0.1% |
16951 | 1 | < 0.1% |
38419 | 1 | < 0.1% |
20717 | 1 | < 0.1% |
98659 | 1 | < 0.1% |
30380 | 1 | < 0.1% |
26253 | 1 | < 0.1% |
29840 | 1 | < 0.1% |
87556 | 1 | < 0.1% |
58549 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
10 | 1 | |
11 | 1 | |
14 | 1 | |
27 | 1 | |
28 | 1 | |
76 | 1 | |
78 | 1 | |
80 | 1 | |
85 | 1 | |
87 | 1 |
Value | Count | Frequency (%) |
99986 | 1 | |
99957 | 1 | |
99954 | 1 | |
99952 | 1 | |
99951 | 1 | |
99944 | 1 | |
99941 | 1 | |
99934 | 1 | |
99920 | 1 | |
99907 | 1 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
남 | |
---|---|
여 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 여 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
남 | 6611 | |
여 | 3389 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 6611 | |
여 | 3389 |
연령대
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
20 | |
---|---|
30 | |
40 | 128 |
50 | 27 |
60 | 7 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 20 |
---|---|
2nd row | 30 |
3rd row | 20 |
4th row | 20 |
5th row | 20 |
Common Values
Value | Count | Frequency (%) |
20 | 7189 | |
30 | 2649 | 26.5% |
40 | 128 | 1.3% |
50 | 27 | 0.3% |
60 | 7 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20 | 7189 | |
30 | 2649 | 26.5% |
40 | 128 | 1.3% |
50 | 27 | 0.3% |
60 | 7 | 0.1% |
응시지역
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
부산광역시 | |
대구광역시 | |
광주광역시 | |
대전광역시 | |
Other values (2) | 488 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.8541 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 6160 | |
부산광역시 | 1118 | 11.2% |
대구광역시 | 871 | 8.7% |
광주광역시 | 710 | 7.1% |
대전광역시 | 653 | 6.5% |
전주 | 483 | 4.8% |
제주도 | 5 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 6160 | |
부산광역시 | 1118 | 11.2% |
대구광역시 | 871 | 8.7% |
광주광역시 | 710 | 7.1% |
대전광역시 | 653 | 6.5% |
전주 | 483 | 4.8% |
제주도 | 5 | < 0.1% |
졸업여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
졸업예정 | |
---|---|
졸업 | 675 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.865 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업예정 |
---|---|
2nd row | 졸업예정 |
3rd row | 졸업예정 |
4th row | 졸업예정 |
5th row | 졸업예정 |
Common Values
Value | Count | Frequency (%) |
졸업예정 | 9325 | |
졸업 | 675 | 6.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업예정 | 9325 | |
졸업 | 675 | 6.8% |
합격여부
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
합격 | |
---|---|
불합격 | 520 |
결시 | 59 |
응시결격 | 49 |
면제포기 | 9 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0636 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 합격 |
3rd row | 합격 |
4th row | 합격 |
5th row | 응시결격 |
Common Values
Value | Count | Frequency (%) |
합격 | 9363 | |
불합격 | 520 | 5.2% |
결시 | 59 | 0.6% |
응시결격 | 49 | 0.5% |
면제포기 | 9 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 9363 | |
불합격 | 520 | 5.2% |
결시 | 59 | 0.6% |
응시결격 | 49 | 0.5% |
면제포기 | 9 | 0.1% |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 33 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
부산광역시 | |
광주광역시 | |
강원도 | |
대구광역시 | |
Other values (28) |
Length
Max length | 8 |
---|---|
Median length | 5 |
Mean length | 4.3969 |
Min length | 2 |
Unique
Unique | 7 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 대구광역시 |
3rd row | 강원도 |
4th row | 경상북도 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 3121 | |
부산광역시 | 844 | 8.4% |
광주광역시 | 809 | 8.1% |
강원도 | 764 | 7.6% |
대구광역시 | 644 | 6.4% |
전라북도 | 596 | 6.0% |
충청남도 | 509 | 5.1% |
대전광역시 | 471 | 4.7% |
경기도 | 467 | 4.7% |
경상남도 | 422 | 4.2% |
Other values (23) | 1353 |
Length
Value | Count | Frequency (%) |
서울특별시 | 3121 | |
부산광역시 | 844 | 8.4% |
광주광역시 | 809 | 8.1% |
강원도 | 764 | 7.6% |
대구광역시 | 644 | 6.4% |
전라북도 | 596 | 6.0% |
충청남도 | 509 | 5.1% |
대전광역시 | 471 | 4.7% |
경기도 | 467 | 4.7% |
경상남도 | 422 | 4.2% |
Other values (23) | 1353 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.863 | 1.000 | 0.984 | 0.087 | 0.218 | 0.211 | 0.097 | 0.165 | 0.223 |
직종 | 0.863 | 1.000 | 0.863 | 0.961 | 0.041 | 0.147 | 0.389 | 0.040 | 0.123 | 0.280 |
회차 | 1.000 | 0.863 | 1.000 | 0.985 | 0.098 | 0.224 | 0.216 | 0.092 | 0.183 | 0.225 |
일련번호 | 0.984 | 0.961 | 0.985 | 1.000 | 0.096 | 0.220 | 0.329 | 0.094 | 0.183 | 0.229 |
성별 | 0.087 | 0.041 | 0.098 | 0.096 | 1.000 | 0.034 | 0.026 | 0.154 | 0.089 | 0.164 |
연령대 | 0.218 | 0.147 | 0.224 | 0.220 | 0.034 | 1.000 | 0.016 | 0.302 | 0.444 | 0.516 |
응시지역 | 0.211 | 0.389 | 0.216 | 0.329 | 0.026 | 0.016 | 1.000 | 0.042 | 0.021 | 0.925 |
졸업여부 | 0.097 | 0.040 | 0.092 | 0.094 | 0.154 | 0.302 | 0.042 | 1.000 | 0.330 | 0.345 |
합격여부 | 0.165 | 0.123 | 0.183 | 0.183 | 0.089 | 0.444 | 0.021 | 0.330 | 1.000 | 0.203 |
학교소재지 | 0.223 | 0.280 | 0.225 | 0.229 | 0.164 | 0.516 | 0.925 | 0.345 | 0.203 | 1.000 |
연령대 | 성별 | 학교소재지 | 합격여부 | 직종 | 응시지역 | 졸업여부 | |
---|---|---|---|---|---|---|---|
연령대 | 1.000 | 0.041 | 0.274 | 0.179 | 0.111 | 0.010 | 0.369 |
성별 | 0.041 | 1.000 | 0.139 | 0.108 | 0.068 | 0.028 | 0.098 |
학교소재지 | 0.274 | 0.139 | 1.000 | 0.097 | 0.134 | 0.711 | 0.293 |
합격여부 | 0.179 | 0.108 | 0.097 | 1.000 | 0.092 | 0.013 | 0.403 |
직종 | 0.111 | 0.068 | 0.134 | 0.092 | 1.000 | 0.284 | 0.067 |
응시지역 | 0.010 | 0.028 | 0.711 | 0.013 | 0.284 | 1.000 | 0.045 |
졸업여부 | 0.369 | 0.098 | 0.293 | 0.403 | 0.067 | 0.045 | 1.000 |
연도 | 회차 | 일련번호 | 직종 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.755 | 0.789 | 0.075 | 0.095 | 0.111 | 0.070 | 0.077 | 0.081 |
회차 | 1.000 | 1.000 | 0.755 | 0.789 | 0.075 | 0.095 | 0.111 | 0.070 | 0.077 | 0.081 |
일련번호 | 0.755 | 0.755 | 1.000 | 0.961 | 0.073 | 0.093 | 0.173 | 0.072 | 0.077 | 0.083 |
직종 | 0.789 | 0.789 | 0.961 | 1.000 | 0.068 | 0.111 | 0.284 | 0.067 | 0.092 | 0.134 |
성별 | 0.075 | 0.075 | 0.073 | 0.068 | 1.000 | 0.041 | 0.028 | 0.098 | 0.108 | 0.139 |
연령대 | 0.095 | 0.095 | 0.093 | 0.111 | 0.041 | 1.000 | 0.010 | 0.369 | 0.179 | 0.274 |
응시지역 | 0.111 | 0.111 | 0.173 | 0.284 | 0.028 | 0.010 | 1.000 | 0.045 | 0.013 | 0.711 |
졸업여부 | 0.070 | 0.070 | 0.072 | 0.067 | 0.098 | 0.369 | 0.045 | 1.000 | 0.403 | 0.293 |
합격여부 | 0.077 | 0.077 | 0.077 | 0.092 | 0.108 | 0.179 | 0.013 | 0.403 | 1.000 | 0.097 |
학교소재지 | 0.081 | 0.081 | 0.083 | 0.134 | 0.139 | 0.274 | 0.711 | 0.293 | 0.097 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
70121 | 2021 | 의사(필기) | 85 | 70122 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
97806 | 2015 | 의사(실기) | 79 | 97807 | 여 | 30 | 서울특별시 | 졸업예정 | 합격 | 대구광역시 |
18878 | 2006 | 의사 | 70 | 18879 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 강원도 |
69876 | 2021 | 의사(필기) | 85 | 69877 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 경상북도 |
7680 | 2003 | 의사 | 67 | 7681 | 남 | 20 | 서울특별시 | 졸업예정 | 응시결격 | 강원도 |
87230 | 2012 | 의사(실기) | 76 | 87231 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 경상북도 |
76983 | 2023 | 의사(필기) | 87 | 76984 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
45569 | 2013 | 의사(필기) | 77 | 45570 | 남 | 20 | 부산광역시 | 졸업예정 | 합격 | 부산광역시 |
12268 | 2004 | 의사 | 68 | 12269 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
25534 | 2007 | 의사 | 71 | 25535 | 남 | 30 | 대전광역시 | 졸업예정 | 합격 | 충청북도 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
53510 | 2015 | 의사(필기) | 79 | 53511 | 남 | 20 | 전주 | 졸업예정 | 합격 | 전라북도 |
56912 | 2017 | 의사(필기) | 81 | 56913 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 강원도 |
66220 | 2019 | 의사(필기) | 83 | 66221 | 여 | 20 | 대전광역시 | 졸업예정 | 합격 | 대전광역시 |
44363 | 2013 | 의사(필기) | 77 | 44364 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
81377 | 2010 | 의사(실기) | 74 | 81378 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 대전광역시 |
90201 | 2013 | 의사(실기) | 77 | 90202 | 여 | 30 | 서울특별시 | 졸업예정 | 합격 | 경기도 |
81727 | 2010 | 의사(실기) | 74 | 81728 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 부산광역시 |
76811 | 2023 | 의사(필기) | 87 | 76812 | 여 | 30 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
15805 | 2005 | 의사 | 69 | 15806 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 강원도 |
57473 | 2017 | 의사(필기) | 81 | 57474 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |