Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 898.4 KiB |
Average record size in memory | 92.0 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 7 |
Dataset
Description | 한의사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15060457/fileData.do |
직종 has constant value "" | Constant |
연도 is highly overall correlated with 회차 and 1 other fields | High correlation |
회차 is highly overall correlated with 연도 and 1 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 1 other fields | High correlation |
응시지역 is highly overall correlated with 학교소재지 | High correlation |
졸업여부 is highly overall correlated with 합격여부 | High correlation |
합격여부 is highly overall correlated with 졸업여부 | High correlation |
학교소재지 is highly overall correlated with 응시지역 | High correlation |
졸업여부 is highly imbalanced (62.3%) | Imbalance |
합격여부 is highly imbalanced (80.2%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 04:32:45.078907 |
---|---|
Analysis finished | 2023-12-12 04:32:47.618685 |
Duration | 2.54 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2011.1601 |
Minimum | 2000 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2001 |
Q1 | 2005 |
median | 2011 |
Q3 | 2017 |
95-th percentile | 2022 |
Maximum | 2023 |
Range | 23 |
Interquartile range (IQR) | 12 |
Descriptive statistics
Standard deviation | 6.7830722 |
---|---|
Coefficient of variation (CV) | 0.0033727162 |
Kurtosis | -1.1685061 |
Mean | 2011.1601 |
Median Absolute Deviation (MAD) | 6 |
Skewness | 0.099448615 |
Sum | 20111601 |
Variance | 46.010069 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2003 | 556 | 5.6% |
2009 | 480 | 4.8% |
2005 | 468 | 4.7% |
2007 | 458 | 4.6% |
2008 | 456 | 4.6% |
2002 | 451 | 4.5% |
2013 | 441 | 4.4% |
2004 | 436 | 4.4% |
2006 | 436 | 4.4% |
2010 | 432 | 4.3% |
Other values (14) | 5386 |
Value | Count | Frequency (%) |
2000 | 372 | |
2001 | 322 | |
2002 | 451 | |
2003 | 556 | |
2004 | 436 | |
2005 | 468 | |
2006 | 436 | |
2007 | 458 | |
2008 | 456 | |
2009 | 480 |
Value | Count | Frequency (%) |
2023 | 388 | |
2022 | 360 | |
2021 | 391 | |
2020 | 372 | |
2019 | 368 | |
2018 | 404 | |
2017 | 406 | |
2016 | 359 | |
2015 | 416 | |
2014 | 406 |
직종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
한의사 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 한의사 |
---|---|
2nd row | 한의사 |
3rd row | 한의사 |
4th row | 한의사 |
5th row | 한의사 |
Common Values
Value | Count | Frequency (%) |
한의사 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
한의사 | 10000 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 66.1601 |
Minimum | 55 |
---|---|
Maximum | 78 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 55 |
---|---|
5-th percentile | 56 |
Q1 | 60 |
median | 66 |
Q3 | 72 |
95-th percentile | 77 |
Maximum | 78 |
Range | 23 |
Interquartile range (IQR) | 12 |
Descriptive statistics
Standard deviation | 6.7830722 |
---|---|
Coefficient of variation (CV) | 0.10252512 |
Kurtosis | -1.1685061 |
Mean | 66.1601 |
Median Absolute Deviation (MAD) | 6 |
Skewness | 0.099448615 |
Sum | 661601 |
Variance | 46.010069 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
58 | 556 | 5.6% |
64 | 480 | 4.8% |
60 | 468 | 4.7% |
62 | 458 | 4.6% |
63 | 456 | 4.6% |
57 | 451 | 4.5% |
68 | 441 | 4.4% |
59 | 436 | 4.4% |
61 | 436 | 4.4% |
65 | 432 | 4.3% |
Other values (14) | 5386 |
Value | Count | Frequency (%) |
55 | 372 | |
56 | 322 | |
57 | 451 | |
58 | 556 | |
59 | 436 | |
60 | 468 | |
61 | 436 | |
62 | 458 | |
63 | 456 | |
64 | 480 |
Value | Count | Frequency (%) |
78 | 388 | |
77 | 360 | |
76 | 391 | |
75 | 372 | |
74 | 368 | |
73 | 404 | |
72 | 406 | |
71 | 359 | |
70 | 416 | |
69 | 406 |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10365.039 |
Minimum | 1 |
---|---|
Maximum | 20713 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1096.9 |
Q1 | 5177.75 |
median | 10318.5 |
Q3 | 15557.25 |
95-th percentile | 19636.15 |
Maximum | 20713 |
Range | 20712 |
Interquartile range (IQR) | 10379.5 |
Descriptive statistics
Standard deviation | 5958.2481 |
---|---|
Coefficient of variation (CV) | 0.57484087 |
Kurtosis | -1.2022473 |
Mean | 10365.039 |
Median Absolute Deviation (MAD) | 5192 |
Skewness | 0.0050898889 |
Sum | 1.0365039 × 108 |
Variance | 35500720 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
5375 | 1 | < 0.1% |
977 | 1 | < 0.1% |
10305 | 1 | < 0.1% |
10489 | 1 | < 0.1% |
4792 | 1 | < 0.1% |
10610 | 1 | < 0.1% |
8611 | 1 | < 0.1% |
1785 | 1 | < 0.1% |
13169 | 1 | < 0.1% |
3291 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
1 | 1 | |
3 | 1 | |
6 | 1 | |
8 | 1 | |
9 | 1 | |
12 | 1 | |
15 | 1 | |
19 | 1 | |
22 | 1 | |
23 | 1 |
Value | Count | Frequency (%) |
20713 | 1 | |
20712 | 1 | |
20711 | 1 | |
20708 | 1 | |
20706 | 1 | |
20705 | 1 | |
20704 | 1 | |
20702 | 1 | |
20698 | 1 | |
20697 | 1 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
남 | |
---|---|
여 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 남 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
남 | 7162 | |
여 | 2838 | 28.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 7162 | |
여 | 2838 | 28.4% |
연령대
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
20 | |
---|---|
30 | |
40 | 513 |
50 | 56 |
60 | 14 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 20 |
---|---|
2nd row | 30 |
3rd row | 20 |
4th row | 20 |
5th row | 20 |
Common Values
Value | Count | Frequency (%) |
20 | 6761 | |
30 | 2656 | 26.6% |
40 | 513 | 5.1% |
50 | 56 | 0.6% |
60 | 14 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20 | 6761 | |
30 | 2656 | 26.6% |
40 | 513 | 5.1% |
50 | 56 | 0.6% |
60 | 14 | 0.1% |
응시지역
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
전주 | 599 |
대구광역시 | 560 |
원주 | 499 |
부산광역시 | 460 |
Other values (2) | 641 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.6706 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 부산광역시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 7241 | |
전주 | 599 | 6.0% |
대구광역시 | 560 | 5.6% |
원주 | 499 | 5.0% |
부산광역시 | 460 | 4.6% |
대전광역시 | 389 | 3.9% |
광주광역시 | 252 | 2.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 7241 | |
전주 | 599 | 6.0% |
대구광역시 | 560 | 5.6% |
원주 | 499 | 5.0% |
부산광역시 | 460 | 4.6% |
대전광역시 | 389 | 3.9% |
광주광역시 | 252 | 2.5% |
졸업여부
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
졸업예정 | |
---|---|
졸업 | 730 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.854 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업예정 |
---|---|
2nd row | 졸업예정 |
3rd row | 졸업예정 |
4th row | 졸업예정 |
5th row | 졸업예정 |
Common Values
Value | Count | Frequency (%) |
졸업예정 | 9270 | |
졸업 | 730 | 7.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업예정 | 9270 | |
졸업 | 730 | 7.3% |
합격여부
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
합격 | |
---|---|
불합격 | 581 |
결시 | 91 |
응시결격 | 1 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0583 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 합격 |
---|---|
2nd row | 합격 |
3rd row | 합격 |
4th row | 합격 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 9327 | |
불합격 | 581 | 5.8% |
결시 | 91 | 0.9% |
응시결격 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 9327 | |
불합격 | 581 | 5.8% |
결시 | 91 | 0.9% |
응시결격 | 1 | < 0.1% |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
전라북도 | |
경상북도 | |
대전광역시 | |
부산광역시 | |
Other values (6) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.3432 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전라북도 |
---|---|
2nd row | 전라북도 |
3rd row | 서울특별시 |
4th row | 전라남도 |
5th row | 부산광역시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 2520 | |
전라북도 | 1695 | |
경상북도 | 1398 | |
대전광역시 | 1044 | |
부산광역시 | 836 | 8.4% |
강원도 | 812 | 8.1% |
전라남도 | 625 | 6.2% |
충청북도 | 574 | 5.7% |
경기도 | 320 | 3.2% |
대구광역시 | 172 | 1.7% |
Length
Value | Count | Frequency (%) |
서울특별시 | 2520 | |
전라북도 | 1695 | |
경상북도 | 1398 | |
대전광역시 | 1044 | |
부산광역시 | 836 | 8.4% |
강원도 | 812 | 8.1% |
전라남도 | 625 | 6.2% |
충청북도 | 574 | 5.7% |
경기도 | 320 | 3.2% |
대구광역시 | 172 | 1.7% |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.991 | 0.193 | 0.181 | 0.547 | 0.124 | 0.095 | 0.303 |
회차 | 1.000 | 1.000 | 0.991 | 0.202 | 0.179 | 0.549 | 0.123 | 0.097 | 0.304 |
일련번호 | 0.991 | 0.991 | 1.000 | 0.204 | 0.192 | 0.544 | 0.117 | 0.103 | 0.326 |
성별 | 0.193 | 0.202 | 0.204 | 1.000 | 0.093 | 0.092 | 0.144 | 0.143 | 0.072 |
연령대 | 0.181 | 0.179 | 0.192 | 0.093 | 1.000 | 0.129 | 0.195 | 0.153 | 0.121 |
응시지역 | 0.547 | 0.549 | 0.544 | 0.092 | 0.129 | 1.000 | 0.071 | 0.046 | 0.820 |
졸업여부 | 0.124 | 0.123 | 0.117 | 0.144 | 0.195 | 0.071 | 1.000 | 0.714 | 0.108 |
합격여부 | 0.095 | 0.097 | 0.103 | 0.143 | 0.153 | 0.046 | 0.714 | 1.000 | 0.099 |
학교소재지 | 0.303 | 0.304 | 0.326 | 0.072 | 0.121 | 0.820 | 0.108 | 0.099 | 1.000 |
응시지역 | 성별 | 합격여부 | 학교소재지 | 졸업여부 | 연령대 | |
---|---|---|---|---|---|---|
응시지역 | 1.000 | 0.098 | 0.032 | 0.594 | 0.076 | 0.082 |
성별 | 0.098 | 1.000 | 0.095 | 0.069 | 0.092 | 0.114 |
합격여부 | 0.032 | 0.095 | 1.000 | 0.060 | 0.509 | 0.125 |
학교소재지 | 0.594 | 0.069 | 0.060 | 1.000 | 0.103 | 0.066 |
졸업여부 | 0.076 | 0.092 | 0.509 | 0.103 | 1.000 | 0.239 |
연령대 | 0.082 | 0.114 | 0.125 | 0.066 | 0.239 | 1.000 |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.999 | 0.155 | 0.075 | 0.317 | 0.094 | 0.058 | 0.134 |
회차 | 1.000 | 1.000 | 0.999 | 0.155 | 0.075 | 0.317 | 0.094 | 0.058 | 0.134 |
일련번호 | 0.999 | 0.999 | 1.000 | 0.157 | 0.081 | 0.314 | 0.090 | 0.062 | 0.145 |
성별 | 0.155 | 0.155 | 0.157 | 1.000 | 0.114 | 0.098 | 0.092 | 0.095 | 0.069 |
연령대 | 0.075 | 0.075 | 0.081 | 0.114 | 1.000 | 0.082 | 0.239 | 0.125 | 0.066 |
응시지역 | 0.317 | 0.317 | 0.314 | 0.098 | 0.082 | 1.000 | 0.076 | 0.032 | 0.594 |
졸업여부 | 0.094 | 0.094 | 0.090 | 0.092 | 0.239 | 0.076 | 1.000 | 0.509 | 0.103 |
합격여부 | 0.058 | 0.058 | 0.062 | 0.095 | 0.125 | 0.032 | 0.509 | 1.000 | 0.060 |
학교소재지 | 0.134 | 0.134 | 0.145 | 0.069 | 0.066 | 0.594 | 0.103 | 0.060 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
5374 | 2005 | 한의사 | 60 | 5375 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 전라북도 |
3615 | 2004 | 한의사 | 59 | 3616 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 전라북도 |
9764 | 2010 | 한의사 | 65 | 9765 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
5679 | 2006 | 한의사 | 61 | 5680 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 전라남도 |
13822 | 2015 | 한의사 | 70 | 13823 | 남 | 20 | 부산광역시 | 졸업예정 | 합격 | 부산광역시 |
8934 | 2009 | 한의사 | 64 | 8935 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 전라북도 |
5144 | 2005 | 한의사 | 60 | 5145 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 전라북도 |
18156 | 2020 | 한의사 | 75 | 18157 | 여 | 20 | 전주 | 졸업예정 | 합격 | 전라북도 |
2899 | 2003 | 한의사 | 58 | 2900 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 충청북도 |
15932 | 2017 | 한의사 | 72 | 15933 | 여 | 40 | 원주 | 졸업예정 | 합격 | 충청북도 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
2882 | 2003 | 한의사 | 58 | 2883 | 남 | 40 | 서울특별시 | 졸업예정 | 합격 | 충청북도 |
18391 | 2021 | 한의사 | 76 | 18392 | 여 | 40 | 서울특별시 | 졸업 | 불합격 | 서울특별시 |
204 | 2000 | 한의사 | 55 | 205 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 전라남도 |
13780 | 2015 | 한의사 | 70 | 13781 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
3273 | 2003 | 한의사 | 58 | 3274 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 강원도 |
17716 | 2020 | 한의사 | 75 | 17717 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
7870 | 2008 | 한의사 | 63 | 7871 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
3919 | 2004 | 한의사 | 59 | 3920 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 강원도 |
19361 | 2022 | 한의사 | 77 | 19362 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 경기도 |
10782 | 2011 | 한의사 | 66 | 10783 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 전라북도 |