Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 898.4 KiB |
Average record size in memory | 92.0 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 7 |
Dataset
Description | 치과의사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15060456/fileData.do |
연도 is highly overall correlated with 회차 and 2 other fields | High correlation |
회차 is highly overall correlated with 연도 and 2 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 2 other fields | High correlation |
직종 is highly overall correlated with 연도 and 2 other fields | High correlation |
졸업여부 is highly overall correlated with 학교소재지 | High correlation |
학교소재지 is highly overall correlated with 졸업여부 | High correlation |
직종 is highly imbalanced (55.2%) | Imbalance |
응시지역 is highly imbalanced (57.5%) | Imbalance |
졸업여부 is highly imbalanced (64.3%) | Imbalance |
합격여부 is highly imbalanced (72.2%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 04:54:24.760893 |
---|---|
Analysis finished | 2023-12-12 04:54:27.265713 |
Duration | 2.5 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2011.5051 |
Minimum | 2000 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2001 |
Q1 | 2005 |
median | 2011 |
Q3 | 2018 |
95-th percentile | 2023 |
Maximum | 2023 |
Range | 23 |
Interquartile range (IQR) | 13 |
Descriptive statistics
Standard deviation | 7.4081889 |
---|---|
Coefficient of variation (CV) | 0.0036829083 |
Kurtosis | -1.3214149 |
Mean | 2011.5051 |
Median Absolute Deviation (MAD) | 7 |
Skewness | 0.062865916 |
Sum | 20115051 |
Variance | 54.881262 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2023 | 694 | 6.9% |
2022 | 666 | 6.7% |
2001 | 495 | 5.0% |
2005 | 492 | 4.9% |
2000 | 481 | 4.8% |
2003 | 476 | 4.8% |
2004 | 460 | 4.6% |
2002 | 442 | 4.4% |
2007 | 420 | 4.2% |
2008 | 394 | 3.9% |
Other values (14) | 4980 |
Value | Count | Frequency (%) |
2000 | 481 | |
2001 | 495 | |
2002 | 442 | |
2003 | 476 | |
2004 | 460 | |
2005 | 492 | |
2006 | 381 | |
2007 | 420 | |
2008 | 394 | |
2009 | 336 |
Value | Count | Frequency (%) |
2023 | 694 | |
2022 | 666 | |
2021 | 330 | |
2020 | 346 | |
2019 | 385 | |
2018 | 349 | |
2017 | 363 | |
2016 | 357 | |
2015 | 328 | |
2014 | 358 |
직종
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
치과의사 | |
---|---|
치과의사(필기) | 701 |
치과의사(실기) | 659 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.544 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 치과의사 |
---|---|
2nd row | 치과의사 |
3rd row | 치과의사 |
4th row | 치과의사(실기) |
5th row | 치과의사 |
Common Values
Value | Count | Frequency (%) |
치과의사 | 8640 | |
치과의사(필기) | 701 | 7.0% |
치과의사(실기) | 659 | 6.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
치과의사 | 8640 | |
치과의사(필기 | 701 | 7.0% |
치과의사(실기 | 659 | 6.6% |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 63.5051 |
Minimum | 52 |
---|---|
Maximum | 75 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 52 |
---|---|
5-th percentile | 53 |
Q1 | 57 |
median | 63 |
Q3 | 70 |
95-th percentile | 75 |
Maximum | 75 |
Range | 23 |
Interquartile range (IQR) | 13 |
Descriptive statistics
Standard deviation | 7.4081889 |
---|---|
Coefficient of variation (CV) | 0.11665502 |
Kurtosis | -1.3214149 |
Mean | 63.5051 |
Median Absolute Deviation (MAD) | 7 |
Skewness | 0.062865916 |
Sum | 635051 |
Variance | 54.881262 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
75 | 694 | 6.9% |
74 | 666 | 6.7% |
53 | 495 | 5.0% |
57 | 492 | 4.9% |
52 | 481 | 4.8% |
55 | 476 | 4.8% |
56 | 460 | 4.6% |
54 | 442 | 4.4% |
59 | 420 | 4.2% |
60 | 394 | 3.9% |
Other values (14) | 4980 |
Value | Count | Frequency (%) |
52 | 481 | |
53 | 495 | |
54 | 442 | |
55 | 476 | |
56 | 460 | |
57 | 492 | |
58 | 381 | |
59 | 420 | |
60 | 394 | |
61 | 336 |
Value | Count | Frequency (%) |
75 | 694 | |
74 | 666 | |
73 | 330 | |
72 | 346 | |
71 | 385 | |
70 | 349 | |
69 | 363 | |
68 | 357 | |
67 | 328 | |
66 | 358 |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 11474.475 |
Minimum | 3 |
---|---|
Maximum | 22859 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 1130.9 |
Q1 | 5803.75 |
median | 11582.5 |
Q3 | 17193.75 |
95-th percentile | 21685.15 |
Maximum | 22859 |
Range | 22856 |
Interquartile range (IQR) | 11390 |
Descriptive statistics
Standard deviation | 6598.6811 |
---|---|
Coefficient of variation (CV) | 0.57507476 |
Kurtosis | -1.2006728 |
Mean | 11474.475 |
Median Absolute Deviation (MAD) | 5695 |
Skewness | -0.018126775 |
Sum | 1.1474475 × 108 |
Variance | 43542592 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10191 | 1 | < 0.1% |
1711 | 1 | < 0.1% |
5891 | 1 | < 0.1% |
1322 | 1 | < 0.1% |
5966 | 1 | < 0.1% |
2051 | 1 | < 0.1% |
20407 | 1 | < 0.1% |
16092 | 1 | < 0.1% |
19019 | 1 | < 0.1% |
13456 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
3 | 1 | |
4 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
11 | 1 | |
12 | 1 | |
13 | 1 | |
15 | 1 |
Value | Count | Frequency (%) |
22859 | 1 | |
22852 | 1 | |
22848 | 1 | |
22840 | 1 | |
22833 | 1 | |
22832 | 1 | |
22831 | 1 | |
22830 | 1 | |
22828 | 1 | |
22826 | 1 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
남 | |
---|---|
여 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여 |
---|---|
2nd row | 여 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
남 | 6801 | |
여 | 3199 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 6801 | |
여 | 3199 |
연령대
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
20 | |
---|---|
30 | |
40 | 455 |
50 | 44 |
60 | 11 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 30 |
---|---|
2nd row | 20 |
3rd row | 20 |
4th row | 20 |
5th row | 20 |
Common Values
Value | Count | Frequency (%) |
20 | 5731 | |
30 | 3759 | |
40 | 455 | 4.5% |
50 | 44 | 0.4% |
60 | 11 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20 | 5731 | |
30 | 3759 | |
40 | 455 | 4.5% |
50 | 44 | 0.4% |
60 | 11 | 0.1% |
응시지역
Categorical
IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
광주광역시 | 673 |
전주 | 604 |
부산광역시 | 344 |
대구광역시 | 268 |
Other values (3) | 299 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.7297 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 7812 | |
광주광역시 | 673 | 6.7% |
전주 | 604 | 6.0% |
부산광역시 | 344 | 3.4% |
대구광역시 | 268 | 2.7% |
원주 | 167 | 1.7% |
성남 | 130 | 1.3% |
대전광역시 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 7812 | |
광주광역시 | 673 | 6.7% |
전주 | 604 | 6.0% |
부산광역시 | 344 | 3.4% |
대구광역시 | 268 | 2.7% |
원주 | 167 | 1.7% |
성남 | 130 | 1.3% |
대전광역시 | 2 | < 0.1% |
졸업여부
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
졸업예정 | |
---|---|
졸업 | |
61 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.7529 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업예정 |
---|---|
2nd row | 졸업예정 |
3rd row | 졸업예정 |
4th row | 졸업예정 |
5th row | 졸업예정 |
Common Values
Value | Count | Frequency (%) |
졸업예정 | 8795 | |
졸업 | 1144 | 11.4% |
61 | 0.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업예정 | 8795 | |
졸업 | 1144 | 11.5% |
합격여부
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
합격 | |
---|---|
불합격 | |
결시 | 116 |
응시결격 | 18 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0968 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 합격 |
3rd row | 합격 |
4th row | 합격 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 8934 | |
불합격 | 932 | 9.3% |
결시 | 116 | 1.2% |
응시결격 | 18 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 8934 | |
불합격 | 932 | 9.3% |
결시 | 116 | 1.2% |
응시결격 | 18 | 0.2% |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
광주광역시 | |
전라북도 | |
부산광역시 | |
충청남도 | |
Other values (19) |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.4536 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 광주광역시 |
3rd row | 부산광역시 |
4th row | 광주광역시 |
5th row | 대구광역시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 2839 | |
광주광역시 | 1888 | |
전라북도 | 1314 | |
부산광역시 | 907 | 9.1% |
충청남도 | 891 | 8.9% |
대구광역시 | 735 | 7.3% |
필리핀 | 522 | 5.2% |
강원도 | 460 | 4.6% |
전주 | 236 | 2.4% |
미국 | 110 | 1.1% |
Other values (14) | 98 | 1.0% |
Length
Value | Count | Frequency (%) |
서울특별시 | 2839 | |
광주광역시 | 1888 | |
전라북도 | 1314 | |
부산광역시 | 907 | 9.1% |
충청남도 | 891 | 8.9% |
대구광역시 | 735 | 7.3% |
필리핀 | 522 | 5.2% |
강원도 | 460 | 4.6% |
전주 | 236 | 2.4% |
미국 | 110 | 1.1% |
Other values (14) | 98 | 1.0% |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.750 | 1.000 | 0.981 | 0.083 | 0.353 | 0.482 | 0.282 | 0.251 | 0.338 |
직종 | 0.750 | 1.000 | 0.750 | 0.806 | 0.025 | 0.098 | 0.503 | 0.184 | 0.066 | 0.186 |
회차 | 1.000 | 0.750 | 1.000 | 0.982 | 0.089 | 0.354 | 0.485 | 0.294 | 0.265 | 0.347 |
일련번호 | 0.981 | 0.806 | 0.982 | 1.000 | 0.085 | 0.340 | 0.528 | 0.326 | 0.275 | 0.376 |
성별 | 0.083 | 0.025 | 0.089 | 0.085 | 1.000 | 0.097 | 0.048 | 0.071 | 0.191 | 0.175 |
연령대 | 0.353 | 0.098 | 0.354 | 0.340 | 0.097 | 1.000 | 0.384 | 0.423 | 0.314 | 0.553 |
응시지역 | 0.482 | 0.503 | 0.485 | 0.528 | 0.048 | 0.384 | 1.000 | 0.130 | 0.147 | 0.851 |
졸업여부 | 0.282 | 0.184 | 0.294 | 0.326 | 0.071 | 0.423 | 0.130 | 1.000 | 0.458 | 0.798 |
합격여부 | 0.251 | 0.066 | 0.265 | 0.275 | 0.191 | 0.314 | 0.147 | 0.458 | 1.000 | 0.643 |
학교소재지 | 0.338 | 0.186 | 0.347 | 0.376 | 0.175 | 0.553 | 0.851 | 0.798 | 0.643 | 1.000 |
직종 | 응시지역 | 성별 | 합격여부 | 학교소재지 | 졸업여부 | 연령대 | |
---|---|---|---|---|---|---|---|
직종 | 1.000 | 0.370 | 0.042 | 0.062 | 0.086 | 0.057 | 0.073 |
응시지역 | 0.370 | 1.000 | 0.036 | 0.066 | 0.490 | 0.082 | 0.247 |
성별 | 0.042 | 0.036 | 1.000 | 0.126 | 0.139 | 0.117 | 0.119 |
합격여부 | 0.062 | 0.066 | 0.126 | 1.000 | 0.357 | 0.453 | 0.261 |
학교소재지 | 0.086 | 0.490 | 0.139 | 0.357 | 1.000 | 0.539 | 0.305 |
졸업여부 | 0.057 | 0.082 | 0.117 | 0.453 | 0.539 | 1.000 | 0.354 |
연령대 | 0.073 | 0.247 | 0.119 | 0.261 | 0.305 | 0.354 | 1.000 |
연도 | 회차 | 일련번호 | 직종 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.998 | 0.621 | 0.068 | 0.155 | 0.256 | 0.184 | 0.161 | 0.134 |
회차 | 1.000 | 1.000 | 0.998 | 0.621 | 0.068 | 0.155 | 0.256 | 0.184 | 0.161 | 0.134 |
일련번호 | 0.998 | 0.998 | 1.000 | 0.700 | 0.065 | 0.148 | 0.286 | 0.207 | 0.167 | 0.147 |
직종 | 0.621 | 0.621 | 0.700 | 1.000 | 0.042 | 0.073 | 0.370 | 0.057 | 0.062 | 0.086 |
성별 | 0.068 | 0.068 | 0.065 | 0.042 | 1.000 | 0.119 | 0.036 | 0.117 | 0.126 | 0.139 |
연령대 | 0.155 | 0.155 | 0.148 | 0.073 | 0.119 | 1.000 | 0.247 | 0.354 | 0.261 | 0.305 |
응시지역 | 0.256 | 0.256 | 0.286 | 0.370 | 0.036 | 0.247 | 1.000 | 0.082 | 0.066 | 0.490 |
졸업여부 | 0.184 | 0.184 | 0.207 | 0.057 | 0.117 | 0.354 | 0.082 | 1.000 | 0.453 | 0.539 |
합격여부 | 0.161 | 0.161 | 0.167 | 0.062 | 0.126 | 0.261 | 0.066 | 0.453 | 1.000 | 0.357 |
학교소재지 | 0.134 | 0.134 | 0.147 | 0.086 | 0.139 | 0.305 | 0.490 | 0.539 | 0.357 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
10190 | 2010 | 치과의사 | 62 | 10191 | 여 | 30 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
12478 | 2012 | 치과의사 | 64 | 12479 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 광주광역시 |
7158 | 2006 | 치과의사 | 58 | 7159 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 부산광역시 |
22279 | 2023 | 치과의사(실기) | 75 | 22280 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 광주광역시 |
7715 | 2007 | 치과의사 | 59 | 7716 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 대구광역시 |
6107 | 2005 | 치과의사 | 57 | 6108 | 남 | 20 | 서울특별시 | 졸업 | 합격 | 충청남도 |
16419 | 2017 | 치과의사 | 69 | 16420 | 남 | 20 | 전주 | 졸업예정 | 합격 | 전라북도 |
13160 | 2013 | 치과의사 | 65 | 13161 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 전주 |
10102 | 2009 | 치과의사 | 61 | 10103 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
280 | 2000 | 치과의사 | 52 | 281 | 남 | 40 | 서울특별시 | 불합격 | 필리핀 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
19029 | 2021 | 치과의사 | 73 | 19030 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 충청남도 |
19262 | 2021 | 치과의사 | 73 | 19263 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
14305 | 2015 | 치과의사 | 67 | 14306 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 충청남도 |
2038 | 2001 | 치과의사 | 53 | 2039 | 여 | 20 | 서울특별시 | 졸업예정 | 불합격 | 전라북도 |
4391 | 2004 | 치과의사 | 56 | 4392 | 남 | 40 | 서울특별시 | 졸업 | 결시 | 전라북도 |
14710 | 2015 | 치과의사 | 67 | 14711 | 남 | 30 | 광주광역시 | 졸업예정 | 합격 | 광주광역시 |
2205 | 2002 | 치과의사 | 54 | 2206 | 남 | 30 | 서울특별시 | 졸업 | 불합격 | 필리핀 |
2953 | 2002 | 치과의사 | 54 | 2954 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
17313 | 2018 | 치과의사 | 70 | 17314 | 남 | 20 | 전주 | 졸업예정 | 합격 | 전라북도 |
14503 | 2015 | 치과의사 | 67 | 14504 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |