Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 898.4 KiB |
Average record size in memory | 92.0 B |
Variable types
Numeric | 4 |
---|---|
Categorical | 6 |
Dataset
Description | 약사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15060460/fileData.do |
연도 is highly overall correlated with 회차 and 2 other fields | High correlation |
회차 is highly overall correlated with 연도 and 2 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 2 other fields | High correlation |
직종 is highly overall correlated with 연도 and 3 other fields | High correlation |
응시지역 is highly overall correlated with 직종 and 1 other fields | High correlation |
학교소재지 is highly overall correlated with 응시지역 | High correlation |
응시지역 is highly imbalanced (52.3%) | Imbalance |
졸업여부 is highly imbalanced (55.1%) | Imbalance |
합격여부 is highly imbalanced (58.9%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 19:11:45.375066 |
---|---|
Analysis finished | 2023-12-12 19:11:49.340506 |
Duration | 3.97 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2011.7886 |
Minimum | 2000 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2000 |
Q1 | 2005 |
median | 2012 |
Q3 | 2019 |
95-th percentile | 2023 |
Maximum | 2023 |
Range | 23 |
Interquartile range (IQR) | 14 |
Descriptive statistics
Standard deviation | 7.3426359 |
---|---|
Coefficient of variation (CV) | 0.0036498049 |
Kurtosis | -1.3233147 |
Mean | 2011.7886 |
Median Absolute Deviation (MAD) | 7 |
Skewness | -0.082270538 |
Sum | 20117886 |
Variance | 53.914301 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2000 | 700 | 7.0% |
2020 | 570 | 5.7% |
2023 | 508 | 5.1% |
2018 | 504 | 5.0% |
2019 | 500 | 5.0% |
2021 | 481 | 4.8% |
2017 | 475 | 4.8% |
2012 | 475 | 4.8% |
2022 | 462 | 4.6% |
2016 | 451 | 4.5% |
Other values (14) | 4874 |
Value | Count | Frequency (%) |
2000 | 700 | |
2001 | 368 | |
2002 | 359 | |
2003 | 371 | |
2004 | 382 | |
2005 | 365 | |
2006 | 422 | |
2007 | 393 | |
2008 | 386 | |
2009 | 401 |
Value | Count | Frequency (%) |
2023 | 508 | |
2022 | 462 | |
2021 | 481 | |
2020 | 570 | |
2019 | 500 | |
2018 | 504 | |
2017 | 475 | |
2016 | 451 | |
2015 | 426 | |
2014 | 82 | 0.8% |
직종
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
약사(4년제) | |
---|---|
약사(6년제) |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 약사(4년제) |
---|---|
2nd row | 약사(4년제) |
3rd row | 약사(6년제) |
4th row | 약사(4년제) |
5th row | 약사(4년제) |
Common Values
Value | Count | Frequency (%) |
약사(4년제) | 5677 | |
약사(6년제) | 4323 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
약사(4년제 | 5677 | |
약사(6년제 | 4323 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 62.7477 |
Minimum | 50 |
---|---|
Maximum | 74 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 50 |
---|---|
5-th percentile | 51 |
Q1 | 56 |
median | 63 |
Q3 | 70 |
95-th percentile | 74 |
Maximum | 74 |
Range | 24 |
Interquartile range (IQR) | 14 |
Descriptive statistics
Standard deviation | 7.4106637 |
---|---|
Coefficient of variation (CV) | 0.11810256 |
Kurtosis | -1.2857631 |
Mean | 62.7477 |
Median Absolute Deviation (MAD) | 7 |
Skewness | -0.10903165 |
Sum | 627477 |
Variance | 54.917937 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
71 | 570 | 5.7% |
74 | 508 | 5.1% |
69 | 504 | 5.0% |
70 | 500 | 5.0% |
72 | 481 | 4.8% |
63 | 475 | 4.8% |
68 | 475 | 4.8% |
73 | 462 | 4.6% |
67 | 451 | 4.5% |
66 | 426 | 4.3% |
Other values (15) | 5148 |
Value | Count | Frequency (%) |
50 | 409 | |
51 | 291 | |
52 | 368 | |
53 | 359 | |
54 | 371 | |
55 | 382 | |
56 | 365 | |
57 | 422 | |
58 | 393 | |
59 | 386 |
Value | Count | Frequency (%) |
74 | 508 | |
73 | 462 | |
72 | 481 | |
71 | 570 | |
70 | 500 | |
69 | 504 | |
68 | 475 | |
67 | 451 | |
66 | 426 | |
65 | 82 | 0.8% |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20925.55 |
Minimum | 3 |
---|---|
Maximum | 41599 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 2060.8 |
Q1 | 10580.5 |
median | 20881 |
Q3 | 31438.25 |
95-th percentile | 39602.25 |
Maximum | 41599 |
Range | 41596 |
Interquartile range (IQR) | 20857.75 |
Descriptive statistics
Standard deviation | 12031.986 |
---|---|
Coefficient of variation (CV) | 0.57499018 |
Kurtosis | -1.2043298 |
Mean | 20925.55 |
Median Absolute Deviation (MAD) | 10425.5 |
Skewness | -0.0088931455 |
Sum | 2.092555 × 108 |
Variance | 1.4476869 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
12885 | 1 | < 0.1% |
33302 | 1 | < 0.1% |
40997 | 1 | < 0.1% |
16732 | 1 | < 0.1% |
30492 | 1 | < 0.1% |
39560 | 1 | < 0.1% |
15112 | 1 | < 0.1% |
11507 | 1 | < 0.1% |
32401 | 1 | < 0.1% |
9827 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
3 | 1 | |
5 | 1 | |
7 | 1 | |
10 | 1 | |
11 | 1 | |
19 | 1 | |
20 | 1 | |
22 | 1 | |
24 | 1 | |
41 | 1 |
Value | Count | Frequency (%) |
41599 | 1 | |
41598 | 1 | |
41595 | 1 | |
41590 | 1 | |
41588 | 1 | |
41579 | 1 | |
41569 | 1 | |
41564 | 1 | |
41560 | 1 | |
41558 | 1 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여 | |
---|---|
남 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 남 |
3rd row | 남 |
4th row | 남 |
5th row | 여 |
Common Values
Value | Count | Frequency (%) |
여 | 6023 | |
남 | 3977 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 6023 | |
남 | 3977 |
연령대
Real number (ℝ)
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 23.566 |
Minimum | 20 |
---|---|
Maximum | 70 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 20 |
---|---|
5-th percentile | 20 |
Q1 | 20 |
median | 20 |
Q3 | 30 |
95-th percentile | 30 |
Maximum | 70 |
Range | 50 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 5.9587914 |
---|---|
Coefficient of variation (CV) | 0.25285544 |
Kurtosis | 4.5708362 |
Mean | 23.566 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.86007 |
Sum | 235660 |
Variance | 35.507195 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20 | 6941 | |
30 | 2654 | 26.5% |
40 | 320 | 3.2% |
50 | 70 | 0.7% |
60 | 13 | 0.1% |
70 | 2 | < 0.1% |
Value | Count | Frequency (%) |
20 | 6941 | |
30 | 2654 | 26.5% |
40 | 320 | 3.2% |
50 | 70 | 0.7% |
60 | 13 | 0.1% |
70 | 2 | < 0.1% |
Value | Count | Frequency (%) |
70 | 2 | < 0.1% |
60 | 13 | 0.1% |
50 | 70 | 0.7% |
40 | 320 | 3.2% |
30 | 2654 | 26.5% |
20 | 6941 |
응시지역
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
대전광역시 | 608 |
광주광역시 | 469 |
부산광역시 | 457 |
대구광역시 | 437 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 부산광역시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 8029 | |
대전광역시 | 608 | 6.1% |
광주광역시 | 469 | 4.7% |
부산광역시 | 457 | 4.6% |
대구광역시 | 437 | 4.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 8029 | |
대전광역시 | 608 | 6.1% |
광주광역시 | 469 | 4.7% |
부산광역시 | 457 | 4.6% |
대구광역시 | 437 | 4.4% |
졸업여부
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
졸업예정 | |
---|---|
졸업 | |
54 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.6382 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업예정 |
---|---|
2nd row | 졸업예정 |
3rd row | 졸업예정 |
4th row | 졸업 |
5th row | 졸업예정 |
Common Values
Value | Count | Frequency (%) |
졸업예정 | 8218 | |
졸업 | 1728 | 17.3% |
54 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업예정 | 8218 | |
졸업 | 1728 | 17.4% |
합격여부
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
합격 | |
---|---|
불합격 | |
결시 | 493 |
응시결격 | 7 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1249 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 합격 |
3rd row | 합격 |
4th row | 결시 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 8265 | |
불합격 | 1235 | 12.3% |
결시 | 493 | 4.9% |
응시결격 | 7 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 8265 | |
불합격 | 1235 | 12.3% |
결시 | 493 | 4.9% |
응시결격 | 7 | 0.1% |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 30 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
광주광역시 | |
경상북도 | |
부산광역시 | |
경기도 | |
Other values (25) |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.4644 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 충청북도 |
---|---|
2nd row | 대전광역시 |
3rd row | 부산광역시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 4192 | |
광주광역시 | 917 | 9.2% |
경상북도 | 840 | 8.4% |
부산광역시 | 752 | 7.5% |
경기도 | 707 | 7.1% |
전라북도 | 600 | 6.0% |
충청북도 | 361 | 3.6% |
대전광역시 | 291 | 2.9% |
강원도 | 272 | 2.7% |
필리핀 | 204 | 2.0% |
Other values (20) | 864 | 8.6% |
Length
Value | Count | Frequency (%) |
서울특별시 | 4192 | |
광주광역시 | 917 | 9.2% |
경상북도 | 840 | 8.4% |
부산광역시 | 752 | 7.5% |
경기도 | 707 | 7.1% |
전라북도 | 600 | 6.0% |
충청북도 | 361 | 3.6% |
대전광역시 | 291 | 2.9% |
강원도 | 272 | 2.7% |
필리핀 | 204 | 2.0% |
Other values (20) | 864 | 8.6% |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.999 | 0.994 | 0.985 | 0.113 | 0.151 | 0.568 | 0.247 | 0.113 | 0.366 |
직종 | 0.999 | 1.000 | 0.999 | 0.997 | 0.008 | 0.238 | 0.467 | 0.095 | 0.302 | 0.416 |
회차 | 0.994 | 0.999 | 1.000 | 0.991 | 0.126 | 0.160 | 0.578 | 0.256 | 0.314 | 0.374 |
일련번호 | 0.985 | 0.997 | 0.991 | 1.000 | 0.121 | 0.157 | 0.581 | 0.258 | 0.330 | 0.361 |
성별 | 0.113 | 0.008 | 0.126 | 0.121 | 1.000 | 0.288 | 0.079 | 0.063 | 0.169 | 0.383 |
연령대 | 0.151 | 0.238 | 0.160 | 0.157 | 0.288 | 1.000 | 0.156 | 0.518 | 0.285 | 0.571 |
응시지역 | 0.568 | 0.467 | 0.578 | 0.581 | 0.079 | 0.156 | 1.000 | 0.133 | 0.106 | 0.914 |
졸업여부 | 0.247 | 0.095 | 0.256 | 0.258 | 0.063 | 0.518 | 0.133 | 1.000 | 0.385 | 0.634 |
합격여부 | 0.113 | 0.302 | 0.314 | 0.330 | 0.169 | 0.285 | 0.106 | 0.385 | 1.000 | 0.419 |
학교소재지 | 0.366 | 0.416 | 0.374 | 0.361 | 0.383 | 0.571 | 0.914 | 0.634 | 0.419 | 1.000 |
성별 | 직종 | 학교소재지 | 합격여부 | 졸업여부 | 응시지역 | |
---|---|---|---|---|---|---|
성별 | 1.000 | 0.005 | 0.304 | 0.112 | 0.104 | 0.096 |
직종 | 0.005 | 1.000 | 0.331 | 0.201 | 0.158 | 0.567 |
학교소재지 | 0.304 | 0.331 | 1.000 | 0.229 | 0.374 | 0.658 |
합격여부 | 0.112 | 0.201 | 0.229 | 1.000 | 0.376 | 0.086 |
졸업여부 | 0.104 | 0.158 | 0.374 | 0.376 | 1.000 | 0.100 |
응시지역 | 0.096 | 0.567 | 0.658 | 0.086 | 0.100 | 1.000 |
연도 | 회차 | 일련번호 | 연령대 | 직종 | 성별 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.999 | 0.147 | 0.976 | 0.097 | 0.277 | 0.145 | 0.170 | 0.128 |
회차 | 1.000 | 1.000 | 0.999 | 0.146 | 0.977 | 0.096 | 0.277 | 0.158 | 0.192 | 0.127 |
일련번호 | 0.999 | 0.999 | 1.000 | 0.146 | 0.950 | 0.093 | 0.278 | 0.159 | 0.202 | 0.122 |
연령대 | 0.147 | 0.146 | 0.146 | 1.000 | 0.171 | 0.207 | 0.106 | 0.249 | 0.187 | 0.268 |
직종 | 0.976 | 0.977 | 0.950 | 0.171 | 1.000 | 0.005 | 0.567 | 0.158 | 0.201 | 0.331 |
성별 | 0.097 | 0.096 | 0.093 | 0.207 | 0.005 | 1.000 | 0.096 | 0.104 | 0.112 | 0.304 |
응시지역 | 0.277 | 0.277 | 0.278 | 0.106 | 0.567 | 0.096 | 1.000 | 0.100 | 0.086 | 0.658 |
졸업여부 | 0.145 | 0.158 | 0.159 | 0.249 | 0.158 | 0.104 | 0.100 | 1.000 | 0.376 | 0.374 |
합격여부 | 0.170 | 0.192 | 0.202 | 0.187 | 0.201 | 0.112 | 0.086 | 0.376 | 1.000 | 0.229 |
학교소재지 | 0.128 | 0.127 | 0.122 | 0.268 | 0.331 | 0.304 | 0.658 | 0.374 | 0.229 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
12884 | 2007 | 약사(4년제) | 58 | 12885 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 충청북도 |
17620 | 2010 | 약사(4년제) | 61 | 17621 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 대전광역시 |
26584 | 2016 | 약사(6년제) | 67 | 26585 | 남 | 20 | 부산광역시 | 졸업예정 | 합격 | 부산광역시 |
18332 | 2010 | 약사(4년제) | 61 | 18333 | 남 | 40 | 서울특별시 | 졸업 | 결시 | 서울특별시 |
5390 | 2002 | 약사(4년제) | 53 | 5391 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
23377 | 2014 | 약사(4년제) | 65 | 23378 | 남 | 30 | 서울특별시 | 졸업 | 합격 | 서울특별시 |
30105 | 2018 | 약사(6년제) | 69 | 30106 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
2475 | 2000 | 약사(4년제) | 51 | 2476 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 경기도 |
39734 | 2023 | 약사(6년제) | 74 | 39735 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 강원도 |
34645 | 2020 | 약사(6년제) | 71 | 34646 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
14015 | 2007 | 약사(4년제) | 58 | 14016 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
3730 | 2001 | 약사(4년제) | 52 | 3731 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 강원도 |
30254 | 2018 | 약사(6년제) | 69 | 30255 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
2104 | 2000 | 약사(4년제) | 51 | 2105 | 남 | 30 | 서울특별시 | 졸업 | 합격 | 광주광역시 |
28861 | 2017 | 약사(6년제) | 68 | 28862 | 남 | 20 | 광주광역시 | 졸업예정 | 합격 | 광주광역시 |
39862 | 2023 | 약사(6년제) | 74 | 39863 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 충청북도 |
20666 | 2011 | 약사(4년제) | 62 | 20667 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
13576 | 2007 | 약사(4년제) | 58 | 13577 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 광주광역시 |
21524 | 2012 | 약사(4년제) | 63 | 21525 | 남 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
20143 | 2011 | 약사(4년제) | 62 | 20144 | 남 | 30 | 서울특별시 | 졸업예정 | 합격 | 충청북도 |