Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 918.0 KiB |
Average record size in memory | 94.0 B |
Variable types
Numeric | 5 |
---|---|
Categorical | 5 |
Dataset
Description | 보건의료정보관리사 국가시험 응시자의 성적 현황을 분석할 수 있는 정보(연도, 직종, 회차, 일련번호, 과목명, 과목별 점수, 총점, 합격여부, 성별, 연령대)를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15083515/fileData.do |
직종 has constant value "" | Constant |
연도 is highly overall correlated with 회차 and 1 other fields | High correlation |
회차 is highly overall correlated with 연도 and 1 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 1 other fields | High correlation |
과목별점수 is highly overall correlated with 총점 and 2 other fields | High correlation |
총점 is highly overall correlated with 과목별점수 and 1 other fields | High correlation |
과목명 is highly overall correlated with 과목별점수 | High correlation |
합격여부 is highly overall correlated with 과목별점수 and 1 other fields | High correlation |
연령대 is highly imbalanced (82.7%) | Imbalance |
과목별점수 has 1446 (14.5%) zeros | Zeros |
총점 has 1436 (14.4%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 07:29:34.492813 |
---|---|
Analysis finished | 2023-12-12 07:29:39.017425 |
Duration | 4.52 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2004.7602 |
Minimum | 2000 |
---|---|
Maximum | 2009 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2000 |
Q1 | 2003 |
median | 2005 |
Q3 | 2007 |
95-th percentile | 2009 |
Maximum | 2009 |
Range | 9 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.7384386 |
---|---|
Coefficient of variation (CV) | 0.0013659681 |
Kurtosis | -1.0967759 |
Mean | 2004.7602 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.13675609 |
Sum | 20047602 |
Variance | 7.4990459 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2003 | 1463 | |
2008 | 1212 | |
2006 | 1173 | |
2007 | 1112 | |
2005 | 1026 | |
2004 | 896 | |
2009 | 870 | |
2000 | 857 | |
2002 | 760 | |
2001 | 631 |
Value | Count | Frequency (%) |
2000 | 857 | |
2001 | 631 | |
2002 | 760 | |
2003 | 1463 | |
2004 | 896 | |
2005 | 1026 | |
2006 | 1173 | |
2007 | 1112 | |
2008 | 1212 | |
2009 | 870 |
Value | Count | Frequency (%) |
2009 | 870 | |
2008 | 1212 | |
2007 | 1112 | |
2006 | 1173 | |
2005 | 1026 | |
2004 | 896 | |
2003 | 1463 | |
2002 | 760 | |
2001 | 631 | |
2000 | 857 |
직종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
보건의료정보관리사 |
---|
Length
Max length | 31 |
---|---|
Median length | 31 |
Mean length | 31 |
Min length | 31 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 보건의료정보관리사 |
---|---|
2nd row | 보건의료정보관리사 |
3rd row | 보건의료정보관리사 |
4th row | 보건의료정보관리사 |
5th row | 보건의료정보관리사 |
Common Values
Value | Count | Frequency (%) |
보건의료정보관리사 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
보건의료정보관리사 | 10000 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 21.4592 |
Minimum | 16 |
---|---|
Maximum | 26 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 16 |
---|---|
5-th percentile | 16 |
Q1 | 19 |
median | 22 |
Q3 | 24 |
95-th percentile | 26 |
Maximum | 26 |
Range | 10 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 3.1125398 |
---|---|
Coefficient of variation (CV) | 0.14504454 |
Kurtosis | -1.1200816 |
Mean | 21.4592 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.27364296 |
Sum | 214592 |
Variance | 9.6879042 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
25 | 1212 | |
23 | 1173 | |
24 | 1112 | |
22 | 1026 | |
21 | 896 | |
26 | 870 | |
16 | 857 | |
19 | 762 | |
18 | 760 | |
20 | 701 |
Value | Count | Frequency (%) |
16 | 857 | |
17 | 631 | |
18 | 760 | |
19 | 762 | |
20 | 701 | |
21 | 896 | |
22 | 1026 | |
23 | 1173 | |
24 | 1112 | |
25 | 1212 |
Value | Count | Frequency (%) |
26 | 870 | |
25 | 1212 | |
24 | 1112 | |
23 | 1173 | |
22 | 1026 | |
21 | 896 | |
20 | 701 | |
19 | 762 | |
18 | 760 | |
17 | 631 |
일련번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 8067 |
---|---|
Distinct (%) | 80.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9545.1471 |
Minimum | 2 |
---|---|
Maximum | 19058 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 911.95 |
Q1 | 4818.5 |
median | 9520.5 |
Q3 | 14349.25 |
95-th percentile | 18108.15 |
Maximum | 19058 |
Range | 19056 |
Interquartile range (IQR) | 9530.75 |
Descriptive statistics
Standard deviation | 5518.6805 |
---|---|
Coefficient of variation (CV) | 0.5781661 |
Kurtosis | -1.2028492 |
Mean | 9545.1471 |
Median Absolute Deviation (MAD) | 4757 |
Skewness | -0.010150831 |
Sum | 95451471 |
Variance | 30455834 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
13164 | 4 | < 0.1% |
12341 | 4 | < 0.1% |
3628 | 4 | < 0.1% |
3056 | 4 | < 0.1% |
10197 | 4 | < 0.1% |
16732 | 4 | < 0.1% |
938 | 4 | < 0.1% |
13729 | 4 | < 0.1% |
15462 | 3 | < 0.1% |
5770 | 3 | < 0.1% |
Other values (8057) | 9962 |
Value | Count | Frequency (%) |
2 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
8 | 2 | |
9 | 1 | |
13 | 1 | |
15 | 1 | |
16 | 1 | |
19 | 1 |
Value | Count | Frequency (%) |
19058 | 1 | |
19056 | 1 | |
19054 | 2 | |
19053 | 1 | |
19045 | 1 | |
19043 | 1 | |
19041 | 2 | |
19036 | 1 | |
19035 | 1 | |
19032 | 1 |
과목명
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
의무기록관리학 | |
---|---|
공중보건학 개론 | |
의료관계법규 | |
의학용어 | |
의무기록사 실기 |
Length
Max length | 8 |
---|---|
Median length | 7 |
Mean length | 6.5973 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공중보건학 개론 |
---|---|
2nd row | 공중보건학 개론 |
3rd row | 의료관계법규 |
4th row | 공중보건학 개론 |
5th row | 의무기록사 실기 |
Common Values
Value | Count | Frequency (%) |
의무기록관리학 | 2035 | |
공중보건학 개론 | 2032 | |
의료관계법규 | 2014 | |
의학용어 | 1991 | |
의무기록사 실기 | 1928 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
의무기록관리학 | 2035 | |
공중보건학 | 2032 | |
개론 | 2032 | |
의료관계법규 | 2014 | |
의학용어 | 1991 | |
의무기록사 | 1928 | |
실기 | 1928 |
과목별점수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 115 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 32.5237 |
Minimum | 0 |
---|---|
Maximum | 100 |
Zeros | 1446 |
Zeros (%) | 14.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 11 |
median | 19 |
Q3 | 56 |
95-th percentile | 80 |
Maximum | 100 |
Range | 100 |
Interquartile range (IQR) | 45 |
Descriptive statistics
Standard deviation | 27.276752 |
---|---|
Coefficient of variation (CV) | 0.83867309 |
Kurtosis | -1.072017 |
Mean | 32.5237 |
Median Absolute Deviation (MAD) | 19 |
Skewness | 0.52733743 |
Sum | 325237 |
Variance | 744.02119 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 1446 | 14.5% |
14.0 | 451 | 4.5% |
15.0 | 388 | 3.9% |
12.0 | 384 | 3.8% |
13.0 | 378 | 3.8% |
16.0 | 331 | 3.3% |
11.0 | 305 | 3.0% |
10.0 | 277 | 2.8% |
17.0 | 259 | 2.6% |
9.0 | 193 | 1.9% |
Other values (105) | 5588 |
Value | Count | Frequency (%) |
0.0 | 1446 | |
2.0 | 2 | < 0.1% |
3.0 | 5 | 0.1% |
4.0 | 15 | 0.1% |
5.0 | 29 | 0.3% |
6.0 | 61 | 0.6% |
7.0 | 98 | 1.0% |
8.0 | 157 | 1.6% |
9.0 | 193 | 1.9% |
10.0 | 277 | 2.8% |
Value | Count | Frequency (%) |
100.0 | 3 | < 0.1% |
97.5 | 5 | 0.1% |
97.0 | 1 | < 0.1% |
96.0 | 3 | < 0.1% |
95.0 | 17 | |
94.0 | 7 | 0.1% |
93.0 | 10 | |
92.5 | 19 | |
92.0 | 9 | |
91.0 | 8 |
총점
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 345 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 142.95445 |
Minimum | 0 |
---|---|
Maximum | 292 |
Zeros | 1436 |
Zeros (%) | 14.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 89 |
median | 119 |
Q3 | 217.5 |
95-th percentile | 251 |
Maximum | 292 |
Range | 292 |
Interquartile range (IQR) | 128.5 |
Descriptive statistics
Standard deviation | 83.192236 |
---|---|
Coefficient of variation (CV) | 0.58194926 |
Kurtosis | -1.1170461 |
Mean | 142.95445 |
Median Absolute Deviation (MAD) | 83.5 |
Skewness | -0.32323754 |
Sum | 1429544.5 |
Variance | 6920.9481 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 1436 | 14.4% |
116.0 | 124 | 1.2% |
117.0 | 107 | 1.1% |
110.0 | 107 | 1.1% |
118.0 | 103 | 1.0% |
112.0 | 101 | 1.0% |
107.0 | 97 | 1.0% |
115.0 | 97 | 1.0% |
114.0 | 92 | 0.9% |
109.0 | 92 | 0.9% |
Other values (335) | 7644 |
Value | Count | Frequency (%) |
0.0 | 1436 | |
28.0 | 3 | < 0.1% |
31.0 | 1 | < 0.1% |
33.0 | 2 | < 0.1% |
35.0 | 1 | < 0.1% |
36.0 | 1 | < 0.1% |
37.0 | 1 | < 0.1% |
41.0 | 1 | < 0.1% |
43.0 | 1 | < 0.1% |
44.0 | 5 | 0.1% |
Value | Count | Frequency (%) |
292.0 | 1 | |
291.5 | 1 | |
290.5 | 2 | |
289.5 | 1 | |
289.0 | 1 | |
288.0 | 1 | |
287.5 | 2 | |
287.0 | 1 | |
286.0 | 1 | |
283.5 | 2 |
합격여부
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
합격 | |
---|---|
불합격 | |
결시 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.4143 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 불합격 |
3rd row | 합격 |
4th row | 결시 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 4421 | |
불합격 | 4143 | |
결시 | 1436 | 14.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 4421 | |
불합격 | 4143 | |
결시 | 1436 | 14.4% |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여 | |
---|---|
남 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여 |
---|---|
2nd row | 남 |
3rd row | 여 |
4th row | 여 |
5th row | 여 |
Common Values
Value | Count | Frequency (%) |
여 | 8394 | |
남 | 1606 | 16.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 8394 | |
남 | 1606 | 16.1% |
연령대
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
20 | |
---|---|
30 | 381 |
40 | 44 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 20 |
---|---|
2nd row | 30 |
3rd row | 20 |
4th row | 20 |
5th row | 20 |
Common Values
Value | Count | Frequency (%) |
20 | 9575 | |
30 | 381 | 3.8% |
40 | 44 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20 | 9575 | |
30 | 381 | 3.8% |
40 | 44 | 0.4% |
연도 | 회차 | 일련번호 | 과목명 | 과목별점수 | 총점 | 합격여부 | 성별 | 연령대 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.999 | 0.940 | 0.000 | 0.178 | 0.291 | 0.371 | 0.052 | 0.025 |
회차 | 0.999 | 1.000 | 0.987 | 0.000 | 0.262 | 0.374 | 0.302 | 0.064 | 0.043 |
일련번호 | 0.940 | 0.987 | 1.000 | 0.000 | 0.255 | 0.378 | 0.277 | 0.057 | 0.050 |
과목명 | 0.000 | 0.000 | 0.000 | 1.000 | 0.868 | 0.028 | 0.028 | 0.000 | 0.000 |
과목별점수 | 0.178 | 0.262 | 0.255 | 0.868 | 1.000 | 0.794 | 0.768 | 0.029 | 0.071 |
총점 | 0.291 | 0.374 | 0.378 | 0.028 | 0.794 | 1.000 | 0.962 | 0.081 | 0.088 |
합격여부 | 0.371 | 0.302 | 0.277 | 0.028 | 0.768 | 0.962 | 1.000 | 0.023 | 0.174 |
성별 | 0.052 | 0.064 | 0.057 | 0.000 | 0.029 | 0.081 | 0.023 | 1.000 | 0.043 |
연령대 | 0.025 | 0.043 | 0.050 | 0.000 | 0.071 | 0.088 | 0.174 | 0.043 | 1.000 |
과목명 | 합격여부 | 연령대 | 성별 | |
---|---|---|---|---|
과목명 | 1.000 | 0.021 | 0.000 | 0.000 |
합격여부 | 0.021 | 1.000 | 0.054 | 0.038 |
연령대 | 0.000 | 0.054 | 1.000 | 0.071 |
성별 | 0.000 | 0.038 | 0.071 | 1.000 |
연도 | 회차 | 일련번호 | 과목별점수 | 총점 | 과목명 | 합격여부 | 성별 | 연령대 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.999 | 0.994 | 0.083 | 0.063 | 0.000 | 0.179 | 0.049 | 0.012 |
회차 | 0.999 | 1.000 | 0.995 | 0.086 | 0.069 | 0.000 | 0.195 | 0.045 | 0.023 |
일련번호 | 0.994 | 0.995 | 1.000 | 0.086 | 0.068 | 0.000 | 0.172 | 0.044 | 0.030 |
과목별점수 | 0.083 | 0.086 | 0.086 | 1.000 | 0.590 | 0.534 | 0.610 | 0.024 | 0.039 |
총점 | 0.063 | 0.069 | 0.068 | 0.590 | 1.000 | 0.012 | 0.963 | 0.062 | 0.052 |
과목명 | 0.000 | 0.000 | 0.000 | 0.534 | 0.012 | 1.000 | 0.021 | 0.000 | 0.000 |
합격여부 | 0.179 | 0.195 | 0.172 | 0.610 | 0.963 | 0.021 | 1.000 | 0.038 | 0.054 |
성별 | 0.049 | 0.045 | 0.044 | 0.024 | 0.062 | 0.000 | 0.038 | 1.000 | 0.071 |
연령대 | 0.012 | 0.023 | 0.030 | 0.039 | 0.052 | 0.000 | 0.054 | 0.071 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 과목명 | 과목별점수 | 총점 | 합격여부 | 성별 | 연령대 | |
---|---|---|---|---|---|---|---|---|---|---|
70471 | 2007 | 보건의료정보관리사 | 24 | 14095 | 공중보건학 개론 | 16.0 | 275.5 | 합격 | 여 | 20 |
79856 | 2008 | 보건의료정보관리사 | 25 | 15972 | 공중보건학 개론 | 10.0 | 85.0 | 불합격 | 남 | 30 |
92152 | 2009 | 보건의료정보관리사 | 26 | 18431 | 의료관계법규 | 17.0 | 183.5 | 합격 | 여 | 20 |
9471 | 2001 | 보건의료정보관리사 | 17 | 1895 | 공중보건학 개론 | 0.0 | 0.0 | 결시 | 여 | 20 |
30764 | 2003 | 보건의료정보관리사 | 20 | 6153 | 의무기록사 실기 | 85.0 | 214.0 | 합격 | 여 | 20 |
436 | 2000 | 보건의료정보관리사 | 16 | 88 | 공중보건학 개론 | 14.0 | 200.0 | 합격 | 여 | 20 |
71717 | 2007 | 보건의료정보관리사 | 24 | 14344 | 의료관계법규 | 15.0 | 261.0 | 합격 | 여 | 20 |
55816 | 2006 | 보건의료정보관리사 | 23 | 11164 | 공중보건학 개론 | 11.0 | 94.0 | 불합격 | 남 | 20 |
92666 | 2009 | 보건의료정보관리사 | 26 | 18534 | 공중보건학 개론 | 10.0 | 94.0 | 불합격 | 여 | 20 |
71157 | 2007 | 보건의료정보관리사 | 24 | 14232 | 의료관계법규 | 11.0 | 202.0 | 합격 | 남 | 20 |
연도 | 직종 | 회차 | 일련번호 | 과목명 | 과목별점수 | 총점 | 합격여부 | 성별 | 연령대 | |
---|---|---|---|---|---|---|---|---|---|---|
66853 | 2007 | 보건의료정보관리사 | 24 | 13371 | 의무기록관리학 | 61.0 | 104.0 | 불합격 | 여 | 20 |
33613 | 2003 | 보건의료정보관리사 | 20 | 6723 | 의무기록관리학 | 0.0 | 0.0 | 결시 | 여 | 20 |
64444 | 2006 | 보건의료정보관리사 | 23 | 12889 | 의무기록사 실기 | 77.5 | 218.5 | 합격 | 여 | 20 |
77704 | 2008 | 보건의료정보관리사 | 25 | 15541 | 의무기록사 실기 | 47.5 | 79.0 | 불합격 | 여 | 20 |
78712 | 2008 | 보건의료정보관리사 | 25 | 15743 | 의료관계법규 | 15.0 | 224.0 | 합격 | 여 | 20 |
58266 | 2006 | 보건의료정보관리사 | 23 | 11654 | 공중보건학 개론 | 16.0 | 235.0 | 합격 | 여 | 20 |
9092 | 2001 | 보건의료정보관리사 | 17 | 1819 | 의료관계법규 | 15.0 | 211.5 | 합격 | 여 | 20 |
66714 | 2007 | 보건의료정보관리사 | 24 | 13343 | 의무기록사 실기 | 55.0 | 195.0 | 불합격 | 여 | 20 |
85414 | 2008 | 보건의료정보관리사 | 25 | 17083 | 의무기록사 실기 | 77.5 | 207.5 | 합격 | 여 | 20 |
21865 | 2003 | 보건의료정보관리사 | 19 | 4374 | 의학용어 | 26.0 | 112.0 | 불합격 | 여 | 20 |