Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 898.4 KiB |
Average record size in memory | 92.0 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 7 |
Dataset
Description | 간호사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15060459/fileData.do |
직종 has constant value "" | Constant |
학교소재지 is highly overall correlated with 응시지역 | High correlation |
응시지역 is highly overall correlated with 학교소재지 | High correlation |
연도 is highly overall correlated with 회차 and 1 other fields | High correlation |
회차 is highly overall correlated with 연도 and 1 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 1 other fields | High correlation |
성별 is highly imbalanced (87.6%) | Imbalance |
연령대 is highly imbalanced (90.0%) | Imbalance |
졸업여부 is highly imbalanced (69.6%) | Imbalance |
합격여부 is highly imbalanced (71.0%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 07:15:41.353650 |
---|---|
Analysis finished | 2023-12-12 07:15:43.780332 |
Duration | 2.43 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2003.3101 |
Minimum | 2000 |
---|---|
Maximum | 2007 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2000 |
Q1 | 2001 |
median | 2002 |
Q3 | 2005 |
95-th percentile | 2007 |
Maximum | 2007 |
Range | 7 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.2957493 |
---|---|
Coefficient of variation (CV) | 0.001145978 |
Kurtosis | -1.3300487 |
Mean | 2003.3101 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.13373445 |
Sum | 20033101 |
Variance | 5.270465 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2002 | 2530 | |
2005 | 1372 | |
2006 | 1288 | |
2000 | 1269 | |
2004 | 1262 | |
2001 | 1258 | |
2007 | 1021 |
Value | Count | Frequency (%) |
2000 | 1269 | |
2001 | 1258 | |
2002 | 2530 | |
2004 | 1262 | |
2005 | 1372 | |
2006 | 1288 | |
2007 | 1021 |
Value | Count | Frequency (%) |
2007 | 1021 | |
2006 | 1288 | |
2005 | 1372 | |
2004 | 1262 | |
2002 | 2530 | |
2001 | 1258 | |
2000 | 1269 |
직종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
간호사 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 간호사 |
---|---|
2nd row | 간호사 |
3rd row | 간호사 |
4th row | 간호사 |
5th row | 간호사 |
Common Values
Value | Count | Frequency (%) |
간호사 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
간호사 | 10000 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 43.4378 |
Minimum | 40 |
---|---|
Maximum | 47 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 40 |
---|---|
5-th percentile | 40 |
Q1 | 41 |
median | 43 |
Q3 | 45 |
95-th percentile | 47 |
Maximum | 47 |
Range | 7 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.2466054 |
---|---|
Coefficient of variation (CV) | 0.051720055 |
Kurtosis | -1.2124304 |
Mean | 43.4378 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.0030425279 |
Sum | 434378 |
Variance | 5.0472359 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
45 | 1372 | |
46 | 1288 | |
43 | 1277 | |
40 | 1269 | |
44 | 1262 | |
41 | 1258 | |
42 | 1253 | |
47 | 1021 |
Value | Count | Frequency (%) |
40 | 1269 | |
41 | 1258 | |
42 | 1253 | |
43 | 1277 | |
44 | 1262 | |
45 | 1372 | |
46 | 1288 | |
47 | 1021 |
Value | Count | Frequency (%) |
47 | 1021 | |
46 | 1288 | |
45 | 1372 | |
44 | 1262 | |
43 | 1277 | |
42 | 1253 | |
41 | 1258 | |
40 | 1269 |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 47589.881 |
Minimum | 4 |
---|---|
Maximum | 95282 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 4 |
---|---|
5-th percentile | 4574.7 |
Q1 | 23563.5 |
median | 47921.5 |
Q3 | 71327.5 |
95-th percentile | 90535.2 |
Maximum | 95282 |
Range | 95278 |
Interquartile range (IQR) | 47764 |
Descriptive statistics
Standard deviation | 27521.211 |
---|---|
Coefficient of variation (CV) | 0.57829964 |
Kurtosis | -1.197012 |
Mean | 47589.881 |
Median Absolute Deviation (MAD) | 23832.5 |
Skewness | -0.011114193 |
Sum | 4.7589881 × 108 |
Variance | 7.5741705 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
55015 | 1 | < 0.1% |
62040 | 1 | < 0.1% |
53472 | 1 | < 0.1% |
28207 | 1 | < 0.1% |
37130 | 1 | < 0.1% |
71508 | 1 | < 0.1% |
22194 | 1 | < 0.1% |
873 | 1 | < 0.1% |
11124 | 1 | < 0.1% |
65257 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
4 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
22 | 1 | |
27 | 1 | |
34 | 1 | |
47 | 1 | |
63 | 1 | |
88 | 1 |
Value | Count | Frequency (%) |
95282 | 1 | |
95280 | 1 | |
95277 | 1 | |
95273 | 1 | |
95269 | 1 | |
95266 | 1 | |
95263 | 1 | |
95250 | 1 | |
95249 | 1 | |
95248 | 1 |
성별
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여 | |
---|---|
남 | 169 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여 |
---|---|
2nd row | 여 |
3rd row | 여 |
4th row | 여 |
5th row | 여 |
Common Values
Value | Count | Frequency (%) |
여 | 9831 | |
남 | 169 | 1.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 9831 | |
남 | 169 | 1.7% |
연령대
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
20 | |
---|---|
30 | 268 |
40 | 20 |
50 | 1 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 20 |
---|---|
2nd row | 20 |
3rd row | 20 |
4th row | 20 |
5th row | 20 |
Common Values
Value | Count | Frequency (%) |
20 | 9711 | |
30 | 268 | 2.7% |
40 | 20 | 0.2% |
50 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20 | 9711 | |
30 | 268 | 2.7% |
40 | 20 | 0.2% |
50 | 1 | < 0.1% |
응시지역
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
대구광역시 | |
광주광역시 | |
부산광역시 | |
대전광역시 | |
Other values (3) |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.8757 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대구광역시 |
---|---|
2nd row | 광주광역시 |
3rd row | 광주광역시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 3929 | |
대구광역시 | 1840 | |
광주광역시 | 1552 | 15.5% |
부산광역시 | 1340 | 13.4% |
대전광역시 | 889 | 8.9% |
전주 | 219 | 2.2% |
강릉 | 124 | 1.2% |
제주도 | 107 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 3929 | |
대구광역시 | 1840 | |
광주광역시 | 1552 | 15.5% |
부산광역시 | 1340 | 13.4% |
대전광역시 | 889 | 8.9% |
전주 | 219 | 2.2% |
강릉 | 124 | 1.2% |
제주도 | 107 | 1.1% |
졸업여부
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
졸업(수습)예정 | |
---|---|
졸업(수습) | |
<NA> | 38 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.799 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업(수습) |
---|---|
2nd row | 졸업(수습)예정 |
3rd row | 졸업(수습)예정 |
4th row | 졸업(수습)예정 |
5th row | 졸업(수습)예정 |
Common Values
Value | Count | Frequency (%) |
졸업(수습)예정 | 9033 | |
졸업(수습) | 929 | 9.3% |
<NA> | 38 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업(수습)예정 | 9033 | |
졸업(수습 | 929 | 9.3% |
na | 38 | 0.4% |
합격여부
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
합격 | |
---|---|
불합격 | |
결시 | 141 |
응시결격 | 12 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1002 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 합격 |
3rd row | 합격 |
4th row | 합격 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 8869 | |
불합격 | 978 | 9.8% |
결시 | 141 | 1.4% |
응시결격 | 12 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 8869 | |
불합격 | 978 | 9.8% |
결시 | 141 | 1.4% |
응시결격 | 12 | 0.1% |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
대구광역시 | |
광주광역시 | |
부산광역시 | |
대전광역시 | |
Other values (3) |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.8757 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대구광역시 |
---|---|
2nd row | 광주광역시 |
3rd row | 광주광역시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 3929 | |
대구광역시 | 1840 | |
광주광역시 | 1552 | 15.5% |
부산광역시 | 1340 | 13.4% |
대전광역시 | 889 | 8.9% |
전주 | 219 | 2.2% |
강릉 | 124 | 1.2% |
제주도 | 107 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 3929 | |
대구광역시 | 1840 | |
광주광역시 | 1552 | 15.5% |
부산광역시 | 1340 | 13.4% |
대전광역시 | 889 | 8.9% |
전주 | 219 | 2.2% |
강릉 | 124 | 1.2% |
제주도 | 107 | 1.1% |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.978 | 0.098 | 0.062 | 0.246 | 0.044 | 0.061 | 0.246 |
회차 | 1.000 | 1.000 | 0.935 | 0.106 | 0.063 | 0.350 | 0.068 | 0.088 | 0.350 |
일련번호 | 0.978 | 0.935 | 1.000 | 0.107 | 0.047 | 0.485 | 0.037 | 0.080 | 0.485 |
성별 | 0.098 | 0.106 | 0.107 | 1.000 | 0.167 | 0.121 | 0.024 | 0.054 | 0.121 |
연령대 | 0.062 | 0.063 | 0.047 | 0.167 | 1.000 | 0.028 | 0.235 | 0.214 | 0.028 |
응시지역 | 0.246 | 0.350 | 0.485 | 0.121 | 0.028 | 1.000 | 0.127 | 0.164 | 1.000 |
졸업여부 | 0.044 | 0.068 | 0.037 | 0.024 | 0.235 | 0.127 | 1.000 | 0.691 | 0.127 |
합격여부 | 0.061 | 0.088 | 0.080 | 0.054 | 0.214 | 0.164 | 0.691 | 1.000 | 0.164 |
학교소재지 | 0.246 | 0.350 | 0.485 | 0.121 | 0.028 | 1.000 | 0.127 | 0.164 | 1.000 |
졸업여부 | 합격여부 | 학교소재지 | 연령대 | 응시지역 | 성별 | |
---|---|---|---|---|---|---|
졸업여부 | 1.000 | 0.489 | 0.095 | 0.156 | 0.095 | 0.015 |
합격여부 | 0.489 | 1.000 | 0.074 | 0.086 | 0.074 | 0.036 |
학교소재지 | 0.095 | 0.074 | 1.000 | 0.013 | 1.000 | 0.091 |
연령대 | 0.156 | 0.086 | 0.013 | 1.000 | 0.013 | 0.111 |
응시지역 | 0.095 | 0.074 | 1.000 | 0.013 | 1.000 | 0.091 |
성별 | 0.015 | 0.036 | 0.091 | 0.111 | 0.091 | 1.000 |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.994 | 0.986 | 0.080 | 0.030 | 0.130 | 0.052 | 0.040 | 0.130 |
회차 | 0.994 | 1.000 | 0.981 | 0.080 | 0.028 | 0.123 | 0.051 | 0.040 | 0.123 |
일련번호 | 0.986 | 0.981 | 1.000 | 0.082 | 0.028 | 0.256 | 0.029 | 0.048 | 0.256 |
성별 | 0.080 | 0.080 | 0.082 | 1.000 | 0.111 | 0.091 | 0.015 | 0.036 | 0.091 |
연령대 | 0.030 | 0.028 | 0.028 | 0.111 | 1.000 | 0.013 | 0.156 | 0.086 | 0.013 |
응시지역 | 0.130 | 0.123 | 0.256 | 0.091 | 0.013 | 1.000 | 0.095 | 0.074 | 1.000 |
졸업여부 | 0.052 | 0.051 | 0.029 | 0.015 | 0.156 | 0.095 | 1.000 | 0.489 | 0.095 |
합격여부 | 0.040 | 0.040 | 0.048 | 0.036 | 0.086 | 0.074 | 0.489 | 1.000 | 0.074 |
학교소재지 | 0.130 | 0.123 | 0.256 | 0.091 | 0.013 | 1.000 | 0.095 | 0.074 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
55014 | 2004 | 간호사 | 44 | 55015 | 여 | 20 | 대구광역시 | 졸업(수습) | 합격 | 대구광역시 |
57810 | 2004 | 간호사 | 44 | 57811 | 여 | 20 | 광주광역시 | 졸업(수습)예정 | 합격 | 광주광역시 |
81451 | 2006 | 간호사 | 46 | 81452 | 여 | 20 | 광주광역시 | 졸업(수습)예정 | 합격 | 광주광역시 |
75899 | 2006 | 간호사 | 46 | 75900 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
28714 | 2002 | 간호사 | 43 | 28715 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
50131 | 2004 | 간호사 | 44 | 50132 | 여 | 20 | 서울특별시 | 졸업(수습) | 결시 | 서울특별시 |
30960 | 2002 | 간호사 | 42 | 30961 | 여 | 20 | 서울특별시 | 졸업(수습) | 합격 | 서울특별시 |
56149 | 2004 | 간호사 | 44 | 56150 | 남 | 20 | 대구광역시 | 졸업(수습)예정 | 합격 | 대구광역시 |
30085 | 2002 | 간호사 | 43 | 30086 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
25636 | 2002 | 간호사 | 43 | 25637 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
73798 | 2006 | 간호사 | 46 | 73799 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
47901 | 2002 | 간호사 | 42 | 47902 | 여 | 20 | 광주광역시 | 졸업(수습)예정 | 합격 | 광주광역시 |
63003 | 2005 | 간호사 | 45 | 63004 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
77112 | 2006 | 간호사 | 46 | 77113 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
15710 | 2001 | 간호사 | 41 | 15711 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
89263 | 2007 | 간호사 | 47 | 89264 | 여 | 20 | 서울특별시 | 졸업(수습)예정 | 합격 | 서울특별시 |
3517 | 2000 | 간호사 | 40 | 3518 | 여 | 20 | 서울특별시 | 졸업(수습) | 불합격 | 서울특별시 |
40768 | 2002 | 간호사 | 43 | 40769 | 여 | 20 | 대구광역시 | 졸업(수습)예정 | 합격 | 대구광역시 |
68204 | 2005 | 간호사 | 45 | 68205 | 여 | 20 | 대구광역시 | 졸업(수습)예정 | 합격 | 대구광역시 |
93957 | 2007 | 간호사 | 47 | 93958 | 여 | 20 | 대구광역시 | 졸업(수습)예정 | 합격 | 대구광역시 |