Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 898.4 KiB |
Average record size in memory | 92.0 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 7 |
Dataset
Description | 위생사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15083488/fileData.do |
직종 has constant value "" | Constant |
연도 is highly overall correlated with 회차 and 1 other fields | High correlation |
회차 is highly overall correlated with 연도 and 1 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 1 other fields | High correlation |
응시지역 is highly overall correlated with 학교소재지 | High correlation |
학교소재지 is highly overall correlated with 응시지역 | High correlation |
연령대 is highly imbalanced (70.0%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 17:11:29.389916 |
---|---|
Analysis finished | 2023-12-12 17:11:31.861220 |
Duration | 2.47 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2004.1472 |
Minimum | 2000 |
---|---|
Maximum | 2008 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2000 |
Q1 | 2002 |
median | 2004 |
Q3 | 2006 |
95-th percentile | 2008 |
Maximum | 2008 |
Range | 8 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.3525487 |
---|---|
Coefficient of variation (CV) | 0.0011738403 |
Kurtosis | -1.0849946 |
Mean | 2004.1472 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.016500458 |
Sum | 20041472 |
Variance | 5.5344856 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2002 | 1797 | |
2006 | 1314 | |
2005 | 1278 | |
2004 | 1204 | |
2007 | 1123 | |
2003 | 1084 | |
2008 | 878 | |
2000 | 671 | 6.7% |
2001 | 651 | 6.5% |
Value | Count | Frequency (%) |
2000 | 671 | 6.7% |
2001 | 651 | 6.5% |
2002 | 1797 | |
2003 | 1084 | |
2004 | 1204 | |
2005 | 1278 | |
2006 | 1314 | |
2007 | 1123 | |
2008 | 878 |
Value | Count | Frequency (%) |
2008 | 878 | |
2007 | 1123 | |
2006 | 1314 | |
2005 | 1278 | |
2004 | 1204 | |
2003 | 1084 | |
2002 | 1797 | |
2001 | 651 | 6.5% |
2000 | 671 | 6.7% |
직종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
위생사 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 위생사 |
---|---|
2nd row | 위생사 |
3rd row | 위생사 |
4th row | 위생사 |
5th row | 위생사 |
Common Values
Value | Count | Frequency (%) |
위생사 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
위생사 | 10000 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 25.927 |
Minimum | 21 |
---|---|
Maximum | 30 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 21 |
---|---|
5-th percentile | 21 |
Q1 | 24 |
median | 26 |
Q3 | 28 |
95-th percentile | 30 |
Maximum | 30 |
Range | 9 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.6552921 |
---|---|
Coefficient of variation (CV) | 0.10241417 |
Kurtosis | -0.99589018 |
Mean | 25.927 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.23495161 |
Sum | 259270 |
Variance | 7.0505761 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
28 | 1314 | |
27 | 1278 | |
26 | 1204 | |
29 | 1123 | |
25 | 1084 | |
24 | 917 | |
23 | 880 | |
30 | 878 | |
21 | 671 | |
22 | 651 |
Value | Count | Frequency (%) |
21 | 671 | |
22 | 651 | |
23 | 880 | |
24 | 917 | |
25 | 1084 | |
26 | 1204 | |
27 | 1278 | |
28 | 1314 | |
29 | 1123 | |
30 | 878 |
Value | Count | Frequency (%) |
30 | 878 | |
29 | 1123 | |
28 | 1314 | |
27 | 1278 | |
26 | 1204 | |
25 | 1084 | |
24 | 917 | |
23 | 880 | |
22 | 651 | |
21 | 671 |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 47263.767 |
Minimum | 27 |
---|---|
Maximum | 95282 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 27 |
---|---|
5-th percentile | 4656.1 |
Q1 | 23793.75 |
median | 46996.5 |
Q3 | 70327.5 |
95-th percentile | 90618.65 |
Maximum | 95282 |
Range | 95255 |
Interquartile range (IQR) | 46533.75 |
Descriptive statistics
Standard deviation | 27331.413 |
---|---|
Coefficient of variation (CV) | 0.57827412 |
Kurtosis | -1.1751485 |
Mean | 47263.767 |
Median Absolute Deviation (MAD) | 23301.5 |
Skewness | 0.022988525 |
Sum | 4.7263767 × 108 |
Variance | 7.4700615 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
82826 | 1 | < 0.1% |
92386 | 1 | < 0.1% |
43004 | 1 | < 0.1% |
80307 | 1 | < 0.1% |
45851 | 1 | < 0.1% |
94101 | 1 | < 0.1% |
71853 | 1 | < 0.1% |
24789 | 1 | < 0.1% |
31374 | 1 | < 0.1% |
39218 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
27 | 1 | |
47 | 1 | |
72 | 1 | |
79 | 1 | |
84 | 1 | |
105 | 1 | |
111 | 1 | |
119 | 1 | |
133 | 1 | |
134 | 1 |
Value | Count | Frequency (%) |
95282 | 1 | |
95278 | 1 | |
95276 | 1 | |
95258 | 1 | |
95256 | 1 | |
95223 | 1 | |
95222 | 1 | |
95177 | 1 | |
95159 | 1 | |
95155 | 1 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여 | |
---|---|
남 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여 |
---|---|
2nd row | 여 |
3rd row | 여 |
4th row | 남 |
5th row | 여 |
Common Values
Value | Count | Frequency (%) |
여 | 8289 | |
남 | 1711 | 17.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 8289 | |
남 | 1711 | 17.1% |
연령대
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
20 | |
---|---|
30 | 864 |
40 | 212 |
50 | 31 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 20 |
---|---|
2nd row | 20 |
3rd row | 20 |
4th row | 40 |
5th row | 20 |
Common Values
Value | Count | Frequency (%) |
20 | 8893 | |
30 | 864 | 8.6% |
40 | 212 | 2.1% |
50 | 31 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20 | 8893 | |
30 | 864 | 8.6% |
40 | 212 | 2.1% |
50 | 31 | 0.3% |
응시지역
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
부산광역시 | |
대구광역시 | |
대전광역시 | |
광주광역시 | |
Other values (2) | 408 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.8776 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대구광역시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 부산광역시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 4233 | |
부산광역시 | 1906 | |
대구광역시 | 1517 | 15.2% |
대전광역시 | 1077 | 10.8% |
광주광역시 | 859 | 8.6% |
전주 | 298 | 3.0% |
원주 | 110 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 4233 | |
부산광역시 | 1906 | |
대구광역시 | 1517 | 15.2% |
대전광역시 | 1077 | 10.8% |
광주광역시 | 859 | 8.6% |
전주 | 298 | 3.0% |
원주 | 110 | 1.1% |
졸업여부
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
졸업예정 | |
---|---|
졸업 | |
202 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.2886 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업예정 |
---|---|
2nd row | 졸업 |
3rd row | 졸업예정 |
4th row | 졸업 |
5th row | 졸업 |
Common Values
Value | Count | Frequency (%) |
졸업예정 | 6544 | |
졸업 | 3254 | |
202 | 2.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업예정 | 6544 | |
졸업 | 3254 |
합격여부
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
불합격 | |
---|---|
합격 | |
결시 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.4552 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 결시 |
3rd row | 결시 |
4th row | 합격 |
5th row | 결시 |
Common Values
Value | Count | Frequency (%) |
불합격 | 4552 | |
합격 | 3222 | |
결시 | 2226 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
불합격 | 4552 | |
합격 | 3222 | |
결시 | 2226 |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 19 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
부산광역시 | |
경상북도 | |
경상남도 | |
Other values (14) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.2115 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 경상북도 |
---|---|
2nd row | 서울특별시 |
3rd row | 충청북도 |
4th row | 대전광역시 |
5th row | 경상남도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 1625 | |
서울특별시 | 1424 | |
부산광역시 | 1091 | |
경상북도 | 991 | |
경상남도 | 714 | |
대구광역시 | 618 | 6.2% |
대전광역시 | 551 | 5.5% |
전라북도 | 532 | 5.3% |
광주광역시 | 509 | 5.1% |
충청남도 | 459 | 4.6% |
Other values (9) | 1486 |
Length
Value | Count | Frequency (%) |
경기도 | 1625 | |
서울특별시 | 1424 | |
부산광역시 | 1091 | |
경상북도 | 991 | |
경상남도 | 714 | |
대구광역시 | 618 | 6.2% |
대전광역시 | 551 | 5.5% |
전라북도 | 532 | 5.3% |
광주광역시 | 509 | 5.1% |
충청남도 | 459 | 4.6% |
Other values (9) | 1486 |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.954 | 0.063 | 0.074 | 0.212 | 0.244 | 0.195 | 0.172 |
회차 | 1.000 | 1.000 | 0.989 | 0.074 | 0.063 | 0.227 | 0.258 | 0.230 | 0.170 |
일련번호 | 0.954 | 0.989 | 1.000 | 0.074 | 0.053 | 0.313 | 0.257 | 0.176 | 0.259 |
성별 | 0.063 | 0.074 | 0.074 | 1.000 | 0.144 | 0.016 | 0.000 | 0.020 | 0.156 |
연령대 | 0.074 | 0.063 | 0.053 | 0.144 | 1.000 | 0.000 | 0.241 | 0.088 | 0.285 |
응시지역 | 0.212 | 0.227 | 0.313 | 0.016 | 0.000 | 1.000 | 0.178 | 0.074 | 0.941 |
졸업여부 | 0.244 | 0.258 | 0.257 | 0.000 | 0.241 | 0.178 | 1.000 | 0.390 | 0.241 |
합격여부 | 0.195 | 0.230 | 0.176 | 0.020 | 0.088 | 0.074 | 0.390 | 1.000 | 0.115 |
학교소재지 | 0.172 | 0.170 | 0.259 | 0.156 | 0.285 | 0.941 | 0.241 | 0.115 | 1.000 |
학교소재지 | 합격여부 | 응시지역 | 성별 | 연령대 | 졸업여부 | |
---|---|---|---|---|---|---|
학교소재지 | 1.000 | 0.060 | 0.792 | 0.138 | 0.159 | 0.130 |
합격여부 | 0.060 | 1.000 | 0.049 | 0.032 | 0.083 | 0.142 |
응시지역 | 0.792 | 0.049 | 1.000 | 0.018 | 0.000 | 0.121 |
성별 | 0.138 | 0.032 | 0.018 | 1.000 | 0.095 | 0.000 |
연령대 | 0.159 | 0.083 | 0.000 | 0.095 | 1.000 | 0.230 |
졸업여부 | 0.130 | 0.142 | 0.121 | 0.000 | 0.230 | 1.000 |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.998 | 0.992 | 0.055 | 0.037 | 0.116 | 0.158 | 0.128 | 0.068 |
회차 | 0.998 | 1.000 | 0.994 | 0.057 | 0.038 | 0.116 | 0.159 | 0.141 | 0.064 |
일련번호 | 0.992 | 0.994 | 1.000 | 0.057 | 0.032 | 0.164 | 0.158 | 0.106 | 0.100 |
성별 | 0.055 | 0.057 | 0.057 | 1.000 | 0.095 | 0.018 | 0.000 | 0.032 | 0.138 |
연령대 | 0.037 | 0.038 | 0.032 | 0.095 | 1.000 | 0.000 | 0.230 | 0.083 | 0.159 |
응시지역 | 0.116 | 0.116 | 0.164 | 0.018 | 0.000 | 1.000 | 0.121 | 0.049 | 0.792 |
졸업여부 | 0.158 | 0.159 | 0.158 | 0.000 | 0.230 | 0.121 | 1.000 | 0.142 | 0.130 |
합격여부 | 0.128 | 0.141 | 0.106 | 0.032 | 0.083 | 0.049 | 0.142 | 1.000 | 0.060 |
학교소재지 | 0.068 | 0.064 | 0.100 | 0.138 | 0.159 | 0.792 | 0.130 | 0.060 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
82827 | 2007 | 위생사 | 29 | 82826 | 여 | 20 | 대구광역시 | 졸업예정 | 합격 | 경상북도 |
32988 | 2003 | 위생사 | 25 | 32987 | 여 | 20 | 서울특별시 | 졸업 | 결시 | 서울특별시 |
16089 | 2002 | 위생사 | 23 | 14408 | 여 | 20 | 서울특별시 | 졸업예정 | 결시 | 충청북도 |
63634 | 2006 | 위생사 | 28 | 63633 | 남 | 40 | 서울특별시 | 졸업 | 합격 | 대전광역시 |
8794 | 2001 | 위생사 | 22 | 8795 | 여 | 20 | 부산광역시 | 졸업 | 결시 | 경상남도 |
50102 | 2004 | 위생사 | 26 | 50101 | 여 | 20 | 대전광역시 | 졸업예정 | 결시 | 대전광역시 |
8852 | 2001 | 위생사 | 22 | 8853 | 여 | 20 | 부산광역시 | 졸업예정 | 합격 | 경상남도 |
86194 | 2007 | 위생사 | 29 | 86193 | 여 | 20 | 전주 | 졸업예정 | 결시 | 전라북도 |
37933 | 2003 | 위생사 | 25 | 37932 | 여 | 20 | 광주광역시 | 졸업예정 | 결시 | 광주광역시 |
25866 | 2002 | 위생사 | 23 | 19434 | 여 | 20 | 대전광역시 | 졸업예정 | 결시 | 대전광역시 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
75195 | 2006 | 위생사 | 28 | 75194 | 여 | 20 | 원주 | 졸업예정 | 불합격 | 경상북도 |
1666 | 2000 | 위생사 | 21 | 1667 | 남 | 20 | 서울특별시 | 졸업 | 불합격 | 서울특별시 |
90086 | 2008 | 위생사 | 30 | 90085 | 여 | 20 | 서울특별시 | 졸업예정 | 불합격 | 서울특별시 |
17525 | 2002 | 위생사 | 23 | 15126 | 남 | 20 | 서울특별시 | 졸업예정 | 불합격 | 경기도 |
11285 | 2001 | 위생사 | 22 | 11286 | 여 | 20 | 대전광역시 | 졸업예정 | 합격 | 전라북도 |
81241 | 2007 | 위생사 | 29 | 81240 | 여 | 20 | 부산광역시 | 졸업예정 | 합격 | 부산광역시 |
37286 | 2003 | 위생사 | 25 | 37285 | 여 | 20 | 광주광역시 | 졸업예정 | 합격 | 전라남도 |
35325 | 2003 | 위생사 | 25 | 35324 | 남 | 20 | 부산광역시 | 졸업예정 | 불합격 | 부산광역시 |
2398 | 2000 | 위생사 | 21 | 2399 | 여 | 20 | 부산광역시 | 졸업 | 불합격 | 부산광역시 |
80215 | 2007 | 위생사 | 29 | 80214 | 여 | 20 | 서울특별시 | 졸업 | 불합격 | 서울특별시 |