Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 820.3 KiB |
Average record size in memory | 84.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 7 |
Dataset
Description | 요양보호사 자격시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15101120/fileData.do |
연도 has constant value "" | Constant |
직종 has constant value "" | Constant |
일련번호 is highly overall correlated with 회차 and 2 other fields | High correlation |
회차 is highly overall correlated with 일련번호 and 1 other fields | High correlation |
응시지역 is highly overall correlated with 일련번호 and 2 other fields | High correlation |
학교소재지 is highly overall correlated with 일련번호 and 1 other fields | High correlation |
합격여부 is highly imbalanced (59.8%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 10:35:56.260484 |
---|---|
Analysis finished | 2023-12-12 10:35:58.409036 |
Duration | 2.15 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 72758.077 |
Minimum | 2 |
---|---|
Maximum | 186378 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 4576.9 |
Q1 | 23681.75 |
median | 47106 |
Q3 | 162172.75 |
95-th percentile | 181645.65 |
Maximum | 186378 |
Range | 186376 |
Interquartile range (IQR) | 138491 |
Descriptive statistics
Standard deviation | 64577.99 |
---|---|
Coefficient of variation (CV) | 0.88757143 |
Kurtosis | -1.0783933 |
Mean | 72758.077 |
Median Absolute Deviation (MAD) | 25963 |
Skewness | 0.78447414 |
Sum | 7.2758077 × 108 |
Variance | 4.1703168 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
38195 | 1 | < 0.1% |
43411 | 1 | < 0.1% |
166964 | 1 | < 0.1% |
12959 | 1 | < 0.1% |
47805 | 1 | < 0.1% |
170362 | 1 | < 0.1% |
10846 | 1 | < 0.1% |
181551 | 1 | < 0.1% |
169884 | 1 | < 0.1% |
182286 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
2 | 1 | |
34 | 1 | |
46 | 1 | |
64 | 1 | |
65 | 1 | |
77 | 1 | |
82 | 1 | |
83 | 1 | |
89 | 1 | |
93 | 1 |
Value | Count | Frequency (%) |
186378 | 1 | |
186354 | 1 | |
186350 | 1 | |
186339 | 1 | |
186336 | 1 | |
186332 | 1 | |
186315 | 1 | |
186310 | 1 | |
186300 | 1 | |
186287 | 1 |
연도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2020 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2020 |
---|---|
2nd row | 2020 |
3rd row | 2020 |
4th row | 2020 |
5th row | 2020 |
Common Values
Value | Count | Frequency (%) |
2020 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2020 | 10000 |
직종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
요양보호사 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 요양보호사 |
---|---|
2nd row | 요양보호사 |
3rd row | 요양보호사 |
4th row | 요양보호사 |
5th row | 요양보호사 |
Common Values
Value | Count | Frequency (%) |
요양보호사 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
요양보호사 | 10000 |
회차
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
30 | |
---|---|
32 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 30 |
---|---|
2nd row | 32 |
3rd row | 32 |
4th row | 32 |
5th row | 30 |
Common Values
Value | Count | Frequency (%) |
30 | 5817 | |
32 | 4183 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
30 | 5817 | |
32 | 4183 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여 | |
---|---|
남 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여 |
---|---|
2nd row | 여 |
3rd row | 여 |
4th row | 여 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
여 | 8862 | |
남 | 1138 | 11.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 8862 | |
남 | 1138 | 11.4% |
연령대
Real number (ℝ)
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 51.826 |
Minimum | 10 |
---|---|
Maximum | 80 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 10 |
---|---|
5-th percentile | 40 |
Q1 | 50 |
median | 50 |
Q3 | 60 |
95-th percentile | 70 |
Maximum | 80 |
Range | 70 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 9.6630772 |
---|---|
Coefficient of variation (CV) | 0.18645231 |
Kurtosis | 0.75459114 |
Mean | 51.826 |
Median Absolute Deviation (MAD) | 10 |
Skewness | -0.51633661 |
Sum | 518260 |
Variance | 93.375062 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
50 | 4067 | |
60 | 3387 | |
40 | 1571 | 15.7% |
70 | 475 | 4.8% |
30 | 339 | 3.4% |
20 | 123 | 1.2% |
80 | 37 | 0.4% |
10 | 1 | < 0.1% |
Value | Count | Frequency (%) |
10 | 1 | < 0.1% |
20 | 123 | 1.2% |
30 | 339 | 3.4% |
40 | 1571 | 15.7% |
50 | 4067 | |
60 | 3387 | |
70 | 475 | 4.8% |
80 | 37 | 0.4% |
Value | Count | Frequency (%) |
80 | 37 | 0.4% |
70 | 475 | 4.8% |
60 | 3387 | |
50 | 4067 | |
40 | 1571 | 15.7% |
30 | 339 | 3.4% |
20 | 123 | 1.2% |
10 | 1 | < 0.1% |
응시지역
Categorical
HIGH CORRELATION
 
Distinct | 21 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
인천광역시 | |
부산광역시 | |
대구광역시 | |
광주광역시 | |
Other values (16) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.6268 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 홍성(충남) |
---|---|
2nd row | 대구광역시 |
3rd row | 부산광역시 |
4th row | 인천광역시 |
5th row | 수원,화성 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 2559 | |
인천광역시 | 1182 | |
부산광역시 | 1150 | |
대구광역시 | 1092 | |
광주광역시 | 739 | 7.4% |
수원,화성 | 558 | 5.6% |
의정부,양주 | 458 | 4.6% |
창원 | 365 | 3.6% |
대전광역시 | 292 | 2.9% |
전주 | 273 | 2.7% |
Other values (11) | 1332 |
Length
Value | Count | Frequency (%) |
서울특별시 | 2559 | |
인천광역시 | 1182 | |
부산광역시 | 1150 | |
대구광역시 | 1092 | |
광주광역시 | 739 | 7.4% |
수원,화성 | 558 | 5.6% |
의정부,양주 | 458 | 4.6% |
창원 | 365 | 3.6% |
대전광역시 | 292 | 2.9% |
전주 | 273 | 2.7% |
Other values (11) | 1332 |
합격여부
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
합격 | |
---|---|
불합격 | |
결시 | 419 |
응시결격 | 3 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1309 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 불합격 |
---|---|
2nd row | 합격 |
3rd row | 불합격 |
4th row | 합격 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 8275 | |
불합격 | 1303 | 13.0% |
결시 | 419 | 4.2% |
응시결격 | 3 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 8275 | |
불합격 | 1303 | 13.0% |
결시 | 419 | 4.2% |
응시결격 | 3 | < 0.1% |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 19 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
수원 | |
부산광역시 | |
인천광역시 | |
경상남도 | |
Other values (14) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.2463 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 충청남도 |
---|---|
2nd row | 경상북도 |
3rd row | 부산광역시 |
4th row | 인천광역시 |
5th row | 수원 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 2183 | |
수원 | 1292 | |
부산광역시 | 1021 | |
인천광역시 | 739 | 7.4% |
경상남도 | 680 | 6.8% |
광주광역시 | 669 | 6.7% |
대구광역시 | 666 | 6.7% |
의정부 | 522 | 5.2% |
경상북도 | 518 | 5.2% |
전라남도 | 360 | 3.6% |
Other values (9) | 1350 |
Length
Value | Count | Frequency (%) |
서울특별시 | 2183 | |
수원 | 1292 | |
부산광역시 | 1021 | |
인천광역시 | 739 | 7.4% |
경상남도 | 680 | 6.8% |
광주광역시 | 669 | 6.7% |
대구광역시 | 666 | 6.7% |
의정부 | 522 | 5.2% |
경상북도 | 518 | 5.2% |
전라남도 | 360 | 3.6% |
Other values (9) | 1350 |
일련번호 | 회차 | 성별 | 연령대 | 응시지역 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|
일련번호 | 1.000 | 1.000 | 0.033 | 0.078 | 0.912 | 0.092 | 0.844 |
회차 | 1.000 | 1.000 | 0.016 | 0.091 | 0.665 | 0.074 | 0.532 |
성별 | 0.033 | 0.016 | 1.000 | 0.272 | 0.062 | 0.043 | 0.062 |
연령대 | 0.078 | 0.091 | 0.272 | 1.000 | 0.165 | 0.281 | 0.163 |
응시지역 | 0.912 | 0.665 | 0.062 | 0.165 | 1.000 | 0.128 | 0.981 |
합격여부 | 0.092 | 0.074 | 0.043 | 0.281 | 0.128 | 1.000 | 0.137 |
학교소재지 | 0.844 | 0.532 | 0.062 | 0.163 | 0.981 | 0.137 | 1.000 |
회차 | 합격여부 | 학교소재지 | 응시지역 | 성별 | |
---|---|---|---|---|---|
회차 | 1.000 | 0.049 | 0.474 | 0.593 | 0.010 |
합격여부 | 0.049 | 1.000 | 0.075 | 0.069 | 0.028 |
학교소재지 | 0.474 | 0.075 | 1.000 | 0.826 | 0.055 |
응시지역 | 0.593 | 0.069 | 0.826 | 1.000 | 0.055 |
성별 | 0.010 | 0.028 | 0.055 | 0.055 | 1.000 |
일련번호 | 연령대 | 회차 | 성별 | 응시지역 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|
일련번호 | 1.000 | 0.019 | 0.982 | 0.024 | 0.704 | 0.060 | 0.596 |
연령대 | 0.019 | 1.000 | 0.068 | 0.204 | 0.069 | 0.129 | 0.069 |
회차 | 0.982 | 0.068 | 1.000 | 0.010 | 0.593 | 0.049 | 0.474 |
성별 | 0.024 | 0.204 | 0.010 | 1.000 | 0.055 | 0.028 | 0.055 |
응시지역 | 0.704 | 0.069 | 0.593 | 0.055 | 1.000 | 0.069 | 0.826 |
합격여부 | 0.060 | 0.129 | 0.049 | 0.028 | 0.069 | 1.000 | 0.075 |
학교소재지 | 0.596 | 0.069 | 0.474 | 0.055 | 0.826 | 0.075 | 1.000 |
일련번호 | 연도 | 직종 | 회차 | 성별 | 연령대 | 응시지역 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
42709 | 38195 | 2020 | 요양보호사 | 30 | 여 | 50 | 홍성(충남) | 불합격 | 충청남도 |
83103 | 67321 | 2020 | 요양보호사 | 32 | 여 | 50 | 대구광역시 | 합격 | 경상북도 |
71966 | 56184 | 2020 | 요양보호사 | 32 | 여 | 60 | 부산광역시 | 불합격 | 부산광역시 |
90399 | 181485 | 2020 | 요양보호사 | 32 | 여 | 40 | 인천광역시 | 합격 | 인천광역시 |
52263 | 46880 | 2020 | 요양보호사 | 30 | 남 | 60 | 수원,화성 | 합격 | 수원 |
12990 | 50012 | 2020 | 요양보호사 | 30 | 여 | 60 | 대구광역시 | 합격 | 대구광역시 |
45494 | 40111 | 2020 | 요양보호사 | 30 | 남 | 60 | 의정부,양주 | 합격 | 서울특별시 |
89185 | 180271 | 2020 | 요양보호사 | 32 | 여 | 50 | 인천광역시 | 합격 | 수원 |
24004 | 19490 | 2020 | 요양보호사 | 30 | 여 | 60 | 광주광역시 | 합격 | 광주광역시 |
37734 | 33220 | 2020 | 요양보호사 | 30 | 남 | 50 | 창원 | 합격 | 경상남도 |
일련번호 | 연도 | 직종 | 회차 | 성별 | 연령대 | 응시지역 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
85548 | 176634 | 2020 | 요양보호사 | 32 | 여 | 60 | 인천광역시 | 합격 | 인천광역시 |
50973 | 45590 | 2020 | 요양보호사 | 30 | 여 | 50 | 수원,화성 | 합격 | 수원 |
53588 | 48205 | 2020 | 요양보호사 | 30 | 여 | 50 | 수원,화성 | 합격 | 수원 |
58498 | 162883 | 2020 | 요양보호사 | 32 | 여 | 50 | 서울특별시 | 합격 | 수원 |
86714 | 177800 | 2020 | 요양보호사 | 32 | 여 | 50 | 인천광역시 | 합격 | 수원 |
14253 | 51275 | 2020 | 요양보호사 | 30 | 여 | 70 | 대구광역시 | 불합격 | 대구광역시 |
12373 | 12374 | 2020 | 요양보호사 | 30 | 여 | 50 | 부산광역시 | 합격 | 부산광역시 |
8708 | 8709 | 2020 | 요양보호사 | 30 | 여 | 50 | 서울특별시 | 합격 | 의정부 |
50245 | 44862 | 2020 | 요양보호사 | 30 | 여 | 40 | 수원,화성 | 합격 | 수원 |
82983 | 67201 | 2020 | 요양보호사 | 32 | 여 | 40 | 대구광역시 | 합격 | 경상북도 |