Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 2598 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 213.2 KiB |
Average record size in memory | 84.1 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 7 |
Dataset
Description | 치과위생사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15083497/fileData.do |
직종 has constant value "" | Constant |
연도 is highly overall correlated with 회차 and 1 other fields | High correlation |
회차 is highly overall correlated with 연도 and 1 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 2 other fields | High correlation |
응시지역 is highly overall correlated with 일련번호 and 1 other fields | High correlation |
학교소재지 is highly overall correlated with 응시지역 | High correlation |
졸업여부 is highly imbalanced (85.0%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 21:49:01.204949 |
---|---|
Analysis finished | 2023-12-12 21:49:02.869282 |
Duration | 1.66 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2020.4911 |
Minimum | 2018 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 23.0 KiB |
Quantile statistics
Minimum | 2018 |
---|---|
5-th percentile | 2018 |
Q1 | 2019 |
median | 2021 |
Q3 | 2022 |
95-th percentile | 2023 |
Maximum | 2023 |
Range | 5 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 1.927977 |
---|---|
Coefficient of variation (CV) | 0.00095421204 |
Kurtosis | -1.5468782 |
Mean | 2020.4911 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.028465192 |
Sum | 5249236 |
Variance | 3.7170953 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
2018 | 649 | |
2023 | 580 | |
2022 | 450 | |
2019 | 365 | |
2021 | 299 | |
2020 | 255 | 9.8% |
Value | Count | Frequency (%) |
2018 | 649 | |
2019 | 365 | |
2020 | 255 | 9.8% |
2021 | 299 | |
2022 | 450 | |
2023 | 580 |
Value | Count | Frequency (%) |
2023 | 580 | |
2022 | 450 | |
2021 | 299 | |
2020 | 255 | 9.8% |
2019 | 365 | |
2018 | 649 |
직종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
1급 장애인재활상담사 |
---|
Length
Max length | 11 |
---|---|
Median length | 11 |
Mean length | 11 |
Min length | 11 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1급 장애인재활상담사 |
---|---|
2nd row | 1급 장애인재활상담사 |
3rd row | 1급 장애인재활상담사 |
4th row | 1급 장애인재활상담사 |
5th row | 1급 장애인재활상담사 |
Common Values
Value | Count | Frequency (%) |
1급 장애인재활상담사 | 2598 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1급 | 2598 | |
장애인재활상담사 | 2598 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.3645112 |
Minimum | 1 |
---|---|
Maximum | 7 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 23.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 5 |
Q3 | 6 |
95-th percentile | 7 |
Maximum | 7 |
Range | 6 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 2.1116148 |
---|---|
Coefficient of variation (CV) | 0.48381474 |
Kurtosis | -1.3596355 |
Mean | 4.3645112 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.20618337 |
Sum | 11339 |
Variance | 4.4589172 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
7 | 580 | |
6 | 450 | |
3 | 365 | |
1 | 329 | |
2 | 320 | |
5 | 299 | |
4 | 255 |
Value | Count | Frequency (%) |
1 | 329 | |
2 | 320 | |
3 | 365 | |
4 | 255 | |
5 | 299 | |
6 | 450 | |
7 | 580 |
Value | Count | Frequency (%) |
7 | 580 | |
6 | 450 | |
5 | 299 | |
4 | 255 | |
3 | 365 | |
2 | 320 | |
1 | 329 |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 2598 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1299.5 |
Minimum | 1 |
---|---|
Maximum | 2598 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 23.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 130.85 |
Q1 | 650.25 |
median | 1299.5 |
Q3 | 1948.75 |
95-th percentile | 2468.15 |
Maximum | 2598 |
Range | 2597 |
Interquartile range (IQR) | 1298.5 |
Descriptive statistics
Standard deviation | 750.12232 |
---|---|
Coefficient of variation (CV) | 0.57723919 |
Kurtosis | -1.2 |
Mean | 1299.5 |
Median Absolute Deviation (MAD) | 649.5 |
Skewness | 0 |
Sum | 3376101 |
Variance | 562683.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
1747 | 1 | < 0.1% |
1729 | 1 | < 0.1% |
1730 | 1 | < 0.1% |
1731 | 1 | < 0.1% |
1732 | 1 | < 0.1% |
1733 | 1 | < 0.1% |
1734 | 1 | < 0.1% |
1735 | 1 | < 0.1% |
1736 | 1 | < 0.1% |
Other values (2588) | 2588 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
2598 | 1 | |
2597 | 1 | |
2596 | 1 | |
2595 | 1 | |
2594 | 1 | |
2593 | 1 | |
2592 | 1 | |
2591 | 1 | |
2590 | 1 | |
2589 | 1 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
여 | |
---|---|
남 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 여 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
여 | 1576 | |
남 | 1022 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 1576 | |
남 | 1022 |
연령대
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
30 | |
---|---|
40 | |
20 | |
50 | |
60 | 17 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 30 |
---|---|
2nd row | 30 |
3rd row | 30 |
4th row | 50 |
5th row | 30 |
Common Values
Value | Count | Frequency (%) |
30 | 860 | |
40 | 772 | |
20 | 671 | |
50 | 278 | 10.7% |
60 | 17 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
30 | 860 | |
40 | 772 | |
20 | 671 | |
50 | 278 | 10.7% |
60 | 17 | 0.7% |
응시지역
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
서울특별시 | |
---|---|
대구광역시 | |
전주 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.5819861 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 1829 | |
대구광역시 | 407 | 15.7% |
전주 | 362 | 13.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 1829 | |
대구광역시 | 407 | 15.7% |
전주 | 362 | 13.9% |
졸업여부
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
졸업 | |
---|---|
졸업예정 | 56 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0431101 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업 |
---|---|
2nd row | 졸업 |
3rd row | 졸업 |
4th row | 졸업 |
5th row | 졸업 |
Common Values
Value | Count | Frequency (%) |
졸업 | 2542 | |
졸업예정 | 56 | 2.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업 | 2542 | |
졸업예정 | 56 | 2.2% |
합격여부
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
합격 | |
---|---|
불합격 | |
결시 | |
응시결격 | 6 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.243649 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 불합격 |
---|---|
2nd row | 합격 |
3rd row | 불합격 |
4th row | 결시 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 1692 | |
불합격 | 621 | 23.9% |
결시 | 279 | 10.7% |
응시결격 | 6 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 1692 | |
불합격 | 621 | 23.9% |
결시 | 279 | 10.7% |
응시결격 | 6 | 0.2% |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.4 KiB |
경상북도 | |
---|---|
경기도 | |
충청남도 | |
서울특별시 | |
전라북도 | |
Other values (17) |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 3.9996151 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 충청북도 |
---|---|
2nd row | 충청남도 |
3rd row | 전라북도 |
4th row | 경기도 |
5th row | 충청남도 |
Common Values
Value | Count | Frequency (%) |
경상북도 | 555 | |
경기도 | 472 | |
충청남도 | 380 | |
서울특별시 | 322 | |
전라북도 | 293 | |
부산광역시 | 126 | 4.8% |
광주광역시 | 98 | 3.8% |
충청북도 | 49 | 1.9% |
대전광역시 | 47 | 1.8% |
전라남도 | 46 | 1.8% |
Other values (12) | 210 | 8.1% |
Length
Value | Count | Frequency (%) |
경상북도 | 555 | |
경기도 | 472 | |
충청남도 | 380 | |
서울특별시 | 322 | |
전라북도 | 293 | |
부산광역시 | 126 | 4.8% |
광주광역시 | 98 | 3.8% |
충청북도 | 49 | 1.9% |
대전광역시 | 47 | 1.8% |
전라남도 | 46 | 1.8% |
Other values (12) | 210 | 8.1% |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.949 | 0.005 | 0.548 | 0.079 | 0.126 | 0.202 | 0.315 |
회차 | 1.000 | 1.000 | 0.956 | 0.028 | 0.386 | 0.372 | 0.156 | 0.296 | 0.309 |
일련번호 | 0.949 | 0.956 | 1.000 | 0.032 | 0.544 | 0.655 | 0.218 | 0.322 | 0.413 |
성별 | 0.005 | 0.028 | 0.032 | 1.000 | 0.113 | 0.000 | 0.102 | 0.164 | 0.000 |
연령대 | 0.548 | 0.386 | 0.544 | 0.113 | 1.000 | 0.108 | 0.189 | 0.182 | 0.425 |
응시지역 | 0.079 | 0.372 | 0.655 | 0.000 | 0.108 | 1.000 | 0.000 | 0.052 | 0.833 |
졸업여부 | 0.126 | 0.156 | 0.218 | 0.102 | 0.189 | 0.000 | 1.000 | 0.093 | 0.100 |
합격여부 | 0.202 | 0.296 | 0.322 | 0.164 | 0.182 | 0.052 | 0.093 | 1.000 | 0.147 |
학교소재지 | 0.315 | 0.309 | 0.413 | 0.000 | 0.425 | 0.833 | 0.100 | 0.147 | 1.000 |
성별 | 합격여부 | 학교소재지 | 연령대 | 응시지역 | 졸업여부 | |
---|---|---|---|---|---|---|
성별 | 1.000 | 0.109 | 0.000 | 0.138 | 0.000 | 0.065 |
합격여부 | 0.109 | 1.000 | 0.080 | 0.150 | 0.049 | 0.061 |
학교소재지 | 0.000 | 0.080 | 1.000 | 0.223 | 0.579 | 0.088 |
연령대 | 0.138 | 0.150 | 0.223 | 1.000 | 0.081 | 0.231 |
응시지역 | 0.000 | 0.049 | 0.579 | 0.081 | 1.000 | 0.000 |
졸업여부 | 0.065 | 0.061 | 0.088 | 0.231 | 0.000 | 1.000 |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 0.994 | 0.981 | 0.034 | 0.259 | 0.271 | 0.167 | 0.187 | 0.132 |
회차 | 0.994 | 1.000 | 0.987 | 0.029 | 0.259 | 0.270 | 0.166 | 0.207 | 0.120 |
일련번호 | 0.981 | 0.987 | 1.000 | 0.025 | 0.256 | 0.504 | 0.167 | 0.197 | 0.165 |
성별 | 0.034 | 0.029 | 0.025 | 1.000 | 0.138 | 0.000 | 0.065 | 0.109 | 0.000 |
연령대 | 0.259 | 0.259 | 0.256 | 0.138 | 1.000 | 0.081 | 0.231 | 0.150 | 0.223 |
응시지역 | 0.271 | 0.270 | 0.504 | 0.000 | 0.081 | 1.000 | 0.000 | 0.049 | 0.579 |
졸업여부 | 0.167 | 0.166 | 0.167 | 0.065 | 0.231 | 0.000 | 1.000 | 0.061 | 0.088 |
합격여부 | 0.187 | 0.207 | 0.197 | 0.109 | 0.150 | 0.049 | 0.061 | 1.000 | 0.080 |
학교소재지 | 0.132 | 0.120 | 0.165 | 0.000 | 0.223 | 0.579 | 0.088 | 0.080 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 2018 | 1급 장애인재활상담사 | 1 | 1 | 남 | 30 | 서울특별시 | 졸업 | 불합격 | 충청북도 |
1 | 2018 | 1급 장애인재활상담사 | 1 | 2 | 여 | 30 | 서울특별시 | 졸업 | 합격 | 충청남도 |
2 | 2018 | 1급 장애인재활상담사 | 1 | 3 | 남 | 30 | 서울특별시 | 졸업 | 불합격 | 전라북도 |
3 | 2018 | 1급 장애인재활상담사 | 1 | 4 | 남 | 50 | 서울특별시 | 졸업 | 결시 | 경기도 |
4 | 2018 | 1급 장애인재활상담사 | 1 | 5 | 남 | 30 | 서울특별시 | 졸업 | 합격 | 충청남도 |
5 | 2018 | 1급 장애인재활상담사 | 1 | 6 | 여 | 30 | 서울특별시 | 졸업 | 합격 | 서울특별시 |
6 | 2018 | 1급 장애인재활상담사 | 1 | 7 | 여 | 40 | 서울특별시 | 졸업 | 합격 | 전라북도 |
7 | 2018 | 1급 장애인재활상담사 | 1 | 8 | 여 | 30 | 서울특별시 | 졸업 | 합격 | 충청남도 |
8 | 2018 | 1급 장애인재활상담사 | 1 | 9 | 여 | 40 | 서울특별시 | 졸업 | 합격 | 서울특별시 |
9 | 2018 | 1급 장애인재활상담사 | 1 | 10 | 남 | 40 | 서울특별시 | 졸업 | 합격 | 강원도 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
2588 | 2023 | 1급 장애인재활상담사 | 7 | 2589 | 여 | 30 | 전주 | 졸업 | 결시 | 전라북도 |
2589 | 2023 | 1급 장애인재활상담사 | 7 | 2590 | 남 | 40 | 전주 | 졸업 | 불합격 | 광주광역시 |
2590 | 2023 | 1급 장애인재활상담사 | 7 | 2591 | 남 | 40 | 전주 | 졸업 | 합격 | 충청남도 |
2591 | 2023 | 1급 장애인재활상담사 | 7 | 2592 | 여 | 30 | 전주 | 졸업 | 합격 | 광주광역시 |
2592 | 2023 | 1급 장애인재활상담사 | 7 | 2593 | 여 | 30 | 전주 | 졸업 | 응시결격 | 전라북도 |
2593 | 2023 | 1급 장애인재활상담사 | 7 | 2594 | 여 | 20 | 전주 | 졸업 | 합격 | 전라북도 |
2594 | 2023 | 1급 장애인재활상담사 | 7 | 2595 | 남 | 20 | 전주 | 졸업예정 | 합격 | 전라북도 |
2595 | 2023 | 1급 장애인재활상담사 | 7 | 2596 | 남 | 20 | 전주 | 졸업 | 합격 | 전라북도 |
2596 | 2023 | 1급 장애인재활상담사 | 7 | 2597 | 남 | 20 | 전주 | 졸업 | 합격 | 전라북도 |
2597 | 2023 | 1급 장애인재활상담사 | 7 | 2598 | 여 | 20 | 전주 | 졸업 | 합격 | 전라북도 |