Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 898.4 KiB |
Average record size in memory | 92.0 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 7 |
Dataset
Description | 영양사 국가시험 응시자의 현황을 분석할 수 있는 정보(연도, 직종, 회차, 성별, 연령대, 응시지역, 졸업여부, 합격여부, 학교소재지)를 개인을 식별할 수 없는 형태로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15060461/fileData.do |
직종 has constant value "" | Constant |
연도 is highly overall correlated with 회차 and 1 other fields | High correlation |
회차 is highly overall correlated with 연도 and 1 other fields | High correlation |
일련번호 is highly overall correlated with 연도 and 1 other fields | High correlation |
응시지역 is highly overall correlated with 학교소재지 | High correlation |
학교소재지 is highly overall correlated with 응시지역 | High correlation |
성별 is highly imbalanced (66.9%) | Imbalance |
연령대 is highly imbalanced (72.6%) | Imbalance |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-11 23:50:35.176668 |
---|---|
Analysis finished | 2023-12-11 23:50:37.248022 |
Duration | 2.07 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2004.6805 |
Minimum | 2000 |
---|---|
Maximum | 2010 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 2000 |
Q1 | 2002 |
median | 2005 |
Q3 | 2007 |
95-th percentile | 2009 |
Maximum | 2010 |
Range | 10 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 2.9686194 |
---|---|
Coefficient of variation (CV) | 0.0014808441 |
Kurtosis | -1.2115924 |
Mean | 2004.6805 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.0035728729 |
Sum | 20046805 |
Variance | 8.812701 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2008 | 1033 | |
2009 | 1030 | |
2002 | 1025 | |
2003 | 999 | |
2005 | 991 | |
2007 | 974 | |
2000 | 958 | |
2006 | 934 | |
2001 | 919 | |
2004 | 907 |
Value | Count | Frequency (%) |
2000 | 958 | |
2001 | 919 | |
2002 | 1025 | |
2003 | 999 | |
2004 | 907 | |
2005 | 991 | |
2006 | 934 | |
2007 | 974 | |
2008 | 1033 | |
2009 | 1030 |
Value | Count | Frequency (%) |
2010 | 230 | 2.3% |
2009 | 1030 | |
2008 | 1033 | |
2007 | 974 | |
2006 | 934 | |
2005 | 991 | |
2004 | 907 | |
2003 | 999 | |
2002 | 1025 | |
2001 | 919 |
직종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
영양사 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 영양사 |
---|---|
2nd row | 영양사 |
3rd row | 영양사 |
4th row | 영양사 |
5th row | 영양사 |
Common Values
Value | Count | Frequency (%) |
영양사 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
영양사 | 10000 |
회차
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 27.6805 |
Minimum | 23 |
---|---|
Maximum | 33 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 23 |
---|---|
5-th percentile | 23 |
Q1 | 25 |
median | 28 |
Q3 | 30 |
95-th percentile | 32 |
Maximum | 33 |
Range | 10 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 2.9686194 |
---|---|
Coefficient of variation (CV) | 0.10724587 |
Kurtosis | -1.2115924 |
Mean | 27.6805 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.0035728729 |
Sum | 276805 |
Variance | 8.812701 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
31 | 1033 | |
32 | 1030 | |
25 | 1025 | |
26 | 999 | |
28 | 991 | |
30 | 974 | |
23 | 958 | |
29 | 934 | |
24 | 919 | |
27 | 907 |
Value | Count | Frequency (%) |
23 | 958 | |
24 | 919 | |
25 | 1025 | |
26 | 999 | |
27 | 907 | |
28 | 991 | |
29 | 934 | |
30 | 974 | |
31 | 1033 | |
32 | 1030 |
Value | Count | Frequency (%) |
33 | 230 | 2.3% |
32 | 1030 | |
31 | 1033 | |
30 | 974 | |
29 | 934 | |
28 | 991 | |
27 | 907 | |
26 | 999 | |
25 | 1025 | |
24 | 919 |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 47438.092 |
Minimum | 6 |
---|---|
Maximum | 95292 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 6 |
---|---|
5-th percentile | 4433.95 |
Q1 | 23550.25 |
median | 47265.5 |
Q3 | 71343.75 |
95-th percentile | 90570.3 |
Maximum | 95292 |
Range | 95286 |
Interquartile range (IQR) | 47793.5 |
Descriptive statistics
Standard deviation | 27557.262 |
---|---|
Coefficient of variation (CV) | 0.58091001 |
Kurtosis | -1.200771 |
Mean | 47438.092 |
Median Absolute Deviation (MAD) | 23940.5 |
Skewness | 0.015338494 |
Sum | 4.7438092 × 108 |
Variance | 7.594027 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1111 | 1 | < 0.1% |
69235 | 1 | < 0.1% |
29044 | 1 | < 0.1% |
23688 | 1 | < 0.1% |
86156 | 1 | < 0.1% |
17886 | 1 | < 0.1% |
89729 | 1 | < 0.1% |
65879 | 1 | < 0.1% |
50607 | 1 | < 0.1% |
83465 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
6 | 1 | |
42 | 1 | |
51 | 1 | |
55 | 1 | |
66 | 1 | |
82 | 1 | |
83 | 1 | |
90 | 1 | |
94 | 1 | |
99 | 1 |
Value | Count | Frequency (%) |
95292 | 1 | |
95287 | 1 | |
95285 | 1 | |
95271 | 1 | |
95269 | 1 | |
95257 | 1 | |
95253 | 1 | |
95246 | 1 | |
95238 | 1 | |
95237 | 1 |
성별
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여 | |
---|---|
남 | 609 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여 |
---|---|
2nd row | 여 |
3rd row | 여 |
4th row | 여 |
5th row | 여 |
Common Values
Value | Count | Frequency (%) |
여 | 9391 | |
남 | 609 | 6.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 9391 | |
남 | 609 | 6.1% |
연령대
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
20 | |
---|---|
30 | 809 |
40 | 283 |
50 | 52 |
60 | 2 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 20 |
---|---|
2nd row | 20 |
3rd row | 20 |
4th row | 20 |
5th row | 20 |
Common Values
Value | Count | Frequency (%) |
20 | 8854 | |
30 | 809 | 8.1% |
40 | 283 | 2.8% |
50 | 52 | 0.5% |
60 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
20 | 8854 | |
30 | 809 | 8.1% |
40 | 283 | 2.8% |
50 | 52 | 0.5% |
60 | 2 | < 0.1% |
응시지역
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
서울특별시 | |
---|---|
부산광역시 | |
대구광역시 | |
대전광역시 | |
광주광역시 | |
Other values (2) | 421 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.8737 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 대구광역시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 부산광역시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 4706 | |
부산광역시 | 1679 | 16.8% |
대구광역시 | 1282 | 12.8% |
대전광역시 | 972 | 9.7% |
광주광역시 | 940 | 9.4% |
전주 | 306 | 3.1% |
원주 | 115 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 4706 | |
부산광역시 | 1679 | 16.8% |
대구광역시 | 1282 | 12.8% |
대전광역시 | 972 | 9.7% |
광주광역시 | 940 | 9.4% |
전주 | 306 | 3.1% |
원주 | 115 | 1.1% |
졸업여부
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
졸업예정 | |
---|---|
졸업 | |
125 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.3299 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 졸업예정 |
---|---|
2nd row | 졸업예정 |
3rd row | 졸업 |
4th row | 졸업예정 |
5th row | 졸업 |
Common Values
Value | Count | Frequency (%) |
졸업예정 | 6712 | |
졸업 | 3163 | |
125 | 1.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
졸업예정 | 6712 | |
졸업 | 3163 |
합격여부
Categorical
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
합격 | |
---|---|
불합격 | |
결시 | |
응시결격 | 4 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.4127 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 합격 |
3rd row | 합격 |
4th row | 결시 |
5th row | 불합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 4160 | |
불합격 | 4119 | |
결시 | 1717 | |
응시결격 | 4 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 4160 | |
불합격 | 4119 | |
결시 | 1717 | |
응시결격 | 4 | < 0.1% |
학교소재지
Categorical
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 | |
부산광역시 | |
경상북도 | |
경상남도 | |
Other values (12) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.2002 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 경기도 |
---|---|
2nd row | 경상북도 |
3rd row | 서울특별시 |
4th row | 경기도 |
5th row | 부산광역시 |
Common Values
Value | Count | Frequency (%) |
경기도 | 2051 | |
서울특별시 | 1549 | |
부산광역시 | 964 | |
경상북도 | 759 | 7.6% |
경상남도 | 638 | 6.4% |
대구광역시 | 631 | 6.3% |
광주광역시 | 600 | 6.0% |
대전광역시 | 576 | 5.8% |
전라북도 | 548 | 5.5% |
강원도 | 404 | 4.0% |
Other values (7) | 1280 |
Length
Value | Count | Frequency (%) |
경기도 | 2051 | |
서울특별시 | 1549 | |
부산광역시 | 964 | |
경상북도 | 759 | 7.6% |
경상남도 | 638 | 6.4% |
대구광역시 | 631 | 6.3% |
광주광역시 | 600 | 6.0% |
대전광역시 | 576 | 5.8% |
전라북도 | 548 | 5.5% |
강원도 | 404 | 4.0% |
Other values (7) | 1280 |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.983 | 0.019 | 0.167 | 0.200 | 0.233 | 0.132 | 0.136 |
회차 | 1.000 | 1.000 | 0.989 | 0.000 | 0.184 | 0.202 | 0.236 | 0.126 | 0.132 |
일련번호 | 0.983 | 0.989 | 1.000 | 0.014 | 0.180 | 0.158 | 0.217 | 0.109 | 0.112 |
성별 | 0.019 | 0.000 | 0.014 | 1.000 | 0.029 | 0.025 | 0.013 | 0.171 | 0.084 |
연령대 | 0.167 | 0.184 | 0.180 | 0.029 | 1.000 | 0.065 | 0.151 | 0.112 | 0.088 |
응시지역 | 0.200 | 0.202 | 0.158 | 0.025 | 0.065 | 1.000 | 0.044 | 0.040 | 0.943 |
졸업여부 | 0.233 | 0.236 | 0.217 | 0.013 | 0.151 | 0.044 | 1.000 | 0.254 | 0.096 |
합격여부 | 0.132 | 0.126 | 0.109 | 0.171 | 0.112 | 0.040 | 0.254 | 1.000 | 0.135 |
학교소재지 | 0.136 | 0.132 | 0.112 | 0.084 | 0.088 | 0.943 | 0.096 | 0.135 | 1.000 |
응시지역 | 성별 | 합격여부 | 학교소재지 | 졸업여부 | 연령대 | |
---|---|---|---|---|---|---|
응시지역 | 1.000 | 0.026 | 0.027 | 0.806 | 0.029 | 0.041 |
성별 | 0.026 | 1.000 | 0.113 | 0.075 | 0.022 | 0.035 |
합격여부 | 0.027 | 0.113 | 1.000 | 0.075 | 0.243 | 0.092 |
학교소재지 | 0.806 | 0.075 | 0.075 | 1.000 | 0.051 | 0.045 |
졸업여부 | 0.029 | 0.022 | 0.243 | 0.051 | 1.000 | 0.114 |
연령대 | 0.041 | 0.035 | 0.092 | 0.045 | 0.114 | 1.000 |
연도 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|
연도 | 1.000 | 1.000 | 0.995 | 0.013 | 0.079 | 0.104 | 0.145 | 0.072 | 0.053 |
회차 | 1.000 | 1.000 | 0.995 | 0.013 | 0.079 | 0.104 | 0.145 | 0.072 | 0.053 |
일련번호 | 0.995 | 0.995 | 1.000 | 0.011 | 0.076 | 0.080 | 0.132 | 0.066 | 0.044 |
성별 | 0.013 | 0.013 | 0.011 | 1.000 | 0.035 | 0.026 | 0.022 | 0.113 | 0.075 |
연령대 | 0.079 | 0.079 | 0.076 | 0.035 | 1.000 | 0.041 | 0.114 | 0.092 | 0.045 |
응시지역 | 0.104 | 0.104 | 0.080 | 0.026 | 0.041 | 1.000 | 0.029 | 0.027 | 0.806 |
졸업여부 | 0.145 | 0.145 | 0.132 | 0.022 | 0.114 | 0.029 | 1.000 | 0.243 | 0.051 |
합격여부 | 0.072 | 0.072 | 0.066 | 0.113 | 0.092 | 0.027 | 0.243 | 1.000 | 0.075 |
학교소재지 | 0.053 | 0.053 | 0.044 | 0.075 | 0.045 | 0.806 | 0.051 | 0.075 | 1.000 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
1110 | 2000 | 영양사 | 23 | 1111 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 경기도 |
33910 | 2003 | 영양사 | 26 | 33911 | 여 | 20 | 대구광역시 | 졸업예정 | 합격 | 경상북도 |
85330 | 2009 | 영양사 | 32 | 85331 | 여 | 20 | 서울특별시 | 졸업 | 합격 | 서울특별시 |
77280 | 2008 | 영양사 | 31 | 77281 | 여 | 20 | 서울특별시 | 졸업예정 | 결시 | 경기도 |
4746 | 2000 | 영양사 | 23 | 4747 | 여 | 20 | 부산광역시 | 졸업 | 불합격 | 부산광역시 |
20442 | 2002 | 영양사 | 25 | 20443 | 여 | 20 | 서울특별시 | 졸업예정 | 불합격 | 서울특별시 |
69662 | 2007 | 영양사 | 30 | 69663 | 여 | 20 | 부산광역시 | 졸업예정 | 합격 | 부산광역시 |
6717 | 2000 | 영양사 | 23 | 6718 | 여 | 20 | 대구광역시 | 졸업예정 | 불합격 | 경상북도 |
57898 | 2006 | 영양사 | 29 | 57899 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
67517 | 2007 | 영양사 | 30 | 67518 | 남 | 20 | 서울특별시 | 졸업예정 | 불합격 | 강원도 |
연도 | 직종 | 회차 | 일련번호 | 성별 | 연령대 | 응시지역 | 졸업여부 | 합격여부 | 학교소재지 | |
---|---|---|---|---|---|---|---|---|---|---|
5689 | 2000 | 영양사 | 23 | 5690 | 여 | 20 | 부산광역시 | 졸업예정 | 합격 | 부산광역시 |
50421 | 2005 | 영양사 | 28 | 50422 | 여 | 20 | 부산광역시 | 졸업예정 | 불합격 | 부산광역시 |
83551 | 2009 | 영양사 | 32 | 83552 | 여 | 20 | 서울특별시 | 졸업예정 | 결시 | 서울특별시 |
74933 | 2008 | 영양사 | 31 | 74934 | 여 | 30 | 서울특별시 | 졸업 | 불합격 | 경기도 |
48451 | 2005 | 영양사 | 28 | 48452 | 여 | 20 | 서울특별시 | 졸업예정 | 합격 | 서울특별시 |
87159 | 2009 | 영양사 | 32 | 87160 | 여 | 20 | 서울특별시 | 졸업예정 | 불합격 | 경기도 |
30326 | 2003 | 영양사 | 26 | 30327 | 여 | 20 | 서울특별시 | 졸업예정 | 불합격 | 강원도 |
32201 | 2003 | 영양사 | 26 | 32202 | 여 | 20 | 부산광역시 | 졸업예정 | 불합격 | 부산광역시 |
65053 | 2007 | 영양사 | 30 | 65054 | 여 | 20 | 서울특별시 | 졸업 | 합격 | 충청남도 |
41172 | 2004 | 영양사 | 27 | 41173 | 여 | 20 | 부산광역시 | 졸업예정 | 합격 | 부산광역시 |