Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 498.0 KiB |
Average record size in memory | 51.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 3 |
Dataset
Description | 한국기술교육대학교 온라인평생교육원 스마트 직업훈련 플랫폼 (STEP)에 대한 과목 등록과 관련된 내용을 제공합니다. |
---|---|
Author | 한국기술교육대학교 |
URL | https://www.data.go.kr/data/15091096/fileData.do |
과정 아이디 is highly overall correlated with 학습자 사용자 인덱스 | High correlation |
학습자 사용자 인덱스 is highly overall correlated with 과정 아이디 | High correlation |
상태 코드 is highly overall correlated with 등록 횟수 | High correlation |
등록 횟수 is highly overall correlated with 상태 코드 | High correlation |
상태 코드 is highly imbalanced (67.7%) | Imbalance |
등록 횟수 is highly imbalanced (98.4%) | Imbalance |
등록국가 is highly imbalanced (93.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-13 00:06:25.121025 |
---|---|
Analysis finished | 2023-12-13 00:06:25.906273 |
Duration | 0.79 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
과정 아이디
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 2534 |
---|---|
Distinct (%) | 25.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5523.7445 |
Minimum | 3 |
---|---|
Maximum | 7290 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 1256 |
Q1 | 4961 |
median | 6253 |
Q3 | 6596 |
95-th percentile | 7154 |
Maximum | 7290 |
Range | 7287 |
Interquartile range (IQR) | 1635 |
Descriptive statistics
Standard deviation | 1719.0004 |
---|---|
Coefficient of variation (CV) | 0.311202 |
Kurtosis | 1.3620018 |
Mean | 5523.7445 |
Median Absolute Deviation (MAD) | 584 |
Skewness | -1.4955057 |
Sum | 55237445 |
Variance | 2954962.2 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2600 | 127 | 1.3% |
6395 | 109 | 1.1% |
6430 | 104 | 1.0% |
6239 | 99 | 1.0% |
6400 | 96 | 1.0% |
6410 | 92 | 0.9% |
2597 | 91 | 0.9% |
6414 | 85 | 0.9% |
7131 | 84 | 0.8% |
2596 | 77 | 0.8% |
Other values (2524) | 9036 |
Value | Count | Frequency (%) |
3 | 1 | < 0.1% |
31 | 1 | < 0.1% |
32 | 1 | < 0.1% |
33 | 4 | |
37 | 1 | < 0.1% |
107 | 1 | < 0.1% |
112 | 1 | < 0.1% |
124 | 1 | < 0.1% |
142 | 1 | < 0.1% |
143 | 1 | < 0.1% |
Value | Count | Frequency (%) |
7290 | 2 | < 0.1% |
7289 | 1 | < 0.1% |
7288 | 3 | < 0.1% |
7287 | 11 | |
7286 | 10 | |
7285 | 3 | < 0.1% |
7284 | 2 | < 0.1% |
7282 | 3 | < 0.1% |
7281 | 3 | < 0.1% |
7280 | 2 | < 0.1% |
학습자 사용자 인덱스
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7989 |
---|---|
Distinct (%) | 79.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 738572.61 |
Minimum | 352 |
---|---|
Maximum | 21857958 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 352 |
---|---|
5-th percentile | 28915 |
Q1 | 80140.75 |
median | 151531 |
Q3 | 206105.25 |
95-th percentile | 1300275.6 |
Maximum | 21857958 |
Range | 21857606 |
Interquartile range (IQR) | 125964.5 |
Descriptive statistics
Standard deviation | 2823014.2 |
---|---|
Coefficient of variation (CV) | 3.8222569 |
Kurtosis | 27.216406 |
Mean | 738572.61 |
Median Absolute Deviation (MAD) | 60050 |
Skewness | 5.2166864 |
Sum | 7.3857261 × 109 |
Variance | 7.9694094 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
145881 | 13 | 0.1% |
23349 | 10 | 0.1% |
57355 | 10 | 0.1% |
3307 | 10 | 0.1% |
72660 | 9 | 0.1% |
30226 | 8 | 0.1% |
3251 | 7 | 0.1% |
56712 | 7 | 0.1% |
363 | 7 | 0.1% |
78947 | 6 | 0.1% |
Other values (7979) | 9913 |
Value | Count | Frequency (%) |
352 | 2 | < 0.1% |
359 | 3 | |
363 | 7 | |
377 | 1 | < 0.1% |
412 | 1 | < 0.1% |
463 | 1 | < 0.1% |
466 | 4 | |
477 | 1 | < 0.1% |
484 | 2 | < 0.1% |
492 | 2 | < 0.1% |
Value | Count | Frequency (%) |
21857958 | 1 | |
21765523 | 1 | |
21743845 | 1 | |
21714416 | 1 | |
21713495 | 1 | |
21636059 | 1 | |
21583580 | 1 | |
21403558 | 1 | |
21208201 | 1 | |
21205789 | 1 |
상태 코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
수강 | |
---|---|
수강취소 | |
수강대기 | 8 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.2232 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 수강 |
---|---|
2nd row | 수강 |
3rd row | 수강 |
4th row | 수강 |
5th row | 수강취소 |
Common Values
Value | Count | Frequency (%) |
수강 | 8884 | |
수강취소 | 1108 | 11.1% |
수강대기 | 8 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
수강 | 8884 | |
수강취소 | 1108 | 11.1% |
수강대기 | 8 | 0.1% |
등록 횟수
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
1 | |
---|---|
2 | 23 |
0 | 5 |
3 | 2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 9970 | |
2 | 23 | 0.2% |
0 | 5 | 0.1% |
3 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 9970 | |
2 | 23 | 0.2% |
0 | 5 | < 0.1% |
3 | 2 | < 0.1% |
등록국가
Categorical
IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
KR | |
---|---|
UNKNOWN | 218 |
US | 16 |
CN | 3 |
JP | 2 |
Other values (2) | 2 |
Length
Max length | 7 |
---|---|
Median length | 2 |
Mean length | 2.109 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | KR |
---|---|
2nd row | KR |
3rd row | KR |
4th row | KR |
5th row | KR |
Common Values
Value | Count | Frequency (%) |
KR | 9759 | |
UNKNOWN | 218 | 2.2% |
US | 16 | 0.2% |
CN | 3 | < 0.1% |
JP | 2 | < 0.1% |
SG | 1 | < 0.1% |
FR | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
kr | 9759 | |
unknown | 218 | 2.2% |
us | 16 | 0.2% |
cn | 3 | < 0.1% |
jp | 2 | < 0.1% |
sg | 1 | < 0.1% |
fr | 1 | < 0.1% |
과정 아이디 | 학습자 사용자 인덱스 | 상태 코드 | 등록 횟수 | 등록국가 | |
---|---|---|---|---|---|
과정 아이디 | 1.000 | 0.175 | 0.143 | 0.031 | 0.124 |
학습자 사용자 인덱스 | 0.175 | 1.000 | 0.151 | 0.135 | 0.385 |
상태 코드 | 0.143 | 0.151 | 1.000 | 0.552 | 0.000 |
등록 횟수 | 0.031 | 0.135 | 0.552 | 1.000 | 0.000 |
등록국가 | 0.124 | 0.385 | 0.000 | 0.000 | 1.000 |
등록국가 | 등록 횟수 | 상태 코드 | |
---|---|---|---|
등록국가 | 1.000 | 0.000 | 0.000 |
등록 횟수 | 0.000 | 1.000 | 0.559 |
상태 코드 | 0.000 | 0.559 | 1.000 |
과정 아이디 | 학습자 사용자 인덱스 | 상태 코드 | 등록 횟수 | 등록국가 | |
---|---|---|---|---|---|
과정 아이디 | 1.000 | 0.692 | 0.086 | 0.018 | 0.063 |
학습자 사용자 인덱스 | 0.692 | 1.000 | 0.102 | 0.093 | 0.143 |
상태 코드 | 0.086 | 0.102 | 1.000 | 0.559 | 0.000 |
등록 횟수 | 0.018 | 0.093 | 0.559 | 1.000 | 0.000 |
등록국가 | 0.063 | 0.143 | 0.000 | 0.000 | 1.000 |
과정 아이디 | 학습자 사용자 인덱스 | 상태 코드 | 등록 횟수 | 등록국가 | |
---|---|---|---|---|---|
61769 | 6408 | 1248145 | 수강 | 1 | KR |
27979 | 5391 | 88975 | 수강 | 1 | KR |
8018 | 2598 | 123285 | 수강 | 1 | KR |
10972 | 2811 | 51588 | 수강 | 1 | KR |
27066 | 5247 | 105994 | 수강취소 | 1 | KR |
95709 | 7177 | 215404 | 수강 | 1 | KR |
11393 | 2882 | 53130 | 수강 | 1 | KR |
13214 | 3157 | 58951 | 수강 | 1 | KR |
86780 | 6929 | 199769 | 수강 | 1 | KR |
38267 | 5852 | 159477 | 수강 | 1 | KR |
과정 아이디 | 학습자 사용자 인덱스 | 상태 코드 | 등록 횟수 | 등록국가 | |
---|---|---|---|---|---|
91125 | 7039 | 192988 | 수강취소 | 1 | KR |
12530 | 3069 | 143848 | 수강 | 1 | KR |
62828 | 6410 | 11057077 | 수강 | 1 | KR |
50594 | 6247 | 177285 | 수강 | 1 | KR |
37151 | 5838 | 160760 | 수강 | 1 | KR |
92830 | 7130 | 399617 | 수강 | 1 | KR |
59397 | 6402 | 253586 | 수강 | 1 | KR |
38306 | 5852 | 160748 | 수강 | 1 | KR |
83391 | 6857 | 197959 | 수강 | 1 | KR |
1758 | 572 | 31675 | 수강 | 1 | KR |