Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 8485 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 609 |
Duplicate rows (%) | 7.2% |
Total size in memory | 207.3 KiB |
Average record size in memory | 25.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 1 |
Numeric | 1 |
Dataset
Description | 한국기술교육대학교 온라인평생교육원 스마트 직업훈련 플랫폼 (STEP)에 대한 LMS 학기 평가 관련 내용을 제공합니다. |
---|---|
Author | 한국기술교육대학교 |
URL | https://www.data.go.kr/data/15090865/fileData.do |
Dataset has 609 (7.2%) duplicate rows | Duplicates |
가중치 has 6790 (80.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 11:13:34.067871 |
---|---|
Analysis finished | 2023-12-12 11:13:34.905436 |
Duration | 0.84 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
학기 아이디
Text
Distinct | 1015 |
---|---|
Distinct (%) | 12.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 66.4 KiB |
Value | Count | Frequency (%) |
직무 | 270 | 2.2% |
핵심 | 258 | 2.1% |
삼성협력사 | 234 | 1.9% |
1기 | 227 | 1.8% |
2020-1 | 210 | 1.7% |
주)광진 | 150 | 1.2% |
2기 | 142 | 1.1% |
3기 | 112 | 0.9% |
2022-1 | 112 | 0.9% |
및 | 105 | 0.8% |
Other values (1025) | 10621 |
Most occurring characters
Value | Count | Frequency (%) |
2 | 12855 | 12.3% |
0 | 8352 | 8.0% |
1 | 7007 | 6.7% |
( | 6043 | 5.8% |
) | 6043 | 5.8% |
- | 6022 | 5.7% |
3997 | 3.8% | |
차 | 3652 | 3.5% |
기 | 3143 | 3.0% |
3 | 1961 | 1.9% |
Other values (358) | 45818 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 44564 | |
Decimal Number | 35692 | |
Open Punctuation | 6084 | 5.8% |
Close Punctuation | 6084 | 5.8% |
Dash Punctuation | 6022 | 5.7% |
Space Separator | 3997 | 3.8% |
Uppercase Letter | 1749 | 1.7% |
Lowercase Letter | 456 | 0.4% |
Other Punctuation | 131 | 0.1% |
Connector Punctuation | 60 | 0.1% |
Other values (2) | 54 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
차 | 3652 | 8.2% |
기 | 3143 | 7.1% |
성 | 1430 | 3.2% |
력 | 1335 | 3.0% |
사 | 1274 | 2.9% |
삼 | 1211 | 2.7% |
협 | 1203 | 2.7% |
스 | 1189 | 2.7% |
이 | 876 | 2.0% |
공 | 739 | 1.7% |
Other values (299) | 28512 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 328 | |
P | 248 | |
L | 216 | |
I | 165 | |
C | 154 | |
T | 150 | |
K | 105 | 6.0% |
A | 101 | 5.8% |
H | 55 | 3.1% |
B | 36 | 2.1% |
Other values (11) | 191 |
Lowercase Letter
Value | Count | Frequency (%) |
t | 99 | |
a | 77 | |
s | 63 | |
b | 63 | |
e | 49 | |
i | 35 | 7.7% |
m | 21 | 4.6% |
o | 21 | 4.6% |
c | 7 | 1.5% |
n | 7 | 1.5% |
Other values (2) | 14 | 3.1% |
Decimal Number
Value | Count | Frequency (%) |
2 | 12855 | |
0 | 8352 | |
1 | 7007 | |
3 | 1961 | 5.5% |
9 | 1243 | 3.5% |
8 | 1185 | 3.3% |
7 | 937 | 2.6% |
4 | 819 | 2.3% |
5 | 703 | 2.0% |
6 | 630 | 1.8% |
Other Punctuation
Value | Count | Frequency (%) |
% | 35 | |
· | 28 | |
/ | 27 | |
. | 14 | 10.7% |
, | 14 | 10.7% |
& | 7 | 5.3% |
! | 6 | 4.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 6043 | |
[ | 41 | 0.7% |
Close Punctuation
Value | Count | Frequency (%) |
) | 6043 | |
] | 41 | 0.7% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6022 |
Space Separator
Value | Count | Frequency (%) |
3997 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 60 |
Math Symbol
Value | Count | Frequency (%) |
+ | 42 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 58112 | |
Hangul | 44576 | |
Latin | 2205 | 2.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
차 | 3652 | 8.2% |
기 | 3143 | 7.1% |
성 | 1430 | 3.2% |
력 | 1335 | 3.0% |
사 | 1274 | 2.9% |
삼 | 1211 | 2.7% |
협 | 1203 | 2.7% |
스 | 1189 | 2.7% |
이 | 876 | 2.0% |
공 | 739 | 1.7% |
Other values (300) | 28524 |
Latin
Value | Count | Frequency (%) |
S | 328 | |
P | 248 | |
L | 216 | 9.8% |
I | 165 | 7.5% |
C | 154 | 7.0% |
T | 150 | 6.8% |
K | 105 | 4.8% |
A | 101 | 4.6% |
t | 99 | 4.5% |
a | 77 | 3.5% |
Other values (23) | 562 |
Common
Value | Count | Frequency (%) |
2 | 12855 | |
0 | 8352 | |
1 | 7007 | |
( | 6043 | |
) | 6043 | |
- | 6022 | |
3997 | 6.9% | |
3 | 1961 | 3.4% |
9 | 1243 | 2.1% |
8 | 1185 | 2.0% |
Other values (15) | 3404 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 60289 | |
Hangul | 44564 | |
None | 40 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2 | 12855 | |
0 | 8352 | |
1 | 7007 | |
( | 6043 | |
) | 6043 | |
- | 6022 | |
3997 | 6.6% | |
3 | 1961 | 3.3% |
9 | 1243 | 2.1% |
8 | 1185 | 2.0% |
Other values (47) | 5581 |
Hangul
Value | Count | Frequency (%) |
차 | 3652 | 8.2% |
기 | 3143 | 7.1% |
성 | 1430 | 3.2% |
력 | 1335 | 3.0% |
사 | 1274 | 2.9% |
삼 | 1211 | 2.7% |
협 | 1203 | 2.7% |
스 | 1189 | 2.7% |
이 | 876 | 2.0% |
공 | 739 | 1.7% |
Other values (299) | 28512 |
None
Value | Count | Frequency (%) |
· | 28 | |
㈜ | 12 |
과목 코드
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 66.4 KiB |
시험 | |
---|---|
퀴즈 | |
과제 | |
토론 | |
게시판 참여 | |
Other values (2) |
Length
Max length | 6 |
---|---|
Median length | 2 |
Mean length | 2.6067177 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 시험 |
---|---|
2nd row | 퀴즈 |
3rd row | 과제 |
4th row | 토론 |
5th row | 게시판 참여 |
Common Values
Value | Count | Frequency (%) |
시험 | 1287 | |
퀴즈 | 1287 | |
과제 | 1287 | |
토론 | 1287 | |
게시판 참여 | 1287 | |
출석 | 1287 | |
기타 | 763 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
시험 | 1287 | |
퀴즈 | 1287 | |
과제 | 1287 | |
토론 | 1287 | |
게시판 | 1287 | |
참여 | 1287 | |
출석 | 1287 | |
기타 | 763 |
가중치
Real number (ℝ)
ZEROS
 
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10.87802 |
Minimum | 0 |
---|---|
Maximum | 100 |
Zeros | 6790 |
Zeros (%) | 80.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 74.7 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 60 |
Maximum | 100 |
Range | 100 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 23.075524 |
---|---|
Coefficient of variation (CV) | 2.1212982 |
Kurtosis | 3.1837026 |
Mean | 10.87802 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 2.0078181 |
Sum | 92300 |
Variance | 532.47982 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 6790 | |
50 | 780 | 9.2% |
40 | 308 | 3.6% |
60 | 300 | 3.5% |
100 | 159 | 1.9% |
30 | 76 | 0.9% |
70 | 60 | 0.7% |
10 | 4 | < 0.1% |
90 | 4 | < 0.1% |
20 | 2 | < 0.1% |
Value | Count | Frequency (%) |
0 | 6790 | |
10 | 4 | < 0.1% |
20 | 2 | < 0.1% |
30 | 76 | 0.9% |
40 | 308 | 3.6% |
50 | 780 | 9.2% |
60 | 300 | 3.5% |
70 | 60 | 0.7% |
80 | 2 | < 0.1% |
90 | 4 | < 0.1% |
Value | Count | Frequency (%) |
100 | 159 | 1.9% |
90 | 4 | < 0.1% |
80 | 2 | < 0.1% |
70 | 60 | 0.7% |
60 | 300 | 3.5% |
50 | 780 | |
40 | 308 | 3.6% |
30 | 76 | 0.9% |
20 | 2 | < 0.1% |
10 | 4 | < 0.1% |
과목 코드 | 가중치 | |
---|---|---|
과목 코드 | 1.000 | 0.602 |
가중치 | 0.602 | 1.000 |
가중치 | 과목 코드 | |
---|---|---|
가중치 | 1.000 | 0.369 |
과목 코드 | 0.369 | 1.000 |
학기 아이디 | 과목 코드 | 가중치 | |
---|---|---|---|
0 | 상시 | 시험 | 0 |
1 | 상시 | 퀴즈 | 0 |
2 | 상시 | 과제 | 0 |
3 | 상시 | 토론 | 0 |
4 | 상시 | 게시판 참여 | 0 |
5 | 상시 | 출석 | 100 |
6 | 상시 | 시험 | 0 |
7 | 상시 | 퀴즈 | 0 |
8 | 상시 | 과제 | 0 |
9 | 상시 | 토론 | 0 |
학기 아이디 | 과목 코드 | 가중치 | |
---|---|---|---|
8475 | 2023-4차(유라코퍼레이션) | 게시판 참여 | 0 |
8476 | 2023-4차(유라코퍼레이션) | 출석 | 50 |
8477 | 2023-4차(유라코퍼레이션) | 기타 | 0 |
8478 | 16기 | 시험 | 50 |
8479 | 16기 | 퀴즈 | 0 |
8480 | 16기 | 과제 | 0 |
8481 | 16기 | 토론 | 0 |
8482 | 16기 | 게시판 참여 | 0 |
8483 | 16기 | 출석 | 50 |
8484 | 16기 | 기타 | 0 |
Most frequently occurring
학기 아이디 | 과목 코드 | 가중치 | # duplicates | |
---|---|---|---|---|
235 | 2020-1 | 게시판 참여 | 0 | 26 |
236 | 2020-1 | 과제 | 0 | 26 |
237 | 2020-1 | 기타 | 0 | 26 |
238 | 2020-1 | 시험 | 0 | 26 |
241 | 2020-1 | 퀴즈 | 0 | 26 |
242 | 2020-1 | 토론 | 0 | 26 |
239 | 2020-1 | 출석 | 0 | 23 |
69 | 13기 | 게시판 참여 | 0 | 10 |
70 | 13기 | 과제 | 0 | 10 |
78 | 13기 | 퀴즈 | 0 | 10 |