Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 400.4 KiB |
Average record size in memory | 41.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 2 |
Numeric | 1 |
Dataset
Description | 학점은행제 교육훈련기관별 교강사별 학습과목에 대한 데이터로 학습과정명, 교강사구분, 구분, 차수 등의 항목을 제공합니다. 정보공개법 제9조제1항제6호에 의거 부분공개 |
---|---|
URL | https://www.data.go.kr/data/15089319/fileData.do |
구분 is highly imbalanced (90.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 10:39:24.734453 |
---|---|
Analysis finished | 2023-12-12 10:39:25.942379 |
Duration | 1.21 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
학습과정
Text
Distinct | 2659 |
---|---|
Distinct (%) | 26.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
사회복지학개론 | 27 | 0.3% |
및 | 24 | 0.2% |
자원봉사론 | 24 | 0.2% |
사회복지조사론 | 23 | 0.2% |
사회복지행정론 | 23 | 0.2% |
국제경영 | 23 | 0.2% |
사회복지법제와실천 | 22 | 0.2% |
보육실습 | 22 | 0.2% |
가족상담및가족치료 | 21 | 0.2% |
아동복지론 | 21 | 0.2% |
Other values (2663) | 9864 |
Most occurring characters
Value | Count | Frequency (%) |
론 | 2274 | 3.8% |
학 | 1807 | 3.0% |
실 | 1659 | 2.7% |
Ⅰ | 1403 | 2.3% |
기 | 1264 | 2.1% |
리 | 1213 | 2.0% |
사 | 1183 | 2.0% |
습 | 1074 | 1.8% |
지 | 949 | 1.6% |
영 | 825 | 1.4% |
Other values (514) | 46882 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 57381 | |
Letter Number | 2373 | 3.9% |
Uppercase Letter | 356 | 0.6% |
Lowercase Letter | 135 | 0.2% |
Space Separator | 100 | 0.2% |
Other Punctuation | 95 | 0.2% |
Decimal Number | 40 | 0.1% |
Close Punctuation | 18 | < 0.1% |
Open Punctuation | 18 | < 0.1% |
Dash Punctuation | 17 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
론 | 2274 | 4.0% |
학 | 1807 | 3.1% |
실 | 1659 | 2.9% |
기 | 1264 | 2.2% |
리 | 1213 | 2.1% |
사 | 1183 | 2.1% |
습 | 1074 | 1.9% |
지 | 949 | 1.7% |
영 | 825 | 1.4% |
인 | 760 | 1.3% |
Other values (463) | 44373 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 74 | |
D | 72 | |
T | 45 | |
A | 39 | |
V | 38 | |
P | 28 | 7.9% |
N | 13 | 3.7% |
I | 12 | 3.4% |
M | 11 | 3.1% |
L | 6 | 1.7% |
Other values (9) | 18 | 5.1% |
Lowercase Letter
Value | Count | Frequency (%) |
o | 23 | |
e | 18 | |
t | 17 | |
s | 14 | |
r | 13 | |
h | 12 | |
l | 10 | |
u | 8 | 5.9% |
a | 8 | 5.9% |
p | 6 | 4.4% |
Other values (3) | 6 | 4.4% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 1403 | |
Ⅱ | 726 | |
Ⅲ | 112 | 4.7% |
Ⅳ | 75 | 3.2% |
Ⅴ | 17 | 0.7% |
Ⅵ | 16 | 0.7% |
Ⅶ | 13 | 0.5% |
Ⅷ | 11 | 0.5% |
Other Punctuation
Value | Count | Frequency (%) |
· | 78 | |
& | 9 | 9.5% |
/ | 7 | 7.4% |
, | 1 | 1.1% |
Decimal Number
Value | Count | Frequency (%) |
3 | 21 | |
2 | 13 | |
0 | 6 | 15.0% |
Space Separator
Value | Count | Frequency (%) |
100 |
Close Punctuation
Value | Count | Frequency (%) |
) | 18 |
Open Punctuation
Value | Count | Frequency (%) |
( | 18 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 17 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 57381 | |
Latin | 2864 | 4.7% |
Common | 288 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
론 | 2274 | 4.0% |
학 | 1807 | 3.1% |
실 | 1659 | 2.9% |
기 | 1264 | 2.2% |
리 | 1213 | 2.1% |
사 | 1183 | 2.1% |
습 | 1074 | 1.9% |
지 | 949 | 1.7% |
영 | 825 | 1.4% |
인 | 760 | 1.3% |
Other values (463) | 44373 |
Latin
Value | Count | Frequency (%) |
Ⅰ | 1403 | |
Ⅱ | 726 | |
Ⅲ | 112 | 3.9% |
Ⅳ | 75 | 2.6% |
C | 74 | 2.6% |
D | 72 | 2.5% |
T | 45 | 1.6% |
A | 39 | 1.4% |
V | 38 | 1.3% |
P | 28 | 1.0% |
Other values (30) | 252 | 8.8% |
Common
Value | Count | Frequency (%) |
100 | ||
· | 78 | |
3 | 21 | 7.3% |
) | 18 | 6.2% |
( | 18 | 6.2% |
- | 17 | 5.9% |
2 | 13 | 4.5% |
& | 9 | 3.1% |
/ | 7 | 2.4% |
0 | 6 | 2.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 57374 | |
Number Forms | 2373 | 3.9% |
ASCII | 701 | 1.2% |
None | 78 | 0.1% |
Compat Jamo | 7 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
론 | 2274 | 4.0% |
학 | 1807 | 3.1% |
실 | 1659 | 2.9% |
기 | 1264 | 2.2% |
리 | 1213 | 2.1% |
사 | 1183 | 2.1% |
습 | 1074 | 1.9% |
지 | 949 | 1.7% |
영 | 825 | 1.4% |
인 | 760 | 1.3% |
Other values (462) | 44366 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 1403 | |
Ⅱ | 726 | |
Ⅲ | 112 | 4.7% |
Ⅳ | 75 | 3.2% |
Ⅴ | 17 | 0.7% |
Ⅵ | 16 | 0.7% |
Ⅶ | 13 | 0.5% |
Ⅷ | 11 | 0.5% |
ASCII
Value | Count | Frequency (%) |
100 | ||
C | 74 | 10.6% |
D | 72 | 10.3% |
T | 45 | 6.4% |
A | 39 | 5.6% |
V | 38 | 5.4% |
P | 28 | 4.0% |
o | 23 | 3.3% |
3 | 21 | 3.0% |
) | 18 | 2.6% |
Other values (32) | 243 |
None
Value | Count | Frequency (%) |
· | 78 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 7 |
교강사구분
Categorical
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
시간강사 | |
---|---|
전임 | |
겸임 | |
대학전임 | |
기타 | 178 |
Other values (3) | 43 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 3.0796 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 겸임 |
---|---|
2nd row | 전임 |
3rd row | 전임 |
4th row | 전임 |
5th row | 시간강사 |
Common Values
Value | Count | Frequency (%) |
시간강사 | 4282 | |
전임 | 3199 | |
겸임 | 1208 | 12.1% |
대학전임 | 1090 | 10.9% |
기타 | 178 | 1.8% |
공무원 | 39 | 0.4% |
전수교육조교 | 3 | < 0.1% |
보유자 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
시간강사 | 4282 | |
전임 | 3199 | |
겸임 | 1208 | 12.1% |
대학전임 | 1090 | 10.9% |
기타 | 178 | 1.8% |
공무원 | 39 | 0.4% |
전수교육조교 | 3 | < 0.1% |
보유자 | 1 | < 0.1% |
구분
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
평가 | |
---|---|
추가 | 148 |
교체 | 139 |
기존 | 9 |
변경인정 | 1 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0002 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 평가 |
---|---|
2nd row | 평가 |
3rd row | 평가 |
4th row | 평가 |
5th row | 평가 |
Common Values
Value | Count | Frequency (%) |
평가 | 9703 | |
추가 | 148 | 1.5% |
교체 | 139 | 1.4% |
기존 | 9 | 0.1% |
변경인정 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
평가 | 9703 | |
추가 | 148 | 1.5% |
교체 | 139 | 1.4% |
기존 | 9 | 0.1% |
변경인정 | 1 | < 0.1% |
차수
Real number (ℝ)
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 27.6076 |
Minimum | 1 |
---|---|
Maximum | 32 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 19 |
Q1 | 27 |
median | 28 |
Q3 | 30 |
95-th percentile | 31 |
Maximum | 32 |
Range | 31 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 3.7200008 |
---|---|
Coefficient of variation (CV) | 0.13474553 |
Kurtosis | 3.9109664 |
Mean | 27.6076 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -1.7691829 |
Sum | 276076 |
Variance | 13.838406 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
31 | 1799 | |
28 | 1684 | |
30 | 1656 | |
29 | 1230 | |
27 | 1125 | |
26 | 1028 | |
20 | 363 | 3.6% |
18 | 272 | 2.7% |
19 | 225 | 2.2% |
21 | 185 | 1.8% |
Other values (7) | 433 | 4.3% |
Value | Count | Frequency (%) |
1 | 4 | < 0.1% |
2 | 7 | 0.1% |
8 | 4 | < 0.1% |
16 | 90 | 0.9% |
17 | 30 | 0.3% |
18 | 272 | |
19 | 225 | |
20 | 363 | |
21 | 185 | |
22 | 115 | 1.1% |
Value | Count | Frequency (%) |
32 | 183 | 1.8% |
31 | 1799 | |
30 | 1656 | |
29 | 1230 | |
28 | 1684 | |
27 | 1125 | |
26 | 1028 | |
22 | 115 | 1.1% |
21 | 185 | 1.8% |
20 | 363 | 3.6% |
교강사구분 | 구분 | 차수 | |
---|---|---|---|
교강사구분 | 1.000 | 0.066 | 0.215 |
구분 | 0.066 | 1.000 | 0.127 |
차수 | 0.215 | 0.127 | 1.000 |
구분 | 교강사구분 | |
---|---|---|
구분 | 1.000 | 0.040 |
교강사구분 | 0.040 | 1.000 |
차수 | 교강사구분 | 구분 | |
---|---|---|---|
차수 | 1.000 | 0.117 | 0.081 |
교강사구분 | 0.117 | 1.000 | 0.040 |
구분 | 0.081 | 0.040 | 1.000 |
학습과정 | 교강사구분 | 구분 | 차수 | |
---|---|---|---|---|
13176 | 유아발달 | 겸임 | 평가 | 18 |
4799 | 로고&타입페이스 | 전임 | 평가 | 28 |
8541 | 생활체육론 | 전임 | 평가 | 31 |
12943 | 운영체제실습 | 전임 | 평가 | 31 |
935 | 게이트볼Ⅰ | 시간강사 | 평가 | 31 |
7747 | 사회복지지도감독론 | 시간강사 | 평가 | 19 |
11513 | 여행사경영론 | 시간강사 | 평가 | 29 |
52 | 3D컴퓨터그래픽 | 대학전임 | 평가 | 26 |
16336 | 중급재무회계Ⅰ | 시간강사 | 평가 | 29 |
16775 | 창작파마실습 | 시간강사 | 평가 | 31 |
학습과정 | 교강사구분 | 구분 | 차수 | |
---|---|---|---|---|
2326 | 광고학 | 겸임 | 평가 | 21 |
16902 | 청소년복지론 | 시간강사 | 평가 | 32 |
11314 | 언어발달장애 | 겸임 | 평가 | 19 |
13882 | 이태리어딕션Ⅰ | 시간강사 | 평가 | 29 |
11745 | 영문학강독Ⅰ | 시간강사 | 평가 | 29 |
14797 | 장면만들기Ⅱ | 겸임 | 평가 | 27 |
12765 | 용접및판금도장실습 | 겸임 | 평가 | 28 |
13293 | 음료서비스실습 | 전임 | 평가 | 32 |
16064 | 조리용어 | 겸임 | 평가 | 30 |
3850 | 대기분석및실습 | 공무원 | 평가 | 19 |