Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 769 |
Missing cells | 13 |
Missing cells (%) | 0.2% |
Duplicate rows | 3 |
Duplicate rows (%) | 0.4% |
Total size in memory | 42.9 KiB |
Average record size in memory | 57.2 B |
Variable types
Categorical | 5 |
---|---|
Text | 2 |
Dataset
Description | 한국폴리텍대학에서 실시하는 교과과정에 대한 정보를 제공합니다. 제공하는 데이터 항목은 (과정, 계열, 학과, 캠퍼스, 이론/실습, 교과목명, 학점)입니다. |
---|---|
Author | 학교법인한국폴리텍 |
URL | https://www.data.go.kr/data/15053552/fileData.do |
과정 has constant value "" | Constant |
Dataset has 3 (0.4%) duplicate rows | Duplicates |
학점 is highly overall correlated with 이론실습여부 | High correlation |
이론실습여부 is highly overall correlated with 학점 | High correlation |
계열 is highly overall correlated with 캠퍼스 | High correlation |
캠퍼스 is highly overall correlated with 계열 | High correlation |
교과목명 has 13 (1.7%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 21:43:20.477453 |
---|---|
Analysis finished | 2023-12-12 21:43:21.150723 |
Duration | 0.67 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
과정
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.1 KiB |
다기능 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 다기능 |
---|---|
2nd row | 다기능 |
3rd row | 다기능 |
4th row | 다기능 |
5th row | 다기능 |
Common Values
Value | Count | Frequency (%) |
다기능 | 769 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
다기능 | 769 |
계열
Categorical
HIGH CORRELATION
 
Distinct | 20 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.1 KiB |
정보통신IT | |
---|---|
자동화 | |
기계 | |
산업설비 | |
전자 | |
Other values (15) |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 3.289987 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기계 |
---|---|
2nd row | 기계 |
3rd row | 기계 |
4th row | 기계 |
5th row | 기계 |
Common Values
Value | Count | Frequency (%) |
정보통신IT | 85 | |
자동화 | 79 | |
기계 | 73 | |
산업설비 | 69 | |
전자 | 64 | |
미디어 | 54 | 7.0% |
전기 | 50 | 6.5% |
섬유패션 | 50 | 6.5% |
디자인 | 50 | 6.5% |
바이오 | 41 | 5.3% |
Other values (10) | 154 |
Length
Value | Count | Frequency (%) |
정보통신it | 85 | |
자동화 | 79 | |
기계 | 73 | |
전자 | 73 | |
산업설비 | 69 | |
미디어 | 54 | 7.0% |
전기 | 50 | 6.5% |
섬유패션 | 50 | 6.5% |
디자인 | 50 | 6.5% |
바이오 | 41 | 5.3% |
Other values (9) | 145 |
학과
Text
Distinct | 69 |
---|---|
Distinct (%) | 9.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.1 KiB |
Value | Count | Frequency (%) |
전기 | 28 | 3.3% |
전기에너지 | 28 | 3.3% |
전기에너지시스템 | 28 | 3.3% |
산업설비자동화 | 25 | 2.9% |
신소재응용 | 24 | 2.8% |
스마트소프트웨어 | 23 | 2.7% |
금형디자인 | 23 | 2.7% |
메카트로닉스 | 22 | 2.6% |
컴퓨터응용기계 | 22 | 2.6% |
it융합제어 | 21 | 2.4% |
Other values (63) | 615 |
Most occurring characters
Value | Count | Frequency (%) |
스 | 266 | 5.3% |
자 | 260 | 5.2% |
전 | 190 | 3.8% |
기 | 181 | 3.6% |
트 | 142 | 2.8% |
디 | 139 | 2.8% |
시 | 127 | 2.5% |
템 | 115 | 2.3% |
어 | 111 | 2.2% |
인 | 104 | 2.1% |
Other values (108) | 3359 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4727 | |
Space Separator | 90 | 1.8% |
Other Punctuation | 90 | 1.8% |
Uppercase Letter | 87 | 1.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 266 | 5.6% |
자 | 260 | 5.5% |
전 | 190 | 4.0% |
기 | 181 | 3.8% |
트 | 142 | 3.0% |
디 | 139 | 2.9% |
시 | 127 | 2.7% |
템 | 115 | 2.4% |
어 | 111 | 2.3% |
인 | 104 | 2.2% |
Other values (101) | 3092 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 30 | |
I | 30 | |
A | 9 | 10.3% |
C | 9 | 10.3% |
D | 9 | 10.3% |
Space Separator
Value | Count | Frequency (%) |
90 |
Other Punctuation
Value | Count | Frequency (%) |
, | 90 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4727 | |
Common | 180 | 3.6% |
Latin | 87 | 1.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 266 | 5.6% |
자 | 260 | 5.5% |
전 | 190 | 4.0% |
기 | 181 | 3.8% |
트 | 142 | 3.0% |
디 | 139 | 2.9% |
시 | 127 | 2.7% |
템 | 115 | 2.4% |
어 | 111 | 2.3% |
인 | 104 | 2.2% |
Other values (101) | 3092 |
Latin
Value | Count | Frequency (%) |
T | 30 | |
I | 30 | |
A | 9 | 10.3% |
C | 9 | 10.3% |
D | 9 | 10.3% |
Common
Value | Count | Frequency (%) |
90 | ||
, | 90 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4727 | |
ASCII | 267 | 5.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
스 | 266 | 5.6% |
자 | 260 | 5.5% |
전 | 190 | 4.0% |
기 | 181 | 3.8% |
트 | 142 | 3.0% |
디 | 139 | 2.9% |
시 | 127 | 2.7% |
템 | 115 | 2.4% |
어 | 111 | 2.3% |
인 | 104 | 2.2% |
Other values (101) | 3092 |
ASCII
Value | Count | Frequency (%) |
90 | ||
, | 90 | |
T | 30 | 11.2% |
I | 30 | 11.2% |
A | 9 | 3.4% |
C | 9 | 3.4% |
D | 9 | 3.4% |
캠퍼스
Categorical
HIGH CORRELATION
 
Distinct | 39 |
---|---|
Distinct (%) | 5.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.1 KiB |
항공 | 48 |
---|---|
대전 | 47 |
서울강서 | 45 |
바이오 | 41 |
인천 | 34 |
Other values (34) |
Length
Max length | 69 |
---|---|
Median length | 34 |
Mean length | 12.546164 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 |
---|---|
2nd row | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 |
3rd row | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 |
4th row | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 |
5th row | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 |
Common Values
Value | Count | Frequency (%) |
항공 | 48 | 6.2% |
대전 | 47 | 6.1% |
서울강서 | 45 | 5.9% |
바이오 | 41 | 5.3% |
인천 | 34 | 4.4% |
안성 | 33 | 4.3% |
아산 | 29 | 3.8% |
섬유패션 | 28 | 3.6% |
서울정수, 안성, 춘천, 홍성, 광주, 목포, 구미, 부산, 울산-전기/인천-전기에너지시스템/ 청주-전기에너지 | 28 | 3.6% |
춘천 | 25 | 3.3% |
Other values (29) | 411 |
Length
Value | Count | Frequency (%) |
인천 | 171 | 7.9% |
창원 | 155 | 7.2% |
서울정수 | 146 | 6.8% |
광주 | 141 | 6.6% |
대구 | 130 | 6.0% |
성남 | 119 | 5.5% |
부산 | 113 | 5.3% |
김제 | 106 | 4.9% |
목포 | 97 | 4.5% |
아산 | 88 | 4.1% |
Other values (22) | 885 |
이론실습여부
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.1 KiB |
실습 | |
---|---|
이론 | |
<NA> | 13 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0338101 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 실습 |
---|---|
2nd row | 실습 |
3rd row | 실습 |
4th row | 실습 |
5th row | 실습 |
Common Values
Value | Count | Frequency (%) |
실습 | 431 | |
이론 | 325 | |
<NA> | 13 | 1.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
실습 | 431 | |
이론 | 325 | |
na | 13 | 1.7% |
교과목명
Text
MISSING
 
Distinct | 448 |
---|---|
Distinct (%) | 59.3% |
Missing | 13 |
Missing (%) | 1.7% |
Memory size | 6.1 KiB |
Value | Count | Frequency (%) |
문제원형실습 | 66 | 8.5% |
cad실습 | 18 | 2.3% |
디지털공학 | 14 | 1.8% |
디지털회로실습 | 12 | 1.6% |
회로이론 | 10 | 1.3% |
프로그래밍실습 | 8 | 1.0% |
기계공작법 | 8 | 1.0% |
기계제도 | 8 | 1.0% |
전기전자공학 | 7 | 0.9% |
프로그래밍언어실습 | 6 | 0.8% |
Other values (448) | 615 |
Most occurring characters
Value | Count | Frequency (%) |
실 | 394 | 8.4% |
습 | 377 | 8.0% |
기 | 208 | 4.4% |
전 | 138 | 2.9% |
학 | 132 | 2.8% |
공 | 132 | 2.8% |
자 | 131 | 2.8% |
제 | 128 | 2.7% |
형 | 90 | 1.9% |
로 | 86 | 1.8% |
Other values (283) | 2883 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4420 | |
Uppercase Letter | 237 | 5.0% |
Decimal Number | 17 | 0.4% |
Space Separator | 16 | 0.3% |
Lowercase Letter | 6 | 0.1% |
Other Punctuation | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
실 | 394 | 8.9% |
습 | 377 | 8.5% |
기 | 208 | 4.7% |
전 | 138 | 3.1% |
학 | 132 | 3.0% |
공 | 132 | 3.0% |
자 | 131 | 3.0% |
제 | 128 | 2.9% |
형 | 90 | 2.0% |
로 | 86 | 1.9% |
Other values (258) | 2604 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 76 | |
A | 51 | |
D | 46 | |
I | 14 | 5.9% |
T | 12 | 5.1% |
N | 10 | 4.2% |
P | 9 | 3.8% |
L | 8 | 3.4% |
M | 5 | 2.1% |
H | 1 | 0.4% |
Other values (5) | 5 | 2.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 10 | |
3 | 4 | 23.5% |
2 | 2 | 11.8% |
5 | 1 | 5.9% |
Lowercase Letter
Value | Count | Frequency (%) |
o | 4 | |
u | 1 | 16.7% |
t | 1 | 16.7% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 2 | |
. | 1 |
Space Separator
Value | Count | Frequency (%) |
16 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4420 | |
Latin | 243 | 5.2% |
Common | 36 | 0.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
실 | 394 | 8.9% |
습 | 377 | 8.5% |
기 | 208 | 4.7% |
전 | 138 | 3.1% |
학 | 132 | 3.0% |
공 | 132 | 3.0% |
자 | 131 | 3.0% |
제 | 128 | 2.9% |
형 | 90 | 2.0% |
로 | 86 | 1.9% |
Other values (258) | 2604 |
Latin
Value | Count | Frequency (%) |
C | 76 | |
A | 51 | |
D | 46 | |
I | 14 | 5.8% |
T | 12 | 4.9% |
N | 10 | 4.1% |
P | 9 | 3.7% |
L | 8 | 3.3% |
M | 5 | 2.1% |
o | 4 | 1.6% |
Other values (8) | 8 | 3.3% |
Common
Value | Count | Frequency (%) |
16 | ||
1 | 10 | |
3 | 4 | 11.1% |
/ | 2 | 5.6% |
2 | 2 | 5.6% |
5 | 1 | 2.8% |
. | 1 | 2.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4420 | |
ASCII | 279 | 5.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
실 | 394 | 8.9% |
습 | 377 | 8.5% |
기 | 208 | 4.7% |
전 | 138 | 3.1% |
학 | 132 | 3.0% |
공 | 132 | 3.0% |
자 | 131 | 3.0% |
제 | 128 | 2.9% |
형 | 90 | 2.0% |
로 | 86 | 1.9% |
Other values (258) | 2604 |
ASCII
Value | Count | Frequency (%) |
C | 76 | |
A | 51 | |
D | 46 | |
16 | 5.7% | |
I | 14 | 5.0% |
T | 12 | 4.3% |
1 | 10 | 3.6% |
N | 10 | 3.6% |
P | 9 | 3.2% |
L | 8 | 2.9% |
Other values (15) | 27 | 9.7% |
학점
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.1 KiB |
4 | |
---|---|
2 | |
3 | |
<NA> | 13 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.0507152 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 4 |
---|---|
2nd row | 4 |
3rd row | 4 |
4th row | 4 |
5th row | 4 |
Common Values
Value | Count | Frequency (%) |
4 | 395 | |
2 | 221 | |
3 | 140 | 18.2% |
<NA> | 13 | 1.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
4 | 395 | |
2 | 221 | |
3 | 140 | 18.2% |
na | 13 | 1.7% |
계열 | 학과 | 캠퍼스 | 이론실습여부 | 학점 | |
---|---|---|---|---|---|
계열 | 1.000 | 1.000 | 0.986 | 0.000 | 0.377 |
학과 | 1.000 | 1.000 | 1.000 | 0.000 | 0.593 |
캠퍼스 | 0.986 | 1.000 | 1.000 | 0.000 | 0.474 |
이론실습여부 | 0.000 | 0.000 | 0.000 | 1.000 | 0.660 |
학점 | 0.377 | 0.593 | 0.474 | 0.660 | 1.000 |
학점 | 이론실습여부 | 캠퍼스 | 계열 | |
---|---|---|---|---|
학점 | 1.000 | 0.920 | 0.246 | 0.213 |
이론실습여부 | 0.920 | 1.000 | 0.000 | 0.000 |
캠퍼스 | 0.246 | 0.000 | 1.000 | 0.801 |
계열 | 0.213 | 0.000 | 0.801 | 1.000 |
계열 | 캠퍼스 | 이론실습여부 | 학점 | |
---|---|---|---|---|
계열 | 1.000 | 0.801 | 0.000 | 0.213 |
캠퍼스 | 0.801 | 1.000 | 0.000 | 0.246 |
이론실습여부 | 0.000 | 0.000 | 1.000 | 0.920 |
학점 | 0.213 | 0.246 | 0.920 | 1.000 |
과정 | 계열 | 학과 | 캠퍼스 | 이론실습여부 | 교과목명 | 학점 | |
---|---|---|---|---|---|---|---|
0 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | 3D모델링실습 | 4 |
1 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | CAD실습 | 4 |
2 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | CNC선반실습 | 4 |
3 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | 공작기계실습 | 4 |
4 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | 금속가공실습 | 4 |
5 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | 금형제작실습 | 4 |
6 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | 기계공작실습 | 4 |
7 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | 도면해독법 | 3 |
8 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | 머시닝센터실습 | 4 |
9 | 다기능 | 기계 | 컴퓨터응용기계 | 서울정수, 성남, 춘천, 원주, 청주, 홍성, 김제, 목포, 익산, 대구, 구미, 부산, 울산-컴퓨터응용기계/창원-기계시스템 | 실습 | 정밀측정실습 | 4 |
과정 | 계열 | 학과 | 캠퍼스 | 이론실습여부 | 교과목명 | 학점 | |
---|---|---|---|---|---|---|---|
759 | 다기능 | ICT융합 | 스마트팩토리 | 창원 | 이론 | 기계제도 | 2 |
760 | 다기능 | ICT융합 | 스마트팩토리 | 창원 | 이론 | 전기전자공학 | 2 |
761 | 다기능 | ICT융합 | 스마트융합제어 | 울산 | 실습 | IoT융합CAD실습 | 4 |
762 | 다기능 | ICT융합 | 스마트융합제어 | 울산 | 실습 | 네트워크구축실습 | 4 |
763 | 다기능 | ICT융합 | 스마트융합제어 | 울산 | 실습 | 디지털회로실습 | 4 |
764 | 다기능 | ICT융합 | 스마트융합제어 | 울산 | 실습 | 스마트전기제어실습 | 4 |
765 | 다기능 | ICT융합 | 스마트융합제어 | 울산 | 실습 | 전기전자실습 | 4 |
766 | 다기능 | ICT융합 | 스마트융합제어 | 울산 | 실습 | 문제원형실습 | 4 |
767 | 다기능 | ICT융합 | 스마트융합제어 | 울산 | 이론 | 전기전자공학 | 2 |
768 | 다기능 | ICT융합 | 스마트융합제어 | 울산 | 이론 | 프로그래밍언어 | 3 |
Most frequently occurring
과정 | 계열 | 학과 | 캠퍼스 | 이론실습여부 | 교과목명 | 학점 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 다기능 | 미디어 | 스마트소프트웨어 | 대전 | <NA> | <NA> | <NA> | 13 |
1 | 다기능 | 섬유패션 | 패션디자인 | 서울강서,섬유패션 | 이론 | 의복구성원리 | 3 | 2 |
2 | 다기능 | 전기 | 전기, 전기에너지, 전기에너지시스템 | 서울정수, 안성, 춘천, 홍성, 광주, 목포, 구미, 부산, 울산-전기/인천-전기에너지시스템/ 청주-전기에너지 | 이론 | 신재생에너지공학 | 2 | 2 |