Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 26 |
Duplicate rows (%) | 0.3% |
Total size in memory | 468.8 KiB |
Average record size in memory | 48.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Dataset
Description | 폴리텍대학에서 운영하는 학과, 계열, 과정, 교과목명 |
---|---|
Author | 학교법인한국폴리텍 |
URL | https://www.data.go.kr/data/15053553/fileData.do |
Dataset has 26 (0.3%) duplicate rows | Duplicates |
계열 is highly imbalanced (76.3%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 20:37:34.833468 |
---|---|
Analysis finished | 2023-12-12 20:37:35.714343 |
Duration | 0.88 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
캠퍼스
Categorical
Distinct | 36 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
인천캠퍼스 | |
---|---|
서울정수캠퍼스 | 633 |
서울강서캠퍼스 | 565 |
창원캠퍼스 | 559 |
광주캠퍼스 | 514 |
Other values (31) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 5.3524 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대전캠퍼스 |
---|---|
2nd row | 남인천캠퍼스 |
3rd row | 아산캠퍼스 |
4th row | 남인천캠퍼스 |
5th row | 아산캠퍼스 |
Common Values
Value | Count | Frequency (%) |
인천캠퍼스 | 848 | 8.5% |
서울정수캠퍼스 | 633 | 6.3% |
서울강서캠퍼스 | 565 | 5.7% |
창원캠퍼스 | 559 | 5.6% |
광주캠퍼스 | 514 | 5.1% |
대전캠퍼스 | 428 | 4.3% |
성남캠퍼스 | 410 | 4.1% |
춘천캠퍼스 | 364 | 3.6% |
부산캠퍼스 | 349 | 3.5% |
울산캠퍼스 | 328 | 3.3% |
Other values (26) | 5002 |
Length
Value | Count | Frequency (%) |
인천캠퍼스 | 848 | 8.5% |
서울정수캠퍼스 | 633 | 6.3% |
서울강서캠퍼스 | 565 | 5.7% |
창원캠퍼스 | 559 | 5.6% |
광주캠퍼스 | 514 | 5.1% |
대전캠퍼스 | 428 | 4.3% |
성남캠퍼스 | 410 | 4.1% |
춘천캠퍼스 | 364 | 3.6% |
부산캠퍼스 | 349 | 3.5% |
울산캠퍼스 | 328 | 3.3% |
Other values (26) | 5002 |
학과
Text
Distinct | 178 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
컴퓨터응용기계과 | 882 | 8.8% |
경력단절여성(예산 | 509 | 5.1% |
베이비부머(예산 | 446 | 4.5% |
자동차과 | 425 | 4.2% |
산업설비자동화과 | 383 | 3.8% |
전기과 | 368 | 3.7% |
금형디자인과 | 318 | 3.2% |
정보통신시스템과 | 306 | 3.1% |
산업설비과 | 297 | 3.0% |
메카트로닉스과 | 291 | 2.9% |
Other values (168) | 5775 |
Most occurring characters
Value | Count | Frequency (%) |
과 | 9010 | 12.9% |
자 | 3259 | 4.7% |
기 | 2600 | 3.7% |
스 | 2395 | 3.4% |
산 | 2022 | 2.9% |
계 | 1906 | 2.7% |
전 | 1870 | 2.7% |
디 | 1513 | 2.2% |
비 | 1508 | 2.2% |
용 | 1466 | 2.1% |
Other values (183) | 42283 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 66219 | |
Open Punctuation | 1282 | 1.8% |
Close Punctuation | 1282 | 1.8% |
Uppercase Letter | 963 | 1.4% |
Other Punctuation | 69 | 0.1% |
Decimal Number | 17 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
과 | 9010 | 13.6% |
자 | 3259 | 4.9% |
기 | 2600 | 3.9% |
스 | 2395 | 3.6% |
산 | 2022 | 3.1% |
계 | 1906 | 2.9% |
전 | 1870 | 2.8% |
디 | 1513 | 2.3% |
비 | 1508 | 2.3% |
용 | 1466 | 2.2% |
Other values (169) | 38670 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 206 | |
T | 170 | |
I | 170 | |
D | 140 | |
A | 100 | |
S | 67 | 7.0% |
G | 48 | 5.0% |
L | 23 | 2.4% |
E | 20 | 2.1% |
W | 19 | 2.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1282 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1282 |
Other Punctuation
Value | Count | Frequency (%) |
& | 69 |
Decimal Number
Value | Count | Frequency (%) |
3 | 17 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 66219 | |
Common | 2650 | 3.8% |
Latin | 963 | 1.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
과 | 9010 | 13.6% |
자 | 3259 | 4.9% |
기 | 2600 | 3.9% |
스 | 2395 | 3.6% |
산 | 2022 | 3.1% |
계 | 1906 | 2.9% |
전 | 1870 | 2.8% |
디 | 1513 | 2.3% |
비 | 1508 | 2.3% |
용 | 1466 | 2.2% |
Other values (169) | 38670 |
Latin
Value | Count | Frequency (%) |
C | 206 | |
T | 170 | |
I | 170 | |
D | 140 | |
A | 100 | |
S | 67 | 7.0% |
G | 48 | 5.0% |
L | 23 | 2.4% |
E | 20 | 2.1% |
W | 19 | 2.0% |
Common
Value | Count | Frequency (%) |
( | 1282 | |
) | 1282 | |
& | 69 | 2.6% |
3 | 17 | 0.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 66219 | |
ASCII | 3613 | 5.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
과 | 9010 | 13.6% |
자 | 3259 | 4.9% |
기 | 2600 | 3.9% |
스 | 2395 | 3.6% |
산 | 2022 | 3.1% |
계 | 1906 | 2.9% |
전 | 1870 | 2.8% |
디 | 1513 | 2.3% |
비 | 1508 | 2.3% |
용 | 1466 | 2.2% |
Other values (169) | 38670 |
ASCII
Value | Count | Frequency (%) |
( | 1282 | |
) | 1282 | |
C | 206 | 5.7% |
T | 170 | 4.7% |
I | 170 | 4.7% |
D | 140 | 3.9% |
A | 100 | 2.8% |
& | 69 | 1.9% |
S | 67 | 1.9% |
G | 48 | 1.3% |
Other values (4) | 79 | 2.2% |
계열
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
정보.전기.전자계열 | |
---|---|
기계.금속계열 | 548 |
디자인.섬유계 | 213 |
자동화.건축.산업응용계열 | 20 |
Length
Max length | 13 |
---|---|
Median length | 10 |
Mean length | 9.7777 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 디자인.섬유계 |
---|---|
2nd row | 정보.전기.전자계열 |
3rd row | 정보.전기.전자계열 |
4th row | 정보.전기.전자계열 |
5th row | 정보.전기.전자계열 |
Common Values
Value | Count | Frequency (%) |
정보.전기.전자계열 | 9219 | |
기계.금속계열 | 548 | 5.5% |
디자인.섬유계 | 213 | 2.1% |
자동화.건축.산업응용계열 | 20 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정보.전기.전자계열 | 9219 | |
기계.금속계열 | 548 | 5.5% |
디자인.섬유계 | 213 | 2.1% |
자동화.건축.산업응용계열 | 20 | 0.2% |
과정
Categorical
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
다기능기술자 | |
---|---|
기능사 | |
학위전공심화 | 189 |
기능장 | 137 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 4.7007 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 다기능기술자 |
---|---|
2nd row | 기능사 |
3rd row | 다기능기술자 |
4th row | 기능사 |
5th row | 다기능기술자 |
Common Values
Value | Count | Frequency (%) |
다기능기술자 | 5480 | |
기능사 | 4194 | |
학위전공심화 | 189 | 1.9% |
기능장 | 137 | 1.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
다기능기술자 | 5480 | |
기능사 | 4194 | |
학위전공심화 | 189 | 1.9% |
기능장 | 137 | 1.4% |
교과목명
Text
Distinct | 4221 |
---|---|
Distinct (%) | 42.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
문제원형실습 | 158 | 1.4% |
프로젝트실습 | 115 | 1.0% |
참人폴리텍 | 100 | 0.9% |
영어 | 99 | 0.9% |
직업과사회 | 97 | 0.9% |
및 | 86 | 0.8% |
실용영어 | 83 | 0.8% |
건강과능력개발 | 82 | 0.7% |
봉사활동 | 82 | 0.7% |
한국사 | 77 | 0.7% |
Other values (4349) | 10038 |
Most occurring characters
Value | Count | Frequency (%) |
실 | 4016 | 6.2% |
습 | 3550 | 5.4% |
기 | 1958 | 3.0% |
공 | 1262 | 1.9% |
제 | 1239 | 1.9% |
전 | 1196 | 1.8% |
자 | 1188 | 1.8% |
로 | 1142 | 1.8% |
C | 1121 | 1.7% |
1039 | 1.6% | |
Other values (553) | 47527 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 56913 | |
Uppercase Letter | 4097 | 6.3% |
Decimal Number | 1738 | 2.7% |
Space Separator | 1039 | 1.6% |
Lowercase Letter | 394 | 0.6% |
Open Punctuation | 314 | 0.5% |
Close Punctuation | 313 | 0.5% |
Letter Number | 306 | 0.5% |
Other Punctuation | 106 | 0.2% |
Dash Punctuation | 14 | < 0.1% |
Other values (3) | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
실 | 4016 | 7.1% |
습 | 3550 | 6.2% |
기 | 1958 | 3.4% |
공 | 1262 | 2.2% |
제 | 1239 | 2.2% |
전 | 1196 | 2.1% |
자 | 1188 | 2.1% |
로 | 1142 | 2.0% |
어 | 954 | 1.7% |
계 | 890 | 1.6% |
Other values (479) | 39518 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 1121 | |
D | 535 | |
A | 478 | |
I | 345 | 8.4% |
N | 250 | 6.1% |
P | 206 | 5.0% |
L | 201 | 4.9% |
T | 180 | 4.4% |
O | 154 | 3.8% |
M | 148 | 3.6% |
Other values (14) | 479 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 63 | |
r | 40 | |
o | 32 | 8.1% |
l | 31 | 7.9% |
n | 30 | 7.6% |
i | 27 | 6.9% |
w | 25 | 6.3% |
a | 24 | 6.1% |
t | 21 | 5.3% |
s | 13 | 3.3% |
Other values (14) | 88 |
Decimal Number
Value | Count | Frequency (%) |
1 | 756 | |
2 | 674 | |
3 | 270 | 15.5% |
5 | 17 | 1.0% |
4 | 16 | 0.9% |
0 | 2 | 0.1% |
7 | 2 | 0.1% |
8 | 1 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 54 | |
, | 38 | |
. | 9 | 8.5% |
& | 4 | 3.8% |
% | 1 | 0.9% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 125 | |
Ⅱ | 122 | |
Ⅲ | 53 | |
Ⅳ | 6 | 2.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 282 | |
[ | 32 | 10.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 281 | |
] | 32 | 10.2% |
Space Separator
Value | Count | Frequency (%) |
1039 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 14 |
Other Number
Value | Count | Frequency (%) |
₂ | 2 |
Math Symbol
Value | Count | Frequency (%) |
∥ | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 56803 | |
Latin | 4797 | 7.4% |
Common | 3528 | 5.4% |
Han | 110 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
실 | 4016 | 7.1% |
습 | 3550 | 6.2% |
기 | 1958 | 3.4% |
공 | 1262 | 2.2% |
제 | 1239 | 2.2% |
전 | 1196 | 2.1% |
자 | 1188 | 2.1% |
로 | 1142 | 2.0% |
어 | 954 | 1.7% |
계 | 890 | 1.6% |
Other values (478) | 39408 |
Latin
Value | Count | Frequency (%) |
C | 1121 | |
D | 535 | |
A | 478 | |
I | 345 | 7.2% |
N | 250 | 5.2% |
P | 206 | 4.3% |
L | 201 | 4.2% |
T | 180 | 3.8% |
O | 154 | 3.2% |
M | 148 | 3.1% |
Other values (42) | 1179 |
Common
Value | Count | Frequency (%) |
1039 | ||
1 | 756 | |
2 | 674 | |
( | 282 | 8.0% |
) | 281 | 8.0% |
3 | 270 | 7.7% |
/ | 54 | 1.5% |
, | 38 | 1.1% |
] | 32 | 0.9% |
[ | 32 | 0.9% |
Other values (12) | 70 | 2.0% |
Han
Value | Count | Frequency (%) |
人 | 110 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 56803 | |
ASCII | 8016 | 12.3% |
Number Forms | 306 | 0.5% |
CJK | 110 | 0.2% |
None | 2 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
실 | 4016 | 7.1% |
습 | 3550 | 6.2% |
기 | 1958 | 3.4% |
공 | 1262 | 2.2% |
제 | 1239 | 2.2% |
전 | 1196 | 2.1% |
자 | 1188 | 2.1% |
로 | 1142 | 2.0% |
어 | 954 | 1.7% |
계 | 890 | 1.6% |
Other values (478) | 39408 |
ASCII
Value | Count | Frequency (%) |
C | 1121 | |
1039 | ||
1 | 756 | 9.4% |
2 | 674 | 8.4% |
D | 535 | 6.7% |
A | 478 | 6.0% |
I | 345 | 4.3% |
( | 282 | 3.5% |
) | 281 | 3.5% |
3 | 270 | 3.4% |
Other values (58) | 2235 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 125 | |
Ⅱ | 122 | |
Ⅲ | 53 | |
Ⅳ | 6 | 2.0% |
CJK
Value | Count | Frequency (%) |
人 | 110 |
None
Value | Count | Frequency (%) |
₂ | 2 |
Math Operators
Value | Count | Frequency (%) |
∥ | 1 |
캠퍼스 | 계열 | 과정 | |
---|---|---|---|
캠퍼스 | 1.000 | 0.542 | 0.672 |
계열 | 0.542 | 1.000 | 0.474 |
과정 | 0.672 | 0.474 | 1.000 |
계열 | 과정 | 캠퍼스 | |
---|---|---|---|
계열 | 1.000 | 0.200 | 0.285 |
과정 | 0.200 | 1.000 | 0.383 |
캠퍼스 | 0.285 | 0.383 | 1.000 |
캠퍼스 | 계열 | 과정 | |
---|---|---|---|
캠퍼스 | 1.000 | 0.285 | 0.383 |
계열 | 0.285 | 1.000 | 0.200 |
과정 | 0.383 | 0.200 | 1.000 |
캠퍼스 | 학과 | 계열 | 과정 | 교과목명 | |
---|---|---|---|---|---|
9239 | 대전캠퍼스 | 디지털콘텐츠과 | 디자인.섬유계 | 다기능기술자 | 영상연출 |
6472 | 남인천캠퍼스 | 스마트전자과 | 정보.전기.전자계열 | 기능사 | 프로젝트실습 |
10480 | 아산캠퍼스 | 정보통신시스템과 | 정보.전기.전자계열 | 다기능기술자 | 통신융합응용실습 |
6440 | 남인천캠퍼스 | 스마트전자과 | 정보.전기.전자계열 | 기능사 | 직업과사회 |
10319 | 아산캠퍼스 | 메카트로닉스과 | 정보.전기.전자계열 | 다기능기술자 | 프로젝트실습1 |
9835 | 청주캠퍼스 | 컴퓨터응용기계과 | 정보.전기.전자계열 | 다기능기술자 | 실용영어 |
5005 | 인천캠퍼스 | 정보통신공학과 | 정보.전기.전자계열 | 학위전공심화 | 정보통신망구축실습 |
10529 | 아산캠퍼스 | 메카트로닉스과 | 정보.전기.전자계열 | 다기능기술자 | 유공압응용실습 |
13415 | 목포캠퍼스 | 스마트정보통신과 | 정보.전기.전자계열 | 다기능기술자 | 고성능프로세서활용실습 |
2138 | 서울강서캠퍼스 | 실내건축디자인과 | 정보.전기.전자계열 | 기능사 | 실내건축시공실습1 |
캠퍼스 | 학과 | 계열 | 과정 | 교과목명 | |
---|---|---|---|---|---|
7529 | 춘천캠퍼스 | 산업설비과 | 정보.전기.전자계열 | 기능사 | 배관공학 |
17763 | 창원캠퍼스 | 스마트전기전자과 | 정보.전기.전자계열 | 기능사 | 디지털회로실습2 |
5790 | 안성캠퍼스 | 주얼리디자인과 | 정보.전기.전자계열 | 다기능기술자 | 경제학의이해 |
11260 | 충주캠퍼스 | 전기제어과 | 정보.전기.전자계열 | 기능사 | 전기CAD |
19489 | 진주캠퍼스 | 컴퓨터응용기계과 | 정보.전기.전자계열 | 기능사 | CNC공작기계실습 |
20116 | 바이오캠퍼스 | 바이오배양공정과 | 정보.전기.전자계열 | 기능사 | 바이오산업개론 |
5081 | 인천캠퍼스 | 기계시스템과 | 기계.금속계열 | 기능장 | 기계재료 |
9415 | 대전캠퍼스 | 기계시스템과 | 기계.금속계열 | 기능사 | 직업과사회 |
396 | 서울정수캠퍼스 | 산업디자인과 | 정보.전기.전자계열 | 다기능기술자 | 공간스케치기법 |
10630 | 아산캠퍼스 | 베이비부머(예산) | 정보.전기.전자계열 | 기능사 | 취업지도 |
Most frequently occurring
캠퍼스 | 학과 | 계열 | 과정 | 교과목명 | # duplicates | |
---|---|---|---|---|---|---|
0 | 강릉캠퍼스 | 자동차과 | 정보.전기.전자계열 | 기능사 | 건강과능력개발 | 2 |
1 | 광주캠퍼스 | 베이비부머(예산) | 정보.전기.전자계열 | 기능사 | 취업역량교육 | 2 |
2 | 구미캠퍼스 | IT응용제어과 | 정보.전기.전자계열 | 다기능기술자 | 데이터베이스실습 | 2 |
3 | 구미캠퍼스 | 스마트전자과 | 정보.전기.전자계열 | 기능사 | 프로젝트실습 | 2 |
4 | 대전캠퍼스 | 경력단절여성(예산) | 정보.전기.전자계열 | 기능사 | 직무소양교육 | 2 |
5 | 서울정수캠퍼스 | 자동차과 | 정보.전기.전자계열 | 다기능기술자 | 친환경전기장치실습 | 2 |
6 | 서울정수캠퍼스 | 컴퓨터응용기계설계과 | 정보.전기.전자계열 | 다기능기술자 | 치공구설계 | 2 |
7 | 성남캠퍼스 | 베이비부머(예산) | 정보.전기.전자계열 | 기능사 | 전기기기 | 2 |
8 | 성남캠퍼스 | 베이비부머(예산) | 정보.전기.전자계열 | 기능사 | 직업윤리 | 2 |
9 | 성남캠퍼스 | 전자정보통신과 | 정보.전기.전자계열 | 다기능기술자 | 디지털공학 | 2 |