Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 198 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 5 |
Duplicate rows (%) | 2.5% |
Total size in memory | 4.8 KiB |
Average record size in memory | 24.7 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Dataset
Description | 산·학·연의 다양한 경력과 지식을 가진 퇴직 과학기술인에 대한 정보입니다. |
---|---|
Author | 한국과학기술정보연구원 |
URL | https://www.data.go.kr/data/3077287/fileData.do |
Dataset has 5 (2.5%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-12 06:54:11.466387 |
---|---|
Analysis finished | 2023-12-12 06:54:11.745800 |
Duration | 0.28 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
성명
Categorical
Distinct | 43 |
---|---|
Distinct (%) | 21.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
김** | |
---|---|
이** | |
박** | |
조** | |
정** | 10 |
Other values (38) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 14 ? |
---|---|
Unique (%) | 7.1% |
Sample
1st row | 감** |
---|---|
2nd row | 강** |
3rd row | 강** |
4th row | 강** |
5th row | 강** |
Common Values
Value | Count | Frequency (%) |
김** | 38 | |
이** | 23 | 11.6% |
박** | 13 | 6.6% |
조** | 12 | 6.1% |
정** | 10 | 5.1% |
윤** | 7 | 3.5% |
강** | 7 | 3.5% |
신** | 6 | 3.0% |
최** | 6 | 3.0% |
고** | 5 | 2.5% |
Other values (33) | 71 |
Length
Value | Count | Frequency (%) |
김 | 38 | |
이 | 23 | 11.6% |
박 | 13 | 6.6% |
조 | 12 | 6.1% |
정 | 10 | 5.1% |
윤 | 7 | 3.5% |
강 | 7 | 3.5% |
신 | 6 | 3.0% |
최 | 6 | 3.0% |
황 | 5 | 2.5% |
Other values (33) | 71 |
분야
Categorical
Distinct | 9 |
---|---|
Distinct (%) | 4.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
큐레이터 | |
---|---|
화학 | |
IT | |
BT | |
재료 | |
Other values (4) |
Length
Max length | 6 |
---|---|
Median length | 2 |
Mean length | 2.4343434 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 큐레이터 |
---|---|
2nd row | IT |
3rd row | BT |
4th row | BT |
5th row | 화학 |
Common Values
Value | Count | Frequency (%) |
큐레이터 | 30 | |
화학 | 30 | |
IT | 28 | |
BT | 27 | |
재료 | 27 | |
기계 | 25 | |
에너지 | 14 | |
환경 | 14 | |
과학기술일반 | 3 | 1.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
큐레이터 | 30 | |
화학 | 30 | |
it | 28 | |
bt | 27 | |
재료 | 27 | |
기계 | 25 | |
에너지 | 14 | |
환경 | 14 | |
과학기술일반 | 3 | 1.5% |
전공
Text
Distinct | 125 |
---|---|
Distinct (%) | 63.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
Value | Count | Frequency (%) |
기계공학 | 10 | 4.7% |
화학공학 | 10 | 4.7% |
기계 | 6 | 2.8% |
식품공학 | 6 | 2.8% |
화학 | 6 | 2.8% |
금속공학 | 5 | 2.4% |
재료공학 | 5 | 2.4% |
미생물학 | 4 | 1.9% |
유기화학 | 4 | 1.9% |
재료 | 4 | 1.9% |
Other values (122) | 151 |
Most occurring characters
Value | Count | Frequency (%) |
학 | 151 | 15.4% |
공 | 70 | 7.1% |
41 | 4.2% | |
화 | 37 | 3.8% |
기 | 36 | 3.7% |
물 | 26 | 2.6% |
자 | 26 | 2.6% |
재 | 23 | 2.3% |
료 | 21 | 2.1% |
계 | 21 | 2.1% |
Other values (141) | 530 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 871 | |
Space Separator | 41 | 4.2% |
Other Punctuation | 28 | 2.9% |
Lowercase Letter | 25 | 2.5% |
Uppercase Letter | 11 | 1.1% |
Open Punctuation | 3 | 0.3% |
Close Punctuation | 3 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 151 | 17.3% |
공 | 70 | 8.0% |
화 | 37 | 4.2% |
기 | 36 | 4.1% |
물 | 26 | 3.0% |
자 | 26 | 3.0% |
재 | 23 | 2.6% |
료 | 21 | 2.4% |
계 | 21 | 2.4% |
생 | 20 | 2.3% |
Other values (115) | 440 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 5 | |
c | 3 | |
t | 3 | |
a | 3 | |
h | 2 | 8.0% |
i | 2 | 8.0% |
m | 1 | 4.0% |
f | 1 | 4.0% |
s | 1 | 4.0% |
r | 1 | 4.0% |
Other values (3) | 3 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 2 | |
C | 2 | |
M | 2 | |
I | 2 | |
D | 1 | |
P | 1 | |
S | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 17 | |
/ | 9 | |
. | 2 | 7.1% |
Space Separator
Value | Count | Frequency (%) |
41 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 871 | |
Common | 75 | 7.6% |
Latin | 36 | 3.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 151 | 17.3% |
공 | 70 | 8.0% |
화 | 37 | 4.2% |
기 | 36 | 4.1% |
물 | 26 | 3.0% |
자 | 26 | 3.0% |
재 | 23 | 2.6% |
료 | 21 | 2.4% |
계 | 21 | 2.4% |
생 | 20 | 2.3% |
Other values (115) | 440 |
Latin
Value | Count | Frequency (%) |
e | 5 | |
c | 3 | 8.3% |
t | 3 | 8.3% |
a | 3 | 8.3% |
h | 2 | 5.6% |
T | 2 | 5.6% |
C | 2 | 5.6% |
M | 2 | 5.6% |
i | 2 | 5.6% |
I | 2 | 5.6% |
Other values (10) | 10 |
Common
Value | Count | Frequency (%) |
41 | ||
, | 17 | |
/ | 9 | 12.0% |
( | 3 | 4.0% |
) | 3 | 4.0% |
. | 2 | 2.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 871 | |
ASCII | 111 | 11.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
학 | 151 | 17.3% |
공 | 70 | 8.0% |
화 | 37 | 4.2% |
기 | 36 | 4.1% |
물 | 26 | 3.0% |
자 | 26 | 3.0% |
재 | 23 | 2.6% |
료 | 21 | 2.4% |
계 | 21 | 2.4% |
생 | 20 | 2.3% |
Other values (115) | 440 |
ASCII
Value | Count | Frequency (%) |
41 | ||
, | 17 | |
/ | 9 | 8.1% |
e | 5 | 4.5% |
c | 3 | 2.7% |
t | 3 | 2.7% |
a | 3 | 2.7% |
( | 3 | 2.7% |
) | 3 | 2.7% |
h | 2 | 1.8% |
Other values (16) | 22 |
성명 | 분야 | |
---|---|---|
성명 | 1.000 | 0.422 |
분야 | 0.422 | 1.000 |
성명 | 분야 | |
---|---|---|
성명 | 1.000 | 0.147 |
분야 | 0.147 | 1.000 |
성명 | 분야 | |
---|---|---|
성명 | 1.000 | 0.147 |
분야 | 0.147 | 1.000 |
성명 | 분야 | 전공 | |
---|---|---|---|
0 | 감** | 큐레이터 | 산업기술경영 |
1 | 강** | IT | 전자 |
2 | 강** | BT | 생물학/식물생리학 |
3 | 강** | BT | 동물분자생리학 |
4 | 강** | 화학 | 고체물리화학/화학/에너지 |
5 | 강** | 재료 | 세라믹 |
6 | 강** | BT | 수의내과학(면역학) |
7 | 강** | 화학 | 물리화학, Ph.D. |
8 | 고** | 큐레이터 | 군사학 |
9 | 고** | 화학 | 화학공학 |
성명 | 분야 | 전공 | |
---|---|---|---|
188 | 허** | IT | 컴퓨터정보학 (박사수료) |
189 | 허** | 기계 | 불규칙진동 |
190 | 현** | 화학 | 섬유공학 |
191 | 홍** | 환경 | 환경공학 |
192 | 홍** | 환경 | 자원순환공학 |
193 | 황** | 환경 | 토양환경 |
194 | 황** | 화학 | 화학공학 |
195 | 황** | 재료 | |
196 | 황** | 환경 | 환경 |
197 | 황** | 재료 | 고온구조용 복합재료 |
Most frequently occurring
성명 | 분야 | 전공 | # duplicates | |
---|---|---|---|---|
0 | 김** | 재료 | 금속공학 | 3 |
1 | 김** | 재료 | 재료공학 | 2 |
2 | 문** | 기계 | 기계 | 2 |
3 | 심** | 재료 | 금속재료공학 | 2 |
4 | 이** | 화학 | 화학공학 | 2 |