Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 2799 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 254 |
Duplicate rows (%) | 9.1% |
Total size in memory | 153.2 KiB |
Average record size in memory | 56.0 B |
Variable types
Categorical | 4 |
---|---|
Text | 3 |
Dataset
Description | 2023년 4월 6일 기준 국가과학기술표준분류에 대한 정보입니다. 국가과학기술표준분류: 과학기술 관련 정보, 인력, 연구개발사업 등의 효율적 관리하고, 국가연구개발사업의 연구기획·평가 및 관리, 과학기술예측 및 기술수준평가 수행, 과학기술 정보의 관리·유통 등을 위한 과학기술 표준분류틀 해당 데이터가 보유한 컬럼은 다음과 같습니다. 컬럼명: 연구분야, 대분류코드, 대분류명, 대분류영문명, 중분류명, 중분류 영문명 |
---|---|
URL | https://www.data.go.kr/data/15113217/fileData.do |
Dataset has 254 (9.1%) duplicate rows | Duplicates |
대분류명 is highly overall correlated with 연구분야 and 2 other fields | High correlation |
연구분야 is highly overall correlated with 대분류코드 and 2 other fields | High correlation |
대분류코드 is highly overall correlated with 연구분야 and 2 other fields | High correlation |
대분류 영문명 is highly overall correlated with 연구분야 and 2 other fields | High correlation |
Reproduction
Analysis started | 2023-12-12 14:53:13.282150 |
---|---|
Analysis finished | 2023-12-12 14:53:13.871455 |
Duration | 0.59 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연구분야
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
인문사회학 | |
---|---|
인공물 | |
생명 | |
자연 | |
인간 과학과 기술 | 73 |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 3.6538049 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 자연 |
---|---|
2nd row | 자연 |
3rd row | 자연 |
4th row | 자연 |
5th row | 자연 |
Common Values
Value | Count | Frequency (%) |
인문사회학 | 1090 | |
인공물 | 848 | |
생명 | 445 | |
자연 | 343 | 12.3% |
인간 과학과 기술 | 73 | 2.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
인문사회학 | 1090 | |
인공물 | 848 | |
생명 | 445 | |
자연 | 343 | 11.6% |
인간 | 73 | 2.5% |
과학과 | 73 | 2.5% |
기술 | 73 | 2.5% |
대분류코드
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
HG | |
---|---|
HF | |
LC | |
LB | |
EA | |
Other values (17) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0507324 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
HG | 568 | |
HF | 397 | |
LC | 203 | 7.3% |
LB | 169 | 6.0% |
EA | 148 | 5.3% |
ED | 126 | 4.5% |
HH | 125 | 4.5% |
ND | 117 | 4.2% |
EC | 109 | 3.9% |
NC | 98 | 3.5% |
Other values (12) | 739 |
Length
Value | Count | Frequency (%) |
hg | 568 | |
hf | 397 | |
lc | 203 | 7.3% |
lb | 169 | 6.0% |
ea | 148 | 5.3% |
ed | 126 | 4.5% |
hh | 125 | 4.5% |
nd | 117 | 4.2% |
ec | 109 | 3.9% |
nc | 98 | 3.5% |
Other values (12) | 739 |
대분류명
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
사회과학 | |
---|---|
인문학 | |
보건의료 | |
농림수산식품 | |
기계 | |
Other values (17) |
Length
Max length | 17 |
---|---|
Median length | 11 |
Mean length | 4.4340836 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 수학 |
---|---|
2nd row | 수학 |
3rd row | 수학 |
4th row | 수학 |
5th row | 수학 |
Common Values
Value | Count | Frequency (%) |
사회과학 | 568 | |
인문학 | 397 | |
보건의료 | 203 | 7.3% |
농림수산식품 | 169 | 6.0% |
기계 | 148 | 5.3% |
전기/전자 | 126 | 4.5% |
문화예술체육학 | 125 | 4.5% |
지구과학(지구/대기/해양/천문) | 117 | 4.2% |
화공 | 109 | 3.9% |
화학 | 98 | 3.5% |
Other values (12) | 739 |
Length
Value | Count | Frequency (%) |
사회과학 | 568 | |
인문학 | 397 | |
보건의료 | 203 | 7.1% |
농림수산식품 | 169 | 5.9% |
기계 | 148 | 5.2% |
전기/전자 | 126 | 4.4% |
문화예술체육학 | 125 | 4.4% |
지구과학(지구/대기/해양/천문 | 117 | 4.1% |
화공 | 109 | 3.8% |
화학 | 98 | 3.4% |
Other values (14) | 788 |
대분류 영문명
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
Social Science | |
---|---|
Humanities | |
Health Sciences | |
Agriculture, Fishery and Food | |
Machinery | |
Other values (17) |
Length
Max length | 48 |
---|---|
Median length | 29 |
Mean length | 16.892104 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | Mathematics |
---|---|
2nd row | Mathematics |
3rd row | Mathematics |
4th row | Mathematics |
5th row | Mathematics |
Common Values
Value | Count | Frequency (%) |
Social Science | 568 | |
Humanities | 397 | |
Health Sciences | 203 | 7.3% |
Agriculture, Fishery and Food | 169 | 6.0% |
Machinery | 148 | 5.3% |
Electricity/Electronics | 126 | 4.5% |
Culture/Arts/Sports | 125 | 4.5% |
Earth Science(Earth/Atmosphere/Marine/Astronomy) | 117 | 4.2% |
Chemical Engineering | 109 | 3.9% |
Chemistry | 98 | 3.5% |
Other values (12) | 739 |
Length
Value | Count | Frequency (%) |
science | 675 | |
social | 568 | 12.3% |
humanities | 397 | 8.6% |
sciences | 242 | 5.2% |
and | 218 | 4.7% |
health | 203 | 4.4% |
agriculture | 169 | 3.6% |
fishery | 169 | 3.6% |
food | 169 | 3.6% |
machinery | 148 | 3.2% |
Other values (23) | 1677 |
중분류코드
Text
Distinct | 277 |
---|---|
Distinct (%) | 9.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
Value | Count | Frequency (%) |
hg12 | 63 | 2.3% |
hf01 | 59 | 2.1% |
hf02 | 48 | 1.7% |
hg11 | 45 | 1.6% |
hg04 | 44 | 1.6% |
hg15 | 43 | 1.5% |
hg19 | 41 | 1.5% |
hf12 | 39 | 1.4% |
hg01 | 38 | 1.4% |
hg20 | 35 | 1.3% |
Other values (267) | 2344 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 1849 | |
1 | 1446 | |
H | 1292 | |
E | 935 | 8.4% |
G | 641 | 5.7% |
2 | 596 | 5.3% |
F | 448 | 4.0% |
L | 445 | 4.0% |
C | 444 | 4.0% |
N | 343 | 3.1% |
Other values (12) | 2757 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 5598 | |
Uppercase Letter | 5598 |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
H | 1292 | |
E | 935 | |
G | 641 | |
F | 448 | 8.0% |
L | 445 | 7.9% |
C | 444 | 7.9% |
N | 343 | 6.1% |
B | 325 | 5.8% |
A | 316 | 5.6% |
D | 243 | 4.3% |
Other values (2) | 166 | 3.0% |
Decimal Number
Value | Count | Frequency (%) |
0 | 1849 | |
1 | 1446 | |
2 | 596 | 10.6% |
3 | 315 | 5.6% |
4 | 278 | 5.0% |
5 | 262 | 4.7% |
8 | 239 | 4.3% |
9 | 230 | 4.1% |
7 | 201 | 3.6% |
6 | 182 | 3.3% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 5598 | |
Latin | 5598 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
H | 1292 | |
E | 935 | |
G | 641 | |
F | 448 | 8.0% |
L | 445 | 7.9% |
C | 444 | 7.9% |
N | 343 | 6.1% |
B | 325 | 5.8% |
A | 316 | 5.6% |
D | 243 | 4.3% |
Other values (2) | 166 | 3.0% |
Common
Value | Count | Frequency (%) |
0 | 1849 | |
1 | 1446 | |
2 | 596 | 10.6% |
3 | 315 | 5.6% |
4 | 278 | 5.0% |
5 | 262 | 4.7% |
8 | 239 | 4.3% |
9 | 230 | 4.1% |
7 | 201 | 3.6% |
6 | 182 | 3.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 11196 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 1849 | |
1 | 1446 | |
H | 1292 | |
E | 935 | 8.4% |
G | 641 | 5.7% |
2 | 596 | 5.3% |
F | 448 | 4.0% |
L | 445 | 4.0% |
C | 444 | 4.0% |
N | 343 | 3.1% |
Other values (12) | 2757 |
중분류명
Text
Distinct | 276 |
---|---|
Distinct (%) | 9.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
Value | Count | Frequency (%) |
문학 | 214 | 6.2% |
기타 | 68 | 2.0% |
법학 | 63 | 1.8% |
역사학 | 59 | 1.7% |
철학 | 48 | 1.4% |
교육학 | 45 | 1.3% |
경영학 | 44 | 1.3% |
지리학 | 43 | 1.3% |
심리과학 | 41 | 1.2% |
한국어와 | 39 | 1.1% |
Other values (301) | 2764 |
Most occurring characters
Value | Count | Frequency (%) |
학 | 1609 | 10.4% |
기 | 734 | 4.8% |
629 | 4.1% | |
/ | 435 | 2.8% |
문 | 338 | 2.2% |
정 | 328 | 2.1% |
리 | 315 | 2.0% |
어 | 288 | 1.9% |
과 | 284 | 1.8% |
생 | 255 | 1.7% |
Other values (208) | 10220 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14195 | |
Space Separator | 629 | 4.1% |
Other Punctuation | 599 | 3.9% |
Uppercase Letter | 12 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 1609 | 11.3% |
기 | 734 | 5.2% |
문 | 338 | 2.4% |
정 | 328 | 2.3% |
리 | 315 | 2.2% |
어 | 288 | 2.0% |
과 | 284 | 2.0% |
생 | 255 | 1.8% |
화 | 246 | 1.7% |
자 | 241 | 1.7% |
Other values (203) | 9557 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 435 | |
· | 164 | 27.4% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 6 | |
W | 6 |
Space Separator
Value | Count | Frequency (%) |
629 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14195 | |
Common | 1228 | 8.0% |
Latin | 12 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 1609 | 11.3% |
기 | 734 | 5.2% |
문 | 338 | 2.4% |
정 | 328 | 2.3% |
리 | 315 | 2.2% |
어 | 288 | 2.0% |
과 | 284 | 2.0% |
생 | 255 | 1.8% |
화 | 246 | 1.7% |
자 | 241 | 1.7% |
Other values (203) | 9557 |
Common
Value | Count | Frequency (%) |
629 | ||
/ | 435 | |
· | 164 | 13.4% |
Latin
Value | Count | Frequency (%) |
S | 6 | |
W | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14195 | |
ASCII | 1076 | 7.0% |
None | 164 | 1.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
학 | 1609 | 11.3% |
기 | 734 | 5.2% |
문 | 338 | 2.4% |
정 | 328 | 2.3% |
리 | 315 | 2.2% |
어 | 288 | 2.0% |
과 | 284 | 2.0% |
생 | 255 | 1.8% |
화 | 246 | 1.7% |
자 | 241 | 1.7% |
Other values (203) | 9557 |
ASCII
Value | Count | Frequency (%) |
629 | ||
/ | 435 | |
S | 6 | 0.6% |
W | 6 | 0.6% |
None
Value | Count | Frequency (%) |
· | 164 |
중분류 영문명
Text
Distinct | 276 |
---|---|
Distinct (%) | 9.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 22.0 KiB |
Value | Count | Frequency (%) |
and | 478 | 7.0% |
science | 267 | 3.9% |
linguistics | 237 | 3.5% |
literature | 231 | 3.4% |
management | 108 | 1.6% |
technology | 99 | 1.5% |
safety | 96 | 1.4% |
information | 85 | 1.3% |
administration | 77 | 1.1% |
chemistry | 75 | 1.1% |
Other values (335) | 5039 |
Most occurring characters
Value | Count | Frequency (%) |
e | 5619 | 9.1% |
i | 5587 | 9.1% |
n | 4726 | 7.7% |
a | 4241 | 6.9% |
3993 | 6.5% | |
t | 3952 | 6.4% |
o | 3874 | 6.3% |
r | 3484 | 5.6% |
c | 3260 | 5.3% |
s | 3026 | 4.9% |
Other values (46) | 19913 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 50300 | |
Uppercase Letter | 6732 | 10.9% |
Space Separator | 3993 | 6.5% |
Other Punctuation | 603 | 1.0% |
Dash Punctuation | 38 | 0.1% |
Open Punctuation | 9 | < 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
e | 5619 | |
i | 5587 | |
n | 4726 | |
a | 4241 | |
t | 3952 | 7.9% |
o | 3874 | 7.7% |
r | 3484 | 6.9% |
c | 3260 | 6.5% |
s | 3026 | 6.0% |
l | 2355 | 4.7% |
Other values (15) | 10176 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 777 | |
M | 608 | 9.0% |
P | 593 | 8.8% |
L | 583 | 8.7% |
C | 514 | 7.6% |
E | 509 | 7.6% |
A | 440 | 6.5% |
D | 361 | 5.4% |
F | 353 | 5.2% |
T | 279 | 4.1% |
Other values (13) | 1715 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 483 | |
& | 46 | 7.6% |
· | 36 | 6.0% |
, | 24 | 4.0% |
' | 14 | 2.3% |
Space Separator
Value | Count | Frequency (%) |
3993 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 38 |
Open Punctuation
Value | Count | Frequency (%) |
( | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 57032 | |
Common | 4643 | 7.5% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
e | 5619 | 9.9% |
i | 5587 | 9.8% |
n | 4726 | 8.3% |
a | 4241 | 7.4% |
t | 3952 | 6.9% |
o | 3874 | 6.8% |
r | 3484 | 6.1% |
c | 3260 | 5.7% |
s | 3026 | 5.3% |
l | 2355 | 4.1% |
Other values (38) | 16908 |
Common
Value | Count | Frequency (%) |
3993 | ||
/ | 483 | 10.4% |
& | 46 | 1.0% |
- | 38 | 0.8% |
· | 36 | 0.8% |
, | 24 | 0.5% |
' | 14 | 0.3% |
( | 9 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 61639 | |
None | 36 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
e | 5619 | 9.1% |
i | 5587 | 9.1% |
n | 4726 | 7.7% |
a | 4241 | 6.9% |
3993 | 6.5% | |
t | 3952 | 6.4% |
o | 3874 | 6.3% |
r | 3484 | 5.7% |
c | 3260 | 5.3% |
s | 3026 | 4.9% |
Other values (45) | 19877 |
None
Value | Count | Frequency (%) |
· | 36 |
연구분야 | 대분류코드 | 대분류명 | 대분류 영문명 | |
---|---|---|---|---|
연구분야 | 1.000 | 1.000 | 1.000 | 1.000 |
대분류코드 | 1.000 | 1.000 | 1.000 | 1.000 |
대분류명 | 1.000 | 1.000 | 1.000 | 1.000 |
대분류 영문명 | 1.000 | 1.000 | 1.000 | 1.000 |
대분류명 | 연구분야 | 대분류코드 | 대분류 영문명 | |
---|---|---|---|---|
대분류명 | 1.000 | 0.997 | 1.000 | 1.000 |
연구분야 | 0.997 | 1.000 | 0.997 | 0.997 |
대분류코드 | 1.000 | 0.997 | 1.000 | 1.000 |
대분류 영문명 | 1.000 | 0.997 | 1.000 | 1.000 |
연구분야 | 대분류코드 | 대분류명 | 대분류 영문명 | |
---|---|---|---|---|
연구분야 | 1.000 | 0.997 | 0.997 | 0.997 |
대분류코드 | 0.997 | 1.000 | 1.000 | 1.000 |
대분류명 | 0.997 | 1.000 | 1.000 | 1.000 |
대분류 영문명 | 0.997 | 1.000 | 1.000 | 1.000 |
연구분야 | 대분류코드 | 대분류명 | 대분류 영문명 | 중분류코드 | 중분류명 | 중분류 영문명 | |
---|---|---|---|---|---|---|---|
0 | 자연 | <NA> | 수학 | Mathematics | NA01 | 대수학 | Algebra |
1 | 자연 | <NA> | 수학 | Mathematics | NA01 | 대수학 | Algebra |
2 | 자연 | <NA> | 수학 | Mathematics | NA01 | 대수학 | Algebra |
3 | 자연 | <NA> | 수학 | Mathematics | NA01 | 대수학 | Algebra |
4 | 자연 | <NA> | 수학 | Mathematics | NA01 | 대수학 | Algebra |
5 | 자연 | <NA> | 수학 | Mathematics | NA01 | 대수학 | Algebra |
6 | 자연 | <NA> | 수학 | Mathematics | NA01 | 대수학 | Algebra |
7 | 자연 | <NA> | 수학 | Mathematics | NA01 | 대수학 | Algebra |
8 | 자연 | <NA> | 수학 | Mathematics | NA02 | 해석학 | Analysis |
9 | 자연 | <NA> | 수학 | Mathematics | NA02 | 해석학 | Analysis |
연구분야 | 대분류코드 | 대분류명 | 대분류 영문명 | 중분류코드 | 중분류명 | 중분류 영문명 | |
---|---|---|---|---|---|---|---|
2789 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC03 | 과학기술정책 사회 | Science and Technology Policy Society |
2790 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC04 | 생명 의료윤리 | Bioethics Medical Ethics |
2791 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC04 | 생명 의료윤리 | Bioethics Medical Ethics |
2792 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC04 | 생명 의료윤리 | Bioethics Medical Ethics |
2793 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC04 | 생명 의료윤리 | Bioethics Medical Ethics |
2794 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC04 | 생명 의료윤리 | Bioethics Medical Ethics |
2795 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC05 | 안전사회/재난관리 | Safe Society/Disaster Management |
2796 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC05 | 안전사회/재난관리 | Safe Society/Disaster Management |
2797 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC05 | 안전사회/재난관리 | Safe Society/Disaster Management |
2798 | 인간 과학과 기술 | OC | 과학기술과 인문사회 | Science, Technology and Society | OC99 | 기타 과학기술과 인문사회 | Other Science, Technology and Society |
Most frequently occurring
연구분야 | 대분류코드 | 대분류명 | 대분류 영문명 | 중분류코드 | 중분류명 | 중분류 영문명 | # duplicates | |
---|---|---|---|---|---|---|---|---|
188 | 인문사회학 | HG | 사회과학 | Social Science | HG12 | 법학 | Law | 63 |
155 | 인문사회학 | HF | 인문학 | Humanities | HF01 | 역사학 | History | 59 |
156 | 인문사회학 | HF | 인문학 | Humanities | HF02 | 철학 | Philosophy | 48 |
187 | 인문사회학 | HG | 사회과학 | Social Science | HG11 | 교육학 | Education | 45 |
180 | 인문사회학 | HG | 사회과학 | Social Science | HG04 | 경영학 | Business Administration | 44 |
191 | 인문사회학 | HG | 사회과학 | Social Science | HG15 | 지리학 | Geographical | 43 |
195 | 인문사회학 | HG | 사회과학 | Social Science | HG19 | 심리과학 | Psychology | 41 |
165 | 인문사회학 | HF | 인문학 | Humanities | HF12 | 한국어와 문학 | Korean Linguistics and Literature | 39 |
177 | 인문사회학 | HG | 사회과학 | Social Science | HG01 | 정치외교학 | Political Science & Diplomacy | 38 |
196 | 인문사회학 | HG | 사회과학 | Social Science | HG20 | 생활과학 | Human Ecology | 35 |