Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 6653 |
Missing cells | 7236 |
Missing cells (%) | 8.4% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 688.8 KiB |
Average record size in memory | 106.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 6 |
Text | 5 |
Unsupported | 1 |
Dataset
Description | 2021년 9월 23일 기준 국가과학기술표분류정보에 대한 정보입니다. 국가과학기술표준분류정보: 과학기술표준분류정보 서비스를 하기 위한 정보로써 연구분야, 적용분야 등 데이터를 구분하여 사용가능한 정보가 포함됨. (과학기술표준분류 소개 및 개요 정보) 해당 데이터가 보유한 컬럼은 다음과 같습니다. 칼럼명: 분류정보일련번호, 분류구분코드, 분류구분코드한글명, 분류코드, 분류코드 한글명, 분야코드, 분야코드 한글명, 대분류코드, 대분류코드 한글명, 중분류코드, 중분류코드 한글명, 제목, 내용태그 |
---|---|
Author | 한국과학기술기획평가원(KISTEP) |
URL | https://www.data.go.kr/data/15065876/fileData.do |
분류코드 is highly overall correlated with 분류정보일련번호 and 5 other fields | High correlation |
분류구분코드 is highly overall correlated with 분류정보일련번호 and 3 other fields | High correlation |
분야코드한글명 is highly overall correlated with 분류정보일련번호 and 3 other fields | High correlation |
분류코드한글명 is highly overall correlated with 분류코드 and 2 other fields | High correlation |
분야코드 is highly overall correlated with 분류정보일련번호 and 5 other fields | High correlation |
분류구분코드한글명 is highly overall correlated with 분류정보일련번호 and 3 other fields | High correlation |
분류정보일련번호 is highly overall correlated with 분류구분코드 and 4 other fields | High correlation |
분류구분코드 is highly imbalanced (90.3%) | Imbalance |
분류구분코드한글명 is highly imbalanced (90.3%) | Imbalance |
분류코드 is highly imbalanced (91.1%) | Imbalance |
분류코드한글명 is highly imbalanced (95.5%) | Imbalance |
대분류코드 has 82 (1.2%) missing values | Missing |
제목 has 371 (5.6%) missing values | Missing |
내용태그 has 6653 (100.0%) missing values | Missing |
내용태그 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-12 14:23:44.682994 |
---|---|
Analysis finished | 2023-12-12 14:23:46.814691 |
Duration | 2.13 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
분류정보일련번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 3364 |
---|---|
Distinct (%) | 50.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1664.0439 |
Minimum | 1 |
---|---|
Maximum | 3598 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 58.6 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 167 |
Q1 | 832 |
median | 1664 |
Q3 | 2495 |
95-th percentile | 3160.4 |
Maximum | 3598 |
Range | 3597 |
Interquartile range (IQR) | 1663 |
Descriptive statistics
Standard deviation | 960.86299 |
---|---|
Coefficient of variation (CV) | 0.57742647 |
Kurtosis | -1.1973128 |
Mean | 1664.0439 |
Median Absolute Deviation (MAD) | 832 |
Skewness | 0.0018812196 |
Sum | 11070884 |
Variance | 923257.68 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
1 | 2 | < 0.1% |
2198 | 2 | < 0.1% |
2188 | 2 | < 0.1% |
2189 | 2 | < 0.1% |
2190 | 2 | < 0.1% |
2191 | 2 | < 0.1% |
2192 | 2 | < 0.1% |
2193 | 2 | < 0.1% |
2194 | 2 | < 0.1% |
2195 | 2 | < 0.1% |
Other values (3354) | 6633 |
Value | Count | Frequency (%) |
1 | 2 | |
2 | 2 | |
3 | 2 | |
4 | 2 | |
5 | 2 | |
6 | 2 | |
7 | 2 | |
8 | 2 | |
9 | 2 | |
10 | 2 |
Value | Count | Frequency (%) |
3598 | 1 | |
3372 | 1 | |
3371 | 1 | |
3370 | 1 | |
3369 | 1 | |
3368 | 1 | |
3358 | 1 | |
3357 | 1 | |
3356 | 1 | |
3355 | 1 |
분류구분코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 52.1 KiB |
CL001 | |
---|---|
CL002 | 83 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | CL001 |
---|---|
2nd row | CL001 |
3rd row | CL001 |
4th row | CL001 |
5th row | CL001 |
Common Values
Value | Count | Frequency (%) |
CL001 | 6570 | |
CL002 | 83 | 1.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
cl001 | 6570 | |
cl002 | 83 | 1.2% |
분류구분코드한글명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 52.1 KiB |
분류정보 | |
---|---|
임시정보 | 83 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 분류정보 |
---|---|
2nd row | 분류정보 |
3rd row | 분류정보 |
4th row | 분류정보 |
5th row | 분류정보 |
Common Values
Value | Count | Frequency (%) |
분류정보 | 6570 | |
임시정보 | 83 | 1.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
분류정보 | 6570 | |
임시정보 | 83 | 1.2% |
분류코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 52.1 KiB |
RCSARE | |
---|---|
TMPR01 | 83 |
APPARE | 33 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | RCSARE |
---|---|
2nd row | RCSARE |
3rd row | RCSARE |
4th row | RCSARE |
5th row | RCSARE |
Common Values
Value | Count | Frequency (%) |
RCSARE | 6537 | |
TMPR01 | 83 | 1.2% |
APPARE | 33 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
rcsare | 6537 | |
tmpr01 | 83 | 1.2% |
appare | 33 | 0.5% |
분류코드한글명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 52.1 KiB |
연구분야 | |
---|---|
적용분야 | 33 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 연구분야 |
---|---|
2nd row | 연구분야 |
3rd row | 연구분야 |
4th row | 연구분야 |
5th row | 연구분야 |
Common Values
Value | Count | Frequency (%) |
연구분야 | 6620 | |
적용분야 | 33 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
연구분야 | 6620 | |
적용분야 | 33 | 0.5% |
분야코드
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 52.1 KiB |
ATARE | |
---|---|
SOARE | |
HUARE | |
LFARE | |
NAARE | |
Other values (6) |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 5.0499023 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | NAARE |
---|---|
2nd row | NAARE |
3rd row | NAARE |
4th row | NAARE |
5th row | NAARE |
Common Values
Value | Count | Frequency (%) |
ATARE | 1935 | |
SOARE | 1444 | |
HUARE | 1215 | |
LFARE | 993 | |
NAARE | 781 | |
SIARE | 169 | 2.5% |
TMPR01L01 | 38 | 0.6% |
TMPR01L03 | 34 | 0.5% |
INARE | 20 | 0.3% |
CMARE | 13 | 0.2% |
Length
Value | Count | Frequency (%) |
atare | 1935 | |
soare | 1444 | |
huare | 1215 | |
lfare | 993 | |
naare | 781 | |
siare | 169 | 2.5% |
tmpr01l01 | 38 | 0.6% |
tmpr01l03 | 34 | 0.5% |
inare | 20 | 0.3% |
cmare | 13 | 0.2% |
분야코드한글명
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 52.1 KiB |
인공물 | |
---|---|
사회 | |
인간 | |
생명 | |
자연 | |
Other values (3) |
Length
Max length | 8 |
---|---|
Median length | 2 |
Mean length | 2.4791823 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 자연 |
---|---|
2nd row | 자연 |
3rd row | 자연 |
4th row | 자연 |
5th row | 자연 |
Common Values
Value | Count | Frequency (%) |
인공물 | 1946 | |
사회 | 1444 | |
인간 | 1215 | |
생명 | 1027 | |
자연 | 781 | |
인간과학과 기술 | 207 | 3.1% |
산업 | 20 | 0.3% |
공공 | 13 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
인공물 | 1946 | |
사회 | 1444 | |
인간 | 1215 | |
생명 | 1027 | |
자연 | 781 | |
인간과학과 | 207 | 3.0% |
기술 | 207 | 3.0% |
산업 | 20 | 0.3% |
공공 | 13 | 0.2% |
대분류코드
Text
MISSING
 
Distinct | 86 |
---|---|
Distinct (%) | 1.3% |
Missing | 82 |
Missing (%) | 1.2% |
Memory size | 52.1 KiB |
Value | Count | Frequency (%) |
hc | 304 | 4.6% |
he | 287 | 4.4% |
hd | 284 | 4.3% |
sc | 246 | 3.7% |
lc | 218 | 3.3% |
tg | 216 | 3.3% |
sd | 212 | 3.2% |
hb | 192 | 2.9% |
sb | 192 | 2.9% |
tf | 191 | 2.9% |
Other values (76) | 4229 |
Most occurring characters
Value | Count | Frequency (%) |
T | 1939 | |
H | 1601 | |
E | 1550 | |
S | 1444 | |
C | 1176 | |
D | 897 | 6.4% |
B | 840 | 6.0% |
A | 703 | 5.0% |
L | 688 | 4.9% |
G | 412 | 2.9% |
Other values (21) | 2755 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 13441 | |
Decimal Number | 564 | 4.0% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
T | 1939 | |
H | 1601 | |
E | 1550 | |
S | 1444 | |
C | 1176 | |
D | 897 | |
B | 840 | 6.2% |
A | 703 | 5.2% |
L | 688 | 5.1% |
G | 412 | 3.1% |
Other values (11) | 2191 |
Decimal Number
Value | Count | Frequency (%) |
0 | 269 | |
1 | 210 | |
3 | 37 | 6.6% |
2 | 26 | 4.6% |
9 | 7 | 1.2% |
7 | 3 | 0.5% |
6 | 3 | 0.5% |
5 | 3 | 0.5% |
4 | 3 | 0.5% |
8 | 3 | 0.5% |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 13441 | |
Common | 564 | 4.0% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
T | 1939 | |
H | 1601 | |
E | 1550 | |
S | 1444 | |
C | 1176 | |
D | 897 | |
B | 840 | 6.2% |
A | 703 | 5.2% |
L | 688 | 5.1% |
G | 412 | 3.1% |
Other values (11) | 2191 |
Common
Value | Count | Frequency (%) |
0 | 269 | |
1 | 210 | |
3 | 37 | 6.6% |
2 | 26 | 4.6% |
9 | 7 | 1.2% |
7 | 3 | 0.5% |
6 | 3 | 0.5% |
5 | 3 | 0.5% |
4 | 3 | 0.5% |
8 | 3 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 14005 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
T | 1939 | |
H | 1601 | |
E | 1550 | |
S | 1444 | |
C | 1176 | |
D | 897 | 6.4% |
B | 840 | 6.0% |
A | 703 | 5.0% |
L | 688 | 4.9% |
G | 412 | 2.9% |
Other values (21) | 2755 |
대분류코드한글명
Text
Distinct | 100 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 52.1 KiB |
Length
Max length | 68 |
---|---|
Median length | 43 |
Mean length | 15.768225 |
Min length | 1 |
Characters and Unicode
Total characters | 104906 |
---|---|
Distinct characters | 182 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 32 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | 수학(Mathematics) |
---|---|
2nd row | 수학 |
3rd row | 수학(Mathematics) |
4th row | 수학 |
5th row | 수학(Mathematics) |
Value | Count | Frequency (%) |
and | 439 | 4.5% |
sciences | 265 | 2.7% |
230 | 2.4% | |
농림수산식품 | 225 | 2.3% |
science | 220 | 2.3% |
보건의료(health | 218 | 2.2% |
보건의료 | 216 | 2.2% |
food | 190 | 2.0% |
농림수산식품(agriculture | 190 | 2.0% |
fishery | 190 | 2.0% |
Other values (154) | 7318 |
Most occurring characters
Value | Count | Frequency (%) |
/ | 6251 | 6.0% |
i | 5745 | 5.5% |
e | 5252 | 5.0% |
o | 4909 | 4.7% |
n | 4817 | 4.6% |
r | 4297 | 4.1% |
t | 4192 | 4.0% |
c | 3936 | 3.8% |
) | 3678 | 3.5% |
( | 3678 | 3.5% |
Other values (172) | 58151 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 52649 | |
Other Letter | 28320 | |
Uppercase Letter | 6880 | 6.6% |
Other Punctuation | 6516 | 6.2% |
Close Punctuation | 3678 | 3.5% |
Open Punctuation | 3678 | 3.5% |
Space Separator | 3185 | 3.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 1761 | 6.2% |
지 | 1222 | 4.3% |
문 | 1070 | 3.8% |
기 | 965 | 3.4% |
보 | 804 | 2.8% |
정 | 753 | 2.7% |
화 | 744 | 2.6% |
과 | 700 | 2.5% |
경 | 680 | 2.4% |
건 | 655 | 2.3% |
Other values (129) | 18966 |
Lowercase Letter
Value | Count | Frequency (%) |
i | 5745 | |
e | 5252 | |
o | 4909 | |
n | 4817 | |
r | 4297 | 8.2% |
t | 4192 | 8.0% |
c | 3936 | 7.5% |
a | 3571 | 6.8% |
s | 2829 | 5.4% |
l | 2133 | 4.1% |
Other values (11) | 10968 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 1057 | |
S | 928 | |
A | 871 | |
C | 677 | |
M | 550 | |
L | 536 | |
P | 495 | |
F | 380 | 5.5% |
H | 340 | 4.9% |
R | 236 | 3.4% |
Other values (6) | 810 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 6251 | |
, | 247 | 3.8% |
& | 18 | 0.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 3678 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3678 |
Space Separator
Value | Count | Frequency (%) |
3185 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 59529 | |
Hangul | 28320 | |
Common | 17057 | 16.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 1761 | 6.2% |
지 | 1222 | 4.3% |
문 | 1070 | 3.8% |
기 | 965 | 3.4% |
보 | 804 | 2.8% |
정 | 753 | 2.7% |
화 | 744 | 2.6% |
과 | 700 | 2.5% |
경 | 680 | 2.4% |
건 | 655 | 2.3% |
Other values (129) | 18966 |
Latin
Value | Count | Frequency (%) |
i | 5745 | 9.7% |
e | 5252 | 8.8% |
o | 4909 | 8.2% |
n | 4817 | 8.1% |
r | 4297 | 7.2% |
t | 4192 | 7.0% |
c | 3936 | 6.6% |
a | 3571 | 6.0% |
s | 2829 | 4.8% |
l | 2133 | 3.6% |
Other values (27) | 17848 |
Common
Value | Count | Frequency (%) |
/ | 6251 | |
) | 3678 | |
( | 3678 | |
3185 | ||
, | 247 | 1.4% |
& | 18 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 76586 | |
Hangul | 28320 | 27.0% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
/ | 6251 | 8.2% |
i | 5745 | 7.5% |
e | 5252 | 6.9% |
o | 4909 | 6.4% |
n | 4817 | 6.3% |
r | 4297 | 5.6% |
t | 4192 | 5.5% |
c | 3936 | 5.1% |
) | 3678 | 4.8% |
( | 3678 | 4.8% |
Other values (33) | 29831 |
Hangul
Value | Count | Frequency (%) |
학 | 1761 | 6.2% |
지 | 1222 | 4.3% |
문 | 1070 | 3.8% |
기 | 965 | 3.4% |
보 | 804 | 2.8% |
정 | 753 | 2.7% |
화 | 744 | 2.6% |
과 | 700 | 2.5% |
경 | 680 | 2.4% |
건 | 655 | 2.3% |
Other values (129) | 18966 |
중분류코드
Text
Distinct | 593 |
---|---|
Distinct (%) | 9.0% |
Missing | 65 |
Missing (%) | 1.0% |
Memory size | 52.1 KiB |
Value | Count | Frequency (%) |
hc01 | 46 | 0.7% |
sd05 | 42 | 0.6% |
he14 | 39 | 0.6% |
hc02 | 38 | 0.6% |
hc11 | 36 | 0.5% |
hd12 | 36 | 0.5% |
hb01 | 34 | 0.5% |
hd01 | 34 | 0.5% |
sd08 | 34 | 0.5% |
sa01 | 32 | 0.5% |
Other values (583) | 6217 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 5610 | |
1 | 2660 | 9.8% |
T | 1923 | 7.1% |
H | 1594 | 5.8% |
E | 1547 | 5.7% |
S | 1518 | 5.6% |
C | 1173 | 4.3% |
2 | 938 | 3.4% |
D | 894 | 3.3% |
B | 836 | 3.1% |
Other values (19) | 8572 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 13674 | |
Uppercase Letter | 13591 |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
T | 1923 | |
H | 1594 | |
E | 1547 | |
S | 1518 | |
C | 1173 | |
D | 894 | |
B | 836 | 6.2% |
A | 780 | 5.7% |
L | 687 | 5.1% |
N | 469 | 3.5% |
Other values (9) | 2170 |
Decimal Number
Value | Count | Frequency (%) |
0 | 5610 | |
1 | 2660 | |
2 | 938 | 6.9% |
4 | 800 | 5.9% |
3 | 796 | 5.8% |
5 | 743 | 5.4% |
9 | 596 | 4.4% |
6 | 574 | 4.2% |
7 | 519 | 3.8% |
8 | 438 | 3.2% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 13674 | |
Latin | 13591 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
T | 1923 | |
H | 1594 | |
E | 1547 | |
S | 1518 | |
C | 1173 | |
D | 894 | |
B | 836 | 6.2% |
A | 780 | 5.7% |
L | 687 | 5.1% |
N | 469 | 3.5% |
Other values (9) | 2170 |
Common
Value | Count | Frequency (%) |
0 | 5610 | |
1 | 2660 | |
2 | 938 | 6.9% |
4 | 800 | 5.9% |
3 | 796 | 5.8% |
5 | 743 | 5.4% |
9 | 596 | 4.4% |
6 | 574 | 4.2% |
7 | 519 | 3.8% |
8 | 438 | 3.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 27265 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 5610 | |
1 | 2660 | 9.8% |
T | 1923 | 7.1% |
H | 1594 | 5.8% |
E | 1547 | 5.7% |
S | 1518 | 5.6% |
C | 1173 | 4.3% |
2 | 938 | 3.4% |
D | 894 | 3.3% |
B | 836 | 3.1% |
Other values (19) | 8572 |
중분류코드한글명
Text
Distinct | 753 |
---|---|
Distinct (%) | 11.4% |
Missing | 65 |
Missing (%) | 1.0% |
Memory size | 52.1 KiB |
Length
Max length | 76 |
---|---|
Median length | 57 |
Mean length | 18.185489 |
Min length | 2 |
Characters and Unicode
Total characters | 119806 |
---|---|
Distinct characters | 300 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 32 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | 대수학(Algebra) |
---|---|
2nd row | 대수학 |
3rd row | 대수학(Algebra) |
4th row | 대수학 |
5th row | 대수학(Algebra) |
Value | Count | Frequency (%) |
and | 242 | 1.9% |
및 | 204 | 1.6% |
science | 192 | 1.5% |
기타 | 166 | 1.3% |
management | 164 | 1.3% |
general | 153 | 1.2% |
technology | 135 | 1.1% |
기술 | 129 | 1.0% |
linguistics | 125 | 1.0% |
literature | 125 | 1.0% |
Other values (1042) | 11167 |
Most occurring characters
Value | Count | Frequency (%) |
e | 7416 | 6.2% |
i | 6281 | 5.2% |
6215 | 5.2% | |
n | 5712 | 4.8% |
a | 5168 | 4.3% |
o | 4855 | 4.1% |
t | 4669 | 3.9% |
r | 4305 | 3.6% |
c | 3719 | 3.1% |
s | 3550 | 3.0% |
Other values (290) | 67916 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 60816 | |
Other Letter | 34529 | |
Uppercase Letter | 8429 | 7.0% |
Space Separator | 6215 | 5.2% |
Open Punctuation | 3269 | 2.7% |
Close Punctuation | 3269 | 2.7% |
Other Punctuation | 3145 | 2.6% |
Dash Punctuation | 134 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 1933 | 5.6% |
기 | 1816 | 5.3% |
정 | 813 | 2.4% |
리 | 808 | 2.3% |
자 | 681 | 2.0% |
술 | 680 | 2.0% |
과 | 604 | 1.7% |
화 | 573 | 1.7% |
전 | 561 | 1.6% |
생 | 536 | 1.6% |
Other values (235) | 25524 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 7416 | |
i | 6281 | |
n | 5712 | |
a | 5168 | |
o | 4855 | |
t | 4669 | 7.7% |
r | 4305 | 7.1% |
c | 3719 | 6.1% |
s | 3550 | 5.8% |
l | 3272 | 5.4% |
Other values (15) | 11869 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 1032 | |
P | 789 | 9.4% |
M | 715 | 8.5% |
C | 649 | 7.7% |
E | 591 | 7.0% |
A | 561 | 6.7% |
L | 451 | 5.4% |
T | 448 | 5.3% |
F | 433 | 5.1% |
R | 381 | 4.5% |
Other values (13) | 2379 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 2912 | |
, | 231 | 7.3% |
& | 2 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
6215 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3269 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3269 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 134 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 69245 | |
Hangul | 34529 | |
Common | 16032 | 13.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 1933 | 5.6% |
기 | 1816 | 5.3% |
정 | 813 | 2.4% |
리 | 808 | 2.3% |
자 | 681 | 2.0% |
술 | 680 | 2.0% |
과 | 604 | 1.7% |
화 | 573 | 1.7% |
전 | 561 | 1.6% |
생 | 536 | 1.6% |
Other values (235) | 25524 |
Latin
Value | Count | Frequency (%) |
e | 7416 | 10.7% |
i | 6281 | 9.1% |
n | 5712 | 8.2% |
a | 5168 | 7.5% |
o | 4855 | 7.0% |
t | 4669 | 6.7% |
r | 4305 | 6.2% |
c | 3719 | 5.4% |
s | 3550 | 5.1% |
l | 3272 | 4.7% |
Other values (38) | 20298 |
Common
Value | Count | Frequency (%) |
6215 | ||
( | 3269 | |
) | 3269 | |
/ | 2912 | |
, | 231 | 1.4% |
- | 134 | 0.8% |
& | 2 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 85277 | |
Hangul | 34529 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
e | 7416 | 8.7% |
i | 6281 | 7.4% |
6215 | 7.3% | |
n | 5712 | 6.7% |
a | 5168 | 6.1% |
o | 4855 | 5.7% |
t | 4669 | 5.5% |
r | 4305 | 5.0% |
c | 3719 | 4.4% |
s | 3550 | 4.2% |
Other values (45) | 33387 |
Hangul
Value | Count | Frequency (%) |
학 | 1933 | 5.6% |
기 | 1816 | 5.3% |
정 | 813 | 2.4% |
리 | 808 | 2.3% |
자 | 681 | 2.0% |
술 | 680 | 2.0% |
과 | 604 | 1.7% |
화 | 573 | 1.7% |
전 | 561 | 1.6% |
생 | 536 | 1.6% |
Other values (235) | 25524 |
제목
Text
MISSING
 
Distinct | 6277 |
---|---|
Distinct (%) | 99.9% |
Missing | 371 |
Missing (%) | 5.6% |
Memory size | 52.1 KiB |
Length
Max length | 140 |
---|---|
Median length | 90 |
Mean length | 39.886501 |
Min length | 2 |
Characters and Unicode
Total characters | 250567 |
---|---|
Distinct characters | 537 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 6272 ? |
---|---|
Unique (%) | 99.8% |
Sample
1st row | 선형대수(Linear algebra) |
---|---|
2nd row | NA01. 대수학(Algebra) |
3rd row | 수리논리학/집합론(Mathematical logic/set theory) |
4th row | NA0101. 선형대수(Linear algebra) |
5th row | 수론(Number theory) |
Value | Count | Frequency (%) |
달리 | 748 | 2.9% |
않는 | 740 | 2.9% |
분류되지 | 719 | 2.8% |
of | 523 | 2.0% |
and | 462 | 1.8% |
technology | 306 | 1.2% |
및 | 251 | 1.0% |
management | 210 | 0.8% |
system | 171 | 0.7% |
literature | 154 | 0.6% |
Other values (9451) | 21458 |
Most occurring characters
Value | Count | Frequency (%) |
19473 | 7.8% | |
e | 14659 | 5.9% |
i | 13068 | 5.2% |
n | 11659 | 4.7% |
o | 11618 | 4.6% |
a | 11521 | 4.6% |
t | 11385 | 4.5% |
r | 9993 | 4.0% |
s | 8208 | 3.3% |
c | 7291 | 2.9% |
Other values (527) | 131692 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 137837 | |
Other Letter | 45013 | 18.0% |
Space Separator | 19474 | 7.8% |
Uppercase Letter | 14671 | 5.9% |
Decimal Number | 12735 | 5.1% |
Other Punctuation | 7271 | 2.9% |
Open Punctuation | 6664 | 2.7% |
Close Punctuation | 6636 | 2.6% |
Dash Punctuation | 262 | 0.1% |
Final Punctuation | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 1889 | 4.2% |
리 | 1557 | 3.5% |
학 | 1511 | 3.4% |
지 | 1334 | 3.0% |
분 | 1057 | 2.3% |
술 | 986 | 2.2% |
류 | 825 | 1.8% |
달 | 777 | 1.7% |
되 | 754 | 1.7% |
않 | 749 | 1.7% |
Other values (451) | 33574 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 14659 | |
i | 13068 | |
n | 11659 | 8.5% |
o | 11618 | 8.4% |
a | 11521 | 8.4% |
t | 11385 | 8.3% |
r | 9993 | 7.2% |
s | 8208 | 6.0% |
c | 7291 | 5.3% |
l | 7122 | 5.2% |
Other values (16) | 31313 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 1818 | |
C | 1484 | 10.1% |
S | 1476 | 10.1% |
H | 1051 | 7.2% |
A | 1005 | 6.9% |
O | 949 | 6.5% |
L | 816 | 5.6% |
D | 798 | 5.4% |
B | 757 | 5.2% |
N | 649 | 4.4% |
Other values (15) | 3868 |
Decimal Number
Value | Count | Frequency (%) |
0 | 5091 | |
1 | 1970 | 15.5% |
9 | 1216 | 9.5% |
2 | 895 | 7.0% |
3 | 770 | 6.0% |
4 | 750 | 5.9% |
5 | 661 | 5.2% |
6 | 528 | 4.1% |
7 | 466 | 3.7% |
8 | 388 | 3.0% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 3691 | |
. | 3374 | |
, | 145 | 2.0% |
& | 22 | 0.3% |
: | 17 | 0.2% |
· | 9 | 0.1% |
' | 6 | 0.1% |
; | 4 | 0.1% |
# | 3 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
19473 | ||
1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 6664 |
Close Punctuation
Value | Count | Frequency (%) |
) | 6636 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 262 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 152508 | |
Common | 53046 | 21.2% |
Hangul | 45013 | 18.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 1889 | 4.2% |
리 | 1557 | 3.5% |
학 | 1511 | 3.4% |
지 | 1334 | 3.0% |
분 | 1057 | 2.3% |
술 | 986 | 2.2% |
류 | 825 | 1.8% |
달 | 777 | 1.7% |
되 | 754 | 1.7% |
않 | 749 | 1.7% |
Other values (451) | 33574 |
Latin
Value | Count | Frequency (%) |
e | 14659 | 9.6% |
i | 13068 | 8.6% |
n | 11659 | 7.6% |
o | 11618 | 7.6% |
a | 11521 | 7.6% |
t | 11385 | 7.5% |
r | 9993 | 6.6% |
s | 8208 | 5.4% |
c | 7291 | 4.8% |
l | 7122 | 4.7% |
Other values (41) | 45984 |
Common
Value | Count | Frequency (%) |
19473 | ||
( | 6664 | 12.6% |
) | 6636 | 12.5% |
0 | 5091 | 9.6% |
/ | 3691 | 7.0% |
. | 3374 | 6.4% |
1 | 1970 | 3.7% |
9 | 1216 | 2.3% |
2 | 895 | 1.7% |
3 | 770 | 1.5% |
Other values (15) | 3266 | 6.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 205540 | |
Hangul | 45012 | 18.0% |
None | 10 | < 0.1% |
Punctuation | 4 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
19473 | 9.5% | |
e | 14659 | 7.1% |
i | 13068 | 6.4% |
n | 11659 | 5.7% |
o | 11618 | 5.7% |
a | 11521 | 5.6% |
t | 11385 | 5.5% |
r | 9993 | 4.9% |
s | 8208 | 4.0% |
c | 7291 | 3.5% |
Other values (63) | 86665 |
Hangul
Value | Count | Frequency (%) |
기 | 1889 | 4.2% |
리 | 1557 | 3.5% |
학 | 1511 | 3.4% |
지 | 1334 | 3.0% |
분 | 1057 | 2.3% |
술 | 986 | 2.2% |
류 | 825 | 1.8% |
달 | 777 | 1.7% |
되 | 754 | 1.7% |
않 | 749 | 1.7% |
Other values (450) | 33573 |
None
Value | Count | Frequency (%) |
· | 9 | |
1 | 10.0% |
Punctuation
Value | Count | Frequency (%) |
’ | 4 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
내용태그
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 6653 |
---|---|
Missing (%) | 100.0% |
Memory size | 58.6 KiB |
분류정보일련번호 | 분류구분코드 | 분류구분코드한글명 | 분류코드 | 분류코드한글명 | 분야코드 | 분야코드한글명 | 대분류코드 | 대분류코드한글명 | |
---|---|---|---|---|---|---|---|---|---|
분류정보일련번호 | 1.000 | 0.847 | 0.847 | 0.710 | 0.552 | 0.878 | 0.873 | 0.973 | 0.988 |
분류구분코드 | 0.847 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 | 0.390 | 1.000 | 0.851 |
분류구분코드한글명 | 0.847 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 | 0.390 | 1.000 | 0.851 |
분류코드 | 0.710 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.808 | 1.000 | 0.971 |
분류코드한글명 | 0.552 | 0.000 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
분야코드 | 0.878 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.992 |
분야코드한글명 | 0.873 | 0.390 | 0.390 | 0.808 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
대분류코드 | 0.973 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
대분류코드한글명 | 0.988 | 0.851 | 0.851 | 0.971 | 1.000 | 0.992 | 1.000 | 1.000 | 1.000 |
분류코드 | 분류구분코드 | 분야코드한글명 | 분류코드한글명 | 분야코드 | 분류구분코드한글명 | |
---|---|---|---|---|---|---|
분류코드 | 1.000 | 1.000 | 0.737 | 1.000 | 0.999 | 1.000 |
분류구분코드 | 1.000 | 1.000 | 0.293 | 0.000 | 0.999 | 0.994 |
분야코드한글명 | 0.737 | 0.293 | 1.000 | 1.000 | 1.000 | 0.293 |
분류코드한글명 | 1.000 | 0.000 | 1.000 | 1.000 | 0.999 | 0.000 |
분야코드 | 0.999 | 0.999 | 1.000 | 0.999 | 1.000 | 0.999 |
분류구분코드한글명 | 1.000 | 0.994 | 0.293 | 0.000 | 0.999 | 1.000 |
분류정보일련번호 | 분류구분코드 | 분류구분코드한글명 | 분류코드 | 분류코드한글명 | 분야코드 | 분야코드한글명 | |
---|---|---|---|---|---|---|---|
분류정보일련번호 | 1.000 | 0.679 | 0.679 | 0.569 | 0.426 | 0.630 | 0.669 |
분류구분코드 | 0.679 | 1.000 | 0.994 | 1.000 | 0.000 | 0.999 | 0.293 |
분류구분코드한글명 | 0.679 | 0.994 | 1.000 | 1.000 | 0.000 | 0.999 | 0.293 |
분류코드 | 0.569 | 1.000 | 1.000 | 1.000 | 1.000 | 0.999 | 0.737 |
분류코드한글명 | 0.426 | 0.000 | 0.000 | 1.000 | 1.000 | 0.999 | 1.000 |
분야코드 | 0.630 | 0.999 | 0.999 | 0.999 | 0.999 | 1.000 | 1.000 |
분야코드한글명 | 0.669 | 0.293 | 0.293 | 0.737 | 1.000 | 1.000 | 1.000 |
분류정보일련번호 | 분류구분코드 | 분류구분코드한글명 | 분류코드 | 분류코드한글명 | 분야코드 | 분야코드한글명 | 대분류코드 | 대분류코드한글명 | 중분류코드 | 중분류코드한글명 | 제목 | 내용태그 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | <NA> | 수학(Mathematics) | NA01 | 대수학(Algebra) | 선형대수(Linear algebra) | <NA> |
1 | 1 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | TA | 수학 | TA01 | 대수학 | NA01. 대수학(Algebra) | <NA> |
2 | 2 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | <NA> | 수학(Mathematics) | NA01 | 대수학(Algebra) | 수리논리학/집합론(Mathematical logic/set theory) | <NA> |
3 | 2 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | TA | 수학 | TA01 | 대수학 | NA0101. 선형대수(Linear algebra) | <NA> |
4 | 3 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | <NA> | 수학(Mathematics) | NA01 | 대수학(Algebra) | 수론(Number theory) | <NA> |
5 | 3 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | TA | 수학 | TA01 | 대수학 | NA0102. 수리논리학/집합론(Mathematical logic/set theory) | <NA> |
6 | 4 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | <NA> | 수학(Mathematics) | NA01 | 대수학(Algebra) | 군/표현(Group/representation theory) | <NA> |
7 | 4 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | TA | 수학 | TA01 | 대수학 | NA0103. 수론(Number theory) | <NA> |
8 | 5 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | <NA> | 수학(Mathematics) | NA01 | 대수학(Algebra) | 대수기하/가환환(Algebraic geometry/commutative ring theory) | <NA> |
9 | 5 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | TA | 수학 | TA01 | 대수학 | NA0104. 군/표현(Group/representation theory) | <NA> |
분류정보일련번호 | 분류구분코드 | 분류구분코드한글명 | 분류코드 | 분류코드한글명 | 분야코드 | 분야코드한글명 | 대분류코드 | 대분류코드한글명 | 중분류코드 | 중분류코드한글명 | 제목 | 내용태그 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
6643 | 3355 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M01 | 인력 및 인프라 | TMPR01L01M01S04 | 연구 및 기타시설 / 장비 | OX0409. 연구개발 이외 국가 목적의 과학적인 시설 및 장비 | <NA> |
6644 | 3356 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M01 | 인력 및 인프라 | TMPR01L01M01S04 | 연구 및 기타시설 / 장비 | OX0499. 기타 과학적인 시설 및 장비 관련 연구와 응용분야 | <NA> |
6645 | 3357 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M01 | 인력 및 인프라 | TMPR01L01M01S05 | 기타 인력 및 인프라 | OX99. 기타 인력 및 인프라 | <NA> |
6646 | 3358 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M01 | 인력 및 인프라 | TMPR01L01M01S05 | 기타 인력 및 인프라 | OX9999. 달리 분류되지 않는 인력 및 인프라 | <NA> |
6647 | 3368 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M02 | 과학기술과 인문사회 | TMPR01L01M02S01 | 과학기술과 재난/안전 | OY0101.안전시스템과학 | <NA> |
6648 | 3369 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M02 | 과학기술과 인문사회 | TMPR01L01M02S01 | 과학기술과 재난/안전 | OY0102.재난관리/방재 | <NA> |
6649 | 3370 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M02 | 과학기술과 인문사회 | TMPR01L01M02S01 | 과학기술과 재난/안전 | OY0103.소방학 | <NA> |
6650 | 3371 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M02 | 과학기술과 인문사회 | TMPR01L01M02S01 | 과학기술과 재난/안전 | OY0104.사회위기 | <NA> |
6651 | 3372 | CL002 | 임시정보 | TMPR01 | 연구분야 | TMPR01L01 | 인간과학과 기술 | TMPR01L01M02 | 과학기술과 인문사회 | TMPR01L01M02S01 | 과학기술과 재난/안전 | OY0199.달리 분류되지 않는 과학기술과 재난/안전 | <NA> |
6652 | 3598 | CL001 | 분류정보 | RCSARE | 연구분야 | NAARE | 자연 | TA | 수학 | <NA> | <NA> | 수학 | <NA> |