Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 273 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 12.9 KiB |
Average record size in memory | 48.5 B |
Variable types
Text | 4 |
---|---|
Categorical | 1 |
Boolean | 1 |
Dataset
Description | (주)한국가스기술공사 연구관리 시스템에 사용되는 기관표준단어 목록으로 단어명 약어 영문명 단어유형 금칙어 정의 등의 항목을 제공합니다 |
---|---|
URL | https://www.data.go.kr/data/15103149/fileData.do |
금칙어여부 has constant value "" | Constant |
Reproduction
Analysis started | 2023-12-11 22:49:08.141450 |
---|---|
Analysis finished | 2023-12-11 22:49:08.544761 |
Duration | 0.4 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
단어명
Text
Distinct | 252 |
---|---|
Distinct (%) | 92.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Value | Count | Frequency (%) |
과제 | 3 | 1.1% |
기술 | 3 | 1.1% |
기관 | 3 | 1.1% |
코드 | 2 | 0.7% |
결과 | 2 | 0.7% |
기타 | 2 | 0.7% |
참여 | 2 | 0.7% |
영문 | 2 | 0.7% |
여부 | 2 | 0.7% |
예산 | 2 | 0.7% |
Other values (242) | 252 |
Most occurring characters
Value | Count | Frequency (%) |
기 | 22 | 3.2% |
이 | 14 | 2.0% |
자 | 13 | 1.9% |
과 | 12 | 1.7% |
연 | 12 | 1.7% |
사 | 12 | 1.7% |
일 | 11 | 1.6% |
구 | 10 | 1.4% |
시 | 10 | 1.4% |
부 | 10 | 1.4% |
Other values (202) | 572 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 678 | |
Uppercase Letter | 16 | 2.3% |
Other Punctuation | 2 | 0.3% |
Space Separator | 2 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 22 | 3.2% |
이 | 14 | 2.1% |
자 | 13 | 1.9% |
과 | 12 | 1.8% |
연 | 12 | 1.8% |
사 | 12 | 1.8% |
일 | 11 | 1.6% |
구 | 10 | 1.5% |
시 | 10 | 1.5% |
부 | 10 | 1.5% |
Other values (191) | 552 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 4 | |
S | 4 | |
N | 2 | |
C | 1 | 6.2% |
L | 1 | 6.2% |
R | 1 | 6.2% |
U | 1 | 6.2% |
D | 1 | 6.2% |
B | 1 | 6.2% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 2 |
Space Separator
Value | Count | Frequency (%) |
2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 678 | |
Latin | 16 | 2.3% |
Common | 4 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 22 | 3.2% |
이 | 14 | 2.1% |
자 | 13 | 1.9% |
과 | 12 | 1.8% |
연 | 12 | 1.8% |
사 | 12 | 1.8% |
일 | 11 | 1.6% |
구 | 10 | 1.5% |
시 | 10 | 1.5% |
부 | 10 | 1.5% |
Other values (191) | 552 |
Latin
Value | Count | Frequency (%) |
I | 4 | |
S | 4 | |
N | 2 | |
C | 1 | 6.2% |
L | 1 | 6.2% |
R | 1 | 6.2% |
U | 1 | 6.2% |
D | 1 | 6.2% |
B | 1 | 6.2% |
Common
Value | Count | Frequency (%) |
/ | 2 | |
2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 678 | |
ASCII | 20 | 2.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
기 | 22 | 3.2% |
이 | 14 | 2.1% |
자 | 13 | 1.9% |
과 | 12 | 1.8% |
연 | 12 | 1.8% |
사 | 12 | 1.8% |
일 | 11 | 1.6% |
구 | 10 | 1.5% |
시 | 10 | 1.5% |
부 | 10 | 1.5% |
Other values (191) | 552 |
ASCII
Value | Count | Frequency (%) |
I | 4 | |
S | 4 | |
/ | 2 | |
2 | ||
N | 2 | |
C | 1 | 5.0% |
L | 1 | 5.0% |
R | 1 | 5.0% |
U | 1 | 5.0% |
D | 1 | 5.0% |
약어
Text
Distinct | 251 |
---|---|
Distinct (%) | 91.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Value | Count | Frequency (%) |
cntc | 2 | 0.7% |
schlshp | 2 | 0.7% |
id | 2 | 0.7% |
de | 2 | 0.7% |
rst | 2 | 0.7% |
pssrp | 2 | 0.7% |
en | 2 | 0.7% |
rsch | 2 | 0.7% |
nation | 2 | 0.7% |
grad | 2 | 0.7% |
Other values (241) | 253 |
Most occurring characters
Value | Count | Frequency (%) |
T | 127 | |
R | 120 | 10.4% |
N | 96 | 8.4% |
C | 88 | 7.7% |
S | 87 | 7.6% |
E | 83 | 7.2% |
P | 79 | 6.9% |
A | 59 | 5.1% |
M | 50 | 4.4% |
D | 44 | 3.8% |
Other values (17) | 316 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 1148 | |
Connector Punctuation | 1 | 0.1% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
T | 127 | |
R | 120 | 10.5% |
N | 96 | 8.4% |
C | 88 | 7.7% |
S | 87 | 7.6% |
E | 83 | 7.2% |
P | 79 | 6.9% |
A | 59 | 5.1% |
M | 50 | 4.4% |
D | 44 | 3.8% |
Other values (16) | 315 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 1148 | |
Common | 1 | 0.1% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
T | 127 | |
R | 120 | 10.5% |
N | 96 | 8.4% |
C | 88 | 7.7% |
S | 87 | 7.6% |
E | 83 | 7.2% |
P | 79 | 6.9% |
A | 59 | 5.1% |
M | 50 | 4.4% |
D | 44 | 3.8% |
Other values (16) | 315 |
Common
Value | Count | Frequency (%) |
_ | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1149 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
T | 127 | |
R | 120 | 10.4% |
N | 96 | 8.4% |
C | 88 | 7.7% |
S | 87 | 7.6% |
E | 83 | 7.2% |
P | 79 | 6.9% |
A | 59 | 5.1% |
M | 50 | 4.4% |
D | 44 | 3.8% |
Other values (17) | 316 |
영문명
Text
Distinct | 242 |
---|---|
Distinct (%) | 88.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Length
Max length | 31 |
---|---|
Median length | 27 |
Mean length | 9.8424908 |
Min length | 2 |
Characters and Unicode
Total characters | 2687 |
---|---|
Distinct characters | 30 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 215 ? |
---|---|
Unique (%) | 78.8% |
Sample
1st row | ENGNEVL |
---|---|
2nd row | CMIT |
3rd row | TECHNOLOGY OF INSTITUDE |
4th row | TECHNOLOGY |
5th row | TEAM |
Value | Count | Frequency (%) |
number | 8 | 2.1% |
research | 8 | 2.1% |
participation | 7 | 1.9% |
date | 7 | 1.9% |
amount | 5 | 1.3% |
practical | 4 | 1.1% |
plan | 4 | 1.1% |
of | 4 | 1.1% |
result | 4 | 1.1% |
registration | 4 | 1.1% |
Other values (246) | 322 |
Most occurring characters
Value | Count | Frequency (%) |
E | 311 | |
T | 245 | 9.1% |
N | 224 | 8.3% |
A | 213 | 7.9% |
I | 210 | 7.8% |
R | 207 | 7.7% |
O | 203 | 7.6% |
C | 136 | 5.1% |
S | 132 | 4.9% |
104 | 3.9% | |
Other values (20) | 702 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 2569 | |
Space Separator | 104 | 3.9% |
Open Punctuation | 5 | 0.2% |
Close Punctuation | 5 | 0.2% |
Connector Punctuation | 4 | 0.1% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
E | 311 | |
T | 245 | |
N | 224 | 8.7% |
A | 213 | 8.3% |
I | 210 | 8.2% |
R | 207 | 8.1% |
O | 203 | 7.9% |
C | 136 | 5.3% |
S | 132 | 5.1% |
P | 104 | 4.0% |
Other values (16) | 584 |
Space Separator
Value | Count | Frequency (%) |
104 |
Open Punctuation
Value | Count | Frequency (%) |
( | 5 |
Close Punctuation
Value | Count | Frequency (%) |
) | 5 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 2569 | |
Common | 118 | 4.4% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
E | 311 | |
T | 245 | |
N | 224 | 8.7% |
A | 213 | 8.3% |
I | 210 | 8.2% |
R | 207 | 8.1% |
O | 203 | 7.9% |
C | 136 | 5.3% |
S | 132 | 5.1% |
P | 104 | 4.0% |
Other values (16) | 584 |
Common
Value | Count | Frequency (%) |
104 | ||
( | 5 | 4.2% |
) | 5 | 4.2% |
_ | 4 | 3.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2687 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
E | 311 | |
T | 245 | 9.1% |
N | 224 | 8.3% |
A | 213 | 7.9% |
I | 210 | 7.8% |
R | 207 | 7.7% |
O | 203 | 7.6% |
C | 136 | 5.1% |
S | 132 | 4.9% |
104 | 3.9% | |
Other values (20) | 702 |
단어유형
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
수식어 | |
---|---|
분류어 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 수식어 |
---|---|
2nd row | 분류어 |
3rd row | 수식어 |
4th row | 수식어 |
5th row | 수식어 |
Common Values
Value | Count | Frequency (%) |
수식어 | 218 | |
분류어 | 55 | 20.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
수식어 | 218 | |
분류어 | 55 | 20.1% |
금칙어여부
Boolean
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 405.0 B |
False |
---|
Value | Count | Frequency (%) |
False | 273 |
정의
Text
Distinct | 252 |
---|---|
Distinct (%) | 92.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Value | Count | Frequency (%) |
과제 | 3 | 1.1% |
기술 | 3 | 1.1% |
기관 | 3 | 1.1% |
코드 | 2 | 0.7% |
결과 | 2 | 0.7% |
요약 | 2 | 0.7% |
기타 | 2 | 0.7% |
영문 | 2 | 0.7% |
여부 | 2 | 0.7% |
예산 | 2 | 0.7% |
Other values (247) | 257 |
Most occurring characters
Value | Count | Frequency (%) |
기 | 21 | 3.0% |
이 | 14 | 2.0% |
자 | 13 | 1.8% |
사 | 13 | 1.8% |
과 | 12 | 1.7% |
일 | 12 | 1.7% |
연 | 12 | 1.7% |
부 | 10 | 1.4% |
시 | 10 | 1.4% |
구 | 10 | 1.4% |
Other values (204) | 584 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 686 | |
Uppercase Letter | 15 | 2.1% |
Space Separator | 7 | 1.0% |
Other Punctuation | 2 | 0.3% |
Lowercase Letter | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 21 | 3.1% |
이 | 14 | 2.0% |
자 | 13 | 1.9% |
사 | 13 | 1.9% |
과 | 12 | 1.7% |
일 | 12 | 1.7% |
연 | 12 | 1.7% |
부 | 10 | 1.5% |
시 | 10 | 1.5% |
구 | 10 | 1.5% |
Other values (193) | 559 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 4 | |
I | 4 | |
N | 2 | |
C | 1 | 6.7% |
R | 1 | 6.7% |
U | 1 | 6.7% |
L | 1 | 6.7% |
B | 1 | 6.7% |
Space Separator
Value | Count | Frequency (%) |
7 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 2 |
Lowercase Letter
Value | Count | Frequency (%) |
d | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 686 | |
Latin | 16 | 2.3% |
Common | 9 | 1.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 21 | 3.1% |
이 | 14 | 2.0% |
자 | 13 | 1.9% |
사 | 13 | 1.9% |
과 | 12 | 1.7% |
일 | 12 | 1.7% |
연 | 12 | 1.7% |
부 | 10 | 1.5% |
시 | 10 | 1.5% |
구 | 10 | 1.5% |
Other values (193) | 559 |
Latin
Value | Count | Frequency (%) |
S | 4 | |
I | 4 | |
N | 2 | |
C | 1 | 6.2% |
R | 1 | 6.2% |
d | 1 | 6.2% |
U | 1 | 6.2% |
L | 1 | 6.2% |
B | 1 | 6.2% |
Common
Value | Count | Frequency (%) |
7 | ||
/ | 2 | 22.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 686 | |
ASCII | 25 | 3.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
기 | 21 | 3.1% |
이 | 14 | 2.0% |
자 | 13 | 1.9% |
사 | 13 | 1.9% |
과 | 12 | 1.7% |
일 | 12 | 1.7% |
연 | 12 | 1.7% |
부 | 10 | 1.5% |
시 | 10 | 1.5% |
구 | 10 | 1.5% |
Other values (193) | 559 |
ASCII
Value | Count | Frequency (%) |
7 | ||
S | 4 | |
I | 4 | |
N | 2 | 8.0% |
/ | 2 | 8.0% |
C | 1 | 4.0% |
R | 1 | 4.0% |
d | 1 | 4.0% |
U | 1 | 4.0% |
L | 1 | 4.0% |
단어명 | 약어 | 영문명 | 단어유형 | 금칙어여부 | 정의 | |
---|---|---|---|---|---|---|
0 | 전문기관평가 | ENGNEVL | ENGNEVL | 수식어 | N | 특정 일에 대한 전문가 집단의 심사 |
1 | 평가위원회구분 | CMIT | CMIT | 분류어 | N | 평가위원회구분 |
2 | 기술 | TCH | TECHNOLOGY OF INSTITUDE | 수식어 | N | 기술 |
3 | 기술적 | TCHNLGY | TECHNOLOGY | 수식어 | N | 기술적 |
4 | 부/팀 | TEAM | TEAM | 수식어 | N | 부/팀 |
5 | 기술 | TECH | TECHNOLOGICAL OF CLASSIFICATION | 수식어 | N | 기술 |
6 | 전화 | TEL | TELEPHONE | 수식어 | N | 전화 |
7 | 논문 | THESIS | THESIS | 수식어 | N | 논문 |
8 | 시간 | TM | TIME | 수식어 | N | 시간 |
9 | 총 | TOT | TOTAL | 수식어 | N | 총 |
단어명 | 약어 | 영문명 | 단어유형 | 금칙어여부 | 정의 | |
---|---|---|---|---|---|---|
263 | 상태 | STTUS | STATUS | 수식어 | N | 상태 |
264 | 현황 | STTUS | STATUS | 수식어 | N | 현황 |
265 | 결과 요약 | SUMRY | SUMMARY | 분류어 | N | 결과 요약 |
266 | 요약 | SUMRY | SUMMARY | 수식어 | N | 요약 |
267 | 소프트웨어 | SW | SOFTWARE | 수식어 | N | 소프트웨어 |
268 | 테이블 | TABLE | TABLE | 수식어 | N | 테이블 |
269 | 과제 | TAS | TASK | 수식어 | N | 과제 |
270 | 기술 | TC | TECHNICAL | 수식어 | N | 기술 |
271 | 기술료 | TC | TECHNICAL | 수식어 | N | 기술료 |
272 | 과학기술분류 | TCCL | TECHNICAL CLASSIFICATION | 수식어 | N | 과학기술분류 |