Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 1194 |
Missing cells | 23 |
Missing cells (%) | 0.3% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 67.8 KiB |
Average record size in memory | 58.1 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 3 |
Text | 3 |
Dataset
Description | 한국산업인력공단 외국인근로자가 자주 쓰는 외국어 정보(우즈베키스탄어)로 외국인근로자가 자주 사용하는 우즈베키스탄어 문장을 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15050965/fileData.do |
대분류코드 has constant value "" | Constant |
대분류 is highly overall correlated with 연번 and 1 other fields | High correlation |
소분류 is highly overall correlated with 연번 and 1 other fields | High correlation |
연번 is highly overall correlated with 대분류 and 1 other fields | High correlation |
외국어_발음 has 14 (1.2%) missing values | Missing |
연번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 22:40:19.972684 |
---|---|
Analysis finished | 2023-12-12 22:40:21.264176 |
Duration | 1.29 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 1194 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 597.5 |
Minimum | 1 |
---|---|
Maximum | 1194 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.6 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 60.65 |
Q1 | 299.25 |
median | 597.5 |
Q3 | 895.75 |
95-th percentile | 1134.35 |
Maximum | 1194 |
Range | 1193 |
Interquartile range (IQR) | 596.5 |
Descriptive statistics
Standard deviation | 344.82242 |
---|---|
Coefficient of variation (CV) | 0.57710865 |
Kurtosis | -1.2 |
Mean | 597.5 |
Median Absolute Deviation (MAD) | 298.5 |
Skewness | 0 |
Sum | 713415 |
Variance | 118902.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
803 | 1 | 0.1% |
801 | 1 | 0.1% |
800 | 1 | 0.1% |
799 | 1 | 0.1% |
798 | 1 | 0.1% |
797 | 1 | 0.1% |
796 | 1 | 0.1% |
795 | 1 | 0.1% |
794 | 1 | 0.1% |
Other values (1184) | 1184 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
1194 | 1 | |
1193 | 1 | |
1192 | 1 | |
1191 | 1 | |
1190 | 1 | |
1189 | 1 | |
1188 | 1 | |
1187 | 1 | |
1186 | 1 | |
1185 | 1 |
대분류코드
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.5 KiB |
3 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 3 |
---|---|
2nd row | 3 |
3rd row | 3 |
4th row | 3 |
5th row | 3 |
Common Values
Value | Count | Frequency (%) |
3 | 1194 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
3 | 1194 |
대분류
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.5 KiB |
일상생활 | |
---|---|
작업지시 | |
근로관련 | |
기숙사및식당 | |
고용관련신고 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 4.3760469 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일상생활 |
---|---|
2nd row | 일상생활 |
3rd row | 일상생활 |
4th row | 일상생활 |
5th row | 일상생활 |
Common Values
Value | Count | Frequency (%) |
일상생활 | 607 | |
작업지시 | 211 | 17.7% |
근로관련 | 186 | 15.6% |
기숙사및식당 | 121 | 10.1% |
고용관련신고 | 69 | 5.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일상생활 | 607 | |
작업지시 | 211 | 17.7% |
근로관련 | 186 | 15.6% |
기숙사및식당 | 121 | 10.1% |
고용관련신고 | 69 | 5.8% |
소분류
Categorical
HIGH CORRELATION
 
Distinct | 29 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.5 KiB |
기타 | |
---|---|
근무태도 | |
건강,병원 | |
급여,수당 관련 | |
기숙사규칙 | |
Other values (24) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 4.4505863 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 인사,소개 |
---|---|
2nd row | 인사,소개 |
3rd row | 인사,소개 |
4th row | 인사,소개 |
5th row | 인사,소개 |
Common Values
Value | Count | Frequency (%) |
기타 | 334 | |
근무태도 | 85 | 7.1% |
건강,병원 | 83 | 7.0% |
급여,수당 관련 | 66 | 5.5% |
기숙사규칙 | 58 | 4.9% |
시장,교통 | 47 | 3.9% |
음식,식습관 | 46 | 3.9% |
안전규칙 | 46 | 3.9% |
작업규칙 등 기타 | 45 | 3.8% |
기타사항 | 44 | 3.7% |
Other values (19) | 340 |
Length
Value | Count | Frequency (%) |
기타 | 379 | |
근무태도 | 85 | 6.1% |
건강,병원 | 83 | 5.9% |
급여,수당 | 66 | 4.7% |
관련 | 66 | 4.7% |
등 | 63 | 4.5% |
기숙사규칙 | 58 | 4.1% |
시장,교통 | 47 | 3.4% |
음식,식습관 | 46 | 3.3% |
안전규칙 | 46 | 3.3% |
Other values (22) | 463 |
한국어_문장
Text
Distinct | 1191 |
---|---|
Distinct (%) | 99.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.5 KiB |
Length
Max length | 67 |
---|---|
Median length | 35 |
Mean length | 14.196817 |
Min length | 1 |
Characters and Unicode
Total characters | 16951 |
---|---|
Distinct characters | 615 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 1188 ? |
---|---|
Unique (%) | 99.5% |
Sample
1st row | 고맙습니다. |
---|---|
2nd row | 그동안 수고하셨습니다 |
3rd row | 다음에 또 뵈요 |
4th row | 다음에 오겠습니다. |
5th row | 당신을 잊지 못할 것 입니다 |
Value | Count | Frequency (%) |
47 | 1.2% | |
합니다 | 36 | 0.9% |
있습니다 | 34 | 0.9% |
잘 | 32 | 0.8% |
마세요 | 28 | 0.7% |
하세요 | 28 | 0.7% |
입니다 | 26 | 0.7% |
수 | 21 | 0.5% |
안됩니다 | 19 | 0.5% |
이 | 18 | 0.5% |
Other values (2408) | 3608 |
Most occurring characters
Value | Count | Frequency (%) |
2973 | 17.5% | |
요 | 573 | 3.4% |
니 | 523 | 3.1% |
. | 474 | 2.8% |
다 | 463 | 2.7% |
세 | 360 | 2.1% |
하 | 314 | 1.9% |
이 | 294 | 1.7% |
에 | 262 | 1.5% |
을 | 251 | 1.5% |
Other values (605) | 10464 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 13041 | |
Space Separator | 2973 | 17.5% |
Other Punctuation | 740 | 4.4% |
Decimal Number | 138 | 0.8% |
Uppercase Letter | 27 | 0.2% |
Math Symbol | 11 | 0.1% |
Close Punctuation | 7 | < 0.1% |
Open Punctuation | 7 | < 0.1% |
Dash Punctuation | 4 | < 0.1% |
Lowercase Letter | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
요 | 573 | 4.4% |
니 | 523 | 4.0% |
다 | 463 | 3.6% |
세 | 360 | 2.8% |
하 | 314 | 2.4% |
이 | 294 | 2.3% |
에 | 262 | 2.0% |
을 | 251 | 1.9% |
시 | 225 | 1.7% |
가 | 215 | 1.6% |
Other values (573) | 9561 |
Decimal Number
Value | Count | Frequency (%) |
0 | 45 | |
1 | 26 | |
2 | 17 | 12.3% |
9 | 10 | 7.2% |
3 | 10 | 7.2% |
4 | 8 | 5.8% |
5 | 7 | 5.1% |
8 | 6 | 4.3% |
6 | 6 | 4.3% |
7 | 3 | 2.2% |
Other Punctuation
Value | Count | Frequency (%) |
. | 474 | |
? | 232 | |
, | 23 | 3.1% |
/ | 6 | 0.8% |
… | 1 | 0.1% |
* | 1 | 0.1% |
% | 1 | 0.1% |
' | 1 | 0.1% |
! | 1 | 0.1% |
Uppercase Letter
Value | Count | Frequency (%) |
O | 22 | |
C | 2 | 7.4% |
E | 1 | 3.7% |
A | 1 | 3.7% |
S | 1 | 3.7% |
Lowercase Letter
Value | Count | Frequency (%) |
v | 1 | |
t | 1 | |
d | 1 |
Space Separator
Value | Count | Frequency (%) |
2973 |
Math Symbol
Value | Count | Frequency (%) |
~ | 11 |
Close Punctuation
Value | Count | Frequency (%) |
) | 7 |
Open Punctuation
Value | Count | Frequency (%) |
( | 7 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 13041 | |
Common | 3880 | 22.9% |
Latin | 30 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
요 | 573 | 4.4% |
니 | 523 | 4.0% |
다 | 463 | 3.6% |
세 | 360 | 2.8% |
하 | 314 | 2.4% |
이 | 294 | 2.3% |
에 | 262 | 2.0% |
을 | 251 | 1.9% |
시 | 225 | 1.7% |
가 | 215 | 1.6% |
Other values (573) | 9561 |
Common
Value | Count | Frequency (%) |
2973 | ||
. | 474 | 12.2% |
? | 232 | 6.0% |
0 | 45 | 1.2% |
1 | 26 | 0.7% |
, | 23 | 0.6% |
2 | 17 | 0.4% |
~ | 11 | 0.3% |
9 | 10 | 0.3% |
3 | 10 | 0.3% |
Other values (14) | 59 | 1.5% |
Latin
Value | Count | Frequency (%) |
O | 22 | |
C | 2 | 6.7% |
v | 1 | 3.3% |
t | 1 | 3.3% |
d | 1 | 3.3% |
E | 1 | 3.3% |
A | 1 | 3.3% |
S | 1 | 3.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 12902 | |
ASCII | 3909 | 23.1% |
Compat Jamo | 139 | 0.8% |
Punctuation | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2973 | ||
. | 474 | 12.1% |
? | 232 | 5.9% |
0 | 45 | 1.2% |
1 | 26 | 0.7% |
, | 23 | 0.6% |
O | 22 | 0.6% |
2 | 17 | 0.4% |
~ | 11 | 0.3% |
9 | 10 | 0.3% |
Other values (21) | 76 | 1.9% |
Hangul
Value | Count | Frequency (%) |
요 | 573 | 4.4% |
니 | 523 | 4.1% |
다 | 463 | 3.6% |
세 | 360 | 2.8% |
하 | 314 | 2.4% |
이 | 294 | 2.3% |
에 | 262 | 2.0% |
을 | 251 | 1.9% |
시 | 225 | 1.7% |
가 | 215 | 1.7% |
Other values (572) | 9422 |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 139 |
Punctuation
Value | Count | Frequency (%) |
… | 1 |
외국어_문장
Text
Distinct | 1172 |
---|---|
Distinct (%) | 98.9% |
Missing | 9 |
Missing (%) | 0.8% |
Memory size | 9.5 KiB |
Length
Max length | 82 |
---|---|
Median length | 60 |
Mean length | 27.578059 |
Min length | 2 |
Characters and Unicode
Total characters | 32680 |
---|---|
Distinct characters | 91 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 1159 ? |
---|---|
Unique (%) | 97.8% |
Sample
1st row | RAHMAT |
---|---|
2nd row | SHU KUNGACHA ISHLAGANILAR USHUN RAHMAT |
3rd row | YANA UCHRASHGUNCHA |
4th row | YANA KELAMAN |
5th row | SIZNI UNUTMAYMAN |
Value | Count | Frequency (%) |
ish | 72 | 1.7% |
bu | 68 | 1.6% |
bilan | 48 | 1.1% |
yahshi | 40 | 0.9% |
kerak | 36 | 0.8% |
qiling | 34 | 0.8% |
dam | 27 | 0.6% |
uchun | 26 | 0.6% |
nima | 24 | 0.6% |
oylik | 23 | 0.5% |
Other values (2175) | 3949 |
Most occurring characters
Value | Count | Frequency (%) |
I | 4027 | 12.3% |
A | 3948 | 12.1% |
3165 | 9.7% | |
N | 2169 | 6.6% |
O | 1927 | 5.9% |
S | 1561 | 4.8% |
H | 1556 | 4.8% |
L | 1534 | 4.7% |
G | 1360 | 4.2% |
R | 1311 | 4.0% |
Other values (81) | 10122 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 28829 | |
Space Separator | 3165 | 9.7% |
Other Punctuation | 324 | 1.0% |
Lowercase Letter | 245 | 0.7% |
Decimal Number | 104 | 0.3% |
Dash Punctuation | 5 | < 0.1% |
Open Punctuation | 4 | < 0.1% |
Close Punctuation | 4 | < 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
о | 24 | 9.8% |
е | 22 | 9.0% |
и | 19 | 7.8% |
н | 19 | 7.8% |
а | 16 | 6.5% |
т | 15 | 6.1% |
р | 12 | 4.9% |
в | 11 | 4.5% |
л | 10 | 4.1% |
с | 9 | 3.7% |
Other values (31) | 88 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 4027 | |
A | 3948 | |
N | 2169 | 7.5% |
O | 1927 | 6.7% |
S | 1561 | 5.4% |
H | 1556 | 5.4% |
L | 1534 | 5.3% |
G | 1360 | 4.7% |
R | 1311 | 4.5% |
T | 1215 | 4.2% |
Other values (20) | 8221 |
Decimal Number
Value | Count | Frequency (%) |
0 | 40 | |
1 | 19 | |
3 | 14 | 13.5% |
2 | 11 | 10.6% |
9 | 8 | 7.7% |
4 | 4 | 3.8% |
8 | 3 | 2.9% |
5 | 3 | 2.9% |
6 | 2 | 1.9% |
Other Punctuation
Value | Count | Frequency (%) |
… | 126 | |
? | 88 | |
. | 88 | |
, | 11 | 3.4% |
′ | 9 | 2.8% |
% | 1 | 0.3% |
/ | 1 | 0.3% |
Space Separator
Value | Count | Frequency (%) |
3165 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 28849 | |
Common | 3606 | 11.0% |
Cyrillic | 225 | 0.7% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
I | 4027 | |
A | 3948 | |
N | 2169 | 7.5% |
O | 1927 | 6.7% |
S | 1561 | 5.4% |
H | 1556 | 5.4% |
L | 1534 | 5.3% |
G | 1360 | 4.7% |
R | 1311 | 4.5% |
T | 1215 | 4.2% |
Other values (29) | 8241 |
Cyrillic
Value | Count | Frequency (%) |
о | 24 | 10.7% |
е | 22 | 9.8% |
и | 19 | 8.4% |
н | 19 | 8.4% |
а | 16 | 7.1% |
т | 15 | 6.7% |
р | 12 | 5.3% |
в | 11 | 4.9% |
л | 10 | 4.4% |
с | 9 | 4.0% |
Other values (22) | 68 |
Common
Value | Count | Frequency (%) |
3165 | ||
… | 126 | 3.5% |
? | 88 | 2.4% |
. | 88 | 2.4% |
0 | 40 | 1.1% |
1 | 19 | 0.5% |
3 | 14 | 0.4% |
2 | 11 | 0.3% |
, | 11 | 0.3% |
′ | 9 | 0.2% |
Other values (10) | 35 | 1.0% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 32320 | |
Cyrillic | 225 | 0.7% |
Punctuation | 135 | 0.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
I | 4027 | |
A | 3948 | |
3165 | 9.8% | |
N | 2169 | 6.7% |
O | 1927 | 6.0% |
S | 1561 | 4.8% |
H | 1556 | 4.8% |
L | 1534 | 4.7% |
G | 1360 | 4.2% |
R | 1311 | 4.1% |
Other values (47) | 9762 |
Punctuation
Value | Count | Frequency (%) |
… | 126 | |
′ | 9 | 6.7% |
Cyrillic
Value | Count | Frequency (%) |
о | 24 | 10.7% |
е | 22 | 9.8% |
и | 19 | 8.4% |
н | 19 | 8.4% |
а | 16 | 7.1% |
т | 15 | 6.7% |
р | 12 | 5.3% |
в | 11 | 4.9% |
л | 10 | 4.4% |
с | 9 | 4.0% |
Other values (22) | 68 |
외국어_발음
Text
MISSING
 
Distinct | 1169 |
---|---|
Distinct (%) | 99.1% |
Missing | 14 |
Missing (%) | 1.2% |
Memory size | 9.5 KiB |
Length
Max length | 46 |
---|---|
Median length | 34 |
Mean length | 14.607627 |
Min length | 1 |
Characters and Unicode
Total characters | 17237 |
---|---|
Distinct characters | 593 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 1158 ? |
---|---|
Unique (%) | 98.1% |
Sample
1st row | 랗맛 |
---|---|
2nd row | 수 군가차 잇라간이랄 우춘 랗맛 |
3rd row | 야나 웆랏군자 |
4th row | 야나 게라만 |
5th row | 싲니 우눝마에만 |
Value | Count | Frequency (%) |
부 | 70 | 1.6% |
이스 | 48 | 1.1% |
비란 | 45 | 1.0% |
얗시 | 33 | 0.8% |
게라그 | 29 | 0.7% |
담 | 26 | 0.6% |
니마 | 24 | 0.6% |
기링 | 24 | 0.6% |
우준 | 23 | 0.5% |
부군 | 21 | 0.5% |
Other values (2582) | 3989 |
Most occurring characters
Value | Count | Frequency (%) |
3263 | 18.9% | |
라 | 591 | 3.4% |
가 | 503 | 2.9% |
즈 | 493 | 2.9% |
시 | 492 | 2.9% |
니 | 444 | 2.6% |
에 | 434 | 2.5% |
리 | 419 | 2.4% |
기 | 404 | 2.3% |
스 | 364 | 2.1% |
Other values (583) | 9830 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 13561 | |
Space Separator | 3263 | 18.9% |
Other Punctuation | 255 | 1.5% |
Decimal Number | 130 | 0.8% |
Lowercase Letter | 8 | < 0.1% |
Dash Punctuation | 6 | < 0.1% |
Uppercase Letter | 6 | < 0.1% |
Close Punctuation | 4 | < 0.1% |
Open Punctuation | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
라 | 591 | 4.4% |
가 | 503 | 3.7% |
즈 | 493 | 3.6% |
시 | 492 | 3.6% |
니 | 444 | 3.3% |
에 | 434 | 3.2% |
리 | 419 | 3.1% |
기 | 404 | 3.0% |
스 | 364 | 2.7% |
다 | 310 | 2.3% |
Other values (553) | 9107 |
Decimal Number
Value | Count | Frequency (%) |
0 | 66 | |
1 | 19 | 14.6% |
3 | 14 | 10.8% |
2 | 11 | 8.5% |
9 | 8 | 6.2% |
4 | 4 | 3.1% |
5 | 3 | 2.3% |
8 | 3 | 2.3% |
6 | 2 | 1.5% |
Other Punctuation
Value | Count | Frequency (%) |
… | 173 | |
. | 68 | 26.7% |
, | 10 | 3.9% |
? | 2 | 0.8% |
% | 1 | 0.4% |
/ | 1 | 0.4% |
Lowercase Letter
Value | Count | Frequency (%) |
c | 2 | |
e | 2 | |
s | 1 | |
a | 1 | |
i | 1 | |
k | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 2 | |
C | 1 | |
A | 1 | |
T | 1 | |
V | 1 |
Space Separator
Value | Count | Frequency (%) |
3263 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 13561 | |
Common | 3662 | 21.2% |
Latin | 14 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
라 | 591 | 4.4% |
가 | 503 | 3.7% |
즈 | 493 | 3.6% |
시 | 492 | 3.6% |
니 | 444 | 3.3% |
에 | 434 | 3.2% |
리 | 419 | 3.1% |
기 | 404 | 3.0% |
스 | 364 | 2.7% |
다 | 310 | 2.3% |
Other values (553) | 9107 |
Common
Value | Count | Frequency (%) |
3263 | ||
… | 173 | 4.7% |
. | 68 | 1.9% |
0 | 66 | 1.8% |
1 | 19 | 0.5% |
3 | 14 | 0.4% |
2 | 11 | 0.3% |
, | 10 | 0.3% |
9 | 8 | 0.2% |
- | 6 | 0.2% |
Other values (9) | 24 | 0.7% |
Latin
Value | Count | Frequency (%) |
c | 2 | |
e | 2 | |
S | 2 | |
C | 1 | |
s | 1 | |
a | 1 | |
i | 1 | |
k | 1 | |
A | 1 | |
T | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 13506 | |
ASCII | 3503 | 20.3% |
Punctuation | 173 | 1.0% |
Compat Jamo | 55 | 0.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3263 | ||
. | 68 | 1.9% |
0 | 66 | 1.9% |
1 | 19 | 0.5% |
3 | 14 | 0.4% |
2 | 11 | 0.3% |
, | 10 | 0.3% |
9 | 8 | 0.2% |
- | 6 | 0.2% |
) | 4 | 0.1% |
Other values (19) | 34 | 1.0% |
Hangul
Value | Count | Frequency (%) |
라 | 591 | 4.4% |
가 | 503 | 3.7% |
즈 | 493 | 3.7% |
시 | 492 | 3.6% |
니 | 444 | 3.3% |
에 | 434 | 3.2% |
리 | 419 | 3.1% |
기 | 404 | 3.0% |
스 | 364 | 2.7% |
다 | 310 | 2.3% |
Other values (539) | 9052 |
Punctuation
Value | Count | Frequency (%) |
… | 173 |
Compat Jamo
Value | Count | Frequency (%) |
ㅏ | 11 | |
ㅣ | 9 | |
ㅡ | 7 | |
ㄷ | 6 | |
ㄱ | 6 | |
ㅗ | 4 | 7.3% |
ㄴ | 4 | 7.3% |
ㅂ | 2 | 3.6% |
ㅕ | 1 | 1.8% |
ㅔ | 1 | 1.8% |
Other values (4) | 4 | 7.3% |
연번 | 대분류 | 소분류 | |
---|---|---|---|
연번 | 1.000 | 0.990 | 0.974 |
대분류 | 0.990 | 1.000 | 0.994 |
소분류 | 0.974 | 0.994 | 1.000 |
대분류 | 소분류 | |
---|---|---|
대분류 | 1.000 | 0.962 |
소분류 | 0.962 | 1.000 |
연번 | 대분류 | 소분류 | |
---|---|---|---|
연번 | 1.000 | 0.857 | 0.828 |
대분류 | 0.857 | 1.000 | 0.962 |
소분류 | 0.828 | 0.962 | 1.000 |
연번 | 대분류코드 | 대분류 | 소분류 | 한국어_문장 | 외국어_문장 | 외국어_발음 | |
---|---|---|---|---|---|---|---|
0 | 1 | 3 | 일상생활 | 인사,소개 | 고맙습니다. | RAHMAT | 랗맛 |
1 | 2 | 3 | 일상생활 | 인사,소개 | 그동안 수고하셨습니다 | SHU KUNGACHA ISHLAGANILAR USHUN RAHMAT | 수 군가차 잇라간이랄 우춘 랗맛 |
2 | 3 | 3 | 일상생활 | 인사,소개 | 다음에 또 뵈요 | YANA UCHRASHGUNCHA | 야나 웆랏군자 |
3 | 4 | 3 | 일상생활 | 인사,소개 | 다음에 오겠습니다. | YANA KELAMAN | 야나 게라만 |
4 | 5 | 3 | 일상생활 | 인사,소개 | 당신을 잊지 못할 것 입니다 | SIZNI UNUTMAYMAN | 싲니 우눝마에만 |
5 | 6 | 3 | 일상생활 | 인사,소개 | 당신의 상사는 ㅇㅇㅇ 입니다. | MEN SIZLARNI BOSHLIQILARMAN | 멘 싲랄니 봇릭이랄만 |
6 | 7 | 3 | 일상생활 | 인사,소개 | 당신의 성공을 기원합니다 | SIZLARGA OMAD TILAYMAN | 싲랄가 오맡 티라에만 |
7 | 8 | 3 | 일상생활 | 인사,소개 | 동료 | QOLLEQTIV | 골렉팁 |
8 | 9 | 3 | 일상생활 | 인사,소개 | 만나서 반갑습니다. | UCHRASHGANIMDAN HURSANDMAN | 웇랐가니밎단 훌산드만 |
9 | 10 | 3 | 일상생활 | 인사,소개 | 맛있게 드세요 | YOQIMLI ISHTAHA | 요금리 있타하 |
연번 | 대분류코드 | 대분류 | 소분류 | 한국어_문장 | 외국어_문장 | 외국어_발음 | |
---|---|---|---|---|---|---|---|
1184 | 1185 | 3 | 고용관련신고 | 기타사항 | 이곳에 도장을 찍어주세요 | BU ERGA KOL KOYING | 부 앨가 골 고에잉 |
1185 | 1186 | 3 | 고용관련신고 | 기타사항 | 이곳에 서류를 접수하세요 | BU ERGA HUJJARLARNI ROYHAT QILING | 부 엘가 후잗랄니 로에하드 기링 |
1186 | 1187 | 3 | 고용관련신고 | 기타사항 | 재고용근로자 안내문을 잘읽어보세요. | CHET ELLIK ISHCHILAR BILDIRISH NOMASINI YAHSHILAB OQING | 젣 엘릭 잇지랄 빙디리시 노마니 얗시라브 오깅 |
1187 | 1188 | 3 | 고용관련신고 | 기타사항 | 재발급을 원합니다. | <NA> | <NA> |
1188 | 1189 | 3 | 고용관련신고 | 기타사항 | 체류기간 연장을 해야 합니다. | SHARTNOMA VAQTINGIZNI CHOZISH KERAK | 살트노마 반틴기지니 초지시 게라그 |
1189 | 1190 | 3 | 고용관련신고 | 기타사항 | 체류기간이 만료되었습니다. | SHARTNOMA MUDDATI OHIRI | 살티노마 묻ㄷ다티 오히리 |
1190 | 1191 | 3 | 고용관련신고 | 기타사항 | 체류지 변경시 반드시 전입신고를 해야 합니다 | YASHASH JOYINI OZGARISHINI HABAR QILISH KERAK | 야삿 조이니 오즈가리시니 하바르 키리시 게라그 |
1191 | 1192 | 3 | 고용관련신고 | 기타사항 | 출국시 외국인등록증은 공항 출입국관리사무소에 반납해야 합니다. | AYRAPORTDA CHIQIB KETISHDA ID KARTASINI BERIB KETISH KERAK EMIGRASIONNIGA | 아에로폴트단 치그브 게디엳간다 아이디 갈다시니 베리브 게디시 게라그 에믹라지언가 |
1192 | 1193 | 3 | 고용관련신고 | 기타사항 | 출국예정일 변경 또는 재입국을 포기하고자할때는 한국산업인력공단 해외주재사무소로반드시 연락하여야합니다. | <NA> | <NA> |
1193 | 1194 | 3 | 고용관련신고 | 기타사항 | 한국체류기간이 얼마나 남았습니까? | KOREADA KOLISH MUDDATIZ QANCHA QOLDI? | 고레아다 고리시 묻다티 칸차 콜디 |