Dataset statistics
Number of variables | 12 |
---|---|
Number of observations | 10000 |
Missing cells | 4287 |
Missing cells (%) | 3.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1015.6 KiB |
Average record size in memory | 104.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 9 |
Dataset
Description | 해외진출기업 데이터는 성공적으로 진출한 기업의 성공사례 정보를 제공함으로써 해외진출을 처음 시도하는 기업에 도움이 되고자한다. |
---|---|
URL | https://www.data.go.kr/data/15034787/fileData.do |
모기업명 has 4286 (42.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 15:46:51.332146 |
---|---|
Analysis finished | 2023-12-12 15:46:54.578168 |
Duration | 3.25 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
지역
Categorical
Distinct | 10 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
동남아대양주 | |
---|---|
중국 (홍콩, 대만 포함) | |
유럽 | |
북미 | |
서남아 | 389 |
Other values (5) |
Length
Max length | 14 |
---|---|
Median length | 6 |
Mean length | 6.5522 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 동남아대양주 |
---|---|
2nd row | 서남아 |
3rd row | CIS |
4th row | 동남아대양주 |
5th row | 중국 (홍콩, 대만 포함) |
Common Values
Value | Count | Frequency (%) |
동남아대양주 | 5053 | |
중국 (홍콩, 대만 포함) | 2025 | |
유럽 | 717 | 7.2% |
북미 | 633 | 6.3% |
서남아 | 389 | 3.9% |
일본 | 381 | 3.8% |
CIS | 283 | 2.8% |
중남미 | 238 | 2.4% |
중동 | 231 | 2.3% |
아프리카 | 50 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
동남아대양주 | 5053 | |
중국 | 2025 | |
홍콩 | 2025 | |
대만 | 2025 | |
포함 | 2025 | |
유럽 | 717 | 4.5% |
북미 | 633 | 3.9% |
서남아 | 389 | 2.4% |
일본 | 381 | 2.4% |
cis | 283 | 1.8% |
Other values (3) | 519 | 3.2% |
진출국가
Text
Distinct | 86 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
베트남 | 3155 | |
중국 | 1848 | |
인도네시아 | 885 | 8.8% |
미국 | 603 | 6.0% |
일본 | 381 | 3.8% |
태국 | 318 | 3.2% |
인도 | 244 | 2.4% |
말레이시아 | 178 | 1.8% |
필리핀 | 155 | 1.6% |
폴란드 | 147 | 1.5% |
Other values (76) | 2086 |
Most occurring characters
Value | Count | Frequency (%) |
트 | 3267 | 11.1% |
베 | 3217 | 10.9% |
남 | 3169 | 10.7% |
국 | 2866 | 9.7% |
중 | 1848 | 6.3% |
아 | 1540 | 5.2% |
시 | 1384 | 4.7% |
인 | 1155 | 3.9% |
도 | 1140 | 3.9% |
네 | 929 | 3.1% |
Other values (113) | 9045 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29560 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
트 | 3267 | 11.1% |
베 | 3217 | 10.9% |
남 | 3169 | 10.7% |
국 | 2866 | 9.7% |
중 | 1848 | 6.3% |
아 | 1540 | 5.2% |
시 | 1384 | 4.7% |
인 | 1155 | 3.9% |
도 | 1140 | 3.9% |
네 | 929 | 3.1% |
Other values (113) | 9045 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29560 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
트 | 3267 | 11.1% |
베 | 3217 | 10.9% |
남 | 3169 | 10.7% |
국 | 2866 | 9.7% |
중 | 1848 | 6.3% |
아 | 1540 | 5.2% |
시 | 1384 | 4.7% |
인 | 1155 | 3.9% |
도 | 1140 | 3.9% |
네 | 929 | 3.1% |
Other values (113) | 9045 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29560 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
트 | 3267 | 11.1% |
베 | 3217 | 10.9% |
남 | 3169 | 10.7% |
국 | 2866 | 9.7% |
중 | 1848 | 6.3% |
아 | 1540 | 5.2% |
시 | 1384 | 4.7% |
인 | 1155 | 3.9% |
도 | 1140 | 3.9% |
네 | 929 | 3.1% |
Other values (113) | 9045 |
관할무역관
Text
Distinct | 124 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
호치민 | 1934 | |
하노이 | 1177 | 11.8% |
자카르타 | 881 | 8.8% |
상하이 | 562 | 5.6% |
방콕 | 318 | 3.2% |
칭다오 | 308 | 3.1% |
도쿄 | 301 | 3.0% |
베이징 | 298 | 3.0% |
쿠알라룸푸르 | 178 | 1.8% |
톈진 | 170 | 1.7% |
Other values (114) | 3873 |
Most occurring characters
Value | Count | Frequency (%) |
이 | 2581 | 8.0% |
치 | 1956 | 6.0% |
민 | 1938 | 6.0% |
호 | 1934 | 6.0% |
하 | 1806 | 5.6% |
르 | 1600 | 4.9% |
노 | 1201 | 3.7% |
카 | 1172 | 3.6% |
타 | 1082 | 3.3% |
자 | 886 | 2.7% |
Other values (157) | 16307 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 32463 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 2581 | 8.0% |
치 | 1956 | 6.0% |
민 | 1938 | 6.0% |
호 | 1934 | 6.0% |
하 | 1806 | 5.6% |
르 | 1600 | 4.9% |
노 | 1201 | 3.7% |
카 | 1172 | 3.6% |
타 | 1082 | 3.3% |
자 | 886 | 2.7% |
Other values (157) | 16307 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 32463 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 2581 | 8.0% |
치 | 1956 | 6.0% |
민 | 1938 | 6.0% |
호 | 1934 | 6.0% |
하 | 1806 | 5.6% |
르 | 1600 | 4.9% |
노 | 1201 | 3.7% |
카 | 1172 | 3.6% |
타 | 1082 | 3.3% |
자 | 886 | 2.7% |
Other values (157) | 16307 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 32463 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
이 | 2581 | 8.0% |
치 | 1956 | 6.0% |
민 | 1938 | 6.0% |
호 | 1934 | 6.0% |
하 | 1806 | 5.6% |
르 | 1600 | 4.9% |
노 | 1201 | 3.7% |
카 | 1172 | 3.6% |
타 | 1082 | 3.3% |
자 | 886 | 2.7% |
Other values (157) | 16307 |
기업명(국문)
Text
Distinct | 9586 |
---|---|
Distinct (%) | 95.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 57 |
---|---|
Median length | 43 |
Mean length | 8.8481 |
Min length | 1 |
Characters and Unicode
Total characters | 88481 |
---|---|
Distinct characters | 945 |
Distinct categories | 12 ? |
Distinct scripts | 5 ? |
Distinct blocks | 6 ? |
Unique
Unique | 9359 ? |
---|---|
Unique (%) | 93.6% |
Sample
1st row | 시노펙스 베트남(주) |
---|---|
2nd row | LG전자 |
3rd row | HS애드 모스크바법인 ((구)LG애드 모스크바법인) |
4th row | 송가네 |
5th row | 대련창조기계유한공사 |
Value | Count | Frequency (%) |
비나 | 400 | 2.4% |
베트남 | 385 | 2.3% |
법인 | 232 | 1.4% |
주식회사 | 166 | 1.0% |
인도네시아 | 118 | 0.7% |
폴란드 | 85 | 0.5% |
글로벌 | 66 | 0.4% |
아메리카 | 61 | 0.4% |
지사 | 53 | 0.3% |
주 | 52 | 0.3% |
Other values (9991) | 14783 |
Most occurring characters
Value | Count | Frequency (%) |
6402 | 7.2% | |
이 | 2668 | 3.0% |
스 | 2659 | 3.0% |
사 | 2567 | 2.9% |
한 | 2406 | 2.7% |
유 | 1916 | 2.2% |
공 | 1683 | 1.9% |
인 | 1649 | 1.9% |
아 | 1452 | 1.6% |
비 | 1360 | 1.5% |
Other values (935) | 63719 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 74661 | |
Space Separator | 6402 | 7.2% |
Uppercase Letter | 3656 | 4.1% |
Open Punctuation | 1111 | 1.3% |
Close Punctuation | 1109 | 1.3% |
Lowercase Letter | 1000 | 1.1% |
Other Punctuation | 260 | 0.3% |
Other Symbol | 120 | 0.1% |
Decimal Number | 74 | 0.1% |
Dash Punctuation | 54 | 0.1% |
Other values (2) | 34 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 2668 | 3.6% |
스 | 2659 | 3.6% |
사 | 2567 | 3.4% |
한 | 2406 | 3.2% |
유 | 1916 | 2.6% |
공 | 1683 | 2.3% |
인 | 1649 | 2.2% |
아 | 1452 | 1.9% |
비 | 1360 | 1.8% |
트 | 1252 | 1.7% |
Other values (852) | 55049 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 379 | 10.4% |
C | 310 | 8.5% |
L | 265 | 7.2% |
A | 258 | 7.1% |
T | 227 | 6.2% |
I | 215 | 5.9% |
K | 206 | 5.6% |
N | 198 | 5.4% |
G | 193 | 5.3% |
E | 192 | 5.3% |
Other values (24) | 1213 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 107 | |
n | 102 | |
i | 101 | |
o | 87 | 8.7% |
e | 80 | 8.0% |
t | 78 | 7.8% |
r | 65 | 6.5% |
s | 51 | 5.1% |
l | 50 | 5.0% |
d | 44 | 4.4% |
Other values (14) | 235 |
Decimal Number
Value | Count | Frequency (%) |
1 | 19 | |
2 | 16 | |
4 | 15 | |
3 | 9 | |
5 | 3 | 4.1% |
0 | 3 | 4.1% |
6 | 3 | 4.1% |
9 | 3 | 4.1% |
7 | 2 | 2.7% |
8 | 1 | 1.4% |
Other Punctuation
Value | Count | Frequency (%) |
. | 107 | |
& | 88 | |
/ | 35 | 13.5% |
, | 26 | 10.0% |
: | 2 | 0.8% |
· | 2 | 0.8% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1110 | |
( | 1 | 0.1% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 119 | |
℃ | 1 | 0.8% |
Space Separator
Value | Count | Frequency (%) |
6402 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1109 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 54 |
Control
Value | Count | Frequency (%) |
32 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 74768 | |
Common | 9045 | 10.2% |
Latin | 4647 | 5.3% |
Han | 12 | < 0.1% |
Cyrillic | 9 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 2668 | 3.6% |
스 | 2659 | 3.6% |
사 | 2567 | 3.4% |
한 | 2406 | 3.2% |
유 | 1916 | 2.6% |
공 | 1683 | 2.3% |
인 | 1649 | 2.2% |
아 | 1452 | 1.9% |
비 | 1360 | 1.8% |
트 | 1252 | 1.7% |
Other values (841) | 55156 |
Latin
Value | Count | Frequency (%) |
S | 379 | 8.2% |
C | 310 | 6.7% |
L | 265 | 5.7% |
A | 258 | 5.6% |
T | 227 | 4.9% |
I | 215 | 4.6% |
K | 206 | 4.4% |
N | 198 | 4.3% |
G | 193 | 4.2% |
E | 192 | 4.1% |
Other values (43) | 2204 |
Common
Value | Count | Frequency (%) |
6402 | ||
( | 1110 | 12.3% |
) | 1109 | 12.3% |
. | 107 | 1.2% |
& | 88 | 1.0% |
- | 54 | 0.6% |
/ | 35 | 0.4% |
32 | 0.4% | |
, | 26 | 0.3% |
1 | 19 | 0.2% |
Other values (14) | 63 | 0.7% |
Han
Value | Count | Frequency (%) |
舊 | 1 | |
上 | 1 | |
海 | 1 | |
金 | 1 | |
化 | 1 | |
工 | 1 | |
昆 | 1 | |
山 | 1 | |
有 | 1 | |
限 | 1 | |
Other values (2) | 2 |
Cyrillic
Value | Count | Frequency (%) |
О | 3 | |
Н | 2 | |
С | 2 | |
Ф | 1 | 11.1% |
Г | 1 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 74649 | |
ASCII | 13685 | 15.5% |
None | 125 | 0.1% |
CJK | 12 | < 0.1% |
Cyrillic | 9 | < 0.1% |
Letterlike Symbols | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6402 | ||
( | 1110 | 8.1% |
) | 1109 | 8.1% |
S | 379 | 2.8% |
C | 310 | 2.3% |
L | 265 | 1.9% |
A | 258 | 1.9% |
T | 227 | 1.7% |
I | 215 | 1.6% |
K | 206 | 1.5% |
Other values (61) | 3204 |
Hangul
Value | Count | Frequency (%) |
이 | 2668 | 3.6% |
스 | 2659 | 3.6% |
사 | 2567 | 3.4% |
한 | 2406 | 3.2% |
유 | 1916 | 2.6% |
공 | 1683 | 2.3% |
인 | 1649 | 2.2% |
아 | 1452 | 1.9% |
비 | 1360 | 1.8% |
트 | 1252 | 1.7% |
Other values (840) | 55037 |
None
Value | Count | Frequency (%) |
㈜ | 119 | |
· | 2 | 1.6% |
E | 1 | 0.8% |
T | 1 | 0.8% |
O | 1 | 0.8% |
( | 1 | 0.8% |
Cyrillic
Value | Count | Frequency (%) |
О | 3 | |
Н | 2 | |
С | 2 | |
Ф | 1 | 11.1% |
Г | 1 | 11.1% |
CJK
Value | Count | Frequency (%) |
舊 | 1 | |
上 | 1 | |
海 | 1 | |
金 | 1 | |
化 | 1 | |
工 | 1 | |
昆 | 1 | |
山 | 1 | |
有 | 1 | |
限 | 1 | |
Other values (2) | 2 |
Letterlike Symbols
Value | Count | Frequency (%) |
℃ | 1 |
기업명(영문)
Text
Distinct | 9669 |
---|---|
Distinct (%) | 96.7% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 90 |
---|---|
Median length | 65 |
Mean length | 25.259826 |
Min length | 1 |
Characters and Unicode
Total characters | 252573 |
---|---|
Distinct characters | 115 |
Distinct categories | 14 ? |
Distinct scripts | 4 ? |
Distinct blocks | 7 ? |
Unique
Unique | 9445 ? |
---|---|
Unique (%) | 94.5% |
Sample
1st row | SYNOPEX VIETNAM./JSC. |
---|---|
2nd row | LG |
3rd row | GIIR RUS LLC |
4th row | SONG''S FAMILY |
5th row | DALIAN CHUANGZAO MACHINERY CO. |
Value | Count | Frequency (%) |
ltd | 4219 | 10.6% |
co | 3760 | 9.4% |
vina | 979 | 2.5% |
vietnam | 570 | 1.4% |
inc | 446 | 1.1% |
400 | 1.0% | |
korea | 317 | 0.8% |
office | 315 | 0.8% |
indonesia | 295 | 0.7% |
international | 285 | 0.7% |
Other values (8082) | 28206 |
Most occurring characters
Value | Count | Frequency (%) |
29787 | 11.8% | |
N | 19955 | 7.9% |
A | 19165 | 7.6% |
I | 17818 | 7.1% |
O | 17337 | 6.9% |
E | 15360 | 6.1% |
T | 15150 | 6.0% |
C | 12766 | 5.1% |
L | 11122 | 4.4% |
S | 10521 | 4.2% |
Other values (105) | 83592 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 205100 | |
Space Separator | 29793 | 11.8% |
Other Punctuation | 15113 | 6.0% |
Open Punctuation | 862 | 0.3% |
Close Punctuation | 858 | 0.3% |
Dash Punctuation | 425 | 0.2% |
Decimal Number | 185 | 0.1% |
Lowercase Letter | 185 | 0.1% |
Other Letter | 33 | < 0.1% |
Final Punctuation | 8 | < 0.1% |
Other values (4) | 11 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
음 | 2 | 6.1% |
없 | 2 | 6.1% |
ㆍ | 1 | 3.0% |
上 | 1 | 3.0% |
海 | 1 | 3.0% |
高 | 1 | 3.0% |
夫 | 1 | 3.0% |
用 | 1 | 3.0% |
品 | 1 | 3.0% |
有 | 1 | 3.0% |
Other values (21) | 21 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 19955 | 9.7% |
A | 19165 | 9.3% |
I | 17818 | 8.7% |
O | 17337 | 8.5% |
E | 15360 | 7.5% |
T | 15150 | 7.4% |
C | 12766 | 6.2% |
L | 11122 | 5.4% |
S | 10521 | 5.1% |
D | 9598 | 4.7% |
Other values (17) | 56308 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 25 | |
i | 22 | |
o | 19 | |
n | 18 | |
h | 17 | |
e | 16 | |
t | 15 | |
g | 13 | |
r | 9 | 4.9% |
d | 7 | 3.8% |
Other values (11) | 24 |
Other Punctuation
Value | Count | Frequency (%) |
. | 10416 | |
, | 3887 | 25.7% |
& | 618 | 4.1% |
/ | 87 | 0.6% |
' | 75 | 0.5% |
" | 19 | 0.1% |
: | 4 | < 0.1% |
& | 3 | < 0.1% |
· | 2 | < 0.1% |
# | 1 | < 0.1% |
Decimal Number
Value | Count | Frequency (%) |
2 | 55 | |
1 | 50 | |
4 | 23 | |
3 | 18 | 9.7% |
9 | 10 | 5.4% |
0 | 9 | 4.9% |
7 | 6 | 3.2% |
5 | 6 | 3.2% |
8 | 5 | 2.7% |
6 | 3 | 1.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 857 | |
[ | 4 | 0.5% |
( | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
29787 | ||
6 | < 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 854 | |
] | 4 | 0.5% |
Control
Value | Count | Frequency (%) |
4 | ||
1 | 20.0% |
Math Symbol
Value | Count | Frequency (%) |
> | 1 | |
+ | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 425 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 8 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 3 |
Other Symbol
Value | Count | Frequency (%) |
℃ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 205285 | |
Common | 47255 | 18.7% |
Hangul | 23 | < 0.1% |
Han | 10 | < 0.1% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
N | 19955 | 9.7% |
A | 19165 | 9.3% |
I | 17818 | 8.7% |
O | 17337 | 8.4% |
E | 15360 | 7.5% |
T | 15150 | 7.4% |
C | 12766 | 6.2% |
L | 11122 | 5.4% |
S | 10521 | 5.1% |
D | 9598 | 4.7% |
Other values (38) | 56493 |
Common
Value | Count | Frequency (%) |
29787 | ||
. | 10416 | 22.0% |
, | 3887 | 8.2% |
( | 857 | 1.8% |
) | 854 | 1.8% |
& | 618 | 1.3% |
- | 425 | 0.9% |
/ | 87 | 0.2% |
' | 75 | 0.2% |
2 | 55 | 0.1% |
Other values (26) | 194 | 0.4% |
Hangul
Value | Count | Frequency (%) |
음 | 2 | 8.7% |
없 | 2 | 8.7% |
ㆍ | 1 | 4.3% |
구 | 1 | 4.3% |
아 | 1 | 4.3% |
우 | 1 | 4.3% |
토 | 1 | 4.3% |
렘 | 1 | 4.3% |
솔 | 1 | 4.3% |
루 | 1 | 4.3% |
Other values (11) | 11 |
Han
Value | Count | Frequency (%) |
上 | 1 | |
海 | 1 | |
高 | 1 | |
夫 | 1 | |
用 | 1 | |
品 | 1 | |
有 | 1 | |
限 | 1 | |
公 | 1 | |
司 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 252518 | |
Hangul | 22 | < 0.1% |
None | 13 | < 0.1% |
CJK | 10 | < 0.1% |
Punctuation | 8 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Letterlike Symbols | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
29787 | 11.8% | |
N | 19955 | 7.9% |
A | 19165 | 7.6% |
I | 17818 | 7.1% |
O | 17337 | 6.9% |
E | 15360 | 6.1% |
T | 15150 | 6.0% |
C | 12766 | 5.1% |
L | 11122 | 4.4% |
S | 10521 | 4.2% |
Other values (67) | 83537 |
Punctuation
Value | Count | Frequency (%) |
’ | 8 |
None
Value | Count | Frequency (%) |
6 | ||
& | 3 | |
· | 2 | 15.4% |
Ł | 1 | 7.7% |
( | 1 | 7.7% |
Hangul
Value | Count | Frequency (%) |
음 | 2 | 9.1% |
없 | 2 | 9.1% |
구 | 1 | 4.5% |
아 | 1 | 4.5% |
우 | 1 | 4.5% |
토 | 1 | 4.5% |
렘 | 1 | 4.5% |
솔 | 1 | 4.5% |
루 | 1 | 4.5% |
션 | 1 | 4.5% |
Other values (10) | 10 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
Letterlike Symbols
Value | Count | Frequency (%) |
℃ | 1 |
CJK
Value | Count | Frequency (%) |
上 | 1 | |
海 | 1 | |
高 | 1 | |
夫 | 1 | |
用 | 1 | |
品 | 1 | |
有 | 1 | |
限 | 1 | |
公 | 1 | |
司 | 1 |
주소
Text
Distinct | 9752 |
---|---|
Distinct (%) | 97.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 201 |
---|---|
Median length | 138 |
Mean length | 64.6889 |
Min length | 1 |
Characters and Unicode
Total characters | 646889 |
---|---|
Distinct characters | 755 |
Distinct categories | 17 ? |
Distinct scripts | 6 ? |
Distinct blocks | 9 ? |
Unique
Unique | 9581 ? |
---|---|
Unique (%) | 95.8% |
Sample
1st row | DONG THO MULTI - COMPLEX I.Z, DONG THO, YEN PHONG, BAC NINH |
---|---|
2nd row | SYMPHONY (6TH FLOOR), PLOT-SE(F)-9, ROAD-142SOUTH AVENUE, GULSHAN-1, DHAKA-1212 |
3rd row | 6 FLOOR, 4TH LESNOY PER., MOSCOW, RUSSIA |
4th row | NO 49A (VIMEAN PHNOM PENH. ST 209, SANGKAT CHRAING CHAM RESS 1, KHAN REUSSEY KEO, PHNOM PENH CAMBODIA) |
5th row | ROOM 408, VIENNA BUILDING, NO.31, LIAOHE WEST ROAD, DALIAN CITY, LIAONING PROVINCE, CHINA |
Value | Count | Frequency (%) |
vietnam | 1664 | 1.5% |
road | 1620 | 1.5% |
district | 1227 | 1.1% |
dist | 1196 | 1.1% |
ward | 1149 | 1.1% |
city | 1024 | 1.0% |
china | 933 | 0.9% |
no | 922 | 0.9% |
1 | 904 | 0.8% |
indonesia | 877 | 0.8% |
Other values (17631) | 96115 |
Most occurring characters
Value | Count | Frequency (%) |
98441 | ||
A | 52492 | 8.1% |
N | 47618 | 7.4% |
I | 37495 | 5.8% |
, | 35084 | 5.4% |
O | 30709 | 4.7% |
T | 29910 | 4.6% |
E | 26910 | 4.2% |
H | 24203 | 3.7% |
R | 22773 | 3.5% |
Other values (745) | 241254 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 446807 | |
Space Separator | 98445 | 15.2% |
Decimal Number | 46882 | 7.2% |
Other Punctuation | 44890 | 6.9% |
Other Letter | 5638 | 0.9% |
Dash Punctuation | 3343 | 0.5% |
Open Punctuation | 369 | 0.1% |
Close Punctuation | 368 | 0.1% |
Math Symbol | 50 | < 0.1% |
Connector Punctuation | 47 | < 0.1% |
Other values (7) | 50 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
市 | 405 | 7.2% |
路 | 350 | 6.2% |
海 | 176 | 3.1% |
上 | 163 | 2.9% |
省 | 152 | 2.7% |
室 | 134 | 2.4% |
大 | 113 | 2.0% |
新 | 108 | 1.9% |
中 | 107 | 1.9% |
沈 | 101 | 1.8% |
Other values (625) | 3829 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 52492 | 11.7% |
N | 47618 | 10.7% |
I | 37495 | 8.4% |
O | 30709 | 6.9% |
T | 29910 | 6.7% |
E | 26910 | 6.0% |
H | 24203 | 5.4% |
R | 22773 | 5.1% |
S | 17923 | 4.0% |
D | 17920 | 4.0% |
Other values (48) | 138854 |
Decimal Number
Value | Count | Frequency (%) |
1 | 10578 | |
0 | 7036 | |
2 | 6742 | |
3 | 4581 | |
5 | 3887 | 8.3% |
4 | 3329 | 7.1% |
6 | 2895 | 6.2% |
7 | 2809 | 6.0% |
8 | 2731 | 5.8% |
9 | 2280 | 4.9% |
Other values (10) | 14 | < 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 35084 | |
. | 8750 | 19.5% |
# | 455 | 1.0% |
; | 166 | 0.4% |
' | 143 | 0.3% |
& | 136 | 0.3% |
: | 114 | 0.3% |
, | 11 | < 0.1% |
、 | 10 | < 0.1% |
" | 8 | < 0.1% |
Other values (3) | 13 | < 0.1% |
Math Symbol
Value | Count | Frequency (%) |
~ | 26 | |
| | 8 | 16.0% |
< | 7 | 14.0% |
> | 6 | 12.0% |
| | 2 | 4.0% |
+ | 1 | 2.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 353 | |
( | 15 | 4.1% |
【 | 1 | 0.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 352 | |
) | 15 | 4.1% |
】 | 1 | 0.3% |
Control
Value | Count | Frequency (%) |
7 | ||
1 | 11.1% | |
1 | 11.1% |
Space Separator
Value | Count | Frequency (%) |
98441 | ||
4 | < 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3342 | |
- | 1 | < 0.1% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 13 | |
” | 2 | 13.3% |
Other Symbol
Value | Count | Frequency (%) |
° | 9 | |
№ | 1 | 10.0% |
Initial Punctuation
Value | Count | Frequency (%) |
“ | 2 | |
‘ | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 47 |
Lowercase Letter
Value | Count | Frequency (%) |
ß | 7 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 4 |
Other Number
Value | Count | Frequency (%) |
½ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 446143 | |
Common | 194433 | |
Han | 5165 | 0.8% |
Cyrillic | 678 | 0.1% |
Hangul | 444 | 0.1% |
Katakana | 26 | < 0.1% |
Most frequent character per script
Han
Value | Count | Frequency (%) |
市 | 405 | 7.8% |
路 | 350 | 6.8% |
海 | 176 | 3.4% |
上 | 163 | 3.2% |
省 | 152 | 2.9% |
室 | 134 | 2.6% |
大 | 113 | 2.2% |
新 | 108 | 2.1% |
中 | 107 | 2.1% |
沈 | 101 | 2.0% |
Other values (448) | 3356 |
Hangul
Value | Count | Frequency (%) |
구 | 23 | 5.2% |
시 | 18 | 4.1% |
진 | 12 | 2.7% |
호 | 9 | 2.0% |
리 | 9 | 2.0% |
남 | 9 | 2.0% |
로 | 8 | 1.8% |
라 | 8 | 1.8% |
중 | 8 | 1.8% |
바 | 8 | 1.8% |
Other values (152) | 332 |
Common
Value | Count | Frequency (%) |
98441 | ||
, | 35084 | 18.0% |
1 | 10578 | 5.4% |
. | 8750 | 4.5% |
0 | 7036 | 3.6% |
2 | 6742 | 3.5% |
3 | 4581 | 2.4% |
5 | 3887 | 2.0% |
- | 3342 | 1.7% |
4 | 3329 | 1.7% |
Other values (50) | 12663 | 6.5% |
Cyrillic
Value | Count | Frequency (%) |
О | 79 | 11.7% |
С | 60 | 8.8% |
А | 57 | 8.4% |
Р | 46 | 6.8% |
К | 45 | 6.6% |
Е | 39 | 5.8% |
Н | 36 | 5.3% |
И | 35 | 5.2% |
Д | 30 | 4.4% |
Л | 29 | 4.3% |
Other values (21) | 222 |
Latin
Value | Count | Frequency (%) |
A | 52492 | 11.8% |
N | 47618 | 10.7% |
I | 37495 | 8.4% |
O | 30709 | 6.9% |
T | 29910 | 6.7% |
E | 26910 | 6.0% |
H | 24203 | 5.4% |
R | 22773 | 5.1% |
S | 17923 | 4.0% |
D | 17920 | 4.0% |
Other values (20) | 138190 |
Katakana
Value | Count | Frequency (%) |
ビ | 4 | |
ン | 4 | |
ル | 4 | |
タ | 2 | |
ア | 2 | |
セ | 2 | |
ク | 1 | 3.8% |
ジ | 1 | 3.8% |
オ | 1 | 3.8% |
バ | 1 | 3.8% |
Other values (4) | 4 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 640430 | |
CJK | 5165 | 0.8% |
Cyrillic | 678 | 0.1% |
Hangul | 444 | 0.1% |
None | 123 | < 0.1% |
Katakana | 26 | < 0.1% |
Punctuation | 18 | < 0.1% |
Number Forms | 4 | < 0.1% |
Letterlike Symbols | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
98441 | ||
A | 52492 | 8.2% |
N | 47618 | 7.4% |
I | 37495 | 5.9% |
, | 35084 | 5.5% |
O | 30709 | 4.8% |
T | 29910 | 4.7% |
E | 26910 | 4.2% |
H | 24203 | 3.8% |
R | 22773 | 3.6% |
Other values (47) | 234795 |
CJK
Value | Count | Frequency (%) |
市 | 405 | 7.8% |
路 | 350 | 6.8% |
海 | 176 | 3.4% |
上 | 163 | 3.2% |
省 | 152 | 2.9% |
室 | 134 | 2.6% |
大 | 113 | 2.2% |
新 | 108 | 2.1% |
中 | 107 | 2.1% |
沈 | 101 | 2.0% |
Other values (448) | 3356 |
Cyrillic
Value | Count | Frequency (%) |
О | 79 | 11.7% |
С | 60 | 8.8% |
А | 57 | 8.4% |
Р | 46 | 6.8% |
К | 45 | 6.6% |
Е | 39 | 5.8% |
Н | 36 | 5.3% |
И | 35 | 5.2% |
Д | 30 | 4.4% |
Л | 29 | 4.3% |
Other values (21) | 222 |
Hangul
Value | Count | Frequency (%) |
구 | 23 | 5.2% |
시 | 18 | 4.1% |
진 | 12 | 2.7% |
호 | 9 | 2.0% |
리 | 9 | 2.0% |
남 | 9 | 2.0% |
로 | 8 | 1.8% |
라 | 8 | 1.8% |
중 | 8 | 1.8% |
바 | 8 | 1.8% |
Other values (152) | 332 |
None
Value | Count | Frequency (%) |
) | 15 | |
( | 15 | |
Ł | 15 | |
, | 11 | |
、 | 10 | 8.1% |
° | 9 | 7.3% |
¿ | 7 | 5.7% |
ß | 7 | 5.7% |
· | 5 | 4.1% |
4 | 3.3% | |
Other values (17) | 25 |
Punctuation
Value | Count | Frequency (%) |
’ | 13 | |
“ | 2 | 11.1% |
” | 2 | 11.1% |
‘ | 1 | 5.6% |
Katakana
Value | Count | Frequency (%) |
ビ | 4 | |
ン | 4 | |
ル | 4 | |
タ | 2 | |
ア | 2 | |
セ | 2 | |
ク | 1 | 3.8% |
ジ | 1 | 3.8% |
オ | 1 | 3.8% |
バ | 1 | 3.8% |
Other values (4) | 4 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 4 |
Letterlike Symbols
Value | Count | Frequency (%) |
№ | 1 |
우편번호
Text
Distinct | 2978 |
---|---|
Distinct (%) | 29.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
700000 | 1870 | 18.3% |
10000 | 425 | 4.2% |
292 | 2.9% | |
16000 | 153 | 1.5% |
201103 | 134 | 1.3% |
100000 | 90 | 0.9% |
15710 | 81 | 0.8% |
10110 | 71 | 0.7% |
200000 | 71 | 0.7% |
116000 | 69 | 0.7% |
Other values (3066) | 6935 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 24159 | |
1 | 8298 | 15.3% |
2 | 4107 | 7.6% |
7 | 3484 | 6.4% |
3 | 2691 | 5.0% |
5 | 2615 | 4.8% |
6 | 2481 | 4.6% |
4 | 2296 | 4.2% |
8 | 1321 | 2.4% |
9 | 1223 | 2.3% |
Other values (54) | 1406 | 2.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 52675 | |
Uppercase Letter | 534 | 1.0% |
Other Punctuation | 307 | 0.6% |
Dash Punctuation | 306 | 0.6% |
Space Separator | 194 | 0.4% |
Lowercase Letter | 64 | 0.1% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
E | 39 | 7.3% |
C | 32 | 6.0% |
N | 31 | 5.8% |
T | 31 | 5.8% |
B | 29 | 5.4% |
A | 29 | 5.4% |
M | 28 | 5.2% |
X | 27 | 5.1% |
P | 26 | 4.9% |
L | 24 | 4.5% |
Other values (16) | 238 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 6 | 9.4% |
b | 6 | 9.4% |
i | 5 | 7.8% |
a | 5 | 7.8% |
e | 5 | 7.8% |
y | 4 | 6.2% |
n | 4 | 6.2% |
s | 4 | 6.2% |
h | 3 | 4.7% |
l | 3 | 4.7% |
Other values (12) | 19 |
Decimal Number
Value | Count | Frequency (%) |
0 | 24159 | |
1 | 8298 | 15.8% |
2 | 4107 | 7.8% |
7 | 3484 | 6.6% |
3 | 2691 | 5.1% |
5 | 2615 | 5.0% |
6 | 2481 | 4.7% |
4 | 2296 | 4.4% |
8 | 1321 | 2.5% |
9 | 1223 | 2.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 303 | |
/ | 3 | 1.0% |
: | 1 | 0.3% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 306 |
Space Separator
Value | Count | Frequency (%) |
194 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 53483 | |
Latin | 598 | 1.1% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
E | 39 | 6.5% |
C | 32 | 5.4% |
N | 31 | 5.2% |
T | 31 | 5.2% |
B | 29 | 4.8% |
A | 29 | 4.8% |
M | 28 | 4.7% |
X | 27 | 4.5% |
P | 26 | 4.3% |
L | 24 | 4.0% |
Other values (38) | 302 |
Common
Value | Count | Frequency (%) |
0 | 24159 | |
1 | 8298 | 15.5% |
2 | 4107 | 7.7% |
7 | 3484 | 6.5% |
3 | 2691 | 5.0% |
5 | 2615 | 4.9% |
6 | 2481 | 4.6% |
4 | 2296 | 4.3% |
8 | 1321 | 2.5% |
9 | 1223 | 2.3% |
Other values (6) | 808 | 1.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 54081 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 24159 | |
1 | 8298 | 15.3% |
2 | 4107 | 7.6% |
7 | 3484 | 6.4% |
3 | 2691 | 5.0% |
5 | 2615 | 4.8% |
6 | 2481 | 4.6% |
4 | 2296 | 4.2% |
8 | 1321 | 2.4% |
9 | 1223 | 2.3% |
Other values (54) | 1406 | 2.6% |
진출형태
Text
Distinct | 271 |
---|---|
Distinct (%) | 2.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
생산법인 | 3955 | |
서비스법인 | 2674 | |
판매법인 | 1867 | |
해외지사 | 1372 | 12.2% |
연락사무소 | 486 | 4.3% |
기타 | 183 | 1.6% |
137 | 1.2% | |
기타(법인 | 62 | 0.6% |
기타(현지법인 | 29 | 0.3% |
기타(건설 | 13 | 0.1% |
Other values (279) | 449 | 4.0% |
Most occurring characters
Value | Count | Frequency (%) |
인 | 8657 | |
법 | 8653 | |
산 | 3962 | 7.8% |
생 | 3957 | 7.8% |
스 | 2698 | 5.3% |
비 | 2694 | 5.3% |
서 | 2683 | 5.3% |
사 | 1921 | 3.8% |
판 | 1869 | 3.7% |
매 | 1869 | 3.7% |
Other values (230) | 11961 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 47303 | |
Space Separator | 1247 | 2.4% |
Other Punctuation | 1247 | 2.4% |
Open Punctuation | 404 | 0.8% |
Close Punctuation | 404 | 0.8% |
Lowercase Letter | 235 | 0.5% |
Uppercase Letter | 82 | 0.2% |
Dash Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
인 | 8657 | |
법 | 8653 | |
산 | 3962 | |
생 | 3957 | |
스 | 2698 | 5.7% |
비 | 2694 | 5.7% |
서 | 2683 | 5.7% |
사 | 1921 | 4.1% |
판 | 1869 | 4.0% |
매 | 1869 | 4.0% |
Other values (182) | 8340 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 33 | |
r | 22 | |
c | 20 | 8.5% |
a | 20 | 8.5% |
i | 19 | 8.1% |
t | 18 | 7.7% |
n | 18 | 7.7% |
o | 14 | 6.0% |
p | 11 | 4.7% |
f | 9 | 3.8% |
Other values (12) | 51 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 9 | |
T | 8 | 9.8% |
R | 8 | 9.8% |
S | 7 | 8.5% |
C | 6 | 7.3% |
A | 6 | 7.3% |
M | 5 | 6.1% |
B | 5 | 6.1% |
E | 4 | 4.9% |
N | 4 | 4.9% |
Other values (8) | 20 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1071 | |
. | 148 | 11.9% |
/ | 23 | 1.8% |
& | 5 | 0.4% |
Space Separator
Value | Count | Frequency (%) |
1247 |
Open Punctuation
Value | Count | Frequency (%) |
( | 404 |
Close Punctuation
Value | Count | Frequency (%) |
) | 404 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 47303 | |
Common | 3304 | 6.5% |
Latin | 317 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
인 | 8657 | |
법 | 8653 | |
산 | 3962 | |
생 | 3957 | |
스 | 2698 | 5.7% |
비 | 2694 | 5.7% |
서 | 2683 | 5.7% |
사 | 1921 | 4.1% |
판 | 1869 | 4.0% |
매 | 1869 | 4.0% |
Other values (182) | 8340 |
Latin
Value | Count | Frequency (%) |
e | 33 | 10.4% |
r | 22 | 6.9% |
c | 20 | 6.3% |
a | 20 | 6.3% |
i | 19 | 6.0% |
t | 18 | 5.7% |
n | 18 | 5.7% |
o | 14 | 4.4% |
p | 11 | 3.5% |
I | 9 | 2.8% |
Other values (30) | 133 |
Common
Value | Count | Frequency (%) |
1247 | ||
, | 1071 | |
( | 404 | 12.2% |
) | 404 | 12.2% |
. | 148 | 4.5% |
/ | 23 | 0.7% |
& | 5 | 0.2% |
- | 2 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 47303 | |
ASCII | 3621 | 7.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
인 | 8657 | |
법 | 8653 | |
산 | 3962 | |
생 | 3957 | |
스 | 2698 | 5.7% |
비 | 2694 | 5.7% |
서 | 2683 | 5.7% |
사 | 1921 | 4.1% |
판 | 1869 | 4.0% |
매 | 1869 | 4.0% |
Other values (182) | 8340 |
ASCII
Value | Count | Frequency (%) |
1247 | ||
, | 1071 | |
( | 404 | 11.2% |
) | 404 | 11.2% |
. | 148 | 4.1% |
e | 33 | 0.9% |
/ | 23 | 0.6% |
r | 22 | 0.6% |
c | 20 | 0.6% |
a | 20 | 0.6% |
Other values (38) | 229 | 6.3% |
투자형태
Text
Distinct | 63 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
단독투자 | 6419 | |
2653 | ||
합작투자 | 500 | 5.0% |
합자투자 | 202 | 2.0% |
m&a | 42 | 0.4% |
합작투자(50 | 32 | 0.3% |
합작투자(60 | 15 | 0.1% |
합작투자(51 | 12 | 0.1% |
합작투자(40 | 12 | 0.1% |
합작투자(49 | 12 | 0.1% |
Other values (51) | 101 | 1.0% |
Most occurring characters
Value | Count | Frequency (%) |
자 | 7488 | |
투 | 7286 | |
단 | 6419 | |
독 | 6419 | |
. | 2653 | 8.1% |
합 | 867 | 2.6% |
작 | 665 | 2.0% |
( | 184 | 0.6% |
) | 184 | 0.6% |
% | 184 | 0.6% |
Other values (14) | 551 | 1.7% |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29144 | |
Other Punctuation | 2898 | 8.8% |
Decimal Number | 363 | 1.1% |
Open Punctuation | 184 | 0.6% |
Close Punctuation | 184 | 0.6% |
Uppercase Letter | 122 | 0.4% |
Space Separator | 5 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 96 | |
5 | 70 | |
9 | 51 | |
1 | 29 | 8.0% |
6 | 28 | 7.7% |
4 | 27 | 7.4% |
7 | 19 | 5.2% |
8 | 16 | 4.4% |
2 | 15 | 4.1% |
3 | 12 | 3.3% |
Other Letter
Value | Count | Frequency (%) |
자 | 7488 | |
투 | 7286 | |
단 | 6419 | |
독 | 6419 | |
합 | 867 | 3.0% |
작 | 665 | 2.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 2653 | |
% | 184 | 6.3% |
& | 61 | 2.1% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 61 | |
M | 61 |
Open Punctuation
Value | Count | Frequency (%) |
( | 184 |
Close Punctuation
Value | Count | Frequency (%) |
) | 184 |
Space Separator
Value | Count | Frequency (%) |
5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29144 | |
Common | 3634 | 11.0% |
Latin | 122 | 0.4% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
. | 2653 | |
( | 184 | 5.1% |
) | 184 | 5.1% |
% | 184 | 5.1% |
0 | 96 | 2.6% |
5 | 70 | 1.9% |
& | 61 | 1.7% |
9 | 51 | 1.4% |
1 | 29 | 0.8% |
6 | 28 | 0.8% |
Other values (6) | 94 | 2.6% |
Hangul
Value | Count | Frequency (%) |
자 | 7488 | |
투 | 7286 | |
단 | 6419 | |
독 | 6419 | |
합 | 867 | 3.0% |
작 | 665 | 2.3% |
Latin
Value | Count | Frequency (%) |
A | 61 | |
M | 61 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29144 | |
ASCII | 3756 | 11.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
자 | 7488 | |
투 | 7286 | |
단 | 6419 | |
독 | 6419 | |
합 | 867 | 3.0% |
작 | 665 | 2.3% |
ASCII
Value | Count | Frequency (%) |
. | 2653 | |
( | 184 | 4.9% |
) | 184 | 4.9% |
% | 184 | 4.9% |
0 | 96 | 2.6% |
5 | 70 | 1.9% |
A | 61 | 1.6% |
& | 61 | 1.6% |
M | 61 | 1.6% |
9 | 51 | 1.4% |
Other values (8) | 151 | 4.0% |
모기업명
Text
MISSING
 
Distinct | 3983 |
---|---|
Distinct (%) | 69.7% |
Missing | 4286 |
Missing (%) | 42.9% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
주식회사 | 214 | 3.0% |
162 | 2.3% | |
ltd | 85 | 1.2% |
co | 74 | 1.0% |
주 | 69 | 1.0% |
신한은행 | 52 | 0.7% |
삼성전자 | 50 | 0.7% |
우리은행 | 38 | 0.5% |
포스코 | 37 | 0.5% |
lg전자 | 32 | 0.4% |
Other values (4131) | 6317 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 1539 | 3.9% |
1438 | 3.7% | |
) | 1223 | 3.1% |
( | 1205 | 3.1% |
스 | 1077 | 2.7% |
이 | 911 | 2.3% |
한 | 692 | 1.8% |
사 | 524 | 1.3% |
대 | 493 | 1.3% |
C | 477 | 1.2% |
Other values (655) | 29771 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 27319 | |
Uppercase Letter | 4522 | 11.5% |
Lowercase Letter | 2790 | 7.1% |
Space Separator | 1438 | 3.7% |
Close Punctuation | 1223 | 3.1% |
Open Punctuation | 1206 | 3.1% |
Other Punctuation | 585 | 1.5% |
Other Symbol | 141 | 0.4% |
Decimal Number | 74 | 0.2% |
Control | 30 | 0.1% |
Other values (3) | 22 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 1539 | 5.6% |
스 | 1077 | 3.9% |
이 | 911 | 3.3% |
한 | 692 | 2.5% |
사 | 524 | 1.9% |
대 | 493 | 1.8% |
에 | 421 | 1.5% |
코 | 415 | 1.5% |
아 | 391 | 1.4% |
국 | 388 | 1.4% |
Other values (576) | 20468 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 477 | 10.5% |
S | 449 | 9.9% |
L | 409 | 9.0% |
O | 312 | 6.9% |
T | 280 | 6.2% |
I | 267 | 5.9% |
G | 262 | 5.8% |
K | 244 | 5.4% |
E | 233 | 5.2% |
N | 231 | 5.1% |
Other values (16) | 1358 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 371 | |
n | 299 | |
a | 253 | |
e | 226 | 8.1% |
i | 217 | 7.8% |
r | 205 | 7.3% |
t | 204 | 7.3% |
l | 137 | 4.9% |
c | 133 | 4.8% |
s | 130 | 4.7% |
Other values (16) | 615 |
Decimal Number
Value | Count | Frequency (%) |
2 | 17 | |
1 | 13 | |
4 | 12 | |
3 | 10 | |
8 | 6 | 8.1% |
0 | 5 | 6.8% |
7 | 5 | 6.8% |
6 | 4 | 5.4% |
5 | 1 | 1.4% |
9 | 1 | 1.4% |
Other Punctuation
Value | Count | Frequency (%) |
. | 349 | |
/ | 130 | 22.2% |
, | 56 | 9.6% |
& | 43 | 7.4% |
¿ | 3 | 0.5% |
' | 2 | 0.3% |
% | 1 | 0.2% |
: | 1 | 0.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1205 | |
( | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
1438 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1223 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 141 |
Control
Value | Count | Frequency (%) |
30 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 20 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Math Symbol
Value | Count | Frequency (%) |
| | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 27447 | |
Latin | 7312 | 18.6% |
Common | 4578 | 11.6% |
Han | 13 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 1539 | 5.6% |
스 | 1077 | 3.9% |
이 | 911 | 3.3% |
한 | 692 | 2.5% |
사 | 524 | 1.9% |
대 | 493 | 1.8% |
에 | 421 | 1.5% |
코 | 415 | 1.5% |
아 | 391 | 1.4% |
국 | 388 | 1.4% |
Other values (565) | 20596 |
Latin
Value | Count | Frequency (%) |
C | 477 | 6.5% |
S | 449 | 6.1% |
L | 409 | 5.6% |
o | 371 | 5.1% |
O | 312 | 4.3% |
n | 299 | 4.1% |
T | 280 | 3.8% |
I | 267 | 3.7% |
G | 262 | 3.6% |
a | 253 | 3.5% |
Other values (42) | 3933 |
Common
Value | Count | Frequency (%) |
1438 | ||
) | 1223 | |
( | 1205 | |
. | 349 | 7.6% |
/ | 130 | 2.8% |
, | 56 | 1.2% |
& | 43 | 0.9% |
30 | 0.7% | |
- | 20 | 0.4% |
2 | 17 | 0.4% |
Other values (16) | 67 | 1.5% |
Han
Value | Count | Frequency (%) |
道 | 2 | |
司 | 1 | |
限 | 1 | |
公 | 1 | |
有 | 1 | |
系 | 1 | |
柳 | 1 | |
万 | 1 | |
和 | 1 | |
州 | 1 | |
Other values (2) | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 27306 | |
ASCII | 11886 | |
None | 145 | 0.4% |
CJK | 13 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 1539 | 5.6% |
스 | 1077 | 3.9% |
이 | 911 | 3.3% |
한 | 692 | 2.5% |
사 | 524 | 1.9% |
대 | 493 | 1.8% |
에 | 421 | 1.5% |
코 | 415 | 1.5% |
아 | 391 | 1.4% |
국 | 388 | 1.4% |
Other values (564) | 20455 |
ASCII
Value | Count | Frequency (%) |
1438 | 12.1% | |
) | 1223 | 10.3% |
( | 1205 | 10.1% |
C | 477 | 4.0% |
S | 449 | 3.8% |
L | 409 | 3.4% |
o | 371 | 3.1% |
. | 349 | 2.9% |
O | 312 | 2.6% |
n | 299 | 2.5% |
Other values (66) | 5354 |
None
Value | Count | Frequency (%) |
㈜ | 141 | |
¿ | 3 | 2.1% |
( | 1 | 0.7% |
CJK
Value | Count | Frequency (%) |
道 | 2 | |
司 | 1 | |
限 | 1 | |
公 | 1 | |
有 | 1 | |
系 | 1 | |
柳 | 1 | |
万 | 1 | |
和 | 1 | |
州 | 1 | |
Other values (2) | 2 |
업종 대분류
Categorical
Distinct | 23 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
C. 제조업 | |
---|---|
G. 도매 및 소매업 | |
H. 운수 및 창고업 | |
F. 건설업 | |
M. 전문, 과학 및 기술 서비스업 | |
Other values (18) |
Length
Max length | 36 |
---|---|
Median length | 6 |
Mean length | 9.5251 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | C. 제조업 |
---|---|
2nd row | G. 도매 및 소매업 |
3rd row | J. 정보통신업 |
4th row | A. 농업, 임업 및 어업 |
5th row | C. 제조업 |
Common Values
Value | Count | Frequency (%) |
C. 제조업 | 4658 | |
G. 도매 및 소매업 | 1445 | 14.4% |
H. 운수 및 창고업 | 644 | 6.4% |
F. 건설업 | 602 | 6.0% |
M. 전문, 과학 및 기술 서비스업 | 554 | 5.5% |
K. 금융 및 보험업 | 386 | 3.9% |
J. 정보통신업 | 304 | 3.0% |
. | 193 | 1.9% |
N. 사업시설 관리, 사업 지원 및 임대 서비스업 | 181 | 1.8% |
S. 협회 및 단체, 수리 및 기타 개인 서비스업 | 146 | 1.5% |
Other values (13) | 887 | 8.9% |
Length
Value | Count | Frequency (%) |
c | 4659 | |
제조업 | 4659 | |
및 | 4169 | 13.1% |
g | 1445 | 4.6% |
도매 | 1445 | 4.6% |
소매업 | 1445 | 4.6% |
서비스업 | 1058 | 3.3% |
h | 644 | 2.0% |
운수 | 644 | 2.0% |
창고업 | 644 | 2.0% |
Other values (76) | 10915 |
업종 중분류
Categorical
Distinct | 28 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
전자 부품, 컴퓨터, 영상, 음향 및 기통신장비 제조업 | |
기타 제품 제조업 | |
섬유제품 제조업 (의복 제외) | |
자동차 및 트레일러 제조업 | 370 |
Other values (23) |
Length
Max length | 30 |
---|---|
Median length | 4 |
Mean length | 10.0098 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 의료, 정밀, 광학 기기 및 시계 제조업 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | 자동차 및 트레일러 제조업 |
Common Values
Value | Count | Frequency (%) |
<NA> | 5340 | |
전자 부품, 컴퓨터, 영상, 음향 및 기통신장비 제조업 | 638 | 6.4% |
기타 제품 제조업 | 627 | 6.3% |
섬유제품 제조업 (의복 제외) | 538 | 5.4% |
자동차 및 트레일러 제조업 | 370 | 3.7% |
기타 기계 및 장비 제조업 | 311 | 3.1% |
고무 및 플라스틱제품 제조업 | 293 | 2.9% |
의복, 의복 액세서리 및 모피제품 제조업 | 274 | 2.7% |
화학 물질 및 화학제품 제조업 (의약품 제외) | 257 | 2.6% |
금속 가공제품 제조업 (기계 및 가구 제외) | 244 | 2.4% |
Other values (18) | 1108 | 11.1% |
Length
Value | Count | Frequency (%) |
na | 5340 | |
제조업 | 4511 | |
및 | 2920 | 10.5% |
의복 | 1086 | 3.9% |
제외 | 1073 | 3.8% |
기타 | 990 | 3.5% |
기통신장비 | 638 | 2.3% |
전자 | 638 | 2.3% |
음향 | 638 | 2.3% |
컴퓨터 | 638 | 2.3% |
Other values (52) | 9436 |
지역 | 진출국가 | 투자형태 | 업종 대분류 | 업종 중분류 | |
---|---|---|---|---|---|
지역 | 1.000 | 1.000 | 0.472 | 0.293 | 0.437 |
진출국가 | 1.000 | 1.000 | 0.803 | 0.490 | 0.641 |
투자형태 | 0.472 | 0.803 | 1.000 | 0.324 | 0.389 |
업종 대분류 | 0.293 | 0.490 | 0.324 | 1.000 | 0.219 |
업종 중분류 | 0.437 | 0.641 | 0.389 | 0.219 | 1.000 |
업종 중분류 | 지역 | 업종 대분류 | |
---|---|---|---|
업종 중분류 | 1.000 | 0.173 | 0.103 |
지역 | 0.173 | 1.000 | 0.112 |
업종 대분류 | 0.103 | 0.112 | 1.000 |
지역 | 업종 대분류 | 업종 중분류 | |
---|---|---|---|
지역 | 1.000 | 0.112 | 0.173 |
업종 대분류 | 0.112 | 1.000 | 0.103 |
업종 중분류 | 0.173 | 0.103 | 1.000 |
지역 | 진출국가 | 관할무역관 | 기업명(국문) | 기업명(영문) | 주소 | 우편번호 | 진출형태 | 투자형태 | 모기업명 | 업종 대분류 | 업종 중분류 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
8336 | 동남아대양주 | 베트남 | 하노이 | 시노펙스 베트남(주) | SYNOPEX VIETNAM./JSC. | DONG THO MULTI - COMPLEX I.Z, DONG THO, YEN PHONG, BAC NINH | 16000 | 생산법인 | . | 시노펙스 | C. 제조업 | 의료, 정밀, 광학 기기 및 시계 제조업 |
586 | 서남아 | 방글라데시 | 다카 | LG전자 | LG | SYMPHONY (6TH FLOOR), PLOT-SE(F)-9, ROAD-142SOUTH AVENUE, GULSHAN-1, DHAKA-1212 | 1212 | 해외지사 | 단독투자 | LG전자 | G. 도매 및 소매업 | <NA> |
1883 | CIS | 러시아 | 모스크바 | HS애드 모스크바법인 ((구)LG애드 모스크바법인) | GIIR RUS LLC | 6 FLOOR, 4TH LESNOY PER., MOSCOW, RUSSIA | 125047 | 서비스법인 | . | HS애드 | J. 정보통신업 | <NA> |
7505 | 동남아대양주 | 캄보디아 | 프놈펜 | 송가네 | SONG''S FAMILY | NO 49A (VIMEAN PHNOM PENH. ST 209, SANGKAT CHRAING CHAM RESS 1, KHAN REUSSEY KEO, PHNOM PENH CAMBODIA) | . | 생산법인 | 단독투자 | <NA> | A. 농업, 임업 및 어업 | <NA> |
506 | 중국 (홍콩, 대만 포함) | 중국 | 다롄 | 대련창조기계유한공사 | DALIAN CHUANGZAO MACHINERY CO. | ROOM 408, VIENNA BUILDING, NO.31, LIAOHE WEST ROAD, DALIAN CITY, LIAONING PROVINCE, CHINA | 116000 | 생산법인 | 단독투자 | <NA> | C. 제조업 | 자동차 및 트레일러 제조업 |
7840 | 동남아대양주 | 베트남 | 하노이 | SEY CARTOON MANUFACTURING CO.,LTD | SEY CARTOON MANUFACTURING CO., LTD. | 9TH FLOOR, MITEC BUILDING, LOT E2, CAU GIAY, YEN HOA, CAU GIAY, HANOI | 10000 | 생산법인 | 단독투자 | <NA> | R. 예술, 스포츠 및 여가관련 서비스업 | <NA> |
10194 | 동남아대양주 | 베트남 | 호치민 | 소울기어 | THE SOULGEAR VINA CO., LTD. | LOT M-1-CN, ROAD NA7, MY PHUOC 2 IP, BEN CAT TOWN, BINH DUONG, VIETNAM | 700000 | 생산법인 | 단독투자 | 소울기어 | C. 제조업 | 가죽, 가방 및 신발 제조업 |
5910 | 동남아대양주 | 인도네시아 | 자카르타 | 켄리 | KENLEE (PARUNG FACTORY) | JL. RAYA PARUNG KM20, BOGOR, INDONESIA | 16330 | 생산법인 | . | <NA> | C. 제조업 | 섬유제품 제조업 (의복 제외) |
7247 | 중국 (홍콩, 대만 포함) | 중국 | 톈진 | 천진덕인과기유한공사 | DUKIN TIANJIN TECHNOLOGY CO., LTD. | 天津市南水西道代城3021003 | 300381 | 판매법인 | 단독투자 | <NA> | G. 도매 및 소매업 | <NA> |
502 | 중국 (홍콩, 대만 포함) | 중국 | 다롄 | 대련장백물류유한공사 | DALIAN JANGBAEK LOGISTICS CO., LTD. | CHANGXING ISLAND ECONOMIC ZONE, DALIAN, LIAONING PROVINCE, CHINA | 116000 | 서비스법인 | 단독투자 | 장백산업기계 | N. 사업시설 관리, 사업 지원 및 임대 서비스업 | <NA> |
지역 | 진출국가 | 관할무역관 | 기업명(국문) | 기업명(영문) | 주소 | 우편번호 | 진출형태 | 투자형태 | 모기업명 | 업종 대분류 | 업종 중분류 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
6089 | 동남아대양주 | 인도네시아 | 자카르타 | 한솔인도끌라뗀 | HANSOLL INDO KLATEN | JL.BUGISAN RAYA 01,06 PRAMBANAN KAT KLATEN, JAWA TENGAH, INDONESIA | 57454 | 생산법인 | . | <NA> | C. 제조업 | 섬유제품 제조업 (의복 제외) |
9909 | 동남아대양주 | 베트남 | 호치민 | 보성비나 | BU SUNG VINA CO., LTD. | LOT E7-2, MINH HUNG-KOREA IP, MINH HUNG COMMUNE, CHON THANH DIST., BINH PHUOC, VIETNAM | 700000 | 생산법인 | 단독투자 | <NA> | C. 제조업 | 고무 및 플라스틱제품 제조업 |
3239 | CIS | 러시아 | 상트페테르부르크 | 대원루스 | DAEWON RUS | RUSSIA, ST.PETERSBURG, LEVASHOVO, GORSKOE SHOSSE, 165, BLOCK 4, LIT. A. | 194361 | 생산법인 | . | 주식회사 대원총업 | C. 제조업 | 기타 제품 제조업 |
3398 | 중국 (홍콩, 대만 포함) | 중국 | 상하이 | 경기섬유마케팅센터(GTC) | GYEONGGI TEXTILE CENTER | 9B20, SHANGHAI, CHINA MART, 2299 YAN'AN WEST ROAD, CHENGNING DISTRICT, SHANGHAI, CHINA | 200051 | 서비스법인 | 단독투자 | 걍기도경제과학진흥원 | M. 전문, 과학 및 기술 서비스업 | <NA> |
4450 | 동남아대양주 | 싱가포르 | 싱가포르 | 어니언 테크놀로지 | ONION TECHNOLOGY PTE LTD. | 81 UBI AVE 4, #07-17 UB ONE, SINGAPORE | 408830 | 서비스법인, 판매법인 | 단독투자 | (주)어니언소프트웨어 | J. 정보통신업 | <NA> |
6419 | 중국 (홍콩, 대만 포함) | 중국 | 칭다오 | 연대지덕각륜공업유한공사 | YANTAI G-DOK CASTER & WHEEL MANUFACTURING CO., LTD. | FUSHAN HIGH TECH INDUSTRIAL ZONE, YANTAI CITY, SHANDONG PROVINCE, CHINA | 265500 | 생산법인 | 단독투자 | <NA> | C. 제조업 | 고무 및 플라스틱제품 제조업 |
6535 | 중국 (홍콩, 대만 포함) | 중국 | 칭다오 | 청도남경전자유한공사 | QINGDAO NANQING ELECTRONIC CO., LTD. | NO. 14, TIANHE INDUSTRIAL PARK, 252 YANHE ROAD, QINGDAO ECONOMIC AND TECHNOLOGICAL DEVELOPMENT ZONE | 266500 | 생산법인 | 단독투자 | (주)대성하이테크 | C. 제조업 | 자동차 및 트레일러 제조업 |
6643 | 중국 (홍콩, 대만 포함) | 중국 | 칭다오 | 칭다오스베이사무기기유한공사 | QINGDAO SIBEI OFFICE EQUIPMENT CO., LTD. | NO.5 ROAD, JIHONGTAN STREET, CHENGYANG DISTRICT, QINGDAO CITY | 266111 | 생산법인 | 합작투자(51%) | (주)에스피씨 | C. 제조업 | 기타 기계 및 장비 제조업 |
7959 | 동남아대양주 | 베트남 | 하노이 | 대선해운항공주식회사 | DAI SON TRADING & FORWARDING HANOI BRANCH | LO11 BT1 ME TRI HA, TU LIEM, HANOI, VIETNAM | 10000 | 서비스법인 | . | Daesun Air&Sea Transportation | H. 운수 및 창고업 | <NA> |
7602 | 유럽 | 독일 | 프랑크푸르트 | (주)보성상사 유럽지점 | BOSUNG ENGINEERING CO., HAMBURG BRANCH | HEIDENKAMPSWEG 100, 8. OG | 20097 | 기타(지점) | . | <NA> | G. 도매 및 소매업 | <NA> |