Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 4014 |
Missing cells | 983 |
Missing cells (%) | 3.1% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 251.0 KiB |
Average record size in memory | 64.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 5 |
Dataset
Description | 천안시 제조업체 현황자료(업종, 기업체명, 주생산품,연락처)로 천안시 공장등록된 제조업체에대한 자료 입니다. |
---|---|
Author | 충청남도 |
URL | https://alldam.chungnam.go.kr/index.chungnam?menuCd=DOM_000000201001001001&st=&cds=&orgCd=&apiType=&isOpen=Y&pageIndex=415&beforeMenuCd=DOM_000000201001001000&publicdatapk=15005040 |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
공장구분 is highly overall correlated with 시도 | High correlation |
시도 is highly overall correlated with 시군구 and 1 other fields | High correlation |
시군구 is highly overall correlated with 시도 | High correlation |
시도 is highly imbalanced (95.9%) | Imbalance |
공장구분 is highly imbalanced (66.5%) | Imbalance |
전화번호 has 747 (18.6%) missing values | Missing |
공장대표주소(도로명) has 217 (5.4%) missing values | Missing |
Reproduction
Analysis started | 2024-01-09 21:20:43.093271 |
---|---|
Analysis finished | 2024-01-09 21:20:44.410928 |
Duration | 1.32 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.5 KiB |
충청남도 | |
---|---|
<NA> | 18 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 충청남도 |
---|---|
2nd row | 충청남도 |
3rd row | 충청남도 |
4th row | 충청남도 |
5th row | 충청남도 |
Common Values
Value | Count | Frequency (%) |
충청남도 | 3996 | |
<NA> | 18 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
충청남도 | 3996 | |
na | 18 | 0.4% |
시군구
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.5 KiB |
천안시 서북구 | |
---|---|
천안시 동남구 | |
<NA> | 18 |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 6.9865471 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 천안시 서북구 |
---|---|
2nd row | 천안시 서북구 |
3rd row | 천안시 동남구 |
4th row | 천안시 서북구 |
5th row | 천안시 동남구 |
Common Values
Value | Count | Frequency (%) |
천안시 서북구 | 2593 | |
천안시 동남구 | 1403 | |
<NA> | 18 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
천안시 | 3996 | |
서북구 | 2593 | |
동남구 | 1403 | 17.5% |
na | 18 | 0.2% |
회사명
Text
Distinct | 3756 |
---|---|
Distinct (%) | 93.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.5 KiB |
Length
Max length | 28 |
---|---|
Median length | 23 |
Mean length | 7.6763827 |
Min length | 2 |
Characters and Unicode
Total characters | 30813 |
---|---|
Distinct characters | 636 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 3523 ? |
---|---|
Unique (%) | 87.8% |
Sample
1st row | 수덕산업 |
---|---|
2nd row | 플렉스폼코리아(유)천안2공장(성거) |
3rd row | (사)두리장애인복지회 두리다담사업단 |
4th row | (사)우리들행복나눔장애인복지회(화장지사업단) |
5th row | (사)한마음장애인복지회 |
Value | Count | Frequency (%) |
주식회사 | 541 | 11.2% |
농업회사법인 | 41 | 0.8% |
제2공장 | 35 | 0.7% |
천안공장 | 23 | 0.5% |
주 | 14 | 0.3% |
천안지점 | 12 | 0.2% |
2공장 | 11 | 0.2% |
제3공장 | 8 | 0.2% |
제1공장 | 6 | 0.1% |
천안 | 6 | 0.1% |
Other values (3775) | 4144 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 2891 | 9.4% |
( | 2319 | 7.5% |
) | 2319 | 7.5% |
이 | 1045 | 3.4% |
스 | 865 | 2.8% |
856 | 2.8% | |
사 | 771 | 2.5% |
회 | 702 | 2.3% |
식 | 649 | 2.1% |
에 | 644 | 2.1% |
Other values (626) | 17752 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 24893 | |
Open Punctuation | 2320 | 7.5% |
Close Punctuation | 2320 | 7.5% |
Space Separator | 856 | 2.8% |
Uppercase Letter | 196 | 0.6% |
Decimal Number | 130 | 0.4% |
Lowercase Letter | 35 | 0.1% |
Other Punctuation | 34 | 0.1% |
Other Symbol | 19 | 0.1% |
Dash Punctuation | 9 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 2891 | 11.6% |
이 | 1045 | 4.2% |
스 | 865 | 3.5% |
사 | 771 | 3.1% |
회 | 702 | 2.8% |
식 | 649 | 2.6% |
에 | 644 | 2.6% |
업 | 483 | 1.9% |
크 | 437 | 1.8% |
지 | 428 | 1.7% |
Other values (568) | 15978 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 22 | |
E | 21 | |
N | 21 | |
G | 17 | 8.7% |
C | 14 | 7.1% |
A | 12 | 6.1% |
I | 10 | 5.1% |
T | 10 | 5.1% |
M | 10 | 5.1% |
B | 8 | 4.1% |
Other values (14) | 51 |
Lowercase Letter
Value | Count | Frequency (%) |
c | 7 | |
e | 5 | |
o | 4 | |
y | 4 | |
n | 4 | |
u | 3 | |
h | 2 | 5.7% |
i | 1 | 2.9% |
r | 1 | 2.9% |
t | 1 | 2.9% |
Other values (3) | 3 |
Decimal Number
Value | Count | Frequency (%) |
2 | 81 | |
3 | 18 | 13.8% |
1 | 17 | 13.1% |
4 | 5 | 3.8% |
9 | 2 | 1.5% |
0 | 2 | 1.5% |
5 | 2 | 1.5% |
6 | 2 | 1.5% |
7 | 1 | 0.8% |
Other Punctuation
Value | Count | Frequency (%) |
. | 23 | |
& | 6 | 17.6% |
, | 4 | 11.8% |
/ | 1 | 2.9% |
Open Punctuation
Value | Count | Frequency (%) |
( | 2319 | |
[ | 1 | < 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 2319 | |
] | 1 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
856 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 19 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 9 |
Control
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 24912 | |
Common | 5670 | 18.4% |
Latin | 231 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 2891 | 11.6% |
이 | 1045 | 4.2% |
스 | 865 | 3.5% |
사 | 771 | 3.1% |
회 | 702 | 2.8% |
식 | 649 | 2.6% |
에 | 644 | 2.6% |
업 | 483 | 1.9% |
크 | 437 | 1.8% |
지 | 428 | 1.7% |
Other values (569) | 15997 |
Latin
Value | Count | Frequency (%) |
S | 22 | 9.5% |
E | 21 | 9.1% |
N | 21 | 9.1% |
G | 17 | 7.4% |
C | 14 | 6.1% |
A | 12 | 5.2% |
I | 10 | 4.3% |
T | 10 | 4.3% |
M | 10 | 4.3% |
B | 8 | 3.5% |
Other values (27) | 86 |
Common
Value | Count | Frequency (%) |
( | 2319 | |
) | 2319 | |
856 | 15.1% | |
2 | 81 | 1.4% |
. | 23 | 0.4% |
3 | 18 | 0.3% |
1 | 17 | 0.3% |
- | 9 | 0.2% |
& | 6 | 0.1% |
4 | 5 | 0.1% |
Other values (10) | 17 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 24893 | |
ASCII | 5901 | 19.2% |
None | 19 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 2891 | 11.6% |
이 | 1045 | 4.2% |
스 | 865 | 3.5% |
사 | 771 | 3.1% |
회 | 702 | 2.8% |
식 | 649 | 2.6% |
에 | 644 | 2.6% |
업 | 483 | 1.9% |
크 | 437 | 1.8% |
지 | 428 | 1.7% |
Other values (568) | 15978 |
ASCII
Value | Count | Frequency (%) |
( | 2319 | |
) | 2319 | |
856 | 14.5% | |
2 | 81 | 1.4% |
. | 23 | 0.4% |
S | 22 | 0.4% |
E | 21 | 0.4% |
N | 21 | 0.4% |
3 | 18 | 0.3% |
G | 17 | 0.3% |
Other values (47) | 204 | 3.5% |
None
Value | Count | Frequency (%) |
㈜ | 19 |
공장구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.5 KiB |
개별입지 | |
---|---|
개획입지 | 249 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 개별입지 |
---|---|
2nd row | 개별입지 |
3rd row | 개별입지 |
4th row | 개별입지 |
5th row | 개별입지 |
Common Values
Value | Count | Frequency (%) |
개별입지 | 3765 | |
개획입지 | 249 | 6.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
개별입지 | 3765 | |
개획입지 | 249 | 6.2% |
전화번호
Text
MISSING
 
Distinct | 2877 |
---|---|
Distinct (%) | 88.1% |
Missing | 747 |
Missing (%) | 18.6% |
Memory size | 31.5 KiB |
Length
Max length | 14 |
---|---|
Median length | 12 |
Mean length | 11.987756 |
Min length | 2 |
Characters and Unicode
Total characters | 39164 |
---|---|
Distinct characters | 14 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 2562 ? |
---|---|
Unique (%) | 78.4% |
Sample
1st row | 041-902-1889 |
---|---|
2nd row | 041-551-2999 |
3rd row | 041-587-5771 |
4th row | 041-552-1460 |
5th row | 041-583-8815 |
Value | Count | Frequency (%) |
041-553-4336 | 15 | 0.5% |
041 | 11 | 0.3% |
041-575-4044 | 5 | 0.2% |
063-243-4444 | 5 | 0.2% |
041-581-5400 | 4 | 0.1% |
041-588-0500 | 4 | 0.1% |
041-568-0022 | 4 | 0.1% |
041-523-8990 | 3 | 0.1% |
041-585-6700 | 3 | 0.1% |
041-552-4042 | 3 | 0.1% |
Other values (2867) | 3210 |
Most occurring characters
Value | Count | Frequency (%) |
- | 6494 | |
0 | 5905 | |
1 | 5205 | |
5 | 4835 | |
4 | 4685 | |
8 | 2503 | 6.4% |
2 | 2442 | 6.2% |
6 | 2024 | 5.2% |
3 | 1983 | 5.1% |
7 | 1835 | 4.7% |
Other values (4) | 1253 | 3.2% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 32649 | |
Dash Punctuation | 6494 | 16.6% |
Uppercase Letter | 21 | 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 5905 | |
1 | 5205 | |
5 | 4835 | |
4 | 4685 | |
8 | 2503 | |
2 | 2442 | |
6 | 2024 | 6.2% |
3 | 1983 | 6.1% |
7 | 1835 | 5.6% |
9 | 1232 | 3.8% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 7 | |
R | 7 | |
S | 7 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6494 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 39143 | |
Latin | 21 | 0.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 6494 | |
0 | 5905 | |
1 | 5205 | |
5 | 4835 | |
4 | 4685 | |
8 | 2503 | 6.4% |
2 | 2442 | 6.2% |
6 | 2024 | 5.2% |
3 | 1983 | 5.1% |
7 | 1835 | 4.7% |
Latin
Value | Count | Frequency (%) |
A | 7 | |
R | 7 | |
S | 7 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 39164 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 6494 | |
0 | 5905 | |
1 | 5205 | |
5 | 4835 | |
4 | 4685 | |
8 | 2503 | 6.4% |
2 | 2442 | 6.2% |
6 | 2024 | 5.2% |
3 | 1983 | 5.1% |
7 | 1835 | 4.7% |
Other values (4) | 1253 | 3.2% |
생산품
Text
Distinct | 3418 |
---|---|
Distinct (%) | 85.3% |
Missing | 8 |
Missing (%) | 0.2% |
Memory size | 31.5 KiB |
Length
Max length | 65 |
---|---|
Median length | 55 |
Mean length | 10.672991 |
Min length | 1 |
Characters and Unicode
Total characters | 42756 |
---|---|
Distinct characters | 793 |
Distinct categories | 15 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 3169 ? |
---|---|
Unique (%) | 79.1% |
Sample
1st row | 코팅제룸(무정전pc판) |
---|---|
2nd row | 자동차용 내장재 |
3rd row | 종량제봉투, 위생팩, 비닐장갑 |
4th row | 화장지 |
5th row | 수배전반, 제어장치, CCTV, LED |
Value | Count | Frequency (%) |
및 | 226 | 2.9% |
반도체 | 172 | 2.2% |
등 | 128 | 1.6% |
부품 | 123 | 1.6% |
외 | 85 | 1.1% |
장비 | 70 | 0.9% |
자동차부품 | 62 | 0.8% |
자동차 | 50 | 0.6% |
반도체장비 | 48 | 0.6% |
플라스틱 | 43 | 0.5% |
Other values (4549) | 6825 |
Most occurring characters
Value | Count | Frequency (%) |
3880 | 9.1% | |
, | 1878 | 4.4% |
기 | 1282 | 3.0% |
품 | 868 | 2.0% |
장 | 848 | 2.0% |
용 | 831 | 1.9% |
스 | 665 | 1.6% |
자 | 658 | 1.5% |
제 | 651 | 1.5% |
부 | 598 | 1.4% |
Other values (783) | 30597 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31603 | |
Space Separator | 3880 | 9.1% |
Uppercase Letter | 2980 | 7.0% |
Other Punctuation | 1974 | 4.6% |
Lowercase Letter | 1247 | 2.9% |
Close Punctuation | 461 | 1.1% |
Open Punctuation | 459 | 1.1% |
Decimal Number | 92 | 0.2% |
Dash Punctuation | 48 | 0.1% |
Control | 7 | < 0.1% |
Other values (5) | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 1282 | 4.1% |
품 | 868 | 2.7% |
장 | 848 | 2.7% |
용 | 831 | 2.6% |
스 | 665 | 2.1% |
자 | 658 | 2.1% |
제 | 651 | 2.1% |
부 | 598 | 1.9% |
조 | 587 | 1.9% |
반 | 560 | 1.8% |
Other values (700) | 24055 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 312 | 10.5% |
E | 292 | 9.8% |
P | 287 | 9.6% |
L | 275 | 9.2% |
D | 225 | 7.6% |
S | 176 | 5.9% |
A | 168 | 5.6% |
T | 158 | 5.3% |
R | 128 | 4.3% |
O | 116 | 3.9% |
Other values (16) | 843 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 145 | |
i | 111 | 8.9% |
r | 99 | 7.9% |
a | 98 | 7.9% |
t | 95 | 7.6% |
o | 93 | 7.5% |
n | 75 | 6.0% |
l | 73 | 5.9% |
c | 66 | 5.3% |
s | 60 | 4.8% |
Other values (16) | 332 |
Decimal Number
Value | Count | Frequency (%) |
2 | 25 | |
1 | 17 | |
3 | 14 | |
4 | 13 | |
0 | 10 | 10.9% |
5 | 6 | 6.5% |
8 | 3 | 3.3% |
9 | 3 | 3.3% |
7 | 1 | 1.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1878 | |
. | 42 | 2.1% |
/ | 35 | 1.8% |
· | 6 | 0.3% |
' | 6 | 0.3% |
& | 3 | 0.2% |
: | 3 | 0.2% |
? | 1 | 0.1% |
Control
Value | Count | Frequency (%) |
3 | ||
3 | ||
1 | 14.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 456 | |
] | 5 | 1.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 454 | |
[ | 5 | 1.1% |
Space Separator
Value | Count | Frequency (%) |
3880 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 48 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Other Number
Value | Count | Frequency (%) |
² | 1 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 1 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31598 | |
Common | 6926 | 16.2% |
Latin | 4227 | 9.9% |
Han | 5 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 1282 | 4.1% |
품 | 868 | 2.7% |
장 | 848 | 2.7% |
용 | 831 | 2.6% |
스 | 665 | 2.1% |
자 | 658 | 2.1% |
제 | 651 | 2.1% |
부 | 598 | 1.9% |
조 | 587 | 1.9% |
반 | 560 | 1.8% |
Other values (697) | 24050 |
Latin
Value | Count | Frequency (%) |
C | 312 | 7.4% |
E | 292 | 6.9% |
P | 287 | 6.8% |
L | 275 | 6.5% |
D | 225 | 5.3% |
S | 176 | 4.2% |
A | 168 | 4.0% |
T | 158 | 3.7% |
e | 145 | 3.4% |
R | 128 | 3.0% |
Other values (42) | 2061 |
Common
Value | Count | Frequency (%) |
3880 | ||
, | 1878 | |
) | 456 | 6.6% |
( | 454 | 6.6% |
- | 48 | 0.7% |
. | 42 | 0.6% |
/ | 35 | 0.5% |
2 | 25 | 0.4% |
1 | 17 | 0.2% |
3 | 14 | 0.2% |
Other values (21) | 77 | 1.1% |
Han
Value | Count | Frequency (%) |
牛 | 2 | |
豚 | 2 | |
生 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31596 | |
ASCII | 11144 | 26.1% |
None | 8 | < 0.1% |
CJK | 5 | < 0.1% |
Compat Jamo | 2 | < 0.1% |
Punctuation | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3880 | ||
, | 1878 | |
) | 456 | 4.1% |
( | 454 | 4.1% |
C | 312 | 2.8% |
E | 292 | 2.6% |
P | 287 | 2.6% |
L | 275 | 2.5% |
D | 225 | 2.0% |
S | 176 | 1.6% |
Other values (69) | 2909 |
Hangul
Value | Count | Frequency (%) |
기 | 1282 | 4.1% |
품 | 868 | 2.7% |
장 | 848 | 2.7% |
용 | 831 | 2.6% |
스 | 665 | 2.1% |
자 | 658 | 2.1% |
제 | 651 | 2.1% |
부 | 598 | 1.9% |
조 | 587 | 1.9% |
반 | 560 | 1.8% |
Other values (696) | 24048 |
None
Value | Count | Frequency (%) |
· | 6 | |
² | 1 | 12.5% |
? | 1 | 12.5% |
CJK
Value | Count | Frequency (%) |
牛 | 2 | |
豚 | 2 | |
生 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 2 |
Punctuation
Value | Count | Frequency (%) |
’ | 1 |
업종명
Text
Distinct | 977 |
---|---|
Distinct (%) | 24.4% |
Missing | 11 |
Missing (%) | 0.3% |
Memory size | 31.5 KiB |
Length
Max length | 35 |
---|---|
Median length | 29 |
Mean length | 17.553085 |
Min length | 3 |
Characters and Unicode
Total characters | 70265 |
---|---|
Distinct characters | 344 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 4 ? |
Unique
Unique | 491 ? |
---|---|
Unique (%) | 12.3% |
Sample
1st row | 도장 및 기타 피막처리업 |
---|---|
2nd row | 그 외 자동차용 신품 부품 제조업 |
3rd row | 플라스틱 필름 제조업 외 1 종 |
4th row | 위생용 종이제품 제조업 |
5th row | 배전반 및 전기 자동제어반 제조업 외 4 종 |
Value | Count | Frequency (%) |
제조업 | 3605 | 16.0% |
외 | 2169 | 9.6% |
종 | 1581 | 7.0% |
및 | 1496 | 6.6% |
기타 | 1034 | 4.6% |
1 | 872 | 3.9% |
그 | 588 | 2.6% |
기계 | 468 | 2.1% |
제조용 | 338 | 1.5% |
금속 | 286 | 1.3% |
Other values (685) | 10080 |
Most occurring characters
Value | Count | Frequency (%) |
18516 | ||
제 | 5081 | 7.2% |
조 | 4558 | 6.5% |
업 | 4241 | 6.0% |
기 | 2766 | 3.9% |
외 | 2237 | 3.2% |
종 | 1636 | 2.3% |
및 | 1525 | 2.2% |
용 | 1429 | 2.0% |
품 | 1381 | 2.0% |
Other values (334) | 26895 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 49572 | |
Space Separator | 18516 | 26.4% |
Decimal Number | 1619 | 2.3% |
Other Punctuation | 472 | 0.7% |
Open Punctuation | 43 | 0.1% |
Close Punctuation | 43 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
제 | 5081 | 10.2% |
조 | 4558 | 9.2% |
업 | 4241 | 8.6% |
기 | 2766 | 5.6% |
외 | 2237 | 4.5% |
종 | 1636 | 3.3% |
및 | 1525 | 3.1% |
용 | 1429 | 2.9% |
품 | 1381 | 2.8% |
타 | 1095 | 2.2% |
Other values (318) | 23623 |
Decimal Number
Value | Count | Frequency (%) |
1 | 910 | |
2 | 282 | 17.4% |
3 | 213 | 13.2% |
4 | 97 | 6.0% |
5 | 46 | 2.8% |
6 | 36 | 2.2% |
7 | 22 | 1.4% |
0 | 6 | 0.4% |
8 | 6 | 0.4% |
9 | 1 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 450 | |
. | 20 | 4.2% |
· | 2 | 0.4% |
Space Separator
Value | Count | Frequency (%) |
18516 |
Open Punctuation
Value | Count | Frequency (%) |
( | 43 |
Close Punctuation
Value | Count | Frequency (%) |
) | 43 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 49572 | |
Common | 20693 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
제 | 5081 | 10.2% |
조 | 4558 | 9.2% |
업 | 4241 | 8.6% |
기 | 2766 | 5.6% |
외 | 2237 | 4.5% |
종 | 1636 | 3.3% |
및 | 1525 | 3.1% |
용 | 1429 | 2.9% |
품 | 1381 | 2.8% |
타 | 1095 | 2.2% |
Other values (318) | 23623 |
Common
Value | Count | Frequency (%) |
18516 | ||
1 | 910 | 4.4% |
, | 450 | 2.2% |
2 | 282 | 1.4% |
3 | 213 | 1.0% |
4 | 97 | 0.5% |
5 | 46 | 0.2% |
( | 43 | 0.2% |
) | 43 | 0.2% |
6 | 36 | 0.2% |
Other values (6) | 57 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 49540 | |
ASCII | 20691 | |
Compat Jamo | 32 | < 0.1% |
None | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
18516 | ||
1 | 910 | 4.4% |
, | 450 | 2.2% |
2 | 282 | 1.4% |
3 | 213 | 1.0% |
4 | 97 | 0.5% |
5 | 46 | 0.2% |
( | 43 | 0.2% |
) | 43 | 0.2% |
6 | 36 | 0.2% |
Other values (5) | 55 | 0.3% |
Hangul
Value | Count | Frequency (%) |
제 | 5081 | 10.3% |
조 | 4558 | 9.2% |
업 | 4241 | 8.6% |
기 | 2766 | 5.6% |
외 | 2237 | 4.5% |
종 | 1636 | 3.3% |
및 | 1525 | 3.1% |
용 | 1429 | 2.9% |
품 | 1381 | 2.8% |
타 | 1095 | 2.2% |
Other values (317) | 23591 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 32 |
None
Value | Count | Frequency (%) |
· | 2 |
공장대표주소(도로명)
Text
MISSING
 
Distinct | 3511 |
---|---|
Distinct (%) | 92.5% |
Missing | 217 |
Missing (%) | 5.4% |
Memory size | 31.5 KiB |
Length
Max length | 96 |
---|---|
Median length | 64 |
Mean length | 30.676323 |
Min length | 7 |
Characters and Unicode
Total characters | 116478 |
---|---|
Distinct characters | 433 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 3286 ? |
---|---|
Unique (%) | 86.5% |
Sample
1st row | 충청남도 천안시 서북구 성환읍 복모리 280 외 1필지 |
---|---|
2nd row | 충청남도 천안시 서북구 성거읍 봉주로 275 |
3rd row | 충청남도 천안시 동남구 수신면 발산1길 281 |
4th row | 충청남도 천안시서북구 성환읍 매주리 607 |
5th row | 충청남도 천안시 동남구 성남면 석곡3길 60, (2,3동) |
Value | Count | Frequency (%) |
충청남도 | 3796 | 14.9% |
천안시 | 3211 | 12.6% |
서북구 | 1952 | 7.6% |
동남구 | 1258 | 4.9% |
직산읍 | 792 | 3.1% |
외 | 726 | 2.8% |
천안시서북구 | 502 | 2.0% |
성환읍 | 462 | 1.8% |
입장면 | 366 | 1.4% |
성남면 | 344 | 1.3% |
Other values (3524) | 12140 |
Most occurring characters
Value | Count | Frequency (%) |
21755 | 18.7% | |
남 | 5662 | 4.9% |
천 | 4347 | 3.7% |
안 | 4083 | 3.5% |
충 | 3942 | 3.4% |
시 | 3918 | 3.4% |
1 | 3885 | 3.3% |
도 | 3859 | 3.3% |
구 | 3842 | 3.3% |
청 | 3827 | 3.3% |
Other values (423) | 57358 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 72490 | |
Space Separator | 21755 | 18.7% |
Decimal Number | 16633 | 14.3% |
Dash Punctuation | 1617 | 1.4% |
Open Punctuation | 1411 | 1.2% |
Close Punctuation | 1410 | 1.2% |
Other Punctuation | 773 | 0.7% |
Uppercase Letter | 327 | 0.3% |
Lowercase Letter | 47 | < 0.1% |
Math Symbol | 14 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
남 | 5662 | 7.8% |
천 | 4347 | 6.0% |
안 | 4083 | 5.6% |
충 | 3942 | 5.4% |
시 | 3918 | 5.4% |
도 | 3859 | 5.3% |
구 | 3842 | 5.3% |
청 | 3827 | 5.3% |
서 | 2563 | 3.5% |
동 | 2484 | 3.4% |
Other values (365) | 33963 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 61 | |
B | 51 | |
M | 50 | |
C | 31 | |
N | 20 | 6.1% |
S | 19 | 5.8% |
I | 16 | 4.9% |
E | 15 | 4.6% |
T | 14 | 4.3% |
G | 10 | 3.1% |
Other values (11) | 40 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 7 | |
o | 6 | |
r | 5 | |
a | 5 | |
t | 4 | |
i | 3 | |
n | 3 | |
g | 3 | |
m | 2 | 4.3% |
p | 2 | 4.3% |
Other values (7) | 7 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3885 | |
2 | 2642 | |
3 | 2066 | |
5 | 1576 | |
4 | 1473 | 8.9% |
0 | 1252 | 7.5% |
6 | 1168 | 7.0% |
7 | 950 | 5.7% |
9 | 822 | 4.9% |
8 | 799 | 4.8% |
Other Punctuation
Value | Count | Frequency (%) |
, | 763 | |
. | 8 | 1.0% |
/ | 1 | 0.1% |
: | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
21755 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1617 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1411 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1410 |
Math Symbol
Value | Count | Frequency (%) |
~ | 14 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 72491 | |
Common | 43613 | |
Latin | 374 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
남 | 5662 | 7.8% |
천 | 4347 | 6.0% |
안 | 4083 | 5.6% |
충 | 3942 | 5.4% |
시 | 3918 | 5.4% |
도 | 3859 | 5.3% |
구 | 3842 | 5.3% |
청 | 3827 | 5.3% |
서 | 2563 | 3.5% |
동 | 2484 | 3.4% |
Other values (366) | 33964 |
Latin
Value | Count | Frequency (%) |
A | 61 | |
B | 51 | |
M | 50 | |
C | 31 | 8.3% |
N | 20 | 5.3% |
S | 19 | 5.1% |
I | 16 | 4.3% |
E | 15 | 4.0% |
T | 14 | 3.7% |
G | 10 | 2.7% |
Other values (28) | 87 |
Common
Value | Count | Frequency (%) |
21755 | ||
1 | 3885 | 8.9% |
2 | 2642 | 6.1% |
3 | 2066 | 4.7% |
- | 1617 | 3.7% |
5 | 1576 | 3.6% |
4 | 1473 | 3.4% |
( | 1411 | 3.2% |
) | 1410 | 3.2% |
0 | 1252 | 2.9% |
Other values (9) | 4526 | 10.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 72490 | |
ASCII | 43987 | |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
21755 | ||
1 | 3885 | 8.8% |
2 | 2642 | 6.0% |
3 | 2066 | 4.7% |
- | 1617 | 3.7% |
5 | 1576 | 3.6% |
4 | 1473 | 3.3% |
( | 1411 | 3.2% |
) | 1410 | 3.2% |
0 | 1252 | 2.8% |
Other values (47) | 4900 | 11.1% |
Hangul
Value | Count | Frequency (%) |
남 | 5662 | 7.8% |
천 | 4347 | 6.0% |
안 | 4083 | 5.6% |
충 | 3942 | 5.4% |
시 | 3918 | 5.4% |
도 | 3859 | 5.3% |
구 | 3842 | 5.3% |
청 | 3827 | 5.3% |
서 | 2563 | 3.5% |
동 | 2484 | 3.4% |
Other values (365) | 33963 |
None
Value | Count | Frequency (%) |
㈜ | 1 |
시군구 | 공장구분 | |
---|---|---|
시군구 | 1.000 | 0.096 |
공장구분 | 0.096 | 1.000 |
공장구분 | 시도 | 시군구 | |
---|---|---|---|
공장구분 | 1.000 | 1.000 | 0.061 |
시도 | 1.000 | 1.000 | 1.000 |
시군구 | 0.061 | 1.000 | 1.000 |
시도 | 시군구 | 공장구분 | |
---|---|---|---|
시도 | 1.000 | 1.000 | 1.000 |
시군구 | 1.000 | 1.000 | 0.061 |
공장구분 | 1.000 | 0.061 | 1.000 |
시도 | 시군구 | 회사명 | 공장구분 | 전화번호 | 생산품 | 업종명 | 공장대표주소(도로명) | |
---|---|---|---|---|---|---|---|---|
0 | 충청남도 | 천안시 서북구 | 수덕산업 | 개별입지 | <NA> | 코팅제룸(무정전pc판) | 도장 및 기타 피막처리업 | 충청남도 천안시 서북구 성환읍 복모리 280 외 1필지 |
1 | 충청남도 | 천안시 서북구 | 플렉스폼코리아(유)천안2공장(성거) | 개별입지 | 041-902-1889 | 자동차용 내장재 | 그 외 자동차용 신품 부품 제조업 | 충청남도 천안시 서북구 성거읍 봉주로 275 |
2 | 충청남도 | 천안시 동남구 | (사)두리장애인복지회 두리다담사업단 | 개별입지 | 041-551-2999 | 종량제봉투, 위생팩, 비닐장갑 | 플라스틱 필름 제조업 외 1 종 | 충청남도 천안시 동남구 수신면 발산1길 281 |
3 | 충청남도 | 천안시 서북구 | (사)우리들행복나눔장애인복지회(화장지사업단) | 개별입지 | 041-587-5771 | 화장지 | 위생용 종이제품 제조업 | 충청남도 천안시서북구 성환읍 매주리 607 |
4 | 충청남도 | 천안시 동남구 | (사)한마음장애인복지회 | 개별입지 | 041-552-1460 | 수배전반, 제어장치, CCTV, LED | 배전반 및 전기 자동제어반 제조업 외 4 종 | 충청남도 천안시 동남구 성남면 석곡3길 60, (2,3동) |
5 | 충청남도 | 천안시 동남구 | (사)한마음장애인복지회 한마음사업단 | 개별입지 | 041-583-8815 | 헤드레스트커버, 전기차 충전기 | 위생용 종이제품 제조업 외 4 종 | 충청남도 천안시 동남구 수신면 발산1길 171 |
6 | 충청남도 | 천안시 동남구 | (유)선양지연지점 | 개별입지 | 041-559-6056 | 문구용지 | 문구용 종이제품 제조업 | 충청남도 천안시 동남구 광덕면 세종로 4186 |
7 | 충청남도 | 천안시 동남구 | (유)성진 | 개별입지 | 041-559-6217 | 문구용지 | 문구용 종이제품 제조업 | 충청남도 천안시 동남구 광덕면 세종로 4186 |
8 | 충청남도 | 천안시 동남구 | (유)엔비오그린 | 개별입지 | <NA> | 미생물 | 그 외 기타 분류 안된 화학제품 제조업 외 1 종 | 충청남도 천안시 동남구 병천면 개목고개길 41 |
9 | 충청남도 | 천안시 서북구 | (유)트윈위더스 | 개별입지 | 041-588-0500 | 투명전도성 필름 | 플라스틱 적층, 도포 및 기타 표면처리 제품 제조업 | 충청남도 천안시 서북구 입장면 홍천당곡길 70 |
시도 | 시군구 | 회사명 | 공장구분 | 전화번호 | 생산품 | 업종명 | 공장대표주소(도로명) | |
---|---|---|---|---|---|---|---|---|
4004 | 충청남도 | 천안시 서북구 | 효신금속(주) | 개별입지 | 041-582-4261 | P.V.D 이온플레이팀 | 도금업 | 충청남도 천안시 서북구 성환읍 홍경길 100 (효신금속(주)) |
4005 | 충청남도 | 천안시 동남구 | 후드메이트(주) | 개별입지 | 041-552-6063 | 조미료 | 기타 식품 첨가물 제조업 | 충청남도 천안시동남구 안서동 산 120-1번지 호서대 신기술창업센타 304 |
4006 | 충청남도 | 천안시 서북구 | 휴나팩(주) | 개별입지 | <NA> | 플라스틱포대 및 봉투 | 플라스틱 포대, 봉투 및 유사제품 제조업 | 충청남도 천안시 서북구 입장면 가산리 642 외 1필지 |
4007 | 충청남도 | 천안시 서북구 | 휴림로봇(주) | 개별입지 | 041-590-1737 | 산업용 및 지능형 로봇 | 산업용 로봇 제조업 | 충청남도 천안시 서북구 직산읍 4산단6길 27 |
4008 | 충청남도 | 천안시 서북구 | 휴먼이엔티주식회사 | 개별입지 | 041-622-0118 | 패널,인방제,바닥제구조물, 디자인형울타리 | 콘크리트 타일, 기와, 벽돌 및 블록 제조업 외 4 종 | 충청남도 천안시 서북구 성거읍 망향로 903-6 |
4009 | 충청남도 | 천안시 서북구 | 휴코시스 주식회사 | 개별입지 | 041-523-9077 | 전력변환전원장치 | 기타 전기 변환장치 제조업 | 충청남도 천안시 서북구 백석공단1로 10, A동513호(백석동, 천안 미래에이스하이테크시티) |
4010 | 충청남도 | 천안시 동남구 | 흥림농산 | 개별입지 | <NA> | 참기름,압착식용유 | 식물성 유지 제조업 | 충청남도 천안시 동남구 수신면 장산동길 168-27 |
4011 | 충청남도 | 천안시 서북구 | 희성폴리머(주) | 개별입지 | 041-559-1010 | 포장재, 광고지, 천막지 | 기타 인쇄업 외 3 종 | 충청남도 천안시 서북구 성환읍 천안대로 2131 (성환읍) 외 1필지 |
4012 | 충청남도 | 천안시 서북구 | 희영 | 개별입지 | 041-583-1677 | 금형제조업 | 주형 및 금형 제조업 | 충청남도 천안시 서북구 직산읍 금곡로 141 ((주)그린테크산업) (총 3 필지) 외 2필지 |
4013 | 충청남도 | 천안시 서북구 | 히트텍(주) | 개별입지 | 041-584-8881 | 차량공조 열교환기 | 공기 조화장치 제조업 | 충청남도 천안시서북구 직산읍 마정리 522번지 |
Most frequently occurring
시도 | 시군구 | 회사명 | 공장구분 | 전화번호 | 생산품 | 업종명 | 공장대표주소(도로명) | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
0 | 충청남도 | 천안시 서북구 | (주)화이버옵틱코리아 | 개별입지 | 041-587-9911 | 조명장치및광센서 | 일반용조명장치제조업 외 1 종 | 충청남도 천안시서북구 직산읍 삼은리 43-5번지 충남테크노파크천안밸리 생산관2109호 | 2 |