Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 15 |
Missing cells (%) | < 0.1% |
Duplicate rows | 2 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
Text | 5 |
---|---|
Numeric | 2 |
Dataset
Description | 경기도 시흥시 관내 기업체 현황 정보입니다.(경기도 시흥시 기업체 현황 정보에는 업체명, 소재지(도로명, 지번주소), 업종명, 생산품, 용지면적, 건축면적이 있습니다.) |
---|---|
URL | https://www.data.go.kr/data/3077206/fileData.do |
Reproduction
Analysis started | 2023-12-12 18:56:51.150583 |
---|---|
Analysis finished | 2023-12-12 18:56:55.245828 |
Duration | 4.1 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업체명
Text
Distinct | 8827 |
---|---|
Distinct (%) | 88.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
주식회사 | 144 | 1.4% |
태양광발전소 | 34 | 0.3% |
tech | 27 | 0.3% |
eng | 11 | 0.1% |
제2공장 | 10 | 0.1% |
시흥지점 | 10 | 0.1% |
하나테크 | 9 | 0.1% |
대성정밀 | 9 | 0.1% |
우리테크 | 8 | 0.1% |
제이에스테크 | 8 | 0.1% |
Other values (8910) | 10157 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 4631 | 7.3% |
( | 4476 | 7.1% |
) | 4476 | 7.1% |
이 | 2489 | 3.9% |
스 | 1850 | 2.9% |
크 | 1572 | 2.5% |
테 | 1493 | 2.4% |
에 | 1331 | 2.1% |
지 | 956 | 1.5% |
업 | 917 | 1.5% |
Other values (721) | 39016 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 51326 | |
Open Punctuation | 4478 | 7.1% |
Close Punctuation | 4478 | 7.1% |
Uppercase Letter | 1931 | 3.1% |
Space Separator | 461 | 0.7% |
Lowercase Letter | 200 | 0.3% |
Decimal Number | 158 | 0.2% |
Other Punctuation | 148 | 0.2% |
Dash Punctuation | 16 | < 0.1% |
Other Symbol | 8 | < 0.1% |
Other values (3) | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 4631 | 9.0% |
이 | 2489 | 4.8% |
스 | 1850 | 3.6% |
크 | 1572 | 3.1% |
테 | 1493 | 2.9% |
에 | 1331 | 2.6% |
지 | 956 | 1.9% |
업 | 917 | 1.8% |
기 | 909 | 1.8% |
정 | 900 | 1.8% |
Other values (650) | 34278 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 254 | |
N | 200 | |
G | 183 | 9.5% |
S | 173 | 9.0% |
T | 155 | 8.0% |
C | 131 | 6.8% |
M | 105 | 5.4% |
H | 88 | 4.6% |
K | 73 | 3.8% |
A | 73 | 3.8% |
Other values (15) | 496 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 43 | |
c | 25 | |
h | 25 | |
n | 16 | 8.0% |
o | 15 | 7.5% |
t | 14 | 7.0% |
i | 8 | 4.0% |
a | 8 | 4.0% |
r | 7 | 3.5% |
s | 7 | 3.5% |
Other values (12) | 32 |
Decimal Number
Value | Count | Frequency (%) |
2 | 60 | |
1 | 40 | |
3 | 19 | 12.0% |
4 | 13 | 8.2% |
0 | 10 | 6.3% |
5 | 5 | 3.2% |
8 | 4 | 2.5% |
9 | 4 | 2.5% |
6 | 2 | 1.3% |
7 | 1 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
. | 109 | |
& | 32 | 21.6% |
, | 6 | 4.1% |
/ | 1 | 0.7% |
Open Punctuation
Value | Count | Frequency (%) |
( | 4476 | |
[ | 2 | < 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 4476 | |
] | 2 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
461 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 16 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 8 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 51334 | |
Common | 9741 | 15.4% |
Latin | 2132 | 3.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 4631 | 9.0% |
이 | 2489 | 4.8% |
스 | 1850 | 3.6% |
크 | 1572 | 3.1% |
테 | 1493 | 2.9% |
에 | 1331 | 2.6% |
지 | 956 | 1.9% |
업 | 917 | 1.8% |
기 | 909 | 1.8% |
정 | 900 | 1.8% |
Other values (651) | 34286 |
Latin
Value | Count | Frequency (%) |
E | 254 | 11.9% |
N | 200 | 9.4% |
G | 183 | 8.6% |
S | 173 | 8.1% |
T | 155 | 7.3% |
C | 131 | 6.1% |
M | 105 | 4.9% |
H | 88 | 4.1% |
K | 73 | 3.4% |
A | 73 | 3.4% |
Other values (38) | 697 |
Common
Value | Count | Frequency (%) |
( | 4476 | |
) | 4476 | |
461 | 4.7% | |
. | 109 | 1.1% |
2 | 60 | 0.6% |
1 | 40 | 0.4% |
& | 32 | 0.3% |
3 | 19 | 0.2% |
- | 16 | 0.2% |
4 | 13 | 0.1% |
Other values (12) | 39 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 51326 | |
ASCII | 11872 | 18.8% |
None | 8 | < 0.1% |
Number Forms | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 4631 | 9.0% |
이 | 2489 | 4.8% |
스 | 1850 | 3.6% |
크 | 1572 | 3.1% |
테 | 1493 | 2.9% |
에 | 1331 | 2.6% |
지 | 956 | 1.9% |
업 | 917 | 1.8% |
기 | 909 | 1.8% |
정 | 900 | 1.8% |
Other values (650) | 34278 |
ASCII
Value | Count | Frequency (%) |
( | 4476 | |
) | 4476 | |
461 | 3.9% | |
E | 254 | 2.1% |
N | 200 | 1.7% |
G | 183 | 1.5% |
S | 173 | 1.5% |
T | 155 | 1.3% |
C | 131 | 1.1% |
. | 109 | 0.9% |
Other values (59) | 1254 | 10.6% |
None
Value | Count | Frequency (%) |
㈜ | 8 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 |
소재지 지번주소
Text
Distinct | 7156 |
---|---|
Distinct (%) | 71.6% |
Missing | 12 |
Missing (%) | 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 94 |
---|---|
Median length | 78 |
Mean length | 38.804265 |
Min length | 14 |
Characters and Unicode
Total characters | 387577 |
---|---|
Distinct characters | 397 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 5506 ? |
---|---|
Unique (%) | 55.1% |
Sample
1st row | 경기도 시흥시 황골길 87-11 (방산동) |
---|---|
2nd row | 경기도 시흥시 정왕천로 197, 3다402 동우디지털파크 A-313 (정왕동) |
3rd row | 경기도 시흥시 매화산단로 165 (매화동) |
4th row | 경기도 시흥시 시화벤처로 151, (1사302호)(정왕동) |
5th row | 경기도 시흥시 공단2대로139번길 25, [정왕동 1702-1 2마 102] (정왕동) |
Value | Count | Frequency (%) |
경기도 | 9988 | 13.0% |
시흥시 | 9988 | 13.0% |
정왕동 | 8370 | 10.9% |
시화단지 | 1162 | 1.5% |
3바 | 917 | 1.2% |
공단1대로 | 722 | 0.9% |
2바 | 612 | 0.8% |
정왕천로 | 567 | 0.7% |
3마 | 520 | 0.7% |
시화산단 | 450 | 0.6% |
Other values (5455) | 43244 |
Most occurring characters
Value | Count | Frequency (%) |
66915 | 17.3% | |
시 | 22721 | 5.9% |
1 | 21643 | 5.6% |
2 | 15636 | 4.0% |
3 | 13161 | 3.4% |
동 | 12804 | 3.3% |
, | 11295 | 2.9% |
기 | 11143 | 2.9% |
( | 10978 | 2.8% |
) | 10976 | 2.8% |
Other values (387) | 190305 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 186422 | |
Decimal Number | 93875 | |
Space Separator | 66915 | 17.3% |
Other Punctuation | 11321 | 2.9% |
Open Punctuation | 11273 | 2.9% |
Close Punctuation | 11271 | 2.9% |
Dash Punctuation | 3483 | 0.9% |
Uppercase Letter | 2594 | 0.7% |
Lowercase Letter | 386 | 0.1% |
Letter Number | 22 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 22721 | 12.2% |
동 | 12804 | 6.9% |
기 | 11143 | 6.0% |
경 | 10580 | 5.7% |
도 | 10159 | 5.4% |
흥 | 10111 | 5.4% |
정 | 10039 | 5.4% |
왕 | 9988 | 5.4% |
로 | 9831 | 5.3% |
호 | 6510 | 3.5% |
Other values (332) | 72536 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 622 | |
A | 598 | |
M | 415 | |
T | 412 | |
V | 409 | |
D | 30 | 1.2% |
C | 21 | 0.8% |
E | 20 | 0.8% |
G | 14 | 0.5% |
F | 12 | 0.5% |
Other values (10) | 41 | 1.6% |
Lowercase Letter
Value | Count | Frequency (%) |
l | 347 | |
b | 13 | 3.4% |
m | 5 | 1.3% |
t | 5 | 1.3% |
v | 5 | 1.3% |
g | 3 | 0.8% |
a | 3 | 0.8% |
e | 1 | 0.3% |
j | 1 | 0.3% |
o | 1 | 0.3% |
Other values (2) | 2 | 0.5% |
Decimal Number
Value | Count | Frequency (%) |
1 | 21643 | |
2 | 15636 | |
3 | 13161 | |
0 | 10896 | |
4 | 6302 | 6.7% |
5 | 5829 | 6.2% |
6 | 5610 | 6.0% |
7 | 5339 | 5.7% |
8 | 5027 | 5.4% |
9 | 4432 | 4.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 11295 | |
/ | 13 | 0.1% |
. | 7 | 0.1% |
: | 4 | < 0.1% |
& | 2 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 10978 | |
[ | 295 | 2.6% |
Close Punctuation
Value | Count | Frequency (%) |
) | 10976 | |
] | 295 | 2.6% |
Space Separator
Value | Count | Frequency (%) |
66915 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3483 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 22 |
Math Symbol
Value | Count | Frequency (%) |
~ | 15 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 198153 | |
Hangul | 186419 | |
Latin | 3002 | 0.8% |
Han | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 22721 | 12.2% |
동 | 12804 | 6.9% |
기 | 11143 | 6.0% |
경 | 10580 | 5.7% |
도 | 10159 | 5.4% |
흥 | 10111 | 5.4% |
정 | 10039 | 5.4% |
왕 | 9988 | 5.4% |
로 | 9831 | 5.3% |
호 | 6510 | 3.5% |
Other values (329) | 72533 |
Latin
Value | Count | Frequency (%) |
B | 622 | |
A | 598 | |
M | 415 | |
T | 412 | |
V | 409 | |
l | 347 | |
D | 30 | 1.0% |
Ⅱ | 22 | 0.7% |
C | 21 | 0.7% |
E | 20 | 0.7% |
Other values (23) | 106 | 3.5% |
Common
Value | Count | Frequency (%) |
66915 | ||
1 | 21643 | 10.9% |
2 | 15636 | 7.9% |
3 | 13161 | 6.6% |
, | 11295 | 5.7% |
( | 10978 | 5.5% |
) | 10976 | 5.5% |
0 | 10896 | 5.5% |
4 | 6302 | 3.2% |
5 | 5829 | 2.9% |
Other values (12) | 24522 | 12.4% |
Han
Value | Count | Frequency (%) |
堂 | 1 | |
美 | 1 | |
外 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 201133 | |
Hangul | 186419 | |
Number Forms | 22 | < 0.1% |
CJK | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
66915 | ||
1 | 21643 | 10.8% |
2 | 15636 | 7.8% |
3 | 13161 | 6.5% |
, | 11295 | 5.6% |
( | 10978 | 5.5% |
) | 10976 | 5.5% |
0 | 10896 | 5.4% |
4 | 6302 | 3.1% |
5 | 5829 | 2.9% |
Other values (44) | 27502 |
Hangul
Value | Count | Frequency (%) |
시 | 22721 | 12.2% |
동 | 12804 | 6.9% |
기 | 11143 | 6.0% |
경 | 10580 | 5.7% |
도 | 10159 | 5.4% |
흥 | 10111 | 5.4% |
정 | 10039 | 5.4% |
왕 | 9988 | 5.4% |
로 | 9831 | 5.3% |
호 | 6510 | 3.5% |
Other values (329) | 72533 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 22 |
CJK
Value | Count | Frequency (%) |
堂 | 1 | |
美 | 1 | |
外 | 1 |
소재지 도로명주소
Text
Distinct | 7071 |
---|---|
Distinct (%) | 70.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 102 |
---|---|
Median length | 77 |
Mean length | 31.3617 |
Min length | 11 |
Characters and Unicode
Total characters | 313617 |
---|---|
Distinct characters | 346 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 5451 ? |
---|---|
Unique (%) | 54.5% |
Sample
1st row | 경기도 시흥시 방산동 184번지 |
---|---|
2nd row | 경기도 시흥시 정왕동 1288-2번지 3다402 동우디지털파크 A-313 |
3rd row | 경기도 시흥시 매화동 87-2번지 |
4th row | 경기도 시흥시 정왕동 2598-6 (1사302호) |
5th row | 경기도 시흥시 정왕동 1702-1번지 |
Value | Count | Frequency (%) |
경기도 | 9985 | 15.8% |
시흥시 | 9983 | 15.8% |
정왕동 | 8971 | 14.2% |
3바 | 716 | 1.1% |
시화단지 | 646 | 1.0% |
2바 | 453 | 0.7% |
3층 | 413 | 0.7% |
2층 | 412 | 0.7% |
1층 | 409 | 0.6% |
3마 | 376 | 0.6% |
Other values (6402) | 31011 |
Most occurring characters
Value | Count | Frequency (%) |
54629 | ||
1 | 21814 | 7.0% |
시 | 21546 | 6.9% |
2 | 17755 | 5.7% |
동 | 12077 | 3.9% |
- | 10806 | 3.4% |
기 | 10133 | 3.2% |
도 | 10085 | 3.2% |
흥 | 10051 | 3.2% |
경 | 10036 | 3.2% |
Other values (336) | 134685 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 145666 | |
Decimal Number | 94445 | |
Space Separator | 54629 | 17.4% |
Dash Punctuation | 10806 | 3.4% |
Uppercase Letter | 2449 | 0.8% |
Open Punctuation | 1825 | 0.6% |
Close Punctuation | 1823 | 0.6% |
Other Punctuation | 1597 | 0.5% |
Lowercase Letter | 344 | 0.1% |
Letter Number | 25 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 21546 | |
동 | 12077 | 8.3% |
기 | 10133 | 7.0% |
도 | 10085 | 6.9% |
흥 | 10051 | 6.9% |
경 | 10036 | 6.9% |
지 | 9590 | 6.6% |
정 | 9349 | 6.4% |
왕 | 9316 | 6.4% |
번 | 8214 | 5.6% |
Other values (283) | 35269 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 568 | |
A | 531 | |
M | 414 | |
T | 410 | |
V | 408 | |
D | 27 | 1.1% |
C | 19 | 0.8% |
E | 18 | 0.7% |
F | 12 | 0.5% |
G | 11 | 0.4% |
Other values (8) | 31 | 1.3% |
Lowercase Letter
Value | Count | Frequency (%) |
l | 307 | |
b | 12 | 3.5% |
v | 5 | 1.5% |
t | 5 | 1.5% |
m | 5 | 1.5% |
g | 3 | 0.9% |
a | 2 | 0.6% |
e | 1 | 0.3% |
y | 1 | 0.3% |
j | 1 | 0.3% |
Other values (2) | 2 | 0.6% |
Decimal Number
Value | Count | Frequency (%) |
1 | 21814 | |
2 | 17755 | |
3 | 9917 | |
0 | 9912 | |
5 | 6481 | 6.9% |
6 | 6277 | 6.6% |
7 | 6185 | 6.5% |
4 | 6050 | 6.4% |
8 | 5867 | 6.2% |
9 | 4187 | 4.4% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1575 | |
/ | 12 | 0.8% |
. | 6 | 0.4% |
: | 3 | 0.2% |
& | 1 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1642 | |
[ | 183 | 10.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1640 | |
] | 183 | 10.0% |
Space Separator
Value | Count | Frequency (%) |
54629 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10806 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 25 |
Math Symbol
Value | Count | Frequency (%) |
~ | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 165133 | |
Hangul | 145663 | |
Latin | 2818 | 0.9% |
Han | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 21546 | |
동 | 12077 | 8.3% |
기 | 10133 | 7.0% |
도 | 10085 | 6.9% |
흥 | 10051 | 6.9% |
경 | 10036 | 6.9% |
지 | 9590 | 6.6% |
정 | 9349 | 6.4% |
왕 | 9316 | 6.4% |
번 | 8214 | 5.6% |
Other values (280) | 35266 |
Latin
Value | Count | Frequency (%) |
B | 568 | |
A | 531 | |
M | 414 | |
T | 410 | |
V | 408 | |
l | 307 | |
D | 27 | 1.0% |
Ⅱ | 25 | 0.9% |
C | 19 | 0.7% |
E | 18 | 0.6% |
Other values (21) | 91 | 3.2% |
Common
Value | Count | Frequency (%) |
54629 | ||
1 | 21814 | 13.2% |
2 | 17755 | 10.8% |
- | 10806 | 6.5% |
3 | 9917 | 6.0% |
0 | 9912 | 6.0% |
5 | 6481 | 3.9% |
6 | 6277 | 3.8% |
7 | 6185 | 3.7% |
4 | 6050 | 3.7% |
Other values (12) | 15307 | 9.3% |
Han
Value | Count | Frequency (%) |
外 | 1 | |
美 | 1 | |
堂 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 167926 | |
Hangul | 145663 | |
Number Forms | 25 | < 0.1% |
CJK | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
54629 | ||
1 | 21814 | 13.0% |
2 | 17755 | 10.6% |
- | 10806 | 6.4% |
3 | 9917 | 5.9% |
0 | 9912 | 5.9% |
5 | 6481 | 3.9% |
6 | 6277 | 3.7% |
7 | 6185 | 3.7% |
4 | 6050 | 3.6% |
Other values (42) | 18100 | 10.8% |
Hangul
Value | Count | Frequency (%) |
시 | 21546 | |
동 | 12077 | 8.3% |
기 | 10133 | 7.0% |
도 | 10085 | 6.9% |
흥 | 10051 | 6.9% |
경 | 10036 | 6.9% |
지 | 9590 | 6.6% |
정 | 9349 | 6.4% |
왕 | 9316 | 6.4% |
번 | 8214 | 5.6% |
Other values (280) | 35266 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 25 |
CJK
Value | Count | Frequency (%) |
外 | 1 | |
美 | 1 | |
堂 | 1 |
업종명
Text
Distinct | 1010 |
---|---|
Distinct (%) | 10.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 35 |
---|---|
Median length | 31 |
Mean length | 15.8477 |
Min length | 3 |
Characters and Unicode
Total characters | 158477 |
---|---|
Distinct characters | 341 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 443 ? |
---|---|
Unique (%) | 4.4% |
Sample
1st row | 주형 및 금형 제조업 |
---|---|
2nd row | 그 외 기타 전자부품 제조업 외 1 종 |
3rd row | 기타 절연선 및 케이블 제조업 외 1 종 |
4th row | 그 외 기타 1차 철강 제조업 |
5th row | 육상 금속 골조 구조재 제조업 외 2 종 |
Value | Count | Frequency (%) |
제조업 | 7437 | 14.9% |
외 | 4552 | 9.1% |
및 | 4352 | 8.7% |
기타 | 2844 | 5.7% |
종 | 2521 | 5.1% |
그 | 2030 | 4.1% |
1 | 1607 | 3.2% |
유사처리업 | 1163 | 2.3% |
절삭가공 | 1163 | 2.3% |
금속 | 810 | 1.6% |
Other values (694) | 21355 |
Most occurring characters
Value | Count | Frequency (%) |
39840 | ||
업 | 10348 | 6.5% |
제 | 9503 | 6.0% |
조 | 8455 | 5.3% |
기 | 6902 | 4.4% |
외 | 4570 | 2.9% |
및 | 4352 | 2.7% |
타 | 2849 | 1.8% |
용 | 2730 | 1.7% |
종 | 2565 | 1.6% |
Other values (331) | 66363 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 114809 | |
Space Separator | 39840 | 25.1% |
Decimal Number | 2915 | 1.8% |
Other Punctuation | 895 | 0.6% |
Open Punctuation | 9 | < 0.1% |
Close Punctuation | 9 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 10348 | 9.0% |
제 | 9503 | 8.3% |
조 | 8455 | 7.4% |
기 | 6902 | 6.0% |
외 | 4570 | 4.0% |
및 | 4352 | 3.8% |
타 | 2849 | 2.5% |
용 | 2730 | 2.4% |
종 | 2565 | 2.2% |
공 | 2530 | 2.2% |
Other values (316) | 60005 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1997 | |
2 | 450 | 15.4% |
3 | 232 | 8.0% |
4 | 104 | 3.6% |
5 | 44 | 1.5% |
6 | 38 | 1.3% |
7 | 23 | 0.8% |
9 | 13 | 0.4% |
8 | 11 | 0.4% |
0 | 3 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 862 | |
. | 33 | 3.7% |
Space Separator
Value | Count | Frequency (%) |
39840 |
Open Punctuation
Value | Count | Frequency (%) |
( | 9 |
Close Punctuation
Value | Count | Frequency (%) |
) | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 114809 | |
Common | 43668 | 27.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 10348 | 9.0% |
제 | 9503 | 8.3% |
조 | 8455 | 7.4% |
기 | 6902 | 6.0% |
외 | 4570 | 4.0% |
및 | 4352 | 3.8% |
타 | 2849 | 2.5% |
용 | 2730 | 2.4% |
종 | 2565 | 2.2% |
공 | 2530 | 2.2% |
Other values (316) | 60005 |
Common
Value | Count | Frequency (%) |
39840 | ||
1 | 1997 | 4.6% |
, | 862 | 2.0% |
2 | 450 | 1.0% |
3 | 232 | 0.5% |
4 | 104 | 0.2% |
5 | 44 | 0.1% |
6 | 38 | 0.1% |
. | 33 | 0.1% |
7 | 23 | 0.1% |
Other values (5) | 45 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 114772 | |
ASCII | 43668 | 27.6% |
Compat Jamo | 37 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
39840 | ||
1 | 1997 | 4.6% |
, | 862 | 2.0% |
2 | 450 | 1.0% |
3 | 232 | 0.5% |
4 | 104 | 0.2% |
5 | 44 | 0.1% |
6 | 38 | 0.1% |
. | 33 | 0.1% |
7 | 23 | 0.1% |
Other values (5) | 45 | 0.1% |
Hangul
Value | Count | Frequency (%) |
업 | 10348 | 9.0% |
제 | 9503 | 8.3% |
조 | 8455 | 7.4% |
기 | 6902 | 6.0% |
외 | 4570 | 4.0% |
및 | 4352 | 3.8% |
타 | 2849 | 2.5% |
용 | 2730 | 2.4% |
종 | 2565 | 2.2% |
공 | 2530 | 2.2% |
Other values (315) | 59968 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 37 |
생산품
Text
Distinct | 6123 |
---|---|
Distinct (%) | 61.2% |
Missing | 3 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 84 |
---|---|
Median length | 53 |
Mean length | 7.4944483 |
Min length | 1 |
Characters and Unicode
Total characters | 74922 |
---|---|
Distinct characters | 752 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 5342 ? |
---|---|
Unique (%) | 53.4% |
Sample
1st row | 모터코어 편칭 및 금형 |
---|---|
2nd row | CD-ROM, USB |
3rd row | 전선 및 전원플러그 |
4th row | 철강재 절단 |
5th row | 철구조물 |
Value | Count | Frequency (%) |
및 | 490 | 2.9% |
기계부품 | 467 | 2.7% |
등 | 402 | 2.4% |
금형 | 352 | 2.1% |
부품 | 324 | 1.9% |
외 | 286 | 1.7% |
자동차부품 | 277 | 1.6% |
배전반 | 235 | 1.4% |
제조업 | 203 | 1.2% |
반도체 | 144 | 0.8% |
Other values (5810) | 13913 |
Most occurring characters
Value | Count | Frequency (%) |
7389 | 9.9% | |
기 | 4145 | 5.5% |
품 | 2873 | 3.8% |
부 | 2428 | 3.2% |
, | 2338 | 3.1% |
자 | 1710 | 2.3% |
계 | 1625 | 2.2% |
동 | 1505 | 2.0% |
공 | 1396 | 1.9% |
전 | 1375 | 1.8% |
Other values (742) | 48138 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 62090 | |
Space Separator | 7389 | 9.9% |
Other Punctuation | 2393 | 3.2% |
Uppercase Letter | 1584 | 2.1% |
Lowercase Letter | 799 | 1.1% |
Open Punctuation | 278 | 0.4% |
Close Punctuation | 278 | 0.4% |
Decimal Number | 92 | 0.1% |
Dash Punctuation | 11 | < 0.1% |
Control | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 4145 | 6.7% |
품 | 2873 | 4.6% |
부 | 2428 | 3.9% |
자 | 1710 | 2.8% |
계 | 1625 | 2.6% |
동 | 1505 | 2.4% |
공 | 1396 | 2.2% |
전 | 1375 | 2.2% |
제 | 1371 | 2.2% |
금 | 1220 | 2.0% |
Other values (672) | 42442 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 215 | |
D | 143 | 9.0% |
E | 142 | 9.0% |
L | 139 | 8.8% |
P | 136 | 8.6% |
A | 84 | 5.3% |
B | 83 | 5.2% |
T | 82 | 5.2% |
S | 69 | 4.4% |
R | 66 | 4.2% |
Other values (14) | 425 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 89 | |
l | 70 | 8.8% |
t | 61 | 7.6% |
c | 61 | 7.6% |
r | 58 | 7.3% |
a | 56 | 7.0% |
o | 52 | 6.5% |
s | 46 | 5.8% |
p | 46 | 5.8% |
n | 45 | 5.6% |
Other values (14) | 215 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2338 | |
/ | 26 | 1.1% |
. | 20 | 0.8% |
& | 3 | 0.1% |
' | 3 | 0.1% |
· | 2 | 0.1% |
% | 1 | < 0.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 38 | |
2 | 25 | |
3 | 12 | 13.0% |
0 | 7 | 7.6% |
5 | 7 | 7.6% |
4 | 2 | 2.2% |
6 | 1 | 1.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 277 | |
[ | 1 | 0.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 277 | |
] | 1 | 0.4% |
Space Separator
Value | Count | Frequency (%) |
7389 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 11 |
Control
Value | Count | Frequency (%) |
6 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 62090 | |
Common | 10449 | 13.9% |
Latin | 2383 | 3.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 4145 | 6.7% |
품 | 2873 | 4.6% |
부 | 2428 | 3.9% |
자 | 1710 | 2.8% |
계 | 1625 | 2.6% |
동 | 1505 | 2.4% |
공 | 1396 | 2.2% |
전 | 1375 | 2.2% |
제 | 1371 | 2.2% |
금 | 1220 | 2.0% |
Other values (672) | 42442 |
Latin
Value | Count | Frequency (%) |
C | 215 | 9.0% |
D | 143 | 6.0% |
E | 142 | 6.0% |
L | 139 | 5.8% |
P | 136 | 5.7% |
e | 89 | 3.7% |
A | 84 | 3.5% |
B | 83 | 3.5% |
T | 82 | 3.4% |
l | 70 | 2.9% |
Other values (38) | 1200 |
Common
Value | Count | Frequency (%) |
7389 | ||
, | 2338 | 22.4% |
( | 277 | 2.7% |
) | 277 | 2.7% |
1 | 38 | 0.4% |
/ | 26 | 0.2% |
2 | 25 | 0.2% |
. | 20 | 0.2% |
3 | 12 | 0.1% |
- | 11 | 0.1% |
Other values (12) | 36 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 62089 | |
ASCII | 12830 | 17.1% |
None | 2 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
7389 | ||
, | 2338 | 18.2% |
( | 277 | 2.2% |
) | 277 | 2.2% |
C | 215 | 1.7% |
D | 143 | 1.1% |
E | 142 | 1.1% |
L | 139 | 1.1% |
P | 136 | 1.1% |
e | 89 | 0.7% |
Other values (59) | 1685 | 13.1% |
Hangul
Value | Count | Frequency (%) |
기 | 4145 | 6.7% |
품 | 2873 | 4.6% |
부 | 2428 | 3.9% |
자 | 1710 | 2.8% |
계 | 1625 | 2.6% |
동 | 1505 | 2.4% |
공 | 1396 | 2.2% |
전 | 1375 | 2.2% |
제 | 1371 | 2.2% |
금 | 1220 | 2.0% |
Other values (671) | 42441 |
None
Value | Count | Frequency (%) |
· | 2 |
Compat Jamo
Value | Count | Frequency (%) |
ㅅ | 1 |
용지면적
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 2381 |
---|---|
Distinct (%) | 23.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 916.66339 |
Minimum | 0 |
---|---|
Maximum | 85942.8 |
Zeros | 5673 |
Zeros (%) | 56.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 525.475 |
95-th percentile | 3701.49 |
Maximum | 85942.8 |
Range | 85942.8 |
Interquartile range (IQR) | 525.475 |
Descriptive statistics
Standard deviation | 3261.6625 |
---|---|
Coefficient of variation (CV) | 3.55819 |
Kurtosis | 179.02837 |
Mean | 916.66339 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 10.837791 |
Sum | 9166633.9 |
Variance | 10638442 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 5673 | |
59.54 | 95 | 0.9% |
42.2 | 69 | 0.7% |
69.28 | 61 | 0.6% |
330.0 | 36 | 0.4% |
80.82 | 33 | 0.3% |
34.54 | 31 | 0.3% |
29.0 | 30 | 0.3% |
37.771 | 29 | 0.3% |
57.24 | 27 | 0.3% |
Other values (2371) | 3916 |
Value | Count | Frequency (%) |
0.0 | 5673 | |
0.2 | 1 | < 0.1% |
4.0 | 1 | < 0.1% |
14.56 | 1 | < 0.1% |
15.0 | 1 | < 0.1% |
15.43 | 1 | < 0.1% |
18.918 | 3 | < 0.1% |
20.04 | 3 | < 0.1% |
25.56 | 1 | < 0.1% |
25.98 | 10 | 0.1% |
Value | Count | Frequency (%) |
85942.8 | 1 | |
79745.8 | 1 | |
75358.3 | 1 | |
60663.8 | 1 | |
52669.0 | 1 | |
51744.0 | 1 | |
51111.5 | 1 | |
49840.9 | 1 | |
48187.7 | 1 | |
46879.4 | 1 |
건축면적
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 5082 |
---|---|
Distinct (%) | 50.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 871.68443 |
Minimum | -127.11 |
---|---|
Maximum | 171614.75 |
Zeros | 103 |
Zeros (%) | 1.0% |
Negative | 1 |
Negative (%) | < 0.1% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | -127.11 |
---|---|
5-th percentile | 33 |
Q1 | 130 |
median | 251.97 |
Q3 | 617.025 |
95-th percentile | 3002.7945 |
Maximum | 171614.75 |
Range | 171741.86 |
Interquartile range (IQR) | 487.025 |
Descriptive statistics
Standard deviation | 3851.3983 |
---|---|
Coefficient of variation (CV) | 4.4183402 |
Kurtosis | 934.35276 |
Mean | 871.68443 |
Median Absolute Deviation (MAD) | 169.47 |
Skewness | 25.916392 |
Sum | 8716844.3 |
Variance | 14833269 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
33.0 | 176 | 1.8% |
165.0 | 167 | 1.7% |
330.0 | 159 | 1.6% |
66.0 | 149 | 1.5% |
99.0 | 132 | 1.3% |
100.0 | 109 | 1.1% |
0.0 | 103 | 1.0% |
132.0 | 85 | 0.9% |
60.0 | 80 | 0.8% |
198.0 | 77 | 0.8% |
Other values (5072) | 8763 |
Value | Count | Frequency (%) |
-127.11 | 1 | < 0.1% |
0.0 | 103 | |
0.5 | 1 | < 0.1% |
1.0 | 3 | < 0.1% |
3.3 | 1 | < 0.1% |
4.0 | 1 | < 0.1% |
6.6 | 1 | < 0.1% |
8.529 | 1 | < 0.1% |
9.0 | 1 | < 0.1% |
9.3 | 1 | < 0.1% |
Value | Count | Frequency (%) |
171614.75 | 1 | |
158657.21 | 1 | |
142192.47 | 1 | |
87300.557 | 1 | |
86805.33 | 1 | |
69396.54 | 1 | |
58335.1 | 1 | |
56027.12 | 1 | |
54687.16 | 1 | |
54278.21 | 1 |
용지면적 | 건축면적 | |
---|---|---|
용지면적 | 1.000 | 0.725 |
건축면적 | 0.725 | 1.000 |
용지면적 | 건축면적 | |
---|---|---|
용지면적 | 1.000 | 0.506 |
건축면적 | 0.506 | 1.000 |
업체명 | 소재지 지번주소 | 소재지 도로명주소 | 업종명 | 생산품 | 용지면적 | 건축면적 | |
---|---|---|---|---|---|---|---|
6125 | 삼오금형 | 경기도 시흥시 황골길 87-11 (방산동) | 경기도 시흥시 방산동 184번지 | 주형 및 금형 제조업 | 모터코어 편칭 및 금형 | 341.0 | 198.86 |
1944 | (주)엑소 | 경기도 시흥시 정왕천로 197, 3다402 동우디지털파크 A-313 (정왕동) | 경기도 시흥시 정왕동 1288-2번지 3다402 동우디지털파크 A-313 | 그 외 기타 전자부품 제조업 외 1 종 | CD-ROM, USB | 52.0 | 58.91 |
3427 | (주)한국코드 | 경기도 시흥시 매화산단로 165 (매화동) | 경기도 시흥시 매화동 87-2번지 | 기타 절연선 및 케이블 제조업 외 1 종 | 전선 및 전원플러그 | 1715.0 | 1271.25 |
664 | (주)디앤더블유 | 경기도 시흥시 시화벤처로 151, (1사302호)(정왕동) | 경기도 시흥시 정왕동 2598-6 (1사302호) | 그 외 기타 1차 철강 제조업 | 철강재 절단 | 1686.98 | 1161.43 |
6156 | 삼원테크 | 경기도 시흥시 공단2대로139번길 25, [정왕동 1702-1 2마 102] (정왕동) | 경기도 시흥시 정왕동 1702-1번지 | 육상 금속 골조 구조재 제조업 외 2 종 | 철구조물 | 0.0 | 66.0 |
9630 | 케이엔시시스템 | 경기도 시흥시 금오로 326-4(과림동) | 경기도 시흥시 과림동 608-13 | 전동기 및 발전기 제조업 | 전동창(창호자동개폐장치) | 419.0 | 192.08 |
8109 | 우진실업(주) | 경기도 시흥시 은행로12번길 5 (은행동, 우진실업(주)) | 경기도 시흥시 은행동 284-10번지 | 산업용 송풍기 및 배기장치 제조업 | 송풍기 | 478.0 | 849.1 |
5814 | 미화전자개발 | 경기도 시흥시 미산로 121 (미산동, 현우정밀) | 경기도 시흥시 미산동 339-2번지 | 배전반 및 전기 자동제어반 제조업 | 자동제어판제조 | 292.0 | 160.12 |
2144 | (주)와이에스지 | 경기도 시흥시 마유로238번길 43, 3나 207호 (정왕동) | 경기도 시흥시 정왕동 1278-6번지 3나 207호 | 유선 통신장비 제조업 외 1 종 | 통신장비케이스 | 0.0 | 792.0 |
7203 | 아진테크 | 경기도 시흥시 협력로 188, 1다 307 (정왕동) | 경기도 시흥시 정왕동 1245-6번지 1다 307 | 그 외 기타 특수목적용 기계 제조업 외 1 종 | 수지가공기 | 0.0 | 292.58 |
업체명 | 소재지 지번주소 | 소재지 도로명주소 | 업종명 | 생산품 | 용지면적 | 건축면적 | |
---|---|---|---|---|---|---|---|
3482 | (주)한신 | 경기도 시흥시 공단1대로260번안길 3, 시화단지 3다 712호 (정왕동) | 경기도 시흥시 정왕동 1275-11번지 | 배전반 및 전기 자동제어반 제조업 외 2 종 | 부품가공, 전동피더 외 | 3322.8 | 2957.87 |
10389 | 한성공업사 | 경기도 시흥시 경기과기대로 145, 3라 204 (정왕동) | 경기도 시흥시 정왕동 1273-3번지 | 비주거용 건물 임대업 | 임대 | 3302.3 | 1740.51 |
10411 | 한신금속열처리 | 경기도 시흥시 경제로 296, 3마 301 (정왕동) | 경기도 시흥시 정왕동 1379번지 3마 301 | 금속 열처리업 | 자동차부품 | 0.0 | 502.0 |
4534 | 다온 | 경기도 시흥시 협력로 197, 정왕동 1240-1번지, 105동, 1다 202-4 (정왕동) | 경기도 시흥시 정왕동 1240-1번지 정왕동 1240-1번지, 105동, 1다 202-4 | 기타 가공 공작기계 제조업 | 제관용 용기 제작 기계 | 0.0 | 90.0 |
4340 | 기룡공업 | 경기도 시흥시 옥구천동로 230, (1255-14, 2나112-1) (정왕동) | 경기도 시흥시 정왕동 1255-14번지 (1255-14, 2나112-1) | 구조용 금속 판제품 및 공작물 제조업 | 산업구조물 | 0.0 | 168.0 |
4232 | 그린밸류(주) | 경기도 시흥시 서울대학로 59-69, 1003호(배곧동, 배곧테크노밸리) | 경기도 시흥시 배곧동 292-3 배곧테크노밸리 1003호 | 탭, 밸브 및 유사장치 제조업 외 1 종 | 밸브, 위생용플라스틱 제품 | 51.22 | 51.22 |
9538 | 천호테크 | 경기도 시흥시 공단1대로322번길 20, 3다 304호 (정왕동) | 경기도 시흥시 정왕동 1281-3번지 3다 304호 | 반도체 제조용 기계 제조업 | 반도체 장비 프레임 | 0.0 | 347.0 |
1719 | (주)에스아이멤브레인 | 경기도 시흥시 서해안로 242, 415호 (정왕동, 시화하이테크 아파트형공장) | 경기도 시흥시 정왕동 1234-7번지 시화하이테크 아파트형공장 415호 | 액체 여과기 제조업 | 수처리설비, 폐수처리장치 | 9918.7 | 22085.67 |
2270 | (주)월드씨앤지 | 경기도 시흥시 소망공원로 323, 4층 404 (정왕동) 4층 404호 | 경기도 시흥시 정왕동 1287-5번지 4층 404 4층 404호 | 금속 문, 창, 셔터 및 관련제품 제조업 | 금속 문, 창, 셔터 | 0.0 | 30.0 |
8638 | 일성테크 | 경기도 시흥시 공단1대로 152, 정왕동1258-13 (101호)(2다 203-1) (정왕동) | 경기도 시흥시 정왕동 1258-13번지 정왕동1258-13 (101호)(2다 203-1) | 절삭가공 및 유사처리업 | 부품절삭가공 | 0.0 | 34.0 |
Most frequently occurring
업체명 | 소재지 지번주소 | 소재지 도로명주소 | 업종명 | 생산품 | 용지면적 | 건축면적 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | (주)태진 | 경기도 시흥시 정왕동 번지 | 경기도 시흥시 정왕동 번지 | 금속 위생용품 제조업 외 9 종 | 핵반응기 및 증기발생기 제조업외 | 0.0 | 300.0 | 2 |
1 | 한아정밀 | 경기도 시흥시 마유로10번길 121, 시화공단 3바 519-8 (정왕동) | 경기도 시흥시 정왕동 2195-17번지 | 주형 및 금형 제조업 | 금형 | 0.0 | 165.0 | 2 |