Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 6911 |
Missing cells | 11083 |
Missing cells (%) | 17.8% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 499.6 KiB |
Average record size in memory | 74.0 B |
Variable types
Text | 6 |
---|---|
Numeric | 2 |
Categorical | 1 |
Dataset
Description | 반월국가산업단지 입주기업 정보에 대한 데이터로 공장명, 주소, 업종명, 연락처, 종업원수, 기업구분, 총원, 생산품명, 생산품분류를 제공합니다. |
---|---|
Author | 경기도 안산시 |
URL | https://www.data.go.kr/data/15112512/fileData.do |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
종업원수 is highly overall correlated with 총원 and 1 other fields | High correlation |
총원 is highly overall correlated with 종업원수 | High correlation |
기업구분 is highly overall correlated with 종업원수 | High correlation |
기업구분 is highly imbalanced (81.8%) | Imbalance |
연락처 has 1244 (18.0%) missing values | Missing |
종업원수 has 1681 (24.3%) missing values | Missing |
총원 has 5996 (86.8%) missing values | Missing |
생산품분류 has 2121 (30.7%) missing values | Missing |
총원 has 125 (1.8%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 13:32:19.741700 |
---|---|
Analysis finished | 2023-12-12 13:32:22.349227 |
Duration | 2.61 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
공장명
Text
Distinct | 6346 |
---|---|
Distinct (%) | 91.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 54.1 KiB |
Value | Count | Frequency (%) |
주식회사 | 156 | 2.1% |
tech | 26 | 0.4% |
2공장 | 17 | 0.2% |
제2공장 | 15 | 0.2% |
안산공장 | 13 | 0.2% |
안산지점 | 8 | 0.1% |
eng | 7 | 0.1% |
안산2공장 | 7 | 0.1% |
지점 | 6 | 0.1% |
주)해성아이다 | 6 | 0.1% |
Other values (6389) | 7051 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 4271 | 9.0% |
( | 4097 | 8.7% |
) | 4096 | 8.7% |
이 | 1771 | 3.8% |
스 | 1485 | 3.1% |
에 | 991 | 2.1% |
크 | 900 | 1.9% |
테 | 840 | 1.8% |
업 | 611 | 1.3% |
지 | 606 | 1.3% |
Other values (659) | 27535 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 37267 | |
Open Punctuation | 4097 | 8.7% |
Close Punctuation | 4097 | 8.7% |
Uppercase Letter | 975 | 2.1% |
Space Separator | 402 | 0.9% |
Lowercase Letter | 135 | 0.3% |
Decimal Number | 114 | 0.2% |
Other Punctuation | 89 | 0.2% |
Dash Punctuation | 19 | < 0.1% |
Other Symbol | 7 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 4271 | 11.5% |
이 | 1771 | 4.8% |
스 | 1485 | 4.0% |
에 | 991 | 2.7% |
크 | 900 | 2.4% |
테 | 840 | 2.3% |
업 | 611 | 1.6% |
지 | 606 | 1.6% |
아 | 567 | 1.5% |
성 | 563 | 1.5% |
Other values (595) | 24662 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 109 | 11.2% |
S | 96 | 9.8% |
T | 84 | 8.6% |
C | 79 | 8.1% |
N | 77 | 7.9% |
G | 59 | 6.1% |
M | 57 | 5.8% |
H | 56 | 5.7% |
A | 44 | 4.5% |
P | 39 | 4.0% |
Other values (15) | 275 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 25 | |
n | 16 | |
c | 14 | |
t | 11 | |
o | 11 | |
i | 9 | 6.7% |
h | 9 | 6.7% |
r | 8 | 5.9% |
a | 7 | 5.2% |
l | 5 | 3.7% |
Other values (9) | 20 |
Decimal Number
Value | Count | Frequency (%) |
2 | 70 | |
1 | 18 | 15.8% |
3 | 13 | 11.4% |
0 | 3 | 2.6% |
4 | 3 | 2.6% |
6 | 3 | 2.6% |
7 | 2 | 1.8% |
5 | 1 | 0.9% |
9 | 1 | 0.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 58 | |
& | 28 | |
, | 2 | 2.2% |
/ | 1 | 1.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 4096 | |
) | 1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 4097 |
Space Separator
Value | Count | Frequency (%) |
402 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 19 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 7 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 37274 | |
Common | 8819 | 18.7% |
Latin | 1110 | 2.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 4271 | 11.5% |
이 | 1771 | 4.8% |
스 | 1485 | 4.0% |
에 | 991 | 2.7% |
크 | 900 | 2.4% |
테 | 840 | 2.3% |
업 | 611 | 1.6% |
지 | 606 | 1.6% |
아 | 567 | 1.5% |
성 | 563 | 1.5% |
Other values (596) | 24669 |
Latin
Value | Count | Frequency (%) |
E | 109 | 9.8% |
S | 96 | 8.6% |
T | 84 | 7.6% |
C | 79 | 7.1% |
N | 77 | 6.9% |
G | 59 | 5.3% |
M | 57 | 5.1% |
H | 56 | 5.0% |
A | 44 | 4.0% |
P | 39 | 3.5% |
Other values (34) | 410 |
Common
Value | Count | Frequency (%) |
( | 4097 | |
) | 4096 | |
402 | 4.6% | |
2 | 70 | 0.8% |
. | 58 | 0.7% |
& | 28 | 0.3% |
- | 19 | 0.2% |
1 | 18 | 0.2% |
3 | 13 | 0.1% |
0 | 3 | < 0.1% |
Other values (9) | 15 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 37267 | |
ASCII | 9928 | 21.0% |
None | 8 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 4271 | 11.5% |
이 | 1771 | 4.8% |
스 | 1485 | 4.0% |
에 | 991 | 2.7% |
크 | 900 | 2.4% |
테 | 840 | 2.3% |
업 | 611 | 1.6% |
지 | 606 | 1.6% |
아 | 567 | 1.5% |
성 | 563 | 1.5% |
Other values (595) | 24662 |
ASCII
Value | Count | Frequency (%) |
( | 4097 | |
) | 4096 | |
402 | 4.0% | |
E | 109 | 1.1% |
S | 96 | 1.0% |
T | 84 | 0.8% |
C | 79 | 0.8% |
N | 77 | 0.8% |
2 | 70 | 0.7% |
G | 59 | 0.6% |
Other values (52) | 759 | 7.6% |
None
Value | Count | Frequency (%) |
㈜ | 7 | |
) | 1 | 12.5% |
주소
Text
Distinct | 5866 |
---|---|
Distinct (%) | 85.0% |
Missing | 12 |
Missing (%) | 0.2% |
Memory size | 54.1 KiB |
Length
Max length | 94 |
---|---|
Median length | 71 |
Mean length | 37.866212 |
Min length | 16 |
Characters and Unicode
Total characters | 261239 |
---|---|
Distinct characters | 427 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 5290 ? |
---|---|
Unique (%) | 76.7% |
Sample
1st row | 경기도 안산시 단원구 해안로 77, 505-10 (목내동) |
---|---|
2nd row | 경기도 안산시 단원구 산단로67번길 134, (16-3-1) (목내동) |
3rd row | 경기도 안산시 단원구 엠티브이12로21번길 18, 시화MTV 4사 106호 (성곡동) |
4th row | 경기도 안산시 단원구 동산로27번길 15,(11B-2L) (원시동) |
5th row | 경기도 안산시 단원구 신원로 314, 디동 (454-1, 16B 19L) (목내동) |
Value | Count | Frequency (%) |
경기도 | 6895 | 12.7% |
안산시 | 6851 | 12.6% |
단원구 | 6436 | 11.8% |
성곡동 | 2463 | 4.5% |
원시동 | 1419 | 2.6% |
신길동 | 1015 | 1.9% |
산단로 | 957 | 1.8% |
목내동 | 873 | 1.6% |
별망로 | 482 | 0.9% |
상록구 | 415 | 0.8% |
Other values (4698) | 26568 |
Most occurring characters
Value | Count | Frequency (%) |
47633 | 18.2% | |
1 | 9451 | 3.6% |
산 | 9418 | 3.6% |
시 | 9188 | 3.5% |
원 | 8871 | 3.4% |
단 | 8513 | 3.3% |
동 | 8348 | 3.2% |
( | 7922 | 3.0% |
) | 7921 | 3.0% |
안 | 7899 | 3.0% |
Other values (417) | 136075 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 136334 | |
Decimal Number | 48337 | 18.5% |
Space Separator | 47633 | 18.2% |
Open Punctuation | 7956 | 3.0% |
Close Punctuation | 7955 | 3.0% |
Other Punctuation | 7232 | 2.8% |
Uppercase Letter | 2887 | 1.1% |
Dash Punctuation | 2668 | 1.0% |
Letter Number | 181 | 0.1% |
Math Symbol | 31 | < 0.1% |
Other values (2) | 25 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 9418 | 6.9% |
시 | 9188 | 6.7% |
원 | 8871 | 6.5% |
단 | 8513 | 6.2% |
동 | 8348 | 6.1% |
안 | 7899 | 5.8% |
기 | 7182 | 5.3% |
도 | 7006 | 5.1% |
경 | 6949 | 5.1% |
구 | 6903 | 5.1% |
Other values (365) | 56057 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 758 | |
T | 439 | |
B | 335 | |
R | 301 | 10.4% |
K | 296 | 10.3% |
F | 178 | 6.2% |
M | 143 | 5.0% |
V | 130 | 4.5% |
L | 126 | 4.4% |
C | 50 | 1.7% |
Other values (11) | 131 | 4.5% |
Decimal Number
Value | Count | Frequency (%) |
1 | 9451 | |
2 | 6589 | |
0 | 5275 | |
3 | 5057 | |
4 | 4536 | |
5 | 4499 | |
6 | 3982 | |
7 | 3573 | 7.4% |
8 | 2897 | 6.0% |
9 | 2478 | 5.1% |
Lowercase Letter
Value | Count | Frequency (%) |
v | 6 | |
t | 6 | |
m | 6 | |
f | 3 | |
c | 2 | 8.3% |
n | 1 | 4.2% |
Other Punctuation
Value | Count | Frequency (%) |
, | 7223 | |
. | 5 | 0.1% |
/ | 2 | < 0.1% |
& | 1 | < 0.1% |
· | 1 | < 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 7922 | |
[ | 34 | 0.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 7921 | |
] | 34 | 0.4% |
Letter Number
Value | Count | Frequency (%) |
Ⅲ | 180 | |
Ⅰ | 1 | 0.6% |
Space Separator
Value | Count | Frequency (%) |
47633 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2668 |
Math Symbol
Value | Count | Frequency (%) |
~ | 31 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 136334 | |
Common | 121813 | |
Latin | 3092 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 9418 | 6.9% |
시 | 9188 | 6.7% |
원 | 8871 | 6.5% |
단 | 8513 | 6.2% |
동 | 8348 | 6.1% |
안 | 7899 | 5.8% |
기 | 7182 | 5.3% |
도 | 7006 | 5.1% |
경 | 6949 | 5.1% |
구 | 6903 | 5.1% |
Other values (365) | 56057 |
Latin
Value | Count | Frequency (%) |
A | 758 | |
T | 439 | |
B | 335 | |
R | 301 | 9.7% |
K | 296 | 9.6% |
Ⅲ | 180 | 5.8% |
F | 178 | 5.8% |
M | 143 | 4.6% |
V | 130 | 4.2% |
L | 126 | 4.1% |
Other values (19) | 206 | 6.7% |
Common
Value | Count | Frequency (%) |
47633 | ||
1 | 9451 | 7.8% |
( | 7922 | 6.5% |
) | 7921 | 6.5% |
, | 7223 | 5.9% |
2 | 6589 | 5.4% |
0 | 5275 | 4.3% |
3 | 5057 | 4.2% |
4 | 4536 | 3.7% |
5 | 4499 | 3.7% |
Other values (13) | 15707 | 12.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 136334 | |
ASCII | 124723 | |
Number Forms | 181 | 0.1% |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
47633 | ||
1 | 9451 | 7.6% |
( | 7922 | 6.4% |
) | 7921 | 6.4% |
, | 7223 | 5.8% |
2 | 6589 | 5.3% |
0 | 5275 | 4.2% |
3 | 5057 | 4.1% |
4 | 4536 | 3.6% |
5 | 4499 | 3.6% |
Other values (39) | 18617 | 14.9% |
Hangul
Value | Count | Frequency (%) |
산 | 9418 | 6.9% |
시 | 9188 | 6.7% |
원 | 8871 | 6.5% |
단 | 8513 | 6.2% |
동 | 8348 | 6.1% |
안 | 7899 | 5.8% |
기 | 7182 | 5.3% |
도 | 7006 | 5.1% |
경 | 6949 | 5.1% |
구 | 6903 | 5.1% |
Other values (365) | 56057 |
Number Forms
Value | Count | Frequency (%) |
Ⅲ | 180 | |
Ⅰ | 1 | 0.6% |
None
Value | Count | Frequency (%) |
· | 1 |
업종명
Text
Distinct | 1755 |
---|---|
Distinct (%) | 25.5% |
Missing | 22 |
Missing (%) | 0.3% |
Memory size | 54.1 KiB |
Length
Max length | 605 |
---|---|
Median length | 287 |
Mean length | 27.467121 |
Min length | 3 |
Characters and Unicode
Total characters | 189221 |
---|---|
Distinct characters | 353 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 1318 ? |
---|---|
Unique (%) | 19.1% |
Sample
1st row | 그 외 기타 1차 철강 제조업 |
---|---|
2nd row | 자동차 재제조 부품 제조업,절삭가공 및 유사처리업,그 외 기타 금속가공업,자동차 엔진용 신품 부품 제조업 |
3rd row | 인쇄회로기판용 적층판 제조업 |
4th row | 주형 및 금형 제조업 |
5th row | 자동차용 신품 제동장치 제조업,그 외 자동차용 신품 부품 제조업,자동차용 신품 조향장치 및 현가 장치 제조업,자동차 재제조 부품 제조업 |
Value | Count | Frequency (%) |
제조업 | 5654 | 11.9% |
및 | 4967 | 10.4% |
기타 | 3247 | 6.8% |
외 | 1872 | 3.9% |
그 | 1085 | 2.3% |
인쇄회로기판 | 1042 | 2.2% |
제조업,그 | 735 | 1.5% |
금속 | 713 | 1.5% |
기계 | 687 | 1.4% |
전기 | 619 | 1.3% |
Other values (1145) | 26931 |
Most occurring characters
Value | Count | Frequency (%) |
40663 | ||
제 | 13536 | 7.2% |
업 | 12779 | 6.8% |
조 | 12211 | 6.5% |
기 | 9761 | 5.2% |
, | 6643 | 3.5% |
및 | 4967 | 2.6% |
타 | 3705 | 2.0% |
용 | 3332 | 1.8% |
품 | 3162 | 1.7% |
Other values (343) | 78462 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 141509 | |
Space Separator | 40663 | 21.5% |
Other Punctuation | 6741 | 3.6% |
Decimal Number | 266 | 0.1% |
Close Punctuation | 21 | < 0.1% |
Open Punctuation | 21 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
제 | 13536 | 9.6% |
업 | 12779 | 9.0% |
조 | 12211 | 8.6% |
기 | 9761 | 6.9% |
및 | 4967 | 3.5% |
타 | 3705 | 2.6% |
용 | 3332 | 2.4% |
품 | 3162 | 2.2% |
장 | 2588 | 1.8% |
판 | 2419 | 1.7% |
Other values (337) | 73049 |
Other Punctuation
Value | Count | Frequency (%) |
, | 6643 | |
. | 98 | 1.5% |
Space Separator
Value | Count | Frequency (%) |
40663 |
Decimal Number
Value | Count | Frequency (%) |
1 | 266 |
Close Punctuation
Value | Count | Frequency (%) |
) | 21 |
Open Punctuation
Value | Count | Frequency (%) |
( | 21 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 141509 | |
Common | 47712 | 25.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
제 | 13536 | 9.6% |
업 | 12779 | 9.0% |
조 | 12211 | 8.6% |
기 | 9761 | 6.9% |
및 | 4967 | 3.5% |
타 | 3705 | 2.6% |
용 | 3332 | 2.4% |
품 | 3162 | 2.2% |
장 | 2588 | 1.8% |
판 | 2419 | 1.7% |
Other values (337) | 73049 |
Common
Value | Count | Frequency (%) |
40663 | ||
, | 6643 | 13.9% |
1 | 266 | 0.6% |
. | 98 | 0.2% |
) | 21 | < 0.1% |
( | 21 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 141473 | |
ASCII | 47712 | 25.2% |
Compat Jamo | 36 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
40663 | ||
, | 6643 | 13.9% |
1 | 266 | 0.6% |
. | 98 | 0.2% |
) | 21 | < 0.1% |
( | 21 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
제 | 13536 | 9.6% |
업 | 12779 | 9.0% |
조 | 12211 | 8.6% |
기 | 9761 | 6.9% |
및 | 4967 | 3.5% |
타 | 3705 | 2.6% |
용 | 3332 | 2.4% |
품 | 3162 | 2.2% |
장 | 2588 | 1.8% |
판 | 2419 | 1.7% |
Other values (336) | 73013 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 36 |
연락처
Text
MISSING
 
Distinct | 5081 |
---|---|
Distinct (%) | 89.7% |
Missing | 1244 |
Missing (%) | 18.0% |
Memory size | 54.1 KiB |
Length
Max length | 13 |
---|---|
Median length | 12 |
Mean length | 12.019234 |
Min length | 8 |
Characters and Unicode
Total characters | 68113 |
---|---|
Distinct characters | 14 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 4588 ? |
---|---|
Unique (%) | 81.0% |
Sample
1st row | 031-491-6400 |
---|---|
2nd row | 031-494-5511 |
3rd row | 031-508-0504 |
4th row | 031-826-0954 |
5th row | 031-491-8665 |
Value | Count | Frequency (%) |
031-490-7294 | 5 | 0.1% |
031-408-6987 | 5 | 0.1% |
031-493-8555 | 5 | 0.1% |
031-493-6561 | 5 | 0.1% |
031-480-3849 | 4 | 0.1% |
031-415-3653 | 4 | 0.1% |
031-492-9315 | 4 | 0.1% |
031-491-3536 | 4 | 0.1% |
031-494-2222 | 4 | 0.1% |
031-432-2121 | 4 | 0.1% |
Other values (5071) | 5623 |
Most occurring characters
Value | Count | Frequency (%) |
- | 11274 | |
0 | 9989 | |
3 | 9789 | |
1 | 9311 | |
4 | 6969 | |
9 | 5151 | |
8 | 3514 | 5.2% |
5 | 3328 | 4.9% |
2 | 3206 | 4.7% |
7 | 3081 | 4.5% |
Other values (4) | 2501 | 3.7% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 56830 | |
Dash Punctuation | 11274 | 16.6% |
Uppercase Letter | 9 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 9989 | |
3 | 9789 | |
1 | 9311 | |
4 | 6969 | |
9 | 5151 | |
8 | 3514 | 6.2% |
5 | 3328 | 5.9% |
2 | 3206 | 5.6% |
7 | 3081 | 5.4% |
6 | 2492 | 4.4% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 3 | |
R | 3 | |
S | 3 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 11274 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 68104 | |
Latin | 9 | < 0.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 11274 | |
0 | 9989 | |
3 | 9789 | |
1 | 9311 | |
4 | 6969 | |
9 | 5151 | |
8 | 3514 | 5.2% |
5 | 3328 | 4.9% |
2 | 3206 | 4.7% |
7 | 3081 | 4.5% |
Latin
Value | Count | Frequency (%) |
A | 3 | |
R | 3 | |
S | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 68113 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 11274 | |
0 | 9989 | |
3 | 9789 | |
1 | 9311 | |
4 | 6969 | |
9 | 5151 | |
8 | 3514 | 5.2% |
5 | 3328 | 4.9% |
2 | 3206 | 4.7% |
7 | 3081 | 4.5% |
Other values (4) | 2501 | 3.7% |
종업원수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 209 |
---|---|
Distinct (%) | 4.0% |
Missing | 1681 |
Missing (%) | 24.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 21.304015 |
Minimum | 0 |
---|---|
Maximum | 1500 |
Zeros | 64 |
Zeros (%) | 0.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 60.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 2 |
Q1 | 4 |
median | 8 |
Q3 | 18 |
95-th percentile | 80 |
Maximum | 1500 |
Range | 1500 |
Interquartile range (IQR) | 14 |
Descriptive statistics
Standard deviation | 54.544913 |
---|---|
Coefficient of variation (CV) | 2.5603114 |
Kurtosis | 194.25454 |
Mean | 21.304015 |
Median Absolute Deviation (MAD) | 5 |
Skewness | 10.915748 |
Sum | 111420 |
Variance | 2975.1476 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2 | 453 | 6.6% |
3 | 452 | 6.5% |
4 | 441 | 6.4% |
5 | 419 | 6.1% |
6 | 331 | 4.8% |
7 | 262 | 3.8% |
8 | 211 | 3.1% |
10 | 198 | 2.9% |
9 | 165 | 2.4% |
1 | 148 | 2.1% |
Other values (199) | 2150 | |
(Missing) | 1681 |
Value | Count | Frequency (%) |
0 | 64 | 0.9% |
1 | 148 | 2.1% |
2 | 453 | |
3 | 452 | |
4 | 441 | |
5 | 419 | |
6 | 331 | |
7 | 262 | |
8 | 211 | |
9 | 165 | 2.4% |
Value | Count | Frequency (%) |
1500 | 1 | |
1200 | 1 | |
870 | 1 | |
775 | 1 | |
741 | 2 | |
621 | 1 | |
580 | 1 | |
579 | 1 | |
559 | 1 | |
554 | 1 |
기업구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 54.1 KiB |
소기업 | |
---|---|
중기업 | 388 |
대기업 | 31 |
<NA> | 7 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0010129 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 소기업 |
---|---|
2nd row | 소기업 |
3rd row | 중기업 |
4th row | 소기업 |
5th row | 소기업 |
Common Values
Value | Count | Frequency (%) |
소기업 | 6485 | |
중기업 | 388 | 5.6% |
대기업 | 31 | 0.4% |
<NA> | 7 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
소기업 | 6485 | |
중기업 | 388 | 5.6% |
대기업 | 31 | 0.4% |
na | 7 | 0.1% |
총원
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 155 |
---|---|
Distinct (%) | 16.9% |
Missing | 5996 |
Missing (%) | 86.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 44.697268 |
Minimum | 0 |
---|---|
Maximum | 4000 |
Zeros | 125 |
Zeros (%) | 1.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 60.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 5 |
median | 13 |
Q3 | 38 |
95-th percentile | 166.7 |
Maximum | 4000 |
Range | 4000 |
Interquartile range (IQR) | 33 |
Descriptive statistics
Standard deviation | 159.87564 |
---|---|
Coefficient of variation (CV) | 3.5768549 |
Kurtosis | 414.67026 |
Mean | 44.697268 |
Median Absolute Deviation (MAD) | 11 |
Skewness | 17.680004 |
Sum | 40898 |
Variance | 25560.22 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 125 | 1.8% |
5 | 52 | 0.8% |
6 | 41 | 0.6% |
4 | 36 | 0.5% |
10 | 34 | 0.5% |
3 | 31 | 0.4% |
8 | 30 | 0.4% |
7 | 27 | 0.4% |
9 | 23 | 0.3% |
20 | 22 | 0.3% |
Other values (145) | 494 | 7.1% |
(Missing) | 5996 |
Value | Count | Frequency (%) |
0 | 125 | |
1 | 7 | 0.1% |
2 | 12 | 0.2% |
3 | 31 | 0.4% |
4 | 36 | 0.5% |
5 | 52 | |
6 | 41 | 0.6% |
7 | 27 | 0.4% |
8 | 30 | 0.4% |
9 | 23 | 0.3% |
Value | Count | Frequency (%) |
4000 | 1 | |
1100 | 1 | |
974 | 1 | |
773 | 1 | |
638 | 1 | |
597 | 1 | |
579 | 1 | |
577 | 1 | |
559 | 1 | |
556 | 1 |
생산품명
Text
Distinct | 4802 |
---|---|
Distinct (%) | 69.6% |
Missing | 7 |
Missing (%) | 0.1% |
Memory size | 54.1 KiB |
Length
Max length | 66 |
---|---|
Median length | 54 |
Mean length | 8.1777231 |
Min length | 1 |
Characters and Unicode
Total characters | 56459 |
---|---|
Distinct characters | 753 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 4340 ? |
---|---|
Unique (%) | 62.9% |
Sample
1st row | 방음벽 지주, 태양광 골조자재 |
---|---|
2nd row | 모터축, 자동차 엔진용부품 등, 전자, 자동차부품 CNC 절삭가공 |
3rd row | FPCB 실장 |
4th row | 금형 |
5th row | 자동차부품 |
Value | Count | Frequency (%) |
및 | 287 | 2.5% |
인쇄회로기판 | 268 | 2.3% |
등 | 225 | 1.9% |
pcb | 169 | 1.5% |
부품 | 162 | 1.4% |
금형 | 149 | 1.3% |
자동차부품 | 149 | 1.3% |
기계부품 | 139 | 1.2% |
전자부품 | 136 | 1.2% |
외 | 121 | 1.0% |
Other values (5285) | 9821 |
Most occurring characters
Value | Count | Frequency (%) |
4729 | 8.4% | |
기 | 2573 | 4.6% |
, | 2137 | 3.8% |
품 | 1791 | 3.2% |
부 | 1349 | 2.4% |
자 | 1272 | 2.3% |
동 | 991 | 1.8% |
제 | 985 | 1.7% |
전 | 956 | 1.7% |
장 | 874 | 1.5% |
Other values (743) | 38802 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 44828 | |
Space Separator | 4729 | 8.4% |
Uppercase Letter | 2868 | 5.1% |
Other Punctuation | 2197 | 3.9% |
Lowercase Letter | 1002 | 1.8% |
Close Punctuation | 364 | 0.6% |
Open Punctuation | 363 | 0.6% |
Decimal Number | 74 | 0.1% |
Dash Punctuation | 32 | 0.1% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 2573 | 5.7% |
품 | 1791 | 4.0% |
부 | 1349 | 3.0% |
자 | 1272 | 2.8% |
동 | 991 | 2.2% |
제 | 985 | 2.2% |
전 | 956 | 2.1% |
장 | 874 | 1.9% |
스 | 871 | 1.9% |
금 | 815 | 1.8% |
Other values (667) | 32351 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 449 | |
P | 406 | |
B | 304 | |
E | 215 | 7.5% |
L | 208 | 7.3% |
D | 188 | 6.6% |
F | 125 | 4.4% |
S | 122 | 4.3% |
T | 113 | 3.9% |
A | 107 | 3.7% |
Other values (16) | 631 |
Lowercase Letter
Value | Count | Frequency (%) |
c | 99 | 9.9% |
e | 98 | 9.8% |
p | 90 | 9.0% |
r | 81 | 8.1% |
o | 75 | 7.5% |
b | 70 | 7.0% |
i | 65 | 6.5% |
t | 62 | 6.2% |
l | 56 | 5.6% |
a | 56 | 5.6% |
Other values (15) | 250 |
Decimal Number
Value | Count | Frequency (%) |
2 | 19 | |
1 | 19 | |
3 | 15 | |
0 | 10 | |
6 | 4 | 5.4% |
8 | 2 | 2.7% |
5 | 2 | 2.7% |
7 | 1 | 1.4% |
9 | 1 | 1.4% |
4 | 1 | 1.4% |
Other Punctuation
Value | Count | Frequency (%) |
, | 2137 | |
. | 26 | 1.2% |
/ | 25 | 1.1% |
' | 3 | 0.1% |
· | 3 | 0.1% |
% | 2 | 0.1% |
& | 1 | < 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 362 | |
] | 2 | 0.5% |
Open Punctuation
Value | Count | Frequency (%) |
( | 361 | |
[ | 2 | 0.6% |
Space Separator
Value | Count | Frequency (%) |
4729 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 32 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 44828 | |
Common | 7761 | 13.7% |
Latin | 3870 | 6.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 2573 | 5.7% |
품 | 1791 | 4.0% |
부 | 1349 | 3.0% |
자 | 1272 | 2.8% |
동 | 991 | 2.2% |
제 | 985 | 2.2% |
전 | 956 | 2.1% |
장 | 874 | 1.9% |
스 | 871 | 1.9% |
금 | 815 | 1.8% |
Other values (667) | 32351 |
Latin
Value | Count | Frequency (%) |
C | 449 | 11.6% |
P | 406 | 10.5% |
B | 304 | 7.9% |
E | 215 | 5.6% |
L | 208 | 5.4% |
D | 188 | 4.9% |
F | 125 | 3.2% |
S | 122 | 3.2% |
T | 113 | 2.9% |
A | 107 | 2.8% |
Other values (41) | 1633 |
Common
Value | Count | Frequency (%) |
4729 | ||
, | 2137 | |
) | 362 | 4.7% |
( | 361 | 4.7% |
- | 32 | 0.4% |
. | 26 | 0.3% |
/ | 25 | 0.3% |
2 | 19 | 0.2% |
1 | 19 | 0.2% |
3 | 15 | 0.2% |
Other values (15) | 36 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 44828 | |
ASCII | 11628 | 20.6% |
None | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4729 | ||
, | 2137 | |
C | 449 | 3.9% |
P | 406 | 3.5% |
) | 362 | 3.1% |
( | 361 | 3.1% |
B | 304 | 2.6% |
E | 215 | 1.8% |
L | 208 | 1.8% |
D | 188 | 1.6% |
Other values (65) | 2269 |
Hangul
Value | Count | Frequency (%) |
기 | 2573 | 5.7% |
품 | 1791 | 4.0% |
부 | 1349 | 3.0% |
자 | 1272 | 2.8% |
동 | 991 | 2.2% |
제 | 985 | 2.2% |
전 | 956 | 2.1% |
장 | 874 | 1.9% |
스 | 871 | 1.9% |
금 | 815 | 1.8% |
Other values (667) | 32351 |
None
Value | Count | Frequency (%) |
· | 3 |
생산품분류
Text
MISSING
 
Distinct | 710 |
---|---|
Distinct (%) | 14.8% |
Missing | 2121 |
Missing (%) | 30.7% |
Memory size | 54.1 KiB |
Length
Max length | 40 |
---|---|
Median length | 34 |
Mean length | 8.0286013 |
Min length | 2 |
Characters and Unicode
Total characters | 38457 |
---|---|
Distinct characters | 218 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 478 ? |
---|---|
Unique (%) | 10.0% |
Sample
1st row | 건축 또는 건축용 재료,조명기기 |
---|---|
2nd row | 자동차 및 자동차부품,동력기계 |
3rd row | 가구,전기통신기계 |
4th row | 계측제어분석기 |
5th row | 자동차 및 자동차부품 |
Value | Count | Frequency (%) |
및 | 1089 | 12.8% |
집적회로 | 311 | 3.7% |
반도체 | 299 | 3.5% |
또는 | 275 | 3.2% |
건축용 | 275 | 3.2% |
화학품 | 274 | 3.2% |
자동차 | 267 | 3.1% |
자동차부품 | 253 | 3.0% |
컴퓨터 | 245 | 2.9% |
계측제어분석기 | 244 | 2.9% |
Other values (750) | 4986 |
Most occurring characters
Value | Count | Frequency (%) |
기 | 3942 | 10.3% |
3728 | 9.7% | |
, | 1520 | 4.0% |
계 | 1519 | 3.9% |
품 | 1373 | 3.6% |
및 | 1139 | 3.0% |
용 | 992 | 2.6% |
동 | 968 | 2.5% |
제 | 893 | 2.3% |
자 | 853 | 2.2% |
Other values (208) | 21530 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 32934 | |
Space Separator | 3728 | 9.7% |
Other Punctuation | 1793 | 4.7% |
Uppercase Letter | 1 | < 0.1% |
Decimal Number | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 3942 | 12.0% |
계 | 1519 | 4.6% |
품 | 1373 | 4.2% |
및 | 1139 | 3.5% |
용 | 992 | 3.0% |
동 | 968 | 2.9% |
제 | 893 | 2.7% |
자 | 853 | 2.6% |
전 | 841 | 2.6% |
료 | 727 | 2.2% |
Other values (203) | 19687 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1520 | |
/ | 273 | 15.2% |
Space Separator
Value | Count | Frequency (%) |
3728 |
Uppercase Letter
Value | Count | Frequency (%) |
D | 1 |
Decimal Number
Value | Count | Frequency (%) |
3 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 32934 | |
Common | 5522 | 14.4% |
Latin | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 3942 | 12.0% |
계 | 1519 | 4.6% |
품 | 1373 | 4.2% |
및 | 1139 | 3.5% |
용 | 992 | 3.0% |
동 | 968 | 2.9% |
제 | 893 | 2.7% |
자 | 853 | 2.6% |
전 | 841 | 2.6% |
료 | 727 | 2.2% |
Other values (203) | 19687 |
Common
Value | Count | Frequency (%) |
3728 | ||
, | 1520 | |
/ | 273 | 4.9% |
3 | 1 | < 0.1% |
Latin
Value | Count | Frequency (%) |
D | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 32934 | |
ASCII | 5523 | 14.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
기 | 3942 | 12.0% |
계 | 1519 | 4.6% |
품 | 1373 | 4.2% |
및 | 1139 | 3.5% |
용 | 992 | 3.0% |
동 | 968 | 2.9% |
제 | 893 | 2.7% |
자 | 853 | 2.6% |
전 | 841 | 2.6% |
료 | 727 | 2.2% |
Other values (203) | 19687 |
ASCII
Value | Count | Frequency (%) |
3728 | ||
, | 1520 | |
/ | 273 | 4.9% |
D | 1 | < 0.1% |
3 | 1 | < 0.1% |
종업원수 | 기업구분 | 총원 | |
---|---|---|---|
종업원수 | 1.000 | 0.711 | 0.759 |
기업구분 | 0.711 | 1.000 | 0.412 |
총원 | 0.759 | 0.412 | 1.000 |
종업원수 | 총원 | 기업구분 | |
---|---|---|---|
종업원수 | 1.000 | 0.662 | 0.601 |
총원 | 0.662 | 1.000 | 0.404 |
기업구분 | 0.601 | 0.404 | 1.000 |
공장명 | 주소 | 업종명 | 연락처 | 종업원수 | 기업구분 | 총원 | 생산품명 | 생산품분류 | |
---|---|---|---|---|---|---|---|---|---|
0 | (주)BMB산업 | 경기도 안산시 단원구 해안로 77, 505-10 (목내동) | 그 외 기타 1차 철강 제조업 | 031-491-6400 | 10 | 소기업 | 18 | 방음벽 지주, 태양광 골조자재 | 건축 또는 건축용 재료,조명기기 |
1 | (주)ICP | 경기도 안산시 단원구 산단로67번길 134, (16-3-1) (목내동) | 자동차 재제조 부품 제조업,절삭가공 및 유사처리업,그 외 기타 금속가공업,자동차 엔진용 신품 부품 제조업 | 031-494-5511 | 30 | 소기업 | 14 | 모터축, 자동차 엔진용부품 등, 전자, 자동차부품 CNC 절삭가공 | 자동차 및 자동차부품,동력기계 |
2 | (주)거림 | 경기도 안산시 단원구 엠티브이12로21번길 18, 시화MTV 4사 106호 (성곡동) | 인쇄회로기판용 적층판 제조업 | 031-508-0504 | 7 | 중기업 | 115 | FPCB 실장 | 가구,전기통신기계 |
3 | (주)건우정공 | 경기도 안산시 단원구 동산로27번길 15,(11B-2L) (원시동) | 주형 및 금형 제조업 | 031-826-0954 | 31 | 소기업 | 42 | 금형 | 계측제어분석기 |
4 | (주)건우정밀 | 경기도 안산시 단원구 신원로 314, 디동 (454-1, 16B 19L) (목내동) | 자동차용 신품 제동장치 제조업,그 외 자동차용 신품 부품 제조업,자동차용 신품 조향장치 및 현가 장치 제조업,자동차 재제조 부품 제조업 | 031-491-8665 | 4 | 소기업 | 4 | 자동차부품 | 자동차 및 자동차부품 |
5 | (주)경안파이프 | 경기도 안산시 단원구 번영로94번길 29, 시화공단 4마 403호 (성곡동) | 강관 가공품 및 관 연결구류 제조업,강관 제조업 | 031-432-6060 | 27 | 소기업 | 27 | 구조관파이프 | 건축 또는 건축용 재료 |
6 | (주)경인양행 | 경기도 안산시 단원구 산단로 26, (10-64) (원시동) | 염료, 조제 무기안료, 유연제 및 기타 착색제 제조업 | 031-491-0111 | 68 | 중기업 | 68 | 염료 | 염료, 안료, 도료 |
7 | (주)고려제지인쇄사업부 | 경기도 안산시 단원구 번영2로 23, 시화단지 4다 707호 (성곡동) 외 1필지 | 적층, 합성 및 특수표면처리 종이 제조업,오프셋 인쇄업,기타 인쇄업 | 031-497-0084 | 26 | 소기업 | 0 | 도공라이너지, 인쇄품 | 의료위생용품,인쇄 및 제본기계 |
8 | (주)고려중전기 | 경기도 안산시 단원구 산단로 112-15, 10블럭 (원시동) | 전동기 및 발전기 제조업 | 031-492-8431 | 8 | 소기업 | 8 | 전기모터,발전기 | 발전기 및 모터 |
9 | (주)고려호이스트 | 경기도 안산시 단원구 엠티브이4로 42, MTV 8사 201호 (목내동, 고려호이스트 공장) | 기타 물품 취급장비 제조업 | 031-431-6030 | 70 | 중기업 | 71 | 호이스트, 크레인 | 운반하역기계 |
공장명 | 주소 | 업종명 | 연락처 | 종업원수 | 기업구분 | 총원 | 생산품명 | 생산품분류 | |
---|---|---|---|---|---|---|---|---|---|
6901 | 흙광고기획 | 경기도 안산시 단원구 화정천서로 523, 101호(선부동) | 간판 및 광고물 제조업,전시 및 광고용 조명장치 제조업 | 031-416-0563 | <NA> | 소기업 | <NA> | 사인물, 아크릴, 실사현수막 | <NA> |
6902 | 흥상산업 | 경기도 안산시 단원구 능안로 81 (신길동, 안산디지털파크) | <NA> | <NA> | 1 | 소기업 | <NA> | 건물임대 | 건축 또는 건축용 재료 |
6903 | 흥성사료(주) | 경기도 안산시 단원구 산단로35번길 141, 17블럭 (목내동) | 배합 사료 제조업,단미 사료 및 기타 사료 제조업 | 031-493-1321 | 71 | 중기업 | <NA> | 배합사료 | 식물성물질/재료 |
6904 | 흥아기업상공(주) | 경기도 안산시 단원구 강촌로139번길 78, 21블럭 (성곡동) | 포장용 플라스틱 성형용기 제조업 | 031-491-0604 | 4 | 중기업 | <NA> | 프라스틱바구니 | 주방용품 |
6905 | 흥진정밀 | 경기도 안산시 단원구 진흥로10번길 26, 5바 904-2호 (성곡동) | 산업처리공정 제어장비 제조업 | 031-488-8750 | 4 | 소기업 | <NA> | 자동화설비 부품 | 컴퓨터 |
6906 | 희다이아몬드 | 경기도 안산시 단원구 산단로 107, 서흥테크노밸리313호 (원시동) | 비동력식 수공구 제조업 | 031-508-9642 | 1 | 소기업 | <NA> | 연삭공구 | 주조 및 금속가공기계 |
6907 | 희상 | 경기도 안산시 단원구 산단로 341, 808호(13-11) (신길동) | 그 외 기타 의료용 기기 제조업 | 031-492-0781 | 2 | 소기업 | <NA> | 뜸봉 | <NA> |
6908 | 희승정밀 | 경기도 안산시 단원구 별망로79번길 25, (성곡동) | 주형 및 금형 제조업 | <NA> | 2 | 소기업 | <NA> | 금형제작 및 가공 | <NA> |
6909 | 희진엠앤에프 | 경기도 안산시 단원구 해봉로273번길 27, 1049-6번지 (신길동) | 연성 및 기타 인쇄회로기판 제조업,인쇄회로기판용 적층판 제조업,경성 인쇄회로기판 제조업 | <NA> | <NA> | 소기업 | <NA> | PCB | <NA> |
6910 | 희창산업 | 경기도 안산시 단원구 산단로20번길 98, 9블럭 (초지동) | 톱 및 호환성 공구 제조업 | 031-495-5228 | 3 | 소기업 | <NA> | 공구 | 주조 및 금속가공기계 |
Most frequently occurring
공장명 | 주소 | 업종명 | 연락처 | 종업원수 | 기업구분 | 총원 | 생산품명 | 생산품분류 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|
0 | (주)스탠다드엔지니어링 | 경기도 안산시 단원구 첨단로 679 (초지동) | 산업용 오븐, 노 및 노용 버너 제조업 | 031-494-0750 | 11 | 소기업 | <NA> | 모듈 | <NA> | 2 |