Dataset statistics
Number of variables | 12 |
---|---|
Number of observations | 6844 |
Missing cells | 15 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 675.2 KiB |
Average record size in memory | 101.0 B |
Variable types
Numeric | 5 |
---|---|
Text | 4 |
Categorical | 3 |
Dataset
Description | 김해시의 공장기업 현황에 대한 데이터로 회사명, 단지명, 대표자명, 지식산업센터명, 공장대표주소, 남종업원, 여종업원, 외국인남자 종업원, 외국인여자 종업원, 업종번호, 업종명, 용도지역 정보를 제공합니다. |
---|---|
Author | 경상남도 김해시 |
URL | https://www.data.go.kr/data/15126955/fileData.do |
지식산업센터명 is highly overall correlated with 순번 and 5 other fields | High correlation |
용도지역 is highly overall correlated with 지식산업센터명 | High correlation |
순번 is highly overall correlated with 지식산업센터명 | High correlation |
남종업원 is highly overall correlated with 지식산업센터명 | High correlation |
여종업원 is highly overall correlated with 지식산업센터명 | High correlation |
(외남)종업원 is highly overall correlated with 지식산업센터명 | High correlation |
(외여)종업원 is highly overall correlated with 지식산업센터명 | High correlation |
단지명 is highly imbalanced (77.1%) | Imbalance |
지식산업센터명 is highly imbalanced (97.6%) | Imbalance |
(외여)종업원 is highly skewed (γ1 = 27.66399715) | Skewed |
순번 has unique values | Unique |
남종업원 has 87 (1.3%) zeros | Zeros |
여종업원 has 1361 (19.9%) zeros | Zeros |
(외남)종업원 has 6342 (92.7%) zeros | Zeros |
(외여)종업원 has 6744 (98.5%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-14 09:39:47.446185 |
---|---|
Analysis finished | 2024-03-14 09:39:56.341245 |
Duration | 8.9 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 6844 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3422.5 |
Minimum | 1 |
---|---|
Maximum | 6844 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 60.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 343.15 |
Q1 | 1711.75 |
median | 3422.5 |
Q3 | 5133.25 |
95-th percentile | 6501.85 |
Maximum | 6844 |
Range | 6843 |
Interquartile range (IQR) | 3421.5 |
Descriptive statistics
Standard deviation | 1975.837 |
---|---|
Coefficient of variation (CV) | 0.57730809 |
Kurtosis | -1.2 |
Mean | 3422.5 |
Median Absolute Deviation (MAD) | 1711 |
Skewness | 0 |
Sum | 23423590 |
Variance | 3903931.7 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
4573 | 1 | < 0.1% |
4571 | 1 | < 0.1% |
4570 | 1 | < 0.1% |
4569 | 1 | < 0.1% |
4568 | 1 | < 0.1% |
4567 | 1 | < 0.1% |
4566 | 1 | < 0.1% |
4565 | 1 | < 0.1% |
4564 | 1 | < 0.1% |
Other values (6834) | 6834 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
6844 | 1 | |
6843 | 1 | |
6842 | 1 | |
6841 | 1 | |
6840 | 1 | |
6839 | 1 | |
6838 | 1 | |
6837 | 1 | |
6836 | 1 | |
6835 | 1 |
회사명
Text
Distinct | 6193 |
---|---|
Distinct (%) | 90.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 53.6 KiB |
Length
Max length | 33 |
---|---|
Median length | 25 |
Mean length | 6.614699 |
Min length | 2 |
Characters and Unicode
Total characters | 45271 |
---|---|
Distinct characters | 639 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 5664 ? |
---|---|
Unique (%) | 82.8% |
Sample
1st row | 종삼벤드 |
---|---|
2nd row | ( 주)케이지앤에프 |
3rd row | (사)경남교통장애인협회 마산지회 |
4th row | (유)근영금속 |
5th row | (유)성문 |
Value | Count | Frequency (%) |
주식회사 | 364 | 5.0% |
tech | 12 | 0.2% |
농업회사법인 | 11 | 0.1% |
대성산업 | 7 | 0.1% |
영진산업 | 6 | 0.1% |
주)dcf | 6 | 0.1% |
trek | 6 | 0.1% |
대원산업 | 6 | 0.1% |
태성산업 | 6 | 0.1% |
김해지점 | 6 | 0.1% |
Other values (6224) | 6910 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 3922 | 8.7% |
) | 3431 | 7.6% |
( | 3431 | 7.6% |
업 | 1328 | 2.9% |
이 | 1178 | 2.6% |
산 | 1082 | 2.4% |
스 | 928 | 2.0% |
사 | 883 | 2.0% |
성 | 781 | 1.7% |
에 | 679 | 1.5% |
Other values (629) | 27628 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 36443 | |
Close Punctuation | 3431 | 7.6% |
Open Punctuation | 3431 | 7.6% |
Uppercase Letter | 1091 | 2.4% |
Space Separator | 504 | 1.1% |
Other Punctuation | 152 | 0.3% |
Lowercase Letter | 109 | 0.2% |
Decimal Number | 98 | 0.2% |
Dash Punctuation | 12 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 3922 | 10.8% |
업 | 1328 | 3.6% |
이 | 1178 | 3.2% |
산 | 1082 | 3.0% |
스 | 928 | 2.5% |
사 | 883 | 2.4% |
성 | 781 | 2.1% |
에 | 679 | 1.9% |
크 | 667 | 1.8% |
공 | 639 | 1.8% |
Other values (570) | 24356 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 119 | 10.9% |
S | 119 | 10.9% |
C | 99 | 9.1% |
T | 88 | 8.1% |
N | 83 | 7.6% |
G | 76 | 7.0% |
M | 58 | 5.3% |
H | 56 | 5.1% |
R | 42 | 3.8% |
P | 40 | 3.7% |
Other values (15) | 311 |
Lowercase Letter
Value | Count | Frequency (%) |
n | 14 | |
o | 11 | |
e | 10 | 9.2% |
t | 9 | 8.3% |
c | 8 | 7.3% |
s | 7 | 6.4% |
a | 7 | 6.4% |
g | 7 | 6.4% |
d | 6 | 5.5% |
y | 4 | 3.7% |
Other values (10) | 26 |
Other Punctuation
Value | Count | Frequency (%) |
. | 114 | |
& | 30 | 19.7% |
, | 5 | 3.3% |
/ | 2 | 1.3% |
: | 1 | 0.7% |
Decimal Number
Value | Count | Frequency (%) |
2 | 63 | |
1 | 21 | 21.4% |
3 | 10 | 10.2% |
4 | 3 | 3.1% |
5 | 1 | 1.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 3431 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3431 |
Space Separator
Value | Count | Frequency (%) |
504 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 36443 | |
Common | 7628 | 16.8% |
Latin | 1200 | 2.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 3922 | 10.8% |
업 | 1328 | 3.6% |
이 | 1178 | 3.2% |
산 | 1082 | 3.0% |
스 | 928 | 2.5% |
사 | 883 | 2.4% |
성 | 781 | 2.1% |
에 | 679 | 1.9% |
크 | 667 | 1.8% |
공 | 639 | 1.8% |
Other values (570) | 24356 |
Latin
Value | Count | Frequency (%) |
E | 119 | 9.9% |
S | 119 | 9.9% |
C | 99 | 8.2% |
T | 88 | 7.3% |
N | 83 | 6.9% |
G | 76 | 6.3% |
M | 58 | 4.8% |
H | 56 | 4.7% |
R | 42 | 3.5% |
P | 40 | 3.3% |
Other values (35) | 420 |
Common
Value | Count | Frequency (%) |
) | 3431 | |
( | 3431 | |
504 | 6.6% | |
. | 114 | 1.5% |
2 | 63 | 0.8% |
& | 30 | 0.4% |
1 | 21 | 0.3% |
- | 12 | 0.2% |
3 | 10 | 0.1% |
, | 5 | 0.1% |
Other values (4) | 7 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 36443 | |
ASCII | 8828 | 19.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 3922 | 10.8% |
업 | 1328 | 3.6% |
이 | 1178 | 3.2% |
산 | 1082 | 3.0% |
스 | 928 | 2.5% |
사 | 883 | 2.4% |
성 | 781 | 2.1% |
에 | 679 | 1.9% |
크 | 667 | 1.8% |
공 | 639 | 1.8% |
Other values (570) | 24356 |
ASCII
Value | Count | Frequency (%) |
) | 3431 | |
( | 3431 | |
504 | 5.7% | |
E | 119 | 1.3% |
S | 119 | 1.3% |
. | 114 | 1.3% |
C | 99 | 1.1% |
T | 88 | 1.0% |
N | 83 | 0.9% |
G | 76 | 0.9% |
Other values (49) | 764 | 8.7% |
단지명
Categorical
IMBALANCE
 
Distinct | 25 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 53.6 KiB |
<NA> | |
---|---|
김해테크노밸리일반산업단지 | 293 |
김해GoldenRoot일반산업단지 | 132 |
김해진영농공단지 | 71 |
서김해일반산업단지 | 55 |
Other values (20) | 384 |
Length
Max length | 18 |
---|---|
Median length | 4 |
Mean length | 5.0457335 |
Min length | 4 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | 김해AM하이테크일반산업단지 |
3rd row | <NA> |
4th row | <NA> |
5th row | 김해테크노밸리일반산업단지 |
Common Values
Value | Count | Frequency (%) |
<NA> | 5909 | |
김해테크노밸리일반산업단지 | 293 | 4.3% |
김해GoldenRoot일반산업단지 | 132 | 1.9% |
김해진영농공단지 | 71 | 1.0% |
서김해일반산업단지 | 55 | 0.8% |
김해안하농공단지 | 44 | 0.6% |
김해병동일반산업단지 | 38 | 0.6% |
김해나전농공단지 | 32 | 0.5% |
김해덕암일반산업단지 | 30 | 0.4% |
김해명동일반산업단지 | 29 | 0.4% |
Other values (15) | 211 | 3.1% |
Length
Value | Count | Frequency (%) |
na | 5909 | |
김해테크노밸리일반산업단지 | 293 | 4.3% |
김해goldenroot일반산업단지 | 132 | 1.9% |
김해진영농공단지 | 71 | 1.0% |
서김해일반산업단지 | 55 | 0.8% |
김해안하농공단지 | 44 | 0.6% |
김해병동일반산업단지 | 38 | 0.6% |
김해나전농공단지 | 32 | 0.5% |
김해덕암일반산업단지 | 30 | 0.4% |
김해명동일반산업단지 | 29 | 0.4% |
Other values (15) | 211 | 3.1% |
지식산업센터명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 53.6 KiB |
<NA> | |
---|---|
재단법인김해시차세대의생명융합산업지원센터 | 16 |
Length
Max length | 21 |
---|---|
Median length | 4 |
Mean length | 4.0397428 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 6828 | |
재단법인김해시차세대의생명융합산업지원센터 | 16 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 6828 | |
재단법인김해시차세대의생명융합산업지원센터 | 16 | 0.2% |
공장대표주소
Text
Distinct | 6073 |
---|---|
Distinct (%) | 88.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 53.6 KiB |
Length
Max length | 56 |
---|---|
Median length | 49 |
Mean length | 25.241525 |
Min length | 7 |
Characters and Unicode
Total characters | 172753 |
---|---|
Distinct characters | 267 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 5441 ? |
---|---|
Unique (%) | 79.5% |
Sample
1st row | 경상남도 김해시 진례면 담안리 1077-13번지 |
---|---|
2nd row | 경상남도 김해시 진례면 하이테크로 22 |
3rd row | 경상남도 김해시 주촌면 서부로1541번길 86-98 |
4th row | 경상남도 김해시 주촌면 서부로1701번안길 58-199 |
5th row | 경상남도 김해시 진례면 테크노밸리1로 123 |
Value | Count | Frequency (%) |
김해시 | 6842 | |
경상남도 | 6841 | |
한림면 | 1361 | 3.9% |
진례면 | 1110 | 3.2% |
주촌면 | 1073 | 3.1% |
진영읍 | 784 | 2.2% |
상동면 | 674 | 1.9% |
생림면 | 523 | 1.5% |
안동 | 242 | 0.7% |
어방동 | 200 | 0.6% |
Other values (4275) | 15406 |
Most occurring characters
Value | Count | Frequency (%) |
28319 | 16.4% | |
해 | 7853 | 4.5% |
김 | 7849 | 4.5% |
상 | 7838 | 4.5% |
1 | 7222 | 4.2% |
남 | 6855 | 4.0% |
시 | 6850 | 4.0% |
경 | 6849 | 4.0% |
도 | 6844 | 4.0% |
로 | 6231 | 3.6% |
Other values (257) | 80043 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 101742 | |
Decimal Number | 35851 | 20.8% |
Space Separator | 28319 | 16.4% |
Dash Punctuation | 3465 | 2.0% |
Open Punctuation | 1437 | 0.8% |
Close Punctuation | 1437 | 0.8% |
Other Punctuation | 298 | 0.2% |
Uppercase Letter | 182 | 0.1% |
Lowercase Letter | 22 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
해 | 7853 | 7.7% |
김 | 7849 | 7.7% |
상 | 7838 | 7.7% |
남 | 6855 | 6.7% |
시 | 6850 | 6.7% |
경 | 6849 | 6.7% |
도 | 6844 | 6.7% |
로 | 6231 | 6.1% |
면 | 4776 | 4.7% |
번 | 4336 | 4.3% |
Other values (221) | 35461 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 73 | |
L | 64 | |
A | 14 | 7.7% |
F | 9 | 4.9% |
E | 5 | 2.7% |
D | 4 | 2.2% |
I | 2 | 1.1% |
H | 2 | 1.1% |
S | 2 | 1.1% |
N | 2 | 1.1% |
Other values (4) | 5 | 2.7% |
Decimal Number
Value | Count | Frequency (%) |
1 | 7222 | |
2 | 4769 | |
3 | 4032 | |
4 | 3396 | |
5 | 3327 | |
6 | 3052 | |
9 | 2920 | |
7 | 2739 | 7.6% |
0 | 2340 | 6.5% |
8 | 2054 | 5.7% |
Lowercase Letter
Value | Count | Frequency (%) |
o | 6 | |
l | 5 | |
k | 3 | |
t | 3 | |
c | 3 | |
b | 2 | 9.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 295 | |
. | 3 | 1.0% |
Space Separator
Value | Count | Frequency (%) |
28319 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3465 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1437 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1437 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 101742 | |
Common | 70807 | |
Latin | 204 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
해 | 7853 | 7.7% |
김 | 7849 | 7.7% |
상 | 7838 | 7.7% |
남 | 6855 | 6.7% |
시 | 6850 | 6.7% |
경 | 6849 | 6.7% |
도 | 6844 | 6.7% |
로 | 6231 | 6.1% |
면 | 4776 | 4.7% |
번 | 4336 | 4.3% |
Other values (221) | 35461 |
Latin
Value | Count | Frequency (%) |
B | 73 | |
L | 64 | |
A | 14 | 6.9% |
F | 9 | 4.4% |
o | 6 | 2.9% |
l | 5 | 2.5% |
E | 5 | 2.5% |
D | 4 | 2.0% |
k | 3 | 1.5% |
t | 3 | 1.5% |
Other values (10) | 18 | 8.8% |
Common
Value | Count | Frequency (%) |
28319 | ||
1 | 7222 | 10.2% |
2 | 4769 | 6.7% |
3 | 4032 | 5.7% |
- | 3465 | 4.9% |
4 | 3396 | 4.8% |
5 | 3327 | 4.7% |
6 | 3052 | 4.3% |
9 | 2920 | 4.1% |
7 | 2739 | 3.9% |
Other values (6) | 7566 | 10.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 101742 | |
ASCII | 71011 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
28319 | ||
1 | 7222 | 10.2% |
2 | 4769 | 6.7% |
3 | 4032 | 5.7% |
- | 3465 | 4.9% |
4 | 3396 | 4.8% |
5 | 3327 | 4.7% |
6 | 3052 | 4.3% |
9 | 2920 | 4.1% |
7 | 2739 | 3.9% |
Other values (26) | 7770 | 10.9% |
Hangul
Value | Count | Frequency (%) |
해 | 7853 | 7.7% |
김 | 7849 | 7.7% |
상 | 7838 | 7.7% |
남 | 6855 | 6.7% |
시 | 6850 | 6.7% |
경 | 6849 | 6.7% |
도 | 6844 | 6.7% |
로 | 6231 | 6.1% |
면 | 4776 | 4.7% |
번 | 4336 | 4.3% |
Other values (221) | 35461 |
남종업원
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 118 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10.913793 |
Minimum | 0 |
---|---|
Maximum | 638 |
Zeros | 87 |
Zeros (%) | 1.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 60.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 6 |
Q3 | 11 |
95-th percentile | 33 |
Maximum | 638 |
Range | 638 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 21.696757 |
---|---|
Coefficient of variation (CV) | 1.9880125 |
Kurtosis | 351.16697 |
Mean | 10.913793 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 14.905901 |
Sum | 74694 |
Variance | 470.74925 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4 | 875 | |
3 | 693 | 10.1% |
2 | 600 | 8.8% |
5 | 538 | 7.9% |
9 | 492 | 7.2% |
1 | 407 | 5.9% |
6 | 375 | 5.5% |
7 | 338 | 4.9% |
10 | 313 | 4.6% |
8 | 312 | 4.6% |
Other values (108) | 1901 |
Value | Count | Frequency (%) |
0 | 87 | 1.3% |
1 | 407 | |
2 | 600 | |
3 | 693 | |
4 | 875 | |
5 | 538 | |
6 | 375 | |
7 | 338 | 4.9% |
8 | 312 | 4.6% |
9 | 492 |
Value | Count | Frequency (%) |
638 | 1 | |
625 | 1 | |
617 | 1 | |
486 | 1 | |
400 | 1 | |
285 | 1 | |
272 | 1 | |
254 | 1 | |
251 | 1 | |
238 | 1 |
여종업원
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 69 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.8834015 |
Minimum | 0 |
---|---|
Maximum | 300 |
Zeros | 1361 |
Zeros (%) | 19.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 60.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 10 |
Maximum | 300 |
Range | 300 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 9.0761546 |
---|---|
Coefficient of variation (CV) | 3.1477248 |
Kurtosis | 395.42987 |
Mean | 2.8834015 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 16.166841 |
Sum | 19734 |
Variance | 82.376583 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 3114 | |
0 | 1361 | |
2 | 814 | 11.9% |
3 | 417 | 6.1% |
4 | 245 | 3.6% |
5 | 203 | 3.0% |
6 | 96 | 1.4% |
10 | 94 | 1.4% |
7 | 88 | 1.3% |
8 | 69 | 1.0% |
Other values (59) | 343 | 5.0% |
Value | Count | Frequency (%) |
0 | 1361 | |
1 | 3114 | |
2 | 814 | 11.9% |
3 | 417 | 6.1% |
4 | 245 | 3.6% |
5 | 203 | 3.0% |
6 | 96 | 1.4% |
7 | 88 | 1.3% |
8 | 69 | 1.0% |
9 | 45 | 0.7% |
Value | Count | Frequency (%) |
300 | 1 | |
280 | 1 | |
196 | 1 | |
194 | 1 | |
150 | 1 | |
140 | 1 | |
138 | 1 | |
120 | 1 | |
107 | 1 | |
97 | 1 |
(외남)종업원
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 24 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.36177674 |
Minimum | 0 |
---|---|
Maximum | 40 |
Zeros | 6342 |
Zeros (%) | 92.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 60.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 2 |
Maximum | 40 |
Range | 40 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 1.7731266 |
---|---|
Coefficient of variation (CV) | 4.9011625 |
Kurtosis | 106.83986 |
Mean | 0.36177674 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 8.3633618 |
Sum | 2476 |
Variance | 3.1439779 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 6342 | |
1 | 95 | 1.4% |
2 | 84 | 1.2% |
3 | 60 | 0.9% |
4 | 55 | 0.8% |
6 | 41 | 0.6% |
5 | 38 | 0.6% |
7 | 28 | 0.4% |
8 | 26 | 0.4% |
10 | 22 | 0.3% |
Other values (14) | 53 | 0.8% |
Value | Count | Frequency (%) |
0 | 6342 | |
1 | 95 | 1.4% |
2 | 84 | 1.2% |
3 | 60 | 0.9% |
4 | 55 | 0.8% |
5 | 38 | 0.6% |
6 | 41 | 0.6% |
7 | 28 | 0.4% |
8 | 26 | 0.4% |
9 | 10 | 0.1% |
Value | Count | Frequency (%) |
40 | 1 | < 0.1% |
34 | 1 | < 0.1% |
31 | 1 | < 0.1% |
28 | 1 | < 0.1% |
26 | 1 | < 0.1% |
21 | 1 | < 0.1% |
18 | 1 | < 0.1% |
17 | 4 | |
15 | 4 | |
14 | 5 |
(외여)종업원
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 12 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 0.045149036 |
Minimum | 0 |
---|---|
Maximum | 30 |
Zeros | 6744 |
Zeros (%) | 98.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 60.3 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 0 |
95-th percentile | 0 |
Maximum | 30 |
Range | 30 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.58013399 |
---|---|
Coefficient of variation (CV) | 12.849311 |
Kurtosis | 1147.6491 |
Mean | 0.045149036 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 27.663997 |
Sum | 309 |
Variance | 0.33655545 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 6744 | |
1 | 41 | 0.6% |
2 | 24 | 0.4% |
3 | 10 | 0.1% |
5 | 6 | 0.1% |
6 | 4 | 0.1% |
4 | 4 | 0.1% |
11 | 3 | < 0.1% |
9 | 3 | < 0.1% |
8 | 2 | < 0.1% |
Other values (2) | 3 | < 0.1% |
Value | Count | Frequency (%) |
0 | 6744 | |
1 | 41 | 0.6% |
2 | 24 | 0.4% |
3 | 10 | 0.1% |
4 | 4 | 0.1% |
5 | 6 | 0.1% |
6 | 4 | 0.1% |
7 | 2 | < 0.1% |
8 | 2 | < 0.1% |
9 | 3 | < 0.1% |
Value | Count | Frequency (%) |
30 | 1 | < 0.1% |
11 | 3 | < 0.1% |
9 | 3 | < 0.1% |
8 | 2 | < 0.1% |
7 | 2 | < 0.1% |
6 | 4 | 0.1% |
5 | 6 | 0.1% |
4 | 4 | 0.1% |
3 | 10 | |
2 | 24 |
업종번호
Text
Distinct | 1640 |
---|---|
Distinct (%) | 24.0% |
Missing | 8 |
Missing (%) | 0.1% |
Memory size | 53.6 KiB |
Value | Count | Frequency (%) |
30399 | 621 | 4.1% |
30400 | 610 | 4.0% |
30391 | 515 | 3.4% |
30392 | 502 | 3.3% |
31114 | 472 | 3.1% |
25113 | 332 | 2.2% |
25999 | 259 | 1.7% |
29199 | 255 | 1.7% |
25114 | 250 | 1.6% |
29176 | 247 | 1.6% |
Other values (435) | 11265 |
Most occurring characters
Value | Count | Frequency (%) |
2 | 20518 | |
1 | 14277 | |
9 | 13325 | |
3 | 10363 | |
, | 8492 | |
8492 | ||
0 | 6865 | 7.3% |
4 | 3867 | 4.1% |
5 | 3760 | 4.0% |
6 | 1410 | 1.5% |
Other values (2) | 2255 | 2.4% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 76640 | |
Other Punctuation | 8492 | 9.1% |
Space Separator | 8492 | 9.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
2 | 20518 | |
1 | 14277 | |
9 | 13325 | |
3 | 10363 | |
0 | 6865 | 9.0% |
4 | 3867 | 5.0% |
5 | 3760 | 4.9% |
6 | 1410 | 1.8% |
7 | 1236 | 1.6% |
8 | 1019 | 1.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 8492 |
Space Separator
Value | Count | Frequency (%) |
8492 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 93624 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
2 | 20518 | |
1 | 14277 | |
9 | 13325 | |
3 | 10363 | |
, | 8492 | |
8492 | ||
0 | 6865 | 7.3% |
4 | 3867 | 4.1% |
5 | 3760 | 4.0% |
6 | 1410 | 1.5% |
Other values (2) | 2255 | 2.4% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 93624 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2 | 20518 | |
1 | 14277 | |
9 | 13325 | |
3 | 10363 | |
, | 8492 | |
8492 | ||
0 | 6865 | 7.3% |
4 | 3867 | 4.1% |
5 | 3760 | 4.0% |
6 | 1410 | 1.5% |
Other values (2) | 2255 | 2.4% |
업종명
Text
Distinct | 1135 |
---|---|
Distinct (%) | 16.6% |
Missing | 7 |
Missing (%) | 0.1% |
Memory size | 53.6 KiB |
Length
Max length | 34 |
---|---|
Median length | 28 |
Mean length | 17.28609 |
Min length | 3 |
Characters and Unicode
Total characters | 118185 |
---|---|
Distinct characters | 343 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 4 ? |
Unique
Unique | 575 ? |
---|---|
Unique (%) | 8.4% |
Sample
1st row | 선박 구성 부분품 제조업 |
---|---|
2nd row | 인삼식품 제조업 |
3rd row | 플라스틱 포대, 봉투 및 유사제품 제조업 |
4th row | 기타 비철금속 주조업 |
5th row | 선박 구성 부분품 제조업 |
Value | Count | Frequency (%) |
제조업 | 5990 | 16.2% |
외 | 4364 | 11.8% |
및 | 2493 | 6.7% |
기타 | 1908 | 5.2% |
1종 | 1579 | 4.3% |
그 | 1465 | 4.0% |
금속 | 796 | 2.2% |
신품 | 625 | 1.7% |
부품 | 622 | 1.7% |
자동차용 | 617 | 1.7% |
Other values (708) | 16487 |
Most occurring characters
Value | Count | Frequency (%) |
30112 | ||
제 | 7607 | 6.4% |
업 | 7102 | 6.0% |
조 | 7021 | 5.9% |
외 | 4466 | 3.8% |
기 | 4066 | 3.4% |
품 | 3134 | 2.7% |
종 | 2932 | 2.5% |
및 | 2493 | 2.1% |
용 | 2249 | 1.9% |
Other values (333) | 47003 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 84076 | |
Space Separator | 30112 | 25.5% |
Decimal Number | 3105 | 2.6% |
Other Punctuation | 716 | 0.6% |
Close Punctuation | 88 | 0.1% |
Open Punctuation | 88 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
제 | 7607 | 9.0% |
업 | 7102 | 8.4% |
조 | 7021 | 8.4% |
외 | 4466 | 5.3% |
기 | 4066 | 4.8% |
품 | 3134 | 3.7% |
종 | 2932 | 3.5% |
및 | 2493 | 3.0% |
용 | 2249 | 2.7% |
타 | 1939 | 2.3% |
Other values (317) | 41067 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1729 | |
3 | 525 | 16.9% |
2 | 414 | 13.3% |
4 | 170 | 5.5% |
5 | 91 | 2.9% |
6 | 61 | 2.0% |
8 | 35 | 1.1% |
9 | 27 | 0.9% |
0 | 27 | 0.9% |
7 | 26 | 0.8% |
Other Punctuation
Value | Count | Frequency (%) |
, | 699 | |
. | 16 | 2.2% |
· | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
30112 |
Close Punctuation
Value | Count | Frequency (%) |
) | 88 |
Open Punctuation
Value | Count | Frequency (%) |
( | 88 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 84076 | |
Common | 34109 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
제 | 7607 | 9.0% |
업 | 7102 | 8.4% |
조 | 7021 | 8.4% |
외 | 4466 | 5.3% |
기 | 4066 | 4.8% |
품 | 3134 | 3.7% |
종 | 2932 | 3.5% |
및 | 2493 | 3.0% |
용 | 2249 | 2.7% |
타 | 1939 | 2.3% |
Other values (317) | 41067 |
Common
Value | Count | Frequency (%) |
30112 | ||
1 | 1729 | 5.1% |
, | 699 | 2.0% |
3 | 525 | 1.5% |
2 | 414 | 1.2% |
4 | 170 | 0.5% |
5 | 91 | 0.3% |
) | 88 | 0.3% |
( | 88 | 0.3% |
6 | 61 | 0.2% |
Other values (6) | 132 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 84060 | |
ASCII | 34108 | |
Compat Jamo | 16 | < 0.1% |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
30112 | ||
1 | 1729 | 5.1% |
, | 699 | 2.0% |
3 | 525 | 1.5% |
2 | 414 | 1.2% |
4 | 170 | 0.5% |
5 | 91 | 0.3% |
) | 88 | 0.3% |
( | 88 | 0.3% |
6 | 61 | 0.2% |
Other values (5) | 131 | 0.4% |
Hangul
Value | Count | Frequency (%) |
제 | 7607 | 9.0% |
업 | 7102 | 8.4% |
조 | 7021 | 8.4% |
외 | 4466 | 5.3% |
기 | 4066 | 4.8% |
품 | 3134 | 3.7% |
종 | 2932 | 3.5% |
및 | 2493 | 3.0% |
용 | 2249 | 2.7% |
타 | 1939 | 2.3% |
Other values (316) | 41051 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 16 |
None
Value | Count | Frequency (%) |
· | 1 |
용도지역
Categorical
HIGH CORRELATION
 
Distinct | 26 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 53.6 KiB |
관리지역/계획관리지역 | |
---|---|
도시지역/공업지역/일반공업지역 | |
도시지역/공업지역/준공업지역 | |
관리지역 | |
관리지역/관리지역기타 | |
Other values (21) |
Length
Max length | 19 |
---|---|
Median length | 16 |
Mean length | 12.746201 |
Min length | 4 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 관리지역/계획관리지역 |
---|---|
2nd row | 관리지역/계획관리지역 |
3rd row | 도시지역/공업지역/준공업지역 |
4th row | 도시지역/주거지역/제2종일반주거지역 |
5th row | 도시지역/공업지역/일반공업지역 |
Common Values
Value | Count | Frequency (%) |
관리지역/계획관리지역 | 2224 | |
도시지역/공업지역/일반공업지역 | 1839 | |
도시지역/공업지역/준공업지역 | 707 | 10.3% |
관리지역 | 614 | 9.0% |
관리지역/관리지역기타 | 584 | 8.5% |
도시지역/녹지지역/자연녹지지역 | 394 | 5.8% |
도시지역/주거지역/제2종일반주거지역 | 246 | 3.6% |
도시지역/주거지역 | 64 | 0.9% |
도시지역/주거지역/준주거지역 | 52 | 0.8% |
도시지역/주거지역/제1종일반주거지역 | 26 | 0.4% |
Other values (16) | 94 | 1.4% |
Length
Value | Count | Frequency (%) |
관리지역/계획관리지역 | 2224 | |
도시지역/공업지역/일반공업지역 | 1839 | |
도시지역/공업지역/준공업지역 | 707 | 10.3% |
관리지역 | 614 | 9.0% |
관리지역/관리지역기타 | 584 | 8.5% |
도시지역/녹지지역/자연녹지지역 | 394 | 5.8% |
도시지역/주거지역/제2종일반주거지역 | 246 | 3.6% |
도시지역/주거지역 | 64 | 0.9% |
도시지역/주거지역/준주거지역 | 52 | 0.8% |
도시지역/주거지역/제1종일반주거지역 | 26 | 0.4% |
Other values (16) | 94 | 1.4% |
순번 | 단지명 | 남종업원 | 여종업원 | (외남)종업원 | (외여)종업원 | 용도지역 | |
---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.311 | 0.052 | 0.000 | 0.058 | 0.000 | 0.125 |
단지명 | 0.311 | 1.000 | 0.569 | 0.000 | 0.000 | 0.000 | 0.772 |
남종업원 | 0.052 | 0.569 | 1.000 | 0.658 | 0.184 | 0.088 | 0.000 |
여종업원 | 0.000 | 0.000 | 0.658 | 1.000 | 0.393 | 0.505 | 0.000 |
(외남)종업원 | 0.058 | 0.000 | 0.184 | 0.393 | 1.000 | 0.811 | 0.000 |
(외여)종업원 | 0.000 | 0.000 | 0.088 | 0.505 | 0.811 | 1.000 | 0.000 |
용도지역 | 0.125 | 0.772 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
단지명 | 지식산업센터명 | 용도지역 | |
---|---|---|---|
단지명 | 1.000 | NaN | 0.427 |
지식산업센터명 | NaN | 1.000 | 1.000 |
용도지역 | 0.427 | 1.000 | 1.000 |
순번 | 남종업원 | 여종업원 | (외남)종업원 | (외여)종업원 | 단지명 | 지식산업센터명 | 용도지역 | |
---|---|---|---|---|---|---|---|---|
순번 | 1.000 | -0.208 | -0.132 | -0.030 | -0.017 | 0.118 | 1.000 | 0.044 |
남종업원 | -0.208 | 1.000 | 0.486 | 0.171 | 0.063 | 0.263 | 1.000 | 0.000 |
여종업원 | -0.132 | 0.486 | 1.000 | 0.179 | 0.133 | 0.000 | 1.000 | 0.000 |
(외남)종업원 | -0.030 | 0.171 | 0.179 | 1.000 | 0.323 | 0.000 | 1.000 | 0.000 |
(외여)종업원 | -0.017 | 0.063 | 0.133 | 0.323 | 1.000 | 0.022 | 1.000 | 0.000 |
단지명 | 0.118 | 0.263 | 0.000 | 0.000 | 0.022 | 1.000 | NaN | 0.427 |
지식산업센터명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
용도지역 | 0.044 | 0.000 | 0.000 | 0.000 | 0.000 | 0.427 | 1.000 | 1.000 |
순번 | 회사명 | 단지명 | 지식산업센터명 | 공장대표주소 | 남종업원 | 여종업원 | (외남)종업원 | (외여)종업원 | 업종번호 | 업종명 | 용도지역 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 종삼벤드 | <NA> | <NA> | 경상남도 김해시 진례면 담안리 1077-13번지 | 4 | 3 | 0 | 0 | 31114 | 선박 구성 부분품 제조업 | 관리지역/계획관리지역 |
1 | 2 | ( 주)케이지앤에프 | 김해AM하이테크일반산업단지 | <NA> | 경상남도 김해시 진례면 하이테크로 22 | 9 | 29 | 0 | 3 | 10795 | 인삼식품 제조업 | 관리지역/계획관리지역 |
2 | 3 | (사)경남교통장애인협회 마산지회 | <NA> | <NA> | 경상남도 김해시 주촌면 서부로1541번길 86-98 | 5 | 0 | 0 | 0 | 22231 | 플라스틱 포대, 봉투 및 유사제품 제조업 | 도시지역/공업지역/준공업지역 |
3 | 4 | (유)근영금속 | <NA> | <NA> | 경상남도 김해시 주촌면 서부로1701번안길 58-199 | 10 | 1 | 0 | 0 | 24329 | 기타 비철금속 주조업 | 도시지역/주거지역/제2종일반주거지역 |
4 | 5 | (유)성문 | 김해테크노밸리일반산업단지 | <NA> | 경상남도 김해시 진례면 테크노밸리1로 123 | 10 | 0 | 0 | 0 | 31114 | 선박 구성 부분품 제조업 | 도시지역/공업지역/일반공업지역 |
5 | 6 | (유)성문 김해지점 | 김해테크노밸리일반산업단지 | <NA> | 경상남도 김해시 진례면 테크노밸리1로 122, (유)성문 | 49 | 5 | 0 | 0 | 31114 | 선박 구성 부분품 제조업 | 도시지역/공업지역/일반공업지역 |
6 | 7 | (유)성문 김해지점2공장 | 김해테크노밸리일반산업단지 | <NA> | 경상남도 김해시 진례면 테크노밸리로 77-32, 성문 | 0 | 0 | 0 | 0 | 31114 | 선박 구성 부분품 제조업 | 도시지역/공업지역/일반공업지역 |
7 | 8 | (유)아이티더블유건화 | 김해병동농공단지 | <NA> | 경상남도 김해시 한림면 김해대로916번길 154-19 | 28 | 9 | 0 | 0 | 30399, 30391, 30392, 30400 | 그 외 자동차용 신품 부품 제조업 외 3종 | 관리지역/계획관리지역 |
8 | 9 | (유)영동레미콘 | <NA> | <NA> | 경상남도 김해시 상동면 상동로 862-79 | 4 | 1 | 0 | 0 | 23993 | 비금속광물 분쇄물 생산업 | 관리지역/계획관리지역 |
9 | 10 | (유)유성강재 | <NA> | <NA> | 경상남도 김해시 상동면 상동로685번길 53-2 (총 3 필지) | 10 | 2 | 0 | 0 | 24111 | 제철업 | 관리지역/관리지역기타 |
순번 | 회사명 | 단지명 | 지식산업센터명 | 공장대표주소 | 남종업원 | 여종업원 | (외남)종업원 | (외여)종업원 | 업종번호 | 업종명 | 용도지역 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
6834 | 6835 | 희락푸드(주) | <NA> | <NA> | 경상남도 김해시 주촌면 서부로1295번길 97-9 | 2 | 3 | 0 | 0 | 10129, 10122, 10301, 10302 | 육류 기타 가공 및 저장처리업 (가금류 제외) 외 3종 | 도시지역/주거지역 |
6835 | 6836 | 희망기업 | 김해테크노밸리일반산업단지 | <NA> | 경상남도 김해시 진례면 테크노밸리1로 13 | 4 | 3 | 0 | 0 | 25912 | 금속 단조제품 제조업 | 도시지역/공업지역/일반공업지역 |
6836 | 6837 | 희망복지영남방송(주) | <NA> | <NA> | 경상남도 김해시 한림면 김해대로916번길 40-58 | 4 | 1 | 0 | 0 | 28519, 29172, 29173, 29174, 29175 | 기타 가정용 전기기기 제조업 외 4종 | 관리지역/계획관리지역 |
6837 | 6838 | 희석종합식품 | <NA> | <NA> | 경상남도 김해시 분성로627번길 53-8 (삼방동) | 3 | 0 | 0 | 0 | 10713 | 과자류 및 코코아 제품 제조업 | 도시지역/공업지역/일반공업지역 |
6838 | 6839 | 희성산업 | <NA> | <NA> | 경상남도 김해시 진례면 고모로442번길 52-1 | 5 | 0 | 0 | 0 | 28123 | 배전반 및 전기 자동제어반 제조업 | 관리지역/계획관리지역 |
6839 | 6840 | 희성산업 | <NA> | <NA> | 경상남도 김해시 진례면 고모로442번길 71-1 (총 2 필지) | 4 | 1 | 0 | 0 | 31114, 29111, 29119, 29133, 29141, 29142, 29210, 29223 | 선박 구성 부분품 제조업 외 7종 | 관리지역/계획관리지역 |
6840 | 6841 | 희성섬유 | <NA> | <NA> | 경상남도 김해시 상동면 매리 1045-외1번지 | 2 | 0 | 0 | 0 | 13999 | 그 외 기타 분류 안된 섬유제품 제조업 | 관리지역/관리지역기타 |
6841 | 6842 | 희원산업기계 | <NA> | <NA> | 경상남도 김해시 김해대로2694번길 13-60 (지내동) | 5 | 2 | 0 | 0 | 29229 | 기타 가공 공작기계 제조업 | 도시지역/공업지역/일반공업지역 |
6842 | 6843 | 희창섬유 | <NA> | <NA> | 경상남도 김해시 상동면 동북로437번길 153-12 | 3 | 3 | 0 | 0 | 13109 | 기타 방적업 | 관리지역/계획관리지역 |
6843 | 6844 | 히팅테크 | <NA> | <NA> | 경상남도 김해시 진례면 고모로324번길 103-65 | 2 | 2 | 0 | 0 | 29150, 28511, 28512, 28520 | 산업용 오븐, 노 및 노용 버너 제조업 외 3종 | 관리지역/계획관리지역 |