Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 4877 |
Missing cells | 29296 |
Missing cells (%) | 46.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 533.6 KiB |
Average record size in memory | 112.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 5 |
Unsupported | 5 |
Dataset
Description | 부산광역시 강서구 내 공장등록 현황에 대한 데이터로 회사명, 주소, 업종, 종업원수, 생산품 등의 항목을 제공합니다. |
---|---|
Author | 부산광역시 강서구 |
URL | https://www.data.go.kr/data/15051978/fileData.do |
Unnamed: 12 has constant value "" | Constant |
Unnamed: 7 has 4877 (100.0%) missing values | Missing |
Unnamed: 8 has 4877 (100.0%) missing values | Missing |
Unnamed: 9 has 4877 (100.0%) missing values | Missing |
Unnamed: 10 has 4877 (100.0%) missing values | Missing |
Unnamed: 11 has 4877 (100.0%) missing values | Missing |
Unnamed: 12 has 4876 (> 99.9%) missing values | Missing |
종업원수 is highly skewed (γ1 = 37.1642917) | Skewed |
순번 has unique values | Unique |
Unnamed: 7 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 8 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 10 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 11 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
종업원수 has 231 (4.7%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 12:05:47.291288 |
---|---|
Analysis finished | 2023-12-12 12:05:50.204099 |
Duration | 2.91 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
UNIQUE
 
Distinct | 4877 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2439.2678 |
Minimum | 1 |
---|---|
Maximum | 4878 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 43.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 244.8 |
Q1 | 1220 |
median | 2439 |
Q3 | 3659 |
95-th percentile | 4634.2 |
Maximum | 4878 |
Range | 4877 |
Interquartile range (IQR) | 2439 |
Descriptive statistics
Standard deviation | 1408.3526 |
---|---|
Coefficient of variation (CV) | 0.57736697 |
Kurtosis | -1.1999772 |
Mean | 2439.2678 |
Median Absolute Deviation (MAD) | 1220 |
Skewness | 0.00038816694 |
Sum | 11896309 |
Variance | 1983457.2 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
3250 | 1 | < 0.1% |
3257 | 1 | < 0.1% |
3256 | 1 | < 0.1% |
3255 | 1 | < 0.1% |
3254 | 1 | < 0.1% |
3253 | 1 | < 0.1% |
3252 | 1 | < 0.1% |
3251 | 1 | < 0.1% |
3249 | 1 | < 0.1% |
Other values (4867) | 4867 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
4878 | 1 | |
4877 | 1 | |
4876 | 1 | |
4875 | 1 | |
4874 | 1 | |
4873 | 1 | |
4872 | 1 | |
4871 | 1 | |
4870 | 1 | |
4869 | 1 |
회사명
Text
Distinct | 4369 |
---|---|
Distinct (%) | 89.6% |
Missing | 2 |
Missing (%) | < 0.1% |
Memory size | 38.2 KiB |
Value | Count | Frequency (%) |
주식회사 | 274 | 5.1% |
제2공장 | 12 | 0.2% |
녹산공장 | 9 | 0.2% |
2공장 | 9 | 0.2% |
주)성광벤드 | 7 | 0.1% |
부산공장 | 7 | 0.1% |
주 | 7 | 0.1% |
리노공업(주 | 6 | 0.1% |
유한회사 | 6 | 0.1% |
사단법인 | 5 | 0.1% |
Other values (4437) | 5023 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 2602 | 7.9% |
) | 2330 | 7.1% |
( | 2327 | 7.1% |
이 | 850 | 2.6% |
스 | 704 | 2.1% |
업 | 686 | 2.1% |
산 | 618 | 1.9% |
사 | 596 | 1.8% |
성 | 510 | 1.6% |
506 | 1.5% | |
Other values (582) | 21103 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 26615 | |
Close Punctuation | 2330 | 7.1% |
Open Punctuation | 2327 | 7.1% |
Uppercase Letter | 819 | 2.5% |
Space Separator | 506 | 1.5% |
Other Punctuation | 117 | 0.4% |
Lowercase Letter | 65 | 0.2% |
Decimal Number | 52 | 0.2% |
Other Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 2602 | 9.8% |
이 | 850 | 3.2% |
스 | 704 | 2.6% |
업 | 686 | 2.6% |
산 | 618 | 2.3% |
사 | 596 | 2.2% |
성 | 510 | 1.9% |
에 | 483 | 1.8% |
기 | 463 | 1.7% |
공 | 449 | 1.7% |
Other values (522) | 18654 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 107 | |
C | 80 | 9.8% |
G | 76 | 9.3% |
N | 74 | 9.0% |
S | 71 | 8.7% |
T | 66 | 8.1% |
M | 39 | 4.8% |
H | 33 | 4.0% |
K | 32 | 3.9% |
A | 32 | 3.9% |
Other values (16) | 209 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 10 | |
t | 8 | |
o | 7 | |
c | 7 | |
n | 6 | |
d | 4 | 6.2% |
a | 4 | 6.2% |
h | 4 | 6.2% |
i | 3 | 4.6% |
k | 2 | 3.1% |
Other values (7) | 10 |
Decimal Number
Value | Count | Frequency (%) |
2 | 34 | |
1 | 10 | 19.2% |
3 | 3 | 5.8% |
6 | 1 | 1.9% |
0 | 1 | 1.9% |
5 | 1 | 1.9% |
9 | 1 | 1.9% |
4 | 1 | 1.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 80 | |
& | 22 | 18.8% |
, | 10 | 8.5% |
/ | 4 | 3.4% |
& | 1 | 0.9% |
Close Punctuation
Value | Count | Frequency (%) |
) | 2330 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2327 |
Space Separator
Value | Count | Frequency (%) |
506 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 26616 | |
Common | 5332 | 16.2% |
Latin | 884 | 2.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 2602 | 9.8% |
이 | 850 | 3.2% |
스 | 704 | 2.6% |
업 | 686 | 2.6% |
산 | 618 | 2.3% |
사 | 596 | 2.2% |
성 | 510 | 1.9% |
에 | 483 | 1.8% |
기 | 463 | 1.7% |
공 | 449 | 1.7% |
Other values (523) | 18655 |
Latin
Value | Count | Frequency (%) |
E | 107 | 12.1% |
C | 80 | 9.0% |
G | 76 | 8.6% |
N | 74 | 8.4% |
S | 71 | 8.0% |
T | 66 | 7.5% |
M | 39 | 4.4% |
H | 33 | 3.7% |
K | 32 | 3.6% |
A | 32 | 3.6% |
Other values (33) | 274 |
Common
Value | Count | Frequency (%) |
) | 2330 | |
( | 2327 | |
506 | 9.5% | |
. | 80 | 1.5% |
2 | 34 | 0.6% |
& | 22 | 0.4% |
, | 10 | 0.2% |
1 | 10 | 0.2% |
/ | 4 | 0.1% |
3 | 3 | 0.1% |
Other values (6) | 6 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 26614 | |
ASCII | 6215 | 18.9% |
None | 2 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 2602 | 9.8% |
이 | 850 | 3.2% |
스 | 704 | 2.6% |
업 | 686 | 2.6% |
산 | 618 | 2.3% |
사 | 596 | 2.2% |
성 | 510 | 1.9% |
에 | 483 | 1.8% |
기 | 463 | 1.7% |
공 | 449 | 1.7% |
Other values (521) | 18653 |
ASCII
Value | Count | Frequency (%) |
) | 2330 | |
( | 2327 | |
506 | 8.1% | |
E | 107 | 1.7% |
C | 80 | 1.3% |
. | 80 | 1.3% |
G | 76 | 1.2% |
N | 74 | 1.2% |
S | 71 | 1.1% |
T | 66 | 1.1% |
Other values (48) | 498 | 8.0% |
None
Value | Count | Frequency (%) |
& | 1 | |
㈜ | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 1 |
종업원수
Real number (ℝ)
SKEWED
  ZEROS
 
Distinct | 156 |
---|---|
Distinct (%) | 3.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 16.53291 |
Minimum | 0 |
---|---|
Maximum | 4572 |
Zeros | 231 |
Zeros (%) | 4.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 43.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 6 |
Q3 | 14 |
95-th percentile | 48 |
Maximum | 4572 |
Range | 4572 |
Interquartile range (IQR) | 11 |
Descriptive statistics
Standard deviation | 93.485793 |
---|---|
Coefficient of variation (CV) | 5.6545276 |
Kurtosis | 1602.485 |
Mean | 16.53291 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 37.164292 |
Sum | 80631 |
Variance | 8739.5935 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
5 | 448 | 9.2% |
3 | 442 | 9.1% |
4 | 431 | 8.8% |
2 | 397 | 8.1% |
1 | 291 | 6.0% |
6 | 282 | 5.8% |
7 | 232 | 4.8% |
0 | 231 | 4.7% |
10 | 213 | 4.4% |
8 | 191 | 3.9% |
Other values (146) | 1719 |
Value | Count | Frequency (%) |
0 | 231 | |
1 | 291 | |
2 | 397 | |
3 | 442 | |
4 | 431 | |
5 | 448 | |
6 | 282 | |
7 | 232 | |
8 | 191 | |
9 | 162 | 3.3% |
Value | Count | Frequency (%) |
4572 | 1 | |
3471 | 1 | |
2213 | 1 | |
782 | 1 | |
710 | 1 | |
500 | 1 | |
479 | 1 | |
451 | 1 | |
410 | 1 | |
370 | 1 |
생산품
Text
Distinct | 3685 |
---|---|
Distinct (%) | 75.6% |
Missing | 5 |
Missing (%) | 0.1% |
Memory size | 38.2 KiB |
Value | Count | Frequency (%) |
등 | 271 | 3.2% |
및 | 225 | 2.6% |
부품 | 149 | 1.7% |
자동차부품 | 113 | 1.3% |
밸브 | 102 | 1.2% |
금형 | 95 | 1.1% |
자동차 | 88 | 1.0% |
선박용 | 84 | 1.0% |
외 | 78 | 0.9% |
산업기계 | 62 | 0.7% |
Other values (3934) | 7262 |
Most occurring characters
Value | Count | Frequency (%) |
3719 | 9.5% | |
, | 1523 | 3.9% |
기 | 1502 | 3.9% |
품 | 1241 | 3.2% |
부 | 934 | 2.4% |
자 | 728 | 1.9% |
용 | 587 | 1.5% |
스 | 580 | 1.5% |
동 | 536 | 1.4% |
공 | 496 | 1.3% |
Other values (681) | 27129 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31252 | |
Space Separator | 3719 | 9.5% |
Other Punctuation | 1557 | 4.0% |
Uppercase Letter | 1188 | 3.0% |
Lowercase Letter | 820 | 2.1% |
Close Punctuation | 196 | 0.5% |
Open Punctuation | 196 | 0.5% |
Decimal Number | 35 | 0.1% |
Dash Punctuation | 10 | < 0.1% |
Connector Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 1502 | 4.8% |
품 | 1241 | 4.0% |
부 | 934 | 3.0% |
자 | 728 | 2.3% |
용 | 587 | 1.9% |
스 | 580 | 1.9% |
동 | 536 | 1.7% |
공 | 496 | 1.6% |
선 | 488 | 1.6% |
전 | 480 | 1.5% |
Other values (609) | 23680 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 143 | |
L | 101 | 8.5% |
P | 91 | 7.7% |
A | 86 | 7.2% |
C | 84 | 7.1% |
S | 69 | 5.8% |
D | 68 | 5.7% |
R | 68 | 5.7% |
T | 64 | 5.4% |
O | 63 | 5.3% |
Other values (15) | 351 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 111 | |
t | 76 | 9.3% |
r | 61 | 7.4% |
i | 61 | 7.4% |
a | 60 | 7.3% |
l | 57 | 7.0% |
o | 56 | 6.8% |
s | 56 | 6.8% |
n | 43 | 5.2% |
p | 32 | 3.9% |
Other values (14) | 207 |
Decimal Number
Value | Count | Frequency (%) |
1 | 10 | |
2 | 6 | |
0 | 6 | |
5 | 4 | 11.4% |
9 | 2 | 5.7% |
8 | 2 | 5.7% |
4 | 2 | 5.7% |
3 | 2 | 5.7% |
6 | 1 | 2.9% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1523 | |
/ | 14 | 0.9% |
. | 11 | 0.7% |
· | 2 | 0.1% |
' | 2 | 0.1% |
% | 2 | 0.1% |
" | 2 | 0.1% |
& | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
3719 |
Close Punctuation
Value | Count | Frequency (%) |
) | 196 |
Open Punctuation
Value | Count | Frequency (%) |
( | 196 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31249 | |
Common | 5715 | 14.7% |
Latin | 2008 | 5.2% |
Han | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 1502 | 4.8% |
품 | 1241 | 4.0% |
부 | 934 | 3.0% |
자 | 728 | 2.3% |
용 | 587 | 1.9% |
스 | 580 | 1.9% |
동 | 536 | 1.7% |
공 | 496 | 1.6% |
선 | 488 | 1.6% |
전 | 480 | 1.5% |
Other values (606) | 23677 |
Latin
Value | Count | Frequency (%) |
E | 143 | 7.1% |
e | 111 | 5.5% |
L | 101 | 5.0% |
P | 91 | 4.5% |
A | 86 | 4.3% |
C | 84 | 4.2% |
t | 76 | 3.8% |
S | 69 | 3.4% |
D | 68 | 3.4% |
R | 68 | 3.4% |
Other values (39) | 1111 |
Common
Value | Count | Frequency (%) |
3719 | ||
, | 1523 | |
) | 196 | 3.4% |
( | 196 | 3.4% |
/ | 14 | 0.2% |
. | 11 | 0.2% |
- | 10 | 0.2% |
1 | 10 | 0.2% |
2 | 6 | 0.1% |
0 | 6 | 0.1% |
Other values (13) | 24 | 0.4% |
Han
Value | Count | Frequency (%) |
材 | 1 | |
線 | 1 | |
外 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31248 | |
ASCII | 7721 | 19.8% |
CJK | 3 | < 0.1% |
None | 2 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3719 | ||
, | 1523 | |
) | 196 | 2.5% |
( | 196 | 2.5% |
E | 143 | 1.9% |
e | 111 | 1.4% |
L | 101 | 1.3% |
P | 91 | 1.2% |
A | 86 | 1.1% |
C | 84 | 1.1% |
Other values (61) | 1471 | 19.1% |
Hangul
Value | Count | Frequency (%) |
기 | 1502 | 4.8% |
품 | 1241 | 4.0% |
부 | 934 | 3.0% |
자 | 728 | 2.3% |
용 | 587 | 1.9% |
스 | 580 | 1.9% |
동 | 536 | 1.7% |
공 | 496 | 1.6% |
선 | 488 | 1.6% |
전 | 480 | 1.5% |
Other values (605) | 23676 |
None
Value | Count | Frequency (%) |
· | 2 |
CJK
Value | Count | Frequency (%) |
材 | 1 | |
線 | 1 | |
外 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㅐ | 1 |
공장대표주소(지번)
Text
Distinct | 4233 |
---|---|
Distinct (%) | 86.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 38.2 KiB |
Length
Max length | 61 |
---|---|
Median length | 60 |
Mean length | 23.905475 |
Min length | 18 |
Characters and Unicode
Total characters | 116587 |
---|---|
Distinct characters | 228 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 3734 ? |
---|---|
Unique (%) | 76.6% |
Sample
1st row | 부산광역시 강서구 신호동 210-1번지 |
---|---|
2nd row | 부산광역시 강서구 송정동 1742-1번지 1742-1번지 |
3rd row | 부산광역시 강서구 미음동 0번지 부산신항배후 국제산업물류도시(1단계) 일반산업단지 I33블록 6놋트 |
4th row | 부산광역시 강서구 강동동 2044-2번지 |
5th row | 부산광역시 강서구 녹산동 110번지 |
Value | Count | Frequency (%) |
부산광역시 | 4908 | |
강서구 | 4878 | |
송정동 | 1663 | 7.8% |
미음동 | 490 | 2.3% |
대저1동 | 436 | 2.0% |
강동동 | 379 | 1.8% |
대저2동 | 341 | 1.6% |
화전동 | 337 | 1.6% |
지사동 | 308 | 1.4% |
번지 | 227 | 1.1% |
Other values (4025) | 7370 |
Most occurring characters
Value | Count | Frequency (%) |
17515 | 15.0% | |
1 | 6697 | 5.7% |
동 | 5501 | 4.7% |
산 | 5459 | 4.7% |
강 | 5259 | 4.5% |
지 | 5234 | 4.5% |
부 | 5042 | 4.3% |
구 | 5037 | 4.3% |
시 | 5014 | 4.3% |
역 | 4912 | 4.2% |
Other values (218) | 50917 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 67530 | |
Decimal Number | 25715 | 22.1% |
Space Separator | 17515 | 15.0% |
Dash Punctuation | 4454 | 3.8% |
Uppercase Letter | 860 | 0.7% |
Close Punctuation | 185 | 0.2% |
Open Punctuation | 184 | 0.2% |
Other Punctuation | 89 | 0.1% |
Lowercase Letter | 54 | < 0.1% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 5501 | 8.1% |
산 | 5459 | 8.1% |
강 | 5259 | 7.8% |
지 | 5234 | 7.8% |
부 | 5042 | 7.5% |
구 | 5037 | 7.5% |
시 | 5014 | 7.4% |
역 | 4912 | 7.3% |
광 | 4908 | 7.3% |
서 | 4881 | 7.2% |
Other values (175) | 16283 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 146 | |
O | 143 | |
I | 136 | |
L | 129 | |
A | 78 | |
M | 68 | |
R | 68 | |
B | 59 | |
C | 13 | 1.5% |
S | 9 | 1.0% |
Other values (3) | 11 | 1.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 6697 | |
2 | 3177 | |
5 | 2874 | |
3 | 2425 | 9.4% |
6 | 2122 | 8.3% |
7 | 2003 | 7.8% |
4 | 1944 | 7.6% |
0 | 1713 | 6.7% |
8 | 1390 | 5.4% |
9 | 1370 | 5.3% |
Lowercase Letter
Value | Count | Frequency (%) |
i | 40 | |
s | 3 | 5.6% |
o | 2 | 3.7% |
t | 2 | 3.7% |
p | 2 | 3.7% |
c | 1 | 1.9% |
g | 1 | 1.9% |
b | 1 | 1.9% |
a | 1 | 1.9% |
m | 1 | 1.9% |
Other Punctuation
Value | Count | Frequency (%) |
, | 84 | |
. | 2 | 2.2% |
/ | 1 | 1.1% |
& | 1 | 1.1% |
; | 1 | 1.1% |
Space Separator
Value | Count | Frequency (%) |
17515 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4454 |
Close Punctuation
Value | Count | Frequency (%) |
) | 185 |
Open Punctuation
Value | Count | Frequency (%) |
( | 184 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 67530 | |
Common | 48143 | |
Latin | 914 | 0.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 5501 | 8.1% |
산 | 5459 | 8.1% |
강 | 5259 | 7.8% |
지 | 5234 | 7.8% |
부 | 5042 | 7.5% |
구 | 5037 | 7.5% |
시 | 5014 | 7.4% |
역 | 4912 | 7.3% |
광 | 4908 | 7.3% |
서 | 4881 | 7.2% |
Other values (175) | 16283 |
Latin
Value | Count | Frequency (%) |
T | 146 | |
O | 143 | |
I | 136 | |
L | 129 | |
A | 78 | |
M | 68 | |
R | 68 | |
B | 59 | |
i | 40 | 4.4% |
C | 13 | 1.4% |
Other values (13) | 34 | 3.7% |
Common
Value | Count | Frequency (%) |
17515 | ||
1 | 6697 | 13.9% |
- | 4454 | 9.3% |
2 | 3177 | 6.6% |
5 | 2874 | 6.0% |
3 | 2425 | 5.0% |
6 | 2122 | 4.4% |
7 | 2003 | 4.2% |
4 | 1944 | 4.0% |
0 | 1713 | 3.6% |
Other values (10) | 3219 | 6.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 67530 | |
ASCII | 49057 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
17515 | ||
1 | 6697 | 13.7% |
- | 4454 | 9.1% |
2 | 3177 | 6.5% |
5 | 2874 | 5.9% |
3 | 2425 | 4.9% |
6 | 2122 | 4.3% |
7 | 2003 | 4.1% |
4 | 1944 | 4.0% |
0 | 1713 | 3.5% |
Other values (33) | 4133 | 8.4% |
Hangul
Value | Count | Frequency (%) |
동 | 5501 | 8.1% |
산 | 5459 | 8.1% |
강 | 5259 | 7.8% |
지 | 5234 | 7.8% |
부 | 5042 | 7.5% |
구 | 5037 | 7.5% |
시 | 5014 | 7.4% |
역 | 4912 | 7.3% |
광 | 4908 | 7.3% |
서 | 4881 | 7.2% |
Other values (175) | 16283 |
대표업종번호
Real number (ℝ)
Distinct | 430 |
---|---|
Distinct (%) | 8.8% |
Missing | 14 |
Missing (%) | 0.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 28718.378 |
Minimum | 10121 |
---|---|
Maximum | 96921 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 43.0 KiB |
Quantile statistics
Minimum | 10121 |
---|---|
5-th percentile | 15219.1 |
Q1 | 25113 |
median | 28121 |
Q3 | 29294 |
95-th percentile | 49301 |
Maximum | 96921 |
Range | 86800 |
Interquartile range (IQR) | 4181 |
Descriptive statistics
Standard deviation | 10630.549 |
---|---|
Coefficient of variation (CV) | 0.37016535 |
Kurtosis | 10.738204 |
Mean | 28718.378 |
Median Absolute Deviation (MAD) | 2210 |
Skewness | 2.735399 |
Sum | 1.3965747 × 108 |
Variance | 1.1300856 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
25924 | 329 | 6.7% |
31114 | 308 | 6.3% |
29294 | 186 | 3.8% |
28123 | 137 | 2.8% |
29133 | 137 | 2.8% |
30399 | 117 | 2.4% |
24132 | 110 | 2.3% |
24199 | 107 | 2.2% |
68112 | 107 | 2.2% |
25113 | 97 | 2.0% |
Other values (420) | 3228 |
Value | Count | Frequency (%) |
10121 | 6 | |
10122 | 1 | < 0.1% |
10129 | 10 | |
10211 | 8 | |
10212 | 2 | < 0.1% |
10213 | 2 | < 0.1% |
10219 | 6 | |
10220 | 3 | 0.1% |
10301 | 4 | 0.1% |
10309 | 6 |
Value | Count | Frequency (%) |
96921 | 1 | < 0.1% |
95212 | 1 | < 0.1% |
95211 | 13 | |
94200 | 1 | < 0.1% |
94110 | 3 | 0.1% |
86102 | 1 | < 0.1% |
84224 | 1 | < 0.1% |
76390 | 1 | < 0.1% |
76190 | 1 | < 0.1% |
75912 | 1 | < 0.1% |
업종명
Text
Distinct | 972 |
---|---|
Distinct (%) | 20.0% |
Missing | 14 |
Missing (%) | 0.3% |
Memory size | 38.2 KiB |
Length
Max length | 34 |
---|---|
Median length | 28 |
Mean length | 15.939955 |
Min length | 3 |
Characters and Unicode
Total characters | 77516 |
---|---|
Distinct characters | 340 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 506 ? |
---|---|
Unique (%) | 10.4% |
Sample
1st row | 비주거용 건물 임대업 |
---|---|
2nd row | 어망 및 기타 끈 가공품 제조업 |
3rd row | 볼트 및 너트류 제조업 외 2종 |
4th row | 그 외 기타 분류 안된 금속 가공 제품 제조업 외 1종 |
5th row | 선박 구성 부분품 제조업 |
Value | Count | Frequency (%) |
제조업 | 3709 | 15.4% |
외 | 2506 | 10.4% |
및 | 2052 | 8.5% |
기타 | 1056 | 4.4% |
1종 | 1010 | 4.2% |
그 | 694 | 2.9% |
금속 | 453 | 1.9% |
부분품 | 345 | 1.4% |
절삭가공 | 329 | 1.4% |
유사처리업 | 329 | 1.4% |
Other values (726) | 11543 |
Most occurring characters
Value | Count | Frequency (%) |
19163 | ||
업 | 4979 | 6.4% |
제 | 4581 | 5.9% |
조 | 4255 | 5.5% |
기 | 2604 | 3.4% |
외 | 2521 | 3.3% |
및 | 2053 | 2.6% |
종 | 1843 | 2.4% |
품 | 1477 | 1.9% |
1 | 1195 | 1.5% |
Other values (330) | 32845 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 55832 | |
Space Separator | 19163 | 24.7% |
Decimal Number | 2020 | 2.6% |
Other Punctuation | 479 | 0.6% |
Open Punctuation | 11 | < 0.1% |
Close Punctuation | 11 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 4979 | 8.9% |
제 | 4581 | 8.2% |
조 | 4255 | 7.6% |
기 | 2604 | 4.7% |
외 | 2521 | 4.5% |
및 | 2053 | 3.7% |
종 | 1843 | 3.3% |
품 | 1477 | 2.6% |
용 | 1160 | 2.1% |
타 | 1064 | 1.9% |
Other values (315) | 29295 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1195 | |
2 | 312 | 15.4% |
3 | 215 | 10.6% |
4 | 115 | 5.7% |
5 | 61 | 3.0% |
6 | 39 | 1.9% |
8 | 31 | 1.5% |
7 | 20 | 1.0% |
9 | 20 | 1.0% |
0 | 12 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 472 | |
. | 7 | 1.5% |
Space Separator
Value | Count | Frequency (%) |
19163 |
Open Punctuation
Value | Count | Frequency (%) |
( | 11 |
Close Punctuation
Value | Count | Frequency (%) |
) | 11 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 55832 | |
Common | 21684 | 28.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 4979 | 8.9% |
제 | 4581 | 8.2% |
조 | 4255 | 7.6% |
기 | 2604 | 4.7% |
외 | 2521 | 4.5% |
및 | 2053 | 3.7% |
종 | 1843 | 3.3% |
품 | 1477 | 2.6% |
용 | 1160 | 2.1% |
타 | 1064 | 1.9% |
Other values (315) | 29295 |
Common
Value | Count | Frequency (%) |
19163 | ||
1 | 1195 | 5.5% |
, | 472 | 2.2% |
2 | 312 | 1.4% |
3 | 215 | 1.0% |
4 | 115 | 0.5% |
5 | 61 | 0.3% |
6 | 39 | 0.2% |
8 | 31 | 0.1% |
7 | 20 | 0.1% |
Other values (5) | 61 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 55815 | |
ASCII | 21684 | 28.0% |
Compat Jamo | 17 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
19163 | ||
1 | 1195 | 5.5% |
, | 472 | 2.2% |
2 | 312 | 1.4% |
3 | 215 | 1.0% |
4 | 115 | 0.5% |
5 | 61 | 0.3% |
6 | 39 | 0.2% |
8 | 31 | 0.1% |
7 | 20 | 0.1% |
Other values (5) | 61 | 0.3% |
Hangul
Value | Count | Frequency (%) |
업 | 4979 | 8.9% |
제 | 4581 | 8.2% |
조 | 4255 | 7.6% |
기 | 2604 | 4.7% |
외 | 2521 | 4.5% |
및 | 2053 | 3.7% |
종 | 1843 | 3.3% |
품 | 1477 | 2.6% |
용 | 1160 | 2.1% |
타 | 1064 | 1.9% |
Other values (314) | 29278 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 17 |
Unnamed: 7
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 4877 |
---|---|
Missing (%) | 100.0% |
Memory size | 43.0 KiB |
Unnamed: 8
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 4877 |
---|---|
Missing (%) | 100.0% |
Memory size | 43.0 KiB |
Unnamed: 9
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 4877 |
---|---|
Missing (%) | 100.0% |
Memory size | 43.0 KiB |
Unnamed: 10
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 4877 |
---|---|
Missing (%) | 100.0% |
Memory size | 43.0 KiB |
Unnamed: 11
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 4877 |
---|---|
Missing (%) | 100.0% |
Memory size | 43.0 KiB |
Unnamed: 12
Text
CONSTANT
  MISSING
 
Distinct | 1 |
---|---|
Distinct (%) | 100.0% |
Missing | 4876 |
Missing (%) | > 99.9% |
Memory size | 38.2 KiB |
Value | Count | Frequency (%) |
1 |
Most occurring characters
Value | Count | Frequency (%) |
` | 1 |
Most occurring categories
Value | Count | Frequency (%) |
Modifier Symbol | 1 |
Most frequent character per category
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
` | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
` | 1 |
순번 | 종업원수 | 대표업종번호 | |
---|---|---|---|
순번 | 1.000 | 0.024 | 0.060 |
종업원수 | 0.024 | 1.000 | 0.015 |
대표업종번호 | 0.060 | 0.015 | 1.000 |
순번 | 종업원수 | 대표업종번호 | |
---|---|---|---|
순번 | 1.000 | -0.189 | 0.006 |
종업원수 | -0.189 | 1.000 | -0.099 |
대표업종번호 | 0.006 | -0.099 | 1.000 |
순번 | 회사명 | 종업원수 | 생산품 | 공장대표주소(지번) | 대표업종번호 | 업종명 | Unnamed: 7 | Unnamed: 8 | Unnamed: 9 | Unnamed: 10 | Unnamed: 11 | Unnamed: 12 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 1 | 임대업 | 부산광역시 강서구 신호동 210-1번지 | 68112 | 비주거용 건물 임대업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | |
1 | 2 | 나현섬유 | 5 | 어망 | 부산광역시 강서구 송정동 1742-1번지 1742-1번지 | 13922 | 어망 및 기타 끈 가공품 제조업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
2 | 3 | 수정공업사 | 0 | 스텐 닛불, 소켓 | 부산광역시 강서구 미음동 0번지 부산신항배후 국제산업물류도시(1단계) 일반산업단지 I33블록 6놋트 | 25941 | 볼트 및 너트류 제조업 외 2종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
3 | 4 | (유)고려금속 | 6 | 밴(VANE) | 부산광역시 강서구 강동동 2044-2번지 | 25999 | 그 외 기타 분류 안된 금속 가공 제품 제조업 외 1종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4 | 5 | (유)비씨코로텍 | 7 | 분사기(세척기) | 부산광역시 강서구 녹산동 110번지 | 31114 | 선박 구성 부분품 제조업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
5 | 6 | (유)프라이그파이스트 | 42 | 선박용 밸브 원격제어장치 | 부산광역시 강서구 송정동 1480-7번지 | 29299 | 그 외 기타 특수목적용 기계 제조업 외 1종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | 7 | (유)해강운수 | 0 | 주차장 | 부산광역시 강서구 화전동 582-2 번지 | 52915 | 주차장 운영업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | 8 | (재)부산경제진흥원 | 43 | 일반스포츠화,특수화,금형 | 부산광역시 강서구 송정동 1735-1번지 | 15219 | 기타 신발 제조업 외 1종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | 9 | (재)부산경제진흥원 녹산출장소 | 1 | 산업단체, 비주거용 건물 임대업 | 부산광역시 강서구 송정동 1709-2번지 | 94110 | 산업 단체 외 1종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | 10 | (재)부산테크노파크 | 25 | 정보서비스 | 부산광역시 강서구 미음동 1537-1번지 | 63999 | 그 외 기타 정보 서비스업 외 2종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
순번 | 회사명 | 종업원수 | 생산품 | 공장대표주소(지번) | 대표업종번호 | 업종명 | Unnamed: 7 | Unnamed: 8 | Unnamed: 9 | Unnamed: 10 | Unnamed: 11 | Unnamed: 12 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4867 | 4869 | 흥일폴리켐 녹산1공장 | 2 | 우레탄 레진 등 | 부산광역시 강서구 송정동 1724-15번지 | 20421 | 계면활성제 제조업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4868 | 4870 | 희성기연 | 18 | 압연기용 롤러 | 부산광역시 강서구 송정동 1680-4번지 | 29230 | 금속 주조 및 기타 야금용 기계 제조업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4869 | 4871 | 희정산업 | 4 | 금속판재 | 부산광역시 강서구 신호동 290-6번지 | 25112 | 구조용 금속 판제품 및 공작물 제조업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4870 | 4872 | 히아브크레인(주) | 5 | 굴절식 크레인 | 부산광역시 강서구 범방2로 36 (미음동) | 29169 | 기타 물품 취급장비 제조업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4871 | 4873 | 히타엔지니어링 | 4 | 히타,열처리로 | 부산광역시 강서구 대저1동 1358-64번지 | 29150 | 산업용 오븐, 노 및 노용 버너 제조업 외 1종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4872 | 4874 | 히타치금속한국(주) | 12 | 철도차량부품소재, 금형소재 | 부산광역시 강서구 화전동 586-4번지 | 25924 | 절삭가공 및 유사처리업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4873 | 4875 | 힐티코리아(주) | 36 | 케이블트레이서포트 | 부산광역시 강서구 녹산동 581-3번지 | 25924 | 절삭가공 및 유사처리업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4874 | 4876 | 힘코이엔지 | 3 | 기계부품 | 부산광역시 강서구 대저1동 2734-3번지 | 29142 | 기어 및 동력전달장치 제조업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4875 | 4877 | 힘텍 | 2 | 선박덕트, 가스파이프 등 | 부산광역시 강서구 송정동 1481-2번지 | 31114 | 선박 구성 부분품 제조업 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
4876 | 4878 | 힙텍 | 1 | 유압(수압,기압) 테스트용 기계 | 부산광역시 강서구 대저1동 337-67번지 | 29299 | 그 외 기타 특수목적용 기계 제조업 외 1종 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |