Dataset statistics
Number of variables | 14 |
---|---|
Number of observations | 514 |
Missing cells | 1865 |
Missing cells (%) | 25.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 59.4 KiB |
Average record size in memory | 118.3 B |
Variable types
Categorical | 2 |
---|---|
Text | 4 |
DateTime | 2 |
Numeric | 4 |
Unsupported | 2 |
Dataset
Description | 기업구분,기업구분명,업체명,대표자성명,설립일자,정규직수,비정규직수,직원수,업종코드,업종코드명,주소,년도_정렬,등록일시,수정일시 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-21056/S/1/datasetView.do |
기업구분 is highly overall correlated with 정규직수 and 2 other fields | High correlation |
기업구분명 is highly overall correlated with 정규직수 and 2 other fields | High correlation |
정규직수 is highly overall correlated with 직원수 and 2 other fields | High correlation |
직원수 is highly overall correlated with 정규직수 and 1 other fields | High correlation |
년도_정렬 is highly overall correlated with 직원수 and 2 other fields | High correlation |
정규직수 has 376 (73.2%) missing values | Missing |
비정규직수 has 514 (100.0%) missing values | Missing |
업종코드 has 279 (54.3%) missing values | Missing |
등록일시 has 182 (35.4%) missing values | Missing |
수정일시 has 514 (100.0%) missing values | Missing |
주소 has unique values | Unique |
비정규직수 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
수정일시 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
직원수 has 376 (73.2%) zeros | Zeros |
Reproduction
Analysis started | 2024-05-11 05:41:09.219423 |
---|---|
Analysis finished | 2024-05-11 05:41:13.513853 |
Duration | 4.29 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기업구분
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.1 KiB |
ssc | |
---|---|
src |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | ssc |
---|---|
2nd row | ssc |
3rd row | ssc |
4th row | ssc |
5th row | ssc |
Common Values
Value | Count | Frequency (%) |
ssc | 332 | |
src | 182 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
ssc | 332 | |
src | 182 |
기업구분명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.1 KiB |
서울형 강소기업 | |
---|---|
하이서울브랜드 기업 |
Length
Max length | 10 |
---|---|
Median length | 8 |
Mean length | 8.7081712 |
Min length | 8 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울형 강소기업 |
---|---|
2nd row | 서울형 강소기업 |
3rd row | 서울형 강소기업 |
4th row | 서울형 강소기업 |
5th row | 서울형 강소기업 |
Common Values
Value | Count | Frequency (%) |
서울형 강소기업 | 332 | |
하이서울브랜드 기업 | 182 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울형 | 332 | |
강소기업 | 332 | |
하이서울브랜드 | 182 | |
기업 | 182 |
업체명
Text
Distinct | 513 |
---|---|
Distinct (%) | 99.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.1 KiB |
Value | Count | Frequency (%) |
주식회사 | 147 | 21.6% |
㈜ | 8 | 1.2% |
풍림무약㈜ | 2 | 0.3% |
㈜페프 | 1 | 0.1% |
미창(아랑주 | 1 | 0.1% |
창의메디칼㈜ | 1 | 0.1% |
㈜유신모자 | 1 | 0.1% |
㈜아이템홀릭 | 1 | 0.1% |
㈜다산에이디 | 1 | 0.1% |
모젼스랩㈜ | 1 | 0.1% |
Other values (515) | 515 |
Most occurring characters
Value | Count | Frequency (%) |
㈜ | 293 | 7.7% |
176 | 4.6% | |
이 | 176 | 4.6% |
주 | 175 | 4.6% |
스 | 171 | 4.5% |
사 | 163 | 4.3% |
회 | 154 | 4.0% |
식 | 152 | 4.0% |
아 | 72 | 1.9% |
트 | 61 | 1.6% |
Other values (389) | 2211 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3243 | |
Other Symbol | 293 | 7.7% |
Space Separator | 176 | 4.6% |
Close Punctuation | 20 | 0.5% |
Open Punctuation | 20 | 0.5% |
Uppercase Letter | 20 | 0.5% |
Lowercase Letter | 14 | 0.4% |
Decimal Number | 12 | 0.3% |
Other Punctuation | 5 | 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 176 | 5.4% |
주 | 175 | 5.4% |
스 | 171 | 5.3% |
사 | 163 | 5.0% |
회 | 154 | 4.7% |
식 | 152 | 4.7% |
아 | 72 | 2.2% |
트 | 61 | 1.9% |
에 | 60 | 1.9% |
리 | 47 | 1.4% |
Other values (352) | 2012 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 2 | 10.0% |
E | 2 | 10.0% |
L | 2 | 10.0% |
S | 2 | 10.0% |
R | 1 | 5.0% |
G | 1 | 5.0% |
Y | 1 | 5.0% |
W | 1 | 5.0% |
X | 1 | 5.0% |
C | 1 | 5.0% |
Other values (6) | 6 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 3 | |
s | 2 | |
l | 2 | |
e | 1 | 7.1% |
b | 1 | 7.1% |
o | 1 | 7.1% |
i | 1 | 7.1% |
n | 1 | 7.1% |
t | 1 | 7.1% |
d | 1 | 7.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 6 | |
0 | 2 | 16.7% |
3 | 2 | 16.7% |
6 | 1 | 8.3% |
2 | 1 | 8.3% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 293 |
Space Separator
Value | Count | Frequency (%) |
176 |
Close Punctuation
Value | Count | Frequency (%) |
) | 20 |
Open Punctuation
Value | Count | Frequency (%) |
( | 20 |
Other Punctuation
Value | Count | Frequency (%) |
. | 5 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3536 | |
Common | 234 | 6.2% |
Latin | 34 | 0.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
㈜ | 293 | 8.3% |
이 | 176 | 5.0% |
주 | 175 | 4.9% |
스 | 171 | 4.8% |
사 | 163 | 4.6% |
회 | 154 | 4.4% |
식 | 152 | 4.3% |
아 | 72 | 2.0% |
트 | 61 | 1.7% |
에 | 60 | 1.7% |
Other values (353) | 2059 |
Latin
Value | Count | Frequency (%) |
a | 3 | 8.8% |
s | 2 | 5.9% |
l | 2 | 5.9% |
A | 2 | 5.9% |
E | 2 | 5.9% |
L | 2 | 5.9% |
S | 2 | 5.9% |
R | 1 | 2.9% |
e | 1 | 2.9% |
b | 1 | 2.9% |
Other values (16) | 16 |
Common
Value | Count | Frequency (%) |
176 | ||
) | 20 | 8.5% |
( | 20 | 8.5% |
1 | 6 | 2.6% |
. | 5 | 2.1% |
0 | 2 | 0.9% |
3 | 2 | 0.9% |
- | 1 | 0.4% |
6 | 1 | 0.4% |
2 | 1 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3243 | |
None | 293 | 7.7% |
ASCII | 268 | 7.0% |
Most frequent character per block
None
Value | Count | Frequency (%) |
㈜ | 293 |
ASCII
Value | Count | Frequency (%) |
176 | ||
) | 20 | 7.5% |
( | 20 | 7.5% |
1 | 6 | 2.2% |
. | 5 | 1.9% |
a | 3 | 1.1% |
s | 2 | 0.7% |
l | 2 | 0.7% |
A | 2 | 0.7% |
E | 2 | 0.7% |
Other values (26) | 30 | 11.2% |
Hangul
Value | Count | Frequency (%) |
이 | 176 | 5.4% |
주 | 175 | 5.4% |
스 | 171 | 5.3% |
사 | 163 | 5.0% |
회 | 154 | 4.7% |
식 | 152 | 4.7% |
아 | 72 | 2.2% |
트 | 61 | 1.9% |
에 | 60 | 1.9% |
리 | 47 | 1.4% |
Other values (352) | 2012 |
대표자성명
Text
Distinct | 501 |
---|---|
Distinct (%) | 97.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.1 KiB |
Value | Count | Frequency (%) |
서예원 | 2 | 0.4% |
이선우 | 2 | 0.4% |
이성주 | 2 | 0.4% |
이정석 | 2 | 0.4% |
이승호 | 2 | 0.4% |
김영환 | 2 | 0.4% |
김명현 | 2 | 0.4% |
훈 | 2 | 0.4% |
김동현 | 2 | 0.4% |
박현수 | 2 | 0.4% |
Other values (513) | 517 |
Most occurring characters
Value | Count | Frequency (%) |
김 | 117 | 6.9% |
이 | 83 | 4.9% |
영 | 57 | 3.4% |
정 | 47 | 2.8% |
박 | 45 | 2.7% |
진 | 39 | 2.3% |
성 | 35 | 2.1% |
현 | 31 | 1.8% |
상 | 30 | 1.8% |
석 | 29 | 1.7% |
Other values (179) | 1174 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1614 | |
Space Separator | 27 | 1.6% |
Uppercase Letter | 27 | 1.6% |
Other Punctuation | 19 | 1.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 117 | 7.2% |
이 | 83 | 5.1% |
영 | 57 | 3.5% |
정 | 47 | 2.9% |
박 | 45 | 2.8% |
진 | 39 | 2.4% |
성 | 35 | 2.2% |
현 | 31 | 1.9% |
상 | 30 | 1.9% |
석 | 29 | 1.8% |
Other values (161) | 1101 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 4 | |
A | 3 | |
R | 3 | |
O | 3 | |
E | 2 | 7.4% |
B | 2 | 7.4% |
I | 2 | 7.4% |
S | 1 | 3.7% |
P | 1 | 3.7% |
K | 1 | 3.7% |
Other values (5) | 5 |
Other Punctuation
Value | Count | Frequency (%) |
, | 16 | |
/ | 3 | 15.8% |
Space Separator
Value | Count | Frequency (%) |
27 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1614 | |
Common | 46 | 2.7% |
Latin | 27 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 117 | 7.2% |
이 | 83 | 5.1% |
영 | 57 | 3.5% |
정 | 47 | 2.9% |
박 | 45 | 2.8% |
진 | 39 | 2.4% |
성 | 35 | 2.2% |
현 | 31 | 1.9% |
상 | 30 | 1.9% |
석 | 29 | 1.8% |
Other values (161) | 1101 |
Latin
Value | Count | Frequency (%) |
N | 4 | |
A | 3 | |
R | 3 | |
O | 3 | |
E | 2 | 7.4% |
B | 2 | 7.4% |
I | 2 | 7.4% |
S | 1 | 3.7% |
P | 1 | 3.7% |
K | 1 | 3.7% |
Other values (5) | 5 |
Common
Value | Count | Frequency (%) |
27 | ||
, | 16 | |
/ | 3 | 6.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1614 | |
ASCII | 73 | 4.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
김 | 117 | 7.2% |
이 | 83 | 5.1% |
영 | 57 | 3.5% |
정 | 47 | 2.9% |
박 | 45 | 2.8% |
진 | 39 | 2.4% |
성 | 35 | 2.2% |
현 | 31 | 1.9% |
상 | 30 | 1.9% |
석 | 29 | 1.8% |
Other values (161) | 1101 |
ASCII
Value | Count | Frequency (%) |
27 | ||
, | 16 | |
N | 4 | 5.5% |
/ | 3 | 4.1% |
A | 3 | 4.1% |
R | 3 | 4.1% |
O | 3 | 4.1% |
E | 2 | 2.7% |
B | 2 | 2.7% |
I | 2 | 2.7% |
Other values (8) | 8 | 11.0% |
설립일자
Date
Distinct | 484 |
---|---|
Distinct (%) | 94.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.1 KiB |
Minimum | 1974-03-21 00:00:00 |
---|---|
Maximum | 2019-12-10 00:00:00 |
정규직수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 77 |
---|---|
Distinct (%) | 55.8% |
Missing | 376 |
Missing (%) | 73.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 54.927536 |
Minimum | 8 |
---|---|
Maximum | 337 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.6 KiB |
Quantile statistics
Minimum | 8 |
---|---|
5-th percentile | 12.85 |
Q1 | 22 |
median | 35 |
Q3 | 67.75 |
95-th percentile | 143.6 |
Maximum | 337 |
Range | 329 |
Interquartile range (IQR) | 45.75 |
Descriptive statistics
Standard deviation | 55.812072 |
---|---|
Coefficient of variation (CV) | 1.0161037 |
Kurtosis | 9.949009 |
Mean | 54.927536 |
Median Absolute Deviation (MAD) | 17 |
Skewness | 2.8186197 |
Sum | 7580 |
Variance | 3114.9874 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
18 | 7 | 1.4% |
35 | 7 | 1.4% |
16 | 6 | 1.2% |
14 | 5 | 1.0% |
26 | 5 | 1.0% |
37 | 4 | 0.8% |
47 | 4 | 0.8% |
21 | 4 | 0.8% |
27 | 4 | 0.8% |
25 | 3 | 0.6% |
Other values (67) | 89 | 17.3% |
(Missing) | 376 |
Value | Count | Frequency (%) |
8 | 3 | |
10 | 1 | 0.2% |
11 | 1 | 0.2% |
12 | 2 | 0.4% |
13 | 2 | 0.4% |
14 | 5 | |
15 | 1 | 0.2% |
16 | 6 | |
18 | 7 | |
19 | 1 | 0.2% |
Value | Count | Frequency (%) |
337 | 1 | |
330 | 1 | |
284 | 1 | |
215 | 1 | |
199 | 1 | |
174 | 1 | |
147 | 1 | |
143 | 1 | |
131 | 1 | |
130 | 1 |
비정규직수
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 514 |
---|---|
Missing (%) | 100.0% |
Memory size | 4.6 KiB |
직원수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 78 |
---|---|
Distinct (%) | 15.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.747082 |
Minimum | 0 |
---|---|
Maximum | 337 |
Zeros | 376 |
Zeros (%) | 73.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.6 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 13.75 |
95-th percentile | 82.35 |
Maximum | 337 |
Range | 337 |
Interquartile range (IQR) | 13.75 |
Descriptive statistics
Standard deviation | 37.756817 |
---|---|
Coefficient of variation (CV) | 2.5602908 |
Kurtosis | 27.751765 |
Mean | 14.747082 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 4.5573123 |
Sum | 7580 |
Variance | 1425.5772 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 376 | |
35 | 7 | 1.4% |
18 | 7 | 1.4% |
16 | 6 | 1.2% |
14 | 5 | 1.0% |
26 | 5 | 1.0% |
27 | 4 | 0.8% |
21 | 4 | 0.8% |
47 | 4 | 0.8% |
37 | 4 | 0.8% |
Other values (68) | 92 | 17.9% |
Value | Count | Frequency (%) |
0 | 376 | |
8 | 3 | 0.6% |
10 | 1 | 0.2% |
11 | 1 | 0.2% |
12 | 2 | 0.4% |
13 | 2 | 0.4% |
14 | 5 | 1.0% |
15 | 1 | 0.2% |
16 | 6 | 1.2% |
18 | 7 | 1.4% |
Value | Count | Frequency (%) |
337 | 1 | |
330 | 1 | |
284 | 1 | |
215 | 1 | |
199 | 1 | |
174 | 1 | |
147 | 1 | |
143 | 1 | |
131 | 1 | |
130 | 1 |
업종코드
Real number (ℝ)
MISSING
 
Distinct | 118 |
---|---|
Distinct (%) | 50.2% |
Missing | 279 |
Missing (%) | 54.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 35062.149 |
Minimum | 13 |
---|---|
Maximum | 85709 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.6 KiB |
Quantile statistics
Minimum | 13 |
---|---|
5-th percentile | 31.1 |
Q1 | 20461 |
median | 29199 |
Q3 | 58221 |
95-th percentile | 72121 |
Maximum | 85709 |
Range | 85696 |
Interquartile range (IQR) | 37760 |
Descriptive statistics
Standard deviation | 22417.514 |
---|---|
Coefficient of variation (CV) | 0.63936509 |
Kurtosis | -0.98977119 |
Mean | 35062.149 |
Median Absolute Deviation (MAD) | 18018 |
Skewness | 0.059651242 |
Sum | 8239605 |
Variance | 5.0254493 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
58222 | 21 | 4.1% |
58221 | 13 | 2.5% |
33999 | 10 | 1.9% |
62010 | 9 | 1.8% |
62021 | 8 | 1.6% |
27199 | 7 | 1.4% |
20423 | 5 | 1.0% |
33 | 5 | 1.0% |
32 | 4 | 0.8% |
27 | 4 | 0.8% |
Other values (108) | 149 | |
(Missing) | 279 |
Value | Count | Frequency (%) |
13 | 3 | |
26 | 2 | 0.4% |
27 | 4 | |
28 | 2 | 0.4% |
29 | 1 | 0.2% |
32 | 4 | |
33 | 5 | |
41 | 1 | 0.2% |
46 | 1 | 0.2% |
62 | 2 | 0.4% |
Value | Count | Frequency (%) |
85709 | 1 | 0.2% |
84119 | 1 | 0.2% |
75992 | 1 | 0.2% |
73909 | 3 | |
73209 | 1 | 0.2% |
73202 | 2 | |
72122 | 1 | 0.2% |
72121 | 3 | |
71531 | 1 | 0.2% |
71400 | 1 | 0.2% |
업종코드명
Text
Distinct | 191 |
---|---|
Distinct (%) | 37.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.1 KiB |
Value | Count | Frequency (%) |
및 | 182 | 11.2% |
제조업 | 164 | 10.1% |
정보통신업 | 85 | 5.2% |
기타 | 80 | 4.9% |
서비스업 | 57 | 3.5% |
외 | 44 | 2.7% |
소프트웨어 | 43 | 2.6% |
서비스 | 42 | 2.6% |
그 | 41 | 2.5% |
개발 | 40 | 2.5% |
Other values (270) | 852 |
Most occurring characters
Value | Count | Frequency (%) |
1126 | 19.3% | |
업 | 446 | 7.6% |
제 | 244 | 4.2% |
기 | 196 | 3.4% |
조 | 187 | 3.2% |
및 | 187 | 3.2% |
스 | 154 | 2.6% |
비 | 149 | 2.6% |
서 | 123 | 2.1% |
, | 115 | 2.0% |
Other values (216) | 2905 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4573 | |
Space Separator | 1126 | 19.3% |
Other Punctuation | 127 | 2.2% |
Close Punctuation | 2 | < 0.1% |
Open Punctuation | 2 | < 0.1% |
Decimal Number | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 446 | 9.8% |
제 | 244 | 5.3% |
기 | 196 | 4.3% |
조 | 187 | 4.1% |
및 | 187 | 4.1% |
스 | 154 | 3.4% |
비 | 149 | 3.3% |
서 | 123 | 2.7% |
정 | 112 | 2.4% |
통 | 111 | 2.4% |
Other values (207) | 2664 |
Other Punctuation
Value | Count | Frequency (%) |
, | 115 | |
. | 5 | 3.9% |
; | 5 | 3.9% |
/ | 2 | 1.6% |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 |
Space Separator
Value | Count | Frequency (%) |
1126 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4573 | |
Common | 1259 | 21.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 446 | 9.8% |
제 | 244 | 5.3% |
기 | 196 | 4.3% |
조 | 187 | 4.1% |
및 | 187 | 4.1% |
스 | 154 | 3.4% |
비 | 149 | 3.3% |
서 | 123 | 2.7% |
정 | 112 | 2.4% |
통 | 111 | 2.4% |
Other values (207) | 2664 |
Common
Value | Count | Frequency (%) |
1126 | ||
, | 115 | 9.1% |
. | 5 | 0.4% |
; | 5 | 0.4% |
/ | 2 | 0.2% |
) | 2 | 0.2% |
( | 2 | 0.2% |
1 | 1 | 0.1% |
2 | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4573 | |
ASCII | 1259 | 21.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1126 | ||
, | 115 | 9.1% |
. | 5 | 0.4% |
; | 5 | 0.4% |
/ | 2 | 0.2% |
) | 2 | 0.2% |
( | 2 | 0.2% |
1 | 1 | 0.1% |
2 | 1 | 0.1% |
Hangul
Value | Count | Frequency (%) |
업 | 446 | 9.8% |
제 | 244 | 5.3% |
기 | 196 | 4.3% |
조 | 187 | 4.1% |
및 | 187 | 4.1% |
스 | 154 | 3.4% |
비 | 149 | 3.3% |
서 | 123 | 2.7% |
정 | 112 | 2.4% |
통 | 111 | 2.4% |
Other values (207) | 2664 |
주소
Text
UNIQUE
 
Distinct | 514 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.1 KiB |
Length
Max length | 66 |
---|---|
Median length | 46 |
Mean length | 28.817121 |
Min length | 11 |
Characters and Unicode
Total characters | 14812 |
---|---|
Distinct characters | 381 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 514 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 서울시 성동구 성수이로22길61 5층 |
---|---|
2nd row | 서울시 강남구 테헤란로 427, 16층 |
3rd row | 서울시 강남구 테헤란로 22길 9, 3,4,6층(역삼동, 아름다운빌딩) |
4th row | 서울시 강남구 논현로 805, B1~1F(신사동) |
5th row | 서울시 강서구 마곡중앙4로 18, B동 720호 |
Value | Count | Frequency (%) |
서울시 | 278 | 9.7% |
강남구 | 100 | 3.5% |
금천구 | 89 | 3.1% |
구로구 | 59 | 2.1% |
서울특별시 | 52 | 1.8% |
서초구 | 47 | 1.6% |
송파구 | 41 | 1.4% |
성동구 | 41 | 1.4% |
디지털로 | 34 | 1.2% |
영등포구 | 32 | 1.1% |
Other values (1233) | 2102 |
Most occurring characters
Value | Count | Frequency (%) |
2434 | 16.4% | |
1 | 742 | 5.0% |
구 | 630 | 4.3% |
로 | 608 | 4.1% |
서 | 460 | 3.1% |
, | 422 | 2.8% |
2 | 412 | 2.8% |
0 | 370 | 2.5% |
울 | 346 | 2.3% |
시 | 345 | 2.3% |
Other values (371) | 8043 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8145 | |
Decimal Number | 3080 | 20.8% |
Space Separator | 2434 | 16.4% |
Other Punctuation | 428 | 2.9% |
Open Punctuation | 206 | 1.4% |
Close Punctuation | 206 | 1.4% |
Uppercase Letter | 194 | 1.3% |
Dash Punctuation | 55 | 0.4% |
Lowercase Letter | 46 | 0.3% |
Math Symbol | 18 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 630 | 7.7% |
로 | 608 | 7.5% |
서 | 460 | 5.6% |
울 | 346 | 4.2% |
시 | 345 | 4.2% |
동 | 308 | 3.8% |
호 | 239 | 2.9% |
층 | 221 | 2.7% |
길 | 212 | 2.6% |
강 | 162 | 2.0% |
Other values (310) | 4614 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 21 | |
S | 21 | |
A | 20 | |
B | 17 | 8.8% |
T | 15 | 7.7% |
I | 13 | 6.7% |
K | 11 | 5.7% |
E | 11 | 5.7% |
M | 8 | 4.1% |
V | 8 | 4.1% |
Other values (13) | 49 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 8 | |
n | 8 | |
o | 4 | |
i | 4 | |
b | 3 | 6.5% |
r | 3 | 6.5% |
a | 3 | 6.5% |
k | 2 | 4.3% |
t | 2 | 4.3% |
s | 2 | 4.3% |
Other values (7) | 7 |
Decimal Number
Value | Count | Frequency (%) |
1 | 742 | |
2 | 412 | |
0 | 370 | |
3 | 341 | |
4 | 265 | 8.6% |
6 | 221 | 7.2% |
5 | 218 | 7.1% |
8 | 184 | 6.0% |
7 | 181 | 5.9% |
9 | 146 | 4.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 422 | |
/ | 2 | 0.5% |
& | 2 | 0.5% |
# | 1 | 0.2% |
. | 1 | 0.2% |
Math Symbol
Value | Count | Frequency (%) |
~ | 17 | |
+ | 1 | 5.6% |
Space Separator
Value | Count | Frequency (%) |
2434 |
Open Punctuation
Value | Count | Frequency (%) |
( | 206 |
Close Punctuation
Value | Count | Frequency (%) |
) | 206 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 55 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8145 | |
Common | 6427 | |
Latin | 240 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 630 | 7.7% |
로 | 608 | 7.5% |
서 | 460 | 5.6% |
울 | 346 | 4.2% |
시 | 345 | 4.2% |
동 | 308 | 3.8% |
호 | 239 | 2.9% |
층 | 221 | 2.7% |
길 | 212 | 2.6% |
강 | 162 | 2.0% |
Other values (310) | 4614 |
Latin
Value | Count | Frequency (%) |
C | 21 | 8.8% |
S | 21 | 8.8% |
A | 20 | 8.3% |
B | 17 | 7.1% |
T | 15 | 6.2% |
I | 13 | 5.4% |
K | 11 | 4.6% |
E | 11 | 4.6% |
e | 8 | 3.3% |
M | 8 | 3.3% |
Other values (30) | 95 |
Common
Value | Count | Frequency (%) |
2434 | ||
1 | 742 | 11.5% |
, | 422 | 6.6% |
2 | 412 | 6.4% |
0 | 370 | 5.8% |
3 | 341 | 5.3% |
4 | 265 | 4.1% |
6 | 221 | 3.4% |
5 | 218 | 3.4% |
( | 206 | 3.2% |
Other values (11) | 796 | 12.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8145 | |
ASCII | 6667 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2434 | ||
1 | 742 | 11.1% |
, | 422 | 6.3% |
2 | 412 | 6.2% |
0 | 370 | 5.5% |
3 | 341 | 5.1% |
4 | 265 | 4.0% |
6 | 221 | 3.3% |
5 | 218 | 3.3% |
( | 206 | 3.1% |
Other values (51) | 1036 |
Hangul
Value | Count | Frequency (%) |
구 | 630 | 7.7% |
로 | 608 | 7.5% |
서 | 460 | 5.6% |
울 | 346 | 4.2% |
시 | 345 | 4.2% |
동 | 308 | 3.8% |
호 | 239 | 2.9% |
층 | 221 | 2.7% |
길 | 212 | 2.6% |
강 | 162 | 2.0% |
Other values (310) | 4614 |
년도_정렬
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 1.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2018.5195 |
Minimum | 2016 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.6 KiB |
Quantile statistics
Minimum | 2016 |
---|---|
5-th percentile | 2016 |
Q1 | 2016 |
median | 2019 |
Q3 | 2020 |
95-th percentile | 2023 |
Maximum | 2023 |
Range | 7 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.233148 |
---|---|
Coefficient of variation (CV) | 0.0011063297 |
Kurtosis | -0.8616952 |
Mean | 2018.5195 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.35112163 |
Sum | 1037519 |
Variance | 4.9869502 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
2016 | 182 | |
2019 | 97 | |
2020 | 95 | |
2018 | 48 | 9.3% |
2023 | 44 | 8.6% |
2021 | 43 | 8.4% |
2017 | 5 | 1.0% |
Value | Count | Frequency (%) |
2016 | 182 | |
2017 | 5 | 1.0% |
2018 | 48 | 9.3% |
2019 | 97 | |
2020 | 95 | |
2021 | 43 | 8.4% |
2023 | 44 | 8.6% |
Value | Count | Frequency (%) |
2023 | 44 | 8.6% |
2021 | 43 | 8.4% |
2020 | 95 | |
2019 | 97 | |
2018 | 48 | 9.3% |
2017 | 5 | 1.0% |
2016 | 182 |
등록일시
Date
MISSING
 
Distinct | 53 |
---|---|
Distinct (%) | 16.0% |
Missing | 182 |
Missing (%) | 35.4% |
Memory size | 4.1 KiB |
Minimum | 2017-07-04 11:16:46 |
---|---|
Maximum | 2023-01-13 14:30:22 |
수정일시
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 514 |
---|---|
Missing (%) | 100.0% |
Memory size | 4.6 KiB |
기업구분 | 기업구분명 | 정규직수 | 직원수 | 업종코드 | 년도_정렬 | 등록일시 | |
---|---|---|---|---|---|---|---|
기업구분 | 1.000 | 1.000 | NaN | 0.287 | 0.626 | NaN | NaN |
기업구분명 | 1.000 | 1.000 | NaN | 0.287 | 0.626 | NaN | NaN |
정규직수 | NaN | NaN | 1.000 | 0.997 | NaN | 0.253 | 0.253 |
직원수 | 0.287 | 0.287 | 0.997 | 1.000 | NaN | 0.527 | 0.000 |
업종코드 | 0.626 | 0.626 | NaN | NaN | 1.000 | 0.000 | 0.990 |
년도_정렬 | NaN | NaN | 0.253 | 0.527 | 0.000 | 1.000 | 1.000 |
등록일시 | NaN | NaN | 0.253 | 0.000 | 0.990 | 1.000 | 1.000 |
기업구분 | 기업구분명 | |
---|---|---|
기업구분 | 1.000 | 0.996 |
기업구분명 | 0.996 | 1.000 |
정규직수 | 직원수 | 업종코드 | 년도_정렬 | 기업구분 | 기업구분명 | |
---|---|---|---|---|---|---|
정규직수 | 1.000 | 1.000 | NaN | 0.125 | 1.000 | 1.000 |
직원수 | 1.000 | 1.000 | NaN | 0.599 | 0.285 | 0.285 |
업종코드 | NaN | NaN | 1.000 | 0.369 | 0.477 | 0.477 |
년도_정렬 | 0.125 | 0.599 | 0.369 | 1.000 | 0.995 | 0.995 |
기업구분 | 1.000 | 0.285 | 0.477 | 0.995 | 1.000 | 0.996 |
기업구분명 | 1.000 | 0.285 | 0.477 | 0.995 | 0.996 | 1.000 |
기업구분 | 기업구분명 | 업체명 | 대표자성명 | 설립일자 | 정규직수 | 비정규직수 | 직원수 | 업종코드 | 업종코드명 | 주소 | 년도_정렬 | 등록일시 | 수정일시 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | ssc | 서울형 강소기업 | ㈜롤리조쓰컴퍼니 | 박신후 | 2018-08-01 | <NA> | <NA> | 0 | <NA> | 제조업 | 서울시 성동구 성수이로22길61 5층 | 2023 | 2023-01-13 14:30:22.0 | <NA> |
1 | ssc | 서울형 강소기업 | ㈜인티그레이션 | 정희범 | 2019-02-01 | <NA> | <NA> | 0 | <NA> | 정보통신업 | 서울시 강남구 테헤란로 427, 16층 | 2023 | 2023-01-13 14:30:22.0 | <NA> |
2 | ssc | 서울형 강소기업 | ㈜샐러디 | 이건호,안상원 | 2015-04-07 | <NA> | <NA> | 0 | <NA> | 제조업 | 서울시 강남구 테헤란로 22길 9, 3,4,6층(역삼동, 아름다운빌딩) | 2023 | 2023-01-13 14:30:22.0 | <NA> |
3 | ssc | 서울형 강소기업 | 설로인 주식회사 | 변준원 | 2017-09-08 | <NA> | <NA> | 0 | <NA> | 제조업 | 서울시 강남구 논현로 805, B1~1F(신사동) | 2023 | 2023-01-13 14:30:22.0 | <NA> |
4 | ssc | 서울형 강소기업 | ㈜테온 | 이승준 | 2019-08-26 | <NA> | <NA> | 0 | <NA> | 정보통신업 | 서울시 강서구 마곡중앙4로 18, B동 720호 | 2023 | 2023-01-13 14:30:22.0 | <NA> |
5 | ssc | 서울형 강소기업 | 주식회사 크몽 | 박현호 | 2012-06-01 | <NA> | <NA> | 0 | <NA> | 정보통신업 | 서울시 서초구 사임당로 157, 릿타워 3층 | 2023 | 2023-01-13 14:30:22.0 | <NA> |
6 | ssc | 서울형 강소기업 | 주식회사 올라핀테크 | 김상수 | 2019-12-10 | <NA> | <NA> | 0 | <NA> | 정보통신업 | 서울시 강남구 선릉로615, 1층 | 2023 | 2023-01-13 14:30:22.0 | <NA> |
7 | ssc | 서울형 강소기업 | (주)해빗팩토리 | 이동익,정윤호 | 2016-01-08 | <NA> | <NA> | 0 | <NA> | 정보통신업 | 서울시 용산구 서빙고로 17 센트럴파크타워 23층 2301호 | 2023 | 2023-01-13 14:30:22.0 | <NA> |
8 | ssc | 서울형 강소기업 | 주식회사 클래스101 | 공대선 | 2015-09-01 | <NA> | <NA> | 0 | <NA> | 정보통신업 | 서울시 강남구 테헤란로 302, 1-11층, 13층 | 2023 | 2023-01-13 14:30:22.0 | <NA> |
9 | ssc | 서울형 강소기업 | 주식회사 무로코퍼레이션 | 전병민 | 2019-04-12 | <NA> | <NA> | 0 | <NA> | 도매 및 소매업 | 서울시 강남구 테헤란로 33길 34 B1F~2F | 2023 | 2023-01-13 14:30:22.0 | <NA> |
기업구분 | 기업구분명 | 업체명 | 대표자성명 | 설립일자 | 정규직수 | 비정규직수 | 직원수 | 업종코드 | 업종코드명 | 주소 | 년도_정렬 | 등록일시 | 수정일시 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
504 | src | 하이서울브랜드 기업 | ㈜제이앤케이사이언스 | 조금용 | 2007-06-22 | <NA> | <NA> | 0 | 46109 | 상품 종합 중개업 | 서초구 방배로 143, 402(방배동, 정진빌딩) | 2016 | <NA> | <NA> |
505 | src | 하이서울브랜드 기업 | ㈜뮈샤 | 김정주 | 2007-05-19 | <NA> | <NA> | 0 | 46492 | 시계 및 귀금속제품 도매업 | 강남구 도산대로67길 13-5 뮈샤빌딩 | 2016 | <NA> | <NA> |
506 | src | 하이서울브랜드 기업 | ㈜트레이드월드 | 김영호 | 2005-03-10 | <NA> | <NA> | 0 | 73209 | 패션, 섬유류 및 기타 전문 디자인업 | 강남구 강남구 논현로 28길 35 대동빌딩5층 | 2016 | <NA> | <NA> |
507 | src | 하이서울브랜드 기업 | ㈜밸류포인트 | 윤영택 | 2002-07-15 | <NA> | <NA> | 0 | 33910 | 간판 및 광고물 제조업 | 강서구 화곡로 64길 98 밸류포인트 | 2016 | <NA> | <NA> |
508 | src | 하이서울브랜드 기업 | 테크노빌리지㈜ | 유인목 | 2000-05-18 | <NA> | <NA> | 0 | 41 | 종합 건설업 | 서초구 서초구 반포대로18길 60, 유승빌딩 5층 | 2016 | <NA> | <NA> |
509 | src | 하이서울브랜드 기업 | 슈어엠주식회사 | 백남욱 | 2000-04-01 | <NA> | <NA> | 0 | 63 | 정보서비스업 | 송파구 오금로81 송파빌딩 11층 | 2016 | <NA> | <NA> |
510 | src | 하이서울브랜드 기업 | ㈜영일교육시스템 | 박영종 | 1999-10-08 | <NA> | <NA> | 0 | 2812 | 전기 공급 및 제어장치 제조업 | 성동구 아차산로15길 52 삼환디지털벤처타워 604호 | 2016 | <NA> | <NA> |
511 | src | 하이서울브랜드 기업 | ㈜버텍스아이디 | 홍순철 | 1999-04-14 | <NA> | <NA> | 0 | 62021 | 컴퓨터시스템 통합 자문 및 구축 서비스업 | 강남구 언주로 121길 13(논현동) 버텍스 아이디 빌딩 | 2016 | <NA> | <NA> |
512 | src | 하이서울브랜드 기업 | ㈜유진로봇 | 신경철 | 1993-12-07 | <NA> | <NA> | 0 | 33999 | 그 외 기타 달리 분류되지 않은 제품 제조업 | 금천구 디지털로 130 남성프라자 1214호(가산동) | 2016 | <NA> | <NA> |
513 | src | 하이서울브랜드 기업 | ㈜새턴바스 | 정인환 | 1990-08-06 | <NA> | <NA> | 0 | 32099 | 그 외 기타 가구 제조업 | 강남구 논현로 127길 14 | 2016 | <NA> | <NA> |