Dataset statistics
Number of variables | 12 |
---|---|
Number of observations | 10000 |
Missing cells | 68 |
Missing cells (%) | 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.0 MiB |
Average record size in memory | 105.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 5 |
Categorical | 4 |
DateTime | 2 |
Dataset
Description | "23년 3월 29일 기준 벤처기업명단입니다. 업체명, 대표자, 확인유형, 지역, 주소, 업종분류, 업종명, 주생산품, 유효시작일, 유효만료일, 확인기관 항목으로 이루어짐 |
---|---|
URL | https://www.data.go.kr/data/15112684/fileData.do |
Reproduction
Analysis started | 2023-12-12 18:46:19.169391 |
---|---|
Analysis finished | 2023-12-12 18:46:22.667723 |
Duration | 3.5 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 17567.328 |
Minimum | 3 |
---|---|
Maximum | 35593 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 1789.9 |
Q1 | 8673.25 |
median | 17407.5 |
Q3 | 26613 |
95-th percentile | 33711.1 |
Maximum | 35593 |
Range | 35590 |
Interquartile range (IQR) | 17939.75 |
Descriptive statistics
Standard deviation | 10277.884 |
---|---|
Coefficient of variation (CV) | 0.58505675 |
Kurtosis | -1.2035864 |
Mean | 17567.328 |
Median Absolute Deviation (MAD) | 8949 |
Skewness | 0.036036354 |
Sum | 1.7567328 × 108 |
Variance | 1.056349 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4587 | 1 | < 0.1% |
18661 | 1 | < 0.1% |
24189 | 1 | < 0.1% |
18668 | 1 | < 0.1% |
11124 | 1 | < 0.1% |
10922 | 1 | < 0.1% |
6357 | 1 | < 0.1% |
9651 | 1 | < 0.1% |
18208 | 1 | < 0.1% |
6546 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
3 | 1 | |
6 | 1 | |
25 | 1 | |
26 | 1 | |
31 | 1 | |
32 | 1 | |
36 | 1 | |
45 | 1 | |
46 | 1 | |
47 | 1 |
Value | Count | Frequency (%) |
35593 | 1 | |
35592 | 1 | |
35590 | 1 | |
35585 | 1 | |
35574 | 1 | |
35573 | 1 | |
35568 | 1 | |
35561 | 1 | |
35560 | 1 | |
35541 | 1 |
업체명
Text
Distinct | 9973 |
---|---|
Distinct (%) | 99.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
주식회사 | 4010 | 27.3% |
주 | 108 | 0.7% |
예비창업자 | 67 | 0.5% |
농업회사법인 | 59 | 0.4% |
유한회사 | 41 | 0.3% |
co.,ltd | 38 | 0.3% |
inc | 34 | 0.2% |
ltd | 25 | 0.2% |
co | 23 | 0.2% |
tech | 9 | 0.1% |
Other values (10181) | 10288 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 5145 | 6.4% |
4749 | 5.9% | |
사 | 4503 | 5.6% |
회 | 4362 | 5.4% |
식 | 4249 | 5.3% |
㈜ | 3797 | 4.7% |
이 | 3612 | 4.5% |
스 | 2964 | 3.7% |
에 | 1615 | 2.0% |
) | 1106 | 1.4% |
Other values (904) | 44633 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 67469 | |
Space Separator | 4749 | 5.9% |
Other Symbol | 3797 | 4.7% |
Uppercase Letter | 1235 | 1.5% |
Close Punctuation | 1107 | 1.4% |
Open Punctuation | 1105 | 1.4% |
Lowercase Letter | 910 | 1.1% |
Other Punctuation | 276 | 0.3% |
Decimal Number | 69 | 0.1% |
Dash Punctuation | 18 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 5145 | 7.6% |
사 | 4503 | 6.7% |
회 | 4362 | 6.5% |
식 | 4249 | 6.3% |
이 | 3612 | 5.4% |
스 | 2964 | 4.4% |
에 | 1615 | 2.4% |
아 | 1046 | 1.6% |
트 | 875 | 1.3% |
리 | 866 | 1.3% |
Other values (832) | 38232 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 142 | |
T | 107 | 8.7% |
L | 105 | 8.5% |
E | 99 | 8.0% |
I | 89 | 7.2% |
S | 86 | 7.0% |
N | 71 | 5.7% |
A | 63 | 5.1% |
O | 63 | 5.1% |
M | 60 | 4.9% |
Other values (15) | 350 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 117 | |
t | 104 | |
e | 89 | |
n | 82 | |
c | 76 | |
d | 72 | 7.9% |
a | 59 | 6.5% |
i | 52 | 5.7% |
r | 42 | 4.6% |
l | 33 | 3.6% |
Other values (15) | 184 |
Decimal Number
Value | Count | Frequency (%) |
1 | 20 | |
2 | 11 | |
3 | 9 | |
5 | 9 | |
6 | 4 | 5.8% |
9 | 4 | 5.8% |
0 | 4 | 5.8% |
4 | 3 | 4.3% |
8 | 3 | 4.3% |
7 | 2 | 2.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 184 | |
, | 66 | 23.9% |
& | 24 | 8.7% |
/ | 1 | 0.4% |
' | 1 | 0.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1106 | |
] | 1 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1104 | |
[ | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
4749 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 3797 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 18 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 71266 | |
Common | 7324 | 9.1% |
Latin | 2145 | 2.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 5145 | 7.2% |
사 | 4503 | 6.3% |
회 | 4362 | 6.1% |
식 | 4249 | 6.0% |
㈜ | 3797 | 5.3% |
이 | 3612 | 5.1% |
스 | 2964 | 4.2% |
에 | 1615 | 2.3% |
아 | 1046 | 1.5% |
트 | 875 | 1.2% |
Other values (833) | 39098 |
Latin
Value | Count | Frequency (%) |
C | 142 | 6.6% |
o | 117 | 5.5% |
T | 107 | 5.0% |
L | 105 | 4.9% |
t | 104 | 4.8% |
E | 99 | 4.6% |
e | 89 | 4.1% |
I | 89 | 4.1% |
S | 86 | 4.0% |
n | 82 | 3.8% |
Other values (40) | 1125 |
Common
Value | Count | Frequency (%) |
4749 | ||
) | 1106 | 15.1% |
( | 1104 | 15.1% |
. | 184 | 2.5% |
, | 66 | 0.9% |
& | 24 | 0.3% |
1 | 20 | 0.3% |
- | 18 | 0.2% |
2 | 11 | 0.2% |
3 | 9 | 0.1% |
Other values (11) | 33 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 67469 | |
ASCII | 9469 | 11.7% |
None | 3797 | 4.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 5145 | 7.6% |
사 | 4503 | 6.7% |
회 | 4362 | 6.5% |
식 | 4249 | 6.3% |
이 | 3612 | 5.4% |
스 | 2964 | 4.4% |
에 | 1615 | 2.4% |
아 | 1046 | 1.6% |
트 | 875 | 1.3% |
리 | 866 | 1.3% |
Other values (832) | 38232 |
ASCII
Value | Count | Frequency (%) |
4749 | ||
) | 1106 | 11.7% |
( | 1104 | 11.7% |
. | 184 | 1.9% |
C | 142 | 1.5% |
o | 117 | 1.2% |
T | 107 | 1.1% |
L | 105 | 1.1% |
t | 104 | 1.1% |
E | 99 | 1.0% |
Other values (61) | 1652 | 17.4% |
None
Value | Count | Frequency (%) |
㈜ | 3797 |
대표자명
Text
Distinct | 431 |
---|---|
Distinct (%) | 4.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
김 | 2028 | |
이 | 1447 | 14.5% |
박 | 811 | 8.1% |
최 | 438 | 4.4% |
정 | 424 | 4.2% |
조 | 299 | 3.0% |
강 | 246 | 2.5% |
장 | 188 | 1.9% |
임 | 186 | 1.9% |
윤 | 184 | 1.8% |
Other values (421) | 3749 |
Most occurring characters
Value | Count | Frequency (%) |
* | 21164 | |
김 | 2256 | 7.0% |
이 | 1629 | 5.0% |
박 | 905 | 2.8% |
, | 582 | 1.8% |
최 | 500 | 1.5% |
정 | 478 | 1.5% |
조 | 331 | 1.0% |
강 | 281 | 0.9% |
장 | 212 | 0.7% |
Other values (111) | 3990 | 12.3% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 21746 | |
Other Letter | 10537 | |
Uppercase Letter | 45 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 2256 | |
이 | 1629 | |
박 | 905 | 8.6% |
최 | 500 | 4.7% |
정 | 478 | 4.5% |
조 | 331 | 3.1% |
강 | 281 | 2.7% |
장 | 212 | 2.0% |
임 | 212 | 2.0% |
윤 | 209 | 2.0% |
Other values (94) | 3524 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 9 | |
K | 9 | |
C | 6 | |
J | 3 | 6.7% |
P | 3 | 6.7% |
B | 2 | 4.4% |
Z | 2 | 4.4% |
Y | 2 | 4.4% |
H | 2 | 4.4% |
S | 2 | 4.4% |
Other values (5) | 5 |
Other Punctuation
Value | Count | Frequency (%) |
* | 21164 | |
, | 582 | 2.7% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 21746 | |
Hangul | 10537 | |
Latin | 45 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 2256 | |
이 | 1629 | |
박 | 905 | 8.6% |
최 | 500 | 4.7% |
정 | 478 | 4.5% |
조 | 331 | 3.1% |
강 | 281 | 2.7% |
장 | 212 | 2.0% |
임 | 212 | 2.0% |
윤 | 209 | 2.0% |
Other values (94) | 3524 |
Latin
Value | Count | Frequency (%) |
L | 9 | |
K | 9 | |
C | 6 | |
J | 3 | 6.7% |
P | 3 | 6.7% |
B | 2 | 4.4% |
Z | 2 | 4.4% |
Y | 2 | 4.4% |
H | 2 | 4.4% |
S | 2 | 4.4% |
Other values (5) | 5 |
Common
Value | Count | Frequency (%) |
* | 21164 | |
, | 582 | 2.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 21791 | |
Hangul | 10537 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 21164 | |
, | 582 | 2.7% |
L | 9 | < 0.1% |
K | 9 | < 0.1% |
C | 6 | < 0.1% |
J | 3 | < 0.1% |
P | 3 | < 0.1% |
B | 2 | < 0.1% |
Z | 2 | < 0.1% |
Y | 2 | < 0.1% |
Other values (7) | 9 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
김 | 2256 | |
이 | 1629 | |
박 | 905 | 8.6% |
최 | 500 | 4.7% |
정 | 478 | 4.5% |
조 | 331 | 3.1% |
강 | 281 | 2.7% |
장 | 212 | 2.0% |
임 | 212 | 2.0% |
윤 | 209 | 2.0% |
Other values (94) | 3524 |
벤처확인유형
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
혁신성장유형 | |
---|---|
연구개발유형 | |
벤처투자유형 | |
예비벤처유형 | 68 |
기술평가보증기업(기금) | 21 |
Length
Max length | 14 |
---|---|
Median length | 6 |
Mean length | 6.0254 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 혁신성장유형 |
---|---|
2nd row | 혁신성장유형 |
3rd row | 혁신성장유형 |
4th row | 벤처투자유형 |
5th row | 연구개발유형 |
Common Values
Value | Count | Frequency (%) |
혁신성장유형 | 6339 | |
연구개발유형 | 1858 | 18.6% |
벤처투자유형 | 1698 | 17.0% |
예비벤처유형 | 68 | 0.7% |
기술평가보증기업(기금) | 21 | 0.2% |
기술평가대출기업(중진공) | 16 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
혁신성장유형 | 6339 | |
연구개발유형 | 1858 | 18.6% |
벤처투자유형 | 1698 | 17.0% |
예비벤처유형 | 68 | 0.7% |
기술평가보증기업(기금 | 21 | 0.2% |
기술평가대출기업(중진공 | 16 | 0.2% |
지역
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기 | |
---|---|
서울 | |
부산 | |
인천 | |
대전 | |
Other values (12) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 충북 |
---|---|
2nd row | 부산 |
3rd row | 충북 |
4th row | 경기 |
5th row | 경북 |
Common Values
Value | Count | Frequency (%) |
경기 | 3146 | |
서울 | 2848 | |
부산 | 487 | 4.9% |
인천 | 464 | 4.6% |
대전 | 401 | 4.0% |
경남 | 388 | 3.9% |
대구 | 342 | 3.4% |
경북 | 340 | 3.4% |
충남 | 336 | 3.4% |
충북 | 231 | 2.3% |
Other values (7) | 1017 | 10.2% |
Length
Value | Count | Frequency (%) |
경기 | 3146 | |
서울 | 2848 | |
부산 | 487 | 4.9% |
인천 | 464 | 4.6% |
대전 | 401 | 4.0% |
경남 | 388 | 3.9% |
대구 | 342 | 3.4% |
경북 | 340 | 3.4% |
충남 | 336 | 3.4% |
충북 | 231 | 2.3% |
Other values (7) | 1017 | 10.2% |
주소
Text
Distinct | 241 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
경기도 | 3146 | 15.7% |
서울특별시 | 2848 | 14.2% |
강남구 | 652 | 3.3% |
부산광역시 | 487 | 2.4% |
성남시 | 476 | 2.4% |
인천광역시 | 464 | 2.3% |
화성시 | 421 | 2.1% |
대전광역시 | 401 | 2.0% |
경상남도 | 388 | 1.9% |
대구광역시 | 342 | 1.7% |
Other values (226) | 10375 |
Most occurring characters
Value | Count | Frequency (%) |
10000 | 12.2% | |
시 | 9771 | 12.0% |
구 | 5244 | 6.4% |
도 | 5141 | 6.3% |
경 | 3963 | 4.9% |
서 | 3716 | 4.6% |
기 | 3183 | 3.9% |
울 | 3018 | 3.7% |
특 | 2949 | 3.6% |
별 | 2949 | 3.6% |
Other values (148) | 31705 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 71625 | |
Space Separator | 10000 | 12.2% |
Decimal Number | 14 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 9771 | 13.6% |
구 | 5244 | 7.3% |
도 | 5141 | 7.2% |
경 | 3963 | 5.5% |
서 | 3716 | 5.2% |
기 | 3183 | 4.4% |
울 | 3018 | 4.2% |
특 | 2949 | 4.1% |
별 | 2949 | 4.1% |
광 | 2431 | 3.4% |
Other values (143) | 29260 |
Decimal Number
Value | Count | Frequency (%) |
7 | 8 | |
1 | 4 | |
2 | 1 | 7.1% |
3 | 1 | 7.1% |
Space Separator
Value | Count | Frequency (%) |
10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 71625 | |
Common | 10014 | 12.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 9771 | 13.6% |
구 | 5244 | 7.3% |
도 | 5141 | 7.2% |
경 | 3963 | 5.5% |
서 | 3716 | 5.2% |
기 | 3183 | 4.4% |
울 | 3018 | 4.2% |
특 | 2949 | 4.1% |
별 | 2949 | 4.1% |
광 | 2431 | 3.4% |
Other values (143) | 29260 |
Common
Value | Count | Frequency (%) |
10000 | ||
7 | 8 | 0.1% |
1 | 4 | < 0.1% |
2 | 1 | < 0.1% |
3 | 1 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 71625 | |
ASCII | 10014 | 12.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10000 | ||
7 | 8 | 0.1% |
1 | 4 | < 0.1% |
2 | 1 | < 0.1% |
3 | 1 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
시 | 9771 | 13.6% |
구 | 5244 | 7.3% |
도 | 5141 | 7.2% |
경 | 3963 | 5.5% |
서 | 3716 | 5.2% |
기 | 3183 | 4.4% |
울 | 3018 | 4.2% |
특 | 2949 | 4.1% |
별 | 2949 | 4.1% |
광 | 2431 | 3.4% |
Other values (143) | 29260 |
업종분류
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
제조업 | |
---|---|
정보처리S/W | |
기타 | |
연구개발서비스 | 387 |
도소매업 | 359 |
Other values (2) | 244 |
Length
Max length | 8 |
---|---|
Median length | 3 |
Mean length | 4.0001 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 제조업 |
---|---|
2nd row | 제조업 |
3rd row | 제조업 |
4th row | 건설운수 |
5th row | 정보처리S/W |
Common Values
Value | Count | Frequency (%) |
제조업 | 5886 | |
정보처리S/W | 2166 | 21.7% |
기타 | 958 | 9.6% |
연구개발서비스 | 387 | 3.9% |
도소매업 | 359 | 3.6% |
건설운수 | 208 | 2.1% |
농,어,임,광업 | 36 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
제조업 | 5886 | |
정보처리s/w | 2166 | 21.7% |
기타 | 958 | 9.6% |
연구개발서비스 | 387 | 3.9% |
도소매업 | 359 | 3.6% |
건설운수 | 208 | 2.1% |
농,어,임,광업 | 36 | 0.4% |
업종명
Text
Distinct | 704 |
---|---|
Distinct (%) | 7.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 29 |
---|---|
Median length | 24 |
Mean length | 15.5258 |
Min length | 3 |
Characters and Unicode
Total characters | 155258 |
---|---|
Distinct characters | 398 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 168 ? |
---|---|
Unique (%) | 1.7% |
Sample
1st row | 접착제 및 젤라틴 제조업 |
---|---|
2nd row | 기기용 자동측정 및 제어장치 제조업 |
3rd row | 수프 및 균질화식품 제조업 |
4th row | 냉장 및 냉동 창고업 |
5th row | 응용 소프트웨어 개발 및 공급업 |
Value | Count | Frequency (%) |
제조업 | 5561 | 12.2% |
및 | 4511 | 9.9% |
기타 | 3365 | 7.4% |
외 | 1830 | 4.0% |
그 | 1825 | 4.0% |
서비스업 | 1304 | 2.9% |
소프트웨어 | 1216 | 2.7% |
공급업 | 1211 | 2.7% |
개발 | 1206 | 2.7% |
응용 | 791 | 1.7% |
Other values (1049) | 22638 |
Most occurring characters
Value | Count | Frequency (%) |
35460 | ||
업 | 10249 | 6.6% |
제 | 7523 | 4.8% |
기 | 6909 | 4.5% |
조 | 6309 | 4.1% |
및 | 4511 | 2.9% |
타 | 3386 | 2.2% |
용 | 2738 | 1.8% |
스 | 2461 | 1.6% |
공 | 2202 | 1.4% |
Other values (388) | 73510 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 118834 | |
Space Separator | 35460 | 22.8% |
Other Punctuation | 876 | 0.6% |
Decimal Number | 32 | < 0.1% |
Open Punctuation | 28 | < 0.1% |
Close Punctuation | 28 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 10249 | 8.6% |
제 | 7523 | 6.3% |
기 | 6909 | 5.8% |
조 | 6309 | 5.3% |
및 | 4511 | 3.8% |
타 | 3386 | 2.8% |
용 | 2738 | 2.3% |
스 | 2461 | 2.1% |
공 | 2202 | 1.9% |
그 | 2171 | 1.8% |
Other values (382) | 70375 |
Other Punctuation
Value | Count | Frequency (%) |
, | 869 | |
. | 7 | 0.8% |
Space Separator
Value | Count | Frequency (%) |
35460 |
Decimal Number
Value | Count | Frequency (%) |
1 | 32 |
Open Punctuation
Value | Count | Frequency (%) |
( | 28 |
Close Punctuation
Value | Count | Frequency (%) |
) | 28 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 118834 | |
Common | 36424 | 23.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 10249 | 8.6% |
제 | 7523 | 6.3% |
기 | 6909 | 5.8% |
조 | 6309 | 5.3% |
및 | 4511 | 3.8% |
타 | 3386 | 2.8% |
용 | 2738 | 2.3% |
스 | 2461 | 2.1% |
공 | 2202 | 1.9% |
그 | 2171 | 1.8% |
Other values (382) | 70375 |
Common
Value | Count | Frequency (%) |
35460 | ||
, | 869 | 2.4% |
1 | 32 | 0.1% |
( | 28 | 0.1% |
) | 28 | 0.1% |
. | 7 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 118762 | |
ASCII | 36424 | 23.5% |
Compat Jamo | 72 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
35460 | ||
, | 869 | 2.4% |
1 | 32 | 0.1% |
( | 28 | 0.1% |
) | 28 | 0.1% |
. | 7 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
업 | 10249 | 8.6% |
제 | 7523 | 6.3% |
기 | 6909 | 5.8% |
조 | 6309 | 5.3% |
및 | 4511 | 3.8% |
타 | 3386 | 2.9% |
용 | 2738 | 2.3% |
스 | 2461 | 2.1% |
공 | 2202 | 1.9% |
그 | 2171 | 1.8% |
Other values (381) | 70303 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 72 |
주생산품
Text
Distinct | 8972 |
---|---|
Distinct (%) | 90.3% |
Missing | 68 |
Missing (%) | 0.7% |
Memory size | 156.2 KiB |
Length
Max length | 114 |
---|---|
Median length | 84 |
Mean length | 12.535441 |
Min length | 1 |
Characters and Unicode
Total characters | 124502 |
---|---|
Distinct characters | 948 |
Distinct categories | 15 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 8665 ? |
---|---|
Unique (%) | 87.2% |
Sample
1st row | 건축자재용 접착제, 폴리우레탄 |
---|---|
2nd row | 주문식 제어장치 |
3rd row | 복합조미시즈닝엑기스소스 |
4th row | 기업형 식자재 유통물류서비스 |
5th row | 대학정보시스템 인공지능솔루션 |
Value | Count | Frequency (%) |
및 | 1277 | 5.1% |
소프트웨어 | 477 | 1.9% |
개발 | 374 | 1.5% |
서비스 | 326 | 1.3% |
등 | 280 | 1.1% |
외 | 273 | 1.1% |
플랫폼 | 235 | 0.9% |
시스템 | 190 | 0.8% |
솔루션 | 185 | 0.7% |
화장품 | 160 | 0.6% |
Other values (11500) | 21282 |
Most occurring characters
Value | Count | Frequency (%) |
15574 | 12.5% | |
, | 3347 | 2.7% |
기 | 3341 | 2.7% |
스 | 2444 | 2.0% |
품 | 1653 | 1.3% |
제 | 1637 | 1.3% |
비 | 1532 | 1.2% |
장 | 1520 | 1.2% |
및 | 1464 | 1.2% |
트 | 1456 | 1.2% |
Other values (938) | 90534 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 92343 | |
Space Separator | 15574 | 12.5% |
Uppercase Letter | 6831 | 5.5% |
Lowercase Letter | 4624 | 3.7% |
Other Punctuation | 3883 | 3.1% |
Close Punctuation | 451 | 0.4% |
Open Punctuation | 356 | 0.3% |
Decimal Number | 345 | 0.3% |
Dash Punctuation | 78 | 0.1% |
Math Symbol | 10 | < 0.1% |
Other values (5) | 7 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 3341 | 3.6% |
스 | 2444 | 2.6% |
품 | 1653 | 1.8% |
제 | 1637 | 1.8% |
비 | 1532 | 1.7% |
장 | 1520 | 1.6% |
및 | 1464 | 1.6% |
트 | 1456 | 1.6% |
용 | 1389 | 1.5% |
어 | 1384 | 1.5% |
Other values (851) | 74523 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 681 | 10.0% |
C | 556 | 8.1% |
E | 543 | 7.9% |
I | 492 | 7.2% |
D | 491 | 7.2% |
T | 481 | 7.0% |
P | 437 | 6.4% |
A | 423 | 6.2% |
L | 377 | 5.5% |
R | 376 | 5.5% |
Other values (16) | 1974 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 559 | |
o | 439 | 9.5% |
a | 417 | 9.0% |
t | 375 | 8.1% |
i | 363 | 7.9% |
r | 361 | 7.8% |
l | 258 | 5.6% |
n | 254 | 5.5% |
s | 208 | 4.5% |
c | 197 | 4.3% |
Other values (16) | 1193 |
Other Punctuation
Value | Count | Frequency (%) |
, | 3347 | |
/ | 299 | 7.7% |
. | 111 | 2.9% |
& | 63 | 1.6% |
; | 38 | 1.0% |
: | 16 | 0.4% |
· | 5 | 0.1% |
* | 2 | 0.1% |
! | 1 | < 0.1% |
% | 1 | < 0.1% |
Decimal Number
Value | Count | Frequency (%) |
3 | 95 | |
2 | 94 | |
1 | 49 | |
0 | 30 | 8.7% |
5 | 23 | 6.7% |
4 | 17 | 4.9% |
9 | 11 | 3.2% |
7 | 10 | 2.9% |
8 | 8 | 2.3% |
6 | 8 | 2.3% |
Open Punctuation
Value | Count | Frequency (%) |
( | 354 | |
{ | 1 | 0.3% |
[ | 1 | 0.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 450 | |
} | 1 | 0.2% |
Math Symbol
Value | Count | Frequency (%) |
+ | 6 | |
| | 4 |
Other Symbol
Value | Count | Frequency (%) |
® | 1 | |
™ | 1 |
Space Separator
Value | Count | Frequency (%) |
15574 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 78 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Initial Punctuation
Value | Count | Frequency (%) |
“ | 1 |
Final Punctuation
Value | Count | Frequency (%) |
” | 1 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 92324 | |
Common | 20704 | 16.6% |
Latin | 11455 | 9.2% |
Han | 19 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 3341 | 3.6% |
스 | 2444 | 2.6% |
품 | 1653 | 1.8% |
제 | 1637 | 1.8% |
비 | 1532 | 1.7% |
장 | 1520 | 1.6% |
및 | 1464 | 1.6% |
트 | 1456 | 1.6% |
용 | 1389 | 1.5% |
어 | 1384 | 1.5% |
Other values (848) | 74504 |
Latin
Value | Count | Frequency (%) |
S | 681 | 5.9% |
e | 559 | 4.9% |
C | 556 | 4.9% |
E | 543 | 4.7% |
I | 492 | 4.3% |
D | 491 | 4.3% |
T | 481 | 4.2% |
o | 439 | 3.8% |
P | 437 | 3.8% |
A | 423 | 3.7% |
Other values (42) | 6353 |
Common
Value | Count | Frequency (%) |
15574 | ||
, | 3347 | 16.2% |
) | 450 | 2.2% |
( | 354 | 1.7% |
/ | 299 | 1.4% |
. | 111 | 0.5% |
3 | 95 | 0.5% |
2 | 94 | 0.5% |
- | 78 | 0.4% |
& | 63 | 0.3% |
Other values (25) | 239 | 1.2% |
Han
Value | Count | Frequency (%) |
外 | 17 | |
茶 | 1 | 5.3% |
用 | 1 | 5.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 92324 | |
ASCII | 32150 | 25.8% |
CJK | 19 | < 0.1% |
None | 6 | < 0.1% |
Punctuation | 2 | < 0.1% |
Letterlike Symbols | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
15574 | ||
, | 3347 | 10.4% |
S | 681 | 2.1% |
e | 559 | 1.7% |
C | 556 | 1.7% |
E | 543 | 1.7% |
I | 492 | 1.5% |
D | 491 | 1.5% |
T | 481 | 1.5% |
) | 450 | 1.4% |
Other values (72) | 8976 |
Hangul
Value | Count | Frequency (%) |
기 | 3341 | 3.6% |
스 | 2444 | 2.6% |
품 | 1653 | 1.8% |
제 | 1637 | 1.8% |
비 | 1532 | 1.7% |
장 | 1520 | 1.6% |
및 | 1464 | 1.6% |
트 | 1456 | 1.6% |
용 | 1389 | 1.5% |
어 | 1384 | 1.5% |
Other values (848) | 74504 |
CJK
Value | Count | Frequency (%) |
外 | 17 | |
茶 | 1 | 5.3% |
用 | 1 | 5.3% |
None
Value | Count | Frequency (%) |
· | 5 | |
® | 1 | 16.7% |
Punctuation
Value | Count | Frequency (%) |
“ | 1 | |
” | 1 |
Letterlike Symbols
Value | Count | Frequency (%) |
™ | 1 |
유효시작일
Date
Distinct | 753 |
---|---|
Distinct (%) | 7.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2021-01-25 00:00:00 |
---|---|
Maximum | 2023-03-30 00:00:00 |
유효종료일
Date
Distinct | 775 |
---|---|
Distinct (%) | 7.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2023-03-31 00:00:00 |
---|---|
Maximum | 2026-03-29 00:00:00 |
벤처확인기관
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
벤처기업확인기관 | |
---|---|
기술보증기금 기술평가센터 | 23 |
중소기업진흥공단 | 18 |
Length
Max length | 13 |
---|---|
Median length | 8 |
Mean length | 8.0115 |
Min length | 8 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 벤처기업확인기관 |
---|---|
2nd row | 벤처기업확인기관 |
3rd row | 벤처기업확인기관 |
4th row | 벤처기업확인기관 |
5th row | 벤처기업확인기관 |
Common Values
Value | Count | Frequency (%) |
벤처기업확인기관 | 9959 | |
기술보증기금 기술평가센터 | 23 | 0.2% |
중소기업진흥공단 | 18 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
벤처기업확인기관 | 9959 | |
기술보증기금 | 23 | 0.2% |
기술평가센터 | 23 | 0.2% |
중소기업진흥공단 | 18 | 0.2% |
연번 | 벤처확인유형 | 지역 | 업종분류 | 벤처확인기관 | |
---|---|---|---|---|---|
연번 | 1.000 | 0.180 | 0.057 | 0.050 | 0.217 |
벤처확인유형 | 0.180 | 1.000 | 0.250 | 0.265 | 0.998 |
지역 | 0.057 | 0.250 | 1.000 | 0.422 | 0.082 |
업종분류 | 0.050 | 0.265 | 0.422 | 1.000 | 0.000 |
벤처확인기관 | 0.217 | 0.998 | 0.082 | 0.000 | 1.000 |
벤처확인기관 | 지역 | 업종분류 | 벤처확인유형 | |
---|---|---|---|---|
벤처확인기관 | 1.000 | 0.043 | 0.000 | 0.949 |
지역 | 0.043 | 1.000 | 0.205 | 0.120 |
업종분류 | 0.000 | 0.205 | 1.000 | 0.161 |
벤처확인유형 | 0.949 | 0.120 | 0.161 | 1.000 |
연번 | 벤처확인유형 | 지역 | 업종분류 | 벤처확인기관 | |
---|---|---|---|---|---|
연번 | 1.000 | 0.095 | 0.022 | 0.025 | 0.132 |
벤처확인유형 | 0.095 | 1.000 | 0.120 | 0.161 | 0.949 |
지역 | 0.022 | 0.120 | 1.000 | 0.205 | 0.043 |
업종분류 | 0.025 | 0.161 | 0.205 | 1.000 | 0.000 |
벤처확인기관 | 0.132 | 0.949 | 0.043 | 0.000 | 1.000 |
연번 | 업체명 | 대표자명 | 벤처확인유형 | 지역 | 주소 | 업종분류 | 업종명 | 주생산품 | 유효시작일 | 유효종료일 | 벤처확인기관 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
4586 | 4587 | ㈜가원폴리텍 | 김** | 혁신성장유형 | 충북 | 충청북도 청주시 | 제조업 | 접착제 및 젤라틴 제조업 | 건축자재용 접착제, 폴리우레탄 | 2021-05-26 | 2024-05-25 | 벤처기업확인기관 |
22427 | 22428 | 다안 스마트 이엔지 | 김** | 혁신성장유형 | 부산 | 부산광역시 해운대구 | 제조업 | 기기용 자동측정 및 제어장치 제조업 | 주문식 제어장치 | 2022-05-30 | 2025-05-29 | 벤처기업확인기관 |
23218 | 23219 | 주식회사 호반식품 | 박** | 혁신성장유형 | 충북 | 충청북도 청주시 | 제조업 | 수프 및 균질화식품 제조업 | 복합조미시즈닝엑기스소스 | 2022-03-24 | 2025-03-23 | 벤처기업확인기관 |
14546 | 14547 | 뉴통 주식회사 | 김** | 벤처투자유형 | 경기 | 경기도 고양시 | 건설운수 | 냉장 및 냉동 창고업 | 기업형 식자재 유통물류서비스 | 2021-12-08 | 2024-12-07 | 벤처기업확인기관 |
34399 | 34400 | ㈜에이앤티랩스 | 윤** | 연구개발유형 | 경북 | 경상북도 구미시 | 정보처리S/W | 응용 소프트웨어 개발 및 공급업 | 대학정보시스템 인공지능솔루션 | 2023-01-08 | 2026-01-07 | 벤처기업확인기관 |
18048 | 18049 | 주식회사 리신바이오 | 박** | 벤처투자유형 | 대전 | 대전광역시 유성구 | 연구개발서비스 | 의학 및 약학 연구개발업 | 항생제 개발 연구 | 2022-02-23 | 2025-02-22 | 벤처기업확인기관 |
6399 | 6400 | 소성정보기술 주식회사 | 김** | 혁신성장유형 | 서울 | 서울특별시 구로구 | 제조업 | 방송장비 제조업 | 방송장비,CCTV,출입통제 외 | 2021-07-10 | 2024-07-09 | 벤처기업확인기관 |
33494 | 33495 | 주식회사 큐브인스트루먼트 | 이** | 연구개발유형 | 대전 | 대전광역시 유성구 | 제조업 | 그 외 기타 의료용 기기 제조업 | 저온 플라즈마 멸균기 | 2023-02-09 | 2026-02-08 | 벤처기업확인기관 |
9263 | 9264 | 엔아이피(NIP) | 이** | 혁신성장유형 | 세종 | 세종특별자치시 집현중앙7로 | 연구개발서비스 | 기타 공학 연구개발업 | 노즐 및 디자인 | 2021-09-02 | 2024-09-01 | 벤처기업확인기관 |
35385 | 35386 | 주식회사 아이투프럼 | 이**,라** | 벤처투자유형 | 서울 | 서울특별시 강남구 | 제조업 | 전자감지장치 제조업 | 무선 디지털카운터 | 2023-03-02 | 2026-03-01 | 벤처기업확인기관 |
연번 | 업체명 | 대표자명 | 벤처확인유형 | 지역 | 주소 | 업종분류 | 업종명 | 주생산품 | 유효시작일 | 유효종료일 | 벤처확인기관 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
518 | 519 | ㈜큐아이티 | 배** | 연구개발유형 | 경기 | 경기도 수원시 | 제조업 | 기타 전기 변환장치 제조업 | 전기변환장치 | 2021-03-05 | 2024-03-04 | 벤처기업확인기관 |
5384 | 5385 | ㈜텔레큐브 | 정** | 혁신성장유형 | 서울 | 서울특별시 영등포구 | 정보처리S/W | 컴퓨터 프로그래밍 서비스업 | 전자문서 솔루션 개발, 교환기 구축 | 2021-06-09 | 2024-06-08 | 벤처기업확인기관 |
18324 | 18325 | ㈜필텍 | 김** | 혁신성장유형 | 전북 | 전라북도 군산시 | 제조업 | 그 외 기타 의료용 기기 제조업 | 일회용 주사기 | 2022-03-26 | 2025-03-25 | 벤처기업확인기관 |
19195 | 19196 | ㈜이너웨이브 | 이** | 혁신성장유형 | 서울 | 서울특별시 금천구 | 정보처리S/W | 컴퓨터 프로그래밍 서비스업 | 응용 소프트웨어 | 2022-02-23 | 2025-02-22 | 벤처기업확인기관 |
28999 | 29000 | 주식회사 비밥소프트웨어 | 전** | 혁신성장유형 | 인천 | 인천광역시 연수구 | 정보처리S/W | 응용 소프트웨어 개발 및 공급업 | 스프트웨어 | 2022-09-18 | 2025-09-17 | 벤처기업확인기관 |
255 | 256 | ㈜시루정보 | 류** | 연구개발유형 | 서울 | 서울특별시 마포구 | 정보처리S/W | 컴퓨터 프로그래밍 서비스업 | 모바일결제, 모바일인증 S/W | 2021-02-11 | 2024-02-10 | 벤처기업확인기관 |
3466 | 3467 | 주식회사 제이씨엔터웍스 | 박** | 혁신성장유형 | 서울 | 서울특별시 강남구 | 기타 | 영화, 비디오물 및 방송프로그램 배급업 | 영화제작,수입,배급 | 2021-05-28 | 2024-05-27 | 벤처기업확인기관 |
18982 | 18983 | 주식회사 넥사 | 주** | 연구개발유형 | 서울 | 서울특별시 송파구 | 제조업 | 반도체 제조용 기계 제조업 | 자동화기계기구, 제조설계용역 | 2022-04-14 | 2025-04-13 | 벤처기업확인기관 |
27981 | 27982 | 주식회사 마켓오브메테리얼 | 조** | 벤처투자유형 | 울산 | 울산광역시 울주군 | 도소매업 | 전자상거래 소매 중개업 | 플랜트 자재 거래 | 2022-08-17 | 2025-08-16 | 벤처기업확인기관 |
7419 | 7420 | ㈜신성금속 | 최** | 혁신성장유형 | 인천 | 인천광역시 남동구 | 제조업 | 톱 및 호환성 공구 제조업 | 절삭공구제조 | 2021-08-25 | 2024-08-24 | 벤처기업확인기관 |