Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 337 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 19.5 KiB |
Average record size in memory | 59.4 B |
Variable types
Categorical | 4 |
---|---|
Text | 2 |
Numeric | 1 |
Dataset
Description | 기업인력애로센터 보조사업(스마트제조기업 일자리 패키지사업)을 통한 기업-구직자 취업매칭 목록- 스마트공장도입(예정)기업에 인력매칭-현장교육-인건비 및 참여보조비 지원 |
---|---|
Author | 중소벤처기업진흥공단 |
URL | https://www.data.go.kr/data/15100252/fileData.do |
업종 is highly imbalanced (89.5%) | Imbalance |
Reproduction
Analysis started | 2024-03-23 05:45:47.261584 |
---|---|
Analysis finished | 2024-03-23 05:45:57.963354 |
Duration | 10.7 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
참여년도
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.8 KiB |
2022 | |
---|---|
2023 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023 |
---|---|
2nd row | 2023 |
3rd row | 2023 |
4th row | 2023 |
5th row | 2023 |
Common Values
Value | Count | Frequency (%) |
2022 | 173 | |
2023 | 164 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2022 | 173 | |
2023 | 164 |
기업명
Text
Distinct | 301 |
---|---|
Distinct (%) | 89.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.8 KiB |
Length
Max length | 16 |
---|---|
Median length | 14 |
Mean length | 7.5964392 |
Min length | 2 |
Characters and Unicode
Total characters | 2560 |
---|---|
Distinct characters | 275 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 265 ? |
---|---|
Unique (%) | 78.6% |
Sample
1st row | 영일엔지니어링(주) |
---|---|
2nd row | (주)드림애드앤프린팅그룹 |
3rd row | 장한기술(주) |
4th row | 스마트엠 |
5th row | 대신엠씨(주) |
Value | Count | Frequency (%) |
가스켐테크놀로지(주 | 3 | 0.9% |
아성플라스틱밸브(주 | 2 | 0.6% |
코엠테크(주 | 2 | 0.6% |
주)한백정밀 | 2 | 0.6% |
미크론 | 2 | 0.6% |
주)위드멤스 | 2 | 0.6% |
주)화인트로 | 2 | 0.6% |
주)아폴로산업 | 2 | 0.6% |
한본인더스트리(주 | 2 | 0.6% |
주)페이퍼팩 | 2 | 0.6% |
Other values (293) | 320 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 276 | 10.8% |
) | 272 | 10.6% |
( | 272 | 10.6% |
이 | 84 | 3.3% |
스 | 82 | 3.2% |
크 | 50 | 2.0% |
에 | 48 | 1.9% |
업 | 44 | 1.7% |
테 | 44 | 1.7% |
아 | 41 | 1.6% |
Other values (265) | 1347 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2002 | |
Close Punctuation | 272 | 10.6% |
Open Punctuation | 272 | 10.6% |
Space Separator | 5 | 0.2% |
Uppercase Letter | 4 | 0.2% |
Control | 2 | 0.1% |
Decimal Number | 2 | 0.1% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 276 | 13.8% |
이 | 84 | 4.2% |
스 | 82 | 4.1% |
크 | 50 | 2.5% |
에 | 48 | 2.4% |
업 | 44 | 2.2% |
테 | 44 | 2.2% |
아 | 41 | 2.0% |
지 | 32 | 1.6% |
리 | 32 | 1.6% |
Other values (256) | 1269 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 2 | |
K | 1 | |
H | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 272 |
Open Punctuation
Value | Count | Frequency (%) |
( | 272 |
Space Separator
Value | Count | Frequency (%) |
5 |
Control
Value | Count | Frequency (%) |
2 |
Decimal Number
Value | Count | Frequency (%) |
6 | 2 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2002 | |
Common | 554 | 21.6% |
Latin | 4 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 276 | 13.8% |
이 | 84 | 4.2% |
스 | 82 | 4.1% |
크 | 50 | 2.5% |
에 | 48 | 2.4% |
업 | 44 | 2.2% |
테 | 44 | 2.2% |
아 | 41 | 2.0% |
지 | 32 | 1.6% |
리 | 32 | 1.6% |
Other values (256) | 1269 |
Common
Value | Count | Frequency (%) |
) | 272 | |
( | 272 | |
5 | 0.9% | |
2 | 0.4% | |
6 | 2 | 0.4% |
& | 1 | 0.2% |
Latin
Value | Count | Frequency (%) |
C | 2 | |
K | 1 | |
H | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2002 | |
ASCII | 558 | 21.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 276 | 13.8% |
이 | 84 | 4.2% |
스 | 82 | 4.1% |
크 | 50 | 2.5% |
에 | 48 | 2.4% |
업 | 44 | 2.2% |
테 | 44 | 2.2% |
아 | 41 | 2.0% |
지 | 32 | 1.6% |
리 | 32 | 1.6% |
Other values (256) | 1269 |
ASCII
Value | Count | Frequency (%) |
) | 272 | |
( | 272 | |
5 | 0.9% | |
C | 2 | 0.4% |
2 | 0.4% | |
6 | 2 | 0.4% |
K | 1 | 0.2% |
H | 1 | 0.2% |
& | 1 | 0.2% |
사업자번호
Real number (ℝ)
Distinct | 286 |
---|---|
Distinct (%) | 84.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.4761642 × 109 |
Minimum | 1.0288002 × 109 |
---|---|
Maximum | 8.9985003 × 109 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.1 KiB |
Quantile statistics
Minimum | 1.0288002 × 109 |
---|---|
5-th percentile | 1.1221497 × 109 |
Q1 | 1.3186552 × 109 |
median | 3.1286233 × 109 |
Q3 | 5.3486002 × 109 |
95-th percentile | 6.4421011 × 109 |
Maximum | 8.9985003 × 109 |
Range | 7.9697001 × 109 |
Interquartile range (IQR) | 4.0299451 × 109 |
Descriptive statistics
Standard deviation | 2.1493002 × 109 |
---|---|
Coefficient of variation (CV) | 0.61829652 |
Kurtosis | -1.1834137 |
Mean | 3.4761642 × 109 |
Median Absolute Deviation (MAD) | 1.8701012 × 109 |
Skewness | 0.3978048 |
Sum | 1.1714673 × 1012 |
Variance | 4.6194914 × 1018 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
6078163163 | 2 | 0.6% |
1308126673 | 2 | 0.6% |
1308162965 | 2 | 0.6% |
1308631832 | 2 | 0.6% |
1308658485 | 2 | 0.6% |
1048149624 | 2 | 0.6% |
1318651001 | 2 | 0.6% |
6092423242 | 2 | 0.6% |
6088162643 | 2 | 0.6% |
1348127048 | 2 | 0.6% |
Other values (276) | 317 |
Value | Count | Frequency (%) |
1028800167 | 1 | |
1048149624 | 2 | |
1058765032 | 1 | |
1068125254 | 2 | |
1071687880 | 2 | |
1078159849 | 1 | |
1078171936 | 1 | |
1078616618 | 1 | |
1088193646 | 2 | |
1088700305 | 2 |
Value | Count | Frequency (%) |
8998500260 | 1 | |
8328500097 | 2 | |
8323200301 | 1 | |
8288801841 | 1 | |
8085200266 | 1 | |
7968101680 | 1 | |
7798600100 | 1 | |
7758700347 | 1 | |
7558600818 | 1 | |
7508701032 | 1 |
취업인원
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.8 KiB |
1 | |
---|---|
3 | |
2 | |
4 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 2 |
---|---|
2nd row | 3 |
3rd row | 2 |
4th row | 2 |
5th row | 3 |
Common Values
Value | Count | Frequency (%) |
1 | 148 | |
3 | 95 | |
2 | 93 | |
4 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 148 | |
3 | 95 | |
2 | 93 | |
4 | 1 | 0.3% |
지역구분
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 5.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.8 KiB |
경기 | |
---|---|
경남 | |
충남 | |
경북 | |
서울 | |
Other values (12) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대구 |
---|---|
2nd row | 경기 |
3rd row | 충남 |
4th row | 서울 |
5th row | 인천 |
Common Values
Value | Count | Frequency (%) |
경기 | 97 | |
경남 | 42 | |
충남 | 35 | 10.4% |
경북 | 22 | 6.5% |
서울 | 20 | 5.9% |
부산 | 19 | 5.6% |
충북 | 18 | 5.3% |
광주 | 16 | 4.7% |
인천 | 16 | 4.7% |
대구 | 16 | 4.7% |
Other values (7) | 36 | 10.7% |
Length
Value | Count | Frequency (%) |
경기 | 97 | |
경남 | 42 | |
충남 | 35 | 10.4% |
경북 | 22 | 6.5% |
서울 | 20 | 5.9% |
부산 | 19 | 5.6% |
충북 | 18 | 5.3% |
대구 | 16 | 4.7% |
인천 | 16 | 4.7% |
광주 | 16 | 4.7% |
Other values (7) | 36 | 10.7% |
업종
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.8 KiB |
제조업 | |
---|---|
도매 및 소매업 | 5 |
전문, 과학 및 기술 서비스업 | 3 |
수리 및 기타 개인 서비스업 | 1 |
운수 및 창고업 | 1 |
Length
Max length | 16 |
---|---|
Median length | 3 |
Mean length | 3.2403561 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | 제조업 |
---|---|
2nd row | 제조업 |
3rd row | 제조업 |
4th row | 전문, 과학 및 기술 서비스업 |
5th row | 제조업 |
Common Values
Value | Count | Frequency (%) |
제조업 | 327 | |
도매 및 소매업 | 5 | 1.5% |
전문, 과학 및 기술 서비스업 | 3 | 0.9% |
수리 및 기타 개인 서비스업 | 1 | 0.3% |
운수 및 창고업 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
제조업 | 327 | |
및 | 10 | 2.7% |
도매 | 5 | 1.4% |
소매업 | 5 | 1.4% |
서비스업 | 4 | 1.1% |
전문 | 3 | 0.8% |
과학 | 3 | 0.8% |
기술 | 3 | 0.8% |
수리 | 1 | 0.3% |
기타 | 1 | 0.3% |
Other values (3) | 3 | 0.8% |
산업분류
Text
Distinct | 209 |
---|---|
Distinct (%) | 62.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.8 KiB |
Length
Max length | 25 |
---|---|
Median length | 20 |
Mean length | 14.10089 |
Min length | 3 |
Characters and Unicode
Total characters | 4752 |
---|---|
Distinct characters | 245 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 150 ? |
---|---|
Unique (%) | 44.5% |
Sample
1st row | 그 외 기타 특수목적용 기계 제조업 |
---|---|
2nd row | 기타 인쇄업 |
3rd row | 금속탱크 및 저장용기 제조업 |
4th row | 제품 디자인업 |
5th row | 그 외 기타 특수목적용 기계 제조업 |
Value | Count | Frequency (%) |
제조업 | 279 | |
및 | 107 | 7.9% |
기타 | 92 | 6.8% |
부품 | 35 | 2.6% |
그 | 31 | 2.3% |
외 | 31 | 2.3% |
그외 | 28 | 2.1% |
기계 | 24 | 1.8% |
자동차 | 23 | 1.7% |
플라스틱 | 20 | 1.5% |
Other values (324) | 690 |
Most occurring characters
Value | Count | Frequency (%) |
1023 | ||
제 | 354 | 7.4% |
업 | 344 | 7.2% |
조 | 330 | 6.9% |
기 | 217 | 4.6% |
품 | 144 | 3.0% |
용 | 113 | 2.4% |
및 | 107 | 2.3% |
타 | 93 | 2.0% |
장 | 75 | 1.6% |
Other values (235) | 1952 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3675 | |
Space Separator | 1023 | 21.5% |
Other Punctuation | 37 | 0.8% |
Close Punctuation | 5 | 0.1% |
Open Punctuation | 5 | 0.1% |
Decimal Number | 4 | 0.1% |
Uppercase Letter | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
제 | 354 | 9.6% |
업 | 344 | 9.4% |
조 | 330 | 9.0% |
기 | 217 | 5.9% |
품 | 144 | 3.9% |
용 | 113 | 3.1% |
및 | 107 | 2.9% |
타 | 93 | 2.5% |
장 | 75 | 2.0% |
자 | 67 | 1.8% |
Other values (226) | 1831 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 1 | |
M | 1 | |
I | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 35 | |
· | 2 | 5.4% |
Space Separator
Value | Count | Frequency (%) |
1023 |
Close Punctuation
Value | Count | Frequency (%) |
) | 5 |
Open Punctuation
Value | Count | Frequency (%) |
( | 5 |
Decimal Number
Value | Count | Frequency (%) |
1 | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3675 | |
Common | 1074 | 22.6% |
Latin | 3 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
제 | 354 | 9.6% |
업 | 344 | 9.4% |
조 | 330 | 9.0% |
기 | 217 | 5.9% |
품 | 144 | 3.9% |
용 | 113 | 3.1% |
및 | 107 | 2.9% |
타 | 93 | 2.5% |
장 | 75 | 2.0% |
자 | 67 | 1.8% |
Other values (226) | 1831 |
Common
Value | Count | Frequency (%) |
1023 | ||
, | 35 | 3.3% |
) | 5 | 0.5% |
( | 5 | 0.5% |
1 | 4 | 0.4% |
· | 2 | 0.2% |
Latin
Value | Count | Frequency (%) |
S | 1 | |
M | 1 | |
I | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3674 | |
ASCII | 1075 | 22.6% |
None | 2 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1023 | ||
, | 35 | 3.3% |
) | 5 | 0.5% |
( | 5 | 0.5% |
1 | 4 | 0.4% |
S | 1 | 0.1% |
M | 1 | 0.1% |
I | 1 | 0.1% |
Hangul
Value | Count | Frequency (%) |
제 | 354 | 9.6% |
업 | 344 | 9.4% |
조 | 330 | 9.0% |
기 | 217 | 5.9% |
품 | 144 | 3.9% |
용 | 113 | 3.1% |
및 | 107 | 2.9% |
타 | 93 | 2.5% |
장 | 75 | 2.0% |
자 | 67 | 1.8% |
Other values (225) | 1830 |
None
Value | Count | Frequency (%) |
· | 2 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 1 |
참여년도 | 사업자번호 | 취업인원 | 지역구분 | 업종 | |
---|---|---|---|---|---|
참여년도 | 1.000 | 0.000 | 0.000 | 0.142 | 0.117 |
사업자번호 | 0.000 | 1.000 | 0.054 | 0.810 | 0.000 |
취업인원 | 0.000 | 0.054 | 1.000 | 0.000 | 0.000 |
지역구분 | 0.142 | 0.810 | 0.000 | 1.000 | 0.304 |
업종 | 0.117 | 0.000 | 0.000 | 0.304 | 1.000 |
취업인원 | 업종 | 지역구분 | 참여년도 | |
---|---|---|---|---|
취업인원 | 1.000 | 0.000 | 0.000 | 0.000 |
업종 | 0.000 | 1.000 | 0.158 | 0.143 |
지역구분 | 0.000 | 0.158 | 1.000 | 0.124 |
참여년도 | 0.000 | 0.143 | 0.124 | 1.000 |
사업자번호 | 참여년도 | 취업인원 | 지역구분 | 업종 | |
---|---|---|---|---|---|
사업자번호 | 1.000 | 0.000 | 0.036 | 0.475 | 0.000 |
참여년도 | 0.000 | 1.000 | 0.000 | 0.124 | 0.143 |
취업인원 | 0.036 | 0.000 | 1.000 | 0.000 | 0.000 |
지역구분 | 0.475 | 0.124 | 0.000 | 1.000 | 0.158 |
업종 | 0.000 | 0.143 | 0.000 | 0.158 | 1.000 |
참여년도 | 기업명 | 사업자번호 | 취업인원 | 지역구분 | 업종 | 산업분류 | |
---|---|---|---|---|---|---|---|
0 | 2023 | 영일엔지니어링(주) | 1028800167 | 2 | 대구 | 제조업 | 그 외 기타 특수목적용 기계 제조업 |
1 | 2023 | (주)드림애드앤프린팅그룹 | 1048149624 | 3 | 경기 | 제조업 | 기타 인쇄업 |
2 | 2023 | 장한기술(주) | 1068125254 | 2 | 충남 | 제조업 | 금속탱크 및 저장용기 제조업 |
3 | 2023 | 스마트엠 | 1071687880 | 2 | 서울 | 전문, 과학 및 기술 서비스업 | 제품 디자인업 |
4 | 2023 | 대신엠씨(주) | 1078159849 | 3 | 인천 | 제조업 | 그 외 기타 특수목적용 기계 제조업 |
5 | 2023 | (주)지에스티산업 | 1078171936 | 3 | 충북 | 제조업 | 탭, 밸브 및 유사장치 제조업 |
6 | 2023 | (주)아임유 | 1088193646 | 3 | 서울 | 제조업 | 사무용 기계 및 장비 제조업 |
7 | 2023 | (주)다니엘컴퍼니 | 1088700305 | 2 | 경북 | 제조업 | 커피 가공업 |
8 | 2023 | 비바코리아 | 1090742664 | 1 | 인천 | 제조업 | 방송장비 제조업 |
9 | 2023 | (주)사운드캠코리아 | 1128155127 | 2 | 서울 | 도매 및 소매업 | 정밀기기 및 과학기기 도매업 |
참여년도 | 기업명 | 사업자번호 | 취업인원 | 지역구분 | 업종 | 산업분류 | |
---|---|---|---|---|---|---|---|
327 | 2022 | (주)코아드 | 4318126854 | 1 | 경기 | 제조업 | 금속 문, 창, 셔터 및 관련제품 제조업 |
328 | 2022 | 한진실업(주) | 4108128484 | 2 | 광주 | 제조업 | 기계장비 조립용 플라스틱 제조업 |
329 | 2022 | (주)화인트로 | 6088162643 | 2 | 충남 | 제조업 | 그외 기타 자동차 부품 제조업 |
330 | 2022 | 스마트엠 | 1071687880 | 1 | 서울 | 제조업 | 기타 편조의복 액세서리 제조업 |
331 | 2022 | (주)프리텍코리아 | 3128619876 | 1 | 충남 | 제조업 | 공기조화장치 제조업 |
332 | 2022 | 이노6(주) | 1248731775 | 2 | 경기 | 제조업 | 반도체 제조용 기계 제조업 |
333 | 2022 | (주)티티엔지 | 5148197018 | 2 | 대구 | 제조업 | 응용소프트웨어 개발 및 공급업 |
334 | 2022 | (주)에니룩스 | 1308658485 | 2 | 경북 | 제조업 | 전시 및 광고용 조명장치 제조업 |
335 | 2022 | (주)마이텍 | 6038153907 | 1 | 부산 | 제조업 | 증류기, 열교환기 및 가스발생기 제조업 |
336 | 2022 | 디랩치과기공소 | 1199133384 | 1 | 서울 | 제조업 | 지과용 기기 제조업 |