Overview

Dataset statistics

Number of variables5
Number of observations42
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory1.8 KiB
Average record size in memory44.1 B

Variable types

Numeric1
Categorical3
Text1

Dataset

Description중소벤처기업진흥공단 정책자금을 지원받은 비대면 분야 우수기업의 "지역, 언택트 분야 및 기술" 정보 리스트
Author중소벤처기업진흥공단
URLhttps://www.data.go.kr/data/15073618/fileData.do

Alerts

업체일련번호 is highly overall correlated with 7대 언택트분야 and 1 other fieldsHigh correlation
7대 언택트분야 is highly overall correlated with 업체일련번호 and 1 other fieldsHigh correlation
기술분야 is highly overall correlated with 업체일련번호 and 1 other fieldsHigh correlation
업체일련번호 has unique valuesUnique

Reproduction

Analysis started2023-12-12 07:18:10.934941
Analysis finished2023-12-12 07:18:11.785033
Duration0.85 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

업체일련번호
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct42
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean21.5
Minimum1
Maximum42
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size510.0 B
2023-12-12T16:18:11.851712image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile3.05
Q111.25
median21.5
Q331.75
95-th percentile39.95
Maximum42
Range41
Interquartile range (IQR)20.5

Descriptive statistics

Standard deviation12.267844
Coefficient of variation (CV)0.5705974
Kurtosis-1.2
Mean21.5
Median Absolute Deviation (MAD)10.5
Skewness0
Sum903
Variance150.5
MonotonicityStrictly increasing
2023-12-12T16:18:11.994042image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=42)
ValueCountFrequency (%)
1 1
 
2.4%
33 1
 
2.4%
25 1
 
2.4%
26 1
 
2.4%
27 1
 
2.4%
28 1
 
2.4%
29 1
 
2.4%
30 1
 
2.4%
31 1
 
2.4%
32 1
 
2.4%
Other values (32) 32
76.2%
ValueCountFrequency (%)
1 1
2.4%
2 1
2.4%
3 1
2.4%
4 1
2.4%
5 1
2.4%
6 1
2.4%
7 1
2.4%
8 1
2.4%
9 1
2.4%
10 1
2.4%
ValueCountFrequency (%)
42 1
2.4%
41 1
2.4%
40 1
2.4%
39 1
2.4%
38 1
2.4%
37 1
2.4%
36 1
2.4%
35 1
2.4%
34 1
2.4%
33 1
2.4%

지역
Categorical

Distinct16
Distinct (%)38.1%
Missing0
Missing (%)0.0%
Memory size468.0 B
서울
경기
경남
경북
강원
Other values (11)
17 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique5 ?
Unique (%)11.9%

Sample

1st row경기
2nd row경기
3rd row강원
4th row인천
5th row대구

Common Values

ValueCountFrequency (%)
서울 9
21.4%
경기 8
19.0%
경남 3
 
7.1%
경북 3
 
7.1%
강원 2
 
4.8%
인천 2
 
4.8%
전남 2
 
4.8%
전북 2
 
4.8%
충북 2
 
4.8%
대전 2
 
4.8%
Other values (6) 7
16.7%

Length

2023-12-12T16:18:12.162292image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
서울 9
21.4%
경기 8
19.0%
경남 3
 
7.1%
경북 3
 
7.1%
강원 2
 
4.8%
인천 2
 
4.8%
전남 2
 
4.8%
전북 2
 
4.8%
충북 2
 
4.8%
대전 2
 
4.8%
Other values (6) 7
16.7%

7대 언택트분야
Categorical

HIGH CORRELATION 

Distinct7
Distinct (%)16.7%
Missing0
Missing (%)0.0%
Memory size468.0 B
거래,소비
14 
비대면기술
11 
교육
의료
오피스
Other values (2)

Length

Max length5
Median length5
Mean length3.9761905
Min length2

Unique

Unique2 ?
Unique (%)4.8%

Sample

1st row의료
2nd row의료
3rd row의료
4th row의료
5th row의료

Common Values

ValueCountFrequency (%)
거래,소비 14
33.3%
비대면기술 11
26.2%
교육 7
16.7%
의료 5
 
11.9%
오피스 3
 
7.1%
액티비티 1
 
2.4%
유레카분야 1
 
2.4%

Length

2023-12-12T16:18:12.303029image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T16:18:12.430471image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
거래,소비 14
33.3%
비대면기술 11
26.2%
교육 7
16.7%
의료 5
 
11.9%
오피스 3
 
7.1%
액티비티 1
 
2.4%
유레카분야 1
 
2.4%

기술분야
Categorical

HIGH CORRELATION 

Distinct18
Distinct (%)42.9%
Missing0
Missing (%)0.0%
Memory size468.0 B
무인점포
온라인 신선식품, 쇼핑
마스크
온라인 교육 시스템, 컨텐츠
화상회의/원격근무시스템
Other values (13)
21 

Length

Max length15
Median length13
Mean length9.8333333
Min length3

Unique

Unique8 ?
Unique (%)19.0%

Sample

1st row마스크
2nd row마스크
3rd row마스크
4th row마스크
5th row원격의료

Common Values

ValueCountFrequency (%)
무인점포 6
14.3%
온라인 신선식품, 쇼핑 5
11.9%
마스크 4
9.5%
온라인 교육 시스템, 컨텐츠 3
 
7.1%
화상회의/원격근무시스템 3
 
7.1%
스마트계약(블록체인 기반) 3
 
7.1%
컴퓨팅, 웨어러블(IoT) 3
 
7.1%
영상, 모션인식 및 가상현실 3
 
7.1%
돌봄, 육아서비스 2
 
4.8%
온라인 교육 시스템·컨텐츠 2
 
4.8%
Other values (8) 8
19.0%

Length

2023-12-12T16:18:12.575967image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
온라인 10
 
11.2%
무인점포 6
 
6.7%
신선식품 5
 
5.6%
쇼핑 5
 
5.6%
가상현실 5
 
5.6%
교육 5
 
5.6%
5
 
5.6%
영상 4
 
4.5%
모션인식 4
 
4.5%
마스크 4
 
4.5%
Other values (19) 36
40.4%
Distinct41
Distinct (%)97.6%
Missing0
Missing (%)0.0%
Memory size468.0 B
2023-12-12T16:18:12.840943image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length49
Median length25.5
Mean length19.52381
Min length10

Characters and Unicode

Total characters820
Distinct characters214
Distinct categories9 ?
Distinct scripts4 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique40 ?
Unique (%)95.2%

Sample

1st row보건마스크(KF80, KF94 등) 생산
2nd row보건용 및 의료용 마스크 제조
3rd row보건용 및 의료용 마스크 제조
4th rowKF94 마스크 및 방진복 제조
5th row스마트 약상자를 이용한 복약 모니터링 기술, 전자회의 시스템
ValueCountFrequency (%)
9
 
4.5%
서비스 7
 
3.5%
플랫폼 7
 
3.5%
제조 6
 
3.0%
비대면 6
 
3.0%
온라인 5
 
2.5%
기반 5
 
2.5%
마스크 3
 
1.5%
3
 
1.5%
교육 3
 
1.5%
Other values (128) 145
72.9%
2023-12-12T16:18:13.280322image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
157
 
19.1%
29
 
3.5%
17
 
2.1%
17
 
2.1%
13
 
1.6%
12
 
1.5%
11
 
1.3%
11
 
1.3%
, 10
 
1.2%
10
 
1.2%
Other values (204) 533
65.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 582
71.0%
Space Separator 157
 
19.1%
Uppercase Letter 44
 
5.4%
Other Punctuation 13
 
1.6%
Close Punctuation 7
 
0.9%
Open Punctuation 7
 
0.9%
Decimal Number 7
 
0.9%
Lowercase Letter 2
 
0.2%
Dash Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
29
 
5.0%
17
 
2.9%
17
 
2.9%
13
 
2.2%
12
 
2.1%
11
 
1.9%
11
 
1.9%
10
 
1.7%
9
 
1.5%
9
 
1.5%
Other values (178) 444
76.3%
Uppercase Letter
ValueCountFrequency (%)
R 6
13.6%
A 6
13.6%
I 5
11.4%
P 4
9.1%
K 4
9.1%
T 3
6.8%
F 3
6.8%
S 3
6.8%
W 3
6.8%
C 2
 
4.5%
Other values (4) 5
11.4%
Decimal Number
ValueCountFrequency (%)
4 2
28.6%
9 2
28.6%
2 1
14.3%
0 1
14.3%
8 1
14.3%
Other Punctuation
ValueCountFrequency (%)
, 10
76.9%
/ 3
 
23.1%
Space Separator
ValueCountFrequency (%)
157
100.0%
Close Punctuation
ValueCountFrequency (%)
) 7
100.0%
Open Punctuation
ValueCountFrequency (%)
( 7
100.0%
Lowercase Letter
ValueCountFrequency (%)
o 2
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 581
70.9%
Common 192
 
23.4%
Latin 46
 
5.6%
Han 1
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
29
 
5.0%
17
 
2.9%
17
 
2.9%
13
 
2.2%
12
 
2.1%
11
 
1.9%
11
 
1.9%
10
 
1.7%
9
 
1.5%
9
 
1.5%
Other values (177) 443
76.2%
Latin
ValueCountFrequency (%)
R 6
13.0%
A 6
13.0%
I 5
10.9%
P 4
8.7%
K 4
8.7%
T 3
6.5%
F 3
6.5%
S 3
6.5%
W 3
6.5%
o 2
 
4.3%
Other values (5) 7
15.2%
Common
ValueCountFrequency (%)
157
81.8%
, 10
 
5.2%
) 7
 
3.6%
( 7
 
3.6%
/ 3
 
1.6%
4 2
 
1.0%
9 2
 
1.0%
2 1
 
0.5%
0 1
 
0.5%
8 1
 
0.5%
Han
ValueCountFrequency (%)
1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 581
70.9%
ASCII 238
29.0%
CJK 1
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
157
66.0%
, 10
 
4.2%
) 7
 
2.9%
( 7
 
2.9%
R 6
 
2.5%
A 6
 
2.5%
I 5
 
2.1%
P 4
 
1.7%
K 4
 
1.7%
T 3
 
1.3%
Other values (16) 29
 
12.2%
Hangul
ValueCountFrequency (%)
29
 
5.0%
17
 
2.9%
17
 
2.9%
13
 
2.2%
12
 
2.1%
11
 
1.9%
11
 
1.9%
10
 
1.7%
9
 
1.5%
9
 
1.5%
Other values (177) 443
76.2%
CJK
ValueCountFrequency (%)
1
100.0%

Interactions

2023-12-12T16:18:11.219640image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T16:18:13.383948image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
업체일련번호지역7대 언택트분야기술분야언택트 기술
업체일련번호1.0000.0000.8710.9551.000
지역0.0001.0000.7930.8070.972
7대 언택트분야0.8710.7931.0001.0001.000
기술분야0.9550.8071.0001.0001.000
언택트 기술1.0000.9721.0001.0001.000
2023-12-12T16:18:13.481230image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
기술분야지역7대 언택트분야
기술분야1.0000.3760.828
지역0.3761.0000.442
7대 언택트분야0.8280.4421.000
2023-12-12T16:18:13.602903image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
업체일련번호지역7대 언택트분야기술분야
업체일련번호1.0000.0000.6600.684
지역0.0001.0000.4420.376
7대 언택트분야0.6600.4421.0000.828
기술분야0.6840.3760.8281.000

Missing values

2023-12-12T16:18:11.630916image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T16:18:11.747715image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

업체일련번호지역7대 언택트분야기술분야언택트 기술
01경기의료마스크보건마스크(KF80, KF94 등) 생산
12경기의료마스크보건용 및 의료용 마스크 제조
23강원의료마스크보건용 및 의료용 마스크 제조
34인천의료마스크KF94 마스크 및 방진복 제조
45대구의료원격의료스마트 약상자를 이용한 복약 모니터링 기술, 전자회의 시스템
56서울교육온라인 교육 시스템, 컨텐츠AI 활용 S/W 교육 플랫폼 서비스
67경기교육온라인 교육 시스템, 컨텐츠디지털 학습 콘텐츠 제작 플랫폼
78전남교육온라인 교육 시스템, 컨텐츠소프트웨어 코딩 교육지원 및 평가 시스템
89경남교육온라인 교육 시스템·컨텐츠사업주 직업능력개발 온라인 강의
910경남교육온라인 교육 시스템·컨텐츠영유아용 교육 온라인 컨텐츠
업체일련번호지역7대 언택트분야기술분야언택트 기술
3233충남비대면기술영상, 모션인식 및 가상현실AR, VR 등 가상증강현실
3334충북비대면기술영상, 모션인식 및 가상현실AR, VR을 접목시킨 안내판 및 산코스 로드뷰
3435강원비대면기술영상, 모션인식 및 가상현실통합 영상 관제 솔루션 및 하드웨어
3536경남비대면기술영상, 모션인식장애인 전용 주차구역 위반차량 영상인식
3637경북비대면기술클라우드클라우드 보안서비스
3738서울비대면기술컴퓨팅, 웨어러블(IoT)생체인식 기반 원격 결제
3839서울비대면기술컴퓨팅, 웨어러블(IoT)빅데이터 기반 컴퓨팅
3940경기비대면기술컴퓨팅, 웨어러블(IoT)스마트(IoT) 신발관리시스템
4041부산비대면기술5G 디바이스스마트팩토리 솔루션 비대면(無방문) 제공
4142울산유레카분야상권분석소상공인 마케팅 분석지원을 위한 빅데이터 분석엔진