Overview

Dataset statistics

Number of variables4
Number of observations66
Missing cells7
Missing cells (%)2.7%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.2 KiB
Average record size in memory34.0 B

Variable types

Text1
DateTime1
Categorical2

Dataset

Description대구광역시_의료RnD지구 입주기업 현황_20231201
Author대구광역시
URLhttp://data.daegu.go.kr/open/data/dataView.do?dataSetId=15085792&dataSetDetailId=150857921e3d0c981929b&provdMethod=FILE

Alerts

입주현황 is highly overall correlated with 업종High correlation
업종 is highly overall correlated with 입주현황High correlation
입주현황 is highly imbalanced (51.2%)Imbalance
입주일 has 7 (10.6%) missing valuesMissing
업체명 has unique valuesUnique

Reproduction

Analysis started2023-12-10 19:39:29.753420
Analysis finished2023-12-10 19:39:30.690169
Duration0.94 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

업체명
Text

UNIQUE 

Distinct66
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size660.0 B
2023-12-11T04:39:30.872534image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length10
Median length8
Mean length4.8181818
Min length2

Characters and Unicode

Total characters318
Distinct characters133
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique66 ?
Unique (%)100.0%

Sample

1st row한성에스앤아이
2nd row오션네트웍스
3rd row마이크로엔엑스
4th row유타스
5th row씨엠테크
ValueCountFrequency (%)
주식회사 2
 
2.9%
한성에스앤아이 1
 
1.4%
명성 1
 
1.4%
제이에스테크윈 1
 
1.4%
올소테크 1
 
1.4%
스페이스 1
 
1.4%
젬텍 1
 
1.4%
토탈소프트뱅크 1
 
1.4%
씨아이에스 1
 
1.4%
일에스티플렛폼 1
 
1.4%
Other values (58) 58
84.1%
2023-12-11T04:39:31.306905image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
22
 
6.9%
20
 
6.3%
13
 
4.1%
9
 
2.8%
7
 
2.2%
7
 
2.2%
6
 
1.9%
6
 
1.9%
6
 
1.9%
6
 
1.9%
Other values (123) 216
67.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 303
95.3%
Space Separator 5
 
1.6%
Uppercase Letter 5
 
1.6%
Other Symbol 3
 
0.9%
Close Punctuation 1
 
0.3%
Open Punctuation 1
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
22
 
7.3%
20
 
6.6%
13
 
4.3%
9
 
3.0%
7
 
2.3%
7
 
2.3%
6
 
2.0%
6
 
2.0%
6
 
2.0%
6
 
2.0%
Other values (115) 201
66.3%
Uppercase Letter
ValueCountFrequency (%)
I 2
40.0%
S 1
20.0%
G 1
20.0%
T 1
20.0%
Space Separator
ValueCountFrequency (%)
5
100.0%
Other Symbol
ValueCountFrequency (%)
3
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 306
96.2%
Common 7
 
2.2%
Latin 5
 
1.6%

Most frequent character per script

Hangul
ValueCountFrequency (%)
22
 
7.2%
20
 
6.5%
13
 
4.2%
9
 
2.9%
7
 
2.3%
7
 
2.3%
6
 
2.0%
6
 
2.0%
6
 
2.0%
6
 
2.0%
Other values (116) 204
66.7%
Latin
ValueCountFrequency (%)
I 2
40.0%
S 1
20.0%
G 1
20.0%
T 1
20.0%
Common
ValueCountFrequency (%)
5
71.4%
) 1
 
14.3%
( 1
 
14.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 303
95.3%
ASCII 12
 
3.8%
None 3
 
0.9%

Most frequent character per block

Hangul
ValueCountFrequency (%)
22
 
7.3%
20
 
6.6%
13
 
4.3%
9
 
3.0%
7
 
2.3%
7
 
2.3%
6
 
2.0%
6
 
2.0%
6
 
2.0%
6
 
2.0%
Other values (115) 201
66.3%
ASCII
ValueCountFrequency (%)
5
41.7%
I 2
 
16.7%
) 1
 
8.3%
( 1
 
8.3%
S 1
 
8.3%
G 1
 
8.3%
T 1
 
8.3%
None
ValueCountFrequency (%)
3
100.0%

입주일
Date

MISSING 

Distinct52
Distinct (%)88.1%
Missing7
Missing (%)10.6%
Memory size660.0 B
Minimum2014-12-16 00:00:00
Maximum2021-12-13 00:00:00
2023-12-11T04:39:31.462392image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-11T04:39:31.598362image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

입주현황
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)3.0%
Missing0
Missing (%)0.0%
Memory size660.0 B
입주완료
59 
입주준비중

Length

Max length5
Median length4
Mean length4.1060606
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row입주완료
2nd row입주완료
3rd row입주완료
4th row입주완료
5th row입주완료

Common Values

ValueCountFrequency (%)
입주완료 59
89.4%
입주준비중 7
 
10.6%

Length

2023-12-11T04:39:31.708765image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T04:39:31.815114image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
입주완료 59
89.4%
입주준비중 7
 
10.6%

업종
Categorical

HIGH CORRELATION 

Distinct24
Distinct (%)36.4%
Missing0
Missing (%)0.0%
Memory size660.0 B
그 외 기타 의료용 기기 제조업
20 
의료기업
치과용 기기 제조업
정형 외과용 및 신체 보정용 기기 제조업
그 외 기타 전자 부품 제조업
Other values (19)
29 

Length

Max length25
Median length21.5
Mean length14.469697
Min length3

Unique

Unique10 ?
Unique (%)15.2%

Sample

1st row전동기 및 발전기 제조업
2nd row그 외 기타 의료용 기기 제조업
3rd row치과용 기기 제조업
4th row전자코일. 변성기 및 기타 전자 유도자 제조업
5th row그 외 기타 의료용 기기 제조업

Common Values

ValueCountFrequency (%)
그 외 기타 의료용 기기 제조업 20
30.3%
의료기업 5
 
7.6%
치과용 기기 제조업 5
 
7.6%
정형 외과용 및 신체 보정용 기기 제조업 4
 
6.1%
그 외 기타 전자 부품 제조업 3
 
4.5%
응용 소프트웨어 개발 및 공급업 3
 
4.5%
화장품 제조업 2
 
3.0%
화장품 2
 
3.0%
방사선 장치 제조업 2
 
3.0%
전기식 진단 및 요법 기기 제조업 2
 
3.0%
Other values (14) 18
27.3%

Length

2023-12-11T04:39:31.949804image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
제조업 55
17.7%
기기 31
 
10.0%
기타 27
 
8.7%
23
 
7.4%
23
 
7.4%
21
 
6.8%
의료용 20
 
6.5%
치과용 5
 
1.6%
의료기업 5
 
1.6%
정형 4
 
1.3%
Other values (50) 96
31.0%

Correlations

2023-12-11T04:39:32.052500image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
업체명입주일입주현황업종
업체명1.0001.0001.0001.000
입주일1.0001.000NaN0.000
입주현황1.000NaN1.0001.000
업종1.0000.0001.0001.000
2023-12-11T04:39:32.186146image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
입주현황업종
입주현황1.0000.810
업종0.8101.000
2023-12-11T04:39:32.283975image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
입주현황업종
입주현황1.0000.810
업종0.8101.000

Missing values

2023-12-11T04:39:30.554174image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-11T04:39:30.659068image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

업체명입주일입주현황업종
0한성에스앤아이2016-03-11입주완료전동기 및 발전기 제조업
1오션네트웍스2017-09-26입주완료그 외 기타 의료용 기기 제조업
2마이크로엔엑스2017-04-06입주완료치과용 기기 제조업
3유타스2016-06-02입주완료전자코일. 변성기 및 기타 전자 유도자 제조업
4씨엠테크2015-06-25입주완료그 외 기타 의료용 기기 제조업
5태양인덕션히터2019-08-29입주완료산업용 오븐. 노 및 노용 버너 제조업
6한의2018-05-11입주완료그 외 기타 의료용 기기 제조업
7레이월드2015-04-01입주완료그 외 기타 전자 부품 제조업
8대류2016-06-02입주완료전기식 진단 및 요법 기기 제조업
9한아IT2015-04-07입주완료컴퓨터 제조업
업체명입주일입주현황업종
56지클로2021-04-26입주완료화장품 제조업
57신라이앤씨2021-04-08입주완료배전반 및 전기 자동제어반 제조업
58경신파킹2021-08-12입주완료응용 소프트웨어 개발 및 공급업
59(유)일성<NA>입주준비중의료기업
60㈜엠모니터<NA>입주준비중의료기업
61초이스우드 주식회사<NA>입주준비중의료기업
62㈜덕산코트랜<NA>입주준비중의료기업
63그린페이퍼<NA>입주준비중화장품
64㈜세양<NA>입주준비중의료기업
65주식회사 에스엘씨<NA>입주준비중화장품