Overview

Dataset statistics

Number of variables2
Number of observations44
Missing cells45
Missing cells (%)51.1%
Duplicate rows1
Duplicate rows (%)2.3%
Total size in memory880.0 B
Average record size in memory20.0 B

Variable types

Text1
Unsupported1

Dataset

Description국가산업단지 업종별 입주, 가동, 임차업체수 등국가산업단지 업종별 산업생산 및 수출, 가동률 등(생산, 수출, 가동률은 제조업 가동업체만을 조사대상으로 함)국가산업단지 업종별 고용인원
Author한국산업단지공단
URLhttps://www.data.go.kr/data/3042071/fileData.do

Alerts

Dataset has 1 (2.3%) duplicate rowsDuplicates
Unnamed: 0 has 1 (2.3%) missing valuesMissing
< 국가산업단지 산업동향 조사 개요 > has 44 (100.0%) missing valuesMissing
< 국가산업단지 산업동향 조사 개요 > is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2024-04-06 08:52:37.677616
Analysis finished2024-04-06 08:52:38.658812
Duration0.98 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Unnamed: 0
Text

MISSING 

Distinct39
Distinct (%)90.7%
Missing1
Missing (%)2.3%
Memory size484.0 B
2024-04-06T17:52:39.092731image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length132
Median length63
Mean length43.790698
Min length2

Characters and Unicode

Total characters1883
Distinct characters256
Distinct categories14 ?
Distinct scripts3 ?
Distinct blocks7 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique38 ?
Unique (%)88.4%

Sample

1st row 
2nd row1. 조사목적
3rd rowㅇ 한국산업단지공단 관할 산업단지 입주기업의 가동실태를 매월 정기적으로 조사․분석하여 산업단지 기본통계 정보 제공 및 입주기업 지원정책 수립을 위한 기초자료로 활용
4th row 
5th row2. 조사근거
ValueCountFrequency (%)
26
 
6.3%
11
 
2.7%
9
 
2.2%
관할단지 6
 
1.5%
조사 5
 
1.2%
산업단지 5
 
1.2%
따라 5
 
1.2%
변경에 5
 
1.2%
수출 4
 
1.0%
제외 4
 
1.0%
Other values (281) 333
80.6%
2024-04-06T17:52:39.993972image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
405
 
21.5%
, 59
 
3.1%
58
 
3.1%
43
 
2.3%
41
 
2.2%
37
 
2.0%
) 30
 
1.6%
29
 
1.5%
( 29
 
1.5%
27
 
1.4%
Other values (246) 1125
59.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1169
62.1%
Space Separator 410
 
21.8%
Other Punctuation 116
 
6.2%
Decimal Number 101
 
5.4%
Close Punctuation 30
 
1.6%
Open Punctuation 29
 
1.5%
Other Number 14
 
0.7%
Initial Punctuation 4
 
0.2%
Control 4
 
0.2%
Lowercase Letter 2
 
0.1%
Other values (4) 4
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
58
 
5.0%
43
 
3.7%
41
 
3.5%
37
 
3.2%
29
 
2.5%
27
 
2.3%
26
 
2.2%
26
 
2.2%
25
 
2.1%
23
 
2.0%
Other values (202) 834
71.3%
Other Number
ValueCountFrequency (%)
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
Other values (4) 4
28.6%
Decimal Number
ValueCountFrequency (%)
1 22
21.8%
2 19
18.8%
0 19
18.8%
4 8
 
7.9%
5 7
 
6.9%
8 6
 
5.9%
6 6
 
5.9%
7 6
 
5.9%
9 4
 
4.0%
3 4
 
4.0%
Other Punctuation
ValueCountFrequency (%)
, 59
50.9%
: 19
 
16.4%
. 18
 
15.5%
' 7
 
6.0%
* 5
 
4.3%
4
 
3.4%
/ 3
 
2.6%
% 1
 
0.9%
Space Separator
ValueCountFrequency (%)
405
98.8%
  5
 
1.2%
Lowercase Letter
ValueCountFrequency (%)
e 1
50.0%
x 1
50.0%
Close Punctuation
ValueCountFrequency (%)
) 30
100.0%
Open Punctuation
ValueCountFrequency (%)
( 29
100.0%
Initial Punctuation
ValueCountFrequency (%)
4
100.0%
Control
ValueCountFrequency (%)
4
100.0%
Math Symbol
ValueCountFrequency (%)
1
100.0%
Final Punctuation
ValueCountFrequency (%)
1
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%
Uppercase Letter
ValueCountFrequency (%)
X 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1169
62.1%
Common 711
37.8%
Latin 3
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
58
 
5.0%
43
 
3.7%
41
 
3.5%
37
 
3.2%
29
 
2.5%
27
 
2.3%
26
 
2.2%
26
 
2.2%
25
 
2.1%
23
 
2.0%
Other values (202) 834
71.3%
Common
ValueCountFrequency (%)
405
57.0%
, 59
 
8.3%
) 30
 
4.2%
( 29
 
4.1%
1 22
 
3.1%
: 19
 
2.7%
2 19
 
2.7%
0 19
 
2.7%
. 18
 
2.5%
4 8
 
1.1%
Other values (31) 83
 
11.7%
Latin
ValueCountFrequency (%)
e 1
33.3%
x 1
33.3%
X 1
33.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1152
61.2%
ASCII 685
36.4%
Compat Jamo 17
 
0.9%
Enclosed Alphanum 14
 
0.7%
Punctuation 9
 
0.5%
None 5
 
0.3%
Arrows 1
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
405
59.1%
, 59
 
8.6%
) 30
 
4.4%
( 29
 
4.2%
1 22
 
3.2%
: 19
 
2.8%
2 19
 
2.8%
0 19
 
2.8%
. 18
 
2.6%
4 8
 
1.2%
Other values (15) 57
 
8.3%
Hangul
ValueCountFrequency (%)
58
 
5.0%
43
 
3.7%
41
 
3.6%
37
 
3.2%
29
 
2.5%
27
 
2.3%
26
 
2.3%
26
 
2.3%
25
 
2.2%
23
 
2.0%
Other values (200) 817
70.9%
Compat Jamo
ValueCountFrequency (%)
11
64.7%
6
35.3%
None
ValueCountFrequency (%)
  5
100.0%
Punctuation
ValueCountFrequency (%)
4
44.4%
4
44.4%
1
 
11.1%
Enclosed Alphanum
ValueCountFrequency (%)
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
1
 
7.1%
Other values (4) 4
28.6%
Arrows
ValueCountFrequency (%)
1
100.0%

< 국가산업단지 산업동향 조사 개요 >
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing44
Missing (%)100.0%
Memory size528.0 B

Missing values

2024-04-06T17:52:38.465910image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-04-06T17:52:38.590970image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

Unnamed: 0< 국가산업단지 산업동향 조사 개요 >
0<NA>
11. 조사목적<NA>
2ㅇ 한국산업단지공단 관할 산업단지 입주기업의 가동실태를 매월 정기적으로 조사․분석하여 산업단지 기본통계 정보 제공 및 입주기업 지원정책 수립을 위한 기초자료로 활용<NA>
3<NA>
42. 조사근거<NA>
5ㅇ 산업집적활성화및공장설립에관한법률 제45조의13(사업), 제48조(보고 및 검사)<NA>
6ㅇ 통계법 제18조에 의한 국가승인통계 : 국가산업단지산업동향(승인번호 : 제399004호)<NA>
7<NA>
83. 조사대상 및 방법<NA>
9ㅇ 조사대상 : 한국산업단지공단 관할 산업단지 내 입주기업을 대표하는 기업체(표본) 약 4,770개사<NA>
Unnamed: 0< 국가산업단지 산업동향 조사 개요 >
34⑤ 아산국가단지는 공단이 관할하는 고대, 부곡, 포승만 포함(원정, 우정 미포함)<NA>
35⑥ 비제조업종 중 임대사업자(비거주용 건물 임대업)는 입주업체와 가동업체에서 제외('14년 10월부터)<NA>
36⑦ ‘16년 8월 산업동향부터 조성 및 분양 중인 관할단지 중 입주 및 가동업체가 발생한 대구, 국가식품클러스터, 아산제2테크노밸리(일), 오송제2생명과학(일), 문막(외), 진천산수(외), 송산2(외) 단지의 입주 및 가동 현황 추가<NA>
37⑧ 관할단지 변경에 따라 ‘16년 10월 산업동향부터 포항, 진해, 광양(광양제철소 등), 강서보고(일), 천안5(외) 단지가 추가, 기룡(일), 기룡2(일), 정관(일), 정관(농), 장안(일) 단지는 제외<NA>
38⑨ ‘17년 10월 산업동향 통계부터 통계 작성 대상 단지 변경 추가 단지 : 사천제1일반산업단지, 사천제2일반산업단지 제외 단지 : 부산과학, 신호, 화전, 강서보고, 모라도시첨단<NA>
39⑩ '18.10월분, '20.9월분 기점으로 표본업체 교체 및 일부 표본업체의 업종 재분류로 인한 실적 변동 발생 ex) 창원단지 두산중공업(기계 → 철강)<NA>
40⑪ 관할단지 변경에 따라 '20.10월분 산업동향부터 파주출판단지 제외<NA>
41⑫ 관할단지 변경에 따라 '21.6월분 산업동향부터 아산제2테크노밸리단지 제외<NA>
42⑬ 관할단지 변경에 따라 아산탕정(외)단지 추가('21.10월)<NA>
43⑭ 관할단지 변경에 따라 동두천단지 추가('22.6월)<NA>

Duplicate rows

Most frequently occurring

Unnamed: 0# duplicates
05