Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 27 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.9 KiB |
Average record size in memory | 72.9 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Numeric | 4 |
Dataset
Description | 부산광역시_산업단지입주기업현황_20230930 |
---|---|
Author | 부산광역시 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=15088731 |
조성면적(만제곱미터) is highly overall correlated with 산업용지(만제곱미터) and 2 other fields | High correlation |
산업용지(만제곱미터) is highly overall correlated with 조성면적(만제곱미터) and 2 other fields | High correlation |
입주업체(개사) is highly overall correlated with 조성면적(만제곱미터) and 3 other fields | High correlation |
고용인원(명) is highly overall correlated with 조성면적(만제곱미터) and 3 other fields | High correlation |
구군명 is highly overall correlated with 입주업체(개사) and 1 other fields | High correlation |
산단구분 is highly imbalanced (58.6%) | Imbalance |
산업단지명 has unique values | Unique |
사업기간 has unique values | Unique |
고용인원(명) has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 16:06:31.558831 |
---|---|
Analysis finished | 2023-12-10 16:06:34.021017 |
Duration | 2.46 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구군명
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 22.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 348.0 B |
강서구 | |
---|---|
기장군 | |
사하구 | 1 |
사상구 | 1 |
해운대구 | 1 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.037037 |
Min length | 3 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 14.8% |
Sample
1st row | 사하구 |
---|---|
2nd row | 강서구 |
3rd row | 강서구 |
4th row | 강서구 |
5th row | 강서구 |
Common Values
Value | Count | Frequency (%) |
강서구 | 12 | |
기장군 | 11 | |
사하구 | 1 | 3.7% |
사상구 | 1 | 3.7% |
해운대구 | 1 | 3.7% |
금정구 | 1 | 3.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
강서구 | 12 | |
기장군 | 11 | |
사하구 | 1 | 3.7% |
사상구 | 1 | 3.7% |
해운대구 | 1 | 3.7% |
금정구 | 1 | 3.7% |
산업단지명
Text
UNIQUE
 
Distinct | 27 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 348.0 B |
Length
Max length | 19 |
---|---|
Median length | 16 |
Mean length | 10.407407 |
Min length | 6 |
Characters and Unicode
Total characters | 281 |
---|---|
Distinct characters | 73 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 27 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 신평ㆍ장림일반산업단지 |
---|---|
2nd row | 녹산국가산업단지 |
3rd row | 신호일반산업단지(경자구역) |
4th row | 부산과학일반산업단지(경자구역) |
5th row | 화전일반산업단지(경자구역) |
Value | Count | Frequency (%) |
신평ㆍ장림일반산업단지 | 1 | 3.7% |
기룡1일반산업단지 | 1 | 3.7% |
에코장안일반산업단지 | 1 | 3.7% |
오리일반산업단지 | 1 | 3.7% |
국제산업물류도시(1단계)(경자구역 | 1 | 3.7% |
반룡일반산업단지 | 1 | 3.7% |
부산신소재일반산업단지 | 1 | 3.7% |
명례일반산업단지 | 1 | 3.7% |
회동ㆍ석대도시첨단산업단지 | 1 | 3.7% |
정관코리일반산업단지 | 1 | 3.7% |
Other values (17) | 17 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 29 | 10.3% |
단 | 29 | 10.3% |
지 | 27 | 9.6% |
업 | 26 | 9.3% |
반 | 23 | 8.2% |
일 | 22 | 7.8% |
( | 7 | 2.5% |
) | 7 | 2.5% |
구 | 6 | 2.1% |
역 | 6 | 2.1% |
Other values (63) | 99 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 263 | |
Open Punctuation | 7 | 2.5% |
Close Punctuation | 7 | 2.5% |
Decimal Number | 4 | 1.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 29 | 11.0% |
단 | 29 | 11.0% |
지 | 27 | 10.3% |
업 | 26 | 9.9% |
반 | 23 | 8.7% |
일 | 22 | 8.4% |
구 | 6 | 2.3% |
역 | 6 | 2.3% |
경 | 6 | 2.3% |
자 | 6 | 2.3% |
Other values (59) | 83 |
Decimal Number
Value | Count | Frequency (%) |
2 | 2 | |
1 | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 7 |
Close Punctuation
Value | Count | Frequency (%) |
) | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 263 | |
Common | 18 | 6.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 29 | 11.0% |
단 | 29 | 11.0% |
지 | 27 | 10.3% |
업 | 26 | 9.9% |
반 | 23 | 8.7% |
일 | 22 | 8.4% |
구 | 6 | 2.3% |
역 | 6 | 2.3% |
경 | 6 | 2.3% |
자 | 6 | 2.3% |
Other values (59) | 83 |
Common
Value | Count | Frequency (%) |
( | 7 | |
) | 7 | |
2 | 2 | 11.1% |
1 | 2 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 261 | |
ASCII | 18 | 6.4% |
Compat Jamo | 2 | 0.7% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 29 | 11.1% |
단 | 29 | 11.1% |
지 | 27 | 10.3% |
업 | 26 | 10.0% |
반 | 23 | 8.8% |
일 | 22 | 8.4% |
구 | 6 | 2.3% |
역 | 6 | 2.3% |
경 | 6 | 2.3% |
자 | 6 | 2.3% |
Other values (58) | 81 |
ASCII
Value | Count | Frequency (%) |
( | 7 | |
) | 7 | |
2 | 2 | 11.1% |
1 | 2 | 11.1% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 2 |
산단구분
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 14.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 348.0 B |
일반 | |
---|---|
도시첨단 | 2 |
국가 | 1 |
농공 | 1 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1481481 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 7.4% |
Sample
1st row | 일반 |
---|---|
2nd row | 국가 |
3rd row | 일반 |
4th row | 일반 |
5th row | 일반 |
Common Values
Value | Count | Frequency (%) |
일반 | 23 | |
도시첨단 | 2 | 7.4% |
국가 | 1 | 3.7% |
농공 | 1 | 3.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반 | 23 | |
도시첨단 | 2 | 7.4% |
국가 | 1 | 3.7% |
농공 | 1 | 3.7% |
사업기간
Text
UNIQUE
 
Distinct | 27 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 348.0 B |
Value | Count | Frequency (%) |
1980~1990 | 1 | 3.7% |
2005~2008 | 1 | 3.7% |
2014~2019 | 1 | 3.7% |
2013~2020 | 1 | 3.7% |
2010~2019 | 1 | 3.7% |
2013~2018 | 1 | 3.7% |
2013~2017 | 1 | 3.7% |
2008~2014 | 1 | 3.7% |
2008~2013 | 1 | 3.7% |
2010~2013 | 1 | 3.7% |
Other values (17) | 17 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 69 | |
2 | 51 | |
1 | 43 | |
~ | 27 | 11.1% |
9 | 17 | 7.0% |
8 | 10 | 4.1% |
7 | 9 | 3.7% |
3 | 7 | 2.9% |
4 | 4 | 1.6% |
5 | 4 | 1.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 216 | |
Math Symbol | 27 | 11.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 69 | |
2 | 51 | |
1 | 43 | |
9 | 17 | 7.9% |
8 | 10 | 4.6% |
7 | 9 | 4.2% |
3 | 7 | 3.2% |
4 | 4 | 1.9% |
5 | 4 | 1.9% |
6 | 2 | 0.9% |
Math Symbol
Value | Count | Frequency (%) |
~ | 27 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 243 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 69 | |
2 | 51 | |
1 | 43 | |
~ | 27 | 11.1% |
9 | 17 | 7.0% |
8 | 10 | 4.1% |
7 | 9 | 3.7% |
3 | 7 | 2.9% |
4 | 4 | 1.6% |
5 | 4 | 1.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 243 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 69 | |
2 | 51 | |
1 | 43 | |
~ | 27 | 11.1% |
9 | 17 | 7.0% |
8 | 10 | 4.1% |
7 | 9 | 3.7% |
3 | 7 | 2.9% |
4 | 4 | 1.6% |
5 | 4 | 1.6% |
조성면적(만제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 23 |
---|---|
Distinct (%) | 85.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 130.25926 |
Minimum | 1 |
---|---|
Maximum | 700 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 375.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 5.3 |
Q1 | 9.5 |
median | 55 |
Q3 | 176.5 |
95-th percentile | 506.2 |
Maximum | 700 |
Range | 699 |
Interquartile range (IQR) | 167 |
Descriptive statistics
Standard deviation | 179.96123 |
---|---|
Coefficient of variation (CV) | 1.3815619 |
Kurtosis | 3.557666 |
Mean | 130.25926 |
Median Absolute Deviation (MAD) | 49 |
Skewness | 1.9266513 |
Sum | 3517 |
Variance | 32386.046 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
8 | 2 | 7.4% |
10 | 2 | 7.4% |
6 | 2 | 7.4% |
26 | 2 | 7.4% |
130 | 1 | 3.7% |
9 | 1 | 3.7% |
20 | 1 | 3.7% |
61 | 1 | 3.7% |
571 | 1 | 3.7% |
55 | 1 | 3.7% |
Other values (13) | 13 |
Value | Count | Frequency (%) |
1 | 1 | |
5 | 1 | |
6 | 2 | |
8 | 2 | |
9 | 1 | |
10 | 2 | |
20 | 1 | |
23 | 1 | |
26 | 2 | |
55 | 1 |
Value | Count | Frequency (%) |
700 | 1 | |
571 | 1 | |
355 | 1 | |
312 | 1 | |
282 | 1 | |
245 | 1 | |
196 | 1 | |
157 | 1 | |
130 | 1 | |
121 | 1 |
산업용지(만제곱미터)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 81.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 72.444444 |
Minimum | 1 |
---|---|
Maximum | 411 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 375.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 3 |
Q1 | 5.5 |
median | 21 |
Q3 | 89.5 |
95-th percentile | 281.2 |
Maximum | 411 |
Range | 410 |
Interquartile range (IQR) | 84 |
Descriptive statistics
Standard deviation | 103.29172 |
---|---|
Coefficient of variation (CV) | 1.425806 |
Kurtosis | 4.0804102 |
Mean | 72.444444 |
Median Absolute Deviation (MAD) | 18 |
Skewness | 2.0366364 |
Sum | 1956 |
Variance | 10669.179 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
5 | 3 | 11.1% |
3 | 2 | 7.4% |
13 | 2 | 7.4% |
6 | 2 | 7.4% |
175 | 1 | 3.7% |
61 | 1 | 3.7% |
4 | 1 | 3.7% |
40 | 1 | 3.7% |
319 | 1 | 3.7% |
33 | 1 | 3.7% |
Other values (12) | 12 |
Value | Count | Frequency (%) |
1 | 1 | 3.7% |
3 | 2 | |
4 | 1 | 3.7% |
5 | 3 | |
6 | 2 | |
13 | 2 | |
17 | 1 | 3.7% |
19 | 1 | 3.7% |
21 | 1 | 3.7% |
33 | 1 | 3.7% |
Value | Count | Frequency (%) |
411 | 1 | |
319 | 1 | |
193 | 1 | |
175 | 1 | |
171 | 1 | |
142 | 1 | |
92 | 1 | |
87 | 1 | |
77 | 1 | |
61 | 1 |
입주업체(개사)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 92.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 258.11111 |
Minimum | 1 |
---|---|
Maximum | 2195 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 375.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 16.5 |
median | 76 |
Q3 | 215 |
95-th percentile | 1245.8 |
Maximum | 2195 |
Range | 2194 |
Interquartile range (IQR) | 198.5 |
Descriptive statistics
Standard deviation | 499.05683 |
---|---|
Coefficient of variation (CV) | 1.9334961 |
Kurtosis | 9.5660307 |
Mean | 258.11111 |
Median Absolute Deviation (MAD) | 72 |
Skewness | 3.0385274 |
Sum | 6969 |
Variance | 249057.72 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4 | 2 | 7.4% |
2 | 2 | 7.4% |
641 | 1 | 3.7% |
1505 | 1 | 3.7% |
24 | 1 | 3.7% |
65 | 1 | 3.7% |
567 | 1 | 3.7% |
70 | 1 | 3.7% |
83 | 1 | 3.7% |
117 | 1 | 3.7% |
Other values (15) | 15 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 2 | |
3 | 1 | |
4 | 2 | |
16 | 1 | |
17 | 1 | |
21 | 1 | |
24 | 1 | |
31 | 1 | |
65 | 1 |
Value | Count | Frequency (%) |
2195 | 1 | |
1505 | 1 | |
641 | 1 | |
567 | 1 | |
435 | 1 | |
306 | 1 | |
217 | 1 | |
213 | 1 | |
167 | 1 | |
117 | 1 |
고용인원(명)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 27 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4027.8889 |
Minimum | 61 |
---|---|
Maximum | 28301 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 375.0 B |
Quantile statistics
Minimum | 61 |
---|---|
5-th percentile | 86.3 |
Q1 | 184 |
median | 1452 |
Q3 | 3846 |
95-th percentile | 15091.5 |
Maximum | 28301 |
Range | 28240 |
Interquartile range (IQR) | 3662 |
Descriptive statistics
Standard deviation | 6410.8098 |
---|---|
Coefficient of variation (CV) | 1.5916054 |
Kurtosis | 7.4819863 |
Mean | 4027.8889 |
Median Absolute Deviation (MAD) | 1321 |
Skewness | 2.5874432 |
Sum | 108753 |
Variance | 41098483 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
14059 | 1 | 3.7% |
28301 | 1 | 3.7% |
61 | 1 | 3.7% |
520 | 1 | 3.7% |
1167 | 1 | 3.7% |
9480 | 1 | 3.7% |
1275 | 1 | 3.7% |
396 | 1 | 3.7% |
1567 | 1 | 3.7% |
2440 | 1 | 3.7% |
Other values (17) | 17 |
Value | Count | Frequency (%) |
61 | 1 | |
68 | 1 | |
129 | 1 | |
131 | 1 | |
149 | 1 | |
161 | 1 | |
174 | 1 | |
194 | 1 | |
396 | 1 | |
520 | 1 |
Value | Count | Frequency (%) |
28301 | 1 | |
15534 | 1 | |
14059 | 1 | |
9480 | 1 | |
8549 | 1 | |
5841 | 1 | |
3955 | 1 | |
3737 | 1 | |
3471 | 1 | |
3075 | 1 |
구군명 | 산업단지명 | 산단구분 | 사업기간 | 조성면적(만제곱미터) | 산업용지(만제곱미터) | 입주업체(개사) | 고용인원(명) | |
---|---|---|---|---|---|---|---|---|
구군명 | 1.000 | 1.000 | 0.640 | 1.000 | 0.000 | 0.000 | 0.671 | 0.723 |
산업단지명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
산단구분 | 0.640 | 1.000 | 1.000 | 1.000 | 0.693 | 0.554 | 0.552 | 0.554 |
사업기간 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
조성면적(만제곱미터) | 0.000 | 1.000 | 0.693 | 1.000 | 1.000 | 0.980 | 0.896 | 0.919 |
산업용지(만제곱미터) | 0.000 | 1.000 | 0.554 | 1.000 | 0.980 | 1.000 | 0.798 | 0.965 |
입주업체(개사) | 0.671 | 1.000 | 0.552 | 1.000 | 0.896 | 0.798 | 1.000 | 0.938 |
고용인원(명) | 0.723 | 1.000 | 0.554 | 1.000 | 0.919 | 0.965 | 0.938 | 1.000 |
산단구분 | 구군명 | |
---|---|---|
산단구분 | 1.000 | 0.442 |
구군명 | 0.442 | 1.000 |
조성면적(만제곱미터) | 산업용지(만제곱미터) | 입주업체(개사) | 고용인원(명) | 구군명 | 산단구분 | |
---|---|---|---|---|---|---|
조성면적(만제곱미터) | 1.000 | 0.981 | 0.746 | 0.852 | 0.000 | 0.321 |
산업용지(만제곱미터) | 0.981 | 1.000 | 0.713 | 0.823 | 0.000 | 0.377 |
입주업체(개사) | 0.746 | 0.713 | 1.000 | 0.950 | 0.514 | 0.463 |
고용인원(명) | 0.852 | 0.823 | 0.950 | 1.000 | 0.517 | 0.377 |
구군명 | 0.000 | 0.000 | 0.514 | 0.517 | 1.000 | 0.442 |
산단구분 | 0.321 | 0.377 | 0.463 | 0.377 | 0.442 | 1.000 |
구군명 | 산업단지명 | 산단구분 | 사업기간 | 조성면적(만제곱미터) | 산업용지(만제곱미터) | 입주업체(개사) | 고용인원(명) | |
---|---|---|---|---|---|---|---|---|
0 | 사하구 | 신평ㆍ장림일반산업단지 | 일반 | 1980~1990 | 282 | 175 | 641 | 14059 |
1 | 강서구 | 녹산국가산업단지 | 국가 | 1989~2002 | 700 | 411 | 1505 | 28301 |
2 | 강서구 | 신호일반산업단지(경자구역) | 일반 | 1993~2007 | 312 | 171 | 76 | 3075 |
3 | 강서구 | 부산과학일반산업단지(경자구역) | 일반 | 1991~2008 | 196 | 92 | 167 | 3955 |
4 | 강서구 | 화전일반산업단지(경자구역) | 일반 | 2003~2011 | 245 | 142 | 306 | 5841 |
5 | 강서구 | 강서보고일반산업단지 | 일반 | 2010~2014 | 10 | 5 | 21 | 194 |
6 | 사상구 | 모라도시첨단산업단지 | 도시첨단 | 2012~2015 | 1 | 1 | 217 | 1452 |
7 | 강서구 | 생곡일반산업단지(경자구역) | 일반 | 2009~2015 | 56 | 34 | 101 | 1037 |
8 | 강서구 | 성우일반산업단지 | 일반 | 2009~2016 | 6 | 3 | 16 | 161 |
9 | 강서구 | 풍상일반산업단지 | 일반 | 2011~2016 | 6 | 5 | 3 | 149 |
구군명 | 산업단지명 | 산단구분 | 사업기간 | 조성면적(만제곱미터) | 산업용지(만제곱미터) | 입주업체(개사) | 고용인원(명) | |
---|---|---|---|---|---|---|---|---|
17 | 기장군 | 기룡2일반산업단지 | 일반 | 2007~2011 | 5 | 3 | 2 | 129 |
18 | 기장군 | 정관코리일반산업단지 | 일반 | 2010~2013 | 8 | 6 | 4 | 131 |
19 | 금정구 | 회동ㆍ석대도시첨단산업단지 | 도시첨단 | 2008~2013 | 23 | 13 | 117 | 2440 |
20 | 기장군 | 명례일반산업단지 | 일반 | 2008~2014 | 157 | 87 | 83 | 1567 |
21 | 기장군 | 부산신소재일반산업단지 | 일반 | 2013~2017 | 26 | 17 | 4 | 396 |
22 | 기장군 | 반룡일반산업단지 | 일반 | 2013~2018 | 55 | 33 | 70 | 1275 |
23 | 강서구 | 국제산업물류도시(1단계)(경자구역) | 일반 | 2010~2019 | 571 | 319 | 567 | 9480 |
24 | 기장군 | 오리일반산업단지 | 일반 | 2013~2020 | 61 | 40 | 65 | 1167 |
25 | 기장군 | 에코장안일반산업단지 | 일반 | 2014~2019 | 20 | 13 | 24 | 520 |
26 | 강서구 | 정주일반산업단지 | 일반 | 2014~2020 | 9 | 4 | 2 | 61 |