Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 68 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.4 KiB |
Average record size in memory | 36.9 B |
Variable types
Text | 1 |
---|---|
Numeric | 3 |
Dataset
Description | 울산광역시 소기업, 중기업, 대기업을 산업분류(농업, 임업, 어업, 금속, 비금속, 섬유, 의류, 석탄 등)로 나타낸 현황 자료를 제공하고 있습니다. |
---|---|
Author | 울산광역시 |
URL | https://www.data.go.kr/data/3076119/fileData.do |
Reproduction
Analysis started | 2024-03-14 14:39:56.918944 |
---|---|
Analysis finished | 2024-03-14 14:39:59.573852 |
Duration | 2.65 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
산업분류
Text
UNIQUE
 
Distinct | 68 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 672.0 B |
Value | Count | Frequency (%) |
및 | 35 | 15.0% |
제조업 | 22 | 9.4% |
서비스업 | 12 | 5.2% |
기타 | 6 | 2.6% |
제외 | 6 | 2.6% |
자동차 | 3 | 1.3% |
운송업 | 3 | 1.3% |
보험 | 2 | 0.9% |
기계 | 2 | 0.9% |
광업 | 2 | 0.9% |
Other values (135) | 140 |
Most occurring characters
Value | Count | Frequency (%) |
165 | ||
업 | 72 | 8.8% |
제 | 42 | 5.1% |
및 | 35 | 4.3% |
조 | 24 | 2.9% |
비 | 22 | 2.7% |
기 | 21 | 2.6% |
스 | 19 | 2.3% |
품 | 18 | 2.2% |
, | 18 | 2.2% |
Other values (150) | 382 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 626 | |
Space Separator | 165 | 20.2% |
Other Punctuation | 26 | 3.2% |
Decimal Number | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 72 | 11.5% |
제 | 42 | 6.7% |
및 | 35 | 5.6% |
조 | 24 | 3.8% |
비 | 22 | 3.5% |
기 | 21 | 3.4% |
스 | 19 | 3.0% |
품 | 18 | 2.9% |
서 | 15 | 2.4% |
가 | 8 | 1.3% |
Other values (145) | 350 |
Other Punctuation
Value | Count | Frequency (%) |
, | 18 | |
; | 7 | 26.9% |
· | 1 | 3.8% |
Space Separator
Value | Count | Frequency (%) |
165 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 626 | |
Common | 192 | 23.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 72 | 11.5% |
제 | 42 | 6.7% |
및 | 35 | 5.6% |
조 | 24 | 3.8% |
비 | 22 | 3.5% |
기 | 21 | 3.4% |
스 | 19 | 3.0% |
품 | 18 | 2.9% |
서 | 15 | 2.4% |
가 | 8 | 1.3% |
Other values (145) | 350 |
Common
Value | Count | Frequency (%) |
165 | ||
, | 18 | 9.4% |
; | 7 | 3.6% |
· | 1 | 0.5% |
1 | 1 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 626 | |
ASCII | 191 | 23.3% |
None | 1 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
165 | ||
, | 18 | 9.4% |
; | 7 | 3.7% |
1 | 1 | 0.5% |
Hangul
Value | Count | Frequency (%) |
업 | 72 | 11.5% |
제 | 42 | 6.7% |
및 | 35 | 5.6% |
조 | 24 | 3.8% |
비 | 22 | 3.5% |
기 | 21 | 3.4% |
스 | 19 | 3.0% |
품 | 18 | 2.9% |
서 | 15 | 2.4% |
가 | 8 | 1.3% |
Other values (145) | 350 |
None
Value | Count | Frequency (%) |
· | 1 |
소기업
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 63 |
---|---|
Distinct (%) | 92.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1165.8676 |
Minimum | 1 |
---|---|
Maximum | 18082 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 740.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 30.5 |
median | 214.5 |
Q3 | 667 |
95-th percentile | 5252.85 |
Maximum | 18082 |
Range | 18081 |
Interquartile range (IQR) | 636.5 |
Descriptive statistics
Standard deviation | 2979.5328 |
---|---|
Coefficient of variation (CV) | 2.5556355 |
Kurtosis | 20.637705 |
Mean | 1165.8676 |
Median Absolute Deviation (MAD) | 202 |
Skewness | 4.3509584 |
Sum | 79279 |
Variance | 8877615.6 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2 | 3 | 4.4% |
11 | 2 | 2.9% |
1 | 2 | 2.9% |
23 | 2 | 2.9% |
149 | 1 | 1.5% |
51 | 1 | 1.5% |
84 | 1 | 1.5% |
3 | 1 | 1.5% |
26 | 1 | 1.5% |
948 | 1 | 1.5% |
Other values (53) | 53 |
Value | Count | Frequency (%) |
1 | 2 | |
2 | 3 | |
3 | 1 | 1.5% |
11 | 2 | |
12 | 1 | 1.5% |
13 | 1 | 1.5% |
17 | 1 | 1.5% |
18 | 1 | 1.5% |
19 | 1 | 1.5% |
23 | 2 |
Value | Count | Frequency (%) |
18082 | 1 | |
14451 | 1 | |
6871 | 1 | |
5690 | 1 | |
4441 | 1 | |
4292 | 1 | |
2628 | 1 | |
2569 | 1 | |
2547 | 1 | |
1928 | 1 |
중기업
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 36 |
---|---|
Distinct (%) | 52.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 32.058824 |
Minimum | 0 |
---|---|
Maximum | 285 |
Zeros | 12 |
Zeros (%) | 17.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 740.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1.75 |
median | 8 |
Q3 | 39 |
95-th percentile | 166.5 |
Maximum | 285 |
Range | 285 |
Interquartile range (IQR) | 37.25 |
Descriptive statistics
Standard deviation | 59.965135 |
---|---|
Coefficient of variation (CV) | 1.8704721 |
Kurtosis | 9.8367691 |
Mean | 32.058824 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 3.1227565 |
Sum | 2180 |
Variance | 3595.8174 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 12 | |
1 | 5 | 7.4% |
2 | 4 | 5.9% |
4 | 4 | 5.9% |
8 | 4 | 5.9% |
39 | 3 | 4.4% |
6 | 3 | 4.4% |
10 | 2 | 2.9% |
3 | 2 | 2.9% |
41 | 2 | 2.9% |
Other values (26) | 27 |
Value | Count | Frequency (%) |
0 | 12 | |
1 | 5 | |
2 | 4 | 5.9% |
3 | 2 | 2.9% |
4 | 4 | 5.9% |
6 | 3 | 4.4% |
7 | 1 | 1.5% |
8 | 4 | 5.9% |
9 | 1 | 1.5% |
10 | 2 | 2.9% |
Value | Count | Frequency (%) |
285 | 1 | |
278 | 1 | |
231 | 1 | |
205 | 1 | |
95 | 1 | |
93 | 1 | |
76 | 1 | |
70 | 1 | |
59 | 1 | |
52 | 1 |
대기업
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 9 |
---|---|
Distinct (%) | 13.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.3088235 |
Minimum | 0 |
---|---|
Maximum | 65 |
Zeros | 42 |
Zeros (%) | 61.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 740.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 2 |
95-th percentile | 5 |
Maximum | 65 |
Range | 65 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 8.2665616 |
---|---|
Coefficient of variation (CV) | 3.5804216 |
Kurtosis | 51.289188 |
Mean | 2.3088235 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 6.8762358 |
Sum | 157 |
Variance | 68.33604 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 42 | |
2 | 7 | 10.3% |
5 | 5 | 7.4% |
1 | 5 | 7.4% |
3 | 4 | 5.9% |
4 | 2 | 2.9% |
7 | 1 | 1.5% |
65 | 1 | 1.5% |
21 | 1 | 1.5% |
Value | Count | Frequency (%) |
0 | 42 | |
1 | 5 | 7.4% |
2 | 7 | 10.3% |
3 | 4 | 5.9% |
4 | 2 | 2.9% |
5 | 5 | 7.4% |
7 | 1 | 1.5% |
21 | 1 | 1.5% |
65 | 1 | 1.5% |
Value | Count | Frequency (%) |
65 | 1 | 1.5% |
21 | 1 | 1.5% |
7 | 1 | 1.5% |
5 | 5 | 7.4% |
4 | 2 | 2.9% |
3 | 4 | 5.9% |
2 | 7 | 10.3% |
1 | 5 | 7.4% |
0 | 42 |
산업분류 | 소기업 | 중기업 | 대기업 | |
---|---|---|---|---|
산업분류 | 1.000 | 1.000 | 1.000 | 1.000 |
소기업 | 1.000 | 1.000 | 0.826 | 0.000 |
중기업 | 1.000 | 0.826 | 1.000 | 0.464 |
대기업 | 1.000 | 0.000 | 0.464 | 1.000 |
소기업 | 중기업 | 대기업 | |
---|---|---|---|
소기업 | 1.000 | 0.788 | 0.418 |
중기업 | 0.788 | 1.000 | 0.571 |
대기업 | 0.418 | 0.571 | 1.000 |
산업분류 | 소기업 | 중기업 | 대기업 | |
---|---|---|---|---|
0 | 농업 | 12 | 0 | 0 |
1 | 임업 | 11 | 0 | 0 |
2 | 어업 | 2 | 0 | 0 |
3 | 비금속광물 광업 ; 연료용 제외 | 13 | 4 | 0 |
4 | 광업 지원 서비스업 | 1 | 0 | 0 |
5 | 식료품 제조업 | 998 | 6 | 2 |
6 | 음료 제조업 | 19 | 1 | 0 |
7 | 섬유제품 제조업; 의복 제외 | 214 | 17 | 2 |
8 | 의복, 의복액세서리 및 모피제품 제조업 | 139 | 0 | 0 |
9 | 가죽, 가방 및 신발 제조업 | 29 | 1 | 0 |
산업분류 | 소기업 | 중기업 | 대기업 | |
---|---|---|---|---|
58 | 사업시설 관리 및 조경 서비스업 | 293 | 21 | 0 |
59 | 사업지원 서비스업 | 751 | 70 | 1 |
60 | 임대업;부동산 제외 | 321 | 20 | 0 |
61 | 교육 서비스업 | 4292 | 76 | 0 |
62 | 보건업 | 1129 | 278 | 0 |
63 | 사회복지 서비스업 | 664 | 8 | 0 |
64 | 창작, 예술 및 여가관련 서비스업 | 277 | 1 | 0 |
65 | 스포츠 및 오락관련 서비스업 | 2569 | 7 | 0 |
66 | 개인 및 소비용품 수리업 | 1928 | 95 | 0 |
67 | 기타 개인 서비스업 | 5690 | 44 | 0 |