Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 25 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.2 KiB |
Average record size in memory | 48.3 B |
Variable types
Categorical | 1 |
---|---|
Text | 1 |
Numeric | 3 |
Dataset
Description | 창업진흥원 창업기업의 형태별(개인, 법인) 업력, 창업진흥원 창업기업의 형태별(개인, 법인) 업종(2020년 창업기업실태조사 통계자료) |
---|---|
URL | https://www.data.go.kr/data/15048993/fileData.do |
기업수 is highly overall correlated with 개인 and 2 other fields | High correlation |
개인 is highly overall correlated with 기업수 and 2 other fields | High correlation |
법인 is highly overall correlated with 기업수 and 2 other fields | High correlation |
구분별(1) is highly overall correlated with 기업수 and 2 other fields | High correlation |
구분별(2) has unique values | Unique |
기업수 has unique values | Unique |
개인 has unique values | Unique |
법인 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 10:01:48.108267 |
---|---|
Analysis finished | 2023-12-12 10:01:49.604684 |
Duration | 1.5 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분별(1)
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 8.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
업종 | |
---|---|
업력 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 업력 |
---|---|
2nd row | 업력 |
3rd row | 업력 |
4th row | 업력 |
5th row | 업력 |
Common Values
Value | Count | Frequency (%) |
업종 | 18 | |
업력 | 7 | 28.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
업종 | 18 | |
업력 | 7 | 28.0% |
구분별(2)
Text
UNIQUE
 
Distinct | 25 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
Value | Count | Frequency (%) |
및 | 12 | 17.4% |
서비스업 | 6 | 8.7% |
1년 | 1 | 1.4% |
관리 | 1 | 1.4% |
숙박 | 1 | 1.4% |
음식점업 | 1 | 1.4% |
정보통신업 | 1 | 1.4% |
금융 | 1 | 1.4% |
보험업 | 1 | 1.4% |
부동산업 | 1 | 1.4% |
Other values (43) | 43 |
Most occurring characters
Value | Count | Frequency (%) |
44 | ||
업 | 23 | 10.7% |
및 | 12 | 5.6% |
, | 8 | 3.7% |
스 | 8 | 3.7% |
년 | 7 | 3.3% |
기 | 6 | 2.8% |
비 | 6 | 2.8% |
서 | 6 | 2.8% |
수 | 4 | 1.9% |
Other values (72) | 91 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 156 | |
Space Separator | 44 | 20.5% |
Other Punctuation | 8 | 3.7% |
Decimal Number | 7 | 3.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 23 | 14.7% |
및 | 12 | 7.7% |
스 | 8 | 5.1% |
년 | 7 | 4.5% |
기 | 6 | 3.8% |
비 | 6 | 3.8% |
서 | 6 | 3.8% |
수 | 4 | 2.6% |
리 | 3 | 1.9% |
사 | 3 | 1.9% |
Other values (63) | 78 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 |
Space Separator
Value | Count | Frequency (%) |
44 |
Other Punctuation
Value | Count | Frequency (%) |
, | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 156 | |
Common | 59 | 27.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 23 | 14.7% |
및 | 12 | 7.7% |
스 | 8 | 5.1% |
년 | 7 | 4.5% |
기 | 6 | 3.8% |
비 | 6 | 3.8% |
서 | 6 | 3.8% |
수 | 4 | 2.6% |
리 | 3 | 1.9% |
사 | 3 | 1.9% |
Other values (63) | 78 |
Common
Value | Count | Frequency (%) |
44 | ||
, | 8 | 13.6% |
1 | 1 | 1.7% |
2 | 1 | 1.7% |
3 | 1 | 1.7% |
4 | 1 | 1.7% |
5 | 1 | 1.7% |
6 | 1 | 1.7% |
7 | 1 | 1.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 156 | |
ASCII | 59 | 27.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
44 | ||
, | 8 | 13.6% |
1 | 1 | 1.7% |
2 | 1 | 1.7% |
3 | 1 | 1.7% |
4 | 1 | 1.7% |
5 | 1 | 1.7% |
6 | 1 | 1.7% |
7 | 1 | 1.7% |
Hangul
Value | Count | Frequency (%) |
업 | 23 | 14.7% |
및 | 12 | 7.7% |
스 | 8 | 5.1% |
년 | 7 | 4.5% |
기 | 6 | 3.8% |
비 | 6 | 3.8% |
서 | 6 | 3.8% |
수 | 4 | 2.6% |
리 | 3 | 1.9% |
사 | 3 | 1.9% |
Other values (63) | 78 |
기업수
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 25 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 245735.52 |
Minimum | 544 |
---|---|
Maximum | 806781 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 357.0 B |
Quantile statistics
Minimum | 544 |
---|---|
5-th percentile | 4848.8 |
Q1 | 69584 |
median | 184837 |
Q3 | 342302 |
95-th percentile | 652569 |
Maximum | 806781 |
Range | 806237 |
Interquartile range (IQR) | 272718 |
Descriptive statistics
Standard deviation | 229880.85 |
---|---|
Coefficient of variation (CV) | 0.93548076 |
Kurtosis | 0.11923532 |
Mean | 245735.52 |
Median Absolute Deviation (MAD) | 118202 |
Skewness | 1.005817 |
Sum | 6143388 |
Variance | 5.2845205 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
659405 | 1 | 4.0% |
625225 | 1 | 4.0% |
184837 | 1 | 4.0% |
94114 | 1 | 4.0% |
26325 | 1 | 4.0% |
137390 | 1 | 4.0% |
92429 | 1 | 4.0% |
122154 | 1 | 4.0% |
127451 | 1 | 4.0% |
17961 | 1 | 4.0% |
Other values (15) | 15 |
Value | Count | Frequency (%) |
544 | 1 | |
4846 | 1 | |
4860 | 1 | |
17961 | 1 | |
26325 | 1 | |
66635 | 1 | |
69584 | 1 | |
92429 | 1 | |
94114 | 1 | |
122154 | 1 |
Value | Count | Frequency (%) |
806781 | 1 | |
659405 | 1 | |
625225 | 1 | |
574606 | 1 | |
493884 | 1 | |
408608 | 1 | |
342302 | 1 | |
290907 | 1 | |
257463 | 1 | |
251363 | 1 |
개인
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 25 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 214255.44 |
Minimum | 4 |
---|---|
Maximum | 706458 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 357.0 B |
Quantile statistics
Minimum | 4 |
---|---|
5-th percentile | 758 |
Q1 | 62282 |
median | 168662 |
Q3 | 294647 |
95-th percentile | 582830.2 |
Maximum | 706458 |
Range | 706454 |
Interquartile range (IQR) | 232365 |
Descriptive statistics
Standard deviation | 208034.36 |
---|---|
Coefficient of variation (CV) | 0.97096419 |
Kurtosis | 0.030825503 |
Mean | 214255.44 |
Median Absolute Deviation (MAD) | 125985 |
Skewness | 1.0217478 |
Sum | 5356386 |
Variance | 4.3278295 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
587150 | 1 | 4.0% |
550351 | 1 | 4.0% |
181151 | 1 | 4.0% |
90022 | 1 | 4.0% |
26054 | 1 | 4.0% |
131245 | 1 | 4.0% |
73298 | 1 | 4.0% |
85374 | 1 | 4.0% |
88149 | 1 | 4.0% |
7833 | 1 | 4.0% |
Other values (15) | 15 |
Value | Count | Frequency (%) |
4 | 1 | |
230 | 1 | |
2870 | 1 | |
7833 | 1 | |
26054 | 1 | |
40834 | 1 | |
62282 | 1 | |
73298 | 1 | |
85374 | 1 | |
88149 | 1 |
Value | Count | Frequency (%) |
706458 | 1 | |
587150 | 1 | |
565551 | 1 | |
550351 | 1 | |
431031 | 1 | |
354694 | 1 | |
294647 | 1 | |
247303 | 1 | |
246969 | 1 | |
213351 | 1 |
법인
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 25 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 31480.08 |
Minimum | 271 |
---|---|
Maximum | 100323 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 357.0 B |
Quantile statistics
Minimum | 271 |
---|---|
5-th percentile | 646.4 |
Q1 | 4856 |
median | 28750 |
Q3 | 47655 |
95-th percentile | 74350.2 |
Maximum | 100323 |
Range | 100052 |
Interquartile range (IQR) | 42799 |
Descriptive statistics
Standard deviation | 28774.188 |
---|---|
Coefficient of variation (CV) | 0.91404431 |
Kurtosis | -0.45733619 |
Mean | 31480.08 |
Median Absolute Deviation (MAD) | 23894 |
Skewness | 0.68617147 |
Sum | 787002 |
Variance | 8.279539 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
72255 | 1 | 4.0% |
74874 | 1 | 4.0% |
3686 | 1 | 4.0% |
4092 | 1 | 4.0% |
271 | 1 | 4.0% |
6145 | 1 | 4.0% |
19131 | 1 | 4.0% |
36780 | 1 | 4.0% |
39302 | 1 | 4.0% |
10128 | 1 | 4.0% |
Other values (15) | 15 |
Value | Count | Frequency (%) |
271 | 1 | |
314 | 1 | |
1976 | 1 | |
3686 | 1 | |
4092 | 1 | |
4353 | 1 | |
4856 | 1 | |
6145 | 1 | |
9055 | 1 | |
10128 | 1 |
Value | Count | Frequency (%) |
100323 | 1 | |
74874 | 1 | |
72255 | 1 | |
68035 | 1 | |
62853 | 1 | |
53914 | 1 | |
47655 | 1 | |
46144 | 1 | |
43938 | 1 | |
39302 | 1 |
구분별(1) | 구분별(2) | 기업수 | 개인 | 법인 | |
---|---|---|---|---|---|
구분별(1) | 1.000 | 1.000 | 0.883 | 0.944 | 0.659 |
구분별(2) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
기업수 | 0.883 | 1.000 | 1.000 | 0.996 | 0.801 |
개인 | 0.944 | 1.000 | 0.996 | 1.000 | 0.790 |
법인 | 0.659 | 1.000 | 0.801 | 0.790 | 1.000 |
기업수 | 개인 | 법인 | 구분별(1) | |
---|---|---|---|---|
기업수 | 1.000 | 0.992 | 0.785 | 0.584 |
개인 | 0.992 | 1.000 | 0.728 | 0.641 |
법인 | 0.785 | 0.728 | 1.000 | 0.562 |
구분별(1) | 0.584 | 0.641 | 0.562 | 1.000 |
구분별(1) | 구분별(2) | 기업수 | 개인 | 법인 | |
---|---|---|---|---|---|
0 | 업력 | 1년 | 659405 | 587150 | 72255 |
1 | 업력 | 2년 | 625225 | 550351 | 74874 |
2 | 업력 | 3년 | 493884 | 431031 | 62853 |
3 | 업력 | 4년 | 408608 | 354694 | 53914 |
4 | 업력 | 5년 | 342302 | 294647 | 47655 |
5 | 업력 | 6년 | 290907 | 246969 | 43938 |
6 | 업력 | 7년 | 251363 | 213351 | 38012 |
7 | 업종 | 농업, 임업 및 어업 | 4860 | 4 | 4856 |
8 | 업종 | 광업 | 544 | 230 | 314 |
9 | 업종 | 제조업 | 236697 | 168662 | 68035 |
구분별(1) | 구분별(2) | 기업수 | 개인 | 법인 | |
---|---|---|---|---|---|
15 | 업종 | 숙박 및 음식점업 | 574606 | 565551 | 9055 |
16 | 업종 | 정보통신업 | 69584 | 40834 | 28750 |
17 | 업종 | 금융 및 보험업 | 17961 | 7833 | 10128 |
18 | 업종 | 부동산업 | 127451 | 88149 | 39302 |
19 | 업종 | 전문, 과학 및 기술 서비스업 | 122154 | 85374 | 36780 |
20 | 업종 | 사업시설 관리, 사업 지원 및 임대 서비스업 | 92429 | 73298 | 19131 |
21 | 업종 | 교육 서비스업 | 137390 | 131245 | 6145 |
22 | 업종 | 보건업 및 사회복지 서비스업 | 26325 | 26054 | 271 |
23 | 업종 | 예술, 스포츠 및 여가관련 서비스업 | 94114 | 90022 | 4092 |
24 | 업종 | 수리 및 기타 개인 서비스업 | 184837 | 181151 | 3686 |