Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 701 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 28.9 KiB |
Average record size in memory | 42.2 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 1 |
Text | 2 |
Dataset
Description | 중소벤처기업진흥공단에서 추진 중인 '구조혁신지원사업'의 구조혁신 진단 기업 산업분류, 산업분류코드 및 주요제품 현황 |
---|---|
Author | 중소벤처기업진흥공단 |
URL | https://www.data.go.kr/data/15124145/fileData.do |
순번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-11 23:44:06.344706 |
---|---|
Analysis finished | 2023-12-11 23:44:07.533945 |
Duration | 1.19 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
UNIQUE
 
Distinct | 701 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 351 |
Minimum | 1 |
---|---|
Maximum | 701 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 36 |
Q1 | 176 |
median | 351 |
Q3 | 526 |
95-th percentile | 666 |
Maximum | 701 |
Range | 700 |
Interquartile range (IQR) | 350 |
Descriptive statistics
Standard deviation | 202.50556 |
---|---|
Coefficient of variation (CV) | 0.5769389 |
Kurtosis | -1.2 |
Mean | 351 |
Median Absolute Deviation (MAD) | 175 |
Skewness | 0 |
Sum | 246051 |
Variance | 41008.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
472 | 1 | 0.1% |
464 | 1 | 0.1% |
465 | 1 | 0.1% |
466 | 1 | 0.1% |
467 | 1 | 0.1% |
468 | 1 | 0.1% |
469 | 1 | 0.1% |
470 | 1 | 0.1% |
471 | 1 | 0.1% |
Other values (691) | 691 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
701 | 1 | |
700 | 1 | |
699 | 1 | |
698 | 1 | |
697 | 1 | |
696 | 1 | |
695 | 1 | |
694 | 1 | |
693 | 1 | |
692 | 1 |
지역
Categorical
Distinct | 16 |
---|---|
Distinct (%) | 2.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.6 KiB |
경기 | |
---|---|
서울 | |
경남 | |
경북 | |
전남 | |
Other values (11) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강원 |
---|---|
2nd row | 인천 |
3rd row | 경기 |
4th row | 경기 |
5th row | 전북 |
Common Values
Value | Count | Frequency (%) |
경기 | 185 | |
서울 | 103 | |
경남 | 63 | 9.0% |
경북 | 56 | 8.0% |
전남 | 50 | 7.1% |
인천 | 44 | 6.3% |
부산 | 43 | 6.1% |
충북 | 27 | 3.9% |
충남 | 25 | 3.6% |
강원 | 23 | 3.3% |
Other values (6) | 82 |
Length
Value | Count | Frequency (%) |
경기 | 185 | |
서울 | 103 | |
경남 | 63 | 9.0% |
경북 | 56 | 8.0% |
전남 | 50 | 7.1% |
인천 | 44 | 6.3% |
부산 | 43 | 6.1% |
충북 | 27 | 3.9% |
충남 | 25 | 3.6% |
강원 | 23 | 3.3% |
Other values (6) | 82 |
산업분류
Text
Distinct | 322 |
---|---|
Distinct (%) | 45.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.6 KiB |
Length
Max length | 29 |
---|---|
Median length | 22 |
Mean length | 15.49786 |
Min length | 3 |
Characters and Unicode
Total characters | 10864 |
---|---|
Distinct characters | 301 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 200 ? |
---|---|
Unique (%) | 28.5% |
Sample
1st row | 일반 통신 공사업 |
---|---|
2nd row | 1차 금속제품 도매업 |
3rd row | 기계 및 장비 중개업 |
4th row | 주형 및 금형 제조업 |
5th row | 합성수지 및 기타 플라스틱 물질 제조업 |
Value | Count | Frequency (%) |
제조업 | 426 | 12.6% |
기타 | 272 | 8.0% |
및 | 265 | 7.8% |
외 | 167 | 4.9% |
그 | 165 | 4.9% |
서비스업 | 72 | 2.1% |
부품 | 52 | 1.5% |
도매업 | 51 | 1.5% |
금속 | 43 | 1.3% |
안된 | 40 | 1.2% |
Other values (542) | 1829 |
Most occurring characters
Value | Count | Frequency (%) |
2681 | ||
업 | 721 | 6.6% |
제 | 587 | 5.4% |
기 | 478 | 4.4% |
조 | 471 | 4.3% |
품 | 283 | 2.6% |
타 | 273 | 2.5% |
및 | 265 | 2.4% |
그 | 180 | 1.7% |
외 | 178 | 1.6% |
Other values (291) | 4747 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8104 | |
Space Separator | 2681 | 24.7% |
Other Punctuation | 59 | 0.5% |
Decimal Number | 8 | 0.1% |
Open Punctuation | 6 | 0.1% |
Close Punctuation | 6 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 721 | 8.9% |
제 | 587 | 7.2% |
기 | 478 | 5.9% |
조 | 471 | 5.8% |
품 | 283 | 3.5% |
타 | 273 | 3.4% |
및 | 265 | 3.3% |
그 | 180 | 2.2% |
외 | 178 | 2.2% |
용 | 159 | 2.0% |
Other values (286) | 4509 |
Space Separator
Value | Count | Frequency (%) |
2681 |
Other Punctuation
Value | Count | Frequency (%) |
, | 59 |
Decimal Number
Value | Count | Frequency (%) |
1 | 8 |
Open Punctuation
Value | Count | Frequency (%) |
( | 6 |
Close Punctuation
Value | Count | Frequency (%) |
) | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8104 | |
Common | 2760 | 25.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 721 | 8.9% |
제 | 587 | 7.2% |
기 | 478 | 5.9% |
조 | 471 | 5.8% |
품 | 283 | 3.5% |
타 | 273 | 3.4% |
및 | 265 | 3.3% |
그 | 180 | 2.2% |
외 | 178 | 2.2% |
용 | 159 | 2.0% |
Other values (286) | 4509 |
Common
Value | Count | Frequency (%) |
2681 | ||
, | 59 | 2.1% |
1 | 8 | 0.3% |
( | 6 | 0.2% |
) | 6 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8084 | |
ASCII | 2760 | 25.4% |
Compat Jamo | 20 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2681 | ||
, | 59 | 2.1% |
1 | 8 | 0.3% |
( | 6 | 0.2% |
) | 6 | 0.2% |
Hangul
Value | Count | Frequency (%) |
업 | 721 | 8.9% |
제 | 587 | 7.3% |
기 | 478 | 5.9% |
조 | 471 | 5.8% |
품 | 283 | 3.5% |
타 | 273 | 3.4% |
및 | 265 | 3.3% |
그 | 180 | 2.2% |
외 | 178 | 2.2% |
용 | 159 | 2.0% |
Other values (285) | 4489 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 20 |
산업분류코드
Real number (ℝ)
Distinct | 322 |
---|---|
Distinct (%) | 45.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 33842.745 |
Minimum | 1122 |
---|---|
Maximum | 96911 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.3 KiB |
Quantile statistics
Minimum | 1122 |
---|---|
5-th percentile | 10713 |
Q1 | 24311 |
median | 29133 |
Q3 | 46106 |
95-th percentile | 71531 |
Maximum | 96911 |
Range | 95789 |
Interquartile range (IQR) | 21795 |
Descriptive statistics
Standard deviation | 17201.092 |
---|---|
Coefficient of variation (CV) | 0.50826528 |
Kurtosis | 0.80283068 |
Mean | 33842.745 |
Median Absolute Deviation (MAD) | 6842 |
Skewness | 1.0551182 |
Sum | 23723764 |
Variance | 2.9587757 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
26299 | 24 | 3.4% |
25999 | 17 | 2.4% |
62021 | 14 | 2.0% |
62010 | 14 | 2.0% |
33999 | 14 | 2.0% |
30399 | 13 | 1.9% |
22299 | 13 | 1.9% |
28123 | 11 | 1.6% |
29199 | 10 | 1.4% |
46800 | 10 | 1.4% |
Other values (312) | 561 |
Value | Count | Frequency (%) |
1122 | 1 | 0.1% |
1231 | 1 | 0.1% |
3220 | 1 | 0.1% |
10121 | 6 | |
10122 | 4 | |
10129 | 2 | 0.3% |
10219 | 4 | |
10220 | 2 | 0.3% |
10301 | 1 | 0.1% |
10309 | 4 |
Value | Count | Frequency (%) |
96911 | 1 | 0.1% |
95120 | 1 | 0.1% |
90290 | 1 | 0.1% |
90199 | 1 | 0.1% |
85709 | 4 | |
85632 | 1 | 0.1% |
85503 | 1 | 0.1% |
76310 | 1 | 0.1% |
75999 | 2 | |
74220 | 1 | 0.1% |
주요제품
Text
Distinct | 691 |
---|---|
Distinct (%) | 98.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.6 KiB |
Length
Max length | 64 |
---|---|
Median length | 43 |
Mean length | 13.67903 |
Min length | 1 |
Characters and Unicode
Total characters | 9589 |
---|---|
Distinct characters | 631 |
Distinct categories | 10 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 684 ? |
---|---|
Unique (%) | 97.6% |
Sample
1st row | 정보통신공사업 |
---|---|
2nd row | 냉연, 도금강판 |
3rd row | 에스프레소머신 |
4th row | 사출,다이캐스팅 금형제조 |
5th row | 우레탄 바닥재 |
Value | Count | Frequency (%) |
및 | 106 | 5.7% |
부품 | 28 | 1.5% |
등 | 25 | 1.3% |
외 | 18 | 1.0% |
제조 | 17 | 0.9% |
시스템 | 12 | 0.6% |
자동차 | 11 | 0.6% |
개발 | 10 | 0.5% |
장비 | 9 | 0.5% |
소프트웨어 | 9 | 0.5% |
Other values (1368) | 1619 |
Most occurring characters
Value | Count | Frequency (%) |
1176 | 12.3% | |
, | 390 | 4.1% |
기 | 243 | 2.5% |
품 | 179 | 1.9% |
스 | 177 | 1.8% |
제 | 148 | 1.5% |
전 | 128 | 1.3% |
용 | 126 | 1.3% |
및 | 125 | 1.3% |
자 | 118 | 1.2% |
Other values (621) | 6779 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 7192 | |
Space Separator | 1176 | 12.3% |
Other Punctuation | 450 | 4.7% |
Uppercase Letter | 376 | 3.9% |
Lowercase Letter | 281 | 2.9% |
Open Punctuation | 38 | 0.4% |
Close Punctuation | 38 | 0.4% |
Decimal Number | 31 | 0.3% |
Dash Punctuation | 5 | 0.1% |
Math Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 243 | 3.4% |
품 | 179 | 2.5% |
스 | 177 | 2.5% |
제 | 148 | 2.1% |
전 | 128 | 1.8% |
용 | 126 | 1.8% |
및 | 125 | 1.7% |
자 | 118 | 1.6% |
부 | 110 | 1.5% |
이 | 102 | 1.4% |
Other values (548) | 5736 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 41 | |
r | 31 | |
o | 23 | 8.2% |
t | 18 | 6.4% |
i | 18 | 6.4% |
p | 16 | 5.7% |
a | 16 | 5.7% |
l | 16 | 5.7% |
c | 16 | 5.7% |
n | 14 | 5.0% |
Other values (15) | 72 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 36 | 9.6% |
C | 30 | 8.0% |
A | 27 | 7.2% |
S | 26 | 6.9% |
I | 26 | 6.9% |
P | 26 | 6.9% |
R | 25 | 6.6% |
D | 25 | 6.6% |
T | 21 | 5.6% |
F | 21 | 5.6% |
Other values (15) | 113 |
Decimal Number
Value | Count | Frequency (%) |
2 | 8 | |
3 | 5 | |
5 | 4 | |
0 | 4 | |
8 | 3 | 9.7% |
4 | 2 | 6.5% |
1 | 2 | 6.5% |
7 | 1 | 3.2% |
6 | 1 | 3.2% |
9 | 1 | 3.2% |
Other Punctuation
Value | Count | Frequency (%) |
, | 390 | |
/ | 28 | 6.2% |
. | 21 | 4.7% |
& | 5 | 1.1% |
" | 2 | 0.4% |
' | 2 | 0.4% |
; | 1 | 0.2% |
: | 1 | 0.2% |
Space Separator
Value | Count | Frequency (%) |
1176 |
Open Punctuation
Value | Count | Frequency (%) |
( | 38 |
Close Punctuation
Value | Count | Frequency (%) |
) | 38 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Math Symbol
Value | Count | Frequency (%) |
+ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 7191 | |
Common | 1740 | 18.1% |
Latin | 657 | 6.9% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 243 | 3.4% |
품 | 179 | 2.5% |
스 | 177 | 2.5% |
제 | 148 | 2.1% |
전 | 128 | 1.8% |
용 | 126 | 1.8% |
및 | 125 | 1.7% |
자 | 118 | 1.6% |
부 | 110 | 1.5% |
이 | 102 | 1.4% |
Other values (547) | 5735 |
Latin
Value | Count | Frequency (%) |
e | 41 | 6.2% |
E | 36 | 5.5% |
r | 31 | 4.7% |
C | 30 | 4.6% |
A | 27 | 4.1% |
S | 26 | 4.0% |
I | 26 | 4.0% |
P | 26 | 4.0% |
R | 25 | 3.8% |
D | 25 | 3.8% |
Other values (40) | 364 |
Common
Value | Count | Frequency (%) |
1176 | ||
, | 390 | 22.4% |
( | 38 | 2.2% |
) | 38 | 2.2% |
/ | 28 | 1.6% |
. | 21 | 1.2% |
2 | 8 | 0.5% |
- | 5 | 0.3% |
3 | 5 | 0.3% |
& | 5 | 0.3% |
Other values (13) | 26 | 1.5% |
Han
Value | Count | Frequency (%) |
外 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 7191 | |
ASCII | 2397 | 25.0% |
CJK | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1176 | ||
, | 390 | 16.3% |
e | 41 | 1.7% |
( | 38 | 1.6% |
) | 38 | 1.6% |
E | 36 | 1.5% |
r | 31 | 1.3% |
C | 30 | 1.3% |
/ | 28 | 1.2% |
A | 27 | 1.1% |
Other values (63) | 562 |
Hangul
Value | Count | Frequency (%) |
기 | 243 | 3.4% |
품 | 179 | 2.5% |
스 | 177 | 2.5% |
제 | 148 | 2.1% |
전 | 128 | 1.8% |
용 | 126 | 1.8% |
및 | 125 | 1.7% |
자 | 118 | 1.6% |
부 | 110 | 1.5% |
이 | 102 | 1.4% |
Other values (547) | 5735 |
CJK
Value | Count | Frequency (%) |
外 | 1 |
순번 | 지역 | 산업분류코드 | |
---|---|---|---|
순번 | 1.000 | 0.313 | 0.100 |
지역 | 0.313 | 1.000 | 0.357 |
산업분류코드 | 0.100 | 0.357 | 1.000 |
순번 | 산업분류코드 | 지역 | |
---|---|---|---|
순번 | 1.000 | -0.058 | 0.128 |
산업분류코드 | -0.058 | 1.000 | 0.146 |
지역 | 0.128 | 0.146 | 1.000 |
순번 | 지역 | 산업분류 | 산업분류코드 | 주요제품 | |
---|---|---|---|---|---|
0 | 1 | 강원 | 일반 통신 공사업 | 42321 | 정보통신공사업 |
1 | 2 | 인천 | 1차 금속제품 도매업 | 46721 | 냉연, 도금강판 |
2 | 3 | 경기 | 기계 및 장비 중개업 | 46106 | 에스프레소머신 |
3 | 4 | 경기 | 주형 및 금형 제조업 | 29294 | 사출,다이캐스팅 금형제조 |
4 | 5 | 전북 | 합성수지 및 기타 플라스틱 물질 제조업 | 20202 | 우레탄 바닥재 |
5 | 6 | 경기 | 기타 전문 서비스업 | 71600 | 전기설계용역서비스 |
6 | 7 | 부산 | 컴퓨터 시스템 통합 자문 및 구축 서비스업 | 62021 | SW개발, SI컨설팅, SI구축 |
7 | 8 | 경기 | 일반 통신 공사업 | 42321 | 구내방송장비 |
8 | 9 | 서울 | 컴퓨터 프로그래밍 서비스업 | 62010 | 소프트웨어 |
9 | 10 | 강원 | 그 외 기타 분류 안된 금속 가공제품 제조업 | 25999 | 낙석방지책 |
순번 | 지역 | 산업분류 | 산업분류코드 | 주요제품 | |
---|---|---|---|---|---|
691 | 692 | 인천 | 단미사료 및 기타 사료 제조업 | 10802 | 반려동물 단미사료 및 용품 |
692 | 693 | 경기 | 그 외 기타 의복 액세서리 제조업 | 14499 | 여성의류 |
693 | 694 | 경남 | 그 외 기타 분류 안된 화학제품 제조업 | 20499 | 피톤치드오일 살균탈취제, 배식이섬유(페어파우더) 제품 |
694 | 695 | 경남 | 코크스 및 관련제품 제조업 | 19101 | 씨콜 외 다수 |
695 | 696 | 경기 | 그 외 기타 플라스틱 제품 제조업 | 22299 | 자동차에 들아가는 여러가지 부품 |
696 | 697 | 전남 | 선박 구성 부분품 제조업 | 31114 | 안전발판(족장) |
697 | 698 | 인천 | 영화, 비디오물 및 방송 프로그램 제작 관련 서비스업 | 59120 | 미디어콘텐츠영상 |
698 | 699 | 경기 | 반도체 제조용 기계 제조업 | 29271 | H/J, HotN2, 3중배관 |
699 | 700 | 경기 | 기타 일반 기계 및 장비 수리업 | 34019 | 산업용 로봇 제조업 |
700 | 701 | 울산 | 기타 건축용 플라스틱 조립제품 제조업 | 22229 | pp보드,epp블럭 |