Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 30 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.8 KiB |
Average record size in memory | 62.4 B |
Variable types
DateTime | 1 |
---|---|
Numeric | 2 |
Text | 3 |
Categorical | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 경기신용보증재단 |
URL | https://bigdata-region.kr/#/dataset/f57576ce-d9cc-475e-8715-e7c3e09c0059 |
Reproduction
Analysis started | 2023-12-10 14:15:00.633578 |
---|---|
Analysis finished | 2023-12-10 14:15:02.503621 |
Duration | 1.87 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기준년월
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Minimum | 2021-10-01 00:00:00 |
---|---|
Maximum | 2021-10-01 00:00:00 |
관리번호
Real number (ℝ)
UNIQUE
 
Distinct | 30 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.0967418 × 108 |
Minimum | 1.0006314 × 108 |
---|---|
Maximum | 1.1001507 × 108 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 1.0006314 × 108 |
---|---|
5-th percentile | 1.1000035 × 108 |
Q1 | 1.1000248 × 108 |
median | 1.1000496 × 108 |
Q3 | 1.1000838 × 108 |
95-th percentile | 1.1001292 × 108 |
Maximum | 1.1001507 × 108 |
Range | 9951935 |
Interquartile range (IQR) | 5902.75 |
Descriptive statistics
Standard deviation | 1815239.5 |
---|---|
Coefficient of variation (CV) | 0.016551202 |
Kurtosis | 29.999716 |
Mean | 1.0967418 × 108 |
Median Absolute Deviation (MAD) | 3267.5 |
Skewness | -5.4771879 |
Sum | 3.2902254 × 109 |
Variance | 3.2950943 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
100063139 | 1 | 3.3% |
110004795 | 1 | 3.3% |
110015074 | 1 | 3.3% |
110005365 | 1 | 3.3% |
110008422 | 1 | 3.3% |
110008421 | 1 | 3.3% |
110008417 | 1 | 3.3% |
110008410 | 1 | 3.3% |
110013090 | 1 | 3.3% |
110008398 | 1 | 3.3% |
Other values (20) | 20 |
Value | Count | Frequency (%) |
100063139 | 1 | |
110000288 | 1 | |
110000436 | 1 | |
110000754 | 1 | |
110000933 | 1 | |
110001019 | 1 | |
110001788 | 1 | |
110002445 | 1 | |
110002571 | 1 | |
110003848 | 1 |
Value | Count | Frequency (%) |
110015074 | 1 | |
110013090 | 1 | |
110012712 | 1 | |
110008422 | 1 | |
110008421 | 1 | |
110008417 | 1 | |
110008410 | 1 | |
110008398 | 1 | |
110008323 | 1 | |
110006958 | 1 |
시군명
Text
Distinct | 15 |
---|---|
Distinct (%) | 50.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
포천시(의정부 | 3 | |
수원시 | 3 | |
용인시 | 3 | |
남양주시 | 3 | |
평택시 | 2 | 6.7% |
의정부 | 2 | 6.7% |
성남시 | 2 | 6.7% |
양주시(의정부 | 2 | 6.7% |
화성시(화성 | 2 | 6.7% |
파주시(고양 | 2 | 6.7% |
Other values (5) | 6 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 29 | |
( | 11 | 7.7% |
) | 11 | 7.7% |
부 | 8 | 5.6% |
양 | 7 | 4.9% |
의 | 7 | 4.9% |
정 | 7 | 4.9% |
성 | 7 | 4.9% |
주 | 7 | 4.9% |
천 | 5 | 3.5% |
Other values (17) | 44 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 121 | |
Open Punctuation | 11 | 7.7% |
Close Punctuation | 11 | 7.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 29 | |
부 | 8 | 6.6% |
양 | 7 | 5.8% |
의 | 7 | 5.8% |
정 | 7 | 5.8% |
성 | 7 | 5.8% |
주 | 7 | 5.8% |
천 | 5 | 4.1% |
남 | 5 | 4.1% |
안 | 4 | 3.3% |
Other values (15) | 35 |
Open Punctuation
Value | Count | Frequency (%) |
( | 11 |
Close Punctuation
Value | Count | Frequency (%) |
) | 11 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 121 | |
Common | 22 | 15.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 29 | |
부 | 8 | 6.6% |
양 | 7 | 5.8% |
의 | 7 | 5.8% |
정 | 7 | 5.8% |
성 | 7 | 5.8% |
주 | 7 | 5.8% |
천 | 5 | 4.1% |
남 | 5 | 4.1% |
안 | 4 | 3.3% |
Other values (15) | 35 |
Common
Value | Count | Frequency (%) |
( | 11 | |
) | 11 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 121 | |
ASCII | 22 | 15.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 29 | |
부 | 8 | 6.6% |
양 | 7 | 5.8% |
의 | 7 | 5.8% |
정 | 7 | 5.8% |
성 | 7 | 5.8% |
주 | 7 | 5.8% |
천 | 5 | 4.1% |
남 | 5 | 4.1% |
안 | 4 | 3.3% |
Other values (15) | 35 |
ASCII
Value | Count | Frequency (%) |
( | 11 | |
) | 11 |
업종대분류명
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 23.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
C 제조업(10~34) | |
---|---|
C 제조업 (10 ~ 33) | |
G 도매 및 소매업 (45~47) | |
G 도매 및 소매업(45~47) | |
F 건설업(41~42) | |
Other values (2) |
Length
Max length | 25 |
---|---|
Median length | 18 |
Mean length | 14.866667 |
Min length | 12 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 6.7% |
Sample
1st row | C 제조업(10~34) |
---|---|
2nd row | C 제조업(10~34) |
3rd row | G 도매 및 소매업(45~47) |
4th row | J출판;영상;방송통신및정보서비스업(58~63) |
5th row | P 교육 서비스업(85) |
Common Values
Value | Count | Frequency (%) |
C 제조업(10~34) | 10 | |
C 제조업 (10 ~ 33) | 7 | |
G 도매 및 소매업 (45~47) | 6 | |
G 도매 및 소매업(45~47) | 3 | 10.0% |
F 건설업(41~42) | 2 | 6.7% |
J출판;영상;방송통신및정보서비스업(58~63) | 1 | 3.3% |
P 교육 서비스업(85) | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
c | 17 | |
제조업(10~34 | 10 | |
g | 9 | |
도매 | 9 | |
및 | 9 | |
제조업 | 7 | |
10 | 7 | |
7 | ||
33 | 7 | |
45~47 | 6 | 5.7% |
Other values (8) | 17 |
업종중분류명
Text
Distinct | 26 |
---|---|
Distinct (%) | 86.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Length
Max length | 29 |
---|---|
Median length | 17 |
Mean length | 12.533333 |
Min length | 3 |
Characters and Unicode
Total characters | 376 |
---|---|
Distinct characters | 80 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 23 ? |
---|---|
Unique (%) | 76.7% |
Sample
1st row | 전기공급 및 전기제어 장치 제조업 |
---|---|
2nd row | 기타 전자부품 제조업 |
3rd row | 기타 기계 및 장비 도매업 |
4th row | 기타 정보 서비스업 |
5th row | 일반 교습 학원 |
Value | Count | Frequency (%) |
제조업 | 15 | 13.8% |
기타 | 12 | 11.0% |
및 | 10 | 9.2% |
도매업 | 6 | 5.5% |
음·식료품 | 4 | 3.7% |
담배 | 4 | 3.7% |
기계 | 3 | 2.8% |
식품 | 3 | 2.8% |
소매업 | 2 | 1.8% |
공사업 | 2 | 1.8% |
Other values (44) | 48 |
Most occurring characters
Value | Count | Frequency (%) |
79 | ||
업 | 30 | 8.0% |
제 | 21 | 5.6% |
기 | 20 | 5.3% |
품 | 17 | 4.5% |
조 | 16 | 4.3% |
타 | 12 | 3.2% |
및 | 10 | 2.7% |
용 | 8 | 2.1% |
매 | 8 | 2.1% |
Other values (70) | 155 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 290 | |
Space Separator | 79 | 21.0% |
Other Punctuation | 6 | 1.6% |
Decimal Number | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 30 | 10.3% |
제 | 21 | 7.2% |
기 | 20 | 6.9% |
품 | 17 | 5.9% |
조 | 16 | 5.5% |
타 | 12 | 4.1% |
및 | 10 | 3.4% |
용 | 8 | 2.8% |
매 | 8 | 2.8% |
식 | 7 | 2.4% |
Other values (66) | 141 |
Other Punctuation
Value | Count | Frequency (%) |
· | 4 | |
; | 2 |
Space Separator
Value | Count | Frequency (%) |
79 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 290 | |
Common | 86 | 22.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 30 | 10.3% |
제 | 21 | 7.2% |
기 | 20 | 6.9% |
품 | 17 | 5.9% |
조 | 16 | 5.5% |
타 | 12 | 4.1% |
및 | 10 | 3.4% |
용 | 8 | 2.8% |
매 | 8 | 2.8% |
식 | 7 | 2.4% |
Other values (66) | 141 |
Common
Value | Count | Frequency (%) |
79 | ||
· | 4 | 4.7% |
; | 2 | 2.3% |
1 | 1 | 1.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 290 | |
ASCII | 82 | 21.8% |
None | 4 | 1.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
79 | ||
; | 2 | 2.4% |
1 | 1 | 1.2% |
Hangul
Value | Count | Frequency (%) |
업 | 30 | 10.3% |
제 | 21 | 7.2% |
기 | 20 | 6.9% |
품 | 17 | 5.9% |
조 | 16 | 5.5% |
타 | 12 | 4.1% |
및 | 10 | 3.4% |
용 | 8 | 2.8% |
매 | 8 | 2.8% |
식 | 7 | 2.4% |
Other values (66) | 141 |
None
Value | Count | Frequency (%) |
· | 4 |
주요제품명
Text
Distinct | 29 |
---|---|
Distinct (%) | 96.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
육가공제품 | 2 | 4.8% |
자동차부품 | 2 | 4.8% |
반도체 | 2 | 4.8% |
시스템 | 2 | 4.8% |
초콜릿;설탕류;감미료또는과자류도매업 | 1 | 2.4% |
화장지;위생용품 | 1 | 2.4% |
수배전반 | 1 | 2.4% |
금속탱크 | 1 | 2.4% |
소가죽;피혁 | 1 | 2.4% |
목재제재 | 1 | 2.4% |
Other values (28) | 28 |
Most occurring characters
Value | Count | Frequency (%) |
12 | 5.5% | |
; | 11 | 5.0% |
품 | 7 | 3.2% |
도 | 6 | 2.7% |
기 | 6 | 2.7% |
반 | 5 | 2.3% |
소 | 4 | 1.8% |
전 | 4 | 1.8% |
자 | 4 | 1.8% |
제 | 4 | 1.8% |
Other values (112) | 156 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 183 | |
Space Separator | 12 | 5.5% |
Other Punctuation | 11 | 5.0% |
Uppercase Letter | 11 | 5.0% |
Lowercase Letter | 2 | 0.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
품 | 7 | 3.8% |
도 | 6 | 3.3% |
기 | 6 | 3.3% |
반 | 5 | 2.7% |
소 | 4 | 2.2% |
전 | 4 | 2.2% |
자 | 4 | 2.2% |
제 | 4 | 2.2% |
체 | 4 | 2.2% |
용 | 4 | 2.2% |
Other values (99) | 135 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 3 | |
N | 1 | 9.1% |
V | 1 | 9.1% |
T | 1 | 9.1% |
P | 1 | 9.1% |
I | 1 | 9.1% |
U | 1 | 9.1% |
L | 1 | 9.1% |
B | 1 | 9.1% |
Lowercase Letter
Value | Count | Frequency (%) |
p | 1 | |
d | 1 |
Space Separator
Value | Count | Frequency (%) |
12 |
Other Punctuation
Value | Count | Frequency (%) |
; | 11 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 183 | |
Common | 23 | 10.5% |
Latin | 13 | 5.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
품 | 7 | 3.8% |
도 | 6 | 3.3% |
기 | 6 | 3.3% |
반 | 5 | 2.7% |
소 | 4 | 2.2% |
전 | 4 | 2.2% |
자 | 4 | 2.2% |
제 | 4 | 2.2% |
체 | 4 | 2.2% |
용 | 4 | 2.2% |
Other values (99) | 135 |
Latin
Value | Count | Frequency (%) |
C | 3 | |
N | 1 | 7.7% |
V | 1 | 7.7% |
T | 1 | 7.7% |
p | 1 | 7.7% |
P | 1 | 7.7% |
I | 1 | 7.7% |
U | 1 | 7.7% |
L | 1 | 7.7% |
B | 1 | 7.7% |
Common
Value | Count | Frequency (%) |
12 | ||
; | 11 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 183 | |
ASCII | 36 | 16.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
12 | ||
; | 11 | |
C | 3 | 8.3% |
N | 1 | 2.8% |
V | 1 | 2.8% |
T | 1 | 2.8% |
p | 1 | 2.8% |
P | 1 | 2.8% |
I | 1 | 2.8% |
U | 1 | 2.8% |
Other values (3) | 3 | 8.3% |
Hangul
Value | Count | Frequency (%) |
품 | 7 | 3.8% |
도 | 6 | 3.3% |
기 | 6 | 3.3% |
반 | 5 | 2.7% |
소 | 4 | 2.2% |
전 | 4 | 2.2% |
자 | 4 | 2.2% |
제 | 4 | 2.2% |
체 | 4 | 2.2% |
용 | 4 | 2.2% |
Other values (99) | 135 |
종업원수
Real number (ℝ)
Distinct | 17 |
---|---|
Distinct (%) | 56.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 10.266667 |
Minimum | 1 |
---|---|
Maximum | 50 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 4 |
median | 6.5 |
Q3 | 13 |
95-th percentile | 25.1 |
Maximum | 50 |
Range | 49 |
Interquartile range (IQR) | 9 |
Descriptive statistics
Standard deviation | 10.013554 |
---|---|
Coefficient of variation (CV) | 0.97534617 |
Kurtosis | 7.7797404 |
Mean | 10.266667 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 2.4226898 |
Sum | 308 |
Variance | 100.27126 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
6 | 4 | |
17 | 3 | |
2 | 3 | |
3 | 3 | |
4 | 2 | 6.7% |
13 | 2 | 6.7% |
8 | 2 | 6.7% |
5 | 2 | 6.7% |
11 | 1 | 3.3% |
1 | 1 | 3.3% |
Other values (7) | 7 |
Value | Count | Frequency (%) |
1 | 1 | 3.3% |
2 | 3 | |
3 | 3 | |
4 | 2 | |
5 | 2 | |
6 | 4 | |
7 | 1 | 3.3% |
8 | 2 | |
9 | 1 | 3.3% |
11 | 1 | 3.3% |
Value | Count | Frequency (%) |
50 | 1 | 3.3% |
26 | 1 | 3.3% |
24 | 1 | 3.3% |
18 | 1 | 3.3% |
17 | 3 | |
13 | 2 | |
12 | 1 | 3.3% |
11 | 1 | 3.3% |
9 | 1 | 3.3% |
8 | 2 |
관리번호 | 시군명 | 업종대분류명 | 업종중분류명 | 주요제품명 | 종업원수 | |
---|---|---|---|---|---|---|
관리번호 | 1.000 | NaN | NaN | NaN | NaN | NaN |
시군명 | NaN | 1.000 | 0.549 | 0.840 | 1.000 | 0.708 |
업종대분류명 | NaN | 0.549 | 1.000 | 1.000 | 1.000 | 0.000 |
업종중분류명 | NaN | 0.840 | 1.000 | 1.000 | 1.000 | 0.889 |
주요제품명 | NaN | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
종업원수 | NaN | 0.708 | 0.000 | 0.889 | 1.000 | 1.000 |
관리번호 | 종업원수 | 업종대분류명 | |
---|---|---|---|
관리번호 | 1.000 | -0.255 | 0.000 |
종업원수 | -0.255 | 1.000 | 0.000 |
업종대분류명 | 0.000 | 0.000 | 1.000 |
기준년월 | 관리번호 | 시군명 | 업종대분류명 | 업종중분류명 | 주요제품명 | 종업원수 | |
---|---|---|---|---|---|---|---|
0 | 2021-10 | 100063139 | 포천시(의정부) | C 제조업(10~34) | 전기공급 및 전기제어 장치 제조업 | 수배전반 | 11 |
1 | 2021-10 | 110000288 | 평택시 | C 제조업(10~34) | 기타 전자부품 제조업 | BLU; IP CCTV | 50 |
2 | 2021-10 | 110000754 | 의정부 | G 도매 및 소매업(45~47) | 기타 기계 및 장비 도매업 | 의료기기 | 7 |
3 | 2021-10 | 110000933 | 수원시 | J출판;영상;방송통신및정보서비스업(58~63) | 기타 정보 서비스업 | 시스템 소프트웨어 자문;개발 | 17 |
4 | 2021-10 | 110001019 | 성남시 | P 교육 서비스업(85) | 일반 교습 학원 | 보습학원 | 2 |
5 | 2021-10 | 110008323 | 양주시(의정부) | C 제조업 (10 ~ 33) | 기타 식품 제조업 | 양갱 | 13 |
6 | 2021-10 | 110002445 | 양주시(의정부) | C 제조업(10~34) | 합성고무 및 플라스틱 물질 제조업 | 합성수지필름 | 6 |
7 | 2021-10 | 110005366 | 포천시(의정부) | G 도매 및 소매업 (45~47) | 음·식료품 및 담배 도매업 | 육가공제품 | 17 |
8 | 2021-10 | 110002571 | 김포시(부천) | C 제조업 (10 ~ 33) | 기타 금속가공제품 제조업 | 도장업 | 13 |
9 | 2021-10 | 110005714 | 시흥시(안산) | C 제조업 (10 ~ 33) | 기타 금속가공제품 제조업 | 반도체; 자동차부품 | 3 |
기준년월 | 관리번호 | 시군명 | 업종대분류명 | 업종중분류명 | 주요제품명 | 종업원수 | |
---|---|---|---|---|---|---|---|
20 | 2021-10 | 110005147 | 남양주시 | C 제조업 (10 ~ 33) | 제재 및 목재 가공업 | 목재제재 | 8 |
21 | 2021-10 | 110012712 | 파주시(고양) | C 제조업(10~34) | 기타 특수목적용 기계 제조업 | 고압세척기;NC테이블 | 26 |
22 | 2021-10 | 110008398 | 파주시(고양) | G 도매 및 소매업 (45~47) | 음·식료품 및 담배 도매업 | 초콜릿;설탕류;감미료또는과자류도매업 | 2 |
23 | 2021-10 | 110013090 | 수원시 | G 도매 및 소매업(45~47) | 상품 중개업 | 반도체장비및 부품 | 5 |
24 | 2021-10 | 110008410 | 안산시 | C 제조업 (10 ~ 33) | 가구 제조업 | 옥외용벤치 | 6 |
25 | 2021-10 | 110008417 | 안산시 | F 건설업(41~42) | 통신 공사업 | 보안용카메라 | 4 |
26 | 2021-10 | 110008421 | 용인시 | G 도매 및 소매업 (45~47) | 기타 가정용품 소매업 | 보일러 | 3 |
27 | 2021-10 | 110008422 | 용인시 | G 도매 및 소매업 (45~47) | 음·식료품 및 담배 소매업 | 유제품 | 1 |
28 | 2021-10 | 110005365 | 포천시(의정부) | G 도매 및 소매업 (45~47) | 음·식료품 및 담배 도매업 | 육가공제품 | 17 |
29 | 2021-10 | 110015074 | 의정부 | G 도매 및 소매업(45~47) | 신선 식품 및 단순 가공 식품 도매업 | 육류 | 3 |