Overview

Dataset statistics

Number of variables6
Number of observations10000
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory556.6 KiB
Average record size in memory57.0 B

Variable types

Numeric1
Categorical3
Text1
DateTime1

Dataset

Description해외 수출을 희망하는 중소벤처기업이 고비즈코리아에 신규로 등록한 유망상품 현황(일자, 지역, 품목 등)을 제공합니다
Author중소벤처기업진흥공단
URLhttps://www.data.go.kr/data/15108091/fileData.do

Alerts

대분류 is highly overall correlated with 중분류High correlation
중분류 is highly overall correlated with 대분류High correlation
연번 has unique valuesUnique

Reproduction

Analysis started2023-12-12 14:07:13.265131
Analysis finished2023-12-12 14:07:14.070212
Duration0.81 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연번
Real number (ℝ)

UNIQUE 

Distinct10000
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean11949.09
Minimum2
Maximum23798
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size166.0 KiB
2023-12-12T23:07:14.143154image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2
5-th percentile1241.95
Q15914.5
median11943
Q317936.5
95-th percentile22685.25
Maximum23798
Range23796
Interquartile range (IQR)12022

Descriptive statistics

Standard deviation6885.6445
Coefficient of variation (CV)0.57624846
Kurtosis-1.2063394
Mean11949.09
Median Absolute Deviation (MAD)6012.5
Skewness-0.0040681064
Sum1.194909 × 108
Variance47412100
MonotonicityNot monotonic
2023-12-12T23:07:14.307752image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
14425 1
 
< 0.1%
5338 1
 
< 0.1%
4597 1
 
< 0.1%
1165 1
 
< 0.1%
11430 1
 
< 0.1%
1757 1
 
< 0.1%
14095 1
 
< 0.1%
20875 1
 
< 0.1%
6201 1
 
< 0.1%
5550 1
 
< 0.1%
Other values (9990) 9990
99.9%
ValueCountFrequency (%)
2 1
< 0.1%
3 1
< 0.1%
5 1
< 0.1%
6 1
< 0.1%
8 1
< 0.1%
16 1
< 0.1%
17 1
< 0.1%
19 1
< 0.1%
20 1
< 0.1%
21 1
< 0.1%
ValueCountFrequency (%)
23798 1
< 0.1%
23791 1
< 0.1%
23787 1
< 0.1%
23784 1
< 0.1%
23783 1
< 0.1%
23782 1
< 0.1%
23777 1
< 0.1%
23776 1
< 0.1%
23775 1
< 0.1%
23774 1
< 0.1%

지역
Categorical

Distinct17
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
서울특별시
2995 
경기도
2854 
인천광역시
661 
부산광역시
568 
강원도
341 
Other values (12)
2581 

Length

Max length7
Median length5
Mean length4.2193
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경기도
2nd row경기도
3rd row서울특별시
4th row부산광역시
5th row대구광역시

Common Values

ValueCountFrequency (%)
서울특별시 2995
29.9%
경기도 2854
28.5%
인천광역시 661
 
6.6%
부산광역시 568
 
5.7%
강원도 341
 
3.4%
전라북도 338
 
3.4%
대구광역시 334
 
3.3%
경상남도 303
 
3.0%
경상북도 298
 
3.0%
대전광역시 272
 
2.7%
Other values (7) 1036
 
10.4%

Length

2023-12-12T23:07:14.442518image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
서울특별시 2995
29.9%
경기도 2854
28.5%
인천광역시 661
 
6.6%
부산광역시 568
 
5.7%
강원도 341
 
3.4%
전라북도 338
 
3.4%
대구광역시 334
 
3.3%
경상남도 303
 
3.0%
경상북도 298
 
3.0%
대전광역시 272
 
2.7%
Other values (7) 1036
 
10.4%

대분류
Categorical

HIGH CORRELATION 

Distinct13
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
건강 및 미용
3905 
농업 및 식품
1339 
의류, 직물 및 액세서리
1005 
가정, 조명 및 장치
863 
기타
558 
Other values (8)
2330 

Length

Max length18
Median length8
Mean length9.6781
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row건강 및 미용
2nd row의류, 직물 및 액세서리
3rd row건강 및 미용
4th row기타
5th row자동 및 수송

Common Values

ValueCountFrequency (%)
건강 및 미용 3905
39.1%
농업 및 식품 1339
 
13.4%
의류, 직물 및 액세서리 1005
 
10.1%
가정, 조명 및 장치 863
 
8.6%
기타 558
 
5.6%
기계, 산업 부품 및 기구 480
 
4.8%
전자제품 462
 
4.6%
선물, 스포츠 및 장난감 336
 
3.4%
포장, 광고 및 사무 302
 
3.0%
전자 장비, 부품 및 전기통신 231
 
2.3%
Other values (3) 519
 
5.2%

Length

2023-12-12T23:07:14.582765image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
8980
27.7%
건강 3905
12.0%
미용 3905
12.0%
농업 1339
 
4.1%
식품 1339
 
4.1%
액세서리 1217
 
3.8%
의류 1005
 
3.1%
직물 1005
 
3.1%
가정 863
 
2.7%
조명 863
 
2.7%
Other values (23) 7987
24.6%

중분류
Categorical

HIGH CORRELATION 

Distinct40
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
미용 및 개인신변 장식제품
3046 
음식 및 음료수
1104 
건강 및 의료
699 
가정 및 정원
690 
의복
647 
Other values (35)
3814 

Length

Max length16
Median length14
Mean length9.8446
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row미용 및 개인신변 장식제품
2nd row의복
3rd row미용 및 개인신변 장식제품
4th row기타
5th row수송

Common Values

ValueCountFrequency (%)
미용 및 개인신변 장식제품 3046
30.5%
음식 및 음료수 1104
 
11.0%
건강 및 의료 699
 
7.0%
가정 및 정원 690
 
6.9%
의복 647
 
6.5%
기타 558
 
5.6%
농업 235
 
2.4%
기계 214
 
2.1%
사무실 및 학교 용품 212
 
2.1%
전기 장비 및 용품 194
 
1.9%
Other values (30) 2401
24.0%

Length

2023-12-12T23:07:14.733785image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
7378
24.9%
장식제품 3046
 
10.3%
미용 3046
 
10.3%
개인신변 3046
 
10.3%
음료수 1104
 
3.7%
음식 1104
 
3.7%
가정 874
 
2.9%
건강 699
 
2.4%
의료 699
 
2.4%
정원 690
 
2.3%
Other values (61) 7981
26.9%
Distinct559
Distinct (%)5.6%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-12T23:07:15.041605image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length19
Median length16
Mean length5.878
Min length1

Characters and Unicode

Total characters58780
Distinct characters416
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique124 ?
Unique (%)1.2%

Sample

1st row스킨 케어
2nd row속옷
3rd row스킨 케어
4th row기타
5th row자전거 부품
ValueCountFrequency (%)
기타 1579
 
7.3%
케어 1418
 
6.6%
스킨 1376
 
6.4%
1368
 
6.3%
용품 853
 
3.9%
제품 769
 
3.6%
화장품 574
 
2.7%
식품 436
 
2.0%
관리 392
 
1.8%
건강 344
 
1.6%
Other values (615) 12512
57.9%
2023-12-12T23:07:15.818163image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
11621
 
19.8%
2977
 
5.1%
2484
 
4.2%
2045
 
3.5%
1645
 
2.8%
1592
 
2.7%
1517
 
2.6%
1446
 
2.5%
1376
 
2.3%
1368
 
2.3%
Other values (406) 30709
52.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 46599
79.3%
Space Separator 11621
 
19.8%
Uppercase Letter 266
 
0.5%
Other Punctuation 196
 
0.3%
Decimal Number 87
 
0.1%
Dash Punctuation 11
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2977
 
6.4%
2484
 
5.3%
2045
 
4.4%
1645
 
3.5%
1592
 
3.4%
1517
 
3.3%
1446
 
3.1%
1376
 
3.0%
1368
 
2.9%
1176
 
2.5%
Other values (389) 28973
62.2%
Uppercase Letter
ValueCountFrequency (%)
C 68
25.6%
T 43
16.2%
V 34
12.8%
D 32
12.0%
L 32
12.0%
E 30
11.3%
B 10
 
3.8%
P 8
 
3.0%
U 5
 
1.9%
S 4
 
1.5%
Other Punctuation
ValueCountFrequency (%)
& 136
69.4%
, 31
 
15.8%
% 29
 
14.8%
Decimal Number
ValueCountFrequency (%)
0 58
66.7%
1 29
33.3%
Space Separator
ValueCountFrequency (%)
11621
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 11
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 46599
79.3%
Common 11915
 
20.3%
Latin 266
 
0.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2977
 
6.4%
2484
 
5.3%
2045
 
4.4%
1645
 
3.5%
1592
 
3.4%
1517
 
3.3%
1446
 
3.1%
1376
 
3.0%
1368
 
2.9%
1176
 
2.5%
Other values (389) 28973
62.2%
Latin
ValueCountFrequency (%)
C 68
25.6%
T 43
16.2%
V 34
12.8%
D 32
12.0%
L 32
12.0%
E 30
11.3%
B 10
 
3.8%
P 8
 
3.0%
U 5
 
1.9%
S 4
 
1.5%
Common
ValueCountFrequency (%)
11621
97.5%
& 136
 
1.1%
0 58
 
0.5%
, 31
 
0.3%
% 29
 
0.2%
1 29
 
0.2%
- 11
 
0.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 46599
79.3%
ASCII 12181
 
20.7%

Most frequent character per block

ASCII
ValueCountFrequency (%)
11621
95.4%
& 136
 
1.1%
C 68
 
0.6%
0 58
 
0.5%
T 43
 
0.4%
V 34
 
0.3%
D 32
 
0.3%
L 32
 
0.3%
, 31
 
0.3%
E 30
 
0.2%
Other values (7) 96
 
0.8%
Hangul
ValueCountFrequency (%)
2977
 
6.4%
2484
 
5.3%
2045
 
4.4%
1645
 
3.5%
1592
 
3.4%
1517
 
3.3%
1446
 
3.1%
1376
 
3.0%
1368
 
2.9%
1176
 
2.5%
Other values (389) 28973
62.2%
Distinct329
Distinct (%)3.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
Minimum2022-01-03 00:00:00
Maximum2022-12-31 00:00:00
2023-12-12T23:07:15.993482image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T23:07:16.121373image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

Interactions

2023-12-12T23:07:13.816824image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T23:07:16.229239image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연번지역대분류중분류
연번1.0000.1380.2180.331
지역0.1381.0000.4390.560
대분류0.2180.4391.0001.000
중분류0.3310.5601.0001.000
2023-12-12T23:07:16.330462image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
대분류중분류지역
대분류1.0000.9990.169
중분류0.9991.0000.183
지역0.1690.1831.000
2023-12-12T23:07:16.411149image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연번지역대분류중분류
연번1.0000.0540.0910.111
지역0.0541.0000.1690.183
대분류0.0910.1691.0000.999
중분류0.1110.1830.9991.000

Missing values

2023-12-12T23:07:13.922573image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T23:07:14.025953image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연번지역대분류중분류품목명등록일
1442414425경기도건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-07-29
1545915460경기도의류, 직물 및 액세서리의복속옷2022-09-13
1803218033서울특별시건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-10-13
2236622367부산광역시기타기타기타2022-11-17
39063907대구광역시자동 및 수송수송자전거 부품2022-05-31
2360723608경기도기계, 산업 부품 및 기구도구기타 도구2022-05-17
16301631서울특별시가정, 조명 및 장치가정 및 정원애완 동물 제품2022-09-09
16801681서울특별시의류, 직물 및 액세서리의복의상2022-08-11
44244425서울특별시기타기타기타2022-07-06
30853086전라남도농업 및 식품음식 및 음료수2022-11-18
연번지역대분류중분류품목명등록일
2190321904부산광역시기타기타기타2022-11-17
83578358경기도가정, 조명 및 장치가정 및 정원욕실 제품2022-07-30
1334013341서울특별시의류, 직물 및 액세서리의복운동복2022-10-24
16701671서울특별시건강 및 미용미용 및 개인신변 장식제품화장품2022-09-19
17151716서울특별시의류, 직물 및 액세서리시계, 보석, 안경귀걸이2022-03-04
25152516경기도전자 장비, 부품 및 전기통신원거리 통신무선 네트워킹 장비2022-01-07
2303823039서울특별시포장, 광고 및 사무사무실 및 학교 용품책 표지2022-11-03
78027803경기도가정, 조명 및 장치가정 및 정원애완 동물 제품2022-08-06
22142215강원도농업 및 식품음식 및 음료수커피2022-04-27
1835418355서울특별시포장, 광고 및 사무사무실 및 학교 용품책 표지2022-11-02