Overview

Dataset statistics

Number of variables5
Number of observations9516
Missing cells0
Missing cells (%)0.0%
Duplicate rows1678
Duplicate rows (%)17.6%
Total size in memory371.8 KiB
Average record size in memory40.0 B

Variable types

Text2
Categorical2
DateTime1

Dataset

Description온라인수출플랫폼을 통해 중소벤처기업 제품를 찾고자 하는 해외바이어이 신청한 인콰이어리 정보(국가, 품목, 수신일 등)를 제공합니다.
Author중소벤처기업진흥공단
URLhttps://www.data.go.kr/data/15108325/fileData.do

Alerts

Dataset has 1678 (17.6%) duplicate rowsDuplicates
대분류 is highly overall correlated with 중분류High correlation
중분류 is highly overall correlated with 대분류High correlation

Reproduction

Analysis started2023-12-12 18:14:20.857872
Analysis finished2023-12-12 18:14:22.002335
Duration1.14 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

국가
Text

Distinct229
Distinct (%)2.4%
Missing0
Missing (%)0.0%
Memory size74.5 KiB
2023-12-13T03:14:22.255812image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length11
Median length10
Mean length3.3844052
Min length1

Characters and Unicode

Total characters32206
Distinct characters211
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique8 ?
Unique (%)0.1%

Sample

1st row인도네시아
2nd row파키스탄
3rd row파키스탄
4th row타이
5th row타이
ValueCountFrequency (%)
미국 1113
 
11.4%
인도 722
 
7.4%
세네갈 644
 
6.6%
대한민국 563
 
5.8%
필리핀 420
 
4.3%
아랍에미리트 401
 
4.1%
베트남 276
 
2.8%
타이 270
 
2.8%
중국 256
 
2.6%
영국 215
 
2.2%
Other values (236) 4847
49.8%
2023-12-13T03:14:22.821620image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2222
 
6.9%
2065
 
6.4%
1557
 
4.8%
1494
 
4.6%
1152
 
3.6%
1036
 
3.2%
982
 
3.0%
955
 
3.0%
890
 
2.8%
864
 
2.7%
Other values (201) 18989
59.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 31995
99.3%
Space Separator 211
 
0.7%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2222
 
6.9%
2065
 
6.5%
1557
 
4.9%
1494
 
4.7%
1152
 
3.6%
1036
 
3.2%
982
 
3.1%
955
 
3.0%
890
 
2.8%
864
 
2.7%
Other values (200) 18778
58.7%
Space Separator
ValueCountFrequency (%)
211
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 31995
99.3%
Common 211
 
0.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2222
 
6.9%
2065
 
6.5%
1557
 
4.9%
1494
 
4.7%
1152
 
3.6%
1036
 
3.2%
982
 
3.1%
955
 
3.0%
890
 
2.8%
864
 
2.7%
Other values (200) 18778
58.7%
Common
ValueCountFrequency (%)
211
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 31995
99.3%
ASCII 211
 
0.7%

Most frequent character per block

Hangul
ValueCountFrequency (%)
2222
 
6.9%
2065
 
6.5%
1557
 
4.9%
1494
 
4.7%
1152
 
3.6%
1036
 
3.2%
982
 
3.1%
955
 
3.0%
890
 
2.8%
864
 
2.7%
Other values (200) 18778
58.7%
ASCII
ValueCountFrequency (%)
211
100.0%

대분류
Categorical

HIGH CORRELATION 

Distinct13
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size74.5 KiB
건강 및 미용
3213 
기계, 산업 부품 및 기구
1462 
전자제품
857 
가정, 조명 및 장치
850 
농업 및 식품
638 
Other values (8)
2496 

Length

Max length18
Median length17
Mean length10.47562
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row자동 및 수송
2nd row기계, 산업 부품 및 기구
3rd row기계, 산업 부품 및 기구
4th row건강 및 미용
5th row건강 및 미용

Common Values

ValueCountFrequency (%)
건강 및 미용 3213
33.8%
기계, 산업 부품 및 기구 1462
15.4%
전자제품 857
 
9.0%
가정, 조명 및 장치 850
 
8.9%
농업 및 식품 638
 
6.7%
의류, 직물 및 액세서리 507
 
5.3%
전자 장비, 부품 및 전기통신 475
 
5.0%
기계, 화학, 고무 및 플라스틱 419
 
4.4%
기타 314
 
3.3%
자동 및 수송 287
 
3.0%
Other values (3) 494
 
5.2%

Length

2023-12-13T03:14:23.030582image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
8345
25.5%
미용 3213
 
9.8%
건강 3213
 
9.8%
부품 1937
 
5.9%
기계 1881
 
5.7%
산업 1462
 
4.5%
기구 1462
 
4.5%
전자제품 857
 
2.6%
조명 850
 
2.6%
장치 850
 
2.6%
Other values (23) 8699
26.5%

중분류
Categorical

HIGH CORRELATION 

Distinct40
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size74.5 KiB
미용 및 개인신변 장식제품
2177 
건강 및 의료
954 
기계
689 
산업용 부품 및 제작 서비스
552 
음식 및 음료수
528 
Other values (35)
4616 

Length

Max length16
Median length14
Mean length9.581652
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row수송
2nd row기계
3rd row기계
4th row미용 및 개인신변 장식제품
5th row미용 및 개인신변 장식제품

Common Values

ValueCountFrequency (%)
미용 및 개인신변 장식제품 2177
22.9%
건강 및 의료 954
 
10.0%
기계 689
 
7.2%
산업용 부품 및 제작 서비스 552
 
5.8%
음식 및 음료수 528
 
5.5%
가정 용품 458
 
4.8%
가정 및 정원 409
 
4.3%
전기 장비 및 용품 397
 
4.2%
기타 314
 
3.3%
의복 302
 
3.2%
Other values (30) 2736
28.8%

Length

2023-12-13T03:14:23.229925image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
6607
23.6%
장식제품 2177
 
7.8%
미용 2177
 
7.8%
개인신변 2177
 
7.8%
건강 954
 
3.4%
의료 954
 
3.4%
용품 888
 
3.2%
가정 867
 
3.1%
기계 689
 
2.5%
서비스 567
 
2.0%
Other values (61) 9918
35.5%
Distinct539
Distinct (%)5.7%
Missing0
Missing (%)0.0%
Memory size74.5 KiB
2023-12-13T03:14:23.774992image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length20
Median length18
Mean length7.2586171
Min length2

Characters and Unicode

Total characters69073
Distinct characters397
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique109 ?
Unique (%)1.1%

Sample

1st row기차 부품
2nd row산업용 레이저 장비
3rd row산업용 레이저 장비
4th row스킨 케어
5th row스킨 케어
ValueCountFrequency (%)
기타 1543
 
7.3%
1384
 
6.5%
케어 839
 
3.9%
스킨 812
 
3.8%
기계 745
 
3.5%
용품 725
 
3.4%
제품 597
 
2.8%
장비 530
 
2.5%
화장품 434
 
2.0%
부품 367
 
1.7%
Other values (596) 13280
62.5%
2023-12-13T03:14:24.432844image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
21256
30.8%
3982
 
5.8%
2840
 
4.1%
1544
 
2.2%
1520
 
2.2%
1485
 
2.1%
1384
 
2.0%
1359
 
2.0%
1209
 
1.8%
983
 
1.4%
Other values (387) 31511
45.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 47324
68.5%
Space Separator 21256
30.8%
Uppercase Letter 276
 
0.4%
Connector Punctuation 168
 
0.2%
Other Punctuation 38
 
0.1%
Dash Punctuation 11
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
3982
 
8.4%
2840
 
6.0%
1544
 
3.3%
1520
 
3.2%
1485
 
3.1%
1384
 
2.9%
1359
 
2.9%
1209
 
2.6%
983
 
2.1%
871
 
1.8%
Other values (371) 30147
63.7%
Uppercase Letter
ValueCountFrequency (%)
C 58
21.0%
T 38
13.8%
D 35
12.7%
L 29
10.5%
V 29
10.5%
E 28
10.1%
B 16
 
5.8%
P 14
 
5.1%
U 11
 
4.0%
S 10
 
3.6%
Other values (2) 8
 
2.9%
Space Separator
ValueCountFrequency (%)
21256
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 168
100.0%
Other Punctuation
ValueCountFrequency (%)
, 38
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 11
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 47324
68.5%
Common 21473
31.1%
Latin 276
 
0.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
3982
 
8.4%
2840
 
6.0%
1544
 
3.3%
1520
 
3.2%
1485
 
3.1%
1384
 
2.9%
1359
 
2.9%
1209
 
2.6%
983
 
2.1%
871
 
1.8%
Other values (371) 30147
63.7%
Latin
ValueCountFrequency (%)
C 58
21.0%
T 38
13.8%
D 35
12.7%
L 29
10.5%
V 29
10.5%
E 28
10.1%
B 16
 
5.8%
P 14
 
5.1%
U 11
 
4.0%
S 10
 
3.6%
Other values (2) 8
 
2.9%
Common
ValueCountFrequency (%)
21256
99.0%
_ 168
 
0.8%
, 38
 
0.2%
- 11
 
0.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 47324
68.5%
ASCII 21749
31.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
21256
97.7%
_ 168
 
0.8%
C 58
 
0.3%
T 38
 
0.2%
, 38
 
0.2%
D 35
 
0.2%
L 29
 
0.1%
V 29
 
0.1%
E 28
 
0.1%
B 16
 
0.1%
Other values (6) 54
 
0.2%
Hangul
ValueCountFrequency (%)
3982
 
8.4%
2840
 
6.0%
1544
 
3.3%
1520
 
3.2%
1485
 
3.1%
1384
 
2.9%
1359
 
2.9%
1209
 
2.6%
983
 
2.1%
871
 
1.8%
Other values (371) 30147
63.7%
Distinct365
Distinct (%)3.8%
Missing0
Missing (%)0.0%
Memory size74.5 KiB
Minimum2022-01-01 00:00:00
Maximum2022-12-31 00:00:00
2023-12-13T03:14:24.608537image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T03:14:24.788686image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

Correlations

2023-12-13T03:14:24.914562image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
대분류중분류
대분류1.0001.000
중분류1.0001.000
2023-12-13T03:14:25.019228image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
대분류중분류
대분류1.0000.999
중분류0.9991.000
2023-12-13T03:14:25.112128image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
대분류중분류
대분류1.0000.999
중분류0.9991.000

Missing values

2023-12-13T03:14:21.805057image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T03:14:21.936177image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

국가대분류중분류품목명수신일
0인도네시아자동 및 수송수송기차 부품2022-11-01
1파키스탄기계, 산업 부품 및 기구기계산업용 레이저 장비2022-01-22
2파키스탄기계, 산업 부품 및 기구기계산업용 레이저 장비2022-01-22
3타이건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-04-16
4타이건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-04-16
5에콰도르기계, 화학, 고무 및 플라스틱고무 및 플라스틱플라스틱 제품2022-11-07
6바베이도스기계, 화학, 고무 및 플라스틱고무 및 플라스틱플라스틱 제품2022-11-08
7우크라이나기계, 화학, 고무 및 플라스틱고무 및 플라스틱플라스틱 제품2022-11-27
8솔로몬 제도기계, 화학, 고무 및 플라스틱고무 및 플라스틱플라스틱 제품2022-11-22
9부룬디기계, 화학, 고무 및 플라스틱고무 및 플라스틱플라스틱 제품2022-11-29
국가대분류중분류품목명수신일
9506미국건강 및 미용미용 및 개인신변 장식제품화장품2022-03-11
9507미국건강 및 미용미용 및 개인신변 장식제품화장품2022-03-11
9508미국건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-02-02
9509미국건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-02-02
9510홍콩건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-03-31
9511홍콩건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-03-31
9512홍콩건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-03-31
9513홍콩건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-03-31
9514독일건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-09-04
9515독일건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-09-04

Duplicate rows

Most frequently occurring

국가대분류중분류품목명수신일# duplicates
684세네갈가정, 조명 및 장치조명 및 조명장치조명 전구 _ 튜브2022-11-1545
708세네갈기계, 산업 부품 및 기구산업용 부품 및 제작 서비스니들밸브2022-11-1544
685세네갈가정, 조명 및 장치조명 및 조명장치조명 전구 _ 튜브2022-11-1632
1118이란건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-03-1430
1589필리핀건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-07-2630
599베트남건강 및 미용미용 및 개인신변 장식제품화장품2022-09-1628
1071우간다건강 및 미용미용 및 개인신변 장식제품기타 미용 및 개인 용품2022-10-0425
593베트남건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-09-1623
592베트남건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-09-1521
1117이란건강 및 미용미용 및 개인신변 장식제품스킨 케어2022-03-0617