Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 10000 |
Missing cells | 1 |
Missing cells (%) | < 0.1% |
Duplicate rows | 7 |
Duplicate rows (%) | 0.1% |
Total size in memory | 400.4 KiB |
Average record size in memory | 41.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 2 |
Numeric | 1 |
Dataset
Description | 2020년 BL데이터로 HSCODE /국가명/ 국가코드/ 수입기업고유갯수를 제공하는 KOTRA 공공데이터 입니다. |
---|---|
Author | 대한무역투자진흥공사 |
URL | https://www.data.go.kr/data/15101842/fileData.do |
Dataset has 7 (0.1%) duplicate rows | Duplicates |
국가코드 is highly overall correlated with 국가명 | High correlation |
국가명 is highly overall correlated with 국가코드 | High correlation |
수입기업 고유갯수 is highly skewed (γ1 = 40.88051953) | Skewed |
Reproduction
Analysis started | 2023-12-12 19:34:04.239959 |
---|---|
Analysis finished | 2023-12-12 19:34:05.171099 |
Duration | 0.93 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
Distinct | 7618 |
---|---|
Distinct (%) | 76.2% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
853400 | 6 | 0.1% |
840991 | 6 | 0.1% |
853810 | 6 | 0.1% |
292429 | 6 | 0.1% |
271290 | 5 | 0.1% |
170191 | 5 | 0.1% |
843359 | 5 | 0.1% |
843410 | 5 | 0.1% |
847432 | 5 | 0.1% |
441294 | 5 | 0.1% |
Other values (7608) | 9945 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 12926 | |
1 | 8532 | |
2 | 7413 | |
9 | 5567 | |
3 | 5154 | 8.7% |
4 | 5050 | 8.5% |
8 | 4308 | 7.2% |
5 | 4126 | 6.9% |
6 | 3341 | 5.6% |
7 | 3138 | 5.3% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 59555 | |
Uppercase Letter | 12 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 12926 | |
1 | 8532 | |
2 | 7413 | |
9 | 5567 | |
3 | 5154 | 8.7% |
4 | 5050 | 8.5% |
8 | 4308 | 7.2% |
5 | 4126 | 6.9% |
6 | 3341 | 5.6% |
7 | 3138 | 5.3% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 59555 | |
Latin | 12 | < 0.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 12926 | |
1 | 8532 | |
2 | 7413 | |
9 | 5567 | |
3 | 5154 | 8.7% |
4 | 5050 | 8.5% |
8 | 4308 | 7.2% |
5 | 4126 | 6.9% |
6 | 3341 | 5.6% |
7 | 3138 | 5.3% |
Latin
Value | Count | Frequency (%) |
S | 12 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 59567 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 12926 | |
1 | 8532 | |
2 | 7413 | |
9 | 5567 | |
3 | 5154 | 8.7% |
4 | 5050 | 8.5% |
8 | 4308 | 7.2% |
5 | 4126 | 6.9% |
6 | 3341 | 5.6% |
7 | 3138 | 5.3% |
국가명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
미국 | |
---|---|
러시아연방 | |
베트남 | |
인도 | |
멕시코 | |
Other values (6) |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.7944 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 미국 |
---|---|
2nd row | 인도네시아 |
3rd row | 케냐 |
4th row | 인도네시아 |
5th row | 미국 |
Common Values
Value | Count | Frequency (%) |
미국 | 4529 | |
러시아연방 | 674 | 6.7% |
베트남 | 655 | 6.6% |
인도 | 653 | 6.5% |
멕시코 | 631 | 6.3% |
인도네시아 | 626 | 6.3% |
필리핀 | 608 | 6.1% |
케냐 | 580 | 5.8% |
아르헨티나 | 553 | 5.5% |
파나마 | 488 | 4.9% |
Length
Value | Count | Frequency (%) |
미국 | 4529 | |
러시아연방 | 674 | 6.7% |
베트남 | 655 | 6.6% |
인도 | 653 | 6.5% |
멕시코 | 631 | 6.3% |
인도네시아 | 626 | 6.3% |
필리핀 | 608 | 6.1% |
케냐 | 580 | 5.8% |
아르헨티나 | 553 | 5.5% |
파나마 | 488 | 4.9% |
국가코드
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
US | |
---|---|
RU | |
VN | |
IN | |
MX | |
Other values (6) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | US |
---|---|
2nd row | ID |
3rd row | KE |
4th row | ID |
5th row | US |
Common Values
Value | Count | Frequency (%) |
US | 4529 | |
RU | 674 | 6.7% |
VN | 655 | 6.6% |
IN | 653 | 6.5% |
MX | 631 | 6.3% |
ID | 626 | 6.3% |
PH | 608 | 6.1% |
KE | 580 | 5.8% |
AR | 553 | 5.5% |
PA | 488 | 4.9% |
Length
Value | Count | Frequency (%) |
us | 4529 | |
ru | 674 | 6.7% |
vn | 655 | 6.6% |
in | 653 | 6.5% |
mx | 631 | 6.3% |
id | 626 | 6.3% |
ph | 608 | 6.1% |
ke | 580 | 5.8% |
ar | 553 | 5.5% |
pa | 488 | 4.9% |
수입기업 고유갯수
Real number (ℝ)
SKEWED
 
Distinct | 1049 |
---|---|
Distinct (%) | 10.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 216.6107 |
Minimum | 0 |
---|---|
Maximum | 105122 |
Zeros | 4 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 8 |
Q3 | 74 |
95-th percentile | 754.05 |
Maximum | 105122 |
Range | 105122 |
Interquartile range (IQR) | 73 |
Descriptive statistics
Standard deviation | 1834.4991 |
---|---|
Coefficient of variation (CV) | 8.4691065 |
Kurtosis | 2136.1568 |
Mean | 216.6107 |
Median Absolute Deviation (MAD) | 7 |
Skewness | 40.88052 |
Sum | 2166107 |
Variance | 3365386.9 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 3378 | |
2 | 647 | 6.5% |
3 | 282 | 2.8% |
4 | 226 | 2.3% |
5 | 156 | 1.6% |
7 | 132 | 1.3% |
6 | 131 | 1.3% |
11 | 118 | 1.2% |
8 | 118 | 1.2% |
9 | 97 | 1.0% |
Other values (1039) | 4715 |
Value | Count | Frequency (%) |
0 | 4 | < 0.1% |
1 | 3378 | |
2 | 647 | 6.5% |
3 | 282 | 2.8% |
4 | 226 | 2.3% |
5 | 156 | 1.6% |
6 | 131 | 1.3% |
7 | 132 | 1.3% |
8 | 118 | 1.2% |
9 | 97 | 1.0% |
Value | Count | Frequency (%) |
105122 | 1 | |
102553 | 1 | |
53160 | 1 | |
30528 | 1 | |
29341 | 1 | |
28734 | 1 | |
27141 | 1 | |
22527 | 1 | |
19614 | 1 | |
14030 | 1 |
국가명 | 국가코드 | 수입기업 고유갯수 | |
---|---|---|---|
국가명 | 1.000 | 1.000 | 0.098 |
국가코드 | 1.000 | 1.000 | 0.098 |
수입기업 고유갯수 | 0.098 | 0.098 | 1.000 |
국가코드 | 국가명 | |
---|---|---|
국가코드 | 1.000 | 1.000 |
국가명 | 1.000 | 1.000 |
수입기업 고유갯수 | 국가명 | 국가코드 | |
---|---|---|---|
수입기업 고유갯수 | 1.000 | 0.054 | 0.054 |
국가명 | 0.054 | 1.000 | 1.000 |
국가코드 | 0.054 | 1.000 | 1.000 |
국제통일상품체계 (HSCODE) | 국가명 | 국가코드 | 수입기업 고유갯수 | |
---|---|---|---|---|
14850 | 229600 | 미국 | US | 2 |
64628 | 902129 | 인도네시아 | ID | 209 |
77162 | 843110 | 케냐 | KE | 44 |
66058 | 330124 | 인도네시아 | ID | 49 |
26613 | 940204 | 미국 | US | 1 |
45485 | 530121 | 러시아연방 | RU | 3 |
13281 | 252220 | 미국 | US | 146 |
3744 | 292108 | 미국 | US | 1 |
22792 | 463711 | 미국 | US | 1 |
76900 | 880240 | 케냐 | KE | 1 |
국제통일상품체계 (HSCODE) | 국가명 | 국가코드 | 수입기업 고유갯수 | |
---|---|---|---|---|
3588 | 256197 | 미국 | US | 1 |
67061 | 200510 | 인도네시아 | ID | 18 |
57463 | 320641 | 아르헨티나 | AR | 28 |
78669 | 020421 | 케냐 | KE | 1 |
3779 | 601222 | 미국 | US | 1 |
43724 | 847432 | 필리핀 | PH | 39 |
2848 | 012158 | 미국 | US | 1 |
43315 | 851989 | 필리핀 | PH | 85 |
55448 | 441891 | 아르헨티나 | AR | 2 |
28673 | 307301 | 미국 | US | 1 |
Most frequently occurring
국제통일상품체계 (HSCODE) | 국가명 | 국가코드 | 수입기업 고유갯수 | # duplicates | |
---|---|---|---|---|---|
0 | 012589 | 미국 | US | 1 | 2 |
1 | 014665 | 미국 | US | 1 | 2 |
2 | 030234 | 미국 | US | 1 | 2 |
3 | 030445 | 미국 | US | 1 | 2 |
4 | 039001 | 미국 | US | 1 | 2 |
5 | 060320 | 미국 | US | 1 | 2 |
6 | 090900 | 미국 | US | 1 | 2 |