Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 563 |
Duplicate rows (%) | 5.6% |
Total size in memory | 312.5 KiB |
Average record size in memory | 32.0 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Dataset
Description | 온라인수출 B2B거래를 하기 위해 고비즈코리아 웹사이트에 가입하는 기업 회원 관련, 회원유형별 회원가입 경로, 고비즈 아이디 등의 정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15118979/fileData.do |
Dataset has 563 (5.6%) duplicate rows | Duplicates |
회원가입경로 is highly imbalanced (82.8%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 16:31:42.159649 |
---|---|
Analysis finished | 2023-12-12 16:31:42.630414 |
Duration | 0.47 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
회원유형
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
중소기업회원 | |
---|---|
데이터 미집계 |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 6.3552 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 데이터 미집계 |
---|---|
2nd row | 중소기업회원 |
3rd row | 중소기업회원 |
4th row | 중소기업회원 |
5th row | 중소기업회원 |
Common Values
Value | Count | Frequency (%) |
중소기업회원 | 6448 | |
데이터 미집계 | 3552 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
중소기업회원 | 6448 | |
데이터 | 3552 | |
미집계 | 3552 |
회원가입경로
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
고비즈코리아 | |
---|---|
플랫폼(웹) | 432 |
데이터 미집계 | 15 |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 6.0015 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 고비즈코리아 |
---|---|
2nd row | 고비즈코리아 |
3rd row | 고비즈코리아 |
4th row | 고비즈코리아 |
5th row | 고비즈코리아 |
Common Values
Value | Count | Frequency (%) |
고비즈코리아 | 9553 | |
플랫폼(웹) | 432 | 4.3% |
데이터 미집계 | 15 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
고비즈코리아 | 9553 | |
플랫폼(웹 | 432 | 4.3% |
데이터 | 15 | 0.1% |
미집계 | 15 | 0.1% |
고비즈 아이디
Text
Distinct | 4768 |
---|---|
Distinct (%) | 47.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 31 |
---|---|
Median length | 27 |
Mean length | 9.9 |
Min length | 3 |
Characters and Unicode
Total characters | 99000 |
---|---|
Distinct characters | 72 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4141 ? |
---|---|
Unique (%) | 41.4% |
Sample
1st row | 201********* |
---|---|
2nd row | dsp*** |
3rd row | hwa******* |
4th row | par***** |
5th row | kev****** |
Value | Count | Frequency (%) |
201 | 2936 | |
미집계 | 395 | 3.8% |
데이터 | 395 | 3.8% |
199 | 320 | 3.1% |
sys | 300 | 2.9% |
200 | 206 | 2.0% |
han | 75 | 0.7% |
a05 | 58 | 0.6% |
sun | 54 | 0.5% |
sam | 46 | 0.4% |
Other values (2968) | 5610 |
Most occurring characters
Value | Count | Frequency (%) |
* | 67420 | |
0 | 3515 | 3.6% |
1 | 3458 | 3.5% |
2 | 3259 | 3.3% |
s | 1968 | 2.0% |
a | 1415 | 1.4% |
e | 1169 | 1.2% |
o | 1111 | 1.1% |
n | 1073 | 1.1% |
i | 1040 | 1.1% |
Other values (62) | 13572 | 13.7% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 67432 | |
Lowercase Letter | 17413 | 17.6% |
Decimal Number | 11271 | 11.4% |
Other Letter | 2370 | 2.4% |
Space Separator | 395 | 0.4% |
Uppercase Letter | 104 | 0.1% |
Dash Punctuation | 14 | < 0.1% |
Connector Punctuation | 1 | < 0.1% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
s | 1968 | 11.3% |
a | 1415 | 8.1% |
e | 1169 | 6.7% |
o | 1111 | 6.4% |
n | 1073 | 6.2% |
i | 1040 | 6.0% |
h | 773 | 4.4% |
m | 772 | 4.4% |
c | 772 | 4.4% |
y | 733 | 4.2% |
Other values (16) | 6587 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 15 | 14.4% |
S | 8 | 7.7% |
E | 7 | 6.7% |
B | 5 | 4.8% |
G | 5 | 4.8% |
T | 5 | 4.8% |
J | 5 | 4.8% |
H | 5 | 4.8% |
C | 5 | 4.8% |
O | 4 | 3.8% |
Other values (14) | 40 |
Decimal Number
Value | Count | Frequency (%) |
0 | 3515 | |
1 | 3458 | |
2 | 3259 | |
9 | 671 | 6.0% |
5 | 108 | 1.0% |
3 | 85 | 0.8% |
6 | 62 | 0.6% |
8 | 43 | 0.4% |
4 | 41 | 0.4% |
7 | 29 | 0.3% |
Other Letter
Value | Count | Frequency (%) |
이 | 395 | |
계 | 395 | |
집 | 395 | |
미 | 395 | |
데 | 395 | |
터 | 395 |
Other Punctuation
Value | Count | Frequency (%) |
* | 67420 | |
. | 7 | < 0.1% |
@ | 5 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
395 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 14 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 79113 | |
Latin | 17517 | 17.7% |
Hangul | 2370 | 2.4% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
s | 1968 | 11.2% |
a | 1415 | 8.1% |
e | 1169 | 6.7% |
o | 1111 | 6.3% |
n | 1073 | 6.1% |
i | 1040 | 5.9% |
h | 773 | 4.4% |
m | 772 | 4.4% |
c | 772 | 4.4% |
y | 733 | 4.2% |
Other values (40) | 6691 |
Common
Value | Count | Frequency (%) |
* | 67420 | |
0 | 3515 | 4.4% |
1 | 3458 | 4.4% |
2 | 3259 | 4.1% |
9 | 671 | 0.8% |
395 | 0.5% | |
5 | 108 | 0.1% |
3 | 85 | 0.1% |
6 | 62 | 0.1% |
8 | 43 | 0.1% |
Other values (6) | 97 | 0.1% |
Hangul
Value | Count | Frequency (%) |
이 | 395 | |
계 | 395 | |
집 | 395 | |
미 | 395 | |
데 | 395 | |
터 | 395 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 96630 | |
Hangul | 2370 | 2.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 67420 | |
0 | 3515 | 3.6% |
1 | 3458 | 3.6% |
2 | 3259 | 3.4% |
s | 1968 | 2.0% |
a | 1415 | 1.5% |
e | 1169 | 1.2% |
o | 1111 | 1.1% |
n | 1073 | 1.1% |
i | 1040 | 1.1% |
Other values (56) | 11202 | 11.6% |
Hangul
Value | Count | Frequency (%) |
이 | 395 | |
계 | 395 | |
집 | 395 | |
미 | 395 | |
데 | 395 | |
터 | 395 |
회원유형 | 회원가입경로 | |
---|---|---|
회원유형 | 1.000 | 0.100 |
회원가입경로 | 0.100 | 1.000 |
회원유형 | 회원가입경로 | |
---|---|---|
회원유형 | 1.000 | 0.165 |
회원가입경로 | 0.165 | 1.000 |
회원유형 | 회원가입경로 | |
---|---|---|
회원유형 | 1.000 | 0.165 |
회원가입경로 | 0.165 | 1.000 |
회원유형 | 회원가입경로 | 고비즈 아이디 | |
---|---|---|---|
77553 | 데이터 미집계 | 고비즈코리아 | 201********* |
20216 | 중소기업회원 | 고비즈코리아 | dsp*** |
6524 | 중소기업회원 | 고비즈코리아 | hwa******* |
20808 | 중소기업회원 | 고비즈코리아 | par***** |
41276 | 중소기업회원 | 고비즈코리아 | kev****** |
93986 | 중소기업회원 | 고비즈코리아 | kjs*************** |
28911 | 중소기업회원 | 고비즈코리아 | 199******* |
86848 | 중소기업회원 | 플랫폼(웹) | 데이터 미집계 |
76591 | 데이터 미집계 | 고비즈코리아 | wzl***** |
89580 | 데이터 미집계 | 고비즈코리아 | 201********* |
회원유형 | 회원가입경로 | 고비즈 아이디 | |
---|---|---|---|
26488 | 중소기업회원 | 고비즈코리아 | 199******* |
72425 | 데이터 미집계 | 고비즈코리아 | 201********* |
52979 | 데이터 미집계 | 고비즈코리아 | 201********* |
12298 | 중소기업회원 | 고비즈코리아 | uni*** |
87471 | 데이터 미집계 | 고비즈코리아 | 201********* |
19499 | 중소기업회원 | 고비즈코리아 | com** |
34349 | 중소기업회원 | 고비즈코리아 | sys************ |
87922 | 중소기업회원 | 고비즈코리아 | jkm************** |
3493 | 중소기업회원 | 고비즈코리아 | kon******* |
85089 | 중소기업회원 | 고비즈코리아 | bra********************* |
Most frequently occurring
회원유형 | 회원가입경로 | 고비즈 아이디 | # duplicates | |
---|---|---|---|---|
0 | 데이터 미집계 | 고비즈코리아 | 201********* | 2933 |
562 | 중소기업회원 | 플랫폼(웹) | 데이터 미집계 | 377 |
26 | 중소기업회원 | 고비즈코리아 | 199******* | 319 |
501 | 중소기업회원 | 고비즈코리아 | sys************ | 293 |
27 | 중소기업회원 | 고비즈코리아 | 200******* | 190 |
50 | 중소기업회원 | 고비즈코리아 | a05********** | 56 |
228 | 중소기업회원 | 고비즈코리아 | han***** | 22 |
490 | 중소기업회원 | 고비즈코리아 | sun***** | 15 |
28 | 중소기업회원 | 고비즈코리아 | 200******** | 14 |
230 | 중소기업회원 | 고비즈코리아 | han******* | 13 |