Dataset statistics
Number of variables | 11 |
---|---|
Number of observations | 248 |
Missing cells | 331 |
Missing cells (%) | 12.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 22.2 KiB |
Average record size in memory | 91.5 B |
Variable types
Numeric | 2 |
---|---|
Text | 4 |
Categorical | 4 |
Unsupported | 1 |
Dataset
Description | 2020-12-22 |
---|---|
Author | 부산시공공데이터포털 |
URL | https://bigdata.busan.go.kr/data/bigDataDetailView.do?menuCode=M00000000007&hdfs_file_sn=20230901050201136000 |
region has constant value "" | Constant |
last_load_dttm has constant value "" | Constant |
insti_gubun is highly overall correlated with gubun | High correlation |
gubun is highly overall correlated with skey and 2 other fields | High correlation |
skey is highly overall correlated with reg_no and 1 other fields | High correlation |
reg_no is highly overall correlated with skey and 1 other fields | High correlation |
company_reg_no has 248 (100.0%) missing values | Missing |
target_country has 83 (33.5%) missing values | Missing |
skey has unique values | Unique |
reg_no has unique values | Unique |
company_reg_no is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-04-17 16:38:09.001690 |
---|---|
Analysis finished | 2024-04-17 16:38:09.918377 |
Duration | 0.92 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
skey
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 248 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1459.5 |
Minimum | 1336 |
---|---|
Maximum | 1583 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.3 KiB |
Quantile statistics
Minimum | 1336 |
---|---|
5-th percentile | 1348.35 |
Q1 | 1397.75 |
median | 1459.5 |
Q3 | 1521.25 |
95-th percentile | 1570.65 |
Maximum | 1583 |
Range | 247 |
Interquartile range (IQR) | 123.5 |
Descriptive statistics
Standard deviation | 71.735626 |
---|---|
Coefficient of variation (CV) | 0.049150823 |
Kurtosis | -1.2 |
Mean | 1459.5 |
Median Absolute Deviation (MAD) | 62 |
Skewness | 0 |
Sum | 361956 |
Variance | 5146 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1559 | 1 | 0.4% |
1389 | 1 | 0.4% |
1376 | 1 | 0.4% |
1377 | 1 | 0.4% |
1378 | 1 | 0.4% |
1379 | 1 | 0.4% |
1380 | 1 | 0.4% |
1381 | 1 | 0.4% |
1382 | 1 | 0.4% |
1383 | 1 | 0.4% |
Other values (238) | 238 |
Value | Count | Frequency (%) |
1336 | 1 | |
1337 | 1 | |
1338 | 1 | |
1339 | 1 | |
1340 | 1 | |
1341 | 1 | |
1342 | 1 | |
1343 | 1 | |
1344 | 1 | |
1345 | 1 |
Value | Count | Frequency (%) |
1583 | 1 | |
1582 | 1 | |
1581 | 1 | |
1580 | 1 | |
1579 | 1 | |
1578 | 1 | |
1577 | 1 | |
1576 | 1 | |
1575 | 1 | |
1574 | 1 |
reg_no
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 248 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 124.5 |
Minimum | 1 |
---|---|
Maximum | 248 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 13.35 |
Q1 | 62.75 |
median | 124.5 |
Q3 | 186.25 |
95-th percentile | 235.65 |
Maximum | 248 |
Range | 247 |
Interquartile range (IQR) | 123.5 |
Descriptive statistics
Standard deviation | 71.735626 |
---|---|
Coefficient of variation (CV) | 0.57618976 |
Kurtosis | -1.2 |
Mean | 124.5 |
Median Absolute Deviation (MAD) | 62 |
Skewness | 0 |
Sum | 30876 |
Variance | 5146 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
224 | 1 | 0.4% |
54 | 1 | 0.4% |
41 | 1 | 0.4% |
42 | 1 | 0.4% |
43 | 1 | 0.4% |
44 | 1 | 0.4% |
45 | 1 | 0.4% |
46 | 1 | 0.4% |
47 | 1 | 0.4% |
48 | 1 | 0.4% |
Other values (238) | 238 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
248 | 1 | |
247 | 1 | |
246 | 1 | |
245 | 1 | |
244 | 1 | |
243 | 1 | |
242 | 1 | |
241 | 1 | |
240 | 1 | |
239 | 1 |
business_nm
Text
Distinct | 247 |
---|---|
Distinct (%) | 99.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
Length
Max length | 25 |
---|---|
Median length | 19 |
Mean length | 8.1975806 |
Min length | 3 |
Characters and Unicode
Total characters | 2033 |
---|---|
Distinct characters | 326 |
Distinct categories | 9 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 246 ? |
---|---|
Unique (%) | 99.2% |
Sample
1st row | 주식회사 메티스 |
---|---|
2nd row | ㈜ 새부산관광투어 |
3rd row | 주식회사 금곡국제여행사 |
4th row | 세정글로벌 주식회사 |
5th row | 드림무역 |
Value | Count | Frequency (%) |
주식회사 | 30 | 9.0% |
㈜ | 13 | 3.9% |
의원 | 3 | 0.9% |
성형외과의원 | 2 | 0.6% |
부민병원 | 2 | 0.6% |
인제대학교 | 2 | 0.6% |
굿윌치과병원 | 2 | 0.6% |
의료법인 | 1 | 0.3% |
청맥병원 | 1 | 0.3% |
일신기독병원 | 1 | 0.3% |
Other values (278) | 278 |
Most occurring characters
Value | Count | Frequency (%) |
원 | 151 | 7.4% |
의 | 98 | 4.8% |
88 | 4.3% | |
과 | 81 | 4.0% |
병 | 55 | 2.7% |
이 | 54 | 2.7% |
스 | 47 | 2.3% |
부 | 45 | 2.2% |
사 | 44 | 2.2% |
주 | 39 | 1.9% |
Other values (316) | 1331 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1764 | |
Space Separator | 88 | 4.3% |
Uppercase Letter | 71 | 3.5% |
Lowercase Letter | 35 | 1.7% |
Other Symbol | 28 | 1.4% |
Open Punctuation | 18 | 0.9% |
Close Punctuation | 18 | 0.9% |
Decimal Number | 7 | 0.3% |
Other Punctuation | 4 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
원 | 151 | 8.6% |
의 | 98 | 5.6% |
과 | 81 | 4.6% |
병 | 55 | 3.1% |
이 | 54 | 3.1% |
스 | 47 | 2.7% |
부 | 45 | 2.6% |
사 | 44 | 2.5% |
주 | 39 | 2.2% |
회 | 38 | 2.2% |
Other values (272) | 1112 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 8 | |
E | 7 | 9.9% |
B | 6 | 8.5% |
A | 6 | 8.5% |
N | 5 | 7.0% |
T | 5 | 7.0% |
M | 5 | 7.0% |
C | 4 | 5.6% |
I | 4 | 5.6% |
P | 3 | 4.2% |
Other values (10) | 18 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 5 | |
a | 5 | |
i | 4 | |
n | 3 | |
s | 3 | |
d | 3 | |
v | 2 | 5.7% |
c | 2 | 5.7% |
t | 2 | 5.7% |
m | 2 | 5.7% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
3 | 2 | |
6 | 2 | |
5 | 2 | |
2 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 | |
. | 2 |
Space Separator
Value | Count | Frequency (%) |
88 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 28 |
Open Punctuation
Value | Count | Frequency (%) |
( | 18 |
Close Punctuation
Value | Count | Frequency (%) |
) | 18 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1785 | |
Common | 135 | 6.6% |
Latin | 106 | 5.2% |
Han | 7 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
원 | 151 | 8.5% |
의 | 98 | 5.5% |
과 | 81 | 4.5% |
병 | 55 | 3.1% |
이 | 54 | 3.0% |
스 | 47 | 2.6% |
부 | 45 | 2.5% |
사 | 44 | 2.5% |
주 | 39 | 2.2% |
회 | 38 | 2.1% |
Other values (266) | 1133 |
Latin
Value | Count | Frequency (%) |
S | 8 | 7.5% |
E | 7 | 6.6% |
B | 6 | 5.7% |
A | 6 | 5.7% |
e | 5 | 4.7% |
N | 5 | 4.7% |
a | 5 | 4.7% |
T | 5 | 4.7% |
M | 5 | 4.7% |
i | 4 | 3.8% |
Other values (24) | 50 |
Common
Value | Count | Frequency (%) |
88 | ||
( | 18 | 13.3% |
) | 18 | 13.3% |
, | 2 | 1.5% |
. | 2 | 1.5% |
3 | 2 | 1.5% |
6 | 2 | 1.5% |
5 | 2 | 1.5% |
2 | 1 | 0.7% |
Han
Value | Count | Frequency (%) |
社 | 1 | |
會 | 1 | |
式 | 1 | |
株 | 1 | |
園 | 1 | |
盛 | 1 | |
韓 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1757 | |
ASCII | 241 | 11.9% |
None | 28 | 1.4% |
CJK | 7 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
원 | 151 | 8.6% |
의 | 98 | 5.6% |
과 | 81 | 4.6% |
병 | 55 | 3.1% |
이 | 54 | 3.1% |
스 | 47 | 2.7% |
부 | 45 | 2.6% |
사 | 44 | 2.5% |
주 | 39 | 2.2% |
회 | 38 | 2.2% |
Other values (265) | 1105 |
ASCII
Value | Count | Frequency (%) |
88 | ||
( | 18 | 7.5% |
) | 18 | 7.5% |
S | 8 | 3.3% |
E | 7 | 2.9% |
B | 6 | 2.5% |
A | 6 | 2.5% |
e | 5 | 2.1% |
N | 5 | 2.1% |
a | 5 | 2.1% |
Other values (33) | 75 |
None
Value | Count | Frequency (%) |
㈜ | 28 |
CJK
Value | Count | Frequency (%) |
社 | 1 | |
會 | 1 | |
式 | 1 | |
株 | 1 | |
園 | 1 | |
盛 | 1 | |
韓 | 1 |
insti_gubun
Categorical
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
<NA> | |
---|---|
의원 | |
병원 | |
치과의원 | |
종합병원 | |
Other values (4) |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 3.1814516 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 88 | |
의원 | 73 | |
병원 | 26 | 10.5% |
치과의원 | 19 | 7.7% |
종합병원 | 14 | 5.6% |
한의원 | 13 | 5.2% |
치과병원 | 9 | 3.6% |
상급종합병원 | 4 | 1.6% |
한방병원 | 2 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 88 | |
의원 | 73 | |
병원 | 26 | 10.5% |
치과의원 | 19 | 7.7% |
종합병원 | 14 | 5.6% |
한의원 | 13 | 5.2% |
치과병원 | 9 | 3.6% |
상급종합병원 | 4 | 1.6% |
한방병원 | 2 | 0.8% |
region
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
부산 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산 |
---|---|
2nd row | 부산 |
3rd row | 부산 |
4th row | 부산 |
5th row | 부산 |
Common Values
Value | Count | Frequency (%) |
부산 | 248 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부산 | 248 |
representative
Text
Distinct | 243 |
---|---|
Distinct (%) | 98.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
Value | Count | Frequency (%) |
1명 | 16 | 5.3% |
외 | 14 | 4.6% |
2명 | 3 | 1.0% |
정선윤 | 2 | 0.7% |
김영철 | 2 | 0.7% |
elena | 2 | 0.7% |
김춘웅 | 2 | 0.7% |
정흥태 | 2 | 0.7% |
구영수 | 2 | 0.7% |
이순형 | 2 | 0.7% |
Other values (256) | 256 |
Most occurring characters
Value | Count | Frequency (%) |
57 | 5.7% | |
김 | 43 | 4.3% |
이 | 41 | 4.1% |
정 | 40 | 4.0% |
A | 29 | 2.9% |
박 | 29 | 2.9% |
명 | 26 | 2.6% |
영 | 23 | 2.3% |
N | 22 | 2.2% |
외 | 21 | 2.1% |
Other values (166) | 667 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 753 | |
Uppercase Letter | 161 | 16.1% |
Space Separator | 57 | 5.7% |
Decimal Number | 21 | 2.1% |
Open Punctuation | 2 | 0.2% |
Other Punctuation | 2 | 0.2% |
Close Punctuation | 2 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 43 | 5.7% |
이 | 41 | 5.4% |
정 | 40 | 5.3% |
박 | 29 | 3.9% |
명 | 26 | 3.5% |
영 | 23 | 3.1% |
외 | 21 | 2.8% |
성 | 18 | 2.4% |
희 | 14 | 1.9% |
진 | 12 | 1.6% |
Other values (138) | 486 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 29 | |
N | 22 | |
E | 15 | |
I | 12 | 7.5% |
O | 11 | 6.8% |
L | 10 | 6.2% |
T | 7 | 4.3% |
V | 6 | 3.7% |
S | 6 | 3.7% |
K | 6 | 3.7% |
Other values (11) | 37 |
Decimal Number
Value | Count | Frequency (%) |
1 | 17 | |
2 | 3 | 14.3% |
4 | 1 | 4.8% |
Space Separator
Value | Count | Frequency (%) |
57 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 753 | |
Latin | 161 | 16.1% |
Common | 84 | 8.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 43 | 5.7% |
이 | 41 | 5.4% |
정 | 40 | 5.3% |
박 | 29 | 3.9% |
명 | 26 | 3.5% |
영 | 23 | 3.1% |
외 | 21 | 2.8% |
성 | 18 | 2.4% |
희 | 14 | 1.9% |
진 | 12 | 1.6% |
Other values (138) | 486 |
Latin
Value | Count | Frequency (%) |
A | 29 | |
N | 22 | |
E | 15 | |
I | 12 | 7.5% |
O | 11 | 6.8% |
L | 10 | 6.2% |
T | 7 | 4.3% |
V | 6 | 3.7% |
S | 6 | 3.7% |
K | 6 | 3.7% |
Other values (11) | 37 |
Common
Value | Count | Frequency (%) |
57 | ||
1 | 17 | 20.2% |
2 | 3 | 3.6% |
( | 2 | 2.4% |
, | 2 | 2.4% |
) | 2 | 2.4% |
4 | 1 | 1.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 753 | |
ASCII | 245 | 24.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
57 | ||
A | 29 | |
N | 22 | 9.0% |
1 | 17 | 6.9% |
E | 15 | 6.1% |
I | 12 | 4.9% |
O | 11 | 4.5% |
L | 10 | 4.1% |
T | 7 | 2.9% |
V | 6 | 2.4% |
Other values (18) | 59 |
Hangul
Value | Count | Frequency (%) |
김 | 43 | 5.7% |
이 | 41 | 5.4% |
정 | 40 | 5.3% |
박 | 29 | 3.9% |
명 | 26 | 3.5% |
영 | 23 | 3.1% |
외 | 21 | 2.8% |
성 | 18 | 2.4% |
희 | 14 | 1.9% |
진 | 12 | 1.6% |
Other values (138) | 486 |
company_reg_no
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 248 |
---|---|
Missing (%) | 100.0% |
Memory size | 2.3 KiB |
addr
Text
Distinct | 247 |
---|---|
Distinct (%) | 99.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
Length
Max length | 68 |
---|---|
Median length | 49 |
Mean length | 35.657258 |
Min length | 22 |
Characters and Unicode
Total characters | 8843 |
---|---|
Distinct characters | 293 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 246 ? |
---|---|
Unique (%) | 99.2% |
Sample
1st row | 부산광역시 수영구 망미번영로70번길 26(수영동) |
---|---|
2nd row | 부산광역시 연제구 고분로 5, 9층(연산동, 현우빌딩) |
3rd row | 부산광역시 해운대구 해운대해변로 203, 7층 17호(우동, 오션타워) |
4th row | 부산광역시 부산진구 황령대로 13, 705(범천동, 한라시그마타워) |
5th row | 부산광역시 동구 홍곡로 50, 103동 1104호(초량동, e편한세상 부산항) |
Value | Count | Frequency (%) |
부산광역시 | 232 | 15.8% |
부산진구 | 74 | 5.0% |
해운대구 | 62 | 4.2% |
중앙대로 | 26 | 1.8% |
동구 | 23 | 1.6% |
가야대로 | 19 | 1.3% |
서면로 | 19 | 1.3% |
동래구 | 16 | 1.1% |
부산 | 16 | 1.1% |
해운대로 | 14 | 1.0% |
Other values (665) | 968 |
Most occurring characters
Value | Count | Frequency (%) |
1690 | 19.1% | |
부 | 410 | 4.6% |
산 | 345 | 3.9% |
동 | 317 | 3.6% |
, | 316 | 3.6% |
1 | 290 | 3.3% |
구 | 252 | 2.8% |
( | 248 | 2.8% |
) | 248 | 2.8% |
로 | 247 | 2.8% |
Other values (283) | 4480 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4847 | |
Space Separator | 1690 | 19.1% |
Decimal Number | 1406 | 15.9% |
Other Punctuation | 319 | 3.6% |
Open Punctuation | 248 | 2.8% |
Close Punctuation | 248 | 2.8% |
Dash Punctuation | 35 | 0.4% |
Uppercase Letter | 30 | 0.3% |
Math Symbol | 15 | 0.2% |
Lowercase Letter | 5 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
부 | 410 | 8.5% |
산 | 345 | 7.1% |
동 | 317 | 6.5% |
구 | 252 | 5.2% |
로 | 247 | 5.1% |
시 | 245 | 5.1% |
광 | 239 | 4.9% |
역 | 233 | 4.8% |
대 | 203 | 4.2% |
층 | 138 | 2.8% |
Other values (246) | 2218 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 6 | |
F | 4 | |
B | 3 | |
C | 3 | |
S | 2 | 6.7% |
K | 2 | 6.7% |
E | 2 | 6.7% |
V | 1 | 3.3% |
P | 1 | 3.3% |
W | 1 | 3.3% |
Other values (5) | 5 |
Decimal Number
Value | Count | Frequency (%) |
1 | 290 | |
0 | 188 | |
2 | 187 | |
4 | 143 | |
3 | 125 | |
7 | 114 | 8.1% |
5 | 112 | 8.0% |
6 | 98 | 7.0% |
8 | 76 | 5.4% |
9 | 73 | 5.2% |
Lowercase Letter
Value | Count | Frequency (%) |
l | 2 | |
e | 1 | |
s | 1 | |
i | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 316 | |
. | 2 | 0.6% |
/ | 1 | 0.3% |
Space Separator
Value | Count | Frequency (%) |
1690 |
Open Punctuation
Value | Count | Frequency (%) |
( | 248 |
Close Punctuation
Value | Count | Frequency (%) |
) | 248 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 35 |
Math Symbol
Value | Count | Frequency (%) |
~ | 15 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4847 | |
Common | 3961 | |
Latin | 35 | 0.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
부 | 410 | 8.5% |
산 | 345 | 7.1% |
동 | 317 | 6.5% |
구 | 252 | 5.2% |
로 | 247 | 5.1% |
시 | 245 | 5.1% |
광 | 239 | 4.9% |
역 | 233 | 4.8% |
대 | 203 | 4.2% |
층 | 138 | 2.8% |
Other values (246) | 2218 |
Latin
Value | Count | Frequency (%) |
A | 6 | |
F | 4 | |
B | 3 | 8.6% |
C | 3 | 8.6% |
S | 2 | 5.7% |
l | 2 | 5.7% |
K | 2 | 5.7% |
E | 2 | 5.7% |
V | 1 | 2.9% |
P | 1 | 2.9% |
Other values (9) | 9 |
Common
Value | Count | Frequency (%) |
1690 | ||
, | 316 | 8.0% |
1 | 290 | 7.3% |
( | 248 | 6.3% |
) | 248 | 6.3% |
0 | 188 | 4.7% |
2 | 187 | 4.7% |
4 | 143 | 3.6% |
3 | 125 | 3.2% |
7 | 114 | 2.9% |
Other values (8) | 412 | 10.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4847 | |
ASCII | 3996 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1690 | ||
, | 316 | 7.9% |
1 | 290 | 7.3% |
( | 248 | 6.2% |
) | 248 | 6.2% |
0 | 188 | 4.7% |
2 | 187 | 4.7% |
4 | 143 | 3.6% |
3 | 125 | 3.1% |
7 | 114 | 2.9% |
Other values (27) | 447 | 11.2% |
Hangul
Value | Count | Frequency (%) |
부 | 410 | 8.5% |
산 | 345 | 7.1% |
동 | 317 | 6.5% |
구 | 252 | 5.2% |
로 | 247 | 5.1% |
시 | 245 | 5.1% |
광 | 239 | 4.9% |
역 | 233 | 4.8% |
대 | 203 | 4.2% |
층 | 138 | 2.8% |
Other values (246) | 2218 |
target_country
Text
MISSING
 
Distinct | 80 |
---|---|
Distinct (%) | 48.5% |
Missing | 83 |
Missing (%) | 33.5% |
Memory size | 2.1 KiB |
Value | Count | Frequency (%) |
러시아 | 34 | |
중국 | 34 | |
일본 | 23 | 9.5% |
베트남 | 18 | 7.4% |
몽골 | 15 | 6.2% |
미국/일본/중국/러시아 | 8 | 3.3% |
미국/일본/중국 | 8 | 3.3% |
미국/일본/중국/몽골/러시아 | 7 | 2.9% |
미국 | 6 | 2.5% |
러시아(cis연합 | 6 | 2.5% |
Other values (58) | 84 |
Most occurring characters
Value | Count | Frequency (%) |
/ | 234 | |
국 | 170 | 9.9% |
아 | 122 | 7.1% |
중 | 116 | 6.7% |
시 | 113 | 6.6% |
러 | 107 | 6.2% |
일 | 95 | 5.5% |
본 | 94 | 5.4% |
78 | 4.5% | |
, | 75 | 4.3% |
Other values (49) | 521 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1205 | |
Other Punctuation | 309 | 17.9% |
Space Separator | 78 | 4.5% |
Uppercase Letter | 69 | 4.0% |
Open Punctuation | 31 | 1.8% |
Close Punctuation | 31 | 1.8% |
Dash Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 170 | |
아 | 122 | |
중 | 116 | |
시 | 113 | |
러 | 107 | |
일 | 95 | |
본 | 94 | 7.8% |
미 | 67 | 5.6% |
남 | 47 | 3.9% |
베 | 37 | 3.1% |
Other values (40) | 237 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 23 | |
I | 23 | |
S | 23 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 234 | |
, | 75 | 24.3% |
Space Separator
Value | Count | Frequency (%) |
78 |
Open Punctuation
Value | Count | Frequency (%) |
( | 31 |
Close Punctuation
Value | Count | Frequency (%) |
) | 31 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1205 | |
Common | 451 | 26.1% |
Latin | 69 | 4.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 170 | |
아 | 122 | |
중 | 116 | |
시 | 113 | |
러 | 107 | |
일 | 95 | |
본 | 94 | 7.8% |
미 | 67 | 5.6% |
남 | 47 | 3.9% |
베 | 37 | 3.1% |
Other values (40) | 237 |
Common
Value | Count | Frequency (%) |
/ | 234 | |
78 | 17.3% | |
, | 75 | 16.6% |
( | 31 | 6.9% |
) | 31 | 6.9% |
- | 2 | 0.4% |
Latin
Value | Count | Frequency (%) |
C | 23 | |
I | 23 | |
S | 23 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1205 | |
ASCII | 520 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
/ | 234 | |
78 | 15.0% | |
, | 75 | 14.4% |
( | 31 | 6.0% |
) | 31 | 6.0% |
C | 23 | 4.4% |
I | 23 | 4.4% |
S | 23 | 4.4% |
- | 2 | 0.4% |
Hangul
Value | Count | Frequency (%) |
국 | 170 | |
아 | 122 | |
중 | 116 | |
시 | 113 | |
러 | 107 | |
일 | 95 | |
본 | 94 | 7.8% |
미 | 67 | 5.6% |
남 | 47 | 3.9% |
베 | 37 | 3.1% |
Other values (40) | 237 |
gubun
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
의료기관 | |
---|---|
유치업자 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 유치업자 |
---|---|
2nd row | 유치업자 |
3rd row | 유치업자 |
4th row | 유치업자 |
5th row | 유치업자 |
Common Values
Value | Count | Frequency (%) |
의료기관 | 160 | |
유치업자 | 88 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
의료기관 | 160 | |
유치업자 | 88 |
last_load_dttm
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
2020-12-22 13:36:07 |
---|
Length
Max length | 19 |
---|---|
Median length | 19 |
Mean length | 19 |
Min length | 19 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2020-12-22 13:36:07 |
---|---|
2nd row | 2020-12-22 13:36:07 |
3rd row | 2020-12-22 13:36:07 |
4th row | 2020-12-22 13:36:07 |
5th row | 2020-12-22 13:36:07 |
Common Values
Value | Count | Frequency (%) |
2020-12-22 13:36:07 | 248 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2020-12-22 | 248 | |
13:36:07 | 248 |
skey | reg_no | insti_gubun | target_country | gubun | |
---|---|---|---|---|---|
skey | 1.000 | 1.000 | 0.130 | 0.814 | 0.992 |
reg_no | 1.000 | 1.000 | 0.130 | 0.810 | 0.991 |
insti_gubun | 0.130 | 0.130 | 1.000 | 0.000 | NaN |
target_country | 0.814 | 0.810 | 0.000 | 1.000 | 0.851 |
gubun | 0.992 | 0.991 | NaN | 0.851 | 1.000 |
insti_gubun | gubun | |
---|---|---|
insti_gubun | 1.000 | 1.000 |
gubun | 1.000 | 1.000 |
skey | reg_no | insti_gubun | gubun | |
---|---|---|---|---|
skey | 1.000 | 1.000 | 0.068 | 0.903 |
reg_no | 1.000 | 1.000 | 0.068 | 0.903 |
insti_gubun | 0.068 | 0.068 | 1.000 | 1.000 |
gubun | 0.903 | 0.903 | 1.000 | 1.000 |
skey | reg_no | business_nm | insti_gubun | region | representative | company_reg_no | addr | target_country | gubun | last_load_dttm | |
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1559 | 224 | 주식회사 메티스 | <NA> | 부산 | 김춘웅 | <NA> | 부산광역시 수영구 망미번영로70번길 26(수영동) | 러시아 | 유치업자 | 2020-12-22 13:36:07 |
1 | 1560 | 225 | ㈜ 새부산관광투어 | <NA> | 부산 | 정판덕 | <NA> | 부산광역시 연제구 고분로 5, 9층(연산동, 현우빌딩) | 중국/베트남/인도네시아,미얀마 | 유치업자 | 2020-12-22 13:36:07 |
2 | 1561 | 226 | 주식회사 금곡국제여행사 | <NA> | 부산 | 이송아 | <NA> | 부산광역시 해운대구 해운대해변로 203, 7층 17호(우동, 오션타워) | 중국 | 유치업자 | 2020-12-22 13:36:07 |
3 | 1562 | 227 | 세정글로벌 주식회사 | <NA> | 부산 | 장연희 | <NA> | 부산광역시 부산진구 황령대로 13, 705(범천동, 한라시그마타워) | 몽골 | 유치업자 | 2020-12-22 13:36:07 |
4 | 1563 | 228 | 드림무역 | <NA> | 부산 | 장은숙 | <NA> | 부산광역시 동구 홍곡로 50, 103동 1104호(초량동, e편한세상 부산항) | 중국/러시아/카자르스탄 | 유치업자 | 2020-12-22 13:36:07 |
5 | 1564 | 229 | 주식회사 하나메디컬서비스 | <NA> | 부산 | 노정범 | <NA> | 부산광역시 해운대구 APEC로 17, 4007(우동, 센텀 리더스마크) | 중국/카자흐스탄 | 유치업자 | 2020-12-22 13:36:07 |
6 | 1565 | 230 | 삼에스개발㈜ | <NA> | 부산 | 구자성 | <NA> | 부산광역시 연제구 월드컵대로 83, 109호, 401호(연산동, 케이티엔지부산본부) | 미국/일본/중국/러시아(CIS연합) | 유치업자 | 2020-12-22 13:36:07 |
7 | 1566 | 231 | 아리스타쉬핑 주식회사 | <NA> | 부산 | 박기태 | <NA> | 부산광역시 동구 중앙대로 228, 901(초량동, 조선일보사사옥) | 러시아(CIS연합) | 유치업자 | 2020-12-22 13:36:07 |
8 | 1567 | 232 | 주식회사 알코르메드라인 | <NA> | 부산 | MAZURIK ELENA | <NA> | 부산광역시 동구 중앙대로 263, 906(초량동,국제오피스텔) | <NA> | 유치업자 | 2020-12-22 13:36:07 |
9 | 1568 | 233 | 에메랄드 마린 주식회사 | <NA> | 부산 | 송길호 | <NA> | 부산광역시 중구 구덕로 87-1. 702(남포동6가, 하버타워 ) | 미국 | 유치업자 | 2020-12-22 13:36:07 |
skey | reg_no | business_nm | insti_gubun | region | representative | company_reg_no | addr | target_country | gubun | last_load_dttm | |
---|---|---|---|---|---|---|---|---|---|---|---|
238 | 1357 | 22 | 센텀이룸여성의원 | 의원 | 부산 | 최종열 외 1명 | <NA> | 부산광역시 해운대구 센텀2로 20, 10층 1003호, 11층 1103호 | 러시아, 몽골, 베트남 | 의료기관 | 2020-12-22 13:36:07 |
239 | 1358 | 23 | 우리원병원 | 병원 | 부산 | 유권열 | <NA> | 부산광역시 사하구 다대로 565(다대동) | <NA> | 의료기관 | 2020-12-22 13:36:07 |
240 | 1359 | 24 | 부산숨이비인후과의원 | 의원 | 부산 | 정재훈 | <NA> | 부산광역시 사하구 낙동남로 1412, 7-8층(하단동, 경부빌딩) | 중국 | 의료기관 | 2020-12-22 13:36:07 |
241 | 1360 | 25 | 제우스남성의원 | 의원 | 부산 | 이석영 | <NA> | 부산광역시 부산진구 서면문화로 10, 10층(부전동) | 미국, 일본, 중국, 러시아, 중동, 몽골, 베트남 | 의료기관 | 2020-12-22 13:36:07 |
242 | 1361 | 26 | 명지엘치과 | 치과의원 | 부산 | 박성준 | <NA> | 부산광역시 강서구 명지국제8로 230, 403-404호(명지동) | <NA> | 의료기관 | 2020-12-22 13:36:07 |
243 | 1362 | 27 | 의료법인 정선의료재단 온종합병원 | 종합병원 | 부산 | 윤선희 | <NA> | 부산광역시 부산진구 가야대로 721, 1층(당감동) | <NA> | 의료기관 | 2020-12-22 13:36:07 |
244 | 1363 | 28 | 힘내라 병원 | 병원 | 부산 | 김문찬 외 1명 | <NA> | 부산광역시 동구 범일로 85, 지상2-5층, 지하1-2층(범일동) | 일본, 중국, 필리핀, 대만 | 의료기관 | 2020-12-22 13:36:07 |
245 | 1364 | 29 | 명제한의원 | 한의원 | 부산 | 이수칠 | <NA> | 부산광역시 동래구 충렬대로 108번길 16(온천동) | 일본, 중국, 베트남 | 의료기관 | 2020-12-22 13:36:07 |
246 | 1365 | 30 | 시원항병원 | 병원 | 부산 | 조현언 | <NA> | 부산광역시 북구 금곡대로 27, 5층~10층(덕천동, 더청명빌딩) | <NA> | 의료기관 | 2020-12-22 13:36:07 |
247 | 1366 | 31 | 이노의원 | 의원 | 부산 | 이상윤 | <NA> | 부산광역시 해운대구 해운대로 620, 305호~309호(우동, 해운대 라뮤에뜨) | <NA> | 의료기관 | 2020-12-22 13:36:07 |