Dataset statistics
Number of variables | 11 |
---|---|
Number of observations | 1494 |
Missing cells | 2449 |
Missing cells (%) | 14.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 131.4 KiB |
Average record size in memory | 90.1 B |
Variable types
Text | 6 |
---|---|
Numeric | 1 |
Categorical | 3 |
Unsupported | 1 |
Dataset
Description | 키값,등록번호,상호,기관구분,행정시,행정구,행정동,대표자,주소,도로명주소,타겟국가 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-12973/S/1/datasetView.do |
행정시 is highly overall correlated with 행정구 | High correlation |
행정구 is highly overall correlated with 행정시 | High correlation |
행정시 is highly imbalanced (98.6%) | Imbalance |
도로명주소 has 1494 (100.0%) missing values | Missing |
타겟국가 has 953 (63.8%) missing values | Missing |
키값 has unique values | Unique |
등록번호 has unique values | Unique |
도로명주소 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-04-16 22:38:03.083797 |
---|---|
Analysis finished | 2024-04-16 22:38:04.242041 |
Duration | 1.16 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
키값
Text
UNIQUE
 
Distinct | 1494 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.8 KiB |
Length
Max length | 14 |
---|---|
Median length | 14 |
Mean length | 14 |
Min length | 14 |
Characters and Unicode
Total characters | 20916 |
---|---|
Distinct characters | 18 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 1494 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | BE_LiST21-1460 |
---|---|
2nd row | BE_LiST21-1461 |
3rd row | BE_LiST21-1462 |
4th row | BE_LiST21-1463 |
5th row | BE_LiST21-1464 |
Value | Count | Frequency (%) |
be_list21-1460 | 1 | 0.1% |
be_list21-1010 | 1 | 0.1% |
be_list21-1019 | 1 | 0.1% |
be_list21-1018 | 1 | 0.1% |
be_list21-1017 | 1 | 0.1% |
be_list21-1016 | 1 | 0.1% |
be_list21-1015 | 1 | 0.1% |
be_list21-1014 | 1 | 0.1% |
be_list21-1013 | 1 | 0.1% |
be_list21-1012 | 1 | 0.1% |
Other values (1484) | 1484 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 2489 | |
2 | 1994 | |
0 | 1496 | 7.2% |
B | 1494 | 7.1% |
T | 1494 | 7.1% |
E | 1494 | 7.1% |
- | 1494 | 7.1% |
S | 1494 | 7.1% |
i | 1494 | 7.1% |
L | 1494 | 7.1% |
Other values (8) | 4479 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 8964 | |
Uppercase Letter | 7470 | |
Dash Punctuation | 1494 | 7.1% |
Lowercase Letter | 1494 | 7.1% |
Connector Punctuation | 1494 | 7.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 2489 | |
2 | 1994 | |
0 | 1496 | |
3 | 500 | 5.6% |
4 | 495 | 5.5% |
6 | 399 | 4.5% |
5 | 399 | 4.5% |
7 | 399 | 4.5% |
8 | 399 | 4.5% |
9 | 394 | 4.4% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 1494 | |
T | 1494 | |
E | 1494 | |
S | 1494 | |
L | 1494 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1494 |
Lowercase Letter
Value | Count | Frequency (%) |
i | 1494 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1494 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 11952 | |
Latin | 8964 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 2489 | |
2 | 1994 | |
0 | 1496 | |
- | 1494 | |
_ | 1494 | |
3 | 500 | 4.2% |
4 | 495 | 4.1% |
6 | 399 | 3.3% |
5 | 399 | 3.3% |
7 | 399 | 3.3% |
Other values (2) | 793 | 6.6% |
Latin
Value | Count | Frequency (%) |
B | 1494 | |
T | 1494 | |
E | 1494 | |
S | 1494 | |
i | 1494 | |
L | 1494 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 20916 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 2489 | |
2 | 1994 | |
0 | 1496 | 7.2% |
B | 1494 | 7.1% |
T | 1494 | 7.1% |
E | 1494 | 7.1% |
- | 1494 | 7.1% |
S | 1494 | 7.1% |
i | 1494 | 7.1% |
L | 1494 | 7.1% |
Other values (8) | 4479 |
등록번호
Real number (ℝ)
UNIQUE
 
Distinct | 1494 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2337.7544 |
Minimum | 1 |
---|---|
Maximum | 9998 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 13.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 184.3 |
Q1 | 1364 |
median | 2577.5 |
Q3 | 3369.75 |
95-th percentile | 3988.7 |
Maximum | 9998 |
Range | 9997 |
Interquartile range (IQR) | 2005.75 |
Descriptive statistics
Standard deviation | 1237.5948 |
---|---|
Coefficient of variation (CV) | 0.52939472 |
Kurtosis | -0.19297006 |
Mean | 2337.7544 |
Median Absolute Deviation (MAD) | 947 |
Skewness | -0.22293602 |
Sum | 3492605 |
Variance | 1531640.9 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4074 | 1 | 0.1% |
3121 | 1 | 0.1% |
3126 | 1 | 0.1% |
3119 | 1 | 0.1% |
3109 | 1 | 0.1% |
3101 | 1 | 0.1% |
3137 | 1 | 0.1% |
3127 | 1 | 0.1% |
3148 | 1 | 0.1% |
3125 | 1 | 0.1% |
Other values (1484) | 1484 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
4 | 1 | |
16 | 1 | |
20 | 1 | |
21 | 1 | |
22 | 1 | |
24 | 1 | |
25 | 1 | |
27 | 1 |
Value | Count | Frequency (%) |
9998 | 1 | |
4138 | 1 | |
4137 | 1 | |
4136 | 1 | |
4135 | 1 | |
4133 | 1 | |
4132 | 1 | |
4127 | 1 | |
4126 | 1 | |
4125 | 1 |
상호
Text
Distinct | 1420 |
---|---|
Distinct (%) | 95.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.8 KiB |
Length
Max length | 29 |
---|---|
Median length | 21 |
Mean length | 7.7175368 |
Min length | 3 |
Characters and Unicode
Total characters | 11530 |
---|---|
Distinct characters | 517 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 1367 ? |
---|---|
Unique (%) | 91.5% |
Sample
1st row | 별이성형외과 |
---|---|
2nd row | 허윞업신경외과의원 |
3rd row | 더마주피부과의원 |
4th row | 아이템의원피부과 |
5th row | 정다운임치과의원 |
Value | Count | Frequency (%) |
성형외과 | 13 | 0.8% |
유디치과의원 | 12 | 0.8% |
의원 | 8 | 0.5% |
성형외과의원 | 6 | 0.4% |
의료법인 | 6 | 0.4% |
한의원 | 4 | 0.3% |
라마르의원 | 4 | 0.3% |
리뉴미피부과의원 | 4 | 0.3% |
미소랑치과의원 | 4 | 0.3% |
경희봄한의원 | 4 | 0.3% |
Other values (1462) | 1523 |
Most occurring characters
Value | Count | Frequency (%) |
원 | 1328 | 11.5% |
의 | 1174 | 10.2% |
과 | 933 | 8.1% |
성 | 409 | 3.5% |
외 | 369 | 3.2% |
형 | 344 | 3.0% |
치 | 299 | 2.6% |
이 | 239 | 2.1% |
병 | 216 | 1.9% |
한 | 206 | 1.8% |
Other values (507) | 6013 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 11190 | |
Space Separator | 95 | 0.8% |
Uppercase Letter | 92 | 0.8% |
Close Punctuation | 45 | 0.4% |
Open Punctuation | 43 | 0.4% |
Decimal Number | 39 | 0.3% |
Lowercase Letter | 16 | 0.1% |
Other Punctuation | 8 | 0.1% |
Dash Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
원 | 1328 | 11.9% |
의 | 1174 | 10.5% |
과 | 933 | 8.3% |
성 | 409 | 3.7% |
외 | 369 | 3.3% |
형 | 344 | 3.1% |
치 | 299 | 2.7% |
이 | 239 | 2.1% |
병 | 216 | 1.9% |
한 | 206 | 1.8% |
Other values (455) | 5673 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 10 | 10.9% |
J | 7 | 7.6% |
K | 7 | 7.6% |
A | 6 | 6.5% |
B | 6 | 6.5% |
P | 6 | 6.5% |
C | 6 | 6.5% |
T | 5 | 5.4% |
Y | 5 | 5.4% |
U | 5 | 5.4% |
Other values (11) | 29 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 4 | |
k | 2 | |
c | 1 | 6.2% |
m | 1 | 6.2% |
n | 1 | 6.2% |
t | 1 | 6.2% |
r | 1 | 6.2% |
u | 1 | 6.2% |
l | 1 | 6.2% |
o | 1 | 6.2% |
Other values (2) | 2 |
Decimal Number
Value | Count | Frequency (%) |
3 | 8 | |
6 | 8 | |
5 | 8 | |
2 | 4 | |
7 | 3 | 7.7% |
1 | 3 | 7.7% |
9 | 2 | 5.1% |
8 | 1 | 2.6% |
0 | 1 | 2.6% |
4 | 1 | 2.6% |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 | |
& | 2 | |
/ | 2 | |
, | 1 | |
? | 1 |
Space Separator
Value | Count | Frequency (%) |
95 |
Close Punctuation
Value | Count | Frequency (%) |
) | 45 |
Open Punctuation
Value | Count | Frequency (%) |
( | 43 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 11190 | |
Common | 232 | 2.0% |
Latin | 108 | 0.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
원 | 1328 | 11.9% |
의 | 1174 | 10.5% |
과 | 933 | 8.3% |
성 | 409 | 3.7% |
외 | 369 | 3.3% |
형 | 344 | 3.1% |
치 | 299 | 2.7% |
이 | 239 | 2.1% |
병 | 216 | 1.9% |
한 | 206 | 1.8% |
Other values (455) | 5673 |
Latin
Value | Count | Frequency (%) |
S | 10 | 9.3% |
J | 7 | 6.5% |
K | 7 | 6.5% |
A | 6 | 5.6% |
B | 6 | 5.6% |
P | 6 | 5.6% |
C | 6 | 5.6% |
T | 5 | 4.6% |
Y | 5 | 4.6% |
U | 5 | 4.6% |
Other values (23) | 45 |
Common
Value | Count | Frequency (%) |
95 | ||
) | 45 | |
( | 43 | |
3 | 8 | 3.4% |
6 | 8 | 3.4% |
5 | 8 | 3.4% |
2 | 4 | 1.7% |
7 | 3 | 1.3% |
1 | 3 | 1.3% |
. | 2 | 0.9% |
Other values (9) | 13 | 5.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 11190 | |
ASCII | 340 | 2.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
원 | 1328 | 11.9% |
의 | 1174 | 10.5% |
과 | 933 | 8.3% |
성 | 409 | 3.7% |
외 | 369 | 3.3% |
형 | 344 | 3.1% |
치 | 299 | 2.7% |
이 | 239 | 2.1% |
병 | 216 | 1.9% |
한 | 206 | 1.8% |
Other values (455) | 5673 |
ASCII
Value | Count | Frequency (%) |
95 | ||
) | 45 | |
( | 43 | |
S | 10 | 2.9% |
3 | 8 | 2.4% |
6 | 8 | 2.4% |
5 | 8 | 2.4% |
J | 7 | 2.1% |
K | 7 | 2.1% |
A | 6 | 1.8% |
Other values (42) | 103 |
기관구분
Categorical
Distinct | 9 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.8 KiB |
의원 | |
---|---|
치과의원 | |
한의원 | |
병원 | |
치과병원 | 38 |
Other values (4) | 63 |
Length
Max length | 6 |
---|---|
Median length | 2 |
Mean length | 2.5823293 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 의원 |
---|---|
2nd row | 의원 |
3rd row | 의원 |
4th row | 의원 |
5th row | 치과의원 |
Common Values
Value | Count | Frequency (%) |
의원 | 878 | |
치과의원 | 245 | 16.4% |
한의원 | 154 | 10.3% |
병원 | 116 | 7.8% |
치과병원 | 38 | 2.5% |
종합병원 | 31 | 2.1% |
상급종합병원 | 16 | 1.1% |
한방병원 | 12 | 0.8% |
기타 | 4 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
의원 | 878 | |
치과의원 | 245 | 16.4% |
한의원 | 154 | 10.3% |
병원 | 116 | 7.8% |
치과병원 | 38 | 2.5% |
종합병원 | 31 | 2.1% |
상급종합병원 | 16 | 1.1% |
한방병원 | 12 | 0.8% |
기타 | 4 | 0.3% |
행정시
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.8 KiB |
서울특별시 | |
---|---|
경기도 | 2 |
<NA> | 1 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9966533 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 1491 | |
경기도 | 2 | 0.1% |
<NA> | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 1491 | |
경기도 | 2 | 0.1% |
na | 1 | 0.1% |
행정구
Categorical
HIGH CORRELATION
 
Distinct | 28 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.8 KiB |
강남구 | |
---|---|
서초구 | |
중구 | |
영등포구 | 46 |
송파구 | 45 |
Other values (23) |
Length
Max length | 8 |
---|---|
Median length | 3 |
Mean length | 3.0060241 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 강남구 |
---|---|
2nd row | 강남구 |
3rd row | 강남구 |
4th row | 강남구 |
5th row | 중랑구 |
Common Values
Value | Count | Frequency (%) |
강남구 | 740 | |
서초구 | 193 | 12.9% |
중구 | 94 | 6.3% |
영등포구 | 46 | 3.1% |
송파구 | 45 | 3.0% |
강서구 | 40 | 2.7% |
마포구 | 33 | 2.2% |
동대문구 | 28 | 1.9% |
종로구 | 24 | 1.6% |
용산구 | 22 | 1.5% |
Other values (18) | 229 | 15.3% |
Length
Value | Count | Frequency (%) |
강남구 | 740 | |
서초구 | 193 | 12.9% |
중구 | 94 | 6.3% |
영등포구 | 46 | 3.1% |
송파구 | 45 | 3.0% |
강서구 | 40 | 2.7% |
마포구 | 33 | 2.2% |
동대문구 | 28 | 1.9% |
종로구 | 24 | 1.6% |
용산구 | 22 | 1.5% |
Other values (19) | 231 | 15.4% |
행정동
Text
Distinct | 246 |
---|---|
Distinct (%) | 16.5% |
Missing | 1 |
Missing (%) | 0.1% |
Memory size | 11.8 KiB |
Value | Count | Frequency (%) |
압구정동 | 140 | 9.4% |
역삼1동 | 137 | 9.2% |
신사동 | 123 | 8.2% |
논현1동 | 91 | 6.1% |
청담동 | 90 | 6.0% |
서초4동 | 75 | 5.0% |
명동 | 56 | 3.8% |
논현2동 | 56 | 3.8% |
잠원동 | 28 | 1.9% |
삼성1동 | 21 | 1.4% |
Other values (236) | 676 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 1497 | |
1 | 405 | 7.3% |
2 | 203 | 3.7% |
삼 | 193 | 3.5% |
신 | 169 | 3.0% |
현 | 169 | 3.0% |
구 | 157 | 2.8% |
역 | 152 | 2.7% |
정 | 147 | 2.7% |
논 | 147 | 2.7% |
Other values (153) | 2306 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4633 | |
Decimal Number | 854 | 15.4% |
Other Punctuation | 58 | 1.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 1497 | |
삼 | 193 | 4.2% |
신 | 169 | 3.6% |
현 | 169 | 3.6% |
구 | 157 | 3.4% |
역 | 152 | 3.3% |
정 | 147 | 3.2% |
논 | 147 | 3.2% |
압 | 140 | 3.0% |
서 | 140 | 3.0% |
Other values (143) | 1722 |
Decimal Number
Value | Count | Frequency (%) |
1 | 405 | |
2 | 203 | |
4 | 121 | 14.2% |
3 | 76 | 8.9% |
6 | 22 | 2.6% |
5 | 15 | 1.8% |
7 | 10 | 1.2% |
8 | 1 | 0.1% |
0 | 1 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 58 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4633 | |
Common | 912 | 16.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 1497 | |
삼 | 193 | 4.2% |
신 | 169 | 3.6% |
현 | 169 | 3.6% |
구 | 157 | 3.4% |
역 | 152 | 3.3% |
정 | 147 | 3.2% |
논 | 147 | 3.2% |
압 | 140 | 3.0% |
서 | 140 | 3.0% |
Other values (143) | 1722 |
Common
Value | Count | Frequency (%) |
1 | 405 | |
2 | 203 | |
4 | 121 | 13.3% |
3 | 76 | 8.3% |
. | 58 | 6.4% |
6 | 22 | 2.4% |
5 | 15 | 1.6% |
7 | 10 | 1.1% |
8 | 1 | 0.1% |
0 | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4633 | |
ASCII | 912 | 16.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 1497 | |
삼 | 193 | 4.2% |
신 | 169 | 3.6% |
현 | 169 | 3.6% |
구 | 157 | 3.4% |
역 | 152 | 3.3% |
정 | 147 | 3.2% |
논 | 147 | 3.2% |
압 | 140 | 3.0% |
서 | 140 | 3.0% |
Other values (143) | 1722 |
ASCII
Value | Count | Frequency (%) |
1 | 405 | |
2 | 203 | |
4 | 121 | 13.3% |
3 | 76 | 8.3% |
. | 58 | 6.4% |
6 | 22 | 2.4% |
5 | 15 | 1.6% |
7 | 10 | 1.1% |
8 | 1 | 0.1% |
0 | 1 | 0.1% |
대표자
Text
Distinct | 1426 |
---|---|
Distinct (%) | 95.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.8 KiB |
Value | Count | Frequency (%) |
외 | 8 | 0.5% |
1명 | 5 | 0.3% |
김영수 | 4 | 0.3% |
이규장 | 3 | 0.2% |
임영진 | 3 | 0.2% |
김종민 | 3 | 0.2% |
곽영태 | 3 | 0.2% |
김형섭 | 3 | 0.2% |
황경식 | 3 | 0.2% |
2명 | 3 | 0.2% |
Other values (1422) | 1475 |
Most occurring characters
Value | Count | Frequency (%) |
김 | 301 | 6.1% |
이 | 237 | 4.8% |
정 | 135 | 2.7% |
영 | 134 | 2.7% |
박 | 127 | 2.6% |
성 | 124 | 2.5% |
명 | 123 | 2.5% |
외 | 103 | 2.1% |
진 | 100 | 2.0% |
현 | 90 | 1.8% |
Other values (229) | 3445 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4753 | |
Decimal Number | 103 | 2.1% |
Other Punctuation | 32 | 0.7% |
Space Separator | 19 | 0.4% |
Uppercase Letter | 10 | 0.2% |
Close Punctuation | 1 | < 0.1% |
Open Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 301 | 6.3% |
이 | 237 | 5.0% |
정 | 135 | 2.8% |
영 | 134 | 2.8% |
박 | 127 | 2.7% |
성 | 124 | 2.6% |
명 | 123 | 2.6% |
외 | 103 | 2.2% |
진 | 100 | 2.1% |
현 | 90 | 1.9% |
Other values (208) | 3279 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 1 | |
S | 1 | |
T | 1 | |
A | 1 | |
N | 1 | |
C | 1 | |
H | 1 | |
E | 1 | |
W | 1 | |
I | 1 |
Decimal Number
Value | Count | Frequency (%) |
1 | 70 | |
2 | 25 | 24.3% |
3 | 3 | 2.9% |
5 | 2 | 1.9% |
4 | 2 | 1.9% |
7 | 1 | 1.0% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 24 | |
, | 8 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
19 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4753 | |
Common | 156 | 3.2% |
Latin | 10 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 301 | 6.3% |
이 | 237 | 5.0% |
정 | 135 | 2.8% |
영 | 134 | 2.8% |
박 | 127 | 2.7% |
성 | 124 | 2.6% |
명 | 123 | 2.6% |
외 | 103 | 2.2% |
진 | 100 | 2.1% |
현 | 90 | 1.9% |
Other values (208) | 3279 |
Common
Value | Count | Frequency (%) |
1 | 70 | |
2 | 25 | 16.0% |
/ | 24 | 15.4% |
19 | 12.2% | |
, | 8 | 5.1% |
3 | 3 | 1.9% |
5 | 2 | 1.3% |
4 | 2 | 1.3% |
) | 1 | 0.6% |
( | 1 | 0.6% |
Latin
Value | Count | Frequency (%) |
O | 1 | |
S | 1 | |
T | 1 | |
A | 1 | |
N | 1 | |
C | 1 | |
H | 1 | |
E | 1 | |
W | 1 | |
I | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4753 | |
ASCII | 166 | 3.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
김 | 301 | 6.3% |
이 | 237 | 5.0% |
정 | 135 | 2.8% |
영 | 134 | 2.8% |
박 | 127 | 2.7% |
성 | 124 | 2.6% |
명 | 123 | 2.6% |
외 | 103 | 2.2% |
진 | 100 | 2.1% |
현 | 90 | 1.9% |
Other values (208) | 3279 |
ASCII
Value | Count | Frequency (%) |
1 | 70 | |
2 | 25 | 15.1% |
/ | 24 | 14.5% |
19 | 11.4% | |
, | 8 | 4.8% |
3 | 3 | 1.8% |
5 | 2 | 1.2% |
4 | 2 | 1.2% |
O | 1 | 0.6% |
S | 1 | 0.6% |
Other values (11) | 11 | 6.6% |
주소
Text
Distinct | 1479 |
---|---|
Distinct (%) | 99.1% |
Missing | 1 |
Missing (%) | 0.1% |
Memory size | 11.8 KiB |
Length
Max length | 60 |
---|---|
Median length | 45 |
Mean length | 27.843269 |
Min length | 9 |
Characters and Unicode
Total characters | 41570 |
---|---|
Distinct characters | 458 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 1468 ? |
---|---|
Unique (%) | 98.3% |
Sample
1st row | 서울특별시 강남구 도산대로 443 청담빌딩 3,4층 |
---|---|
2nd row | 서울특별시 강남구 강남대로 254 용문빌딩 4층 |
3rd row | 서울특별시 강남구 영동대로 607 랜드마크빌딩 |
4th row | 서울특별시 강남구 도산대로 134 |
5th row | 중랑구 중랑역로 51, 대종빌딩 3층 |
Value | Count | Frequency (%) |
서울특별시 | 1404 | 17.6% |
강남구 | 737 | 9.3% |
서초구 | 192 | 2.4% |
신사동 | 153 | 1.9% |
강남대로 | 132 | 1.7% |
3층 | 102 | 1.3% |
중구 | 93 | 1.2% |
2층 | 86 | 1.1% |
도산대로 | 57 | 0.7% |
4층 | 57 | 0.7% |
Other values (2651) | 4950 |
Most occurring characters
Value | Count | Frequency (%) |
6516 | 15.7% | |
서 | 1896 | 4.6% |
구 | 1597 | 3.8% |
울 | 1485 | 3.6% |
시 | 1474 | 3.5% |
1 | 1458 | 3.5% |
별 | 1408 | 3.4% |
특 | 1407 | 3.4% |
동 | 1346 | 3.2% |
2 | 1084 | 2.6% |
Other values (448) | 21899 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 24570 | |
Decimal Number | 7762 | 18.7% |
Space Separator | 6516 | 15.7% |
Other Punctuation | 805 | 1.9% |
Dash Punctuation | 575 | 1.4% |
Close Punctuation | 538 | 1.3% |
Open Punctuation | 538 | 1.3% |
Uppercase Letter | 180 | 0.4% |
Math Symbol | 49 | 0.1% |
Lowercase Letter | 35 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 1896 | 7.7% |
구 | 1597 | 6.5% |
울 | 1485 | 6.0% |
시 | 1474 | 6.0% |
별 | 1408 | 5.7% |
특 | 1407 | 5.7% |
동 | 1346 | 5.5% |
층 | 1028 | 4.2% |
강 | 992 | 4.0% |
남 | 946 | 3.9% |
Other values (391) | 10991 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 31 | |
A | 15 | 8.3% |
K | 14 | 7.8% |
I | 12 | 6.7% |
M | 12 | 6.7% |
S | 11 | 6.1% |
E | 10 | 5.6% |
J | 9 | 5.0% |
F | 9 | 5.0% |
C | 8 | 4.4% |
Other values (12) | 49 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 6 | |
i | 4 | |
v | 4 | |
n | 3 | |
u | 3 | |
b | 2 | 5.7% |
r | 2 | 5.7% |
s | 2 | 5.7% |
t | 2 | 5.7% |
a | 2 | 5.7% |
Other values (4) | 5 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1458 | |
2 | 1084 | |
3 | 963 | |
5 | 763 | |
4 | 753 | |
0 | 703 | |
6 | 670 | |
8 | 509 | 6.6% |
7 | 499 | 6.4% |
9 | 360 | 4.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 784 | |
. | 10 | 1.2% |
/ | 6 | 0.7% |
& | 4 | 0.5% |
: | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
6516 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 575 |
Close Punctuation
Value | Count | Frequency (%) |
) | 538 |
Open Punctuation
Value | Count | Frequency (%) |
( | 538 |
Math Symbol
Value | Count | Frequency (%) |
~ | 49 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 24572 | |
Common | 16783 | |
Latin | 215 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 1896 | 7.7% |
구 | 1597 | 6.5% |
울 | 1485 | 6.0% |
시 | 1474 | 6.0% |
별 | 1408 | 5.7% |
특 | 1407 | 5.7% |
동 | 1346 | 5.5% |
층 | 1028 | 4.2% |
강 | 992 | 4.0% |
남 | 946 | 3.8% |
Other values (392) | 10993 |
Latin
Value | Count | Frequency (%) |
B | 31 | 14.4% |
A | 15 | 7.0% |
K | 14 | 6.5% |
I | 12 | 5.6% |
M | 12 | 5.6% |
S | 11 | 5.1% |
E | 10 | 4.7% |
J | 9 | 4.2% |
F | 9 | 4.2% |
C | 8 | 3.7% |
Other values (26) | 84 |
Common
Value | Count | Frequency (%) |
6516 | ||
1 | 1458 | 8.7% |
2 | 1084 | 6.5% |
3 | 963 | 5.7% |
, | 784 | 4.7% |
5 | 763 | 4.5% |
4 | 753 | 4.5% |
0 | 703 | 4.2% |
6 | 670 | 4.0% |
- | 575 | 3.4% |
Other values (10) | 2514 | 15.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 24570 | |
ASCII | 16998 | |
None | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6516 | ||
1 | 1458 | 8.6% |
2 | 1084 | 6.4% |
3 | 963 | 5.7% |
, | 784 | 4.6% |
5 | 763 | 4.5% |
4 | 753 | 4.4% |
0 | 703 | 4.1% |
6 | 670 | 3.9% |
- | 575 | 3.4% |
Other values (46) | 2729 |
Hangul
Value | Count | Frequency (%) |
서 | 1896 | 7.7% |
구 | 1597 | 6.5% |
울 | 1485 | 6.0% |
시 | 1474 | 6.0% |
별 | 1408 | 5.7% |
특 | 1407 | 5.7% |
동 | 1346 | 5.5% |
층 | 1028 | 4.2% |
강 | 992 | 4.0% |
남 | 946 | 3.9% |
Other values (391) | 10991 |
None
Value | Count | Frequency (%) |
㈜ | 2 |
도로명주소
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 1494 |
---|---|
Missing (%) | 100.0% |
Memory size | 13.3 KiB |
타겟국가
Text
MISSING
 
Distinct | 81 |
---|---|
Distinct (%) | 15.0% |
Missing | 953 |
Missing (%) | 63.8% |
Memory size | 11.8 KiB |
Length
Max length | 35 |
---|---|
Median length | 20 |
Mean length | 10.500924 |
Min length | 2 |
Characters and Unicode
Total characters | 5681 |
---|---|
Distinct characters | 35 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 36 ? |
---|---|
Unique (%) | 6.7% |
Sample
1st row | 중국, |
---|---|
2nd row | 중국,러시아,몽골, |
3rd row | 미국,일본,중국,러시아,중동,몽골,베트남, |
4th row | 미국,중국, |
5th row | 일본,중국,몽골, |
Value | Count | Frequency (%) |
미국,일본,중국 | 94 | |
중국 | 59 | 10.9% |
미국,일본,중국,러시아,중동,몽골,베트남 | 49 | 9.0% |
일본,중국 | 36 | 6.6% |
미국,중국 | 31 | 5.7% |
미국,일본,중국,러시아,몽골 | 30 | 5.5% |
미국,일본,중국,러시아 | 22 | 4.1% |
일본,중국,러시아 | 12 | 2.2% |
중국,러시아 | 11 | 2.0% |
미국 | 11 | 2.0% |
Other values (72) | 188 |
Most occurring characters
Value | Count | Frequency (%) |
, | 1763 | |
국 | 821 | |
중 | 575 | 10.1% |
미 | 334 | 5.9% |
일 | 334 | 5.9% |
본 | 334 | 5.9% |
아 | 218 | 3.8% |
시 | 210 | 3.7% |
러 | 205 | 3.6% |
몽 | 192 | 3.4% |
Other values (25) | 695 | 12.2% |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3916 | |
Other Punctuation | 1763 | |
Space Separator | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
국 | 821 | |
중 | 575 | |
미 | 334 | |
일 | 334 | |
본 | 334 | |
아 | 218 | 5.6% |
시 | 210 | 5.4% |
러 | 205 | 5.2% |
몽 | 192 | 4.9% |
골 | 192 | 4.9% |
Other values (23) | 501 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1763 |
Space Separator
Value | Count | Frequency (%) |
2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3916 | |
Common | 1765 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
국 | 821 | |
중 | 575 | |
미 | 334 | |
일 | 334 | |
본 | 334 | |
아 | 218 | 5.6% |
시 | 210 | 5.4% |
러 | 205 | 5.2% |
몽 | 192 | 4.9% |
골 | 192 | 4.9% |
Other values (23) | 501 |
Common
Value | Count | Frequency (%) |
, | 1763 | |
2 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3916 | |
ASCII | 1765 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
, | 1763 | |
2 | 0.1% |
Hangul
Value | Count | Frequency (%) |
국 | 821 | |
중 | 575 | |
미 | 334 | |
일 | 334 | |
본 | 334 | |
아 | 218 | 5.6% |
시 | 210 | 5.4% |
러 | 205 | 5.2% |
몽 | 192 | 4.9% |
골 | 192 | 4.9% |
Other values (23) | 501 |
등록번호 | 기관구분 | 행정시 | 행정구 | 타겟국가 | |
---|---|---|---|---|---|
등록번호 | 1.000 | 0.217 | 0.000 | 0.177 | 0.676 |
기관구분 | 0.217 | 1.000 | 0.000 | 0.460 | 0.628 |
행정시 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
행정구 | 0.177 | 0.460 | 1.000 | 1.000 | 0.634 |
타겟국가 | 0.676 | 0.628 | 0.000 | 0.634 | 1.000 |
행정시 | 행정구 | 기관구분 | |
---|---|---|---|
행정시 | 1.000 | 0.992 | 0.000 |
행정구 | 0.992 | 1.000 | 0.170 |
기관구분 | 0.000 | 0.170 | 1.000 |
등록번호 | 기관구분 | 행정시 | 행정구 | |
---|---|---|---|---|
등록번호 | 1.000 | 0.109 | 0.000 | 0.078 |
기관구분 | 0.109 | 1.000 | 0.000 | 0.170 |
행정시 | 0.000 | 0.000 | 1.000 | 0.992 |
행정구 | 0.078 | 0.170 | 0.992 | 1.000 |
키값 | 등록번호 | 상호 | 기관구분 | 행정시 | 행정구 | 행정동 | 대표자 | 주소 | 도로명주소 | 타겟국가 | |
---|---|---|---|---|---|---|---|---|---|---|---|
0 | BE_LiST21-1460 | 4074 | 별이성형외과 | 의원 | 서울특별시 | 강남구 | 청담동 | 홍왕광 | 서울특별시 강남구 도산대로 443 청담빌딩 3,4층 | <NA> | 중국, |
1 | BE_LiST21-1461 | 4055 | 허윞업신경외과의원 | 의원 | 서울특별시 | 강남구 | 도곡1동 | 안계훈 | 서울특별시 강남구 강남대로 254 용문빌딩 4층 | <NA> | 중국,러시아,몽골, |
2 | BE_LiST21-1462 | 4052 | 더마주피부과의원 | 의원 | 서울특별시 | 강남구 | 삼성1동 | 김주영 | 서울특별시 강남구 영동대로 607 랜드마크빌딩 | <NA> | 미국,일본,중국,러시아,중동,몽골,베트남, |
3 | BE_LiST21-1463 | 4081 | 아이템의원피부과 | 의원 | 서울특별시 | 강남구 | 논현1동 | 이진화 | 서울특별시 강남구 도산대로 134 | <NA> | 미국,중국, |
4 | BE_LiST21-1464 | 4078 | 정다운임치과의원 | 치과의원 | 서울특별시 | 중랑구 | 중화2동 | 강철규 | 중랑구 중랑역로 51, 대종빌딩 3층 | <NA> | <NA> |
5 | BE_LiST21-1465 | 4084 | 스타동안피부과의원 | 의원 | 서울특별시 | 서초구 | 잠원동 | 최호철 | 서울시 서초구 잠원동 6-1 리버사이드호텔 5층 스타동원피부과의원 | <NA> | <NA> |
6 | BE_LiST21-1466 | 4088 | 디테일의원 | 의원 | 서울특별시 | 강남구 | 논현2동 | 김진명 | 서울시 강남구 논현동 61-6번지 지안빌딩 2층 | <NA> | 일본,중국,몽골, |
7 | BE_LiST21-1467 | 4083 | 압구정현치과의원 | 치과의원 | 서울특별시 | 강남구 | 신사동 | 박현 | 서울특별시 강남구 압구정로 164 아세아빌딩 | <NA> | <NA> |
8 | BE_LiST21-1326 | 3747 | 제이엠제이의원 | 의원 | 서울특별시 | 강남구 | 압구정동 | 박주연 | 서울특별시 강남구 신사동 659-13 3층 | <NA> | 중국,러시아, |
9 | BE_LiST21-1327 | 3763 | 담의원 | 의원 | 서울특별시 | 강남구 | 삼성1동 | 김홍두 | 서울특별시 강남구 삼성로126길 6 보고재빌딩 B2 | <NA> | 미국,중국, |
키값 | 등록번호 | 상호 | 기관구분 | 행정시 | 행정구 | 행정동 | 대표자 | 주소 | 도로명주소 | 타겟국가 | |
---|---|---|---|---|---|---|---|---|---|---|---|
1484 | BE_LiST21-1136 | 3337 | 서울복지한방병원 | 한방병원 | 서울특별시 | 영등포구 | 대림2동 | 김영대 | 서울특별시 영등포구 도림로 144 (대림동) | <NA> | <NA> |
1485 | BE_LiST21-1137 | 3359 | 리영의원 | 의원 | 서울특별시 | 서초구 | 서초4동 | 안상태 | 서울특별시 서초구 서초대로77길 54, 서초더블유타워 602호 | <NA> | <NA> |
1486 | BE_LiST21-1138 | 9998 | 의료기관명국문 | 병원 | 서울특별시 | 강서구 | 발산1동 | 대표자국문 | 서울 강서구 내발산동 마곡수명산파크아파트 아파트아파트아파트 408동 201호 11111 | <NA> | 미국, |
1487 | BE_LiST21-1139 | 3373 | 키위 (KIWI) 성형외과 | 의원 | 서울특별시 | 강남구 | 역삼1동 | 김지훈 | 서울특별시 강남구 강남대로 406, 1402(역삼동) | <NA> | <NA> |
1488 | BE_LiST21-1140 | 3384 | 남상천한의원 | 한의원 | 서울특별시 | 서초구 | 서초3동 | 정철 | 서울특별시 서초구 반포대로 109 (서초동,서초빌딩3층,5층) | <NA> | <NA> |
1489 | BE_LiST21-0519 | 1610 | 남대문외과의원 | 의원 | 서울특별시 | 중구 | 회현동 | 임진상 | 서울특별시 중구 남창동 9-15 금오빌딩 9층 | <NA> | <NA> |
1490 | BE_LiST21-0520 | 1616 | 최병기치과의원 | 치과의원 | 서울특별시 | 노원구 | 공릉1동 | 최병기 | 서울특별시 노원구 공릉1동 581-1 공릉쇼핑 3층 | <NA> | <NA> |
1491 | BE_LiST21-0521 | 1617 | 플로렌치과의원 | 치과의원 | 서울특별시 | 강남구 | 압구정동 | 오경아 | 서울특별시 강남구 신사동 653-16 (2,3층) | <NA> | <NA> |
1492 | BE_LiST21-0522 | 1625 | 서울탑치과병원 | 치과병원 | 서울특별시 | 서초구 | 서초3동 | 김현종외1명 | 서울특별시 서초구 서초중앙로 39(서초동,5층) | <NA> | <NA> |
1493 | BE_LiST21-0523 | 1630 | 사계절한의원 | 한의원 | 서울특별시 | 중구 | 명동 | 김계진 | 서울특별시 중구 을지로2가 163-3 보승빌딩 2층 | <NA> | <NA> |