Dataset statistics
Number of variables | 12 |
---|---|
Number of observations | 4784 |
Missing cells | 3668 |
Missing cells (%) | 6.4% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 458.0 KiB |
Average record size in memory | 98.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 5 |
Text | 4 |
Boolean | 1 |
Dataset
Description | 안심식당 정보 |
---|---|
Author | 충청남도 |
URL | https://alldam.chungnam.go.kr/bigdata/collect/view.chungnam?menuCd=DOM_000000201001001000&apiIdx=2701 |
주소1 has constant value "" | Constant |
선정여부 is highly overall correlated with 전화번호 and 2 other fields | High correlation |
시도명 is highly overall correlated with 선정여부 and 1 other fields | High correlation |
업종 is highly overall correlated with 전화번호 | High correlation |
전화번호 is highly overall correlated with 업종 and 1 other fields | High correlation |
업종상세 is highly overall correlated with 시도명 and 1 other fields | High correlation |
시도명 is highly imbalanced (79.9%) | Imbalance |
선정여부 is highly imbalanced (98.7%) | Imbalance |
안심식당SEQ is highly imbalanced (50.8%) | Imbalance |
업종상세 is highly imbalanced (60.9%) | Imbalance |
주소2 has 3667 (76.7%) missing values | Missing |
업종 has unique values | Unique |
전화번호 has unique values | Unique |
Reproduction
Analysis started | 2024-01-09 19:53:33.436339 |
---|---|
Analysis finished | 2024-01-09 19:53:34.977886 |
Duration | 1.54 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업종
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 4784 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2392.5 |
Minimum | 1 |
---|---|
Maximum | 4784 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 42.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 240.15 |
Q1 | 1196.75 |
median | 2392.5 |
Q3 | 3588.25 |
95-th percentile | 4544.85 |
Maximum | 4784 |
Range | 4783 |
Interquartile range (IQR) | 2391.5 |
Descriptive statistics
Standard deviation | 1381.1662 |
---|---|
Coefficient of variation (CV) | 0.57728994 |
Kurtosis | -1.2 |
Mean | 2392.5 |
Median Absolute Deviation (MAD) | 1196 |
Skewness | 0 |
Sum | 11445720 |
Variance | 1907620 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
3197 | 1 | < 0.1% |
3195 | 1 | < 0.1% |
3194 | 1 | < 0.1% |
3193 | 1 | < 0.1% |
3192 | 1 | < 0.1% |
3191 | 1 | < 0.1% |
3190 | 1 | < 0.1% |
3189 | 1 | < 0.1% |
3188 | 1 | < 0.1% |
Other values (4774) | 4774 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
4784 | 1 | |
4783 | 1 | |
4782 | 1 | |
4781 | 1 | |
4780 | 1 | |
4779 | 1 | |
4778 | 1 | |
4777 | 1 | |
4776 | 1 | |
4775 | 1 |
시도명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.5 KiB |
일반음식점 | |
---|---|
일반음식점_외 | 150 |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 5.062709 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반음식점 |
---|---|
2nd row | 일반음식점 |
3rd row | 일반음식점 |
4th row | 일반음식점 |
5th row | 일반음식점 |
Common Values
Value | Count | Frequency (%) |
일반음식점 | 4634 | |
일반음식점_외 | 150 | 3.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반음식점 | 4634 | |
일반음식점_외 | 150 | 3.1% |
주소1
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.5 KiB |
충청남도 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 충청남도 |
---|---|
2nd row | 충청남도 |
3rd row | 충청남도 |
4th row | 충청남도 |
5th row | 충청남도 |
Common Values
Value | Count | Frequency (%) |
충청남도 | 4784 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
충청남도 | 4784 |
주소2
Text
MISSING
 
Distinct | 121 |
---|---|
Distinct (%) | 10.8% |
Missing | 3667 |
Missing (%) | 76.7% |
Memory size | 37.5 KiB |
Value | Count | Frequency (%) |
1층 | 907 | |
2층 | 93 | 7.5% |
1층, | 15 | 1.2% |
3층 | 10 | 0.8% |
101호 | 9 | 0.7% |
지하1층 | 9 | 0.7% |
102호 | 8 | 0.6% |
103호 | 6 | 0.5% |
상가동 | 6 | 0.5% |
4층 | 5 | 0.4% |
Other values (134) | 179 | 14.4% |
Most occurring characters
Value | Count | Frequency (%) |
1 | 1059 | |
층 | 1059 | |
2 | 158 | 4.6% |
130 | 3.8% | |
4 | 128 | 3.7% |
호 | 93 | 2.7% |
0 | 90 | 2.6% |
동 | 72 | 2.1% |
# | 52 | 1.5% |
; | 52 | 1.5% |
Other values (147) | 523 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1527 | |
Decimal Number | 1505 | |
Other Punctuation | 156 | 4.6% |
Space Separator | 130 | 3.8% |
Close Punctuation | 28 | 0.8% |
Open Punctuation | 28 | 0.8% |
Uppercase Letter | 16 | 0.5% |
Lowercase Letter | 12 | 0.4% |
Math Symbol | 10 | 0.3% |
Dash Punctuation | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
층 | 1059 | |
호 | 93 | 6.1% |
동 | 72 | 4.7% |
가 | 20 | 1.3% |
상 | 14 | 0.9% |
아 | 13 | 0.9% |
지 | 12 | 0.8% |
하 | 11 | 0.7% |
빌 | 8 | 0.5% |
내 | 7 | 0.5% |
Other values (112) | 218 | 14.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 1059 | |
2 | 158 | 10.5% |
4 | 128 | 8.5% |
0 | 90 | 6.0% |
3 | 27 | 1.8% |
5 | 15 | 1.0% |
6 | 9 | 0.6% |
9 | 8 | 0.5% |
7 | 6 | 0.4% |
8 | 5 | 0.3% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 3 | |
n | 2 | |
u | 1 | 8.3% |
v | 1 | 8.3% |
h | 1 | 8.3% |
c | 1 | 8.3% |
r | 1 | 8.3% |
a | 1 | 8.3% |
o | 1 | 8.3% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 7 | |
B | 3 | |
C | 2 | 12.5% |
I | 1 | 6.2% |
M | 1 | 6.2% |
D | 1 | 6.2% |
W | 1 | 6.2% |
Other Punctuation
Value | Count | Frequency (%) |
# | 52 | |
; | 52 | |
& | 52 |
Space Separator
Value | Count | Frequency (%) |
130 |
Close Punctuation
Value | Count | Frequency (%) |
) | 28 |
Open Punctuation
Value | Count | Frequency (%) |
( | 28 |
Math Symbol
Value | Count | Frequency (%) |
~ | 10 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1861 | |
Hangul | 1527 | |
Latin | 28 | 0.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
층 | 1059 | |
호 | 93 | 6.1% |
동 | 72 | 4.7% |
가 | 20 | 1.3% |
상 | 14 | 0.9% |
아 | 13 | 0.9% |
지 | 12 | 0.8% |
하 | 11 | 0.7% |
빌 | 8 | 0.5% |
내 | 7 | 0.5% |
Other values (112) | 218 | 14.3% |
Common
Value | Count | Frequency (%) |
1 | 1059 | |
2 | 158 | 8.5% |
130 | 7.0% | |
4 | 128 | 6.9% |
0 | 90 | 4.8% |
# | 52 | 2.8% |
; | 52 | 2.8% |
& | 52 | 2.8% |
) | 28 | 1.5% |
( | 28 | 1.5% |
Other values (9) | 84 | 4.5% |
Latin
Value | Count | Frequency (%) |
A | 7 | |
B | 3 | |
e | 3 | |
n | 2 | 7.1% |
C | 2 | 7.1% |
I | 1 | 3.6% |
u | 1 | 3.6% |
v | 1 | 3.6% |
h | 1 | 3.6% |
c | 1 | 3.6% |
Other values (6) | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1889 | |
Hangul | 1527 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 1059 | |
2 | 158 | 8.4% |
130 | 6.9% | |
4 | 128 | 6.8% |
0 | 90 | 4.8% |
# | 52 | 2.8% |
; | 52 | 2.8% |
& | 52 | 2.8% |
) | 28 | 1.5% |
( | 28 | 1.5% |
Other values (25) | 112 | 5.9% |
Hangul
Value | Count | Frequency (%) |
층 | 1059 | |
호 | 93 | 6.1% |
동 | 72 | 4.7% |
가 | 20 | 1.3% |
상 | 14 | 0.9% |
아 | 13 | 0.9% |
지 | 12 | 0.8% |
하 | 11 | 0.7% |
빌 | 8 | 0.5% |
내 | 7 | 0.5% |
Other values (112) | 218 | 14.3% |
사업자명
Text
Distinct | 4526 |
---|---|
Distinct (%) | 94.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.5 KiB |
Length
Max length | 32 |
---|---|
Median length | 25 |
Mean length | 5.9260033 |
Min length | 1 |
Characters and Unicode
Total characters | 28350 |
---|---|
Distinct characters | 804 |
Distinct categories | 10 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 4320 ? |
---|---|
Unique (%) | 90.3% |
Sample
1st row | 청와삼대 |
---|---|
2nd row | 토마토아저씨서산점 |
3rd row | 하루엔소쿠(서산점) |
4th row | 거성정육식당 |
5th row | 김영희강남동태찜예산점 |
Value | Count | Frequency (%) |
서산점 | 17 | 0.3% |
부여점 | 9 | 0.2% |
등촌샤브칼국수 | 7 | 0.1% |
양평해장국 | 7 | 0.1% |
서산호수공원점 | 7 | 0.1% |
이삭토스트 | 6 | 0.1% |
논산점 | 6 | 0.1% |
예천점 | 6 | 0.1% |
아산점 | 6 | 0.1% |
함지박 | 5 | 0.1% |
Other values (4677) | 5054 |
Most occurring characters
Value | Count | Frequency (%) |
점 | 685 | 2.4% |
식 | 539 | 1.9% |
당 | 524 | 1.8% |
가 | 499 | 1.8% |
수 | 482 | 1.7% |
이 | 481 | 1.7% |
산 | 479 | 1.7% |
국 | 430 | 1.5% |
장 | 405 | 1.4% |
대 | 353 | 1.2% |
Other values (794) | 23473 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 26984 | |
Space Separator | 347 | 1.2% |
Decimal Number | 235 | 0.8% |
Lowercase Letter | 192 | 0.7% |
Open Punctuation | 180 | 0.6% |
Close Punctuation | 179 | 0.6% |
Other Punctuation | 120 | 0.4% |
Uppercase Letter | 96 | 0.3% |
Other Symbol | 16 | 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
점 | 685 | 2.5% |
식 | 539 | 2.0% |
당 | 524 | 1.9% |
가 | 499 | 1.8% |
수 | 482 | 1.8% |
이 | 481 | 1.8% |
산 | 479 | 1.8% |
국 | 430 | 1.6% |
장 | 405 | 1.5% |
대 | 353 | 1.3% |
Other values (729) | 22107 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 45 | |
m | 33 | |
p | 33 | |
e | 12 | 6.2% |
n | 10 | 5.2% |
o | 9 | 4.7% |
t | 7 | 3.6% |
r | 6 | 3.1% |
y | 5 | 2.6% |
l | 5 | 2.6% |
Other values (11) | 27 |
Uppercase Letter
Value | Count | Frequency (%) |
R | 14 | |
C | 13 | |
K | 10 | |
F | 8 | 8.3% |
E | 6 | 6.2% |
M | 6 | 6.2% |
A | 5 | 5.2% |
B | 5 | 5.2% |
G | 4 | 4.2% |
D | 4 | 4.2% |
Other values (10) | 21 |
Decimal Number
Value | Count | Frequency (%) |
4 | 44 | |
1 | 43 | |
2 | 39 | |
0 | 21 | |
9 | 20 | |
3 | 17 | 7.2% |
6 | 15 | 6.4% |
8 | 15 | 6.4% |
7 | 11 | 4.7% |
5 | 10 | 4.3% |
Other Punctuation
Value | Count | Frequency (%) |
; | 46 | |
& | 38 | |
# | 15 | 12.5% |
. | 8 | 6.7% |
· | 5 | 4.2% |
? | 3 | 2.5% |
/ | 3 | 2.5% |
* | 1 | 0.8% |
! | 1 | 0.8% |
Space Separator
Value | Count | Frequency (%) |
347 |
Open Punctuation
Value | Count | Frequency (%) |
( | 180 |
Close Punctuation
Value | Count | Frequency (%) |
) | 179 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 16 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 26996 | |
Common | 1062 | 3.7% |
Latin | 288 | 1.0% |
Han | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
점 | 685 | 2.5% |
식 | 539 | 2.0% |
당 | 524 | 1.9% |
가 | 499 | 1.8% |
수 | 482 | 1.8% |
이 | 481 | 1.8% |
산 | 479 | 1.8% |
국 | 430 | 1.6% |
장 | 405 | 1.5% |
대 | 353 | 1.3% |
Other values (726) | 22119 |
Latin
Value | Count | Frequency (%) |
a | 45 | |
m | 33 | 11.5% |
p | 33 | 11.5% |
R | 14 | 4.9% |
C | 13 | 4.5% |
e | 12 | 4.2% |
n | 10 | 3.5% |
K | 10 | 3.5% |
o | 9 | 3.1% |
F | 8 | 2.8% |
Other values (31) | 101 |
Common
Value | Count | Frequency (%) |
347 | ||
( | 180 | |
) | 179 | |
; | 46 | 4.3% |
4 | 44 | 4.1% |
1 | 43 | 4.0% |
2 | 39 | 3.7% |
& | 38 | 3.6% |
0 | 21 | 2.0% |
9 | 20 | 1.9% |
Other values (13) | 105 | 9.9% |
Han
Value | Count | Frequency (%) |
辛 | 1 | |
漁 | 1 | |
本 | 1 | |
王 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 26980 | |
ASCII | 1342 | 4.7% |
None | 24 | 0.1% |
CJK | 4 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
점 | 685 | 2.5% |
식 | 539 | 2.0% |
당 | 524 | 1.9% |
가 | 499 | 1.8% |
수 | 482 | 1.8% |
이 | 481 | 1.8% |
산 | 479 | 1.8% |
국 | 430 | 1.6% |
장 | 405 | 1.5% |
대 | 353 | 1.3% |
Other values (725) | 22103 |
ASCII
Value | Count | Frequency (%) |
347 | ||
( | 180 | |
) | 179 | |
; | 46 | 3.4% |
a | 45 | 3.4% |
4 | 44 | 3.3% |
1 | 43 | 3.2% |
2 | 39 | 2.9% |
& | 38 | 2.8% |
m | 33 | 2.5% |
Other values (52) | 348 |
None
Value | Count | Frequency (%) |
㈜ | 16 | |
· | 5 | 20.8% |
? | 3 | 12.5% |
CJK
Value | Count | Frequency (%) |
辛 | 1 | |
漁 | 1 | |
本 | 1 | |
王 | 1 |
선정여부
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.5 KiB |
<NA> | |
---|---|
프랜차이즈협회우선추천매장 | 10 |
http://www.인삼장어백탄구이.kr/ | 1 |
http://www.강변가든.com/ | 1 |
http://www.gardenofsky.com/dining/ | 1 |
Length
Max length | 34 |
---|---|
Median length | 4 |
Mean length | 4.0319816 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 4770 | |
프랜차이즈협회우선추천매장 | 10 | 0.2% |
http://www.인삼장어백탄구이.kr/ | 1 | < 0.1% |
http://www.강변가든.com/ | 1 | < 0.1% |
http://www.gardenofsky.com/dining/ | 1 | < 0.1% |
횟집 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 4770 | |
프랜차이즈협회우선추천매장 | 10 | 0.2% |
http://www.인삼장어백탄구이.kr | 1 | < 0.1% |
http://www.강변가든.com | 1 | < 0.1% |
http://www.gardenofsky.com/dining | 1 | < 0.1% |
횟집 | 1 | < 0.1% |
안심식당SEQ
Boolean
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
True | |
---|---|
False |
Value | Count | Frequency (%) |
True | 4270 | |
False | 514 | 10.7% |
전화번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 4784 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 31649.528 |
Minimum | 4290 |
---|---|
Maximum | 70509 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 42.2 KiB |
Quantile statistics
Minimum | 4290 |
---|---|
5-th percentile | 6292.15 |
Q1 | 10399.75 |
median | 31867.5 |
Q3 | 49670.25 |
95-th percentile | 64195.85 |
Maximum | 70509 |
Range | 66219 |
Interquartile range (IQR) | 39270.5 |
Descriptive statistics
Standard deviation | 20917.715 |
---|---|
Coefficient of variation (CV) | 0.66091711 |
Kurtosis | -1.5056701 |
Mean | 31649.528 |
Median Absolute Deviation (MAD) | 21241 |
Skewness | 0.15095074 |
Sum | 1.5141134 × 108 |
Variance | 4.3755078 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
11515 | 1 | < 0.1% |
48880 | 1 | < 0.1% |
48878 | 1 | < 0.1% |
48877 | 1 | < 0.1% |
48876 | 1 | < 0.1% |
48875 | 1 | < 0.1% |
48874 | 1 | < 0.1% |
48873 | 1 | < 0.1% |
48872 | 1 | < 0.1% |
48871 | 1 | < 0.1% |
Other values (4774) | 4774 |
Value | Count | Frequency (%) |
4290 | 1 | |
4291 | 1 | |
4292 | 1 | |
4293 | 1 | |
4294 | 1 | |
4295 | 1 | |
4296 | 1 | |
4297 | 1 | |
4298 | 1 | |
4299 | 1 |
Value | Count | Frequency (%) |
70509 | 1 | |
70408 | 1 | |
70407 | 1 | |
70406 | 1 | |
70405 | 1 | |
70404 | 1 | |
70403 | 1 | |
70402 | 1 | |
70401 | 1 | |
70400 | 1 |
시군구명
Text
Distinct | 4329 |
---|---|
Distinct (%) | 90.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.5 KiB |
Length
Max length | 29 |
---|---|
Median length | 26 |
Mean length | 20.234323 |
Min length | 14 |
Characters and Unicode
Total characters | 96801 |
---|---|
Distinct characters | 339 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 3981 ? |
---|---|
Unique (%) | 83.2% |
Sample
1st row | 충청남도 서산시 석림6로 17 |
---|---|
2nd row | 충청남도 서산시 호수공원14로 36 |
3rd row | 충청남도 서산시 안견로 242 |
4th row | 충청남도 예산군 삽교읍 수암산로 272-23 |
5th row | 충청남도 예산군 예산읍 산성공원1길 20 |
Value | Count | Frequency (%) |
충청남도 | 4784 | 21.2% |
천안시 | 830 | 3.7% |
아산시 | 616 | 2.7% |
당진시 | 595 | 2.6% |
서산시 | 497 | 2.2% |
서북구 | 418 | 1.8% |
동남구 | 412 | 1.8% |
논산시 | 345 | 1.5% |
보령시 | 310 | 1.4% |
공주시 | 293 | 1.3% |
Other values (3391) | 13507 |
Most occurring characters
Value | Count | Frequency (%) |
17823 | ||
남 | 5369 | 5.5% |
청 | 5116 | 5.3% |
충 | 4908 | 5.1% |
도 | 4874 | 5.0% |
시 | 3774 | 3.9% |
1 | 3644 | 3.8% |
로 | 3287 | 3.4% |
산 | 2591 | 2.7% |
2 | 2276 | 2.4% |
Other values (329) | 43139 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 61840 | |
Space Separator | 17823 | 18.4% |
Decimal Number | 15815 | 16.3% |
Dash Punctuation | 1322 | 1.4% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
남 | 5369 | 8.7% |
청 | 5116 | 8.3% |
충 | 4908 | 7.9% |
도 | 4874 | 7.9% |
시 | 3774 | 6.1% |
로 | 3287 | 5.3% |
산 | 2591 | 4.2% |
길 | 2172 | 3.5% |
천 | 1425 | 2.3% |
읍 | 1368 | 2.2% |
Other values (316) | 26956 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3644 | |
2 | 2276 | |
3 | 1857 | |
4 | 1490 | |
5 | 1299 | 8.2% |
6 | 1157 | 7.3% |
7 | 1155 | 7.3% |
8 | 1064 | 6.7% |
0 | 946 | 6.0% |
9 | 927 | 5.9% |
Space Separator
Value | Count | Frequency (%) |
17823 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1322 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 61840 | |
Common | 34961 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
남 | 5369 | 8.7% |
청 | 5116 | 8.3% |
충 | 4908 | 7.9% |
도 | 4874 | 7.9% |
시 | 3774 | 6.1% |
로 | 3287 | 5.3% |
산 | 2591 | 4.2% |
길 | 2172 | 3.5% |
천 | 1425 | 2.3% |
읍 | 1368 | 2.2% |
Other values (316) | 26956 |
Common
Value | Count | Frequency (%) |
17823 | ||
1 | 3644 | 10.4% |
2 | 2276 | 6.5% |
3 | 1857 | 5.3% |
4 | 1490 | 4.3% |
- | 1322 | 3.8% |
5 | 1299 | 3.7% |
6 | 1157 | 3.3% |
7 | 1155 | 3.3% |
8 | 1064 | 3.0% |
Other values (3) | 1874 | 5.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 61840 | |
ASCII | 34961 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
17823 | ||
1 | 3644 | 10.4% |
2 | 2276 | 6.5% |
3 | 1857 | 5.3% |
4 | 1490 | 4.3% |
- | 1322 | 3.8% |
5 | 1299 | 3.7% |
6 | 1157 | 3.3% |
7 | 1155 | 3.3% |
8 | 1064 | 3.0% |
Other values (3) | 1874 | 5.4% |
Hangul
Value | Count | Frequency (%) |
남 | 5369 | 8.7% |
청 | 5116 | 8.3% |
충 | 4908 | 7.9% |
도 | 4874 | 7.9% |
시 | 3774 | 6.1% |
로 | 3287 | 5.3% |
산 | 2591 | 4.2% |
길 | 2172 | 3.5% |
천 | 1425 | 2.3% |
읍 | 1368 | 2.2% |
Other values (316) | 26956 |
시도코드
Text
Distinct | 3064 |
---|---|
Distinct (%) | 64.1% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 37.5 KiB |
Length
Max length | 14 |
---|---|
Median length | 12 |
Mean length | 11.868702 |
Min length | 7 |
Characters and Unicode
Total characters | 56768 |
---|---|
Distinct characters | 13 |
Distinct categories | 4 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 2987 ? |
---|---|
Unique (%) | 62.5% |
Sample
1st row | 041-669-1008 |
---|---|
2nd row | 050-5006-2544 |
3rd row | 041-664-3637 |
4th row | 041-338-5485 |
5th row | 041-335-9992 |
Value | Count | Frequency (%) |
010 | 1320 | |
1234567 | 147 | 3.1% |
12345678 | 94 | 2.0% |
000-000-0000 | 27 | 0.6% |
000-0000-0000 | 20 | 0.4% |
0413397483 | 19 | 0.4% |
041 | 18 | 0.4% |
041-332-8852 | 8 | 0.2% |
041-858-0561 | 8 | 0.2% |
041-856-8351 | 5 | 0.1% |
Other values (3059) | 3139 |
Most occurring characters
Value | Count | Frequency (%) |
* | 10560 | |
- | 8761 | |
0 | 7896 | |
1 | 6086 | |
4 | 5032 | |
3 | 3573 | 6.3% |
5 | 3424 | 6.0% |
6 | 2589 | 4.6% |
2 | 2361 | 4.2% |
7 | 2357 | 4.2% |
Other values (3) | 4129 | 7.3% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 37425 | |
Other Punctuation | 10560 | 18.6% |
Dash Punctuation | 8761 | 15.4% |
Space Separator | 22 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 7896 | |
1 | 6086 | |
4 | 5032 | |
3 | 3573 | |
5 | 3424 | |
6 | 2589 | 6.9% |
2 | 2361 | 6.3% |
7 | 2357 | 6.3% |
8 | 2163 | 5.8% |
9 | 1944 | 5.2% |
Other Punctuation
Value | Count | Frequency (%) |
* | 10560 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 8761 |
Space Separator
Value | Count | Frequency (%) |
22 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 56768 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
* | 10560 | |
- | 8761 | |
0 | 7896 | |
1 | 6086 | |
4 | 5032 | |
3 | 3573 | 6.3% |
5 | 3424 | 6.0% |
6 | 2589 | 4.6% |
2 | 2361 | 4.2% |
7 | 2357 | 4.2% |
Other values (3) | 4129 | 7.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 56768 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 10560 | |
- | 8761 | |
0 | 7896 | |
1 | 6086 | |
4 | 5032 | |
3 | 3573 | 6.3% |
5 | 3424 | 6.0% |
6 | 2589 | 4.6% |
2 | 2361 | 4.2% |
7 | 2357 | 4.2% |
Other values (3) | 4129 | 7.3% |
대표자명
Categorical
Distinct | 15 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.5 KiB |
천안시 | |
---|---|
아산시 | |
당진시 | |
서산시 | |
논산시 | |
Other values (10) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서산시 |
---|---|
2nd row | 서산시 |
3rd row | 서산시 |
4th row | 예산군 |
5th row | 예산군 |
Common Values
Value | Count | Frequency (%) |
천안시 | 830 | |
아산시 | 616 | |
당진시 | 595 | |
서산시 | 497 | |
논산시 | 345 | |
보령시 | 310 | 6.5% |
공주시 | 293 | 6.1% |
홍성군 | 270 | 5.6% |
예산군 | 209 | 4.4% |
태안군 | 190 | 4.0% |
Other values (5) | 629 |
Length
Value | Count | Frequency (%) |
천안시 | 830 | |
아산시 | 616 | |
당진시 | 595 | |
서산시 | 497 | |
논산시 | 345 | |
보령시 | 310 | 6.5% |
공주시 | 293 | 6.1% |
홍성군 | 270 | 5.6% |
예산군 | 209 | 4.4% |
태안군 | 190 | 4.0% |
Other values (5) | 629 |
업종상세
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.5 KiB |
한식 | |
---|---|
기타 음식점업 | 304 |
중식 | 221 |
일식 | 164 |
서양식 | 107 |
Length
Max length | 7 |
---|---|
Median length | 2 |
Mean length | 2.3557692 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 한식 |
---|---|
2nd row | 서양식 |
3rd row | 일식 |
4th row | 한식 |
5th row | 한식 |
Common Values
Value | Count | Frequency (%) |
한식 | 3963 | |
기타 음식점업 | 304 | 6.4% |
중식 | 221 | 4.6% |
일식 | 164 | 3.4% |
서양식 | 107 | 2.2% |
기타외국식 | 25 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
한식 | 3963 | |
기타 | 304 | 6.0% |
음식점업 | 304 | 6.0% |
중식 | 221 | 4.3% |
일식 | 164 | 3.2% |
서양식 | 107 | 2.1% |
기타외국식 | 25 | 0.5% |
업종 | 시도명 | 선정여부 | 안심식당SEQ | 전화번호 | 대표자명 | 업종상세 | |
---|---|---|---|---|---|---|---|
업종 | 1.000 | 0.131 | 0.632 | 0.223 | 0.892 | 0.598 | 0.116 |
시도명 | 0.131 | 1.000 | NaN | 0.014 | 0.118 | 0.155 | 0.827 |
선정여부 | 0.632 | NaN | 1.000 | 0.000 | 0.784 | 0.000 | 1.000 |
안심식당SEQ | 0.223 | 0.014 | 0.000 | 1.000 | 0.180 | 0.231 | 0.000 |
전화번호 | 0.892 | 0.118 | 0.784 | 0.180 | 1.000 | 0.600 | 0.145 |
대표자명 | 0.598 | 0.155 | 0.000 | 0.231 | 0.600 | 1.000 | 0.198 |
업종상세 | 0.116 | 0.827 | 1.000 | 0.000 | 0.145 | 0.198 | 1.000 |
선정여부 | 대표자명 | 시도명 | 업종상세 | 안심식당SEQ | |
---|---|---|---|---|---|
선정여부 | 1.000 | 0.000 | 1.000 | 0.866 | 0.000 |
대표자명 | 0.000 | 1.000 | 0.141 | 0.093 | 0.210 |
시도명 | 1.000 | 0.141 | 1.000 | 0.631 | 0.009 |
업종상세 | 0.866 | 0.093 | 0.631 | 1.000 | 0.000 |
안심식당SEQ | 0.000 | 0.210 | 0.009 | 0.000 | 1.000 |
업종 | 전화번호 | 시도명 | 선정여부 | 안심식당SEQ | 대표자명 | 업종상세 | |
---|---|---|---|---|---|---|---|
업종 | 1.000 | 0.892 | 0.101 | 0.430 | 0.171 | 0.269 | 0.061 |
전화번호 | 0.892 | 1.000 | 0.118 | 0.715 | 0.179 | 0.294 | 0.072 |
시도명 | 0.101 | 0.118 | 1.000 | 1.000 | 0.009 | 0.141 | 0.631 |
선정여부 | 0.430 | 0.715 | 1.000 | 1.000 | 0.000 | 0.000 | 0.866 |
안심식당SEQ | 0.171 | 0.179 | 0.009 | 0.000 | 1.000 | 0.210 | 0.000 |
대표자명 | 0.269 | 0.294 | 0.141 | 0.000 | 0.210 | 1.000 | 0.093 |
업종상세 | 0.061 | 0.072 | 0.631 | 0.866 | 0.000 | 0.093 | 1.000 |
업종 | 시도명 | 주소1 | 주소2 | 사업자명 | 선정여부 | 안심식당SEQ | 전화번호 | 시군구명 | 시도코드 | 대표자명 | 업종상세 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 일반음식점 | 충청남도 | <NA> | 청와삼대 | <NA> | Y | 11515 | 충청남도 서산시 석림6로 17 | 041-669-1008 | 서산시 | 한식 |
1 | 2 | 일반음식점 | 충청남도 | <NA> | 토마토아저씨서산점 | <NA> | Y | 11516 | 충청남도 서산시 호수공원14로 36 | 050-5006-2544 | 서산시 | 서양식 |
2 | 3 | 일반음식점 | 충청남도 | 2층 | 하루엔소쿠(서산점) | <NA> | Y | 11517 | 충청남도 서산시 안견로 242 | 041-664-3637 | 서산시 | 일식 |
3 | 4 | 일반음식점 | 충청남도 | <NA> | 거성정육식당 | <NA> | Y | 11518 | 충청남도 예산군 삽교읍 수암산로 272-23 | 041-338-5485 | 예산군 | 한식 |
4 | 5 | 일반음식점 | 충청남도 | <NA> | 김영희강남동태찜예산점 | <NA> | Y | 11519 | 충청남도 예산군 예산읍 산성공원1길 20 | 041-335-9992 | 예산군 | 한식 |
5 | 6 | 일반음식점 | 충청남도 | <NA> | 늘봄우와돈 | <NA> | Y | 11520 | 충청남도 예산군 예산읍 역전로160번길 30 | 041-335-3309 | 예산군 | 한식 |
6 | 7 | 일반음식점 | 충청남도 | <NA> | 대성식당 | <NA> | Y | 11521 | 충청남도 예산군 신양면 대덕로 6 | 010-****-**** | 예산군 | 한식 |
7 | 8 | 일반음식점 | 충청남도 | <NA> | 대술촌돼지찌개 | <NA> | Y | 11522 | 충청남도 예산군 대술면 대술로 119 | 010-****-**** | 예산군 | 한식 |
8 | 9 | 일반음식점 | 충청남도 | <NA> | 대술칼국수 | <NA> | Y | 11523 | 충청남도 예산군 대술면 대술로 120-1 | 010-****-**** | 예산군 | 한식 |
9 | 10 | 일반음식점 | 충청남도 | <NA> | 막창도둑 | <NA> | Y | 11524 | 충청남도 예산군 예산읍 벚꽃로155번길 5 | 041-331-5161 | 예산군 | 한식 |
업종 | 시도명 | 주소1 | 주소2 | 사업자명 | 선정여부 | 안심식당SEQ | 전화번호 | 시군구명 | 시도코드 | 대표자명 | 업종상세 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
4774 | 4775 | 일반음식점 | 충청남도 | <NA> | 월명산장 | <NA> | Y | 70509 | 충청남도 서천군 비인면 충서로740번길 2-1 | 010-****-**** | 서천군 | 한식 |
4775 | 4776 | 일반음식점 | 충청남도 | 1층 | 온정곰탕 | <NA> | Y | 70399 | 충청남도 아산시 충무로20번길 10 | 041-532-6094 | 아산시 | 한식 |
4776 | 4777 | 일반음식점 | 충청남도 | <NA> | 장미치킨호프 | <NA> | Y | 70400 | 충청남도 아산시 신창면 서부북로 933-30 | 041-546-3392 | 아산시 | 한식 |
4777 | 4778 | 일반음식점 | 충청남도 | <NA> | 다도횟집 | <NA> | Y | 70401 | 충청남도 아산시 시민로457번길 35 | 041-545-9555 | 아산시 | 한식 |
4778 | 4779 | 일반음식점 | 충청남도 | <NA> | 서경한식뷔페 | <NA> | Y | 70402 | 충청남도 아산시 영인면 영인로 136 | 041-543-5657 | 아산시 | 한식 |
4779 | 4780 | 일반음식점 | 충청남도 | <NA> | 그램그램 (아산음봉포스코점) | <NA> | Y | 70403 | 충청남도 아산시 음봉면 음봉로 574 | 041-546-9002 | 아산시 | 한식 |
4780 | 4781 | 일반음식점 | 충청남도 | <NA> | 짱이야 | <NA> | Y | 70404 | 충청남도 아산시 온화로65번길 25 | 0507-1482-0230 | 아산시 | 한식 |
4781 | 4782 | 일반음식점 | 충청남도 | <NA> | 이춘봉인생치킨 아산1호점 | <NA> | Y | 70405 | 충청남도 아산시 음봉면 음봉로 672 | 041-531-3139 | 아산시 | 한식 |
4782 | 4783 | 일반음식점 | 충청남도 | <NA> | 마미쿡 | <NA> | Y | 70406 | 충청남도 아산시 배방읍 용연로 20-2 | 0507-1404-1183 | 아산시 | 한식 |
4783 | 4784 | 일반음식점 | 충청남도 | <NA> | 새로운가주식회사 족발야시장 | <NA> | Y | 70407 | 충청남도 아산시 배방읍 용연로 84-7 | 041-532-4969 | 아산시 | 한식 |