Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 4752 |
Missing cells | 14469 |
Missing cells (%) | 23.4% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 510.6 KiB |
Average record size in memory | 110.0 B |
Variable types
Text | 4 |
---|---|
DateTime | 1 |
Categorical | 2 |
Unsupported | 3 |
Numeric | 3 |
Dataset
Description | 일반음식점(까페) 현황 |
---|---|
Author | 행정안전부 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=3L2A0IARXF24QRZCIQQV13612546&infSeq=1 |
위생업태명 has constant value "" | Constant |
소재지우편번호 is highly overall correlated with WGS84위도 | High correlation |
WGS84위도 is highly overall correlated with 소재지우편번호 | High correlation |
다중이용업소여부 has 4752 (100.0%) missing values | Missing |
총시설규모(㎡) has 4752 (100.0%) missing values | Missing |
위생업종명 has 4752 (100.0%) missing values | Missing |
소재지도로명주소 has 98 (2.1%) missing values | Missing |
소재지우편번호 has 48 (1.0%) missing values | Missing |
다중이용업소여부 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
총시설규모(㎡) is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
위생업종명 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-10 21:49:57.418348 |
---|---|
Analysis finished | 2023-12-10 21:50:00.213701 |
Duration | 2.8 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군명
Text
Distinct | 55 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.3 KiB |
Value | Count | Frequency (%) |
고양시 | 897 | |
성남시 | 508 | |
수원시 | 466 | 9.8% |
용인시 | 404 | 8.5% |
안산시 | 309 | 6.5% |
화성시 | 254 | 5.3% |
안양시 | 232 | 4.9% |
파주시 | 190 | 4.0% |
부천시 | 159 | 3.3% |
남양주시 | 134 | 2.8% |
Other values (22) | 1199 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 4677 | |
4343 | ||
양 | 1381 | 7.3% |
고 | 897 | 4.8% |
성 | 807 | 4.3% |
남 | 702 | 3.7% |
안 | 586 | 3.1% |
주 | 503 | 2.7% |
원 | 466 | 2.5% |
수 | 466 | 2.5% |
Other values (33) | 4003 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14488 | |
Space Separator | 4343 | 23.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 4677 | |
양 | 1381 | 9.5% |
고 | 897 | 6.2% |
성 | 807 | 5.6% |
남 | 702 | 4.8% |
안 | 586 | 4.0% |
주 | 503 | 3.5% |
원 | 466 | 3.2% |
수 | 466 | 3.2% |
용 | 404 | 2.8% |
Other values (32) | 3599 |
Space Separator
Value | Count | Frequency (%) |
4343 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14488 | |
Common | 4343 | 23.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 4677 | |
양 | 1381 | 9.5% |
고 | 897 | 6.2% |
성 | 807 | 5.6% |
남 | 702 | 4.8% |
안 | 586 | 4.0% |
주 | 503 | 3.5% |
원 | 466 | 3.2% |
수 | 466 | 3.2% |
용 | 404 | 2.8% |
Other values (32) | 3599 |
Common
Value | Count | Frequency (%) |
4343 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14488 | |
ASCII | 4343 | 23.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 4677 | |
양 | 1381 | 9.5% |
고 | 897 | 6.2% |
성 | 807 | 5.6% |
남 | 702 | 4.8% |
안 | 586 | 4.0% |
주 | 503 | 3.5% |
원 | 466 | 3.2% |
수 | 466 | 3.2% |
용 | 404 | 2.8% |
Other values (32) | 3599 |
ASCII
Value | Count | Frequency (%) |
4343 |
사업장명
Text
Distinct | 4210 |
---|---|
Distinct (%) | 88.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.3 KiB |
Length
Max length | 46 |
---|---|
Median length | 36 |
Mean length | 5.7613636 |
Min length | 1 |
Characters and Unicode
Total characters | 27378 |
---|---|
Distinct characters | 930 |
Distinct categories | 15 ? |
Distinct scripts | 4 ? |
Distinct blocks | 9 ? |
Unique
Unique | 3864 ? |
---|---|
Unique (%) | 81.3% |
Sample
1st row | 버치티하우스 |
---|---|
2nd row | 마더스 아뜰리에 로스터리 카페 |
3rd row | 까사32 |
4th row | 메이플티하우스 |
5th row | 파인티하우스 |
Value | Count | Frequency (%) |
카페 | 62 | 1.1% |
cafe | 38 | 0.7% |
coffee | 33 | 0.6% |
커피 | 19 | 0.3% |
까페 | 17 | 0.3% |
아지트 | 14 | 0.2% |
블루 | 12 | 0.2% |
더 | 11 | 0.2% |
테라스 | 9 | 0.2% |
the | 9 | 0.2% |
Other values (4640) | 5414 |
Most occurring characters
Value | Count | Frequency (%) |
890 | 3.3% | |
페 | 869 | 3.2% |
카 | 786 | 2.9% |
( | 745 | 2.7% |
) | 744 | 2.7% |
스 | 741 | 2.7% |
이 | 635 | 2.3% |
리 | 494 | 1.8% |
피 | 464 | 1.7% |
e | 462 | 1.7% |
Other values (920) | 20548 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 19496 | |
Lowercase Letter | 2684 | 9.8% |
Uppercase Letter | 2057 | 7.5% |
Space Separator | 890 | 3.3% |
Open Punctuation | 746 | 2.7% |
Close Punctuation | 745 | 2.7% |
Decimal Number | 575 | 2.1% |
Other Punctuation | 154 | 0.6% |
Dash Punctuation | 13 | < 0.1% |
Modifier Symbol | 5 | < 0.1% |
Other values (5) | 13 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
페 | 869 | 4.5% |
카 | 786 | 4.0% |
스 | 741 | 3.8% |
이 | 635 | 3.3% |
리 | 494 | 2.5% |
피 | 464 | 2.4% |
커 | 412 | 2.1% |
라 | 364 | 1.9% |
아 | 344 | 1.8% |
점 | 265 | 1.4% |
Other values (830) | 14122 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 462 | |
a | 323 | |
o | 253 | 9.4% |
f | 216 | 8.0% |
n | 149 | 5.6% |
r | 139 | 5.2% |
s | 136 | 5.1% |
i | 134 | 5.0% |
c | 119 | 4.4% |
l | 112 | 4.2% |
Other values (16) | 641 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 201 | 9.8% |
A | 193 | 9.4% |
E | 176 | 8.6% |
O | 169 | 8.2% |
B | 125 | 6.1% |
F | 97 | 4.7% |
L | 97 | 4.7% |
T | 96 | 4.7% |
N | 95 | 4.6% |
M | 90 | 4.4% |
Other values (16) | 718 |
Other Punctuation
Value | Count | Frequency (%) |
. | 53 | |
& | 45 | |
' | 23 | |
: | 7 | 4.5% |
, | 6 | 3.9% |
· | 6 | 3.9% |
! | 3 | 1.9% |
? | 3 | 1.9% |
" | 2 | 1.3% |
& | 2 | 1.3% |
Other values (3) | 4 | 2.6% |
Decimal Number
Value | Count | Frequency (%) |
0 | 130 | |
1 | 83 | |
2 | 80 | |
7 | 64 | |
8 | 50 | 8.7% |
3 | 45 | 7.8% |
5 | 38 | 6.6% |
9 | 32 | 5.6% |
4 | 28 | 4.9% |
6 | 25 | 4.3% |
Open Punctuation
Value | Count | Frequency (%) |
( | 745 | |
[ | 1 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 744 | |
] | 1 | 0.1% |
Modifier Symbol
Value | Count | Frequency (%) |
` | 4 | |
´ | 1 | 20.0% |
Other Symbol
Value | Count | Frequency (%) |
℃ | 3 | |
° | 1 | 25.0% |
Letter Number
Value | Count | Frequency (%) |
Ⅲ | 2 | |
Ⅱ | 1 |
Space Separator
Value | Count | Frequency (%) |
890 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 13 |
Math Symbol
Value | Count | Frequency (%) |
+ | 3 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 2 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 19489 | |
Latin | 4744 | 17.3% |
Common | 3138 | 11.5% |
Han | 7 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
페 | 869 | 4.5% |
카 | 786 | 4.0% |
스 | 741 | 3.8% |
이 | 635 | 3.3% |
리 | 494 | 2.5% |
피 | 464 | 2.4% |
커 | 412 | 2.1% |
라 | 364 | 1.9% |
아 | 344 | 1.8% |
점 | 265 | 1.4% |
Other values (823) | 14115 |
Latin
Value | Count | Frequency (%) |
e | 462 | 9.7% |
a | 323 | 6.8% |
o | 253 | 5.3% |
f | 216 | 4.6% |
C | 201 | 4.2% |
A | 193 | 4.1% |
E | 176 | 3.7% |
O | 169 | 3.6% |
n | 149 | 3.1% |
r | 139 | 2.9% |
Other values (44) | 2463 |
Common
Value | Count | Frequency (%) |
890 | ||
( | 745 | |
) | 744 | |
0 | 130 | 4.1% |
1 | 83 | 2.6% |
2 | 80 | 2.5% |
7 | 64 | 2.0% |
. | 53 | 1.7% |
8 | 50 | 1.6% |
3 | 45 | 1.4% |
Other values (26) | 254 | 8.1% |
Han
Value | Count | Frequency (%) |
貢 | 1 | |
正 | 1 | |
茶 | 1 | |
茶 | 1 | |
人 | 1 | |
秀 | 1 | |
占 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 19484 | |
ASCII | 7863 | |
None | 11 | < 0.1% |
CJK | 6 | < 0.1% |
Compat Jamo | 5 | < 0.1% |
Letterlike Symbols | 3 | < 0.1% |
Number Forms | 3 | < 0.1% |
Punctuation | 2 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
890 | 11.3% | |
( | 745 | 9.5% |
) | 744 | 9.5% |
e | 462 | 5.9% |
a | 323 | 4.1% |
o | 253 | 3.2% |
f | 216 | 2.7% |
C | 201 | 2.6% |
A | 193 | 2.5% |
E | 176 | 2.2% |
Other values (71) | 3660 |
Hangul
Value | Count | Frequency (%) |
페 | 869 | 4.5% |
카 | 786 | 4.0% |
스 | 741 | 3.8% |
이 | 635 | 3.3% |
리 | 494 | 2.5% |
피 | 464 | 2.4% |
커 | 412 | 2.1% |
라 | 364 | 1.9% |
아 | 344 | 1.8% |
점 | 265 | 1.4% |
Other values (822) | 14110 |
None
Value | Count | Frequency (%) |
· | 6 | |
& | 2 | 18.2% |
_ | 1 | 9.1% |
´ | 1 | 9.1% |
° | 1 | 9.1% |
Compat Jamo
Value | Count | Frequency (%) |
ㅋ | 5 |
Letterlike Symbols
Value | Count | Frequency (%) |
℃ | 3 |
Punctuation
Value | Count | Frequency (%) |
’ | 2 |
Number Forms
Value | Count | Frequency (%) |
Ⅲ | 2 | |
Ⅱ | 1 |
CJK
Value | Count | Frequency (%) |
貢 | 1 | |
正 | 1 | |
茶 | 1 | |
人 | 1 | |
秀 | 1 | |
占 | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
茶 | 1 |
인허가일자
Date
Distinct | 2608 |
---|---|
Distinct (%) | 54.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.3 KiB |
Minimum | 1973-09-21 00:00:00 |
---|---|
Maximum | 2020-12-18 00:00:00 |
영업상태명
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.3 KiB |
폐업 | |
---|---|
영업 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 영업 |
---|---|
2nd row | 영업 |
3rd row | 영업 |
4th row | 영업 |
5th row | 영업 |
Common Values
Value | Count | Frequency (%) |
폐업 | 3669 | |
영업 | 1083 | 22.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
폐업 | 3669 | |
영업 | 1083 | 22.8% |
다중이용업소여부
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 4752 |
---|---|
Missing (%) | 100.0% |
Memory size | 41.9 KiB |
총시설규모(㎡)
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 4752 |
---|---|
Missing (%) | 100.0% |
Memory size | 41.9 KiB |
위생업종명
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 4752 |
---|---|
Missing (%) | 100.0% |
Memory size | 41.9 KiB |
위생업태명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 37.3 KiB |
까페 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 까페 |
---|---|
2nd row | 까페 |
3rd row | 까페 |
4th row | 까페 |
5th row | 까페 |
Common Values
Value | Count | Frequency (%) |
까페 | 4752 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
까페 | 4752 |
소재지도로명주소
Text
MISSING
 
Distinct | 4477 |
---|---|
Distinct (%) | 96.2% |
Missing | 98 |
Missing (%) | 2.1% |
Memory size | 37.3 KiB |
Length
Max length | 71 |
---|---|
Median length | 53 |
Mean length | 31.021057 |
Min length | 13 |
Characters and Unicode
Total characters | 144372 |
---|---|
Distinct characters | 559 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 4347 ? |
---|---|
Unique (%) | 93.4% |
Sample
1st row | 경기도 가평군 상면 둔덕말길 232 (외 45필지) |
---|---|
2nd row | 경기도 가평군 설악면 유명로 1454-25, B동 1~2층 |
3rd row | 경기도 가평군 설악면 유명로 2384, C동 1층 |
4th row | 경기도 가평군 상면 둔덕말길 232, 1층 |
5th row | 경기도 가평군 상면 둔덕말길 232 (외 45필지) |
Value | Count | Frequency (%) |
경기도 | 4653 | 15.5% |
1층 | 933 | 3.1% |
고양시 | 889 | 3.0% |
일산동구 | 581 | 1.9% |
성남시 | 488 | 1.6% |
수원시 | 454 | 1.5% |
용인시 | 400 | 1.3% |
분당구 | 341 | 1.1% |
안산시 | 306 | 1.0% |
2층 | 265 | 0.9% |
Other values (5821) | 20703 |
Most occurring characters
Value | Count | Frequency (%) |
25470 | 17.6% | |
1 | 7167 | 5.0% |
기 | 4873 | 3.4% |
경 | 4796 | 3.3% |
도 | 4737 | 3.3% |
시 | 4702 | 3.3% |
동 | 4502 | 3.1% |
로 | 4430 | 3.1% |
, | 3890 | 2.7% |
2 | 3722 | 2.6% |
Other values (549) | 76083 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 81258 | |
Space Separator | 25470 | 17.6% |
Decimal Number | 24999 | 17.3% |
Other Punctuation | 3927 | 2.7% |
Close Punctuation | 3438 | 2.4% |
Open Punctuation | 3437 | 2.4% |
Dash Punctuation | 1437 | 1.0% |
Uppercase Letter | 325 | 0.2% |
Math Symbol | 39 | < 0.1% |
Lowercase Letter | 28 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 4873 | 6.0% |
경 | 4796 | 5.9% |
도 | 4737 | 5.8% |
시 | 4702 | 5.8% |
동 | 4502 | 5.5% |
로 | 4430 | 5.5% |
구 | 2963 | 3.6% |
길 | 2132 | 2.6% |
층 | 2057 | 2.5% |
산 | 1930 | 2.4% |
Other values (490) | 44136 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 107 | |
A | 49 | |
I | 22 | 6.8% |
C | 19 | 5.8% |
S | 14 | 4.3% |
E | 13 | 4.0% |
T | 9 | 2.8% |
K | 9 | 2.8% |
W | 8 | 2.5% |
D | 8 | 2.5% |
Other values (14) | 67 |
Lowercase Letter
Value | Count | Frequency (%) |
l | 5 | |
e | 4 | |
b | 3 | |
w | 3 | |
a | 2 | 7.1% |
n | 2 | 7.1% |
i | 2 | 7.1% |
c | 2 | 7.1% |
o | 2 | 7.1% |
r | 1 | 3.6% |
Other values (2) | 2 | 7.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 7167 | |
2 | 3722 | |
3 | 2565 | 10.3% |
0 | 2444 | 9.8% |
4 | 1945 | 7.8% |
5 | 1707 | 6.8% |
6 | 1556 | 6.2% |
7 | 1407 | 5.6% |
8 | 1323 | 5.3% |
9 | 1163 | 4.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 3890 | |
. | 30 | 0.8% |
/ | 3 | 0.1% |
@ | 3 | 0.1% |
' | 1 | < 0.1% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 6 | |
Ⅰ | 4 | |
Ⅲ | 4 |
Space Separator
Value | Count | Frequency (%) |
25470 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3438 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3437 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1437 |
Math Symbol
Value | Count | Frequency (%) |
~ | 39 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 81258 | |
Common | 62747 | |
Latin | 367 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 4873 | 6.0% |
경 | 4796 | 5.9% |
도 | 4737 | 5.8% |
시 | 4702 | 5.8% |
동 | 4502 | 5.5% |
로 | 4430 | 5.5% |
구 | 2963 | 3.6% |
길 | 2132 | 2.6% |
층 | 2057 | 2.5% |
산 | 1930 | 2.4% |
Other values (490) | 44136 |
Latin
Value | Count | Frequency (%) |
B | 107 | |
A | 49 | |
I | 22 | 6.0% |
C | 19 | 5.2% |
S | 14 | 3.8% |
E | 13 | 3.5% |
T | 9 | 2.5% |
K | 9 | 2.5% |
W | 8 | 2.2% |
D | 8 | 2.2% |
Other values (29) | 109 |
Common
Value | Count | Frequency (%) |
25470 | ||
1 | 7167 | 11.4% |
, | 3890 | 6.2% |
2 | 3722 | 5.9% |
) | 3438 | 5.5% |
( | 3437 | 5.5% |
3 | 2565 | 4.1% |
0 | 2444 | 3.9% |
4 | 1945 | 3.1% |
5 | 1707 | 2.7% |
Other values (10) | 6962 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 81258 | |
ASCII | 63100 | |
Number Forms | 14 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
25470 | ||
1 | 7167 | 11.4% |
, | 3890 | 6.2% |
2 | 3722 | 5.9% |
) | 3438 | 5.4% |
( | 3437 | 5.4% |
3 | 2565 | 4.1% |
0 | 2444 | 3.9% |
4 | 1945 | 3.1% |
5 | 1707 | 2.7% |
Other values (46) | 7315 | 11.6% |
Hangul
Value | Count | Frequency (%) |
기 | 4873 | 6.0% |
경 | 4796 | 5.9% |
도 | 4737 | 5.8% |
시 | 4702 | 5.8% |
동 | 4502 | 5.5% |
로 | 4430 | 5.5% |
구 | 2963 | 3.6% |
길 | 2132 | 2.6% |
층 | 2057 | 2.5% |
산 | 1930 | 2.4% |
Other values (490) | 44136 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 6 | |
Ⅰ | 4 | |
Ⅲ | 4 |
소재지지번주소
Text
Distinct | 4682 |
---|---|
Distinct (%) | 98.5% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 37.3 KiB |
Length
Max length | 65 |
---|---|
Median length | 52 |
Mean length | 28.928015 |
Min length | 14 |
Characters and Unicode
Total characters | 137437 |
---|---|
Distinct characters | 552 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 4615 ? |
---|---|
Unique (%) | 97.1% |
Sample
1st row | 경기도 가평군 상면 상동리 산 52 외 45필지 |
---|---|
2nd row | 경기도 가평군 설악면 신천리 726-6 외 1필지, B동 1~2층 |
3rd row | 경기도 가평군 설악면 회곡리 467-6 C동1층 |
4th row | 경기도 가평군 상면 상동리 산 52 외 45필지, 1층 |
5th row | 경기도 가평군 상면 상동리 산 52 외 45필지 |
Value | Count | Frequency (%) |
경기도 | 4750 | 16.3% |
1층 | 978 | 3.4% |
고양시 | 897 | 3.1% |
일산동구 | 585 | 2.0% |
성남시 | 508 | 1.7% |
수원시 | 466 | 1.6% |
용인시 | 404 | 1.4% |
분당구 | 343 | 1.2% |
2층 | 337 | 1.2% |
안산시 | 309 | 1.1% |
Other values (6713) | 19517 |
Most occurring characters
Value | Count | Frequency (%) |
24558 | 17.9% | |
1 | 7881 | 5.7% |
동 | 5453 | 4.0% |
기 | 4951 | 3.6% |
도 | 4834 | 3.5% |
경 | 4782 | 3.5% |
시 | 4741 | 3.4% |
지 | 4426 | 3.2% |
2 | 3978 | 2.9% |
- | 3873 | 2.8% |
Other values (542) | 67960 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 77827 | |
Decimal Number | 28964 | 21.1% |
Space Separator | 24558 | 17.9% |
Dash Punctuation | 3873 | 2.8% |
Other Punctuation | 576 | 0.4% |
Close Punctuation | 575 | 0.4% |
Open Punctuation | 574 | 0.4% |
Uppercase Letter | 400 | 0.3% |
Math Symbol | 40 | < 0.1% |
Lowercase Letter | 32 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 5453 | 7.0% |
기 | 4951 | 6.4% |
도 | 4834 | 6.2% |
경 | 4782 | 6.1% |
시 | 4741 | 6.1% |
지 | 4426 | 5.7% |
번 | 3397 | 4.4% |
구 | 2994 | 3.8% |
층 | 2200 | 2.8% |
호 | 2039 | 2.6% |
Other values (480) | 38010 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 128 | |
A | 54 | |
I | 31 | 7.8% |
C | 23 | 5.8% |
S | 15 | 3.8% |
E | 15 | 3.8% |
T | 14 | 3.5% |
K | 12 | 3.0% |
W | 11 | 2.8% |
D | 10 | 2.5% |
Other values (14) | 87 |
Lowercase Letter
Value | Count | Frequency (%) |
l | 10 | |
e | 5 | |
a | 3 | 9.4% |
b | 2 | 6.2% |
w | 2 | 6.2% |
c | 2 | 6.2% |
n | 2 | 6.2% |
i | 2 | 6.2% |
p | 1 | 3.1% |
m | 1 | 3.1% |
Other values (2) | 2 | 6.2% |
Decimal Number
Value | Count | Frequency (%) |
1 | 7881 | |
2 | 3978 | |
0 | 3100 | 10.7% |
3 | 2781 | 9.6% |
4 | 2210 | 7.6% |
5 | 2105 | 7.3% |
6 | 1934 | 6.7% |
7 | 1857 | 6.4% |
8 | 1681 | 5.8% |
9 | 1437 | 5.0% |
Other Punctuation
Value | Count | Frequency (%) |
, | 528 | |
. | 36 | 6.2% |
@ | 6 | 1.0% |
/ | 2 | 0.3% |
& | 2 | 0.3% |
' | 1 | 0.2% |
; | 1 | 0.2% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 8 | |
Ⅲ | 6 | |
Ⅰ | 4 |
Math Symbol
Value | Count | Frequency (%) |
~ | 39 | |
∥ | 1 | 2.5% |
Space Separator
Value | Count | Frequency (%) |
24558 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3873 |
Close Punctuation
Value | Count | Frequency (%) |
) | 575 |
Open Punctuation
Value | Count | Frequency (%) |
( | 574 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 77827 | |
Common | 59160 | |
Latin | 450 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 5453 | 7.0% |
기 | 4951 | 6.4% |
도 | 4834 | 6.2% |
경 | 4782 | 6.1% |
시 | 4741 | 6.1% |
지 | 4426 | 5.7% |
번 | 3397 | 4.4% |
구 | 2994 | 3.8% |
층 | 2200 | 2.8% |
호 | 2039 | 2.6% |
Other values (480) | 38010 |
Latin
Value | Count | Frequency (%) |
B | 128 | |
A | 54 | 12.0% |
I | 31 | 6.9% |
C | 23 | 5.1% |
S | 15 | 3.3% |
E | 15 | 3.3% |
T | 14 | 3.1% |
K | 12 | 2.7% |
W | 11 | 2.4% |
D | 10 | 2.2% |
Other values (29) | 137 |
Common
Value | Count | Frequency (%) |
24558 | ||
1 | 7881 | 13.3% |
2 | 3978 | 6.7% |
- | 3873 | 6.5% |
0 | 3100 | 5.2% |
3 | 2781 | 4.7% |
4 | 2210 | 3.7% |
5 | 2105 | 3.6% |
6 | 1934 | 3.3% |
7 | 1857 | 3.1% |
Other values (13) | 4883 | 8.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 77827 | |
ASCII | 59591 | |
Number Forms | 18 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
24558 | ||
1 | 7881 | 13.2% |
2 | 3978 | 6.7% |
- | 3873 | 6.5% |
0 | 3100 | 5.2% |
3 | 2781 | 4.7% |
4 | 2210 | 3.7% |
5 | 2105 | 3.5% |
6 | 1934 | 3.2% |
7 | 1857 | 3.1% |
Other values (48) | 5314 | 8.9% |
Hangul
Value | Count | Frequency (%) |
동 | 5453 | 7.0% |
기 | 4951 | 6.4% |
도 | 4834 | 6.2% |
경 | 4782 | 6.1% |
시 | 4741 | 6.1% |
지 | 4426 | 5.7% |
번 | 3397 | 4.4% |
구 | 2994 | 3.8% |
층 | 2200 | 2.8% |
호 | 2039 | 2.6% |
Other values (480) | 38010 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 8 | |
Ⅲ | 6 | |
Ⅰ | 4 |
Math Operators
Value | Count | Frequency (%) |
∥ | 1 |
소재지우편번호
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 1691 |
---|---|
Distinct (%) | 35.9% |
Missing | 48 |
Missing (%) | 1.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 13926.338 |
Minimum | 4344 |
---|---|
Maximum | 18624 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 41.9 KiB |
Quantile statistics
Minimum | 4344 |
---|---|
5-th percentile | 10343.3 |
Q1 | 10952.75 |
median | 13637 |
Q3 | 16476 |
95-th percentile | 18276.95 |
Maximum | 18624 |
Range | 14280 |
Interquartile range (IQR) | 5523.25 |
Descriptive statistics
Standard deviation | 2685.2288 |
---|---|
Coefficient of variation (CV) | 0.19281657 |
Kurtosis | -1.2983092 |
Mean | 13926.338 |
Median Absolute Deviation (MAD) | 2742.5 |
Skewness | 0.038478996 |
Sum | 65509494 |
Variance | 7210453.5 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10401 | 77 | 1.6% |
10402 | 67 | 1.4% |
10364 | 64 | 1.3% |
10358 | 48 | 1.0% |
16705 | 38 | 0.8% |
10383 | 33 | 0.7% |
10406 | 33 | 0.7% |
16897 | 33 | 0.7% |
10446 | 31 | 0.7% |
16889 | 31 | 0.7% |
Other values (1681) | 4249 | |
(Missing) | 48 | 1.0% |
Value | Count | Frequency (%) |
4344 | 1 | |
10003 | 1 | |
10011 | 1 | |
10016 | 2 | |
10017 | 1 | |
10018 | 2 | |
10022 | 1 | |
10029 | 1 | |
10031 | 1 | |
10032 | 1 |
Value | Count | Frequency (%) |
18624 | 1 | < 0.1% |
18623 | 1 | < 0.1% |
18606 | 1 | < 0.1% |
18603 | 3 | 0.1% |
18602 | 2 | < 0.1% |
18600 | 2 | < 0.1% |
18598 | 6 | |
18594 | 3 | 0.1% |
18593 | 10 | |
18592 | 1 | < 0.1% |
WGS84위도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 3983 |
---|---|
Distinct (%) | 84.4% |
Missing | 33 |
Missing (%) | 0.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 37.44903 |
Minimum | 36.959158 |
---|---|
Maximum | 38.213377 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 41.9 KiB |
Quantile statistics
Minimum | 36.959158 |
---|---|
5-th percentile | 37.157898 |
Q1 | 37.301573 |
median | 37.396821 |
Q3 | 37.65477 |
95-th percentile | 37.759848 |
Maximum | 38.213377 |
Range | 1.2542197 |
Interquartile range (IQR) | 0.35319767 |
Descriptive statistics
Standard deviation | 0.20316612 |
---|---|
Coefficient of variation (CV) | 0.0054251372 |
Kurtosis | -0.57121247 |
Mean | 37.44903 |
Median Absolute Deviation (MAD) | 0.13592729 |
Skewness | 0.17010576 |
Sum | 176721.97 |
Variance | 0.041276474 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
37.662782103 | 14 | 0.3% |
37.6558930852 | 10 | 0.2% |
37.6636687856 | 9 | 0.2% |
37.6603374862 | 9 | 0.2% |
37.6572135804 | 8 | 0.2% |
37.6577605332 | 7 | 0.1% |
37.4012858766 | 7 | 0.1% |
37.6613171228 | 7 | 0.1% |
37.3119260049 | 6 | 0.1% |
37.6618144398 | 6 | 0.1% |
Other values (3973) | 4636 | |
(Missing) | 33 | 0.7% |
Value | Count | Frequency (%) |
36.9591575959 | 1 | |
36.9593241076 | 1 | |
36.9593457707 | 1 | |
36.959508969 | 1 | |
36.9596360398 | 1 | |
36.9604879033 | 1 | |
36.9606313551 | 1 | |
36.9609410537 | 1 | |
36.9610121479 | 1 | |
36.9644052069 | 1 |
Value | Count | Frequency (%) |
38.2133773231 | 1 | |
38.1849584503 | 1 | |
38.0849552218 | 1 | |
38.0718166543 | 1 | |
38.0668169302 | 1 | |
38.0305892653 | 1 | |
38.0270406935 | 1 | |
38.0250571471 | 1 | |
38.0243695815 | 1 | |
38.0237056853 | 1 |
WGS84경도
Real number (ℝ)
Distinct | 3983 |
---|---|
Distinct (%) | 84.4% |
Missing | 33 |
Missing (%) | 0.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 126.9865 |
Minimum | 126.54798 |
---|---|
Maximum | 127.75444 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 41.9 KiB |
Quantile statistics
Minimum | 126.54798 |
---|---|
5-th percentile | 126.74558 |
Q1 | 126.79109 |
median | 127.0019 |
Q3 | 127.11145 |
95-th percentile | 127.31862 |
Maximum | 127.75444 |
Range | 1.2064561 |
Interquartile range (IQR) | 0.32035357 |
Descriptive statistics
Standard deviation | 0.19519397 |
---|---|
Coefficient of variation (CV) | 0.0015371239 |
Kurtosis | 0.31404255 |
Mean | 126.9865 |
Median Absolute Deviation (MAD) | 0.14565217 |
Skewness | 0.55417297 |
Sum | 599249.27 |
Variance | 0.038100687 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
126.7666198185 | 14 | 0.3% |
126.7719705633 | 10 | 0.2% |
126.7657153891 | 9 | 0.2% |
126.7677436097 | 9 | 0.2% |
126.7697922897 | 8 | 0.2% |
126.7737095861 | 7 | 0.1% |
127.1104579421 | 7 | 0.1% |
126.7672918171 | 7 | 0.1% |
126.8310374164 | 6 | 0.1% |
126.7675476974 | 6 | 0.1% |
Other values (3973) | 4636 | |
(Missing) | 33 | 0.7% |
Value | Count | Frequency (%) |
126.5479804776 | 1 | < 0.1% |
126.5497387546 | 2 | |
126.5498350863 | 1 | < 0.1% |
126.5511387505 | 1 | < 0.1% |
126.5635961939 | 1 | < 0.1% |
126.5654892796 | 3 | |
126.5683296453 | 1 | < 0.1% |
126.5691742314 | 1 | < 0.1% |
126.5693388781 | 1 | < 0.1% |
126.5729671695 | 1 | < 0.1% |
Value | Count | Frequency (%) |
127.7544366101 | 1 | |
127.7542478119 | 1 | |
127.7530783607 | 1 | |
127.6881568938 | 1 | |
127.6802960853 | 1 | |
127.6614174614 | 1 | |
127.6551880182 | 1 | |
127.6482480426 | 1 | |
127.6426257803 | 1 | |
127.6404855895 | 1 |
시군명 | 영업상태명 | 소재지우편번호 | WGS84위도 | WGS84경도 | |
---|---|---|---|---|---|
시군명 | 1.000 | 0.346 | 0.991 | 0.982 | 0.947 |
영업상태명 | 0.346 | 1.000 | 0.114 | 0.128 | 0.196 |
소재지우편번호 | 0.991 | 0.114 | 1.000 | 0.824 | 0.781 |
WGS84위도 | 0.982 | 0.128 | 0.824 | 1.000 | 0.698 |
WGS84경도 | 0.947 | 0.196 | 0.781 | 0.698 | 1.000 |
소재지우편번호 | WGS84위도 | WGS84경도 | 영업상태명 | |
---|---|---|---|---|
소재지우편번호 | 1.000 | -0.915 | 0.413 | 0.121 |
WGS84위도 | -0.915 | 1.000 | -0.366 | 0.098 |
WGS84경도 | 0.413 | -0.366 | 1.000 | 0.150 |
영업상태명 | 0.121 | 0.098 | 0.150 | 1.000 |
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 다중이용업소여부 | 총시설규모(㎡) | 위생업종명 | 위생업태명 | 소재지도로명주소 | 소재지지번주소 | 소재지우편번호 | WGS84위도 | WGS84경도 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 가평군 | 버치티하우스 | 2005-11-02 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 상면 둔덕말길 232 (외 45필지) | 경기도 가평군 상면 상동리 산 52 외 45필지 | 12443 | 37.797145 | 127.305438 |
1 | 가평군 | 마더스 아뜰리에 로스터리 카페 | 2012-09-04 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 설악면 유명로 1454-25, B동 1~2층 | 경기도 가평군 설악면 신천리 726-6 외 1필지, B동 1~2층 | 12467 | 37.66187 | 127.481666 |
2 | 가평군 | 까사32 | 2015-04-29 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 설악면 유명로 2384, C동 1층 | 경기도 가평군 설악면 회곡리 467-6 C동1층 | 12459 | 37.711504 | 127.445133 |
3 | 가평군 | 메이플티하우스 | 2005-11-02 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 상면 둔덕말길 232, 1층 | 경기도 가평군 상면 상동리 산 52 외 45필지, 1층 | 12443 | 37.797145 | 127.305438 |
4 | 가평군 | 파인티하우스 | 2005-11-02 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 상면 둔덕말길 232 (외 45필지) | 경기도 가평군 상면 상동리 산 52 외 45필지 | 12443 | 37.797145 | 127.305438 |
5 | 가평군 | HIM & I | 2004-08-17 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 청평면 상지로 212 | 경기도 가평군 청평면 상천리 1502-9 외 1필지 | 12449 | 37.768703 | 127.473102 |
6 | 가평군 | 아도니스 | 20150209 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 상면 수목원로 314-2 | 경기도 가평군 상면 행현리 602-3번지 | 12448 | 37.751668 | 127.358808 |
7 | 가평군 | 불나불나 | 20100903 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 조종면 현창로44번길 13 | 경기도 가평군 조종면 현리 262-23 | 12437 | 37.819777 | 127.348816 |
8 | 가평군 | 하겐나 | 20131112 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 설악면 한서로 96, 1층 | 경기도 가평군 설악면 창의리 429 1층 | 12464 | 37.67312 | 127.502325 |
9 | 가평군 | 아뜰리에 새봄 | 20140328 | 영업 | <NA> | <NA> | <NA> | 까페 | 경기도 가평군 가평읍 오리나무길 51, 지하1층 | 경기도 가평군 가평읍 대곡리 177-1 지하1층 | 12420 | 37.823226 | 127.514181 |
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 다중이용업소여부 | 총시설규모(㎡) | 위생업종명 | 위생업태명 | 소재지도로명주소 | 소재지지번주소 | 소재지우편번호 | WGS84위도 | WGS84경도 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
4742 | 화성시 | 벤치 | 20120718 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 삼성1로 160 (석우동, 31-2번지 디지털스테이션 108호) | 경기도 화성시 석우동 31-2 (디지털스테이션 108호) | 18450 | 37.21821 | 127.077881 |
4743 | 화성시 | 주전부리 | 20060822 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 효행로 1028 (진안동,(삼성프라자 108호)) | 경기도 화성시 진안동 877-1 (삼성프라자 108호) | 18404 | 37.212976 | 127.040075 |
4744 | 화성시 | 휴고 | 20070221 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 향남읍 발안남로55번길 26-3 | 경기도 화성시 향남읍 발안리 402 | 18594 | 37.130336 | 126.904477 |
4745 | 화성시 | 잠자리 | 20120620 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 동탄공원로1길 6-27 (반송동, 102호) | 경기도 화성시 반송동 71-3 102호 | 18436 | 37.201808 | 127.061339 |
4746 | 화성시 | 카페브라운 | 20121122 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 봉담읍 삼천병마로 1281, 1층 | 경기도 화성시 봉담읍 상리 27-2 1층 | 18313 | 37.220439 | 126.949035 |
4747 | 화성시 | 떼레노시떼 | 20130201 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 동학산2길 10 (석우동, (1층)) | 경기도 화성시 석우동 9-7 (1층) | 18450 | 37.224924 | 127.074992 |
4748 | 화성시 | 앤즈코너 (Ann's corner) | 20120705 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 삼성전자로 16 (석우동, 32-3 (107호)) | 경기도 화성시 석우동 32-3 (107호) | 18450 | 37.218855 | 127.079185 |
4749 | 화성시 | 인숙까페 | 20130711 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 매송면 화성로2239번길 4, 2층 | 경기도 화성시 매송면 어천리 429-8 2층 | 18287 | 37.249778 | 126.911206 |
4750 | 화성시 | 카페오울(cafe owl) | 20130610 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 노작로4길 22-20 (반송동) | 경기도 화성시 반송동 113-1 | 18459 | 37.198442 | 127.077675 |
4751 | 화성시 | 알토스푸드까페 | 20130530 | 폐업 | <NA> | <NA> | <NA> | 까페 | 경기도 화성시 향남읍 행정남로 99-18, 향남시범마을휴먼시아가상가동 104호 | 경기도 화성시 향남읍 행정리 465 외 1필지 향남시범마을휴먼시아가상가동 104호 | 18603 | 37.123954 | 126.917292 |