Dataset statistics
Number of variables | 14 |
---|---|
Number of observations | 10000 |
Missing cells | 23642 |
Missing cells (%) | 16.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.2 MiB |
Average record size in memory | 124.0 B |
Variable types
Categorical | 4 |
---|---|
Text | 3 |
DateTime | 2 |
Boolean | 1 |
Unsupported | 1 |
Numeric | 3 |
Dataset
Description | 휴게음식점(편의점) 현황 |
---|---|
Author | 행정안전부 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=CPMB3F3D1SDTN6V7LTWE13467194&infSeq=1 |
위생업태명 has constant value "" | Constant |
영업상태명 is highly overall correlated with 소재지우편번호 and 1 other fields | High correlation |
위생업종명 is highly overall correlated with 소재지우편번호 and 5 other fields | High correlation |
시군명 is highly overall correlated with WGS84위도 and 2 other fields | High correlation |
다중이용업소여부 is highly overall correlated with 위생업종명 | High correlation |
소재지우편번호 is highly overall correlated with 영업상태명 and 1 other fields | High correlation |
WGS84위도 is highly overall correlated with 시군명 and 1 other fields | High correlation |
WGS84경도 is highly overall correlated with 시군명 and 1 other fields | High correlation |
다중이용업소여부 is highly imbalanced (99.4%) | Imbalance |
폐업일자 has 7518 (75.2%) missing values | Missing |
다중이용업소여부 has 5744 (57.4%) missing values | Missing |
총시설규모(㎡) has 10000 (100.0%) missing values | Missing |
WGS84위도 has 113 (1.1%) missing values | Missing |
WGS84경도 has 113 (1.1%) missing values | Missing |
총시설규모(㎡) is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-05-10 21:21:05.714341 |
---|---|
Analysis finished | 2024-05-10 21:21:18.444816 |
Duration | 12.73 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군명
Categorical
HIGH CORRELATION
 
Distinct | 31 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
화성시 | |
---|---|
부천시 | |
용인시 | |
평택시 | |
수원시 | 640 |
Other values (26) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0857 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 의왕시 |
---|---|
2nd row | 부천시 |
3rd row | 성남시 |
4th row | 의정부시 |
5th row | 용인시 |
Common Values
Value | Count | Frequency (%) |
화성시 | 821 | 8.2% |
부천시 | 709 | 7.1% |
용인시 | 683 | 6.8% |
평택시 | 651 | 6.5% |
수원시 | 640 | 6.4% |
안산시 | 544 | 5.4% |
성남시 | 505 | 5.1% |
김포시 | 462 | 4.6% |
파주시 | 448 | 4.5% |
고양시 | 403 | 4.0% |
Other values (21) | 4134 |
Length
Value | Count | Frequency (%) |
화성시 | 821 | 8.2% |
부천시 | 709 | 7.1% |
용인시 | 683 | 6.8% |
평택시 | 651 | 6.5% |
수원시 | 640 | 6.4% |
안산시 | 544 | 5.4% |
성남시 | 505 | 5.1% |
김포시 | 462 | 4.6% |
파주시 | 448 | 4.5% |
고양시 | 403 | 4.0% |
Other values (21) | 4134 |
사업장명
Text
Distinct | 8883 |
---|---|
Distinct (%) | 88.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 28 |
---|---|
Median length | 26 |
Mean length | 10.5793 |
Min length | 2 |
Characters and Unicode
Total characters | 105793 |
---|---|
Distinct characters | 707 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 7882 ? |
---|---|
Unique (%) | 78.8% |
Sample
1st row | 지에스GS25포일대림점 |
---|---|
2nd row | 이마트24R부천심곡점 |
3rd row | 세븐일레븐성남모란본점 |
4th row | CU (녹양원룸점) |
5th row | 미니스톱 용인교동점 |
Value | Count | Frequency (%) |
세븐일레븐 | 1603 | 10.5% |
씨유 | 1047 | 6.8% |
gs25 | 742 | 4.8% |
지에스25 | 408 | 2.7% |
이마트24 | 394 | 2.6% |
미니스톱 | 300 | 2.0% |
지에스(gs)25 | 209 | 1.4% |
cu | 81 | 0.5% |
씨유(cu | 47 | 0.3% |
지에스25(gs25 | 46 | 0.3% |
Other values (8752) | 10455 |
Most occurring characters
Value | Count | Frequency (%) |
점 | 9184 | 8.7% |
5344 | 5.1% | |
븐 | 5120 | 4.8% |
2 | 3809 | 3.6% |
5 | 3050 | 2.9% |
일 | 2979 | 2.8% |
세 | 2690 | 2.5% |
스 | 2662 | 2.5% |
레 | 2654 | 2.5% |
유 | 2242 | 2.1% |
Other values (697) | 66059 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 84178 | |
Decimal Number | 7842 | 7.4% |
Uppercase Letter | 5858 | 5.5% |
Space Separator | 5344 | 5.1% |
Close Punctuation | 1205 | 1.1% |
Open Punctuation | 1204 | 1.1% |
Lowercase Letter | 141 | 0.1% |
Other Punctuation | 13 | < 0.1% |
Dash Punctuation | 4 | < 0.1% |
Math Symbol | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
점 | 9184 | 10.9% |
븐 | 5120 | 6.1% |
일 | 2979 | 3.5% |
세 | 2690 | 3.2% |
스 | 2662 | 3.2% |
레 | 2654 | 3.2% |
유 | 2242 | 2.7% |
씨 | 2176 | 2.6% |
지 | 1911 | 2.3% |
이 | 1568 | 1.9% |
Other values (633) | 50992 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 2209 | |
G | 2204 | |
C | 516 | 8.8% |
U | 446 | 7.6% |
R | 145 | 2.5% |
I | 74 | 1.3% |
L | 43 | 0.7% |
K | 33 | 0.6% |
T | 29 | 0.5% |
A | 21 | 0.4% |
Other values (15) | 138 | 2.4% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 23 | |
e | 15 | |
g | 15 | |
u | 14 | |
t | 13 | |
c | 12 | |
r | 8 | 5.7% |
a | 8 | 5.7% |
f | 5 | 3.5% |
i | 5 | 3.5% |
Other values (9) | 23 |
Decimal Number
Value | Count | Frequency (%) |
2 | 3809 | |
5 | 3050 | |
4 | 697 | 8.9% |
1 | 106 | 1.4% |
3 | 80 | 1.0% |
6 | 43 | 0.5% |
7 | 27 | 0.3% |
9 | 13 | 0.2% |
8 | 12 | 0.2% |
0 | 5 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 6 | |
& | 5 | |
, | 1 | 7.7% |
/ | 1 | 7.7% |
Math Symbol
Value | Count | Frequency (%) |
< | 2 | |
> | 2 |
Space Separator
Value | Count | Frequency (%) |
5344 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1205 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1204 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 84178 | |
Common | 15616 | 14.8% |
Latin | 5999 | 5.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
점 | 9184 | 10.9% |
븐 | 5120 | 6.1% |
일 | 2979 | 3.5% |
세 | 2690 | 3.2% |
스 | 2662 | 3.2% |
레 | 2654 | 3.2% |
유 | 2242 | 2.7% |
씨 | 2176 | 2.6% |
지 | 1911 | 2.3% |
이 | 1568 | 1.9% |
Other values (633) | 50992 |
Latin
Value | Count | Frequency (%) |
S | 2209 | |
G | 2204 | |
C | 516 | 8.6% |
U | 446 | 7.4% |
R | 145 | 2.4% |
I | 74 | 1.2% |
L | 43 | 0.7% |
K | 33 | 0.6% |
T | 29 | 0.5% |
s | 23 | 0.4% |
Other values (34) | 277 | 4.6% |
Common
Value | Count | Frequency (%) |
5344 | ||
2 | 3809 | |
5 | 3050 | |
) | 1205 | 7.7% |
( | 1204 | 7.7% |
4 | 697 | 4.5% |
1 | 106 | 0.7% |
3 | 80 | 0.5% |
6 | 43 | 0.3% |
7 | 27 | 0.2% |
Other values (10) | 51 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 84178 | |
ASCII | 21615 | 20.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
점 | 9184 | 10.9% |
븐 | 5120 | 6.1% |
일 | 2979 | 3.5% |
세 | 2690 | 3.2% |
스 | 2662 | 3.2% |
레 | 2654 | 3.2% |
유 | 2242 | 2.7% |
씨 | 2176 | 2.6% |
지 | 1911 | 2.3% |
이 | 1568 | 1.9% |
Other values (633) | 50992 |
ASCII
Value | Count | Frequency (%) |
5344 | ||
2 | 3809 | |
5 | 3050 | |
S | 2209 | |
G | 2204 | |
) | 1205 | 5.6% |
( | 1204 | 5.6% |
4 | 697 | 3.2% |
C | 516 | 2.4% |
U | 446 | 2.1% |
Other values (54) | 931 | 4.3% |
인허가일자
Date
Distinct | 3216 |
---|---|
Distinct (%) | 32.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 1988-05-09 00:00:00 |
---|---|
Maximum | 2024-04-30 00:00:00 |
영업상태명
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
영업 | |
---|---|
운영중 | |
폐업 | |
폐업 등 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.527 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 폐업 |
---|---|
2nd row | 영업 |
3rd row | 운영중 |
4th row | 운영중 |
5th row | 운영중 |
Common Values
Value | Count | Frequency (%) |
영업 | 4276 | |
운영중 | 3242 | |
폐업 | 1468 | 14.7% |
폐업 등 | 1014 | 10.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
영업 | 4276 | |
운영중 | 3242 | |
폐업 | 2482 | |
등 | 1014 | 9.2% |
폐업일자
Date
MISSING
 
Distinct | 1396 |
---|---|
Distinct (%) | 56.2% |
Missing | 7518 |
Missing (%) | 75.2% |
Memory size | 156.2 KiB |
Minimum | 1996-12-24 00:00:00 |
---|---|
Maximum | 2024-04-30 00:00:00 |
다중이용업소여부
Boolean
HIGH CORRELATION
  IMBALANCE
  MISSING
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 5744 |
Missing (%) | 57.4% |
Memory size | 97.7 KiB |
False | |
---|---|
True | 2 |
(Missing) |
Value | Count | Frequency (%) |
False | 4254 | |
True | 2 | < 0.1% |
(Missing) | 5744 |
총시설규모(㎡)
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 10000 |
---|---|
Missing (%) | 100.0% |
Memory size | 166.0 KiB |
위생업종명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
휴게음식점 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.4256 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 휴게음식점 |
4th row | 휴게음식점 |
5th row | 휴게음식점 |
Common Values
Value | Count | Frequency (%) |
<NA> | 5744 | |
휴게음식점 | 4256 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5744 | |
휴게음식점 | 4256 |
위생업태명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
편의점 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 편의점 |
---|---|
2nd row | 편의점 |
3rd row | 편의점 |
4th row | 편의점 |
5th row | 편의점 |
Common Values
Value | Count | Frequency (%) |
편의점 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
편의점 | 10000 |
소재지도로명주소
Text
Distinct | 8949 |
---|---|
Distinct (%) | 90.2% |
Missing | 75 |
Missing (%) | 0.8% |
Memory size | 156.2 KiB |
Length
Max length | 79 |
---|---|
Median length | 65 |
Mean length | 34.270529 |
Min length | 13 |
Characters and Unicode
Total characters | 340135 |
---|---|
Distinct characters | 695 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 8004 ? |
---|---|
Unique (%) | 80.6% |
Sample
1st row | 경기도 의왕시 내손로 59, 의왕내손이편한세상 상가동 1층 103호 (내손동) |
---|---|
2nd row | 경기도 부천시 성주로 158, 상가동 지하3층 102호 일부호 (심곡본동, e편한세상 부천심곡) |
3rd row | 경기도 성남시 중원구 둔촌대로101번길 6, 1층 (성남동) |
4th row | 경기도 의정부시 녹양로103번길 36, 지상1층 (녹양동) |
5th row | 경기도 용인시 기흥구 마북로 126 (마북동,1층) |
Value | Count | Frequency (%) |
경기도 | 9925 | 13.7% |
1층 | 5402 | 7.4% |
일부호 | 1268 | 1.7% |
일부 | 1011 | 1.4% |
화성시 | 819 | 1.1% |
부천시 | 707 | 1.0% |
용인시 | 677 | 0.9% |
평택시 | 649 | 0.9% |
수원시 | 631 | 0.9% |
상가동 | 616 | 0.8% |
Other values (11010) | 50829 |
Most occurring characters
Value | Count | Frequency (%) |
62653 | 18.4% | |
1 | 20376 | 6.0% |
시 | 10726 | 3.2% |
동 | 10619 | 3.1% |
, | 10537 | 3.1% |
기 | 10469 | 3.1% |
도 | 10368 | 3.0% |
경 | 10365 | 3.0% |
로 | 9190 | 2.7% |
) | 8015 | 2.4% |
Other values (685) | 176817 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 191236 | |
Space Separator | 62653 | 18.4% |
Decimal Number | 56341 | 16.6% |
Other Punctuation | 10612 | 3.1% |
Close Punctuation | 8015 | 2.4% |
Open Punctuation | 8015 | 2.4% |
Dash Punctuation | 1770 | 0.5% |
Uppercase Letter | 1256 | 0.4% |
Lowercase Letter | 156 | < 0.1% |
Math Symbol | 66 | < 0.1% |
Other values (2) | 15 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 10726 | 5.6% |
동 | 10619 | 5.6% |
기 | 10469 | 5.5% |
도 | 10368 | 5.4% |
경 | 10365 | 5.4% |
로 | 9190 | 4.8% |
층 | 6661 | 3.5% |
호 | 5742 | 3.0% |
부 | 5043 | 2.6% |
일 | 4089 | 2.1% |
Other values (610) | 107964 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 257 | |
A | 180 | |
S | 100 | 8.0% |
I | 82 | 6.5% |
G | 75 | 6.0% |
C | 74 | 5.9% |
E | 64 | 5.1% |
T | 51 | 4.1% |
R | 48 | 3.8% |
L | 47 | 3.7% |
Other values (16) | 278 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 59 | |
c | 11 | 7.1% |
r | 10 | 6.4% |
t | 9 | 5.8% |
a | 9 | 5.8% |
l | 7 | 4.5% |
n | 7 | 4.5% |
s | 7 | 4.5% |
i | 6 | 3.8% |
o | 6 | 3.8% |
Other values (11) | 25 |
Decimal Number
Value | Count | Frequency (%) |
1 | 20376 | |
2 | 6532 | 11.6% |
0 | 6252 | 11.1% |
3 | 4608 | 8.2% |
4 | 3926 | 7.0% |
5 | 3589 | 6.4% |
6 | 3064 | 5.4% |
7 | 2913 | 5.2% |
8 | 2616 | 4.6% |
9 | 2465 | 4.4% |
Other Punctuation
Value | Count | Frequency (%) |
, | 10537 | |
. | 55 | 0.5% |
@ | 10 | 0.1% |
& | 6 | 0.1% |
: | 1 | < 0.1% |
· | 1 | < 0.1% |
' | 1 | < 0.1% |
/ | 1 | < 0.1% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 8 | |
Ⅰ | 5 | |
Ⅲ | 1 | 7.1% |
Math Symbol
Value | Count | Frequency (%) |
~ | 63 | |
+ | 3 | 4.5% |
Space Separator
Value | Count | Frequency (%) |
62653 |
Close Punctuation
Value | Count | Frequency (%) |
) | 8015 |
Open Punctuation
Value | Count | Frequency (%) |
( | 8015 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1770 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 191233 | |
Common | 147473 | |
Latin | 1426 | 0.4% |
Han | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 10726 | 5.6% |
동 | 10619 | 5.6% |
기 | 10469 | 5.5% |
도 | 10368 | 5.4% |
경 | 10365 | 5.4% |
로 | 9190 | 4.8% |
층 | 6661 | 3.5% |
호 | 5742 | 3.0% |
부 | 5043 | 2.6% |
일 | 4089 | 2.1% |
Other values (607) | 107961 |
Latin
Value | Count | Frequency (%) |
B | 257 | |
A | 180 | |
S | 100 | 7.0% |
I | 82 | 5.8% |
G | 75 | 5.3% |
C | 74 | 5.2% |
E | 64 | 4.5% |
e | 59 | 4.1% |
T | 51 | 3.6% |
R | 48 | 3.4% |
Other values (40) | 436 |
Common
Value | Count | Frequency (%) |
62653 | ||
1 | 20376 | 13.8% |
, | 10537 | 7.1% |
) | 8015 | 5.4% |
( | 8015 | 5.4% |
2 | 6532 | 4.4% |
0 | 6252 | 4.2% |
3 | 4608 | 3.1% |
4 | 3926 | 2.7% |
5 | 3589 | 2.4% |
Other values (15) | 12970 | 8.8% |
Han
Value | Count | Frequency (%) |
家 | 1 | |
苑 | 1 | |
美 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 191233 | |
ASCII | 148884 | |
Number Forms | 14 | < 0.1% |
CJK | 3 | < 0.1% |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
62653 | ||
1 | 20376 | 13.7% |
, | 10537 | 7.1% |
) | 8015 | 5.4% |
( | 8015 | 5.4% |
2 | 6532 | 4.4% |
0 | 6252 | 4.2% |
3 | 4608 | 3.1% |
4 | 3926 | 2.6% |
5 | 3589 | 2.4% |
Other values (61) | 14381 | 9.7% |
Hangul
Value | Count | Frequency (%) |
시 | 10726 | 5.6% |
동 | 10619 | 5.6% |
기 | 10469 | 5.5% |
도 | 10368 | 5.4% |
경 | 10365 | 5.4% |
로 | 9190 | 4.8% |
층 | 6661 | 3.5% |
호 | 5742 | 3.0% |
부 | 5043 | 2.6% |
일 | 4089 | 2.1% |
Other values (607) | 107961 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 8 | |
Ⅰ | 5 | |
Ⅲ | 1 | 7.1% |
CJK
Value | Count | Frequency (%) |
家 | 1 | |
苑 | 1 | |
美 | 1 |
None
Value | Count | Frequency (%) |
· | 1 |
소재지지번주소
Text
Distinct | 9798 |
---|---|
Distinct (%) | 98.0% |
Missing | 2 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 69 |
---|---|
Median length | 57 |
Mean length | 27.803661 |
Min length | 14 |
Characters and Unicode
Total characters | 277981 |
---|---|
Distinct characters | 661 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 9605 ? |
---|---|
Unique (%) | 96.1% |
Sample
1st row | 경기도 의왕시 내손동 846 의왕내손이편한세상 |
---|---|
2nd row | 경기도 부천시 심곡본동 820-2 e편한세상 부천심곡, 상가동 지하3층 102호 일부 |
3rd row | 경기도 성남시 중원구 성남동 4121번지 1층 |
4th row | 경기도 의정부시 녹양동 375-8번지 지상1층 |
5th row | 경기도 용인시 기흥구 마북동 168-6번지 1층 |
Value | Count | Frequency (%) |
경기도 | 9998 | 16.6% |
1층 | 2710 | 4.5% |
일부 | 1147 | 1.9% |
화성시 | 821 | 1.4% |
부천시 | 709 | 1.2% |
용인시 | 683 | 1.1% |
평택시 | 651 | 1.1% |
수원시 | 640 | 1.1% |
안산시 | 544 | 0.9% |
성남시 | 505 | 0.8% |
Other values (12985) | 41731 |
Most occurring characters
Value | Count | Frequency (%) |
55109 | ||
1 | 15873 | 5.7% |
시 | 10570 | 3.8% |
기 | 10392 | 3.7% |
도 | 10349 | 3.7% |
경 | 10091 | 3.6% |
동 | 9677 | 3.5% |
- | 7427 | 2.7% |
지 | 5906 | 2.1% |
2 | 5831 | 2.1% |
Other values (651) | 136756 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 158104 | |
Space Separator | 55109 | 19.8% |
Decimal Number | 54327 | 19.5% |
Dash Punctuation | 7427 | 2.7% |
Uppercase Letter | 995 | 0.4% |
Other Punctuation | 776 | 0.3% |
Open Punctuation | 533 | 0.2% |
Close Punctuation | 533 | 0.2% |
Lowercase Letter | 123 | < 0.1% |
Math Symbol | 40 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 10570 | 6.7% |
기 | 10392 | 6.6% |
도 | 10349 | 6.5% |
경 | 10091 | 6.4% |
동 | 9677 | 6.1% |
지 | 5906 | 3.7% |
번 | 4280 | 2.7% |
구 | 3851 | 2.4% |
부 | 3763 | 2.4% |
층 | 3674 | 2.3% |
Other values (580) | 85551 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 174 | |
A | 128 | |
S | 91 | 9.1% |
I | 70 | 7.0% |
G | 64 | 6.4% |
E | 54 | 5.4% |
C | 50 | 5.0% |
L | 41 | 4.1% |
T | 39 | 3.9% |
R | 38 | 3.8% |
Other values (16) | 246 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 52 | |
c | 9 | 7.3% |
r | 9 | 7.3% |
n | 7 | 5.7% |
i | 6 | 4.9% |
a | 6 | 4.9% |
t | 6 | 4.9% |
l | 4 | 3.3% |
d | 4 | 3.3% |
h | 3 | 2.4% |
Other values (9) | 17 | 13.8% |
Decimal Number
Value | Count | Frequency (%) |
1 | 15873 | |
2 | 5831 | 10.7% |
0 | 5342 | 9.8% |
3 | 4743 | 8.7% |
4 | 4375 | 8.1% |
5 | 4356 | 8.0% |
6 | 3978 | 7.3% |
7 | 3550 | 6.5% |
8 | 3237 | 6.0% |
9 | 3042 | 5.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 714 | |
. | 42 | 5.4% |
@ | 11 | 1.4% |
& | 6 | 0.8% |
# | 1 | 0.1% |
/ | 1 | 0.1% |
' | 1 | 0.1% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 8 | |
Ⅰ | 5 | |
Ⅲ | 1 | 7.1% |
Math Symbol
Value | Count | Frequency (%) |
~ | 37 | |
+ | 3 | 7.5% |
Space Separator
Value | Count | Frequency (%) |
55109 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 7427 |
Open Punctuation
Value | Count | Frequency (%) |
( | 533 |
Close Punctuation
Value | Count | Frequency (%) |
) | 533 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 158100 | |
Common | 118745 | |
Latin | 1132 | 0.4% |
Han | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 10570 | 6.7% |
기 | 10392 | 6.6% |
도 | 10349 | 6.5% |
경 | 10091 | 6.4% |
동 | 9677 | 6.1% |
지 | 5906 | 3.7% |
번 | 4280 | 2.7% |
구 | 3851 | 2.4% |
부 | 3763 | 2.4% |
층 | 3674 | 2.3% |
Other values (576) | 85547 |
Latin
Value | Count | Frequency (%) |
B | 174 | |
A | 128 | 11.3% |
S | 91 | 8.0% |
I | 70 | 6.2% |
G | 64 | 5.7% |
E | 54 | 4.8% |
e | 52 | 4.6% |
C | 50 | 4.4% |
L | 41 | 3.6% |
T | 39 | 3.4% |
Other values (38) | 369 |
Common
Value | Count | Frequency (%) |
55109 | ||
1 | 15873 | 13.4% |
- | 7427 | 6.3% |
2 | 5831 | 4.9% |
0 | 5342 | 4.5% |
3 | 4743 | 4.0% |
4 | 4375 | 3.7% |
5 | 4356 | 3.7% |
6 | 3978 | 3.4% |
7 | 3550 | 3.0% |
Other values (13) | 8161 | 6.9% |
Han
Value | Count | Frequency (%) |
家 | 1 | |
內 | 1 | |
苑 | 1 | |
美 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 158098 | |
ASCII | 119863 | |
Number Forms | 14 | < 0.1% |
CJK | 4 | < 0.1% |
Compat Jamo | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
55109 | ||
1 | 15873 | 13.2% |
- | 7427 | 6.2% |
2 | 5831 | 4.9% |
0 | 5342 | 4.5% |
3 | 4743 | 4.0% |
4 | 4375 | 3.7% |
5 | 4356 | 3.6% |
6 | 3978 | 3.3% |
7 | 3550 | 3.0% |
Other values (58) | 9279 | 7.7% |
Hangul
Value | Count | Frequency (%) |
시 | 10570 | 6.7% |
기 | 10392 | 6.6% |
도 | 10349 | 6.5% |
경 | 10091 | 6.4% |
동 | 9677 | 6.1% |
지 | 5906 | 3.7% |
번 | 4280 | 2.7% |
구 | 3851 | 2.4% |
부 | 3763 | 2.4% |
층 | 3674 | 2.3% |
Other values (574) | 85545 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 8 | |
Ⅰ | 5 | |
Ⅲ | 1 | 7.1% |
CJK
Value | Count | Frequency (%) |
家 | 1 | |
內 | 1 | |
苑 | 1 | |
美 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㄷ | 1 | |
ㅁ | 1 |
소재지우편번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 4293 |
---|---|
Distinct (%) | 43.3% |
Missing | 77 |
Missing (%) | 0.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 192277.55 |
Minimum | 10003 |
---|---|
Maximum | 487915 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 10003 |
---|---|
5-th percentile | 10826 |
Q1 | 14087 |
median | 17767 |
Q3 | 445235 |
95-th percentile | 477811.2 |
Maximum | 487915 |
Range | 477912 |
Interquartile range (IQR) | 431148 |
Descriptive statistics
Standard deviation | 214103.55 |
---|---|
Coefficient of variation (CV) | 1.113513 |
Kurtosis | -1.8368333 |
Mean | 192277.55 |
Median Absolute Deviation (MAD) | 6419 |
Skewness | 0.38213649 |
Sum | 1.9079702 × 109 |
Variance | 4.584033 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
415060 | 41 | 0.4% |
10071 | 24 | 0.2% |
447140 | 23 | 0.2% |
445160 | 19 | 0.2% |
483030 | 19 | 0.2% |
472501 | 19 | 0.2% |
415080 | 19 | 0.2% |
429856 | 18 | 0.2% |
14786 | 18 | 0.2% |
459813 | 17 | 0.2% |
Other values (4283) | 9706 | |
(Missing) | 77 | 0.8% |
Value | Count | Frequency (%) |
10003 | 1 | < 0.1% |
10008 | 1 | < 0.1% |
10009 | 1 | < 0.1% |
10010 | 3 | |
10011 | 5 | |
10012 | 2 | < 0.1% |
10014 | 1 | < 0.1% |
10016 | 1 | < 0.1% |
10017 | 3 | |
10018 | 1 | < 0.1% |
Value | Count | Frequency (%) |
487915 | 2 | < 0.1% |
487914 | 4 | |
487913 | 5 | |
487911 | 1 | < 0.1% |
487899 | 1 | < 0.1% |
487896 | 2 | < 0.1% |
487892 | 6 | |
487883 | 2 | < 0.1% |
487882 | 1 | < 0.1% |
487878 | 2 | < 0.1% |
WGS84위도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 7964 |
---|---|
Distinct (%) | 80.6% |
Missing | 113 |
Missing (%) | 1.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 37.422109 |
Minimum | 36.928476 |
---|---|
Maximum | 38.185874 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 36.928476 |
---|---|
5-th percentile | 37.017492 |
Q1 | 37.259372 |
median | 37.38883 |
Q3 | 37.634203 |
95-th percentile | 37.824844 |
Maximum | 38.185874 |
Range | 1.2573975 |
Interquartile range (IQR) | 0.37483188 |
Descriptive statistics
Standard deviation | 0.23945902 |
---|---|
Coefficient of variation (CV) | 0.006398865 |
Kurtosis | -0.63611399 |
Mean | 37.422109 |
Median Absolute Deviation (MAD) | 0.16206488 |
Skewness | 0.23536967 |
Sum | 369992.39 |
Variance | 0.057340624 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
37.4017965187 | 6 | 0.1% |
37.3970275535 | 6 | 0.1% |
37.3039712756 | 6 | 0.1% |
37.393257409 | 5 | 0.1% |
37.4811539491 | 5 | 0.1% |
37.7319945034 | 5 | 0.1% |
37.5000449964 | 5 | 0.1% |
37.3509798931 | 4 | < 0.1% |
37.487843769 | 4 | < 0.1% |
37.7468858429 | 4 | < 0.1% |
Other values (7954) | 9837 | |
(Missing) | 113 | 1.1% |
Value | Count | Frequency (%) |
36.9284762331 | 1 | |
36.9390963076 | 1 | |
36.9445891982 | 1 | |
36.9448447964 | 1 | |
36.9449600423 | 1 | |
36.945223949 | 1 | |
36.945845635 | 1 | |
36.9494769474 | 1 | |
36.9522591921 | 2 | |
36.9527499579 | 1 |
Value | Count | Frequency (%) |
38.1858737821 | 1 | < 0.1% |
38.1416766138 | 1 | < 0.1% |
38.1334276678 | 1 | < 0.1% |
38.122598679 | 2 | |
38.1084726669 | 1 | < 0.1% |
38.1056939412 | 2 | |
38.1005066857 | 1 | < 0.1% |
38.1002521779 | 1 | < 0.1% |
38.0914319891 | 1 | < 0.1% |
38.0910958227 | 3 |
WGS84경도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 7964 |
---|---|
Distinct (%) | 80.6% |
Missing | 113 |
Missing (%) | 1.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 127.00764 |
Minimum | 126.5324 |
---|---|
Maximum | 127.75406 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 126.5324 |
---|---|
5-th percentile | 126.70858 |
Q1 | 126.82498 |
median | 127.03344 |
Q3 | 127.13582 |
95-th percentile | 127.36713 |
Maximum | 127.75406 |
Range | 1.221653 |
Interquartile range (IQR) | 0.31084165 |
Descriptive statistics
Standard deviation | 0.20811597 |
---|---|
Coefficient of variation (CV) | 0.0016386099 |
Kurtosis | 0.043115943 |
Mean | 127.00764 |
Median Absolute Deviation (MAD) | 0.15432975 |
Skewness | 0.37700691 |
Sum | 1255724.5 |
Variance | 0.043312258 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
126.9910176434 | 6 | 0.1% |
126.9743742407 | 6 | 0.1% |
127.1046527186 | 6 | 0.1% |
126.9347696759 | 5 | 0.1% |
126.7813152457 | 5 | 0.1% |
126.7466453308 | 5 | 0.1% |
126.7811115921 | 5 | 0.1% |
127.1104696178 | 4 | < 0.1% |
126.7830949203 | 4 | < 0.1% |
127.0461782874 | 4 | < 0.1% |
Other values (7954) | 9837 | |
(Missing) | 113 | 1.1% |
Value | Count | Frequency (%) |
126.53240288 | 1 | < 0.1% |
126.5367878817 | 1 | < 0.1% |
126.5434441568 | 1 | < 0.1% |
126.5485079113 | 1 | < 0.1% |
126.5507752527 | 1 | < 0.1% |
126.5513354228 | 1 | < 0.1% |
126.5516304184 | 1 | < 0.1% |
126.5541379101 | 1 | < 0.1% |
126.5541581093 | 3 | |
126.5542252238 | 1 | < 0.1% |
Value | Count | Frequency (%) |
127.7540559028 | 1 | |
127.7105943188 | 1 | |
127.6642792342 | 2 | |
127.6628124288 | 1 | |
127.6621119016 | 2 | |
127.6594616227 | 1 | |
127.6552913078 | 1 | |
127.6531572174 | 2 | |
127.6507481685 | 1 | |
127.6482480426 | 1 |
시군명 | 영업상태명 | 다중이용업소여부 | 소재지우편번호 | WGS84위도 | WGS84경도 | |
---|---|---|---|---|---|---|
시군명 | 1.000 | 0.239 | 0.000 | 0.720 | 0.951 | 0.932 |
영업상태명 | 0.239 | 1.000 | 0.000 | 0.654 | 0.141 | 0.103 |
다중이용업소여부 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
소재지우편번호 | 0.720 | 0.654 | 0.000 | 1.000 | 0.417 | 0.531 |
WGS84위도 | 0.951 | 0.141 | 0.000 | 0.417 | 1.000 | 0.623 |
WGS84경도 | 0.932 | 0.103 | 0.000 | 0.531 | 0.623 | 1.000 |
영업상태명 | 위생업종명 | 시군명 | 다중이용업소여부 | |
---|---|---|---|---|
영업상태명 | 1.000 | 1.000 | 0.126 | 0.000 |
위생업종명 | 1.000 | 1.000 | 1.000 | 1.000 |
시군명 | 0.126 | 1.000 | 1.000 | 0.000 |
다중이용업소여부 | 0.000 | 1.000 | 0.000 | 1.000 |
소재지우편번호 | WGS84위도 | WGS84경도 | 시군명 | 영업상태명 | 다중이용업소여부 | 위생업종명 | |
---|---|---|---|---|---|---|---|
소재지우편번호 | 1.000 | -0.317 | 0.265 | 0.496 | 0.680 | 0.000 | 1.000 |
WGS84위도 | -0.317 | 1.000 | -0.195 | 0.736 | 0.084 | 0.000 | 1.000 |
WGS84경도 | 0.265 | -0.195 | 1.000 | 0.677 | 0.062 | 0.000 | 1.000 |
시군명 | 0.496 | 0.736 | 0.677 | 1.000 | 0.126 | 0.000 | 1.000 |
영업상태명 | 0.680 | 0.084 | 0.062 | 0.126 | 1.000 | 0.000 | 1.000 |
다중이용업소여부 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 |
위생업종명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 폐업일자 | 다중이용업소여부 | 총시설규모(㎡) | 위생업종명 | 위생업태명 | 소재지도로명주소 | 소재지지번주소 | 소재지우편번호 | WGS84위도 | WGS84경도 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8613 | 의왕시 | 지에스GS25포일대림점 | 20190627 | 폐업 | 20211221 | <NA> | <NA> | <NA> | 편의점 | 경기도 의왕시 내손로 59, 의왕내손이편한세상 상가동 1층 103호 (내손동) | 경기도 의왕시 내손동 846 의왕내손이편한세상 | 16025 | 37.386335 | 126.977985 |
2826 | 부천시 | 이마트24R부천심곡점 | 20210804 | 영업 | <NA> | <NA> | <NA> | <NA> | 편의점 | 경기도 부천시 성주로 158, 상가동 지하3층 102호 일부호 (심곡본동, e편한세상 부천심곡) | 경기도 부천시 심곡본동 820-2 e편한세상 부천심곡, 상가동 지하3층 102호 일부 | 14747 | 37.478428 | 126.773345 |
3861 | 성남시 | 세븐일레븐성남모란본점 | 20170405 | 운영중 | <NA> | N | <NA> | 휴게음식점 | 편의점 | 경기도 성남시 중원구 둔촌대로101번길 6, 1층 (성남동) | 경기도 성남시 중원구 성남동 4121번지 1층 | 462829 | 37.430329 | 127.130427 |
8784 | 의정부시 | CU (녹양원룸점) | 20160322 | 운영중 | <NA> | N | <NA> | 휴게음식점 | 편의점 | 경기도 의정부시 녹양로103번길 36, 지상1층 (녹양동) | 경기도 의정부시 녹양동 375-8번지 지상1층 | 480826 | 37.759993 | 127.032929 |
8133 | 용인시 | 미니스톱 용인교동점 | 20090601 | 운영중 | <NA> | N | <NA> | 휴게음식점 | 편의점 | 경기도 용인시 기흥구 마북로 126 (마북동,1층) | 경기도 용인시 기흥구 마북동 168-6번지 1층 | 446506 | 37.301584 | 127.121715 |
9144 | 이천시 | CU 이천신하점 | 20190109 | 영업 | <NA> | <NA> | <NA> | <NA> | 편의점 | 경기도 이천시 부발읍 경충대로2265번길 27 | 경기도 이천시 부발읍 신하리 397-4 | 17328 | 37.260352 | 127.473836 |
11839 | 화성시 | 씨유(CU) 화성무하로점 | 20160317 | 운영중 | <NA> | N | <NA> | 휴게음식점 | 편의점 | 경기도 화성시 팔탄면 무하로 168, 1층 | 경기도 화성시 팔탄면 하저리 933-5번지 1층 | 445958 | 37.184175 | 126.860905 |
6095 | 안산시 | 로얄식품스타프라자점 | 19900504 | 폐업 등 | 20000920 | N | <NA> | 휴게음식점 | 편의점 | <NA> | 경기도 안산시 상록구 성포동 583번지 지층 38호 | 426837 | 37.322432 | 126.844737 |
9998 | 평택시 | 세븐일레븐 평택청북부영점 | 20220125 | 영업 | <NA> | <NA> | <NA> | <NA> | 편의점 | 경기도 평택시 청북읍 청북남로 277, 101호 (부영사랑으로) | 경기도 평택시 청북읍 옥길리 1104 부영사랑으로 101호 | 17809 | 37.017795 | 126.913877 |
6748 | 안양시 | 씨유안양관양중앙점 | 20190213 | 폐업 | 20210511 | <NA> | <NA> | <NA> | 편의점 | 경기도 안양시 동안구 관악대로389번길 8, 일부 1층 (관양동) | 경기도 안양시 동안구 관양동 1433-14 일층 일부 | 13939 | 37.405274 | 126.96608 |
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 폐업일자 | 다중이용업소여부 | 총시설규모(㎡) | 위생업종명 | 위생업태명 | 소재지도로명주소 | 소재지지번주소 | 소재지우편번호 | WGS84위도 | WGS84경도 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8933 | 의정부시 | 세븐일레븐 의정부본점 | 20160415 | 운영중 | <NA> | N | <NA> | 휴게음식점 | 편의점 | 경기도 의정부시 시민로 83, 109호 (의정부동) | 경기도 의정부시 의정부동 442-12번지 광장타워 | 480810 | 37.738822 | 127.044502 |
3490 | 부천시 | (주)웅진플레이도시 세븐일레븐 | 2014-05-16 | 폐업 | 2018-10-08 | <NA> | <NA> | <NA> | 편의점 | 경기도 부천시 원미구 조마루로 2 (상동, 부천체육문화센타 스포츠센타동 FF109호일부,FF110일부) | 경기도 부천시 원미구 상동 572-1 부천체육문화센타 스포츠센타동 FF109호일부,FF110일부 | 14592 | 37.498867 | 126.745385 |
4121 | 성남시 | 씨유 성남SK테크노점 | 20110126 | 폐업 등 | 20141015 | N | <NA> | 휴게음식점 | 편의점 | 경기도 성남시 중원구 사기막골로 124, 비즈센터동 113호 (상대원동) | 경기도 성남시 중원구 상대원동 190-1번지 비즈센터동 113호 | 462807 | 37.439518 | 127.177916 |
8407 | 용인시 | 미니스톱 수지풍덕천점 | 20070831 | 폐업 등 | 20100616 | N | <NA> | 휴게음식점 | 편의점 | 경기도 용인시 수지구 수지로296번길 51-7 | 경기도 용인시 수지구 풍덕천동 1080-15번지 가람빌딩 103호 | 448509 | 37.321875 | 127.094751 |
6569 | 안양시 | 세븐일레븐 안양미도점 | 20170410 | 영업 | <NA> | <NA> | <NA> | <NA> | 편의점 | 경기도 안양시 만안구 안양로 29, 지상1층 (안양동) | 경기도 안양시 만안구 안양동 371-6 지상1층 | 14096 | 37.378646 | 126.938562 |
9085 | 이천시 | 씨유이천백사점 | 20151204 | 영업 | <NA> | <NA> | <NA> | <NA> | 편의점 | 경기도 이천시 백사면 청백리로 77, 1층 | 경기도 이천시 백사면 모전리 533-1 (1층) | 17316 | 37.304033 | 127.470142 |
223 | 고양시 | 세븐일레븐행신역점 | 2019-03-04 | 영업 | <NA> | <NA> | <NA> | <NA> | 편의점 | 경기도 고양시 덕양구 용현로5번길 24, 백산오피스텔 108(일부)호 (행신동) | 경기도 고양시 덕양구 행신동 763-2 외1필지 백산오피스텔 108호일부 | 10526 | 37.613533 | 126.834996 |
5231 | 시흥시 | 씨유 시화라성점 | 20130304 | 운영중 | <NA> | N | <NA> | 휴게음식점 | 편의점 | 경기도 시흥시 산기대학로 29 | 경기도 시흥시 정왕동 2164-8번지 101호 | 429450 | 37.351036 | 126.714993 |
2046 | 김포시 | 씨유김포고촌점 | 20110405 | 폐업 등 | 20121231 | N | <NA> | 휴게음식점 | 편의점 | 경기도 김포시 고촌읍 장차로 4, 1층 | 경기도 김포시 고촌읍 신곡리 532-84번지 1층 | 415811 | 37.602405 | 126.769977 |
8085 | 용인시 | 세븐일레븐용인풍덕천사거리점 | 20180207 | 운영중 | <NA> | N | <NA> | 휴게음식점 | 편의점 | 경기도 용인시 수지구 풍덕천로190번길 25, 신건프라자 103호 일부호 (풍덕천동) | 경기도 용인시 수지구 풍덕천동 945번지 신건프라자 103호 | 448854 | 37.324309 | 127.102548 |