Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 977 |
Missing cells | 1953 |
Missing cells (%) | 33.3% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 46.9 KiB |
Average record size in memory | 49.1 B |
Variable types
Categorical | 2 |
---|---|
Text | 3 |
Unsupported | 1 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15178/S/1/datasetView.do |
Unnamed: 5 has constant value "" | Constant |
Unnamed: 4 has 977 (100.0%) missing values | Missing |
Unnamed: 5 has 976 (99.9%) missing values | Missing |
주소 has unique values | Unique |
Unnamed: 4 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 09:56:53.404763 |
---|---|
Analysis finished | 2023-12-11 09:56:53.996035 |
Duration | 0.59 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
브랜드명
Categorical
Distinct | 6 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.8 KiB |
GS25 | |
---|---|
CU | |
세븐일레븐 | |
미니스톱 | |
씨스페이스 | 10 |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 3.7533265 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | CU |
---|---|
2nd row | CU |
3rd row | CU |
4th row | CU |
5th row | CU |
Common Values
Value | Count | Frequency (%) |
GS25 | 313 | |
CU | 252 | |
세븐일레븐 | 251 | |
미니스톱 | 150 | |
씨스페이스 | 10 | 1.0% |
CU(신규) | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
gs25 | 313 | |
cu | 252 | |
세븐일레븐 | 251 | |
미니스톱 | 150 | |
씨스페이스 | 10 | 1.0% |
cu(신규 | 1 | 0.1% |
자치구
Categorical
Distinct | 24 |
---|---|
Distinct (%) | 2.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.8 KiB |
강남구 | |
---|---|
송파구 | |
서초구 | 59 |
동대문구 | 50 |
마포구 | 47 |
Other values (19) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0747185 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 중구 |
---|---|
2nd row | 중구 |
3rd row | 중구 |
4th row | 중구 |
5th row | 중구 |
Common Values
Value | Count | Frequency (%) |
강남구 | 146 | 14.9% |
송파구 | 63 | 6.4% |
서초구 | 59 | 6.0% |
동대문구 | 50 | 5.1% |
마포구 | 47 | 4.8% |
강동구 | 47 | 4.8% |
성북구 | 42 | 4.3% |
관악구 | 42 | 4.3% |
영등포구 | 39 | 4.0% |
구로구 | 37 | 3.8% |
Other values (14) | 405 |
Length
Value | Count | Frequency (%) |
강남구 | 146 | 14.9% |
송파구 | 63 | 6.4% |
서초구 | 59 | 6.0% |
동대문구 | 50 | 5.1% |
마포구 | 47 | 4.8% |
강동구 | 47 | 4.8% |
성북구 | 42 | 4.3% |
관악구 | 42 | 4.3% |
영등포구 | 39 | 4.0% |
구로구 | 37 | 3.8% |
Other values (14) | 405 |
점포명
Text
Distinct | 966 |
---|---|
Distinct (%) | 98.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.8 KiB |
Value | Count | Frequency (%) |
세븐일레븐 | 45 | 4.3% |
b | 16 | 1.5% |
대방점 | 2 | 0.2% |
동부이촌점 | 2 | 0.2% |
문정공원점 | 2 | 0.2% |
개포사랑 | 2 | 0.2% |
구일역점 | 2 | 0.2% |
장위점 | 2 | 0.2% |
역삼타운점 | 2 | 0.2% |
장안햇살 | 2 | 0.2% |
Other values (961) | 967 |
Most occurring characters
Value | Count | Frequency (%) |
점 | 706 | 12.8% |
동 | 165 | 3.0% |
대 | 124 | 2.2% |
역 | 98 | 1.8% |
븐 | 91 | 1.6% |
일 | 79 | 1.4% |
신 | 78 | 1.4% |
성 | 77 | 1.4% |
삼 | 77 | 1.4% |
74 | 1.3% | |
Other values (367) | 3951 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5126 | |
Decimal Number | 148 | 2.7% |
Space Separator | 74 | 1.3% |
Open Punctuation | 62 | 1.1% |
Close Punctuation | 62 | 1.1% |
Uppercase Letter | 47 | 0.9% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
점 | 706 | 13.8% |
동 | 165 | 3.2% |
대 | 124 | 2.4% |
역 | 98 | 1.9% |
븐 | 91 | 1.8% |
일 | 79 | 1.5% |
신 | 78 | 1.5% |
성 | 77 | 1.5% |
삼 | 77 | 1.5% |
로 | 69 | 1.3% |
Other values (336) | 3562 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 17 | |
C | 4 | 8.5% |
K | 3 | 6.4% |
I | 3 | 6.4% |
T | 2 | 4.3% |
N | 2 | 4.3% |
L | 2 | 4.3% |
G | 2 | 4.3% |
E | 2 | 4.3% |
M | 2 | 4.3% |
Other values (7) | 8 |
Decimal Number
Value | Count | Frequency (%) |
2 | 47 | |
1 | 35 | |
3 | 32 | |
4 | 13 | 8.8% |
5 | 7 | 4.7% |
8 | 4 | 2.7% |
7 | 3 | 2.0% |
6 | 3 | 2.0% |
9 | 2 | 1.4% |
0 | 2 | 1.4% |
Space Separator
Value | Count | Frequency (%) |
74 |
Open Punctuation
Value | Count | Frequency (%) |
( | 62 |
Close Punctuation
Value | Count | Frequency (%) |
) | 62 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5126 | |
Common | 347 | 6.3% |
Latin | 47 | 0.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
점 | 706 | 13.8% |
동 | 165 | 3.2% |
대 | 124 | 2.4% |
역 | 98 | 1.9% |
븐 | 91 | 1.8% |
일 | 79 | 1.5% |
신 | 78 | 1.5% |
성 | 77 | 1.5% |
삼 | 77 | 1.5% |
로 | 69 | 1.3% |
Other values (336) | 3562 |
Latin
Value | Count | Frequency (%) |
B | 17 | |
C | 4 | 8.5% |
K | 3 | 6.4% |
I | 3 | 6.4% |
T | 2 | 4.3% |
N | 2 | 4.3% |
L | 2 | 4.3% |
G | 2 | 4.3% |
E | 2 | 4.3% |
M | 2 | 4.3% |
Other values (7) | 8 |
Common
Value | Count | Frequency (%) |
74 | ||
( | 62 | |
) | 62 | |
2 | 47 | |
1 | 35 | |
3 | 32 | |
4 | 13 | 3.7% |
5 | 7 | 2.0% |
8 | 4 | 1.2% |
7 | 3 | 0.9% |
Other values (4) | 8 | 2.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5126 | |
ASCII | 394 | 7.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
점 | 706 | 13.8% |
동 | 165 | 3.2% |
대 | 124 | 2.4% |
역 | 98 | 1.9% |
븐 | 91 | 1.8% |
일 | 79 | 1.5% |
신 | 78 | 1.5% |
성 | 77 | 1.5% |
삼 | 77 | 1.5% |
로 | 69 | 1.3% |
Other values (336) | 3562 |
ASCII
Value | Count | Frequency (%) |
74 | ||
( | 62 | |
) | 62 | |
2 | 47 | |
1 | 35 | |
3 | 32 | |
B | 17 | 4.3% |
4 | 13 | 3.3% |
5 | 7 | 1.8% |
C | 4 | 1.0% |
Other values (21) | 41 |
주소
Text
UNIQUE
 
Distinct | 977 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 7.8 KiB |
Length
Max length | 60 |
---|---|
Median length | 44 |
Mean length | 22.807574 |
Min length | 6 |
Characters and Unicode
Total characters | 22283 |
---|---|
Distinct characters | 369 |
Distinct categories | 11 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 977 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 남대문로5가 84-6번지 |
---|---|
2nd row | 남대문로3가 85번지 |
3rd row | 서울특별시 중구 회현동3가 1-9번지 |
4th row | 서울특별시 중구 순화동 1-104번지 |
5th row | 서울 중구 서애로21 1층 |
Value | Count | Frequency (%) |
서울 | 348 | 8.0% |
서울특별시 | 315 | 7.3% |
강남구 | 132 | 3.0% |
1층 | 122 | 2.8% |
서울시 | 114 | 2.6% |
서초구 | 55 | 1.3% |
동대문구 | 47 | 1.1% |
송파구 | 45 | 1.0% |
성북구 | 40 | 0.9% |
강동구 | 37 | 0.9% |
Other values (1992) | 3080 |
Most occurring characters
Value | Count | Frequency (%) |
3450 | 15.5% | |
1 | 1400 | 6.3% |
동 | 1154 | 5.2% |
서 | 914 | 4.1% |
구 | 878 | 3.9% |
울 | 777 | 3.5% |
2 | 742 | 3.3% |
- | 722 | 3.2% |
3 | 632 | 2.8% |
4 | 529 | 2.4% |
Other values (359) | 11085 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 11460 | |
Decimal Number | 5646 | |
Space Separator | 3450 | 15.5% |
Dash Punctuation | 722 | 3.2% |
Close Punctuation | 351 | 1.6% |
Open Punctuation | 351 | 1.6% |
Other Punctuation | 215 | 1.0% |
Uppercase Letter | 68 | 0.3% |
Lowercase Letter | 17 | 0.1% |
Control | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 1154 | 10.1% |
서 | 914 | 8.0% |
구 | 878 | 7.7% |
울 | 777 | 6.8% |
시 | 440 | 3.8% |
로 | 431 | 3.8% |
특 | 315 | 2.7% |
별 | 315 | 2.7% |
길 | 275 | 2.4% |
지 | 253 | 2.2% |
Other values (308) | 5708 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 15 | |
A | 10 | |
M | 5 | 7.4% |
C | 5 | 7.4% |
E | 4 | 5.9% |
S | 4 | 5.9% |
D | 3 | 4.4% |
I | 3 | 4.4% |
P | 3 | 4.4% |
L | 3 | 4.4% |
Other values (10) | 13 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 3 | |
k | 2 | |
l | 2 | |
o | 2 | |
e | 2 | |
t | 1 | 5.9% |
s | 1 | 5.9% |
r | 1 | 5.9% |
j | 1 | 5.9% |
g | 1 | 5.9% |
Decimal Number
Value | Count | Frequency (%) |
1 | 1400 | |
2 | 742 | |
3 | 632 | |
4 | 529 | 9.4% |
0 | 452 | 8.0% |
6 | 428 | 7.6% |
5 | 408 | 7.2% |
7 | 375 | 6.6% |
8 | 370 | 6.6% |
9 | 310 | 5.5% |
Other Punctuation
Value | Count | Frequency (%) |
, | 206 | |
. | 5 | 2.3% |
@ | 3 | 1.4% |
/ | 1 | 0.5% |
Space Separator
Value | Count | Frequency (%) |
3450 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 722 |
Close Punctuation
Value | Count | Frequency (%) |
) | 351 |
Open Punctuation
Value | Count | Frequency (%) |
( | 351 |
Control
Value | Count | Frequency (%) |
2 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 11459 | |
Common | 10738 | |
Latin | 85 | 0.4% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 1154 | 10.1% |
서 | 914 | 8.0% |
구 | 878 | 7.7% |
울 | 777 | 6.8% |
시 | 440 | 3.8% |
로 | 431 | 3.8% |
특 | 315 | 2.7% |
별 | 315 | 2.7% |
길 | 275 | 2.4% |
지 | 253 | 2.2% |
Other values (307) | 5707 |
Latin
Value | Count | Frequency (%) |
B | 15 | |
A | 10 | 11.8% |
M | 5 | 5.9% |
C | 5 | 5.9% |
E | 4 | 4.7% |
S | 4 | 4.7% |
D | 3 | 3.5% |
I | 3 | 3.5% |
P | 3 | 3.5% |
L | 3 | 3.5% |
Other values (21) | 30 |
Common
Value | Count | Frequency (%) |
3450 | ||
1 | 1400 | |
2 | 742 | 6.9% |
- | 722 | 6.7% |
3 | 632 | 5.9% |
4 | 529 | 4.9% |
0 | 452 | 4.2% |
6 | 428 | 4.0% |
5 | 408 | 3.8% |
7 | 375 | 3.5% |
Other values (10) | 1600 |
Han
Value | Count | Frequency (%) |
現 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 11459 | |
ASCII | 10823 | |
CJK | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3450 | ||
1 | 1400 | |
2 | 742 | 6.9% |
- | 722 | 6.7% |
3 | 632 | 5.8% |
4 | 529 | 4.9% |
0 | 452 | 4.2% |
6 | 428 | 4.0% |
5 | 408 | 3.8% |
7 | 375 | 3.5% |
Other values (41) | 1685 |
Hangul
Value | Count | Frequency (%) |
동 | 1154 | 10.1% |
서 | 914 | 8.0% |
구 | 878 | 7.7% |
울 | 777 | 6.8% |
시 | 440 | 3.8% |
로 | 431 | 3.8% |
특 | 315 | 2.7% |
별 | 315 | 2.7% |
길 | 275 | 2.4% |
지 | 253 | 2.2% |
Other values (307) | 5707 |
CJK
Value | Count | Frequency (%) |
現 | 1 |
Unnamed: 4
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 977 |
---|---|
Missing (%) | 100.0% |
Memory size | 8.7 KiB |
Unnamed: 5
Text
CONSTANT
  MISSING
 
Distinct | 1 |
---|---|
Distinct (%) | 100.0% |
Missing | 976 |
Missing (%) | 99.9% |
Memory size | 7.8 KiB |
Value | Count | Frequency (%) |
이촌로 | 1 | |
303 | 1 | |
현대아파트 | 1 | |
21동 | 1 | |
104호-나호 | 1 | |
105-가호 | 1 |
Most occurring characters
Value | Count | Frequency (%) |
7 | ||
1 | 3 | 8.6% |
0 | 3 | 8.6% |
호 | 3 | 8.6% |
3 | 2 | 5.7% |
- | 2 | 5.7% |
이 | 1 | 2.9% |
5 | 1 | 2.9% |
, | 1 | 2.9% |
나 | 1 | 2.9% |
Other values (11) | 11 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14 | |
Decimal Number | 11 | |
Space Separator | 7 | |
Dash Punctuation | 2 | 5.7% |
Other Punctuation | 1 | 2.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
호 | 3 | |
이 | 1 | 7.1% |
나 | 1 | 7.1% |
동 | 1 | 7.1% |
트 | 1 | 7.1% |
촌 | 1 | 7.1% |
파 | 1 | 7.1% |
아 | 1 | 7.1% |
대 | 1 | 7.1% |
현 | 1 | 7.1% |
Other values (2) | 2 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
0 | 3 | |
3 | 2 | |
5 | 1 | 9.1% |
4 | 1 | 9.1% |
2 | 1 | 9.1% |
Space Separator
Value | Count | Frequency (%) |
7 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 21 | |
Hangul | 14 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
호 | 3 | |
이 | 1 | 7.1% |
나 | 1 | 7.1% |
동 | 1 | 7.1% |
트 | 1 | 7.1% |
촌 | 1 | 7.1% |
파 | 1 | 7.1% |
아 | 1 | 7.1% |
대 | 1 | 7.1% |
현 | 1 | 7.1% |
Other values (2) | 2 |
Common
Value | Count | Frequency (%) |
7 | ||
1 | 3 | |
0 | 3 | |
3 | 2 | 9.5% |
- | 2 | 9.5% |
5 | 1 | 4.8% |
, | 1 | 4.8% |
4 | 1 | 4.8% |
2 | 1 | 4.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 21 | |
Hangul | 14 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
7 | ||
1 | 3 | |
0 | 3 | |
3 | 2 | 9.5% |
- | 2 | 9.5% |
5 | 1 | 4.8% |
, | 1 | 4.8% |
4 | 1 | 4.8% |
2 | 1 | 4.8% |
Hangul
Value | Count | Frequency (%) |
호 | 3 | |
이 | 1 | 7.1% |
나 | 1 | 7.1% |
동 | 1 | 7.1% |
트 | 1 | 7.1% |
촌 | 1 | 7.1% |
파 | 1 | 7.1% |
아 | 1 | 7.1% |
대 | 1 | 7.1% |
현 | 1 | 7.1% |
Other values (2) | 2 |
브랜드명 | 자치구 | |
---|---|---|
브랜드명 | 1.000 | 0.420 |
자치구 | 0.420 | 1.000 |
자치구 | 브랜드명 | |
---|---|---|
자치구 | 1.000 | 0.180 |
브랜드명 | 0.180 | 1.000 |
브랜드명 | 자치구 | |
---|---|---|
브랜드명 | 1.000 | 0.180 |
자치구 | 0.180 | 1.000 |
브랜드명 | 자치구 | 점포명 | 주소 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|---|---|---|
0 | CU | 중구 | 남대문로5가점 | 남대문로5가 84-6번지 | <NA> | <NA> |
1 | CU | 중구 | 남대문점 | 남대문로3가 85번지 | <NA> | <NA> |
2 | CU | 중구 | 명동화이자점 | 서울특별시 중구 회현동3가 1-9번지 | <NA> | <NA> |
3 | CU | 중구 | 순화점 | 서울특별시 중구 순화동 1-104번지 | <NA> | <NA> |
4 | CU | 중구 | 중구필동점 | 서울 중구 서애로21 1층 | <NA> | <NA> |
5 | CU | 중구 | 중구회현점 | 서울특별시 중구 회현동1가 190번지 | <NA> | <NA> |
6 | CU | 중구 | 중구흥인점 | 서울특별시 중구 흥인동 156번지 | <NA> | <NA> |
7 | CU | 중구 | 청구대로점 | 서울특별시 중구 신당동 336-3번지 | <NA> | <NA> |
8 | CU | 중구 | 청구역점 | 서울특별시 중구 신당동 387-3번지 | <NA> | <NA> |
9 | GS25 | 중구 | 북창 | 서울 중구 북창동 98 | <NA> | <NA> |
브랜드명 | 자치구 | 점포명 | 주소 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|---|---|---|
967 | 세븐일레븐 | 강동구 | 명일삼익점 | 서울특별시 강동구 명일동 양재대로 128길 47 | <NA> | <NA> |
968 | 세븐일레븐 | 강동구 | 명일점 | 서울 강동구 명일동 306-5 | <NA> | <NA> |
969 | 세븐일레븐 | 강동구 | 암사희망점 | 암사동 469-17 | <NA> | <NA> |
970 | 세븐일레븐 | 강동구 | 천호쌍용점 | 서울 강동구 천호동 432-10 | <NA> | <NA> |
971 | 세븐일레븐 | 강동구 | 천호역점 | 서울 강동구 천호2동 429-2 | <NA> | <NA> |
972 | 세븐일레븐 | 강동구 | 세븐일레븐 성내삼성점 | 서울특별시 강동구 성내로9길 351층 (성내동) | <NA> | <NA> |
973 | 세븐일레븐 | 강동구 | 세븐일레븐 강동고덕점 | 서울특별시 강동구 동남로75길 13-25 | <NA> | <NA> |
974 | 세븐일레븐 | 강동구 | 세븐일레븐 길동4호점 | 서울특별시 강동구 명일로210 (길동) | <NA> | <NA> |
975 | 씨스페이스 | 강동구 | 강동상일점 | 서울시 강동구 상일동 437-8 1층 | <NA> | <NA> |
976 | GS25 | 강동구 | 천호중앙점 | 상암로162 | <NA> | <NA> |