Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 73 |
Missing cells | 103 |
Missing cells (%) | 17.6% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.4% |
Total size in memory | 4.8 KiB |
Average record size in memory | 67.8 B |
Variable types
Categorical | 4 |
---|---|
Text | 2 |
Unsupported | 1 |
DateTime | 1 |
Dataset
Description | 서울특별시 광진구 보도상영업시설물 현황에 관한 자료로서 유형(가로판매대,구두수선대), 관리번호, 시설물 주소, 점용면적, 취급품목등의 자료를 제공합니다 |
---|---|
Author | 서울특별시 광진구 |
URL | https://www.data.go.kr/data/15064346/fileData.do |
자료기준일 has constant value "" | Constant |
Dataset has 1 (1.4%) duplicate rows | Duplicates |
유형 is highly overall correlated with 면적(제곱미터) and 1 other fields | High correlation |
면적(제곱미터) is highly overall correlated with 유형 | High correlation |
취급품목 is highly overall correlated with 유형 | High correlation |
관리번호 has 10 (13.7%) missing values | Missing |
주소 has 10 (13.7%) missing values | Missing |
비고 has 73 (100.0%) missing values | Missing |
자료기준일 has 10 (13.7%) missing values | Missing |
비고 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-03-14 22:46:49.953308 |
---|---|
Analysis finished | 2024-03-14 22:46:51.204370 |
Duration | 1.25 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
유형
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 4.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 712.0 B |
가로판매대(서울시형) | |
---|---|
구두수선대 | |
<NA> |
Length
Max length | 11 |
---|---|
Median length | 5 |
Mean length | 7.6575342 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 가로판매대(서울시형) |
---|---|
2nd row | 가로판매대(서울시형) |
3rd row | 가로판매대(서울시형) |
4th row | 가로판매대(서울시형) |
5th row | 가로판매대(서울시형) |
Common Values
Value | Count | Frequency (%) |
가로판매대(서울시형) | 34 | |
구두수선대 | 29 | |
<NA> | 10 | 13.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
가로판매대(서울시형 | 34 | |
구두수선대 | 29 | |
na | 10 | 13.7% |
관리번호
Text
MISSING
 
Distinct | 63 |
---|---|
Distinct (%) | 100.0% |
Missing | 10 |
Missing (%) | 13.7% |
Memory size | 712.0 B |
Value | Count | Frequency (%) |
가로판매대-02 | 1 | 1.6% |
구두수선대-15 | 1 | 1.6% |
구두수선대-01 | 1 | 1.6% |
구두수선대-02 | 1 | 1.6% |
구두수선대-03 | 1 | 1.6% |
구두수선대-04 | 1 | 1.6% |
구두수선대-05 | 1 | 1.6% |
구두수선대-06 | 1 | 1.6% |
구두수선대-07 | 1 | 1.6% |
구두수선대-08 | 1 | 1.6% |
Other values (53) | 53 |
Most occurring characters
Value | Count | Frequency (%) |
대 | 63 | |
- | 63 | |
가 | 34 | 6.7% |
로 | 34 | 6.7% |
판 | 34 | 6.7% |
매 | 34 | 6.7% |
수 | 29 | 5.8% |
두 | 29 | 5.8% |
구 | 29 | 5.8% |
선 | 29 | 5.8% |
Other values (10) | 126 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 315 | |
Decimal Number | 126 | 25.0% |
Dash Punctuation | 63 | 12.5% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 27 | |
2 | 25 | |
0 | 23 | |
3 | 14 | |
4 | 7 | 5.6% |
6 | 6 | 4.8% |
5 | 6 | 4.8% |
7 | 6 | 4.8% |
8 | 6 | 4.8% |
9 | 6 | 4.8% |
Other Letter
Value | Count | Frequency (%) |
대 | 63 | |
가 | 34 | |
로 | 34 | |
판 | 34 | |
매 | 34 | |
수 | 29 | |
두 | 29 | |
구 | 29 | |
선 | 29 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 63 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 315 | |
Common | 189 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 63 | |
1 | 27 | |
2 | 25 | 13.2% |
0 | 23 | 12.2% |
3 | 14 | 7.4% |
4 | 7 | 3.7% |
6 | 6 | 3.2% |
5 | 6 | 3.2% |
7 | 6 | 3.2% |
8 | 6 | 3.2% |
Hangul
Value | Count | Frequency (%) |
대 | 63 | |
가 | 34 | |
로 | 34 | |
판 | 34 | |
매 | 34 | |
수 | 29 | |
두 | 29 | |
구 | 29 | |
선 | 29 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 315 | |
ASCII | 189 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
대 | 63 | |
가 | 34 | |
로 | 34 | |
판 | 34 | |
매 | 34 | |
수 | 29 | |
두 | 29 | |
구 | 29 | |
선 | 29 |
ASCII
Value | Count | Frequency (%) |
- | 63 | |
1 | 27 | |
2 | 25 | 13.2% |
0 | 23 | 12.2% |
3 | 14 | 7.4% |
4 | 7 | 3.7% |
6 | 6 | 3.2% |
5 | 6 | 3.2% |
7 | 6 | 3.2% |
8 | 6 | 3.2% |
주소
Text
MISSING
 
Distinct | 52 |
---|---|
Distinct (%) | 82.5% |
Missing | 10 |
Missing (%) | 13.7% |
Memory size | 712.0 B |
Length
Max length | 25 |
---|---|
Median length | 24 |
Mean length | 22.396825 |
Min length | 17 |
Characters and Unicode
Total characters | 1411 |
---|---|
Distinct characters | 53 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 45 ? |
---|---|
Unique (%) | 71.4% |
Sample
1st row | 서울특별시 광진구 자양로 95(자양동) |
---|---|
2nd row | 서울특별시 광진구 아차산로 377(구의동) |
3rd row | 서울특별시 광진구 아차산로 219(화양동) |
4th row | 서울특별시 광진구 아차산로 224(자양동) |
5th row | 서울특별시 광진구 아차산로 244(자양동) |
Value | Count | Frequency (%) |
서울특별시 | 62 | |
광진구 | 62 | |
능동로 | 12 | 4.8% |
강변역로 | 10 | 4.0% |
아차산로 | 10 | 4.0% |
천호대로 | 8 | 3.2% |
자양로 | 5 | 2.0% |
50(구의동 | 4 | 1.6% |
53(구의동 | 4 | 1.6% |
광나루로 | 4 | 1.6% |
Other values (60) | 68 |
Most occurring characters
Value | Count | Frequency (%) |
186 | 13.2% | |
구 | 84 | 6.0% |
동 | 75 | 5.3% |
광 | 70 | 5.0% |
서 | 63 | 4.5% |
특 | 63 | 4.5% |
별 | 63 | 4.5% |
시 | 63 | 4.5% |
진 | 63 | 4.5% |
울 | 63 | 4.5% |
Other values (43) | 618 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 918 | |
Space Separator | 186 | 13.2% |
Decimal Number | 177 | 12.5% |
Close Punctuation | 62 | 4.4% |
Open Punctuation | 62 | 4.4% |
Dash Punctuation | 6 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 84 | 9.2% |
동 | 75 | 8.2% |
광 | 70 | 7.6% |
서 | 63 | 6.9% |
특 | 63 | 6.9% |
별 | 63 | 6.9% |
시 | 63 | 6.9% |
진 | 63 | 6.9% |
울 | 63 | 6.9% |
로 | 63 | 6.9% |
Other values (29) | 248 |
Decimal Number
Value | Count | Frequency (%) |
5 | 39 | |
2 | 25 | |
1 | 21 | |
3 | 19 | |
4 | 17 | |
7 | 16 | |
0 | 13 | 7.3% |
6 | 11 | 6.2% |
9 | 9 | 5.1% |
8 | 7 | 4.0% |
Space Separator
Value | Count | Frequency (%) |
186 |
Close Punctuation
Value | Count | Frequency (%) |
) | 62 |
Open Punctuation
Value | Count | Frequency (%) |
( | 62 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 918 | |
Common | 493 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 84 | 9.2% |
동 | 75 | 8.2% |
광 | 70 | 7.6% |
서 | 63 | 6.9% |
특 | 63 | 6.9% |
별 | 63 | 6.9% |
시 | 63 | 6.9% |
진 | 63 | 6.9% |
울 | 63 | 6.9% |
로 | 63 | 6.9% |
Other values (29) | 248 |
Common
Value | Count | Frequency (%) |
186 | ||
) | 62 | 12.6% |
( | 62 | 12.6% |
5 | 39 | 7.9% |
2 | 25 | 5.1% |
1 | 21 | 4.3% |
3 | 19 | 3.9% |
4 | 17 | 3.4% |
7 | 16 | 3.2% |
0 | 13 | 2.6% |
Other values (4) | 33 | 6.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 918 | |
ASCII | 493 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
186 | ||
) | 62 | 12.6% |
( | 62 | 12.6% |
5 | 39 | 7.9% |
2 | 25 | 5.1% |
1 | 21 | 4.3% |
3 | 19 | 3.9% |
4 | 17 | 3.4% |
7 | 16 | 3.2% |
0 | 13 | 2.6% |
Other values (4) | 33 | 6.7% |
Hangul
Value | Count | Frequency (%) |
구 | 84 | 9.2% |
동 | 75 | 8.2% |
광 | 70 | 7.6% |
서 | 63 | 6.9% |
특 | 63 | 6.9% |
별 | 63 | 6.9% |
시 | 63 | 6.9% |
진 | 63 | 6.9% |
울 | 63 | 6.9% |
로 | 63 | 6.9% |
Other values (29) | 248 |
성 명
Categorical
Distinct | 23 |
---|---|
Distinct (%) | 31.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 712.0 B |
김** | |
---|---|
<NA> | |
박** | |
정** | |
이** | |
Other values (18) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.1369863 |
Min length | 3 |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 13.7% |
Sample
1st row | 신** |
---|---|
2nd row | 박** |
3rd row | 임** |
4th row | 한** |
5th row | 박** |
Common Values
Value | Count | Frequency (%) |
김** | 14 | |
<NA> | 10 | |
박** | 9 | |
정** | 7 | |
이** | 5 | 6.8% |
전** | 3 | 4.1% |
임** | 3 | 4.1% |
유** | 2 | 2.7% |
최** | 2 | 2.7% |
송** | 2 | 2.7% |
Other values (13) | 16 |
Length
Value | Count | Frequency (%) |
김 | 14 | |
na | 10 | |
박 | 9 | |
정 | 7 | |
이 | 5 | 6.8% |
전 | 3 | 4.1% |
임 | 3 | 4.1% |
한 | 2 | 2.7% |
안 | 2 | 2.7% |
강 | 2 | 2.7% |
Other values (13) | 16 |
면적(제곱미터)
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 5.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 712.0 B |
3.92 | |
---|---|
4.48 | |
<NA> | |
3.5 | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9726027 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 3.92 |
---|---|
2nd row | 3.92 |
3rd row | 3.92 |
4th row | 3.92 |
5th row | 3.92 |
Common Values
Value | Count | Frequency (%) |
3.92 | 34 | |
4.48 | 27 | |
<NA> | 10 | 13.7% |
3.5 | 2 | 2.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
3.92 | 34 | |
4.48 | 27 | |
na | 10 | 13.7% |
3.5 | 2 | 2.7% |
취급품목
Categorical
HIGH CORRELATION
 
Distinct | 29 |
---|---|
Distinct (%) | 39.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 712.0 B |
구두닦이 및 수선 | |
---|---|
<NA> | |
과일 | |
복권, 교통카드, 신문, 음료 | 2 |
교통카드, 담배, 음료 | 2 |
Other values (24) |
Length
Max length | 16 |
---|---|
Median length | 14 |
Mean length | 7.7671233 |
Min length | 1 |
Unique
Unique | 21 ? |
---|---|
Unique (%) | 28.8% |
Sample
1st row | 잡화 |
---|---|
2nd row | 기타 |
3rd row | 핫도그/제빵 |
4th row | 핫도그, 토스트 |
5th row | 양말, 장갑 |
Common Values
Value | Count | Frequency (%) |
구두닦이 및 수선 | 29 | |
<NA> | 10 | 13.7% |
과일 | 3 | 4.1% |
복권, 교통카드, 신문, 음료 | 2 | 2.7% |
교통카드, 담배, 음료 | 2 | 2.7% |
김밥, 토스트 | 2 | 2.7% |
잡화 | 2 | 2.7% |
핫도그, 김밥, 샌드위치 | 2 | 2.7% |
기타 | 1 | 1.4% |
토스트, 김밥 | 1 | 1.4% |
Other values (19) | 19 |
Length
Value | Count | Frequency (%) |
구두닦이 | 29 | |
수선 | 29 | |
및 | 29 | |
음료 | 12 | 7.1% |
na | 10 | 6.0% |
교통카드 | 8 | 4.8% |
잡화 | 6 | 3.6% |
김밥 | 5 | 3.0% |
담배 | 4 | 2.4% |
토스트 | 4 | 2.4% |
Other values (21) | 32 |
비고
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 73 |
---|---|
Missing (%) | 100.0% |
Memory size | 785.0 B |
자료기준일
Date
CONSTANT
  MISSING
 
Distinct | 1 |
---|---|
Distinct (%) | 1.6% |
Missing | 10 |
Missing (%) | 13.7% |
Memory size | 712.0 B |
Minimum | 2024-02-13 00:00:00 |
---|---|
Maximum | 2024-02-13 00:00:00 |
유형 | 관리번호 | 주소 | 성 명 | 면적(제곱미터) | 취급품목 | |
---|---|---|---|---|---|---|
유형 | 1.000 | 1.000 | 0.502 | 0.000 | 1.000 | 1.000 |
관리번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
주소 | 0.502 | 1.000 | 1.000 | 0.914 | 0.000 | 0.759 |
성 명 | 0.000 | 1.000 | 0.914 | 1.000 | 0.000 | 0.726 |
면적(제곱미터) | 1.000 | 1.000 | 0.000 | 0.000 | 1.000 | 0.570 |
취급품목 | 1.000 | 1.000 | 0.759 | 0.726 | 0.570 | 1.000 |
유형 | 성 명 | 면적(제곱미터) | 취급품목 | |
---|---|---|---|---|
유형 | 1.000 | 0.000 | 0.992 | 0.757 |
성 명 | 0.000 | 1.000 | 0.000 | 0.227 |
면적(제곱미터) | 0.992 | 0.000 | 1.000 | 0.258 |
취급품목 | 0.757 | 0.227 | 0.258 | 1.000 |
유형 | 성 명 | 면적(제곱미터) | 취급품목 | |
---|---|---|---|---|
유형 | 1.000 | 0.000 | 0.992 | 0.757 |
성 명 | 0.000 | 1.000 | 0.000 | 0.227 |
면적(제곱미터) | 0.992 | 0.000 | 1.000 | 0.258 |
취급품목 | 0.757 | 0.227 | 0.258 | 1.000 |
유형 | 관리번호 | 주소 | 성 명 | 면적(제곱미터) | 취급품목 | 비고 | 자료기준일 | |
---|---|---|---|---|---|---|---|---|
0 | 가로판매대(서울시형) | 가로판매대-01 | 서울특별시 광진구 자양로 95(자양동) | 신** | 3.92 | 잡화 | <NA> | 2024-02-13 |
1 | 가로판매대(서울시형) | 가로판매대-02 | 서울특별시 광진구 아차산로 377(구의동) | 박** | 3.92 | 기타 | <NA> | 2024-02-13 |
2 | 가로판매대(서울시형) | 가로판매대-03 | 서울특별시 광진구 아차산로 219(화양동) | 임** | 3.92 | 핫도그/제빵 | <NA> | 2024-02-13 |
3 | 가로판매대(서울시형) | 가로판매대-04 | 서울특별시 광진구 아차산로 224(자양동) | 한** | 3.92 | 핫도그, 토스트 | <NA> | 2024-02-13 |
4 | 가로판매대(서울시형) | 가로판매대-05 | 서울특별시 광진구 아차산로 244(자양동) | 박** | 3.92 | 양말, 장갑 | <NA> | 2024-02-13 |
5 | 가로판매대(서울시형) | 가로판매대-06 | 서울특별시 광진구 능동로 92(자양동) | 진** | 3.92 | 과일 | <NA> | 2024-02-13 |
6 | 가로판매대(서울시형) | 가로판매대-07 | 서울특별시 광진구 능등로 103(화양동) | 문** | 3.92 | 잡화 | <NA> | 2024-02-13 |
7 | 가로판매대(서울시형) | 가로판매대-08 | 서울특별시 광진구 능동로 107(화양동) | 이** | 3.92 | 핫도그, 김밥, 샌드위치 | <NA> | 2024-02-13 |
8 | 가로판매대(서울시형) | 가로판매대-09 | 서울특별시 광진구 능동로 115(화양동) | 고** | 3.92 | 꽃 | <NA> | 2024-02-13 |
9 | 가로판매대(서울시형) | 가로판매대-10 | 서울특별시 광진구 능동로 117(화양동) | 양** | 3.92 | 애견용품 | <NA> | 2024-02-13 |
유형 | 관리번호 | 주소 | 성 명 | 면적(제곱미터) | 취급품목 | 비고 | 자료기준일 | |
---|---|---|---|---|---|---|---|---|
63 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
64 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
65 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
66 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
67 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
68 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
69 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
70 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
71 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
72 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
유형 | 관리번호 | 주소 | 성 명 | 면적(제곱미터) | 취급품목 | 자료기준일 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 10 |