Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 17 |
Duplicate rows (%) | 0.2% |
Total size in memory | 312.5 KiB |
Average record size in memory | 32.0 B |
Variable types
Text | 2 |
---|---|
Categorical | 1 |
Dataset
Description | 경기도 광주시 관내 업소정보(음식점, 병원, 약국, 공공시설 등) 현황에 대한 데이터로 업소명, 읍면동명, 도로명주소 등을 제공합니다. |
---|---|
Author | 경기도 광주시 |
URL | https://www.data.go.kr/data/15042402/fileData.do |
Dataset has 17 (0.2%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-16 15:16:19.585147 |
---|---|
Analysis finished | 2023-12-16 15:16:24.130392 |
Duration | 4.55 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업소
Text
Distinct | 9807 |
---|---|
Distinct (%) | 98.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 34 |
---|---|
Median length | 27 |
Mean length | 6.7475 |
Min length | 1 |
Characters and Unicode
Total characters | 67475 |
---|---|
Distinct characters | 1023 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 9670 ? |
---|---|
Unique (%) | 96.7% |
Sample
1st row | 풍선홀릭 |
---|---|
2nd row | 퍼시픽SA |
3rd row | 주식회사 에이치제이건설 |
4th row | 주식회사 승진도시가스 |
5th row | 참숯구이 아리아리 |
Value | Count | Frequency (%) |
주식회사 | 440 | 3.7% |
주 | 111 | 0.9% |
어린이집 | 32 | 0.3% |
노래연습장 | 19 | 0.2% |
사무소 | 18 | 0.1% |
광주 | 17 | 0.1% |
농업회사법인 | 17 | 0.1% |
gs25 | 15 | 0.1% |
더 | 14 | 0.1% |
경기광주점 | 14 | 0.1% |
Other values (10552) | 11325 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 2148 | 3.2% |
2030 | 3.0% | |
이 | 1738 | 2.6% |
스 | 1516 | 2.2% |
사 | 1480 | 2.2% |
( | 1287 | 1.9% |
) | 1286 | 1.9% |
리 | 950 | 1.4% |
인 | 794 | 1.2% |
지 | 765 | 1.1% |
Other values (1013) | 53481 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 57346 | |
Uppercase Letter | 2609 | 3.9% |
Space Separator | 2032 | 3.0% |
Lowercase Letter | 1759 | 2.6% |
Close Punctuation | 1322 | 2.0% |
Open Punctuation | 1320 | 2.0% |
Decimal Number | 573 | 0.8% |
Other Punctuation | 490 | 0.7% |
Dash Punctuation | 18 | < 0.1% |
Other Symbol | 3 | < 0.1% |
Other values (2) | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 2148 | 3.7% |
이 | 1738 | 3.0% |
스 | 1516 | 2.6% |
사 | 1480 | 2.6% |
리 | 950 | 1.7% |
인 | 794 | 1.4% |
지 | 765 | 1.3% |
회 | 709 | 1.2% |
에 | 688 | 1.2% |
식 | 670 | 1.2% |
Other values (929) | 45888 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 231 | 8.9% |
C | 206 | 7.9% |
E | 179 | 6.9% |
A | 160 | 6.1% |
O | 153 | 5.9% |
N | 151 | 5.8% |
G | 135 | 5.2% |
T | 134 | 5.1% |
L | 121 | 4.6% |
I | 116 | 4.4% |
Other values (16) | 1023 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 221 | |
o | 176 | 10.0% |
a | 148 | 8.4% |
n | 138 | 7.8% |
i | 137 | 7.8% |
r | 101 | 5.7% |
s | 100 | 5.7% |
t | 92 | 5.2% |
l | 82 | 4.7% |
c | 78 | 4.4% |
Other values (16) | 486 |
Other Punctuation
Value | Count | Frequency (%) |
* | 314 | |
. | 89 | 18.2% |
& | 42 | 8.6% |
, | 24 | 4.9% |
' | 7 | 1.4% |
# | 6 | 1.2% |
? | 3 | 0.6% |
/ | 2 | 0.4% |
? | 2 | 0.4% |
· | 1 | 0.2% |
Decimal Number
Value | Count | Frequency (%) |
2 | 133 | |
1 | 107 | |
5 | 78 | |
0 | 54 | |
3 | 50 | 8.7% |
4 | 46 | 8.0% |
9 | 34 | 5.9% |
6 | 31 | 5.4% |
7 | 24 | 4.2% |
8 | 16 | 2.8% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1287 | |
( | 32 | 2.4% |
[ | 1 | 0.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1286 | |
) | 35 | 2.6% |
] | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
2030 | ||
2 | 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 18 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 3 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 57332 | |
Common | 5758 | 8.5% |
Latin | 4368 | 6.5% |
Han | 17 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 2148 | 3.7% |
이 | 1738 | 3.0% |
스 | 1516 | 2.6% |
사 | 1480 | 2.6% |
리 | 950 | 1.7% |
인 | 794 | 1.4% |
지 | 765 | 1.3% |
회 | 709 | 1.2% |
에 | 688 | 1.2% |
식 | 670 | 1.2% |
Other values (914) | 45874 |
Latin
Value | Count | Frequency (%) |
S | 231 | 5.3% |
e | 221 | 5.1% |
C | 206 | 4.7% |
E | 179 | 4.1% |
o | 176 | 4.0% |
A | 160 | 3.7% |
O | 153 | 3.5% |
N | 151 | 3.5% |
a | 148 | 3.4% |
n | 138 | 3.2% |
Other values (42) | 2605 |
Common
Value | Count | Frequency (%) |
2030 | ||
( | 1287 | |
) | 1286 | |
* | 314 | 5.5% |
2 | 133 | 2.3% |
1 | 107 | 1.9% |
. | 89 | 1.5% |
5 | 78 | 1.4% |
0 | 54 | 0.9% |
3 | 50 | 0.9% |
Other values (21) | 330 | 5.7% |
Han
Value | Count | Frequency (%) |
巨 | 2 | 11.8% |
金 | 1 | 5.9% |
石 | 1 | 5.9% |
平 | 1 | 5.9% |
山 | 1 | 5.9% |
手 | 1 | 5.9% |
繩 | 1 | 5.9% |
普 | 1 | 5.9% |
賈 | 1 | 5.9% |
材 | 1 | 5.9% |
Other values (6) | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 57327 | |
ASCII | 10053 | 14.9% |
None | 76 | 0.1% |
CJK | 16 | < 0.1% |
Compat Jamo | 2 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 2148 | 3.7% |
이 | 1738 | 3.0% |
스 | 1516 | 2.6% |
사 | 1480 | 2.6% |
리 | 950 | 1.7% |
인 | 794 | 1.4% |
지 | 765 | 1.3% |
회 | 709 | 1.2% |
에 | 688 | 1.2% |
식 | 670 | 1.2% |
Other values (911) | 45869 |
ASCII
Value | Count | Frequency (%) |
2030 | ||
( | 1287 | 12.8% |
) | 1286 | 12.8% |
* | 314 | 3.1% |
S | 231 | 2.3% |
e | 221 | 2.2% |
C | 206 | 2.0% |
E | 179 | 1.8% |
o | 176 | 1.8% |
A | 160 | 1.6% |
Other values (68) | 3963 |
None
Value | Count | Frequency (%) |
) | 35 | |
( | 32 | |
㈜ | 3 | 3.9% |
? | 3 | 3.9% |
2 | 2.6% | |
· | 1 | 1.3% |
CJK
Value | Count | Frequency (%) |
巨 | 2 | 12.5% |
石 | 1 | 6.2% |
平 | 1 | 6.2% |
山 | 1 | 6.2% |
手 | 1 | 6.2% |
繩 | 1 | 6.2% |
普 | 1 | 6.2% |
賈 | 1 | 6.2% |
材 | 1 | 6.2% |
珍 | 1 | 6.2% |
Other values (5) | 5 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
金 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㅋ | 1 | |
ㅡ | 1 |
읍면동
Categorical
Distinct | 23 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
초월읍 | |
---|---|
곤지암읍 | |
오포1동 | |
오포2동 | |
도척면 | |
Other values (18) |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.2252 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 곤지암읍 |
---|---|
2nd row | 삼동 |
3rd row | 초월읍 |
4th row | 초월읍 |
5th row | 오포1동 |
Common Values
Value | Count | Frequency (%) |
초월읍 | 1632 | |
곤지암읍 | 1111 | |
오포1동 | 770 | 7.7% |
오포2동 | 758 | 7.6% |
도척면 | 636 | 6.4% |
태전동 | 596 | 6.0% |
경안동 | 567 | 5.7% |
신현동 | 540 | 5.4% |
송정동 | 537 | 5.4% |
능평동 | 456 | 4.6% |
Other values (13) | 2397 |
Length
Value | Count | Frequency (%) |
초월읍 | 1632 | |
곤지암읍 | 1111 | |
오포1동 | 770 | 7.7% |
오포2동 | 758 | 7.6% |
도척면 | 636 | 6.4% |
태전동 | 596 | 6.0% |
경안동 | 567 | 5.7% |
신현동 | 540 | 5.4% |
송정동 | 537 | 5.4% |
능평동 | 456 | 4.6% |
Other values (13) | 2397 |
도로명주소
Text
Distinct | 7189 |
---|---|
Distinct (%) | 71.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 30 |
---|---|
Median length | 26 |
Mean length | 18.6824 |
Min length | 9 |
Characters and Unicode
Total characters | 186824 |
---|---|
Distinct characters | 194 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 5592 ? |
---|---|
Unique (%) | 55.9% |
Sample
1st row | 경기도 광주시 곤지암읍 평촌길 59-16 |
---|---|
2nd row | 경기도 광주시 고불로 452 |
3rd row | 경기도 광주시 초월읍 설월길36번길 15-21 |
4th row | 경기도 광주시 초월읍 현산로 98 |
5th row | 경기도 광주시 오포로 485 |
Value | Count | Frequency (%) |
경기도 | 10000 | |
광주시 | 10000 | |
초월읍 | 1632 | 3.7% |
곤지암읍 | 1111 | 2.5% |
도척면 | 636 | 1.4% |
경충대로 | 456 | 1.0% |
퇴촌면 | 351 | 0.8% |
오포로 | 332 | 0.8% |
중앙로 | 279 | 0.6% |
회안대로 | 247 | 0.6% |
Other values (3977) | 18834 |
Most occurring characters
Value | Count | Frequency (%) |
33882 | ||
도 | 11239 | 6.0% |
경 | 11052 | 5.9% |
광 | 10514 | 5.6% |
주 | 10180 | 5.4% |
기 | 10038 | 5.4% |
시 | 10005 | 5.4% |
1 | 7618 | 4.1% |
로 | 6571 | 3.5% |
길 | 5943 | 3.2% |
Other values (184) | 69782 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 112196 | |
Decimal Number | 36728 | 19.7% |
Space Separator | 33882 | 18.1% |
Dash Punctuation | 4018 | 2.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 11239 | 10.0% |
경 | 11052 | 9.9% |
광 | 10514 | 9.4% |
주 | 10180 | 9.1% |
기 | 10038 | 8.9% |
시 | 10005 | 8.9% |
로 | 6571 | 5.9% |
길 | 5943 | 5.3% |
읍 | 2743 | 2.4% |
번 | 2509 | 2.2% |
Other values (172) | 31402 |
Decimal Number
Value | Count | Frequency (%) |
1 | 7618 | |
2 | 4910 | |
3 | 4238 | |
4 | 3800 | |
5 | 3229 | |
6 | 2926 | 8.0% |
7 | 2715 | 7.4% |
0 | 2486 | 6.8% |
8 | 2441 | 6.6% |
9 | 2365 | 6.4% |
Space Separator
Value | Count | Frequency (%) |
33882 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4018 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 112196 | |
Common | 74628 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 11239 | 10.0% |
경 | 11052 | 9.9% |
광 | 10514 | 9.4% |
주 | 10180 | 9.1% |
기 | 10038 | 8.9% |
시 | 10005 | 8.9% |
로 | 6571 | 5.9% |
길 | 5943 | 5.3% |
읍 | 2743 | 2.4% |
번 | 2509 | 2.2% |
Other values (172) | 31402 |
Common
Value | Count | Frequency (%) |
33882 | ||
1 | 7618 | 10.2% |
2 | 4910 | 6.6% |
3 | 4238 | 5.7% |
- | 4018 | 5.4% |
4 | 3800 | 5.1% |
5 | 3229 | 4.3% |
6 | 2926 | 3.9% |
7 | 2715 | 3.6% |
0 | 2486 | 3.3% |
Other values (2) | 4806 | 6.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 112196 | |
ASCII | 74628 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
33882 | ||
1 | 7618 | 10.2% |
2 | 4910 | 6.6% |
3 | 4238 | 5.7% |
- | 4018 | 5.4% |
4 | 3800 | 5.1% |
5 | 3229 | 4.3% |
6 | 2926 | 3.9% |
7 | 2715 | 3.6% |
0 | 2486 | 3.3% |
Other values (2) | 4806 | 6.4% |
Hangul
Value | Count | Frequency (%) |
도 | 11239 | 10.0% |
경 | 11052 | 9.9% |
광 | 10514 | 9.4% |
주 | 10180 | 9.1% |
기 | 10038 | 8.9% |
시 | 10005 | 8.9% |
로 | 6571 | 5.9% |
길 | 5943 | 5.3% |
읍 | 2743 | 2.4% |
번 | 2509 | 2.2% |
Other values (172) | 31402 |
업소 | 읍면동 | 도로명주소 | |
---|---|---|---|
29969 | 풍선홀릭 | 곤지암읍 | 경기도 광주시 곤지암읍 평촌길 59-16 |
10674 | 퍼시픽SA | 삼동 | 경기도 광주시 고불로 452 |
28464 | 주식회사 에이치제이건설 | 초월읍 | 경기도 광주시 초월읍 설월길36번길 15-21 |
23964 | 주식회사 승진도시가스 | 초월읍 | 경기도 광주시 초월읍 현산로 98 |
16203 | 참숯구이 아리아리 | 오포1동 | 경기도 광주시 오포로 485 |
27926 | 진성무역 | 초월읍 | 경기도 광주시 초월읍 현산로361번길 5-11 |
17250 | 코웨이(주) 오포지국 | 오포1동 | 경기도 광주시 고산길 4 |
34978 | 스타당구클럽 | 도척면 | 경기도 광주시 도척면 다람로 4 |
35192 | (주)제국포장 | 도척면 | 경기도 광주시 도척면 국사봉로 25 |
12529 | 명랑핫도그 태전점 | 태전동 | 경기도 광주시 태전동로 21 |
업소 | 읍면동 | 도로명주소 | |
---|---|---|---|
10512 | 오늘도어여쁨 | 중대동 | 경기도 광주시 텃골길47번길 18 |
3602 | 용해금속 | 회덕동 | 경기도 광주시 회덕길 34-10 |
29097 | 모세수산 | 퇴촌면 | 경기도 광주시 퇴촌면 정영로 524 |
31549 | 금金초밥 | 곤지암읍 | 경기도 광주시 곤지암읍 경충대로 691 |
22607 | 새빛경영컨설팅 | 신현동 | 경기도 광주시 신현로 54 |
22337 | 최고봉홍보사 | 능평동 | 경기도 광주시 수레실길 143-36 |
940 | 플랜에이치과의원 | 경안동 | 경기도 광주시 중앙로 107 |
8280 | 젠타코리아 | 목동 | 경기도 광주시 광남안로 256 |
9160 | 24시전주콩나물국밥 | 태전동 | 경기도 광주시 고불로 68 |
8065 | (주) 예스런던 강남 300CC | 목동 | 경기도 광주시 새말길 353 |
Most frequently occurring
업소 | 읍면동 | 도로명주소 | # duplicates | |
---|---|---|---|---|
7 | 세일통운 | 송정동 | 경기도 광주시 회안대로 984 | 11 |
3 | 대륙화물 | 퇴촌면 | 경기도 광주시 퇴촌면 천진암로 396 | 7 |
8 | 소백운수 | 송정동 | 경기도 광주시 회안대로 984 | 7 |
13 | 조은나라 | 장지동 | 경기도 광주시 포은대로 692-12 | 7 |
10 | 아모레카운셀러 | 경안동 | 경기도 광주시 광주대로 64 | 6 |
0 | 건우특송 | 퇴촌면 | 경기도 광주시 퇴촌면 천진암로 396 | 5 |
6 | 상우모터스 | 송정동 | 경기도 광주시 회안대로 984 | 5 |
14 | 한성운수 | 송정동 | 경기도 광주시 회안대로 984 | 5 |
11 | 알파로지스 | 퇴촌면 | 경기도 광주시 퇴촌면 천진암로 396 | 4 |
12 | 정성기업 | 송정동 | 경기도 광주시 회안대로 984 | 3 |