Dataset statistics
Number of variables | 12 |
---|---|
Number of observations | 583 |
Missing cells | 1432 |
Missing cells (%) | 20.5% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.2% |
Total size in memory | 57.1 KiB |
Average record size in memory | 100.2 B |
Variable types
Categorical | 2 |
---|---|
Text | 4 |
Boolean | 1 |
DateTime | 1 |
Numeric | 4 |
Dataset
Description | 경기도 노점상 현황 |
---|---|
Author | 가평군 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=8WI97IK4X4SES1VKDO2731818479&infSeq=1 |
Dataset has 1 (0.2%) duplicate rows | Duplicates |
정제우편번호 is highly overall correlated with 정제WGS84위도 and 3 other fields | High correlation |
정제WGS84위도 is highly overall correlated with 정제우편번호 and 2 other fields | High correlation |
정제WGS84경도 is highly overall correlated with 시군명 and 2 other fields | High correlation |
시군명 is highly overall correlated with 정제우편번호 and 4 other fields | High correlation |
업종명 is highly overall correlated with 정제우편번호 and 4 other fields | High correlation |
폐업여부 is highly overall correlated with 정제우편번호 and 3 other fields | High correlation |
폐업여부 is highly imbalanced (84.5%) | Imbalance |
점포명 has 104 (17.8%) missing values | Missing |
허가번호 has 186 (31.9%) missing values | Missing |
폐업여부 has 183 (31.4%) missing values | Missing |
인허가일자 has 215 (36.9%) missing values | Missing |
점용면적 has 171 (29.3%) missing values | Missing |
정제도로명주소 has 138 (23.7%) missing values | Missing |
정제지번주소 has 98 (16.8%) missing values | Missing |
정제우편번호 has 127 (21.8%) missing values | Missing |
정제WGS84위도 has 105 (18.0%) missing values | Missing |
정제WGS84경도 has 105 (18.0%) missing values | Missing |
Reproduction
Analysis started | 2024-05-10 20:24:36.787273 |
---|---|
Analysis finished | 2024-05-10 20:24:43.727011 |
Duration | 6.94 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군명
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 2.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.7 KiB |
가평군 | |
---|---|
고양시 | |
수원시 | |
부천시 | |
성남시 | |
Other values (7) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0034305 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 고양시 |
---|---|
2nd row | 고양시 |
3rd row | 고양시 |
4th row | 고양시 |
5th row | 고양시 |
Common Values
Value | Count | Frequency (%) |
가평군 | 171 | |
고양시 | 140 | |
수원시 | 93 | |
부천시 | 73 | |
성남시 | 69 | |
구리시 | 10 | 1.7% |
광명시 | 8 | 1.4% |
여주시 | 8 | 1.4% |
의왕시 | 4 | 0.7% |
하남시 | 4 | 0.7% |
Other values (2) | 3 | 0.5% |
Length
Value | Count | Frequency (%) |
가평군 | 171 | |
고양시 | 140 | |
수원시 | 93 | |
부천시 | 73 | |
성남시 | 69 | |
구리시 | 10 | 1.7% |
광명시 | 8 | 1.4% |
여주시 | 8 | 1.4% |
의왕시 | 4 | 0.7% |
하남시 | 4 | 0.7% |
Other values (2) | 3 | 0.5% |
점포명
Text
MISSING
 
Distinct | 302 |
---|---|
Distinct (%) | 63.0% |
Missing | 104 |
Missing (%) | 17.8% |
Memory size | 4.7 KiB |
Value | Count | Frequency (%) |
햇살가게 | 73 | 14.7% |
구두수선점 | 64 | 12.9% |
구두수선소 | 15 | 3.0% |
교통카드판매소 | 13 | 2.6% |
가로판매점 | 12 | 2.4% |
구두수선대 | 6 | 1.2% |
토큰박스 | 3 | 0.6% |
길벗가게a-38호 | 1 | 0.2% |
가평5일시장(뻥튀기③ | 1 | 0.2% |
소품 | 1 | 0.2% |
Other values (307) | 307 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 291 | 7.5% |
( | 219 | 5.6% |
) | 217 | 5.6% |
5 | 195 | 5.0% |
일 | 180 | 4.6% |
게 | 179 | 4.6% |
장 | 173 | 4.5% |
시 | 172 | 4.4% |
평 | 144 | 3.7% |
벗 | 106 | 2.7% |
Other values (157) | 2001 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2686 | |
Decimal Number | 403 | 10.4% |
Open Punctuation | 219 | 5.6% |
Close Punctuation | 217 | 5.6% |
Other Number | 114 | 2.9% |
Dash Punctuation | 84 | 2.2% |
Uppercase Letter | 84 | 2.2% |
Lowercase Letter | 30 | 0.8% |
Other Punctuation | 22 | 0.6% |
Space Separator | 17 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 291 | 10.8% |
일 | 180 | 6.7% |
게 | 179 | 6.7% |
장 | 173 | 6.4% |
시 | 172 | 6.4% |
평 | 144 | 5.4% |
벗 | 106 | 3.9% |
길 | 106 | 3.9% |
선 | 95 | 3.5% |
구 | 94 | 3.5% |
Other values (128) | 1146 |
Decimal Number
Value | Count | Frequency (%) |
5 | 195 | |
0 | 32 | 7.9% |
1 | 29 | 7.2% |
3 | 28 | 6.9% |
4 | 26 | 6.5% |
2 | 25 | 6.2% |
7 | 20 | 5.0% |
6 | 17 | 4.2% |
8 | 16 | 4.0% |
9 | 15 | 3.7% |
Other Number
Value | Count | Frequency (%) |
② | 35 | |
① | 34 | |
③ | 18 | |
⑤ | 9 | 7.9% |
④ | 8 | 7.0% |
⑥ | 5 | 4.4% |
⑧ | 2 | 1.8% |
⑦ | 2 | 1.8% |
⑨ | 1 | 0.9% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 40 | |
C | 36 | |
A | 8 | 9.5% |
Open Punctuation
Value | Count | Frequency (%) |
( | 219 |
Close Punctuation
Value | Count | Frequency (%) |
) | 217 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 84 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 30 |
Other Punctuation
Value | Count | Frequency (%) |
, | 22 |
Space Separator
Value | Count | Frequency (%) |
17 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2687 | |
Common | 1076 | |
Latin | 114 | 2.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 291 | 10.8% |
일 | 180 | 6.7% |
게 | 179 | 6.7% |
장 | 173 | 6.4% |
시 | 172 | 6.4% |
평 | 144 | 5.4% |
벗 | 106 | 3.9% |
길 | 106 | 3.9% |
선 | 95 | 3.5% |
구 | 94 | 3.5% |
Other values (129) | 1147 |
Common
Value | Count | Frequency (%) |
( | 219 | |
) | 217 | |
5 | 195 | |
- | 84 | 7.8% |
② | 35 | 3.3% |
① | 34 | 3.2% |
0 | 32 | 3.0% |
1 | 29 | 2.7% |
3 | 28 | 2.6% |
4 | 26 | 2.4% |
Other values (14) | 177 |
Latin
Value | Count | Frequency (%) |
B | 40 | |
C | 36 | |
a | 30 | |
A | 8 | 7.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2686 | |
ASCII | 1076 | |
Enclosed Alphanum | 114 | 2.9% |
None | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 291 | 10.8% |
일 | 180 | 6.7% |
게 | 179 | 6.7% |
장 | 173 | 6.4% |
시 | 172 | 6.4% |
평 | 144 | 5.4% |
벗 | 106 | 3.9% |
길 | 106 | 3.9% |
선 | 95 | 3.5% |
구 | 94 | 3.5% |
Other values (128) | 1146 |
ASCII
Value | Count | Frequency (%) |
( | 219 | |
) | 217 | |
5 | 195 | |
- | 84 | 7.8% |
B | 40 | 3.7% |
C | 36 | 3.3% |
0 | 32 | 3.0% |
a | 30 | 2.8% |
1 | 29 | 2.7% |
3 | 28 | 2.6% |
Other values (9) | 166 |
Enclosed Alphanum
Value | Count | Frequency (%) |
② | 35 | |
① | 34 | |
③ | 18 | |
⑤ | 9 | 7.9% |
④ | 8 | 7.0% |
⑥ | 5 | 4.4% |
⑧ | 2 | 1.8% |
⑦ | 2 | 1.8% |
⑨ | 1 | 0.9% |
None
Value | Count | Frequency (%) |
㈜ | 1 |
허가번호
Text
MISSING
 
Distinct | 307 |
---|---|
Distinct (%) | 77.3% |
Missing | 186 |
Missing (%) | 31.9% |
Memory size | 4.7 KiB |
Length
Max length | 15 |
---|---|
Median length | 12 |
Mean length | 7.604534 |
Min length | 3 |
Characters and Unicode
Total characters | 3019 |
---|---|
Distinct characters | 39 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 260 ? |
---|---|
Unique (%) | 65.5% |
Sample
1st row | 제2023-31호 |
---|---|
2nd row | 제2023-32호 |
3rd row | 제2023-33호 |
4th row | 제2023-34호 |
5th row | 제2023-35호 |
Value | Count | Frequency (%) |
제 | 18 | 4.3% |
제2023-40호 | 3 | 0.7% |
제2023-20호 | 3 | 0.7% |
제2023-38호 | 3 | 0.7% |
제2023-04호 | 3 | 0.7% |
제2023-09호 | 3 | 0.7% |
제2023-11호 | 3 | 0.7% |
제2023-14호 | 3 | 0.7% |
제2023-16호 | 3 | 0.7% |
제2023-27호 | 3 | 0.7% |
Other values (298) | 370 |
Most occurring characters
Value | Count | Frequency (%) |
2 | 647 | |
0 | 442 | |
- | 406 | |
3 | 257 | 8.5% |
호 | 203 | 6.7% |
제 | 201 | 6.7% |
1 | 182 | 6.0% |
4 | 83 | 2.7% |
5 | 47 | 1.6% |
6 | 46 | 1.5% |
Other values (29) | 505 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1829 | |
Other Letter | 682 | 22.6% |
Dash Punctuation | 406 | 13.4% |
Uppercase Letter | 73 | 2.4% |
Space Separator | 18 | 0.6% |
Open Punctuation | 4 | 0.1% |
Close Punctuation | 4 | 0.1% |
Other Punctuation | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
호 | 203 | |
제 | 201 | |
당 | 45 | 6.6% |
분 | 45 | 6.6% |
구 | 39 | 5.7% |
두 | 33 | 4.8% |
정 | 18 | 2.6% |
수 | 18 | 2.6% |
로 | 17 | 2.5% |
가 | 17 | 2.5% |
Other values (9) | 46 | 6.7% |
Decimal Number
Value | Count | Frequency (%) |
2 | 647 | |
0 | 442 | |
3 | 257 | 14.1% |
1 | 182 | 10.0% |
4 | 83 | 4.5% |
5 | 47 | 2.6% |
6 | 46 | 2.5% |
7 | 45 | 2.5% |
8 | 44 | 2.4% |
9 | 36 | 2.0% |
Uppercase Letter
Value | Count | Frequency (%) |
H | 29 | |
A | 21 | |
C | 12 | |
B | 8 | 11.0% |
D | 3 | 4.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 406 |
Space Separator
Value | Count | Frequency (%) |
18 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Other Punctuation
Value | Count | Frequency (%) |
, | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 2264 | |
Hangul | 682 | 22.6% |
Latin | 73 | 2.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
호 | 203 | |
제 | 201 | |
당 | 45 | 6.6% |
분 | 45 | 6.6% |
구 | 39 | 5.7% |
두 | 33 | 4.8% |
정 | 18 | 2.6% |
수 | 18 | 2.6% |
로 | 17 | 2.5% |
가 | 17 | 2.5% |
Other values (9) | 46 | 6.7% |
Common
Value | Count | Frequency (%) |
2 | 647 | |
0 | 442 | |
- | 406 | |
3 | 257 | 11.4% |
1 | 182 | 8.0% |
4 | 83 | 3.7% |
5 | 47 | 2.1% |
6 | 46 | 2.0% |
7 | 45 | 2.0% |
8 | 44 | 1.9% |
Other values (5) | 65 | 2.9% |
Latin
Value | Count | Frequency (%) |
H | 29 | |
A | 21 | |
C | 12 | |
B | 8 | 11.0% |
D | 3 | 4.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2337 | |
Hangul | 682 | 22.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2 | 647 | |
0 | 442 | |
- | 406 | |
3 | 257 | 11.0% |
1 | 182 | 7.8% |
4 | 83 | 3.6% |
5 | 47 | 2.0% |
6 | 46 | 2.0% |
7 | 45 | 1.9% |
8 | 44 | 1.9% |
Other values (10) | 138 | 5.9% |
Hangul
Value | Count | Frequency (%) |
호 | 203 | |
제 | 201 | |
당 | 45 | 6.6% |
분 | 45 | 6.6% |
구 | 39 | 5.7% |
두 | 33 | 4.8% |
정 | 18 | 2.6% |
수 | 18 | 2.6% |
로 | 17 | 2.5% |
가 | 17 | 2.5% |
Other values (9) | 46 | 6.7% |
업종명
Categorical
HIGH CORRELATION
 
Distinct | 28 |
---|---|
Distinct (%) | 4.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.7 KiB |
<NA> | |
---|---|
길벗가게 | |
스낵 | |
구두수선대 | |
가두판매대 | |
Other values (23) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 4.1955403 |
Min length | 2 |
Unique
Unique | 11 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 교통카드판매소 |
---|---|
2nd row | 교통카드판매소 |
3rd row | 교통카드판매소 |
4th row | 교통카드판매소 |
5th row | 교통카드판매소 |
Common Values
Value | Count | Frequency (%) |
<NA> | 171 | |
길벗가게 | 106 | |
스낵 | 51 | 8.7% |
구두수선대 | 50 | 8.6% |
가두판매대 | 45 | 7.7% |
구두수선소 | 42 | 7.2% |
가로판매대 | 25 | 4.3% |
교통카드판매소 | 17 | 2.9% |
구두수선점 | 13 | 2.2% |
가로판매점 | 12 | 2.1% |
Other values (18) | 51 | 8.7% |
Length
Value | Count | Frequency (%) |
na | 171 | |
길벗가게 | 106 | |
스낵 | 51 | 8.7% |
구두수선대 | 50 | 8.5% |
가두판매대 | 45 | 7.7% |
구두수선소 | 42 | 7.2% |
가로판매대 | 25 | 4.3% |
교통카드판매소 | 17 | 2.9% |
구두수선점 | 13 | 2.2% |
가로판매점 | 12 | 2.1% |
Other values (20) | 53 | 9.1% |
폐업여부
Boolean
HIGH CORRELATION
  IMBALANCE
  MISSING
 
Distinct | 2 |
---|---|
Distinct (%) | 0.5% |
Missing | 183 |
Missing (%) | 31.4% |
Memory size | 1.3 KiB |
False | |
---|---|
True | 9 |
(Missing) |
Value | Count | Frequency (%) |
False | 391 | |
True | 9 | 1.5% |
(Missing) | 183 |
인허가일자
Date
MISSING
 
Distinct | 37 |
---|---|
Distinct (%) | 10.1% |
Missing | 215 |
Missing (%) | 36.9% |
Memory size | 4.7 KiB |
Minimum | 1998-01-01 00:00:00 |
---|---|
Maximum | 2023-01-01 00:00:00 |
점용면적
Real number (ℝ)
MISSING
 
Distinct | 59 |
---|---|
Distinct (%) | 14.3% |
Missing | 171 |
Missing (%) | 29.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.1935437 |
Minimum | 1.8 |
---|---|
Maximum | 7.1 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.3 KiB |
Quantile statistics
Minimum | 1.8 |
---|---|
5-th percentile | 3 |
Q1 | 3.8 |
median | 4.14 |
Q3 | 4.5 |
95-th percentile | 5.4 |
Maximum | 7.1 |
Range | 5.3 |
Interquartile range (IQR) | 0.7 |
Descriptive statistics
Standard deviation | 0.75780196 |
---|---|
Coefficient of variation (CV) | 0.18070682 |
Kurtosis | 1.892716 |
Mean | 4.1935437 |
Median Absolute Deviation (MAD) | 0.36 |
Skewness | 0.14327625 |
Sum | 1727.74 |
Variance | 0.57426381 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4.5 | 98 | |
4.08 | 54 | 9.3% |
4.14 | 28 | 4.8% |
4.84 | 26 | 4.5% |
4.0 | 24 | 4.1% |
3.61 | 20 | 3.4% |
3.0 | 18 | 3.1% |
3.6 | 12 | 2.1% |
3.52 | 11 | 1.9% |
4.8 | 10 | 1.7% |
Other values (49) | 111 | |
(Missing) | 171 |
Value | Count | Frequency (%) |
1.8 | 3 | 0.5% |
2.25 | 5 | 0.9% |
2.38 | 1 | 0.2% |
2.4 | 1 | 0.2% |
2.66 | 3 | 0.5% |
2.8 | 1 | 0.2% |
2.88 | 1 | 0.2% |
3.0 | 18 | |
3.08 | 3 | 0.5% |
3.09 | 1 | 0.2% |
Value | Count | Frequency (%) |
7.1 | 1 | 0.2% |
7.0 | 1 | 0.2% |
6.7 | 1 | 0.2% |
6.3 | 1 | 0.2% |
6.11 | 9 | |
6.0 | 3 | 0.5% |
5.7 | 1 | 0.2% |
5.4 | 6 | |
5.32 | 1 | 0.2% |
5.3 | 1 | 0.2% |
정제도로명주소
Text
MISSING
 
Distinct | 242 |
---|---|
Distinct (%) | 54.4% |
Missing | 138 |
Missing (%) | 23.7% |
Memory size | 4.7 KiB |
Length
Max length | 33 |
---|---|
Median length | 31 |
Mean length | 21.54382 |
Min length | 13 |
Characters and Unicode
Total characters | 9587 |
---|---|
Distinct characters | 155 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 222 ? |
---|---|
Unique (%) | 49.9% |
Sample
1st row | 경기도 고양시 덕양구 화정로 지하 60 |
---|---|
2nd row | 경기도 구리시 건원대로 55 |
3rd row | 경기도 수원시 장안구 송원로 65 |
4th row | 경기도 수원시 장안구 연무로42번길 12 |
5th row | 경기도 수원시 장안구 장안로115번길 38 |
Value | Count | Frequency (%) |
경기도 | 445 | |
가평군 | 171 | 7.6% |
가평읍 | 96 | 4.3% |
34번길 | 96 | 4.3% |
일원 | 96 | 4.3% |
보납로 | 96 | 4.3% |
수원시 | 82 | 3.6% |
부천시 | 73 | 3.2% |
성남시 | 69 | 3.1% |
시장중앙로 | 48 | 2.1% |
Other values (382) | 981 |
Most occurring characters
Value | Count | Frequency (%) |
1808 | ||
경 | 457 | 4.8% |
도 | 446 | 4.7% |
기 | 445 | 4.6% |
로 | 445 | 4.6% |
1 | 357 | 3.7% |
평 | 326 | 3.4% |
시 | 323 | 3.4% |
가 | 268 | 2.8% |
3 | 205 | 2.1% |
Other values (145) | 4507 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6062 | |
Space Separator | 1808 | 18.9% |
Decimal Number | 1384 | 14.4% |
Dash Punctuation | 200 | 2.1% |
Close Punctuation | 63 | 0.7% |
Open Punctuation | 63 | 0.7% |
Connector Punctuation | 7 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
경 | 457 | 7.5% |
도 | 446 | 7.4% |
기 | 445 | 7.3% |
로 | 445 | 7.3% |
평 | 326 | 5.4% |
시 | 323 | 5.3% |
가 | 268 | 4.4% |
원 | 198 | 3.3% |
구 | 194 | 3.2% |
군 | 171 | 2.8% |
Other values (130) | 2789 |
Decimal Number
Value | Count | Frequency (%) |
1 | 357 | |
3 | 205 | |
2 | 194 | |
4 | 167 | |
9 | 102 | 7.4% |
0 | 86 | 6.2% |
5 | 84 | 6.1% |
6 | 68 | 4.9% |
7 | 64 | 4.6% |
8 | 57 | 4.1% |
Space Separator
Value | Count | Frequency (%) |
1808 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 200 |
Close Punctuation
Value | Count | Frequency (%) |
) | 63 |
Open Punctuation
Value | Count | Frequency (%) |
( | 63 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6062 | |
Common | 3525 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
경 | 457 | 7.5% |
도 | 446 | 7.4% |
기 | 445 | 7.3% |
로 | 445 | 7.3% |
평 | 326 | 5.4% |
시 | 323 | 5.3% |
가 | 268 | 4.4% |
원 | 198 | 3.3% |
구 | 194 | 3.2% |
군 | 171 | 2.8% |
Other values (130) | 2789 |
Common
Value | Count | Frequency (%) |
1808 | ||
1 | 357 | 10.1% |
3 | 205 | 5.8% |
- | 200 | 5.7% |
2 | 194 | 5.5% |
4 | 167 | 4.7% |
9 | 102 | 2.9% |
0 | 86 | 2.4% |
5 | 84 | 2.4% |
6 | 68 | 1.9% |
Other values (5) | 254 | 7.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6062 | |
ASCII | 3525 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1808 | ||
1 | 357 | 10.1% |
3 | 205 | 5.8% |
- | 200 | 5.7% |
2 | 194 | 5.5% |
4 | 167 | 4.7% |
9 | 102 | 2.9% |
0 | 86 | 2.4% |
5 | 84 | 2.4% |
6 | 68 | 1.9% |
Other values (5) | 254 | 7.2% |
Hangul
Value | Count | Frequency (%) |
경 | 457 | 7.5% |
도 | 446 | 7.4% |
기 | 445 | 7.3% |
로 | 445 | 7.3% |
평 | 326 | 5.4% |
시 | 323 | 5.3% |
가 | 268 | 4.4% |
원 | 198 | 3.3% |
구 | 194 | 3.2% |
군 | 171 | 2.8% |
Other values (130) | 2789 |
정제지번주소
Text
MISSING
 
Distinct | 316 |
---|---|
Distinct (%) | 65.2% |
Missing | 98 |
Missing (%) | 16.8% |
Memory size | 4.7 KiB |
Length
Max length | 54 |
---|---|
Median length | 49 |
Mean length | 25.34433 |
Min length | 15 |
Characters and Unicode
Total characters | 12292 |
---|---|
Distinct characters | 194 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 264 ? |
---|---|
Unique (%) | 54.4% |
Sample
1st row | 경기도 고양시 덕양구 화정동 1098번지 (970번지선) |
---|---|
2nd row | 경기도 고양시 덕양구 행신동 858번지 (783번지선) |
3rd row | 경기도 고양시 덕양구 성사동 386-5번지 (726번지선) |
4th row | 경기도 고양시 덕양구 화정동 971-3번지 (974번지선) |
5th row | 경기도 고양시 덕양구 행신동 1019번지 (993번지선) |
Value | Count | Frequency (%) |
경기도 | 486 | 18.1% |
고양시 | 141 | 5.2% |
수원시 | 94 | 3.5% |
가평군 | 75 | 2.8% |
부천시 | 71 | 2.6% |
성남시 | 69 | 2.6% |
원미구 | 59 | 2.2% |
일산동구 | 52 | 1.9% |
청평면 | 48 | 1.8% |
청평리 | 48 | 1.8% |
Other values (532) | 1546 |
Most occurring characters
Value | Count | Frequency (%) |
2206 | 17.9% | |
1 | 537 | 4.4% |
동 | 500 | 4.1% |
도 | 490 | 4.0% |
경 | 486 | 4.0% |
기 | 486 | 4.0% |
구 | 421 | 3.4% |
시 | 414 | 3.4% |
2 | 335 | 2.7% |
- | 306 | 2.5% |
Other values (184) | 6111 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 7136 | |
Decimal Number | 2315 | 18.8% |
Space Separator | 2206 | 17.9% |
Dash Punctuation | 306 | 2.5% |
Close Punctuation | 157 | 1.3% |
Open Punctuation | 157 | 1.3% |
Other Punctuation | 12 | 0.1% |
Lowercase Letter | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 500 | 7.0% |
도 | 490 | 6.9% |
경 | 486 | 6.8% |
기 | 486 | 6.8% |
구 | 421 | 5.9% |
시 | 414 | 5.8% |
번 | 278 | 3.9% |
지 | 261 | 3.7% |
양 | 195 | 2.7% |
평 | 185 | 2.6% |
Other values (167) | 3420 |
Decimal Number
Value | Count | Frequency (%) |
1 | 537 | |
2 | 335 | |
8 | 217 | |
4 | 203 | 8.8% |
3 | 199 | 8.6% |
6 | 177 | 7.6% |
0 | 172 | 7.4% |
7 | 163 | 7.0% |
5 | 160 | 6.9% |
9 | 152 | 6.6% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 2 | |
b | 1 |
Space Separator
Value | Count | Frequency (%) |
2206 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 306 |
Close Punctuation
Value | Count | Frequency (%) |
) | 157 |
Open Punctuation
Value | Count | Frequency (%) |
( | 157 |
Other Punctuation
Value | Count | Frequency (%) |
, | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 7136 | |
Common | 5153 | |
Latin | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 500 | 7.0% |
도 | 490 | 6.9% |
경 | 486 | 6.8% |
기 | 486 | 6.8% |
구 | 421 | 5.9% |
시 | 414 | 5.8% |
번 | 278 | 3.9% |
지 | 261 | 3.7% |
양 | 195 | 2.7% |
평 | 185 | 2.6% |
Other values (167) | 3420 |
Common
Value | Count | Frequency (%) |
2206 | ||
1 | 537 | 10.4% |
2 | 335 | 6.5% |
- | 306 | 5.9% |
8 | 217 | 4.2% |
4 | 203 | 3.9% |
3 | 199 | 3.9% |
6 | 177 | 3.4% |
0 | 172 | 3.3% |
7 | 163 | 3.2% |
Other values (5) | 638 | 12.4% |
Latin
Value | Count | Frequency (%) |
s | 2 | |
b | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 7136 | |
ASCII | 5156 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2206 | ||
1 | 537 | 10.4% |
2 | 335 | 6.5% |
- | 306 | 5.9% |
8 | 217 | 4.2% |
4 | 203 | 3.9% |
3 | 199 | 3.9% |
6 | 177 | 3.4% |
0 | 172 | 3.3% |
7 | 163 | 3.2% |
Other values (7) | 641 | 12.4% |
Hangul
Value | Count | Frequency (%) |
동 | 500 | 7.0% |
도 | 490 | 6.9% |
경 | 486 | 6.8% |
기 | 486 | 6.8% |
구 | 421 | 5.9% |
시 | 414 | 5.8% |
번 | 278 | 3.9% |
지 | 261 | 3.7% |
양 | 195 | 2.7% |
평 | 185 | 2.6% |
Other values (167) | 3420 |
정제우편번호
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 195 |
---|---|
Distinct (%) | 42.8% |
Missing | 127 |
Missing (%) | 21.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 13288.064 |
Minimum | 10237 |
---|---|
Maximum | 16713 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.3 KiB |
Quantile statistics
Minimum | 10237 |
---|---|
5-th percentile | 10364 |
Q1 | 10586.75 |
median | 13314.5 |
Q3 | 14644 |
95-th percentile | 16565.25 |
Maximum | 16713 |
Range | 6476 |
Interquartile range (IQR) | 4057.25 |
Descriptive statistics
Standard deviation | 2157.4064 |
---|---|
Coefficient of variation (CV) | 0.16235672 |
Kurtosis | -1.1825515 |
Mean | 13288.064 |
Median Absolute Deviation (MAD) | 1362 |
Skewness | 0.085299818 |
Sum | 6059357 |
Variance | 4654402.6 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
12453 | 48 | 8.2% |
12465 | 27 | 4.6% |
10386 | 23 | 3.9% |
14637 | 13 | 2.2% |
10500 | 13 | 2.2% |
10364 | 12 | 2.1% |
14644 | 10 | 1.7% |
10414 | 10 | 1.7% |
14742 | 8 | 1.4% |
12621 | 8 | 1.4% |
Other values (185) | 284 | |
(Missing) | 127 |
Value | Count | Frequency (%) |
10237 | 1 | 0.2% |
10241 | 1 | 0.2% |
10242 | 1 | 0.2% |
10286 | 1 | 0.2% |
10293 | 3 | |
10306 | 1 | 0.2% |
10338 | 2 | |
10346 | 1 | 0.2% |
10357 | 1 | 0.2% |
10358 | 1 | 0.2% |
Value | Count | Frequency (%) |
16713 | 2 | |
16709 | 1 | |
16708 | 1 | |
16707 | 1 | |
16704 | 1 | |
16703 | 1 | |
16700 | 1 | |
16699 | 2 | |
16698 | 2 | |
16692 | 2 |
정제WGS84위도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 298 |
---|---|
Distinct (%) | 62.3% |
Missing | 105 |
Missing (%) | 18.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 37.517153 |
Minimum | 37.237227 |
---|---|
Maximum | 37.831801 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.3 KiB |
Quantile statistics
Minimum | 37.237227 |
---|---|
5-th percentile | 37.261396 |
Q1 | 37.378203 |
median | 37.504463 |
Q3 | 37.669325 |
95-th percentile | 37.734606 |
Maximum | 37.831801 |
Range | 0.59457359 |
Interquartile range (IQR) | 0.29112227 |
Descriptive statistics
Standard deviation | 0.1639575 |
---|---|
Coefficient of variation (CV) | 0.0043702009 |
Kurtosis | -1.35122 |
Mean | 37.517153 |
Median Absolute Deviation (MAD) | 0.15832218 |
Skewness | -0.27301937 |
Sum | 17933.199 |
Variance | 0.026882061 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
37.7346061435 | 48 | 8.2% |
37.6775904442 | 27 | 4.6% |
37.6697335206 | 15 | 2.6% |
37.4869364026 | 8 | 1.4% |
37.2956458819 | 8 | 1.4% |
37.6520635602 | 7 | 1.2% |
37.6567111412 | 6 | 1.0% |
37.6645130115 | 6 | 1.0% |
37.6627851331 | 6 | 1.0% |
37.6709272392 | 5 | 0.9% |
Other values (288) | 342 | |
(Missing) | 105 | 18.0% |
Value | Count | Frequency (%) |
37.23722736 | 1 | |
37.2392058629 | 1 | |
37.2451780596 | 1 | |
37.2460950051 | 1 | |
37.2464754073 | 1 | |
37.2490869204 | 1 | |
37.2496770879 | 1 | |
37.2505474909 | 1 | |
37.2509511287 | 1 | |
37.2514263539 | 1 |
Value | Count | Frequency (%) |
37.8318009486 | 1 | 0.2% |
37.7346061435 | 48 | |
37.6969627091 | 1 | 0.2% |
37.6946392537 | 1 | 0.2% |
37.6933893917 | 1 | 0.2% |
37.6919995515 | 1 | 0.2% |
37.68872941 | 1 | 0.2% |
37.6878832356 | 1 | 0.2% |
37.6873787383 | 1 | 0.2% |
37.6780504044 | 1 | 0.2% |
정제WGS84경도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 298 |
---|---|
Distinct (%) | 62.3% |
Missing | 105 |
Missing (%) | 18.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 127.01344 |
Minimum | 126.74777 |
---|---|
Maximum | 127.63755 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.3 KiB |
Quantile statistics
Minimum | 126.74777 |
---|---|
5-th percentile | 126.75303 |
Q1 | 126.77817 |
median | 127.00786 |
Q3 | 127.13316 |
95-th percentile | 127.4929 |
Maximum | 127.63755 |
Range | 0.8897837 |
Interquartile range (IQR) | 0.35499092 |
Descriptive statistics
Standard deviation | 0.25038193 |
---|---|
Coefficient of variation (CV) | 0.0019713026 |
Kurtosis | -0.54641902 |
Mean | 127.01344 |
Median Absolute Deviation (MAD) | 0.219917 |
Skewness | 0.74208925 |
Sum | 60712.423 |
Variance | 0.062691108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
127.415880581 | 48 | 8.2% |
127.4929009409 | 27 | 4.6% |
126.7626394714 | 15 | 2.6% |
126.7530269102 | 8 | 1.4% |
127.6375487482 | 8 | 1.4% |
126.7780161833 | 7 | 1.2% |
126.7716224656 | 6 | 1.0% |
126.7652308692 | 6 | 1.0% |
126.7671073188 | 6 | 1.0% |
126.7618339197 | 5 | 0.9% |
Other values (288) | 342 | |
(Missing) | 105 | 18.0% |
Value | Count | Frequency (%) |
126.7477650455 | 2 | |
126.7478408715 | 2 | |
126.7480186671 | 1 | |
126.7510489352 | 1 | |
126.7523469055 | 1 | |
126.7523682616 | 2 | |
126.7523870918 | 2 | |
126.7524263231 | 1 | |
126.7527945904 | 1 | |
126.7528074666 | 1 |
Value | Count | Frequency (%) |
127.6375487482 | 8 | 1.4% |
127.4929009409 | 27 | |
127.415880581 | 48 | |
127.2362512352 | 1 | 0.2% |
127.2355632511 | 1 | 0.2% |
127.2130625029 | 1 | 0.2% |
127.2084336222 | 1 | 0.2% |
127.2082411875 | 1 | 0.2% |
127.2019461542 | 1 | 0.2% |
127.1669905006 | 1 | 0.2% |
시군명 | 업종명 | 폐업여부 | 인허가일자 | 점용면적 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | |
---|---|---|---|---|---|---|---|---|
시군명 | 1.000 | 0.971 | 0.584 | 0.998 | 0.723 | 0.975 | 0.939 | 0.956 |
업종명 | 0.971 | 1.000 | 0.689 | 0.958 | 0.805 | 0.969 | 0.941 | 0.928 |
폐업여부 | 0.584 | 0.689 | 1.000 | 0.826 | 0.195 | 0.533 | 0.177 | 0.547 |
인허가일자 | 0.998 | 0.958 | 0.826 | 1.000 | 0.903 | 0.996 | 0.981 | 0.964 |
점용면적 | 0.723 | 0.805 | 0.195 | 0.903 | 1.000 | 0.631 | 0.552 | 0.592 |
정제우편번호 | 0.975 | 0.969 | 0.533 | 0.996 | 0.631 | 1.000 | 0.916 | 0.862 |
정제WGS84위도 | 0.939 | 0.941 | 0.177 | 0.981 | 0.552 | 0.916 | 1.000 | 0.877 |
정제WGS84경도 | 0.956 | 0.928 | 0.547 | 0.964 | 0.592 | 0.862 | 0.877 | 1.000 |
업종명 | 시군명 | 폐업여부 | |
---|---|---|---|
업종명 | 1.000 | 0.807 | 0.590 |
시군명 | 0.807 | 1.000 | 0.582 |
폐업여부 | 0.590 | 0.582 | 1.000 |
점용면적 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | 시군명 | 업종명 | 폐업여부 | |
---|---|---|---|---|---|---|---|
점용면적 | 1.000 | -0.043 | 0.043 | -0.120 | 0.412 | 0.439 | 0.148 |
정제우편번호 | -0.043 | 1.000 | -0.811 | 0.084 | 0.928 | 0.828 | 0.568 |
정제WGS84위도 | 0.043 | -0.811 | 1.000 | -0.013 | 0.774 | 0.727 | 0.175 |
정제WGS84경도 | -0.120 | 0.084 | -0.013 | 1.000 | 0.818 | 0.717 | 0.584 |
시군명 | 0.412 | 0.928 | 0.774 | 0.818 | 1.000 | 0.807 | 0.582 |
업종명 | 0.439 | 0.828 | 0.727 | 0.717 | 0.807 | 1.000 | 0.590 |
폐업여부 | 0.148 | 0.568 | 0.175 | 0.584 | 0.582 | 0.590 | 1.000 |
시군명 | 점포명 | 허가번호 | 업종명 | 폐업여부 | 인허가일자 | 점용면적 | 정제도로명주소 | 정제지번주소 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 고양시 | 교통카드판매소 | 제2023-31호 | 교통카드판매소 | N | 2022-12-30 | 5.04 | 경기도 고양시 덕양구 화정로 지하 60 | 경기도 고양시 덕양구 화정동 1098번지 (970번지선) | 10500 | 37.634503 | 126.832622 |
1 | 고양시 | 교통카드판매소 | 제2023-32호 | 교통카드판매소 | N | 2022-12-30 | 3.6 | <NA> | 경기도 고양시 덕양구 행신동 858번지 (783번지선) | 10527 | 37.615419 | 126.838571 |
2 | 고양시 | 교통카드판매소 | 제2023-33호 | 교통카드판매소 | N | 2022-12-30 | 3.08 | <NA> | 경기도 고양시 덕양구 성사동 386-5번지 (726번지선) | <NA> | <NA> | <NA> |
3 | 고양시 | 교통카드판매소 | 제2023-34호 | 교통카드판매소 | N | 2022-12-30 | 2.8 | <NA> | 경기도 고양시 덕양구 화정동 971-3번지 (974번지선) | 10500 | 37.634418 | 126.832924 |
4 | 고양시 | 교통카드판매소 | 제2023-35호 | 교통카드판매소 | N | 2022-12-30 | 3.6 | <NA> | 경기도 고양시 덕양구 행신동 1019번지 (993번지선) | <NA> | 37.623161 | 126.835982 |
5 | 고양시 | 교통카드판매소 | 제2023-36호 | 교통카드판매소 | N | 2022-12-30 | 2.4 | <NA> | 경기도 고양시 덕양구 관산동 227-9번지 (227-11번지선) | 10286 | 37.687883 | 126.864817 |
6 | 고양시 | 교통카드판매소 | 제2023-37호 | 교통카드판매소 | N | 2022-12-30 | 3.6 | <NA> | 경기도 고양시 덕양구 행신동 187-2번지 (971번지선) | 10492 | 37.618522 | 126.844415 |
7 | 고양시 | 교통카드판매소 | 제2023-39호 | 교통카드판매소 | N | 2022-12-30 | 3.08 | <NA> | 경기도 고양시 덕양구 행신동 881번지 (796번지선) | <NA> | 37.618118 | 126.844875 |
8 | 구리시 | 구두수선점 | 2019-158 | 구두수선점 | N | 2020-01-01 | 4.86 | 경기도 구리시 건원대로 55 | 경기도 구리시 인창동 679-7 | 11918 | 37.605968 | 127.139303 |
9 | 고양시 | 구두수선소 | 제2023-41호 | 구두수선소 | N | 2022-12-30 | 4.48 | <NA> | 경기도 고양시 덕양구 삼송동 26-11번지 (26-8번지선) | 10590 | 37.653369 | 126.894245 |
시군명 | 점포명 | 허가번호 | 업종명 | 폐업여부 | 인허가일자 | 점용면적 | 정제도로명주소 | 정제지번주소 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
573 | 가평군 | 청평5일시장(양말②,속옷②) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
574 | 가평군 | 청평5일시장(고추) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
575 | 가평군 | 청평5일시장(의류③) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
576 | 가평군 | 청평5일시장(과일②) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
577 | 가평군 | 청평5일시장(신발) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
578 | 가평군 | 청평5일시장(약재,건강식품) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
579 | 가평군 | 청평5일시장(먹거리) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
580 | 가평군 | 청평5일시장(낚시) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
581 | 가평군 | 청평5일시장(왕애치킨) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
582 | 가평군 | 청평5일시장(각종약초) | <NA> | <NA> | <NA> | <NA> | <NA> | 경기도 가평군 청평면 시장중앙로 19 | 경기도 가평군 청평면 청평리 81-2번지 | 12453 | 37.734606 | 127.415881 |
Most frequently occurring
시군명 | 점포명 | 허가번호 | 업종명 | 폐업여부 | 인허가일자 | 점용면적 | 정제도로명주소 | 정제지번주소 | 정제우편번호 | 정제WGS84위도 | 정제WGS84경도 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 부천시 | 햇살가게 | B-2,3 | 스낵 | N | 2012-10-15 | 3.33 | 경기도 부천시 송내대로 37-2 | 경기도 부천시 소사구 송내동 280-11번지 | 14742 | 37.486936 | 126.753027 | 3 |