Dataset statistics
Number of variables | 14 |
---|---|
Number of observations | 357 |
Missing cells | 608 |
Missing cells (%) | 12.2% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.3% |
Total size in memory | 41.3 KiB |
Average record size in memory | 118.4 B |
Variable types
Categorical | 4 |
---|---|
Text | 4 |
DateTime | 2 |
Numeric | 4 |
Dataset
Description | 반려동물 판매업체 현황 |
---|---|
Author | 행정안전부 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=99L24Y065OQ36TTGVENX502240&infSeq=1 |
총종업원수 has constant value "" | Constant |
Dataset has 1 (0.3%) duplicate rows | Duplicates |
소재지면적정보 is highly overall correlated with 도로명우편번호 and 5 other fields | High correlation |
영업상태명 is highly overall correlated with 소재지면적정보 | High correlation |
시군명 is highly overall correlated with 도로명우편번호 and 4 other fields | High correlation |
도로명우편번호 is highly overall correlated with 소재지우편번호 and 3 other fields | High correlation |
소재지우편번호 is highly overall correlated with 도로명우편번호 and 3 other fields | High correlation |
X좌표값 is highly overall correlated with 시군명 and 1 other fields | High correlation |
Y좌표값 is highly overall correlated with 도로명우편번호 and 3 other fields | High correlation |
영업상태명 is highly imbalanced (53.4%) | Imbalance |
소재지면적정보 is highly imbalanced (97.2%) | Imbalance |
소재지시설전화번호 has 348 (97.5%) missing values | Missing |
도로명우편번호 has 18 (5.0%) missing values | Missing |
소재지도로명주소 has 14 (3.9%) missing values | Missing |
소재지지번주소 has 5 (1.4%) missing values | Missing |
소재지우편번호 has 217 (60.8%) missing values | Missing |
Reproduction
Analysis started | 2023-12-10 22:26:44.727029 |
---|---|
Analysis finished | 2023-12-10 22:26:47.743273 |
Duration | 3.02 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군명
Categorical
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 7.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
여주시 | |
---|---|
파주시 | |
양평군 | |
화성시 | |
용인시 | |
Other values (20) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0392157 |
Min length | 3 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 1.4% |
Sample
1st row | 가평군 |
---|---|
2nd row | 가평군 |
3rd row | 가평군 |
4th row | 가평군 |
5th row | 가평군 |
Common Values
Value | Count | Frequency (%) |
여주시 | 43 | |
파주시 | 42 | |
양평군 | 40 | |
화성시 | 35 | |
용인시 | 29 | |
양주시 | 29 | |
안성시 | 25 | 7.0% |
김포시 | 20 | 5.6% |
평택시 | 16 | 4.5% |
연천군 | 14 | 3.9% |
Other values (15) | 64 |
Length
Value | Count | Frequency (%) |
여주시 | 43 | |
파주시 | 42 | |
양평군 | 40 | |
화성시 | 35 | |
용인시 | 29 | |
양주시 | 29 | |
안성시 | 25 | 7.0% |
김포시 | 20 | 5.6% |
평택시 | 16 | 4.5% |
연천군 | 14 | 3.9% |
Other values (15) | 64 |
사업장명
Text
Distinct | 348 |
---|---|
Distinct (%) | 97.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
Value | Count | Frequency (%) |
켄넬 | 8 | 1.8% |
kennel | 5 | 1.1% |
puppy | 4 | 0.9% |
농장 | 4 | 0.9% |
캐터리 | 4 | 0.9% |
피닉스 | 3 | 0.7% |
퍼피 | 3 | 0.7% |
dog | 3 | 0.7% |
흑석미미 | 2 | 0.4% |
하우스 | 2 | 0.4% |
Other values (406) | 416 |
Most occurring characters
Value | Count | Frequency (%) |
97 | 4.9% | |
스 | 52 | 2.6% |
넬 | 46 | 2.3% |
켄 | 43 | 2.2% |
리 | 42 | 2.1% |
이 | 41 | 2.1% |
견 | 41 | 2.1% |
애 | 39 | 2.0% |
우 | 29 | 1.5% |
e | 29 | 1.5% |
Other values (368) | 1516 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1401 | |
Lowercase Letter | 232 | 11.7% |
Uppercase Letter | 194 | 9.8% |
Space Separator | 97 | 4.9% |
Open Punctuation | 16 | 0.8% |
Close Punctuation | 16 | 0.8% |
Other Punctuation | 10 | 0.5% |
Decimal Number | 7 | 0.4% |
Dash Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 52 | 3.7% |
넬 | 46 | 3.3% |
켄 | 43 | 3.1% |
리 | 42 | 3.0% |
이 | 41 | 2.9% |
견 | 41 | 2.9% |
애 | 39 | 2.8% |
우 | 29 | 2.1% |
하 | 27 | 1.9% |
장 | 24 | 1.7% |
Other values (309) | 1017 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 15 | 7.7% |
L | 14 | 7.2% |
O | 14 | 7.2% |
S | 13 | 6.7% |
A | 13 | 6.7% |
D | 12 | 6.2% |
C | 11 | 5.7% |
G | 10 | 5.2% |
B | 10 | 5.2% |
H | 9 | 4.6% |
Other values (14) | 73 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 29 | |
o | 23 | 9.9% |
n | 22 | 9.5% |
l | 19 | 8.2% |
a | 16 | 6.9% |
i | 15 | 6.5% |
t | 14 | 6.0% |
y | 12 | 5.2% |
d | 10 | 4.3% |
u | 10 | 4.3% |
Other values (12) | 62 |
Decimal Number
Value | Count | Frequency (%) |
3 | 2 | |
2 | 2 | |
5 | 1 | |
8 | 1 | |
1 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
& | 5 | |
. | 3 | |
· | 1 | 10.0% |
' | 1 | 10.0% |
Space Separator
Value | Count | Frequency (%) |
97 |
Open Punctuation
Value | Count | Frequency (%) |
( | 16 |
Close Punctuation
Value | Count | Frequency (%) |
) | 16 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1401 | |
Latin | 426 | 21.6% |
Common | 148 | 7.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 52 | 3.7% |
넬 | 46 | 3.3% |
켄 | 43 | 3.1% |
리 | 42 | 3.0% |
이 | 41 | 2.9% |
견 | 41 | 2.9% |
애 | 39 | 2.8% |
우 | 29 | 2.1% |
하 | 27 | 1.9% |
장 | 24 | 1.7% |
Other values (309) | 1017 |
Latin
Value | Count | Frequency (%) |
e | 29 | 6.8% |
o | 23 | 5.4% |
n | 22 | 5.2% |
l | 19 | 4.5% |
a | 16 | 3.8% |
i | 15 | 3.5% |
E | 15 | 3.5% |
L | 14 | 3.3% |
t | 14 | 3.3% |
O | 14 | 3.3% |
Other values (36) | 245 |
Common
Value | Count | Frequency (%) |
97 | ||
( | 16 | 10.8% |
) | 16 | 10.8% |
& | 5 | 3.4% |
. | 3 | 2.0% |
- | 2 | 1.4% |
3 | 2 | 1.4% |
2 | 2 | 1.4% |
5 | 1 | 0.7% |
8 | 1 | 0.7% |
Other values (3) | 3 | 2.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1401 | |
ASCII | 573 | |
None | 1 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
97 | 16.9% | |
e | 29 | 5.1% |
o | 23 | 4.0% |
n | 22 | 3.8% |
l | 19 | 3.3% |
( | 16 | 2.8% |
) | 16 | 2.8% |
a | 16 | 2.8% |
i | 15 | 2.6% |
E | 15 | 2.6% |
Other values (48) | 305 |
Hangul
Value | Count | Frequency (%) |
스 | 52 | 3.7% |
넬 | 46 | 3.3% |
켄 | 43 | 3.1% |
리 | 42 | 3.0% |
이 | 41 | 2.9% |
견 | 41 | 2.9% |
애 | 39 | 2.8% |
우 | 29 | 2.1% |
하 | 27 | 1.9% |
장 | 24 | 1.7% |
Other values (309) | 1017 |
None
Value | Count | Frequency (%) |
· | 1 |
인허가일자
Date
Distinct | 301 |
---|---|
Distinct (%) | 84.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
Minimum | 2008-06-09 00:00:00 |
---|---|
Maximum | 2023-12-04 00:00:00 |
영업상태명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
정상 | |
---|---|
폐업 | |
휴업 | 15 |
말소 | 1 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 정상 |
---|---|
2nd row | 정상 |
3rd row | 정상 |
4th row | 정상 |
5th row | 정상 |
Common Values
Value | Count | Frequency (%) |
정상 | 279 | |
폐업 | 62 | 17.4% |
휴업 | 15 | 4.2% |
말소 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정상 | 279 | |
폐업 | 62 | 17.4% |
휴업 | 15 | 4.2% |
말소 | 1 | 0.3% |
소재지시설전화번호
Text
MISSING
 
Distinct | 8 |
---|---|
Distinct (%) | 88.9% |
Missing | 348 |
Missing (%) | 97.5% |
Memory size | 2.9 KiB |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 11.888889 |
Min length | 11 |
Characters and Unicode
Total characters | 107 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 7 ? |
---|---|
Unique (%) | 77.8% |
Sample
1st row | 031-555-5920 |
---|---|
2nd row | 031-759-9141 |
3rd row | 03176751419 |
4th row | 031-844-2045 |
5th row | 031-884-7708 |
Value | Count | Frequency (%) |
031-334-4812 | 2 | |
031-555-5920 | 1 | |
031-759-9141 | 1 | |
03176751419 | 1 | |
031-844-2045 | 1 | |
031-884-7708 | 1 | |
031-881-1535 | 1 | |
031-322-6536 | 1 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 17 | |
3 | 16 | |
- | 16 | |
0 | 12 | |
4 | 10 | |
5 | 10 | |
8 | 8 | |
2 | 6 | 5.6% |
7 | 5 | 4.7% |
9 | 4 | 3.7% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 91 | |
Dash Punctuation | 16 | 15.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 17 | |
3 | 16 | |
0 | 12 | |
4 | 10 | |
5 | 10 | |
8 | 8 | |
2 | 6 | 6.6% |
7 | 5 | 5.5% |
9 | 4 | 4.4% |
6 | 3 | 3.3% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 16 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 107 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 17 | |
3 | 16 | |
- | 16 | |
0 | 12 | |
4 | 10 | |
5 | 10 | |
8 | 8 | |
2 | 6 | 5.6% |
7 | 5 | 4.7% |
9 | 4 | 3.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 107 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 17 | |
3 | 16 | |
- | 16 | |
0 | 12 | |
4 | 10 | |
5 | 10 | |
8 | 8 | |
2 | 6 | 5.6% |
7 | 5 | 4.7% |
9 | 4 | 3.7% |
소재지면적정보
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
0 | |
---|---|
<NA> | 1 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.0084034 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 356 | |
<NA> | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 356 | |
na | 1 | 0.3% |
도로명우편번호
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 246 |
---|---|
Distinct (%) | 72.6% |
Missing | 18 |
Missing (%) | 5.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 13718.027 |
Minimum | 10011 |
---|---|
Maximum | 18586 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.3 KiB |
Quantile statistics
Minimum | 10011 |
---|---|
5-th percentile | 10093.6 |
Q1 | 11134 |
median | 12581 |
Q3 | 17164.5 |
95-th percentile | 18545.4 |
Maximum | 18586 |
Range | 8575 |
Interquartile range (IQR) | 6030.5 |
Descriptive statistics
Standard deviation | 2942.3489 |
---|---|
Coefficient of variation (CV) | 0.21448776 |
Kurtosis | -1.3926594 |
Mean | 13718.027 |
Median Absolute Deviation (MAD) | 1648 |
Skewness | 0.52298496 |
Sum | 4650411 |
Variance | 8657416.8 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10025 | 6 | 1.7% |
11423 | 5 | 1.4% |
12570 | 5 | 1.4% |
12544 | 5 | 1.4% |
11047 | 5 | 1.4% |
10804 | 5 | 1.4% |
12611 | 4 | 1.1% |
12667 | 4 | 1.1% |
17406 | 4 | 1.1% |
17039 | 4 | 1.1% |
Other values (236) | 292 | |
(Missing) | 18 | 5.0% |
Value | Count | Frequency (%) |
10011 | 1 | 0.3% |
10012 | 1 | 0.3% |
10014 | 1 | 0.3% |
10015 | 1 | 0.3% |
10017 | 1 | 0.3% |
10022 | 1 | 0.3% |
10024 | 1 | 0.3% |
10025 | 6 | |
10036 | 1 | 0.3% |
10039 | 1 | 0.3% |
Value | Count | Frequency (%) |
18586 | 4 | |
18584 | 1 | 0.3% |
18583 | 1 | 0.3% |
18582 | 1 | 0.3% |
18577 | 1 | 0.3% |
18569 | 1 | 0.3% |
18561 | 1 | 0.3% |
18556 | 4 | |
18555 | 1 | 0.3% |
18549 | 2 |
소재지도로명주소
Text
MISSING
 
Distinct | 316 |
---|---|
Distinct (%) | 92.1% |
Missing | 14 |
Missing (%) | 3.9% |
Memory size | 2.9 KiB |
Length
Max length | 43 |
---|---|
Median length | 33 |
Mean length | 24.014577 |
Min length | 17 |
Characters and Unicode
Total characters | 8237 |
---|---|
Distinct characters | 251 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 295 ? |
---|---|
Unique (%) | 86.0% |
Sample
1st row | 경기도 가평군 가평읍 분자골로**번길 **-* |
---|---|
2nd row | 경기도 가평군 설악면 신천중앙로**번길 ***-** |
3rd row | 경기도 가평군 설악면 신천중앙로**번길 ***-** |
4th row | 경기도 가평군 가평읍 석봉로*번길 ***-** |
5th row | 경기도 가평군 북면 백둔로 ***-** |
Value | Count | Frequency (%) |
경기도 | 343 | 18.8% |
336 | 18.5% | |
여주시 | 43 | 2.4% |
파주시 | 39 | 2.1% |
화성시 | 35 | 1.9% |
양평군 | 31 | 1.7% |
양주시 | 29 | 1.6% |
용인시 | 29 | 1.6% |
층 | 28 | 1.5% |
처인구 | 26 | 1.4% |
Other values (470) | 882 |
Most occurring characters
Value | Count | Frequency (%) |
* | 1653 | |
1478 | ||
도 | 357 | 4.3% |
경 | 350 | 4.2% |
기 | 349 | 4.2% |
시 | 295 | 3.6% |
길 | 250 | 3.0% |
면 | 225 | 2.7% |
로 | 214 | 2.6% |
- | 194 | 2.4% |
Other values (241) | 2872 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4735 | |
Other Punctuation | 1720 | 20.9% |
Space Separator | 1478 | 17.9% |
Dash Punctuation | 194 | 2.4% |
Open Punctuation | 53 | 0.6% |
Close Punctuation | 53 | 0.6% |
Uppercase Letter | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 357 | 7.5% |
경 | 350 | 7.4% |
기 | 349 | 7.4% |
시 | 295 | 6.2% |
길 | 250 | 5.3% |
면 | 225 | 4.8% |
로 | 214 | 4.5% |
동 | 138 | 2.9% |
주 | 134 | 2.8% |
양 | 121 | 2.6% |
Other values (232) | 2302 |
Uppercase Letter
Value | Count | Frequency (%) |
D | 2 | |
A | 1 | |
B | 1 |
Other Punctuation
Value | Count | Frequency (%) |
* | 1653 | |
, | 67 | 3.9% |
Space Separator
Value | Count | Frequency (%) |
1478 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 194 |
Open Punctuation
Value | Count | Frequency (%) |
( | 53 |
Close Punctuation
Value | Count | Frequency (%) |
) | 53 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4735 | |
Common | 3498 | |
Latin | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 357 | 7.5% |
경 | 350 | 7.4% |
기 | 349 | 7.4% |
시 | 295 | 6.2% |
길 | 250 | 5.3% |
면 | 225 | 4.8% |
로 | 214 | 4.5% |
동 | 138 | 2.9% |
주 | 134 | 2.8% |
양 | 121 | 2.6% |
Other values (232) | 2302 |
Common
Value | Count | Frequency (%) |
* | 1653 | |
1478 | ||
- | 194 | 5.5% |
, | 67 | 1.9% |
( | 53 | 1.5% |
) | 53 | 1.5% |
Latin
Value | Count | Frequency (%) |
D | 2 | |
A | 1 | |
B | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4735 | |
ASCII | 3502 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 1653 | |
1478 | ||
- | 194 | 5.5% |
, | 67 | 1.9% |
( | 53 | 1.5% |
) | 53 | 1.5% |
D | 2 | 0.1% |
A | 1 | < 0.1% |
B | 1 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
도 | 357 | 7.5% |
경 | 350 | 7.4% |
기 | 349 | 7.4% |
시 | 295 | 6.2% |
길 | 250 | 5.3% |
면 | 225 | 4.8% |
로 | 214 | 4.5% |
동 | 138 | 2.9% |
주 | 134 | 2.8% |
양 | 121 | 2.6% |
Other values (232) | 2302 |
소재지지번주소
Text
MISSING
 
Distinct | 302 |
---|---|
Distinct (%) | 85.8% |
Missing | 5 |
Missing (%) | 1.4% |
Memory size | 2.9 KiB |
Length
Max length | 38 |
---|---|
Median length | 30 |
Mean length | 21.764205 |
Min length | 16 |
Characters and Unicode
Total characters | 7661 |
---|---|
Distinct characters | 202 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 269 ? |
---|---|
Unique (%) | 76.4% |
Sample
1st row | 경기도 가평군 가평읍 산유리 ***-* |
---|---|
2nd row | 경기도 가평군 설악면 신천리 ***-* |
3rd row | 경기도 가평군 설악면 신천리 ***-* |
4th row | 경기도 가평군 가평읍 대곡리 ***-* |
5th row | 경기도 가평군 설악면 신천리 ***-* |
Value | Count | Frequency (%) |
경기도 | 352 | |
352 | ||
여주시 | 43 | 2.4% |
양평군 | 40 | 2.2% |
파주시 | 38 | 2.1% |
화성시 | 35 | 2.0% |
용인시 | 29 | 1.6% |
양주시 | 29 | 1.6% |
처인구 | 26 | 1.5% |
안성시 | 25 | 1.4% |
Other values (399) | 811 |
Most occurring characters
Value | Count | Frequency (%) |
1777 | ||
* | 1384 | |
도 | 369 | 4.8% |
기 | 357 | 4.7% |
경 | 352 | 4.6% |
리 | 304 | 4.0% |
시 | 293 | 3.8% |
- | 257 | 3.4% |
면 | 234 | 3.1% |
주 | 130 | 1.7% |
Other values (192) | 2204 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4240 | |
Space Separator | 1777 | |
Other Punctuation | 1384 | 18.1% |
Dash Punctuation | 257 | 3.4% |
Uppercase Letter | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 369 | 8.7% |
기 | 357 | 8.4% |
경 | 352 | 8.3% |
리 | 304 | 7.2% |
시 | 293 | 6.9% |
면 | 234 | 5.5% |
주 | 130 | 3.1% |
양 | 114 | 2.7% |
동 | 110 | 2.6% |
평 | 89 | 2.1% |
Other values (187) | 1888 |
Uppercase Letter
Value | Count | Frequency (%) |
D | 2 | |
B | 1 |
Space Separator
Value | Count | Frequency (%) |
1777 |
Other Punctuation
Value | Count | Frequency (%) |
* | 1384 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 257 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4240 | |
Common | 3418 | |
Latin | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 369 | 8.7% |
기 | 357 | 8.4% |
경 | 352 | 8.3% |
리 | 304 | 7.2% |
시 | 293 | 6.9% |
면 | 234 | 5.5% |
주 | 130 | 3.1% |
양 | 114 | 2.7% |
동 | 110 | 2.6% |
평 | 89 | 2.1% |
Other values (187) | 1888 |
Common
Value | Count | Frequency (%) |
1777 | ||
* | 1384 | |
- | 257 | 7.5% |
Latin
Value | Count | Frequency (%) |
D | 2 | |
B | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4240 | |
ASCII | 3421 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1777 | ||
* | 1384 | |
- | 257 | 7.5% |
D | 2 | 0.1% |
B | 1 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
도 | 369 | 8.7% |
기 | 357 | 8.4% |
경 | 352 | 8.3% |
리 | 304 | 7.2% |
시 | 293 | 6.9% |
면 | 234 | 5.5% |
주 | 130 | 3.1% |
양 | 114 | 2.7% |
동 | 110 | 2.6% |
평 | 89 | 2.1% |
Other values (187) | 1888 |
소재지우편번호
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 96 |
---|---|
Distinct (%) | 68.6% |
Missing | 217 |
Missing (%) | 60.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 13675.75 |
Minimum | 10099 |
---|---|
Maximum | 18586 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.3 KiB |
Quantile statistics
Minimum | 10099 |
---|---|
5-th percentile | 10804 |
Q1 | 11128.75 |
median | 12570 |
Q3 | 17402.25 |
95-th percentile | 18556 |
Maximum | 18586 |
Range | 8487 |
Interquartile range (IQR) | 6273.5 |
Descriptive statistics
Standard deviation | 2869.0959 |
---|---|
Coefficient of variation (CV) | 0.20979441 |
Kurtosis | -1.2212197 |
Mean | 13675.75 |
Median Absolute Deviation (MAD) | 1524 |
Skewness | 0.69487812 |
Sum | 1914605 |
Variance | 8231711.3 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
12544 | 6 | 1.7% |
10804 | 5 | 1.4% |
11047 | 5 | 1.4% |
18586 | 4 | 1.1% |
17406 | 4 | 1.1% |
18556 | 4 | 1.1% |
10801 | 3 | 0.8% |
11045 | 3 | 0.8% |
17608 | 3 | 0.8% |
12665 | 3 | 0.8% |
Other values (86) | 100 | |
(Missing) | 217 |
Value | Count | Frequency (%) |
10099 | 2 | 0.6% |
10577 | 1 | 0.3% |
10801 | 3 | |
10804 | 5 | |
10809 | 1 | 0.3% |
10830 | 1 | 0.3% |
10839 | 1 | 0.3% |
10857 | 1 | 0.3% |
10858 | 1 | 0.3% |
10860 | 1 | 0.3% |
Value | Count | Frequency (%) |
18586 | 4 | |
18577 | 1 | 0.3% |
18556 | 4 | |
18545 | 1 | 0.3% |
18544 | 1 | 0.3% |
18540 | 1 | 0.3% |
18514 | 1 | 0.3% |
18355 | 1 | 0.3% |
17963 | 1 | 0.3% |
17927 | 1 | 0.3% |
데이터갱신시각
Date
Distinct | 154 |
---|---|
Distinct (%) | 43.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
Minimum | 2023-04-01 02:40:00 |
---|---|
Maximum | 2023-12-08 02:40:00 |
X좌표값
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 327 |
---|---|
Distinct (%) | 92.4% |
Missing | 3 |
Missing (%) | 0.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 214012.6 |
Minimum | 159712.44 |
---|---|
Maximum | 268723.16 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.3 KiB |
Quantile statistics
Minimum | 159712.44 |
---|---|
5-th percentile | 171707.51 |
Q1 | 189859.56 |
median | 214226.7 |
Q3 | 241518.73 |
95-th percentile | 258217.32 |
Maximum | 268723.16 |
Range | 109010.71 |
Interquartile range (IQR) | 51659.176 |
Descriptive statistics
Standard deviation | 28813.687 |
---|---|
Coefficient of variation (CV) | 0.13463547 |
Kurtosis | -1.1556698 |
Mean | 214012.6 |
Median Absolute Deviation (MAD) | 25701.084 |
Skewness | 0.048677269 |
Sum | 75760459 |
Variance | 8.3022859 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
251670.885904551 | 5 | 1.4% |
159712.805419118 | 4 | 1.1% |
239028.846842397 | 4 | 1.1% |
193880.180476123 | 3 | 0.8% |
200822.269293154 | 3 | 0.8% |
200138.657871181 | 3 | 0.8% |
175777.045591953 | 2 | 0.6% |
251673.804140614 | 2 | 0.6% |
228035.93414103 | 2 | 0.6% |
196055.771259137 | 2 | 0.6% |
Other values (317) | 324 | |
(Missing) | 3 | 0.8% |
Value | Count | Frequency (%) |
159712.443415208 | 1 | 0.3% |
159712.805419118 | 4 | |
159843.680122721 | 1 | 0.3% |
160522.500562898 | 1 | 0.3% |
160979.884735116 | 1 | 0.3% |
162628.085046042 | 1 | 0.3% |
163080.796223046 | 1 | 0.3% |
164546.44666091 | 1 | 0.3% |
166107.718114664 | 1 | 0.3% |
166795.00930874 | 1 | 0.3% |
Value | Count | Frequency (%) |
268723.158012174 | 1 | |
268102.122092259 | 1 | |
266111.777045975 | 1 | |
264484.193560158 | 1 | |
262083.535991123 | 1 | |
262024.810866276 | 1 | |
261883.038951851 | 1 | |
261803.706830516 | 1 | |
261126.262833931 | 1 | |
260818.695151134 | 1 |
Y좌표값
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 327 |
---|---|
Distinct (%) | 92.4% |
Missing | 3 |
Missing (%) | 0.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 441539.87 |
Minimum | 379598.25 |
---|---|
Maximum | 521639.77 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.3 KiB |
Quantile statistics
Minimum | 379598.25 |
---|---|
5-th percentile | 388715.85 |
Q1 | 411034.4 |
median | 436604.35 |
Q3 | 472834.23 |
95-th percentile | 499768.96 |
Maximum | 521639.77 |
Range | 142041.52 |
Interquartile range (IQR) | 61799.833 |
Descriptive statistics
Standard deviation | 35464.948 |
---|---|
Coefficient of variation (CV) | 0.080321054 |
Kurtosis | -1.1976879 |
Mean | 441539.87 |
Median Absolute Deviation (MAD) | 29939.479 |
Skewness | 0.1218102 |
Sum | 1.5630511 × 108 |
Variance | 1.2577625 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
435443.562902921 | 5 | 1.4% |
465327.230265845 | 4 | 1.1% |
405575.014904152 | 4 | 1.1% |
480245.946424279 | 3 | 0.8% |
497050.812637971 | 3 | 0.8% |
502378.395174842 | 3 | 0.8% |
458830.878392679 | 2 | 0.6% |
435411.340879456 | 2 | 0.6% |
411034.401578762 | 2 | 0.6% |
383497.401056246 | 2 | 0.6% |
Other values (317) | 324 | |
(Missing) | 3 | 0.8% |
Value | Count | Frequency (%) |
379598.251156353 | 1 | |
381526.965032199 | 1 | |
381787.427887327 | 1 | |
381943.420167773 | 2 | |
383118.804840559 | 1 | |
383497.401056246 | 2 | |
384141.385575977 | 1 | |
385141.828071119 | 1 | |
385439.909033845 | 1 | |
385838.097334672 | 1 |
Value | Count | Frequency (%) |
521639.77044525 | 1 | 0.3% |
510109.879646913 | 1 | 0.3% |
506283.067942985 | 1 | 0.3% |
506234.998211045 | 1 | 0.3% |
506219.585315101 | 1 | 0.3% |
503708.1198991 | 1 | 0.3% |
502378.395174842 | 3 | |
502327.971951421 | 2 | |
501968.901119515 | 2 | |
501016.505007957 | 1 | 0.3% |
총종업원수
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
0 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 357 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 357 |
시군명 | 영업상태명 | 소재지시설전화번호 | 도로명우편번호 | 소재지우편번호 | X좌표값 | Y좌표값 | |
---|---|---|---|---|---|---|---|
시군명 | 1.000 | 0.393 | 1.000 | 0.998 | 0.969 | 0.908 | 0.901 |
영업상태명 | 0.393 | 1.000 | 1.000 | 0.000 | 0.000 | 0.238 | 0.126 |
소재지시설전화번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
도로명우편번호 | 0.998 | 0.000 | 1.000 | 1.000 | 0.997 | 0.755 | 0.752 |
소재지우편번호 | 0.969 | 0.000 | 1.000 | 0.997 | 1.000 | 0.804 | 0.812 |
X좌표값 | 0.908 | 0.238 | 1.000 | 0.755 | 0.804 | 1.000 | 0.738 |
Y좌표값 | 0.901 | 0.126 | 1.000 | 0.752 | 0.812 | 0.738 | 1.000 |
소재지면적정보 | 영업상태명 | 시군명 | |
---|---|---|---|
소재지면적정보 | 1.000 | 1.000 | 1.000 |
영업상태명 | 1.000 | 1.000 | 0.210 |
시군명 | 1.000 | 0.210 | 1.000 |
도로명우편번호 | 소재지우편번호 | X좌표값 | Y좌표값 | 시군명 | 영업상태명 | 소재지면적정보 | |
---|---|---|---|---|---|---|---|
도로명우편번호 | 1.000 | 1.000 | 0.271 | -0.889 | 0.937 | 0.000 | 1.000 |
소재지우편번호 | 1.000 | 1.000 | 0.179 | -0.921 | 0.859 | 0.000 | 1.000 |
X좌표값 | 0.271 | 0.179 | 1.000 | -0.237 | 0.623 | 0.138 | 1.000 |
Y좌표값 | -0.889 | -0.921 | -0.237 | 1.000 | 0.606 | 0.072 | 1.000 |
시군명 | 0.937 | 0.859 | 0.623 | 0.606 | 1.000 | 0.210 | 1.000 |
영업상태명 | 0.000 | 0.000 | 0.138 | 0.072 | 0.210 | 1.000 | 1.000 |
소재지면적정보 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 소재지시설전화번호 | 소재지면적정보 | 도로명우편번호 | 소재지도로명주소 | 소재지지번주소 | 소재지우편번호 | 데이터갱신시각 | X좌표값 | Y좌표값 | 총종업원수 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 가평군 | 시바견 전문 가도켄넬 | 2023-09-13 | 정상 | <NA> | 0 | 12429 | 경기도 가평군 가평읍 분자골로**번길 **-* | 경기도 가평군 가평읍 산유리 ***-* | 12429 | 2023-09-15 00:18:04 | 243919.743289 | 473539.491523 | 0 |
1 | 가평군 | 설악펫 | 2022-07-14 | 정상 | <NA> | 0 | 12467 | 경기도 가평군 설악면 신천중앙로**번길 ***-** | 경기도 가평군 설악면 신천리 ***-* | <NA> | 2023-07-01 02:40:00 | 243139.074224 | 462062.856228 | 0 |
2 | 가평군 | 월드애견 | 2022-07-14 | 정상 | <NA> | 0 | 12467 | 경기도 가평군 설악면 신천중앙로**번길 ***-** | 경기도 가평군 설악면 신천리 ***-* | <NA> | 2023-12-01 02:40:00 | 243145.739535 | 462032.254359 | 0 |
3 | 가평군 | 예분 | 2022-10-18 | 정상 | <NA> | 0 | 12416 | 경기도 가평군 가평읍 석봉로*번길 ***-** | 경기도 가평군 가평읍 대곡리 ***-* | <NA> | 2023-05-14 02:40:00 | 243247.30137 | 480064.513852 | 0 |
4 | 가평군 | 라임 | 2020-12-31 | 정상 | <NA> | 0 | <NA> | <NA> | 경기도 가평군 설악면 신천리 ***-* | <NA> | 2023-04-08 02:40:00 | 243132.930714 | 462099.806002 | 0 |
5 | 가평군 | A HAPPY DOG WORLD | 2019-09-03 | 정상 | <NA> | 0 | 12406 | 경기도 가평군 북면 백둔로 ***-** | 경기도 가평군 북면 백둔리 **-* | 12406 | 2023-11-02 02:40:00 | 243058.525141 | 488517.445561 | 0 |
6 | 가평군 | S.S.G | 2023-05-09 | 정상 | <NA> | 0 | 12467 | 경기도 가평군 설악면 신천중앙로**번길 ***-** | 경기도 가평군 설악면 신천리 ***-* | <NA> | 2023-05-11 00:19:54 | 243162.092933 | 462078.67232 | 0 |
7 | 가평군 | 러브캣 | 2018-11-06 | 폐업 | <NA> | 0 | 12440 | 경기도 가평군 상면 물골길 *** | 경기도 가평군 상면 봉수리 **-* | 12440 | 2023-04-01 02:40:00 | 227316.457262 | 481512.676257 | 0 |
8 | 고양시 | 냥냥하우스 | 2023-03-28 | 정상 | <NA> | 0 | 10254 | 경기도 고양시 일산동구 문원길***번길 ***-**(설문동) | 경기도 고양시 일산동구 설문동 **-** | <NA> | 2023-06-25 02:40:00 | 184093.827524 | 468900.104576 | 0 |
9 | 고양시 | 디자인독 | 2018-11-07 | 정상 | <NA> | 0 | 10260 | 경기도 고양시 일산동구 공릉천로***번길 **-* (사리현동) | 경기도 고양시 일산동구 사리현동 ***-** | <NA> | 2023-05-13 02:40:00 | 186065.297021 | 466846.752148 | 0 |
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 소재지시설전화번호 | 소재지면적정보 | 도로명우편번호 | 소재지도로명주소 | 소재지지번주소 | 소재지우편번호 | 데이터갱신시각 | X좌표값 | Y좌표값 | 총종업원수 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
347 | 화성시 | 루나캣 | 2022-03-11 | 폐업 | <NA> | 0 | 18278 | 경기도 화성시 남양읍 고향의봄길 ***-** | 경기도 화성시 남양읍 활초리 ***-** | <NA> | 2023-10-25 02:40:00 | 185060.936826 | 408967.399431 | 0 |
348 | 화성시 | 서신농원 | 2023-04-03 | 폐업 | <NA> | 0 | 18556 | 경기도 화성시 서신면 홍법사길 **-* | 경기도 화성시 서신면 홍법리 ** | 18556 | 2023-11-11 02:40:00 | 175910.200227 | 407713.146213 | 0 |
349 | 화성시 | 에덴축산 | 2009-03-09 | 폐업 | <NA> | 0 | <NA> | 경기도 화성시 매송면 송숙로 ** | 경기도 화성시 매송면 송라리 ***-* | <NA> | 2023-04-23 02:40:00 | 190379.229474 | 418773.78057 | 0 |
350 | 화성시 | 라임캣 | 2023-11-27 | 폐업 | <NA> | <NA> | 18582 | 경기도 화성시 향남읍 상신로 ***-* | 경기도 화성시 향남읍 상신리 ***-* | <NA> | 2023-11-29 00:17:01 | 189906.472605 | 399684.79467 | 0 |
351 | 화성시 | 우리데코 | 2018-06-19 | 폐업 | <NA> | 0 | 18283 | 경기도 화성시 비봉면 삼화길***번길 **-* | 경기도 화성시 비봉면 삼화리 ***-* | <NA> | 2023-04-01 02:40:00 | 186960.59211 | 415862.952863 | 0 |
352 | 화성시 | 그녀의고양이 | 2020-06-30 | 폐업 | <NA> | 0 | 18583 | 경기도 화성시 장안면 고해길 ** | 경기도 화성시 장안면 독정리 **-* | <NA> | 2023-11-25 02:40:00 | 188315.695153 | 395838.446097 | 0 |
353 | 화성시 | 코코로캔넬 | 2021-03-16 | 휴업 | <NA> | 0 | 18569 | 경기도 화성시 우정읍 석천길 * | 경기도 화성시 우정읍 화산리 ****-** | <NA> | 2023-11-25 02:40:00 | <NA> | <NA> | 0 |
354 | 화성시 | 데비아스 | 2008-06-09 | 휴업 | <NA> | 0 | <NA> | 경기도 화성시 봉담읍 분천길***번길 ** | 경기도 화성시 봉담읍 분천리 ***-* | <NA> | 2023-11-24 02:40:00 | 195807.42232 | 411393.76266 | 0 |
355 | 화성시 | 어워크 | 2013-02-08 | 휴업 | <NA> | 0 | 18577 | 경기도 화성시 팔탄면 온천로***번길 **-** | 경기도 화성시 팔탄면 덕우리 ***-* | 18577 | 2023-12-02 02:40:00 | 187834.500886 | 404481.644645 | 0 |
356 | 화성시 | 하나켄넬 | 2017-12-27 | 휴업 | <NA> | 0 | 18269 | 경기도 화성시 남양읍 남양로***번길 ** | 경기도 화성시 남양읍 신남리 *** | <NA> | 2023-11-22 02:40:00 | 183620.839411 | 408975.175406 | 0 |
Most frequently occurring
시군명 | 사업장명 | 인허가일자 | 영업상태명 | 소재지시설전화번호 | 소재지면적정보 | 도로명우편번호 | 소재지도로명주소 | 소재지지번주소 | 소재지우편번호 | 데이터갱신시각 | X좌표값 | Y좌표값 | 총종업원수 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 용인시 | 오산농장 | 2019-09-03 | 정상 | 031-334-4812 | 0 | 17136 | 경기도 용인시 처인구 이동읍 경기동로 *** | 경기도 용인시 처인구 이동읍 송전리 ***-** | <NA> | 2023-06-10 02:40:00 | 217479.432767 | 404231.264885 | 0 | 2 |