Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 6548 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 412 |
Duplicate rows (%) | 6.3% |
Total size in memory | 255.9 KiB |
Average record size in memory | 40.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Dataset
Description | 강원특별자치도에서 운영 중인 농어촌 민박 운영 개소수를 시군별로 분류하였고, 민박명, 민박소재지, 정상운영 여부를 추가적으로 기재함 |
---|---|
URL | https://www.data.go.kr/data/3045496/fileData.do |
시도명 has constant value "" | Constant |
Dataset has 412 (6.3%) duplicate rows | Duplicates |
영업상태 is highly imbalanced (99.6%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 08:57:47.991101 |
---|---|
Analysis finished | 2023-12-12 08:57:49.138619 |
Duration | 1.15 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.3 KiB |
강원특별자치도 |
---|
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강원특별자치도 |
---|---|
2nd row | 강원특별자치도 |
3rd row | 강원특별자치도 |
4th row | 강원특별자치도 |
5th row | 강원특별자치도 |
Common Values
Value | Count | Frequency (%) |
강원특별자치도 | 6548 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
강원특별자치도 | 6548 |
시군구명
Categorical
Distinct | 18 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.3 KiB |
강릉시 | |
---|---|
삼척시 | |
고성군 | |
평창군 | |
홍천군 | |
Other values (13) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 춘천시 |
---|---|
2nd row | 춘천시 |
3rd row | 춘천시 |
4th row | 춘천시 |
5th row | 춘천시 |
Common Values
Value | Count | Frequency (%) |
강릉시 | 825 | |
삼척시 | 810 | |
고성군 | 628 | |
평창군 | 556 | |
홍천군 | 533 | |
인제군 | 521 | |
양양군 | 480 | |
춘천시 | 476 | |
영월군 | 370 | 5.7% |
정선군 | 301 | 4.6% |
Other values (8) | 1048 |
Length
Value | Count | Frequency (%) |
강릉시 | 825 | |
삼척시 | 810 | |
고성군 | 628 | |
평창군 | 556 | |
홍천군 | 533 | |
인제군 | 521 | |
양양군 | 480 | |
춘천시 | 476 | |
영월군 | 370 | 5.7% |
정선군 | 301 | 4.6% |
Other values (8) | 1048 |
업소명
Text
Distinct | 5694 |
---|---|
Distinct (%) | 87.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.3 KiB |
Value | Count | Frequency (%) |
민박 | 305 | 3.9% |
펜션 | 165 | 2.1% |
하우스 | 29 | 0.4% |
스테이 | 21 | 0.3% |
고향민박 | 16 | 0.2% |
숲속의 | 14 | 0.2% |
더 | 14 | 0.2% |
하얀집 | 14 | 0.2% |
해변민박 | 14 | 0.2% |
집 | 13 | 0.2% |
Other values (5808) | 7168 |
Most occurring characters
Value | Count | Frequency (%) |
박 | 1995 | 5.7% |
민 | 1989 | 5.6% |
1672 | 4.7% | |
션 | 1532 | 4.3% |
펜 | 1449 | 4.1% |
스 | 780 | 2.2% |
리 | 655 | 1.9% |
이 | 652 | 1.9% |
하 | 532 | 1.5% |
산 | 419 | 1.2% |
Other values (845) | 23566 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31855 | |
Space Separator | 1672 | 4.7% |
Decimal Number | 606 | 1.7% |
Uppercase Letter | 445 | 1.3% |
Lowercase Letter | 437 | 1.2% |
Close Punctuation | 65 | 0.2% |
Open Punctuation | 65 | 0.2% |
Other Punctuation | 60 | 0.2% |
Letter Number | 21 | 0.1% |
Dash Punctuation | 13 | < 0.1% |
Other values (2) | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
박 | 1995 | 6.3% |
민 | 1989 | 6.2% |
션 | 1532 | 4.8% |
펜 | 1449 | 4.5% |
스 | 780 | 2.4% |
리 | 655 | 2.1% |
이 | 652 | 2.0% |
하 | 532 | 1.7% |
산 | 419 | 1.3% |
우 | 410 | 1.3% |
Other values (769) | 21442 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 54 | 12.1% |
S | 45 | 10.1% |
B | 45 | 10.1% |
O | 29 | 6.5% |
H | 28 | 6.3% |
T | 24 | 5.4% |
E | 23 | 5.2% |
Y | 18 | 4.0% |
C | 16 | 3.6% |
U | 16 | 3.6% |
Other values (14) | 147 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 58 | |
o | 52 | |
a | 48 | |
s | 40 | 9.2% |
i | 25 | 5.7% |
l | 22 | 5.0% |
n | 21 | 4.8% |
p | 20 | 4.6% |
h | 19 | 4.3% |
t | 19 | 4.3% |
Other values (13) | 113 |
Decimal Number
Value | Count | Frequency (%) |
2 | 145 | |
1 | 121 | |
0 | 69 | |
3 | 56 | 9.2% |
5 | 43 | 7.1% |
8 | 43 | 7.1% |
7 | 35 | 5.8% |
4 | 34 | 5.6% |
9 | 30 | 5.0% |
6 | 30 | 5.0% |
Other Punctuation
Value | Count | Frequency (%) |
& | 21 | |
. | 10 | |
? | 6 | 10.0% |
; | 5 | 8.3% |
, | 5 | 8.3% |
" | 4 | 6.7% |
# | 4 | 6.7% |
' | 3 | 5.0% |
& | 1 | 1.7% |
· | 1 | 1.7% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 12 | |
Ⅰ | 7 | |
Ⅲ | 2 | 9.5% |
Space Separator
Value | Count | Frequency (%) |
1672 |
Close Punctuation
Value | Count | Frequency (%) |
) | 65 |
Open Punctuation
Value | Count | Frequency (%) |
( | 65 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 13 |
Other Symbol
Value | Count | Frequency (%) |
♡ | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31849 | |
Common | 2483 | 7.0% |
Latin | 903 | 2.6% |
Han | 6 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
박 | 1995 | 6.3% |
민 | 1989 | 6.2% |
션 | 1532 | 4.8% |
펜 | 1449 | 4.5% |
스 | 780 | 2.4% |
리 | 655 | 2.1% |
이 | 652 | 2.0% |
하 | 532 | 1.7% |
산 | 419 | 1.3% |
우 | 410 | 1.3% |
Other values (765) | 21436 |
Latin
Value | Count | Frequency (%) |
e | 58 | 6.4% |
A | 54 | 6.0% |
o | 52 | 5.8% |
a | 48 | 5.3% |
S | 45 | 5.0% |
B | 45 | 5.0% |
s | 40 | 4.4% |
O | 29 | 3.2% |
H | 28 | 3.1% |
i | 25 | 2.8% |
Other values (40) | 479 |
Common
Value | Count | Frequency (%) |
1672 | ||
2 | 145 | 5.8% |
1 | 121 | 4.9% |
0 | 69 | 2.8% |
) | 65 | 2.6% |
( | 65 | 2.6% |
3 | 56 | 2.3% |
5 | 43 | 1.7% |
8 | 43 | 1.7% |
7 | 35 | 1.4% |
Other values (16) | 169 | 6.8% |
Han
Value | Count | Frequency (%) |
休 | 3 | |
家 | 1 | 16.7% |
愛 | 1 | 16.7% |
山 | 1 | 16.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31849 | |
ASCII | 3362 | 9.5% |
Number Forms | 21 | 0.1% |
CJK | 6 | < 0.1% |
None | 2 | < 0.1% |
Misc Symbols | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
박 | 1995 | 6.3% |
민 | 1989 | 6.2% |
션 | 1532 | 4.8% |
펜 | 1449 | 4.5% |
스 | 780 | 2.4% |
리 | 655 | 2.1% |
이 | 652 | 2.0% |
하 | 532 | 1.7% |
산 | 419 | 1.3% |
우 | 410 | 1.3% |
Other values (765) | 21436 |
ASCII
Value | Count | Frequency (%) |
1672 | ||
2 | 145 | 4.3% |
1 | 121 | 3.6% |
0 | 69 | 2.1% |
) | 65 | 1.9% |
( | 65 | 1.9% |
e | 58 | 1.7% |
3 | 56 | 1.7% |
A | 54 | 1.6% |
o | 52 | 1.5% |
Other values (60) | 1005 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 12 | |
Ⅰ | 7 | |
Ⅲ | 2 | 9.5% |
CJK
Value | Count | Frequency (%) |
休 | 3 | |
家 | 1 | 16.7% |
愛 | 1 | 16.7% |
山 | 1 | 16.7% |
None
Value | Count | Frequency (%) |
& | 1 | |
· | 1 |
Misc Symbols
Value | Count | Frequency (%) |
♡ | 1 |
소재지도로명주소
Text
Distinct | 6005 |
---|---|
Distinct (%) | 91.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.3 KiB |
Length
Max length | 42 |
---|---|
Median length | 39 |
Mean length | 25.802535 |
Min length | 20 |
Characters and Unicode
Total characters | 168955 |
---|---|
Distinct characters | 573 |
Distinct categories | 9 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 5480 ? |
---|---|
Unique (%) | 83.7% |
Sample
1st row | 강원특별자치도 춘천시 남산면 강촌로 116 |
---|---|
2nd row | 강원특별자치도 춘천시 남산면 문의골길 3 |
3rd row | 강원특별자치도 춘천시 남산면 강촌구곡길 19 |
4th row | 강원특별자치도 춘천시 남산면 방하로 777, 가동 |
5th row | 강원특별자치도 춘천시 사북면 원평길 54 |
Value | Count | Frequency (%) |
강원특별자치도 | 6543 | 19.6% |
강릉시 | 825 | 2.5% |
삼척시 | 810 | 2.4% |
고성군 | 628 | 1.9% |
평창군 | 556 | 1.7% |
홍천군 | 533 | 1.6% |
인제군 | 521 | 1.6% |
근덕면 | 500 | 1.5% |
양양군 | 480 | 1.4% |
춘천시 | 476 | 1.4% |
Other values (5972) | 21571 |
Most occurring characters
Value | Count | Frequency (%) |
26895 | 15.9% | |
강 | 7959 | 4.7% |
원 | 7405 | 4.4% |
도 | 6939 | 4.1% |
치 | 6667 | 3.9% |
자 | 6664 | 3.9% |
별 | 6549 | 3.9% |
특 | 6543 | 3.9% |
면 | 5061 | 3.0% |
1 | 4997 | 3.0% |
Other values (563) | 83276 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 113411 | |
Space Separator | 26895 | 15.9% |
Decimal Number | 23921 | 14.2% |
Dash Punctuation | 3009 | 1.8% |
Other Punctuation | 738 | 0.4% |
Close Punctuation | 456 | 0.3% |
Open Punctuation | 456 | 0.3% |
Uppercase Letter | 46 | < 0.1% |
Lowercase Letter | 23 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
강 | 7959 | 7.0% |
원 | 7405 | 6.5% |
도 | 6939 | 6.1% |
치 | 6667 | 5.9% |
자 | 6664 | 5.9% |
별 | 6549 | 5.8% |
특 | 6543 | 5.8% |
면 | 5061 | 4.5% |
길 | 4157 | 3.7% |
군 | 4126 | 3.6% |
Other values (519) | 51341 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 9 | |
S | 6 | |
B | 6 | |
C | 3 | 6.5% |
Y | 3 | 6.5% |
R | 3 | 6.5% |
O | 3 | 6.5% |
E | 2 | 4.3% |
G | 2 | 4.3% |
J | 2 | 4.3% |
Other values (5) | 7 |
Lowercase Letter
Value | Count | Frequency (%) |
o | 3 | |
l | 3 | |
u | 3 | |
e | 2 | |
p | 2 | |
x | 2 | |
d | 2 | |
a | 1 | 4.3% |
b | 1 | 4.3% |
t | 1 | 4.3% |
Other values (3) | 3 |
Decimal Number
Value | Count | Frequency (%) |
1 | 4997 | |
2 | 3494 | |
3 | 2517 | |
4 | 2271 | |
5 | 2068 | |
6 | 1983 | 8.3% |
7 | 1822 | 7.6% |
0 | 1637 | 6.8% |
8 | 1627 | 6.8% |
9 | 1505 | 6.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 734 | |
. | 4 | 0.5% |
Space Separator
Value | Count | Frequency (%) |
26895 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3009 |
Close Punctuation
Value | Count | Frequency (%) |
) | 456 |
Open Punctuation
Value | Count | Frequency (%) |
( | 456 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 113410 | |
Common | 55475 | |
Latin | 69 | < 0.1% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
강 | 7959 | 7.0% |
원 | 7405 | 6.5% |
도 | 6939 | 6.1% |
치 | 6667 | 5.9% |
자 | 6664 | 5.9% |
별 | 6549 | 5.8% |
특 | 6543 | 5.8% |
면 | 5061 | 4.5% |
길 | 4157 | 3.7% |
군 | 4126 | 3.6% |
Other values (518) | 51340 |
Latin
Value | Count | Frequency (%) |
A | 9 | 13.0% |
S | 6 | 8.7% |
B | 6 | 8.7% |
o | 3 | 4.3% |
C | 3 | 4.3% |
l | 3 | 4.3% |
Y | 3 | 4.3% |
R | 3 | 4.3% |
O | 3 | 4.3% |
u | 3 | 4.3% |
Other values (18) | 27 |
Common
Value | Count | Frequency (%) |
26895 | ||
1 | 4997 | 9.0% |
2 | 3494 | 6.3% |
- | 3009 | 5.4% |
3 | 2517 | 4.5% |
4 | 2271 | 4.1% |
5 | 2068 | 3.7% |
6 | 1983 | 3.6% |
7 | 1822 | 3.3% |
0 | 1637 | 3.0% |
Other values (6) | 4782 | 8.6% |
Han
Value | Count | Frequency (%) |
秀 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 113410 | |
ASCII | 55544 | |
CJK | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
26895 | ||
1 | 4997 | 9.0% |
2 | 3494 | 6.3% |
- | 3009 | 5.4% |
3 | 2517 | 4.5% |
4 | 2271 | 4.1% |
5 | 2068 | 3.7% |
6 | 1983 | 3.6% |
7 | 1822 | 3.3% |
0 | 1637 | 2.9% |
Other values (34) | 4851 | 8.7% |
Hangul
Value | Count | Frequency (%) |
강 | 7959 | 7.0% |
원 | 7405 | 6.5% |
도 | 6939 | 6.1% |
치 | 6667 | 5.9% |
자 | 6664 | 5.9% |
별 | 6549 | 5.8% |
특 | 6543 | 5.8% |
면 | 5061 | 4.5% |
길 | 4157 | 3.7% |
군 | 4126 | 3.6% |
Other values (518) | 51340 |
CJK
Value | Count | Frequency (%) |
秀 | 1 |
영업상태
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 51.3 KiB |
정상 | |
---|---|
휴업 | 2 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 정상 |
---|---|
2nd row | 정상 |
3rd row | 정상 |
4th row | 정상 |
5th row | 정상 |
Common Values
Value | Count | Frequency (%) |
정상 | 6546 | |
휴업 | 2 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정상 | 6546 | |
휴업 | 2 | < 0.1% |
시군구명 | 영업상태 | |
---|---|---|
시군구명 | 1.000 | 0.000 |
영업상태 | 0.000 | 1.000 |
시군구명 | 영업상태 | |
---|---|---|
시군구명 | 1.000 | 0.000 |
영업상태 | 0.000 | 1.000 |
시군구명 | 영업상태 | |
---|---|---|
시군구명 | 1.000 | 0.000 |
영업상태 | 0.000 | 1.000 |
시도명 | 시군구명 | 업소명 | 소재지도로명주소 | 영업상태 | |
---|---|---|---|---|---|
0 | 강원특별자치도 | 춘천시 | 푸른마트 4층 | 강원특별자치도 춘천시 남산면 강촌로 116 | 정상 |
1 | 강원특별자치도 | 춘천시 | 미래하우스 | 강원특별자치도 춘천시 남산면 문의골길 3 | 정상 |
2 | 강원특별자치도 | 춘천시 | 팔도민박 | 강원특별자치도 춘천시 남산면 강촌구곡길 19 | 정상 |
3 | 강원특별자치도 | 춘천시 | 연화펜션 | 강원특별자치도 춘천시 남산면 방하로 777, 가동 | 정상 |
4 | 강원특별자치도 | 춘천시 | 정 팜스테이 | 강원특별자치도 춘천시 사북면 원평길 54 | 정상 |
5 | 강원특별자치도 | 춘천시 | 연화민박 | 강원특별자치도 춘천시 남산면 방하로 777, 나동 | 정상 |
6 | 강원특별자치도 | 춘천시 | 오월당 | 강원특별자치도 춘천시 서면 납실길 214 | 정상 |
7 | 강원특별자치도 | 춘천시 | 갓골가든 | 강원특별자치도 춘천시 사북면 화악지암길 765 | 정상 |
8 | 강원특별자치도 | 춘천시 | 삼팔선의봄 | 강원특별자치도 춘천시 사북면 말고개길 14-13 | 정상 |
9 | 강원특별자치도 | 춘천시 | 강가에서민박 | 강원특별자치도 춘천시 사북면 춘화로 372 | 정상 |
시도명 | 시군구명 | 업소명 | 소재지도로명주소 | 영업상태 | |
---|---|---|---|---|---|
6538 | 강원특별자치도 | 양양군 | 마나긔 하우스 | 강원특별자치도 양양군 강현면 회룡1길 161-2 | 정상 |
6539 | 강원특별자치도 | 양양군 | 고꼴집 | 강원특별자치도 양양군 현남면 화상해안길 287 | 정상 |
6540 | 강원특별자치도 | 양양군 | 송이로1010 | 강원특별자치도 양양군 현북면 송이로 1010 | 정상 |
6541 | 강원특별자치도 | 양양군 | 물치항펜션 | 강원특별자치도 양양군 강현면 동해대로 3595-1 | 정상 |
6542 | 강원특별자치도 | 양양군 | 랑스 | 강원특별자치도 양양군 양양읍 동해신묘길 16-2 | 정상 |
6543 | 강원특별자치도 | 양양군 | 법수치리 120 | 강원특별자치도 양양군 현북면 법수치길 913 | 정상 |
6544 | 강원특별자치도 | 양양군 | 화이트펜션 | 강원특별자치도 양양군 현남면 동해대로 952 | 정상 |
6545 | 강원특별자치도 | 양양군 | 증바우 민박 | 강원특별자치도 양양군 강현면 정암2길 55 | 정상 |
6546 | 강원특별자치도 | 양양군 | 사인삼각 | 강원특별자치도 양양군 현남면 황태골로 69-18 | 정상 |
6547 | 강원특별자치도 | 양양군 | 남애 영희와 윤아저씨 | 강원특별자치도 양양군 현남면 미륭마을길 1-7 | 정상 |
Most frequently occurring
시도명 | 시군구명 | 업소명 | 소재지도로명주소 | 영업상태 | # duplicates | |
---|---|---|---|---|---|---|
0 | 강원특별자치도 | 고성군 | 까사텔아야 | 강원특별자치도 고성군 토성면 아야진해변길 19 | 정상 | 2 |
1 | 강원특별자치도 | 고성군 | 수성민박 | 강원특별자치도 고성군 거진읍 반암길 10, 수성민박 | 정상 | 2 |
2 | 강원특별자치도 | 고성군 | 예쁜연못집 민박 | 강원특별자치도 고성군 간성읍 소똥령마을길 48, 예쁜연못집 | 정상 | 2 |
3 | 강원특별자치도 | 고성군 | 전원민박 | 강원특별자치도 고성군 죽왕면 삼포민박촌2길 31, 전원가든 | 정상 | 2 |
4 | 강원특별자치도 | 고성군 | 천진슈퍼 민박 | 강원특별자치도 고성군 토성면 토성로 153 | 정상 | 2 |
5 | 강원특별자치도 | 삼척시 | #끝집민박 | 강원특별자치도 삼척시 원덕읍 갈남길 69-26, 골든민박 | 정상 | 2 |
6 | 강원특별자치도 | 삼척시 | 103HOUSE | 강원특별자치도 삼척시 원덕읍 임원항구로 15-103, 모텔하우스 | 정상 | 2 |
7 | 강원특별자치도 | 삼척시 | 1박2일 | 강원특별자치도 삼척시 가곡면 덕풍길 45-141 | 정상 | 2 |
8 | 강원특별자치도 | 삼척시 | 2087펜션 | 강원특별자치도 삼척시 근덕면 삼척로 2087 | 정상 | 2 |
9 | 강원특별자치도 | 삼척시 | FoRest(숲&휴식) | 강원특별자치도 삼척시 하장면 중봉당골길 297 | 정상 | 2 |