Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 179 |
Missing cells | 39 |
Missing cells (%) | 3.6% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.6% |
Total size in memory | 8.7 KiB |
Average record size in memory | 49.7 B |
Variable types
Categorical | 2 |
---|---|
Text | 3 |
Numeric | 1 |
Dataset
Description | 서산시의 숙박업소 현황에 대한 데이터입니다. 항목명은 업종명, 업소명, 업소소재지, 소재지전화, 객실수로 이루어져 있습니다. |
---|---|
Author | 충청남도 |
URL | https://alldam.chungnam.go.kr/index.chungnam?menuCd=DOM_000000201001001001&st=&cds=&orgCd=&apiType=&isOpen=Y&pageIndex=445&beforeMenuCd=DOM_000000201001001000&publicdatapk=15069198 |
데이터기준일 has constant value "" | Constant |
Dataset has 1 (0.6%) duplicate rows | Duplicates |
업종명 is highly imbalanced (73.7%) | Imbalance |
소재지전화 has 39 (21.8%) missing values | Missing |
Reproduction
Analysis started | 2024-01-09 21:36:39.181906 |
---|---|
Analysis finished | 2024-01-09 21:36:39.651981 |
Duration | 0.47 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업종명
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
숙박업(일반) | |
---|---|
숙박업(생활) | 8 |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 숙박업(일반) |
---|---|
2nd row | 숙박업(일반) |
3rd row | 숙박업(일반) |
4th row | 숙박업(일반) |
5th row | 숙박업(일반) |
Common Values
Value | Count | Frequency (%) |
숙박업(일반) | 171 | |
숙박업(생활) | 8 | 4.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
숙박업(일반 | 171 | |
숙박업(생활 | 8 | 4.5% |
업소명
Text
Distinct | 177 |
---|---|
Distinct (%) | 98.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Value | Count | Frequency (%) |
모텔 | 4 | 2.2% |
한일여인숙 | 2 | 1.1% |
뉴그린모텔 | 2 | 1.1% |
천송펜션 | 1 | 0.5% |
중왕펜션 | 1 | 0.5% |
블루스카이 | 1 | 0.5% |
화정여인숙 | 1 | 0.5% |
부석모텔 | 1 | 0.5% |
프로포즈모텔 | 1 | 0.5% |
청수파크 | 1 | 0.5% |
Other values (171) | 171 |
Most occurring characters
Value | Count | Frequency (%) |
텔 | 105 | 12.0% |
모 | 73 | 8.3% |
여 | 48 | 5.5% |
인 | 39 | 4.5% |
장 | 29 | 3.3% |
관 | 25 | 2.9% |
숙 | 24 | 2.7% |
호 | 24 | 2.7% |
리 | 17 | 1.9% |
이 | 15 | 1.7% |
Other values (194) | 476 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 861 | |
Space Separator | 7 | 0.8% |
Other Punctuation | 2 | 0.2% |
Open Punctuation | 2 | 0.2% |
Close Punctuation | 2 | 0.2% |
Uppercase Letter | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
텔 | 105 | 12.2% |
모 | 73 | 8.5% |
여 | 48 | 5.6% |
인 | 39 | 4.5% |
장 | 29 | 3.4% |
관 | 25 | 2.9% |
숙 | 24 | 2.8% |
호 | 24 | 2.8% |
리 | 17 | 2.0% |
이 | 15 | 1.7% |
Other values (189) | 462 |
Space Separator
Value | Count | Frequency (%) |
7 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Uppercase Letter
Value | Count | Frequency (%) |
J | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 861 | |
Common | 13 | 1.5% |
Latin | 1 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
텔 | 105 | 12.2% |
모 | 73 | 8.5% |
여 | 48 | 5.6% |
인 | 39 | 4.5% |
장 | 29 | 3.4% |
관 | 25 | 2.9% |
숙 | 24 | 2.8% |
호 | 24 | 2.8% |
리 | 17 | 2.0% |
이 | 15 | 1.7% |
Other values (189) | 462 |
Common
Value | Count | Frequency (%) |
7 | ||
. | 2 | 15.4% |
( | 2 | 15.4% |
) | 2 | 15.4% |
Latin
Value | Count | Frequency (%) |
J | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 861 | |
ASCII | 14 | 1.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
텔 | 105 | 12.2% |
모 | 73 | 8.5% |
여 | 48 | 5.6% |
인 | 39 | 4.5% |
장 | 29 | 3.4% |
관 | 25 | 2.9% |
숙 | 24 | 2.8% |
호 | 24 | 2.8% |
리 | 17 | 2.0% |
이 | 15 | 1.7% |
Other values (189) | 462 |
ASCII
Value | Count | Frequency (%) |
7 | ||
. | 2 | 14.3% |
( | 2 | 14.3% |
) | 2 | 14.3% |
J | 1 | 7.1% |
업소소재지(도로명)
Text
Distinct | 178 |
---|---|
Distinct (%) | 99.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Length
Max length | 64 |
---|---|
Median length | 44 |
Mean length | 24.96648 |
Min length | 19 |
Characters and Unicode
Total characters | 4469 |
---|---|
Distinct characters | 128 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 177 ? |
---|---|
Unique (%) | 98.9% |
Sample
1st row | 충청남도 서산시 시장4길 5-1 (동문동) |
---|---|
2nd row | 충청남도 서산시 고운로 195 (동문동) |
3rd row | 충청남도 서산시 연당3길 12 (동문동) |
4th row | 충청남도 서산시 번화2로 44-1 (동문동) |
5th row | 충청남도 서산시 고운로 198 (동문동) |
Value | Count | Frequency (%) |
충청남도 | 179 | |
서산시 | 179 | |
읍내동 | 44 | 4.6% |
동문동 | 43 | 4.5% |
대산읍 | 29 | 3.0% |
동헌로 | 12 | 1.3% |
읍내1로 | 11 | 1.1% |
충의로 | 11 | 1.1% |
시장6로 | 10 | 1.0% |
시장4길 | 9 | 0.9% |
Other values (274) | 431 |
Most occurring characters
Value | Count | Frequency (%) |
779 | 17.4% | |
산 | 221 | 4.9% |
시 | 205 | 4.6% |
1 | 200 | 4.5% |
충 | 191 | 4.3% |
남 | 182 | 4.1% |
동 | 182 | 4.1% |
서 | 181 | 4.1% |
도 | 180 | 4.0% |
청 | 180 | 4.0% |
Other values (118) | 1968 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2477 | |
Space Separator | 779 | 17.4% |
Decimal Number | 741 | 16.6% |
Close Punctuation | 126 | 2.8% |
Open Punctuation | 126 | 2.8% |
Dash Punctuation | 93 | 2.1% |
Other Punctuation | 75 | 1.7% |
Math Symbol | 43 | 1.0% |
Uppercase Letter | 9 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 221 | 8.9% |
시 | 205 | 8.3% |
충 | 191 | 7.7% |
남 | 182 | 7.3% |
동 | 182 | 7.3% |
서 | 181 | 7.3% |
도 | 180 | 7.3% |
청 | 180 | 7.3% |
로 | 125 | 5.0% |
읍 | 104 | 4.2% |
Other values (98) | 726 |
Decimal Number
Value | Count | Frequency (%) |
1 | 200 | |
2 | 127 | |
3 | 82 | |
4 | 68 | 9.2% |
6 | 56 | 7.6% |
5 | 49 | 6.6% |
9 | 47 | 6.3% |
0 | 42 | 5.7% |
7 | 40 | 5.4% |
8 | 30 | 4.0% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 4 | |
A | 3 | |
D | 1 | 11.1% |
C | 1 | 11.1% |
Space Separator
Value | Count | Frequency (%) |
779 |
Close Punctuation
Value | Count | Frequency (%) |
) | 126 |
Open Punctuation
Value | Count | Frequency (%) |
( | 126 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 93 |
Other Punctuation
Value | Count | Frequency (%) |
, | 75 |
Math Symbol
Value | Count | Frequency (%) |
~ | 43 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2477 | |
Common | 1983 | |
Latin | 9 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 221 | 8.9% |
시 | 205 | 8.3% |
충 | 191 | 7.7% |
남 | 182 | 7.3% |
동 | 182 | 7.3% |
서 | 181 | 7.3% |
도 | 180 | 7.3% |
청 | 180 | 7.3% |
로 | 125 | 5.0% |
읍 | 104 | 4.2% |
Other values (98) | 726 |
Common
Value | Count | Frequency (%) |
779 | ||
1 | 200 | 10.1% |
2 | 127 | 6.4% |
) | 126 | 6.4% |
( | 126 | 6.4% |
- | 93 | 4.7% |
3 | 82 | 4.1% |
, | 75 | 3.8% |
4 | 68 | 3.4% |
6 | 56 | 2.8% |
Other values (6) | 251 | 12.7% |
Latin
Value | Count | Frequency (%) |
B | 4 | |
A | 3 | |
D | 1 | 11.1% |
C | 1 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2477 | |
ASCII | 1992 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
779 | ||
1 | 200 | 10.0% |
2 | 127 | 6.4% |
) | 126 | 6.3% |
( | 126 | 6.3% |
- | 93 | 4.7% |
3 | 82 | 4.1% |
, | 75 | 3.8% |
4 | 68 | 3.4% |
6 | 56 | 2.8% |
Other values (10) | 260 | 13.1% |
Hangul
Value | Count | Frequency (%) |
산 | 221 | 8.9% |
시 | 205 | 8.3% |
충 | 191 | 7.7% |
남 | 182 | 7.3% |
동 | 182 | 7.3% |
서 | 181 | 7.3% |
도 | 180 | 7.3% |
청 | 180 | 7.3% |
로 | 125 | 5.0% |
읍 | 104 | 4.2% |
Other values (98) | 726 |
소재지전화
Text
MISSING
 
Distinct | 137 |
---|---|
Distinct (%) | 97.9% |
Missing | 39 |
Missing (%) | 21.8% |
Memory size | 1.5 KiB |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 12 |
Min length | 12 |
Characters and Unicode
Total characters | 1680 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 134 ? |
---|---|
Unique (%) | 95.7% |
Sample
1st row | 041-665-0505 |
---|---|
2nd row | 041-665-2618 |
3rd row | 041-662-1535 |
4th row | 041-665-3368 |
5th row | 041-665-3066 |
Value | Count | Frequency (%) |
041-669-9449 | 2 | 1.4% |
041-664-9933 | 2 | 1.4% |
041-668-7822 | 2 | 1.4% |
041-669-2988 | 1 | 0.7% |
041-663-5048 | 1 | 0.7% |
041-688-8488 | 1 | 0.7% |
041-665-3106 | 1 | 0.7% |
041-668-5858 | 1 | 0.7% |
041-666-2255 | 1 | 0.7% |
041-664-1797 | 1 | 0.7% |
Other values (127) | 127 |
Most occurring characters
Value | Count | Frequency (%) |
6 | 314 | |
- | 280 | |
0 | 222 | |
1 | 208 | |
4 | 196 | |
5 | 107 | 6.4% |
8 | 102 | 6.1% |
3 | 74 | 4.4% |
9 | 64 | 3.8% |
2 | 64 | 3.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1400 | |
Dash Punctuation | 280 | 16.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
6 | 314 | |
0 | 222 | |
1 | 208 | |
4 | 196 | |
5 | 107 | 7.6% |
8 | 102 | 7.3% |
3 | 74 | 5.3% |
9 | 64 | 4.6% |
2 | 64 | 4.6% |
7 | 49 | 3.5% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 280 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1680 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
6 | 314 | |
- | 280 | |
0 | 222 | |
1 | 208 | |
4 | 196 | |
5 | 107 | 6.4% |
8 | 102 | 6.1% |
3 | 74 | 4.4% |
9 | 64 | 3.8% |
2 | 64 | 3.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1680 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6 | 314 | |
- | 280 | |
0 | 222 | |
1 | 208 | |
4 | 196 | |
5 | 107 | 6.4% |
8 | 102 | 6.1% |
3 | 74 | 4.4% |
9 | 64 | 3.8% |
2 | 64 | 3.8% |
객실수
Real number (ℝ)
Distinct | 45 |
---|---|
Distinct (%) | 25.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 23.256983 |
Minimum | 4 |
---|---|
Maximum | 194 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.7 KiB |
Quantile statistics
Minimum | 4 |
---|---|
5-th percentile | 7 |
Q1 | 12 |
median | 19 |
Q3 | 29 |
95-th percentile | 46 |
Maximum | 194 |
Range | 190 |
Interquartile range (IQR) | 17 |
Descriptive statistics
Standard deviation | 19.0151 |
---|---|
Coefficient of variation (CV) | 0.8176082 |
Kurtosis | 38.591079 |
Mean | 23.256983 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 4.9496223 |
Sum | 4163 |
Variance | 361.57404 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
19 | 17 | 9.5% |
12 | 12 | 6.7% |
18 | 11 | 6.1% |
10 | 11 | 6.1% |
36 | 10 | 5.6% |
17 | 7 | 3.9% |
7 | 7 | 3.9% |
8 | 7 | 3.9% |
29 | 6 | 3.4% |
15 | 6 | 3.4% |
Other values (35) | 85 |
Value | Count | Frequency (%) |
4 | 1 | 0.6% |
5 | 3 | 1.7% |
6 | 2 | 1.1% |
7 | 7 | |
8 | 7 | |
9 | 4 | 2.2% |
10 | 11 | |
11 | 1 | 0.6% |
12 | 12 | |
13 | 4 | 2.2% |
Value | Count | Frequency (%) |
194 | 1 | 0.6% |
115 | 1 | 0.6% |
70 | 1 | 0.6% |
69 | 1 | 0.6% |
56 | 1 | 0.6% |
53 | 1 | 0.6% |
51 | 1 | 0.6% |
46 | 4 | |
44 | 1 | 0.6% |
40 | 3 |
데이터기준일
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
2021-10-27 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2021-10-27 |
---|---|
2nd row | 2021-10-27 |
3rd row | 2021-10-27 |
4th row | 2021-10-27 |
5th row | 2021-10-27 |
Common Values
Value | Count | Frequency (%) |
2021-10-27 | 179 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2021-10-27 | 179 |
업종명 | 객실수 | |
---|---|---|
업종명 | 1.000 | 0.000 |
객실수 | 0.000 | 1.000 |
객실수 | 업종명 | |
---|---|---|
객실수 | 1.000 | 0.000 |
업종명 | 0.000 | 1.000 |
업종명 | 업소명 | 업소소재지(도로명) | 소재지전화 | 객실수 | 데이터기준일 | |
---|---|---|---|---|---|---|
0 | 숙박업(일반) | 한일여인숙 | 충청남도 서산시 시장4길 5-1 (동문동) | 041-665-0505 | 14 | 2021-10-27 |
1 | 숙박업(일반) | 서인여인숙 | 충청남도 서산시 고운로 195 (동문동) | 041-665-2618 | 8 | 2021-10-27 |
2 | 숙박업(일반) | 화정여인숙 | 충청남도 서산시 연당3길 12 (동문동) | 041-662-1535 | 12 | 2021-10-27 |
3 | 숙박업(일반) | 신화여인숙 | 충청남도 서산시 번화2로 44-1 (동문동) | 041-665-3368 | 12 | 2021-10-27 |
4 | 숙박업(일반) | 부흥여인숙 | 충청남도 서산시 고운로 198 (동문동) | 041-665-3066 | 10 | 2021-10-27 |
5 | 숙박업(일반) | 대지여인숙 | 충청남도 서산시 번화2로 50-6 (동문동) | 041-665-3682 | 7 | 2021-10-27 |
6 | 숙박업(일반) | 양지여인숙 | 충청남도 서산시 대산읍 죽엽로 10 | <NA> | 7 | 2021-10-27 |
7 | 숙박업(일반) | 여로여인숙 | 충청남도 서산시 고운로 166-10 (동문동) | 041-665-2505 | 8 | 2021-10-27 |
8 | 숙박업(일반) | 한일여인숙 | 충청남도 서산시 대산읍 삼길포2길 32-10 | 041-663-7082 | 5 | 2021-10-27 |
9 | 숙박업(일반) | 중앙여관 | 충청남도 서산시 시장6로 30-9 (동문동) | 041-665-8001 | 20 | 2021-10-27 |
업종명 | 업소명 | 업소소재지(도로명) | 소재지전화 | 객실수 | 데이터기준일 | |
---|---|---|---|---|---|---|
169 | 숙박업(일반) | 자자호텔 | 충청남도 서산시 대산읍 구진천로 10-9 | 041-665-5200 | 46 | 2021-10-27 |
170 | 숙박업(일반) | 톡무인텔 | 충청남도 서산시 음암면 상홍검동길 34-22, 토크무인텔 2층 | 041-664-2400 | 23 | 2021-10-27 |
171 | 숙박업(생활) | 서산펜션 해뜨는비치 | 충청남도 서산시 지곡면 왕산길 6-16, 1~4동 | 041-669-3890 | 20 | 2021-10-27 |
172 | 숙박업(생활) | 펜션파인씨 | 충청남도 서산시 팔봉면 호리영살길 122 | 041-669-6777 | 9 | 2021-10-27 |
173 | 숙박업(생활) | 중왕펜션 | 충청남도 서산시 지곡면 왕산길 16-4 (-6(1,2동),-9(1,2동)-10,-11-12,-13(1,2동),14) | 041-664-6270 | 13 | 2021-10-27 |
174 | 숙박업(생활) | 천송펜션 | 충청남도 서산시 팔봉면 정자동길 161-38 (가동(1,2층),나동(1,2층)) | 041-664-3319 | 9 | 2021-10-27 |
175 | 숙박업(생활) | 나폴리펜션 | 충청남도 서산시 팔봉면 호리1길 132-10, A동, B동(201,202,301,302호) | 041-669-2988 | 7 | 2021-10-27 |
176 | 숙박업(생활) | 리젠트모텔 | 충청남도 서산시 동헌로 89, 1~6층 (읍내동) | <NA> | 36 | 2021-10-27 |
177 | 숙박업(생활) | 바닷가펜션 | 충청남도 서산시 지곡면 왕산길 6-10, 1~2동 | <NA> | 4 | 2021-10-27 |
178 | 숙박업(생활) | 썬셋모텔펜션 | 충청남도 서산시 부석면 창리2길 27, 2~3층 | 041-669-7933 | 13 | 2021-10-27 |
Most frequently occurring
업종명 | 업소명 | 업소소재지(도로명) | 소재지전화 | 객실수 | 데이터기준일 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | 숙박업(일반) | 뉴그린모텔 | 충청남도 서산시 지곡면 왕산이로 6 | 041-669-9449 | 19 | 2021-10-27 | 2 |