Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 275 |
Missing cells | 3 |
Missing cells (%) | 0.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 11.4 KiB |
Average record size in memory | 42.5 B |
Variable types
Categorical | 1 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 진주시 관내 운영중인 호텔, 여관, 모텔, 민박, 펜션 등 숙박정보에 대한 업소명, 소재지, 면적, 객실수 설명입니다 |
---|---|
URL | https://www.data.go.kr/data/3066707/fileData.do |
영업장면적 is highly overall correlated with 객실수 and 1 other fields | High correlation |
객실수 is highly overall correlated with 영업장면적 and 1 other fields | High correlation |
업종명 is highly overall correlated with 영업장면적 and 1 other fields | High correlation |
업종명 is highly imbalanced (89.0%) | Imbalance |
영업장면적 has 3 (1.1%) missing values | Missing |
영업장면적 has 4 (1.5%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 13:02:58.256788 |
---|---|
Analysis finished | 2023-12-12 13:02:59.159891 |
Duration | 0.9 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업종명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
숙박업(일반) | |
---|---|
숙박업(생활) | 4 |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 숙박업(일반) |
---|---|
2nd row | 숙박업(일반) |
3rd row | 숙박업(일반) |
4th row | 숙박업(일반) |
5th row | 숙박업(일반) |
Common Values
Value | Count | Frequency (%) |
숙박업(일반) | 271 | |
숙박업(생활) | 4 | 1.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
숙박업(일반 | 271 | |
숙박업(생활 | 4 | 1.5% |
업소명
Text
Distinct | 268 |
---|---|
Distinct (%) | 97.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Value | Count | Frequency (%) |
모텔 | 4 | 1.4% |
제이모텔 | 2 | 0.7% |
휴모텔 | 2 | 0.7% |
진주성점 | 2 | 0.7% |
코지모텔 | 2 | 0.7% |
드림모텔 | 2 | 0.7% |
동경모텔 | 2 | 0.7% |
썸모텔 | 2 | 0.7% |
헤라모텔 | 2 | 0.7% |
리버빌 | 1 | 0.3% |
Other values (270) | 270 |
Most occurring characters
Value | Count | Frequency (%) |
텔 | 183 | 12.8% |
모 | 133 | 9.3% |
여 | 65 | 4.5% |
관 | 62 | 4.3% |
장 | 52 | 3.6% |
호 | 52 | 3.6% |
스 | 31 | 2.2% |
이 | 23 | 1.6% |
) | 21 | 1.5% |
( | 21 | 1.5% |
Other values (282) | 787 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1286 | |
Uppercase Letter | 55 | 3.8% |
Close Punctuation | 21 | 1.5% |
Open Punctuation | 21 | 1.5% |
Lowercase Letter | 19 | 1.3% |
Space Separator | 16 | 1.1% |
Decimal Number | 8 | 0.6% |
Other Punctuation | 3 | 0.2% |
Math Symbol | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
텔 | 183 | 14.2% |
모 | 133 | 10.3% |
여 | 65 | 5.1% |
관 | 62 | 4.8% |
장 | 52 | 4.0% |
호 | 52 | 4.0% |
스 | 31 | 2.4% |
이 | 23 | 1.8% |
성 | 16 | 1.2% |
라 | 15 | 1.2% |
Other values (240) | 654 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 6 | |
T | 6 | |
S | 4 | 7.3% |
A | 4 | 7.3% |
L | 4 | 7.3% |
O | 4 | 7.3% |
H | 4 | 7.3% |
M | 4 | 7.3% |
I | 3 | 5.5% |
G | 3 | 5.5% |
Other values (9) | 13 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 5 | |
o | 3 | |
t | 2 | 10.5% |
l | 2 | 10.5% |
r | 2 | 10.5% |
h | 1 | 5.3% |
s | 1 | 5.3% |
p | 1 | 5.3% |
u | 1 | 5.3% |
v | 1 | 5.3% |
Decimal Number
Value | Count | Frequency (%) |
2 | 2 | |
9 | 2 | |
5 | 1 | |
8 | 1 | |
4 | 1 | |
7 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 | |
' | 1 | |
. | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 21 |
Open Punctuation
Value | Count | Frequency (%) |
( | 21 |
Space Separator
Value | Count | Frequency (%) |
16 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1286 | |
Latin | 74 | 5.2% |
Common | 70 | 4.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
텔 | 183 | 14.2% |
모 | 133 | 10.3% |
여 | 65 | 5.1% |
관 | 62 | 4.8% |
장 | 52 | 4.0% |
호 | 52 | 4.0% |
스 | 31 | 2.4% |
이 | 23 | 1.8% |
성 | 16 | 1.2% |
라 | 15 | 1.2% |
Other values (240) | 654 |
Latin
Value | Count | Frequency (%) |
E | 6 | 8.1% |
T | 6 | 8.1% |
e | 5 | 6.8% |
S | 4 | 5.4% |
A | 4 | 5.4% |
L | 4 | 5.4% |
O | 4 | 5.4% |
H | 4 | 5.4% |
M | 4 | 5.4% |
I | 3 | 4.1% |
Other values (19) | 30 |
Common
Value | Count | Frequency (%) |
) | 21 | |
( | 21 | |
16 | ||
2 | 2 | 2.9% |
9 | 2 | 2.9% |
& | 1 | 1.4% |
' | 1 | 1.4% |
5 | 1 | 1.4% |
+ | 1 | 1.4% |
8 | 1 | 1.4% |
Other values (3) | 3 | 4.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1286 | |
ASCII | 144 | 10.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
텔 | 183 | 14.2% |
모 | 133 | 10.3% |
여 | 65 | 5.1% |
관 | 62 | 4.8% |
장 | 52 | 4.0% |
호 | 52 | 4.0% |
스 | 31 | 2.4% |
이 | 23 | 1.8% |
성 | 16 | 1.2% |
라 | 15 | 1.2% |
Other values (240) | 654 |
ASCII
Value | Count | Frequency (%) |
) | 21 | 14.6% |
( | 21 | 14.6% |
16 | 11.1% | |
E | 6 | 4.2% |
T | 6 | 4.2% |
e | 5 | 3.5% |
S | 4 | 2.8% |
A | 4 | 2.8% |
L | 4 | 2.8% |
O | 4 | 2.8% |
Other values (32) | 53 |
영업소 주소(도로명)
Text
Distinct | 274 |
---|---|
Distinct (%) | 99.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.3 KiB |
Length
Max length | 50 |
---|---|
Median length | 44 |
Mean length | 27.232727 |
Min length | 20 |
Characters and Unicode
Total characters | 7489 |
---|---|
Distinct characters | 127 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 273 ? |
---|---|
Unique (%) | 99.3% |
Sample
1st row | 경상남도 진주시 비봉로54번길 8 (계동) |
---|---|
2nd row | 경상남도 진주시 진주대로1032번길 11 (동성동) |
3rd row | 경상남도 진주시 진주대로1040번길 10 (동성동) |
4th row | 경상남도 진주시 진주대로891번길 41 (강남동) |
5th row | 경상남도 진주시 진주대로879번길 14-16 (강남동) |
Value | Count | Frequency (%) |
경상남도 | 275 | 18.9% |
진주시 | 275 | 18.9% |
장대동 | 38 | 2.6% |
상평동 | 32 | 2.2% |
봉곡동 | 32 | 2.2% |
상대동 | 22 | 1.5% |
논개길 | 18 | 1.2% |
강남동 | 18 | 1.2% |
남강로 | 17 | 1.2% |
옥봉동 | 17 | 1.2% |
Other values (363) | 710 |
Most occurring characters
Value | Count | Frequency (%) |
1180 | 15.8% | |
남 | 347 | 4.6% |
진 | 346 | 4.6% |
상 | 337 | 4.5% |
주 | 327 | 4.4% |
1 | 319 | 4.3% |
동 | 290 | 3.9% |
도 | 284 | 3.8% |
경 | 275 | 3.7% |
시 | 275 | 3.7% |
Other values (117) | 3509 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4229 | |
Decimal Number | 1294 | 17.3% |
Space Separator | 1180 | 15.8% |
Open Punctuation | 269 | 3.6% |
Close Punctuation | 269 | 3.6% |
Other Punctuation | 129 | 1.7% |
Dash Punctuation | 97 | 1.3% |
Math Symbol | 20 | 0.3% |
Uppercase Letter | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
남 | 347 | 8.2% |
진 | 346 | 8.2% |
상 | 337 | 8.0% |
주 | 327 | 7.7% |
동 | 290 | 6.9% |
도 | 284 | 6.7% |
경 | 275 | 6.5% |
시 | 275 | 6.5% |
로 | 256 | 6.1% |
길 | 196 | 4.6% |
Other values (97) | 1296 |
Decimal Number
Value | Count | Frequency (%) |
1 | 319 | |
2 | 135 | |
5 | 132 | |
6 | 130 | |
3 | 127 | 9.8% |
4 | 99 | 7.7% |
0 | 98 | 7.6% |
9 | 97 | 7.5% |
7 | 88 | 6.8% |
8 | 69 | 5.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 127 | |
/ | 1 | 0.8% |
. | 1 | 0.8% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 1 | |
B | 1 |
Space Separator
Value | Count | Frequency (%) |
1180 |
Open Punctuation
Value | Count | Frequency (%) |
( | 269 |
Close Punctuation
Value | Count | Frequency (%) |
) | 269 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 97 |
Math Symbol
Value | Count | Frequency (%) |
~ | 20 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4229 | |
Common | 3258 | |
Latin | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
남 | 347 | 8.2% |
진 | 346 | 8.2% |
상 | 337 | 8.0% |
주 | 327 | 7.7% |
동 | 290 | 6.9% |
도 | 284 | 6.7% |
경 | 275 | 6.5% |
시 | 275 | 6.5% |
로 | 256 | 6.1% |
길 | 196 | 4.6% |
Other values (97) | 1296 |
Common
Value | Count | Frequency (%) |
1180 | ||
1 | 319 | 9.8% |
( | 269 | 8.3% |
) | 269 | 8.3% |
2 | 135 | 4.1% |
5 | 132 | 4.1% |
6 | 130 | 4.0% |
, | 127 | 3.9% |
3 | 127 | 3.9% |
4 | 99 | 3.0% |
Other values (8) | 471 | 14.5% |
Latin
Value | Count | Frequency (%) |
A | 1 | |
B | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4229 | |
ASCII | 3260 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1180 | ||
1 | 319 | 9.8% |
( | 269 | 8.3% |
) | 269 | 8.3% |
2 | 135 | 4.1% |
5 | 132 | 4.0% |
6 | 130 | 4.0% |
, | 127 | 3.9% |
3 | 127 | 3.9% |
4 | 99 | 3.0% |
Other values (10) | 473 |
Hangul
Value | Count | Frequency (%) |
남 | 347 | 8.2% |
진 | 346 | 8.2% |
상 | 337 | 8.0% |
주 | 327 | 7.7% |
동 | 290 | 6.9% |
도 | 284 | 6.7% |
경 | 275 | 6.5% |
시 | 275 | 6.5% |
로 | 256 | 6.1% |
길 | 196 | 4.6% |
Other values (97) | 1296 |
영업장면적
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 261 |
---|---|
Distinct (%) | 96.0% |
Missing | 3 |
Missing (%) | 1.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 669.74125 |
Minimum | 0 |
---|---|
Maximum | 5954 |
Zeros | 4 |
Zeros (%) | 1.5% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.5 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 146.021 |
Q1 | 320.6025 |
median | 455.115 |
Q3 | 740.78 |
95-th percentile | 1710.736 |
Maximum | 5954 |
Range | 5954 |
Interquartile range (IQR) | 420.1775 |
Descriptive statistics
Standard deviation | 770.48003 |
---|---|
Coefficient of variation (CV) | 1.1504145 |
Kurtosis | 22.021852 |
Mean | 669.74125 |
Median Absolute Deviation (MAD) | 177.725 |
Skewness | 4.2082047 |
Sum | 182169.62 |
Variance | 593639.47 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 4 | 1.5% |
812.39 | 3 | 1.1% |
446.8 | 2 | 0.7% |
652.18 | 2 | 0.7% |
594.0 | 2 | 0.7% |
331.2 | 2 | 0.7% |
408.05 | 2 | 0.7% |
575.78 | 2 | 0.7% |
2223.26 | 1 | 0.4% |
518.24 | 1 | 0.4% |
Other values (251) | 251 | |
(Missing) | 3 | 1.1% |
Value | Count | Frequency (%) |
0.0 | 4 | |
37.69 | 1 | 0.4% |
69.38 | 1 | 0.4% |
76.48 | 1 | 0.4% |
90.05 | 1 | 0.4% |
108.63 | 1 | 0.4% |
111.38 | 1 | 0.4% |
116.2 | 1 | 0.4% |
119.5 | 1 | 0.4% |
139.37 | 1 | 0.4% |
Value | Count | Frequency (%) |
5954.0 | 1 | |
5803.8 | 1 | |
4892.52 | 1 | |
4875.33 | 1 | |
4115.42 | 1 | |
2800.95 | 1 | |
2800.52 | 1 | |
2436.56 | 1 | |
2322.78 | 1 | |
2306.0 | 1 |
객실수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 42 |
---|---|
Distinct (%) | 15.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20.047273 |
Minimum | 5 |
---|---|
Maximum | 128 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.5 KiB |
Quantile statistics
Minimum | 5 |
---|---|
5-th percentile | 9 |
Q1 | 13 |
median | 17 |
Q3 | 23 |
95-th percentile | 35 |
Maximum | 128 |
Range | 123 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 13.741937 |
---|---|
Coefficient of variation (CV) | 0.68547661 |
Kurtosis | 25.265249 |
Mean | 20.047273 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 4.3261304 |
Sum | 5513 |
Variance | 188.84082 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
19 | 25 | 9.1% |
18 | 23 | 8.4% |
14 | 22 | 8.0% |
15 | 21 | 7.6% |
12 | 19 | 6.9% |
11 | 13 | 4.7% |
16 | 13 | 4.7% |
13 | 12 | 4.4% |
20 | 12 | 4.4% |
17 | 11 | 4.0% |
Other values (32) | 104 |
Value | Count | Frequency (%) |
5 | 3 | 1.1% |
7 | 3 | 1.1% |
8 | 7 | 2.5% |
9 | 3 | 1.1% |
10 | 11 | |
11 | 13 | |
12 | 19 | |
13 | 12 | |
14 | 22 | |
15 | 21 |
Value | Count | Frequency (%) |
128 | 1 | |
110 | 1 | |
95 | 1 | |
83 | 1 | |
76 | 1 | |
72 | 1 | |
57 | 1 | |
53 | 1 | |
43 | 1 | |
38 | 1 |
업종명 | 영업장면적 | 객실수 | |
---|---|---|---|
업종명 | 1.000 | 0.817 | 0.974 |
영업장면적 | 0.817 | 1.000 | 0.915 |
객실수 | 0.974 | 0.915 | 1.000 |
영업장면적 | 객실수 | 업종명 | |
---|---|---|---|
영업장면적 | 1.000 | 0.895 | 0.630 |
객실수 | 0.895 | 1.000 | 0.848 |
업종명 | 0.630 | 0.848 | 1.000 |
업종명 | 업소명 | 영업소 주소(도로명) | 영업장면적 | 객실수 | |
---|---|---|---|---|---|
0 | 숙박업(일반) | 진주스토리 | 경상남도 진주시 비봉로54번길 8 (계동) | 272.0 | 36 |
1 | 숙박업(일반) | 진성모텔 | 경상남도 진주시 진주대로1032번길 11 (동성동) | 454.92 | 12 |
2 | 숙박업(일반) | 휴모텔 | 경상남도 진주시 진주대로1040번길 10 (동성동) | 139.37 | 15 |
3 | 숙박업(일반) | 진양장여관 | 경상남도 진주시 진주대로891번길 41 (강남동) | 147.11 | 13 |
4 | 숙박업(일반) | 삼학여관 | 경상남도 진주시 진주대로879번길 14-16 (강남동) | 158.68 | 8 |
5 | 숙박업(일반) | 백만장여관 | 경상남도 진주시 장대로10번길 10 (장대동) | 116.2 | 11 |
6 | 숙박업(일반) | 삼성여관 | 경상남도 진주시 장대로6번길 5-1 (장대동) | 69.38 | 11 |
7 | 숙박업(일반) | 유명장여관 | 경상남도 진주시 진양호로564번길 12 (장대동) | 400.59 | 19 |
8 | 숙박업(일반) | 선화장여관 | 경상남도 진주시 장대로15번길 5-2 (장대동) | 206.28 | 7 |
9 | 숙박업(일반) | 이화장 여관 | 경상남도 진주시 장대로6번길 5 (장대동) | 157.69 | 11 |
업종명 | 업소명 | 영업소 주소(도로명) | 영업장면적 | 객실수 | |
---|---|---|---|---|---|
265 | 숙박업(일반) | 호텔보보 | 경상남도 진주시 돗골로20번길 11 (상평동) | 511.87 | 17 |
266 | 숙박업(일반) | 호텔로그인 | 경상남도 진주시 정촌면 화개천로54번길 33-16, 1~3층 | 2800.95 | 28 |
267 | 숙박업(일반) | 에포케호텔 | 경상남도 진주시 정촌면 화개천로 132-19, 1,2,3층 | 2223.26 | 23 |
268 | 숙박업(일반) | 히트모텔 | 경상남도 진주시 논개길 49, 1층~5층 (장대동) | 459.05 | 20 |
269 | 숙박업(일반) | 에스티알엘(Strl)호텔 | 경상남도 진주시 순환로 506, 1층~7층 (평거동) | 1729.26 | 35 |
270 | 숙박업(일반) | 호텔테라 | 경상남도 진주시 정촌면 화개천로54번길 81, 1층~3층 | 1207.14 | 10 |
271 | 숙박업(생활) | 주식회사라온스테이 | 경상남도 진주시 영천강로 164, 라온스테이페를라1차 95객실 3층~14층 (충무공동) | 2193.31 | 95 |
272 | 숙박업(생활) | 더클라우드 | 경상남도 진주시 논개길 47-2 (장대동, 1층~6층) | 724.35 | 19 |
273 | 숙박업(생활) | 뉴라온스테이 | 경상남도 진주시 영천강로 166, 라온 스테이 인 페를라 2차 3-14층 (충무공동) | 4115.42 | 110 |
274 | 숙박업(생활) | 골든튤립호텔남강 | 경상남도 진주시 남강로673번길 16, 골든튤립남강 4층-16층 (동성동) | 4875.33 | 128 |