Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 9493 |
Missing cells | 1 |
Missing cells (%) | < 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 306.1 KiB |
Average record size in memory | 33.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 1 |
Text | 2 |
Dataset
Description | 이 파일은 인천광역시 관내 미용실 및 목욕탕에 대한 데이터입니다. 해당 업소의 상호명 및 상세 주소 등에 대한 정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15061611/fileData.do |
Reproduction
Analysis started | 2023-12-12 12:17:15.401407 |
---|---|
Analysis finished | 2023-12-12 12:17:16.923443 |
Duration | 1.52 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 9493 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4747 |
Minimum | 1 |
---|---|
Maximum | 9493 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 83.6 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 475.6 |
Q1 | 2374 |
median | 4747 |
Q3 | 7120 |
95-th percentile | 9018.4 |
Maximum | 9493 |
Range | 9492 |
Interquartile range (IQR) | 4746 |
Descriptive statistics
Standard deviation | 2740.5374 |
---|---|
Coefficient of variation (CV) | 0.57731986 |
Kurtosis | -1.2 |
Mean | 4747 |
Median Absolute Deviation (MAD) | 2373 |
Skewness | 0 |
Sum | 45063271 |
Variance | 7510545.2 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
6325 | 1 | < 0.1% |
6327 | 1 | < 0.1% |
6328 | 1 | < 0.1% |
6329 | 1 | < 0.1% |
6330 | 1 | < 0.1% |
6331 | 1 | < 0.1% |
6332 | 1 | < 0.1% |
6333 | 1 | < 0.1% |
6334 | 1 | < 0.1% |
Other values (9483) | 9483 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
9493 | 1 | |
9492 | 1 | |
9491 | 1 | |
9490 | 1 | |
9489 | 1 | |
9488 | 1 | |
9487 | 1 | |
9486 | 1 | |
9485 | 1 | |
9484 | 1 |
구분
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 74.3 KiB |
미용실 | |
---|---|
목욕탕 | 241 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 목욕탕 |
---|---|
2nd row | 목욕탕 |
3rd row | 미용실 |
4th row | 목욕탕 |
5th row | 목욕탕 |
Common Values
Value | Count | Frequency (%) |
미용실 | 9252 | |
목욕탕 | 241 | 2.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
미용실 | 9252 | |
목욕탕 | 241 | 2.5% |
상호명
Text
Distinct | 7990 |
---|---|
Distinct (%) | 84.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 74.3 KiB |
Value | Count | Frequency (%) |
헤어 | 229 | 1.9% |
hair | 116 | 1.0% |
nail | 94 | 0.8% |
네일 | 93 | 0.8% |
미용실 | 90 | 0.8% |
헤어샵 | 50 | 0.4% |
salon | 38 | 0.3% |
에스테틱 | 36 | 0.3% |
더 | 35 | 0.3% |
리안헤어 | 35 | 0.3% |
Other values (8300) | 10995 |
Most occurring characters
Value | Count | Frequency (%) |
어 | 4140 | 6.8% |
헤 | 3992 | 6.6% |
2319 | 3.8% | |
미 | 1686 | 2.8% |
이 | 1301 | 2.2% |
스 | 1296 | 2.1% |
일 | 1273 | 2.1% |
네 | 1232 | 2.0% |
리 | 1185 | 2.0% |
) | 1001 | 1.7% |
Other values (922) | 41041 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 48258 | |
Lowercase Letter | 3603 | 6.0% |
Uppercase Letter | 3134 | 5.2% |
Space Separator | 2319 | 3.8% |
Close Punctuation | 1057 | 1.7% |
Open Punctuation | 1056 | 1.7% |
Other Punctuation | 549 | 0.9% |
Decimal Number | 419 | 0.7% |
Dash Punctuation | 38 | 0.1% |
Connector Punctuation | 18 | < 0.1% |
Other values (5) | 15 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
어 | 4140 | 8.6% |
헤 | 3992 | 8.3% |
미 | 1686 | 3.5% |
이 | 1301 | 2.7% |
스 | 1296 | 2.7% |
일 | 1273 | 2.6% |
네 | 1232 | 2.6% |
리 | 1185 | 2.5% |
실 | 956 | 2.0% |
용 | 950 | 2.0% |
Other values (831) | 30247 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 519 | |
i | 417 | |
e | 365 | |
l | 298 | |
n | 294 | |
o | 283 | 7.9% |
r | 231 | 6.4% |
h | 171 | 4.7% |
s | 150 | 4.2% |
y | 142 | 3.9% |
Other values (16) | 733 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 361 | 11.5% |
N | 287 | 9.2% |
H | 241 | 7.7% |
I | 213 | 6.8% |
S | 205 | 6.5% |
L | 193 | 6.2% |
O | 186 | 5.9% |
E | 180 | 5.7% |
B | 150 | 4.8% |
R | 141 | 4.5% |
Other values (16) | 977 |
Other Punctuation
Value | Count | Frequency (%) |
& | 142 | |
, | 112 | |
. | 101 | |
# | 100 | |
' | 45 | 8.2% |
: | 22 | 4.0% |
· | 10 | 1.8% |
; | 6 | 1.1% |
! | 3 | 0.5% |
& | 3 | 0.5% |
Other values (3) | 5 | 0.9% |
Decimal Number
Value | Count | Frequency (%) |
1 | 90 | |
2 | 83 | |
0 | 61 | |
3 | 47 | |
5 | 31 | 7.4% |
6 | 29 | 6.9% |
4 | 21 | 5.0% |
9 | 20 | 4.8% |
7 | 19 | 4.5% |
8 | 18 | 4.3% |
Math Symbol
Value | Count | Frequency (%) |
+ | 4 | |
= | 2 | |
~ | 1 | 12.5% |
× | 1 | 12.5% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1001 | |
] | 56 | 5.3% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1000 | |
[ | 56 | 5.3% |
Modifier Symbol
Value | Count | Frequency (%) |
´ | 1 | |
` | 1 |
Space Separator
Value | Count | Frequency (%) |
2319 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 38 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 18 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 2 |
Other Symbol
Value | Count | Frequency (%) |
° | 2 |
Other Number
Value | Count | Frequency (%) |
₂ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 48210 | |
Latin | 6739 | 11.1% |
Common | 5469 | 9.0% |
Han | 48 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
어 | 4140 | 8.6% |
헤 | 3992 | 8.3% |
미 | 1686 | 3.5% |
이 | 1301 | 2.7% |
스 | 1296 | 2.7% |
일 | 1273 | 2.6% |
네 | 1232 | 2.6% |
리 | 1185 | 2.5% |
실 | 956 | 2.0% |
용 | 950 | 2.0% |
Other values (815) | 30199 |
Latin
Value | Count | Frequency (%) |
a | 519 | 7.7% |
i | 417 | 6.2% |
e | 365 | 5.4% |
A | 361 | 5.4% |
l | 298 | 4.4% |
n | 294 | 4.4% |
N | 287 | 4.3% |
o | 283 | 4.2% |
H | 241 | 3.6% |
r | 231 | 3.4% |
Other values (43) | 3443 |
Common
Value | Count | Frequency (%) |
2319 | ||
) | 1001 | |
( | 1000 | |
& | 142 | 2.6% |
, | 112 | 2.0% |
. | 101 | 1.8% |
# | 100 | 1.8% |
1 | 90 | 1.6% |
2 | 83 | 1.5% |
0 | 61 | 1.1% |
Other values (28) | 460 | 8.4% |
Han
Value | Count | Frequency (%) |
美 | 26 | |
秀 | 4 | 8.3% |
休 | 2 | 4.2% |
愛 | 2 | 4.2% |
姬 | 2 | 4.2% |
家 | 2 | 4.2% |
林 | 1 | 2.1% |
花 | 1 | 2.1% |
熙 | 1 | 2.1% |
木 | 1 | 2.1% |
Other values (6) | 6 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 48207 | |
ASCII | 12185 | 20.2% |
CJK | 48 | 0.1% |
None | 21 | < 0.1% |
Compat Jamo | 3 | < 0.1% |
Number Forms | 2 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
어 | 4140 | 8.6% |
헤 | 3992 | 8.3% |
미 | 1686 | 3.5% |
이 | 1301 | 2.7% |
스 | 1296 | 2.7% |
일 | 1273 | 2.6% |
네 | 1232 | 2.6% |
리 | 1185 | 2.5% |
실 | 956 | 2.0% |
용 | 950 | 2.0% |
Other values (812) | 30196 |
ASCII
Value | Count | Frequency (%) |
2319 | ||
) | 1001 | 8.2% |
( | 1000 | 8.2% |
a | 519 | 4.3% |
i | 417 | 3.4% |
e | 365 | 3.0% |
A | 361 | 3.0% |
l | 298 | 2.4% |
n | 294 | 2.4% |
N | 287 | 2.4% |
Other values (72) | 5324 |
CJK
Value | Count | Frequency (%) |
美 | 26 | |
秀 | 4 | 8.3% |
休 | 2 | 4.2% |
愛 | 2 | 4.2% |
姬 | 2 | 4.2% |
家 | 2 | 4.2% |
林 | 1 | 2.1% |
花 | 1 | 2.1% |
熙 | 1 | 2.1% |
木 | 1 | 2.1% |
Other values (6) | 6 | 12.5% |
None
Value | Count | Frequency (%) |
· | 10 | |
& | 3 | 14.3% |
# | 2 | 9.5% |
° | 2 | 9.5% |
´ | 1 | 4.8% |
: | 1 | 4.8% |
₂ | 1 | 4.8% |
× | 1 | 4.8% |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 2 |
Compat Jamo
Value | Count | Frequency (%) |
ㅏ | 1 | |
ㅜ | 1 | |
ㅓ | 1 |
주소
Text
Distinct | 8972 |
---|---|
Distinct (%) | 94.5% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 74.3 KiB |
Length
Max length | 53 |
---|---|
Median length | 46 |
Mean length | 23.391698 |
Min length | 6 |
Characters and Unicode
Total characters | 222034 |
---|---|
Distinct characters | 580 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 8652 ? |
---|---|
Unique (%) | 91.2% |
Sample
1st row | 강화군 강화읍 강화대로 431 |
---|---|
2nd row | 강화군 강화읍 청하동길 14 |
3rd row | 강화군 강화읍 중앙로 43 |
4th row | 강화군 내가면 강화서로 26 |
5th row | 강화군 선원면 중앙로 246 |
Value | Count | Frequency (%) |
남동구 | 1813 | 3.7% |
부평구 | 1723 | 3.6% |
서구 | 1696 | 3.5% |
미추홀구 | 1440 | 3.0% |
1호 | 1270 | 2.6% |
연수구 | 1070 | 2.2% |
1층 | 1053 | 2.2% |
계양구 | 936 | 1.9% |
부평동 | 774 | 1.6% |
2호 | 656 | 1.4% |
Other values (6765) | 35983 |
Most occurring characters
Value | Count | Frequency (%) |
38922 | 17.5% | |
1 | 14421 | 6.5% |
동 | 12187 | 5.5% |
지 | 10246 | 4.6% |
구 | 9996 | 4.5% |
번 | 9404 | 4.2% |
호 | 9250 | 4.2% |
2 | 7929 | 3.6% |
0 | 6068 | 2.7% |
3 | 5431 | 2.4% |
Other values (570) | 98180 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 120795 | |
Decimal Number | 55938 | |
Space Separator | 38922 | 17.5% |
Dash Punctuation | 3204 | 1.4% |
Uppercase Letter | 1049 | 0.5% |
Other Punctuation | 743 | 0.3% |
Open Punctuation | 582 | 0.3% |
Close Punctuation | 581 | 0.3% |
Lowercase Letter | 182 | 0.1% |
Math Symbol | 29 | < 0.1% |
Other values (2) | 9 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 12187 | 10.1% |
지 | 10246 | 8.5% |
구 | 9996 | 8.3% |
번 | 9404 | 7.8% |
호 | 9250 | 7.7% |
부 | 4296 | 3.6% |
평 | 2763 | 2.3% |
층 | 2613 | 2.2% |
남 | 2213 | 1.8% |
서 | 2095 | 1.7% |
Other values (501) | 55732 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 166 | |
B | 162 | |
S | 75 | 7.1% |
C | 74 | 7.1% |
E | 64 | 6.1% |
I | 57 | 5.4% |
K | 51 | 4.9% |
D | 42 | 4.0% |
L | 40 | 3.8% |
V | 39 | 3.7% |
Other values (15) | 279 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 63 | |
s | 22 | 12.1% |
r | 17 | 9.3% |
a | 17 | 9.3% |
d | 14 | 7.7% |
y | 12 | 6.6% |
k | 10 | 5.5% |
t | 8 | 4.4% |
c | 3 | 1.6% |
i | 3 | 1.6% |
Other values (8) | 13 | 7.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 14421 | |
2 | 7929 | |
0 | 6068 | |
3 | 5431 | 9.7% |
4 | 4456 | 8.0% |
5 | 4268 | 7.6% |
6 | 3920 | 7.0% |
9 | 3178 | 5.7% |
7 | 3145 | 5.6% |
8 | 3122 | 5.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 657 | |
@ | 46 | 6.2% |
. | 15 | 2.0% |
' | 14 | 1.9% |
/ | 9 | 1.2% |
& | 2 | 0.3% |
Open Punctuation
Value | Count | Frequency (%) |
( | 581 | |
[ | 1 | 0.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 580 | |
] | 1 | 0.2% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 6 | |
Ⅰ | 2 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
38922 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3204 |
Math Symbol
Value | Count | Frequency (%) |
~ | 29 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 120795 | |
Common | 100000 | |
Latin | 1239 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 12187 | 10.1% |
지 | 10246 | 8.5% |
구 | 9996 | 8.3% |
번 | 9404 | 7.8% |
호 | 9250 | 7.7% |
부 | 4296 | 3.6% |
평 | 2763 | 2.3% |
층 | 2613 | 2.2% |
남 | 2213 | 1.8% |
서 | 2095 | 1.7% |
Other values (501) | 55732 |
Latin
Value | Count | Frequency (%) |
A | 166 | 13.4% |
B | 162 | 13.1% |
S | 75 | 6.1% |
C | 74 | 6.0% |
E | 64 | 5.2% |
e | 63 | 5.1% |
I | 57 | 4.6% |
K | 51 | 4.1% |
D | 42 | 3.4% |
L | 40 | 3.2% |
Other values (35) | 445 |
Common
Value | Count | Frequency (%) |
38922 | ||
1 | 14421 | 14.4% |
2 | 7929 | 7.9% |
0 | 6068 | 6.1% |
3 | 5431 | 5.4% |
4 | 4456 | 4.5% |
5 | 4268 | 4.3% |
6 | 3920 | 3.9% |
- | 3204 | 3.2% |
9 | 3178 | 3.2% |
Other values (14) | 8203 | 8.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 120795 | |
ASCII | 101231 | |
Number Forms | 8 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
38922 | ||
1 | 14421 | 14.2% |
2 | 7929 | 7.8% |
0 | 6068 | 6.0% |
3 | 5431 | 5.4% |
4 | 4456 | 4.4% |
5 | 4268 | 4.2% |
6 | 3920 | 3.9% |
- | 3204 | 3.2% |
9 | 3178 | 3.1% |
Other values (57) | 9434 | 9.3% |
Hangul
Value | Count | Frequency (%) |
동 | 12187 | 10.1% |
지 | 10246 | 8.5% |
구 | 9996 | 8.3% |
번 | 9404 | 7.8% |
호 | 9250 | 7.7% |
부 | 4296 | 3.6% |
평 | 2763 | 2.3% |
층 | 2613 | 2.2% |
남 | 2213 | 1.8% |
서 | 2095 | 1.7% |
Other values (501) | 55732 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 6 | |
Ⅰ | 2 | 25.0% |
연번 | 구분 | |
---|---|---|
연번 | 1.000 | 0.624 |
구분 | 0.624 | 1.000 |
연번 | 구분 | |
---|---|---|
연번 | 1.000 | 0.483 |
구분 | 0.483 | 1.000 |
연번 | 구분 | 상호명 | 주소 | |
---|---|---|---|---|
0 | 1 | 목욕탕 | 유성목욕탕 | 강화군 강화읍 강화대로 431 |
1 | 2 | 목욕탕 | 대양목욕탕 | 강화군 강화읍 청하동길 14 |
2 | 3 | 미용실 | 터미널대중탕 | 강화군 강화읍 중앙로 43 |
3 | 4 | 목욕탕 | 시휴재 | 강화군 내가면 강화서로 26 |
4 | 5 | 목욕탕 | 청솔불한증막 | 강화군 선원면 중앙로 246 |
5 | 6 | 목욕탕 | 약수천사우나 | 강화군 길상면 강화동로 23 |
6 | 7 | 목욕탕 | 삼화목욕탕 | 강화군 강화읍 송악길 6 |
7 | 8 | 목욕탕 | 강화해수랜드 | 강화군 길상면 해안남로 13-12 |
8 | 9 | 목욕탕 | 강화리빙스파랜드 | 강화군 강화읍 갑룡길73번길 1 |
9 | 10 | 목욕탕 | 교동목욕탕 | 강화군 교동면 대룡안길45번길 23 |
연번 | 구분 | 상호명 | 주소 | |
---|---|---|---|---|
9483 | 9484 | 미용실 | 루씨르 네일 | 서구 가정동 504번지 6호 -107 |
9484 | 9485 | 미용실 | 오오샵 검단점 | 서구 왕길동 662번지 6호 장수프라자 |
9485 | 9486 | 미용실 | 탤 | 서구 청라동 165번지 11호 |
9486 | 9487 | 미용실 | 블링제이뷰티 | 서구 가정동 606번지 3호 아트프라자 |
9487 | 9488 | 미용실 | 청라한네일 | 서구 청라동 165번지 12호 지젤엠청라 |
9488 | 9489 | 미용실 | 라라뷰티 | 서구 검암동 606번지 1호 준암프라자 |
9489 | 9490 | 미용실 | 리블로셀검단아라점 | 서구 원당동 0번지 우미린 더 시그니처 |
9490 | 9491 | 미용실 | 네일루 | 서구 불로동 788번지 8호 |
9491 | 9492 | 미용실 | 모드니네일 | 서구 청라동 165번지 12호 지젤엠청라-38 |
9492 | 9493 | 미용실 | 오늘네일 | 서구 가정동 546번지 한신그랜드힐빌리지 |