Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 5663 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 182.6 KiB |
Average record size in memory | 33.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 2 |
Categorical | 1 |
Dataset
Description | 서울특별시 다중이용업소 중 고시원 정보에 대한 데이터로 상호명, 업종명, 법정동 주소 등을 포함하여 제공합니다. |
---|---|
Author | 서울특별시 |
URL | https://www.data.go.kr/data/15030030/fileData.do |
Reproduction
Analysis started | 2024-04-21 01:59:33.645625 |
---|---|
Analysis finished | 2024-04-21 01:59:34.790767 |
Duration | 1.15 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 5663 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2832 |
Minimum | 1 |
---|---|
Maximum | 5663 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 49.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 284.1 |
Q1 | 1416.5 |
median | 2832 |
Q3 | 4247.5 |
95-th percentile | 5379.9 |
Maximum | 5663 |
Range | 5662 |
Interquartile range (IQR) | 2831 |
Descriptive statistics
Standard deviation | 1634.9116 |
---|---|
Coefficient of variation (CV) | 0.5772993 |
Kurtosis | -1.2 |
Mean | 2832 |
Median Absolute Deviation (MAD) | 1416 |
Skewness | 0 |
Sum | 16037616 |
Variance | 2672936 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
3806 | 1 | < 0.1% |
3782 | 1 | < 0.1% |
3781 | 1 | < 0.1% |
3780 | 1 | < 0.1% |
3779 | 1 | < 0.1% |
3778 | 1 | < 0.1% |
3777 | 1 | < 0.1% |
3776 | 1 | < 0.1% |
3775 | 1 | < 0.1% |
Other values (5653) | 5653 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
5663 | 1 | |
5662 | 1 | |
5661 | 1 | |
5660 | 1 | |
5659 | 1 | |
5658 | 1 | |
5657 | 1 | |
5656 | 1 | |
5655 | 1 | |
5654 | 1 |
상호
Text
Distinct | 4198 |
---|---|
Distinct (%) | 74.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 44.4 KiB |
Length
Max length | 25 |
---|---|
Median length | 22 |
Mean length | 5.9816352 |
Min length | 2 |
Characters and Unicode
Total characters | 33874 |
---|---|
Distinct characters | 662 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 3624 ? |
---|---|
Unique (%) | 64.0% |
Sample
1st row | 운현고시원 |
---|---|
2nd row | 주식회사 에스에스디에이 |
3rd row | 원룸텔경복궁굿스테이 |
4th row | 영하호 |
5th row | 대보빌딩(코쿤하우스) |
Value | Count | Frequency (%) |
고시원 | 76 | 1.2% |
원룸텔 | 60 | 1.0% |
고시텔 | 35 | 0.6% |
해피하우스 | 34 | 0.6% |
코코리빙텔 | 30 | 0.5% |
싱글하우스 | 29 | 0.5% |
소호리빙텔 | 27 | 0.4% |
레지던스 | 26 | 0.4% |
심플하우스 | 26 | 0.4% |
하우스 | 26 | 0.4% |
Other values (4209) | 5794 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 2550 | 7.5% |
원 | 2539 | 7.5% |
고 | 2530 | 7.5% |
스 | 1757 | 5.2% |
텔 | 1594 | 4.7% |
우 | 1021 | 3.0% |
하 | 1019 | 3.0% |
리 | 836 | 2.5% |
빙 | 587 | 1.7% |
빌 | 559 | 1.7% |
Other values (652) | 18882 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 31047 | |
Uppercase Letter | 598 | 1.8% |
Space Separator | 501 | 1.5% |
Close Punctuation | 471 | 1.4% |
Open Punctuation | 471 | 1.4% |
Decimal Number | 360 | 1.1% |
Other Punctuation | 229 | 0.7% |
Lowercase Letter | 119 | 0.4% |
Dash Punctuation | 53 | 0.2% |
Math Symbol | 14 | < 0.1% |
Other values (2) | 11 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 2550 | 8.2% |
원 | 2539 | 8.2% |
고 | 2530 | 8.1% |
스 | 1757 | 5.7% |
텔 | 1594 | 5.1% |
우 | 1021 | 3.3% |
하 | 1019 | 3.3% |
리 | 836 | 2.7% |
빙 | 587 | 1.9% |
빌 | 559 | 1.8% |
Other values (579) | 16055 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 56 | 9.4% |
I | 54 | 9.0% |
O | 40 | 6.7% |
J | 36 | 6.0% |
A | 34 | 5.7% |
H | 33 | 5.5% |
M | 29 | 4.8% |
E | 29 | 4.8% |
B | 28 | 4.7% |
K | 25 | 4.2% |
Other values (15) | 234 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 39 | |
i | 11 | 9.2% |
l | 10 | 8.4% |
s | 9 | 7.6% |
a | 9 | 7.6% |
o | 6 | 5.0% |
u | 6 | 5.0% |
n | 5 | 4.2% |
r | 4 | 3.4% |
t | 3 | 2.5% |
Other values (12) | 17 |
Decimal Number
Value | Count | Frequency (%) |
2 | 111 | |
1 | 69 | |
3 | 64 | |
4 | 44 | 12.2% |
5 | 25 | 6.9% |
6 | 12 | 3.3% |
0 | 11 | 3.1% |
9 | 9 | 2.5% |
8 | 8 | 2.2% |
7 | 7 | 1.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 172 | |
, | 38 | 16.6% |
& | 11 | 4.8% |
/ | 4 | 1.7% |
@ | 2 | 0.9% |
! | 2 | 0.9% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 7 | |
Ⅰ | 2 | 20.0% |
Ⅲ | 1 | 10.0% |
Math Symbol
Value | Count | Frequency (%) |
~ | 11 | |
+ | 3 | 21.4% |
Space Separator
Value | Count | Frequency (%) |
501 |
Close Punctuation
Value | Count | Frequency (%) |
) | 471 |
Open Punctuation
Value | Count | Frequency (%) |
( | 471 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 53 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 31044 | |
Common | 2100 | 6.2% |
Latin | 727 | 2.1% |
Han | 3 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 2550 | 8.2% |
원 | 2539 | 8.2% |
고 | 2530 | 8.1% |
스 | 1757 | 5.7% |
텔 | 1594 | 5.1% |
우 | 1021 | 3.3% |
하 | 1019 | 3.3% |
리 | 836 | 2.7% |
빙 | 587 | 1.9% |
빌 | 559 | 1.8% |
Other values (576) | 16052 |
Latin
Value | Count | Frequency (%) |
S | 56 | 7.7% |
I | 54 | 7.4% |
O | 40 | 5.5% |
e | 39 | 5.4% |
J | 36 | 5.0% |
A | 34 | 4.7% |
H | 33 | 4.5% |
M | 29 | 4.0% |
E | 29 | 4.0% |
B | 28 | 3.9% |
Other values (40) | 349 |
Common
Value | Count | Frequency (%) |
501 | ||
) | 471 | |
( | 471 | |
. | 172 | 8.2% |
2 | 111 | 5.3% |
1 | 69 | 3.3% |
3 | 64 | 3.0% |
- | 53 | 2.5% |
4 | 44 | 2.1% |
, | 38 | 1.8% |
Other values (13) | 106 | 5.0% |
Han
Value | Count | Frequency (%) |
秀 | 1 | |
家 | 1 | |
舊 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 31042 | |
ASCII | 2817 | 8.3% |
Number Forms | 10 | < 0.1% |
CJK | 3 | < 0.1% |
Compat Jamo | 2 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 2550 | 8.2% |
원 | 2539 | 8.2% |
고 | 2530 | 8.2% |
스 | 1757 | 5.7% |
텔 | 1594 | 5.1% |
우 | 1021 | 3.3% |
하 | 1019 | 3.3% |
리 | 836 | 2.7% |
빙 | 587 | 1.9% |
빌 | 559 | 1.8% |
Other values (574) | 16050 |
ASCII
Value | Count | Frequency (%) |
501 | ||
) | 471 | |
( | 471 | |
. | 172 | 6.1% |
2 | 111 | 3.9% |
1 | 69 | 2.4% |
3 | 64 | 2.3% |
S | 56 | 2.0% |
I | 54 | 1.9% |
- | 53 | 1.9% |
Other values (60) | 795 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 7 | |
Ⅰ | 2 | 20.0% |
Ⅲ | 1 | 10.0% |
CJK
Value | Count | Frequency (%) |
秀 | 1 | |
家 | 1 | |
舊 | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㄴ | 1 | |
ㄱ | 1 |
업종
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 44.4 KiB |
고시원업 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 고시원업 |
---|---|
2nd row | 고시원업 |
3rd row | 고시원업 |
4th row | 고시원업 |
5th row | 고시원업 |
Common Values
Value | Count | Frequency (%) |
고시원업 | 5663 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
고시원업 | 5663 |
법정동 주소
Text
Distinct | 5355 |
---|---|
Distinct (%) | 94.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 44.4 KiB |
Length
Max length | 24 |
---|---|
Median length | 23 |
Mean length | 19.753841 |
Min length | 14 |
Characters and Unicode
Total characters | 111866 |
---|---|
Distinct characters | 196 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 5088 ? |
---|---|
Unique (%) | 89.8% |
Sample
1st row | 서울특별시 종로구 경운동 1-9 |
---|---|
2nd row | 서울특별시 종로구 명륜3가 61-8 |
3rd row | 서울특별시 종로구 필운동 278-5 |
4th row | 서울특별시 종로구 창신동 283 |
5th row | 서울특별시 종로구 이화동 36-2 |
Value | Count | Frequency (%) |
서울특별시 | 5663 | |
관악구 | 778 | 3.4% |
신림동 | 582 | 2.6% |
동작구 | 485 | 2.1% |
강남구 | 415 | 1.8% |
동대문구 | 339 | 1.5% |
영등포구 | 323 | 1.4% |
성북구 | 308 | 1.4% |
서대문구 | 243 | 1.1% |
송파구 | 242 | 1.1% |
Other values (5269) | 13274 |
Most occurring characters
Value | Count | Frequency (%) |
16989 | ||
동 | 6771 | 6.1% |
서 | 6427 | 5.7% |
구 | 5981 | 5.3% |
시 | 5680 | 5.1% |
특 | 5663 | 5.1% |
별 | 5663 | 5.1% |
울 | 5663 | 5.1% |
1 | 5394 | 4.8% |
- | 5240 | 4.7% |
Other values (186) | 42395 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 63892 | |
Decimal Number | 25745 | |
Space Separator | 16989 | 15.2% |
Dash Punctuation | 5240 | 4.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 6771 | 10.6% |
서 | 6427 | 10.1% |
구 | 5981 | 9.4% |
시 | 5680 | 8.9% |
특 | 5663 | 8.9% |
별 | 5663 | 8.9% |
울 | 5663 | 8.9% |
강 | 890 | 1.4% |
신 | 853 | 1.3% |
관 | 814 | 1.3% |
Other values (174) | 19487 |
Decimal Number
Value | Count | Frequency (%) |
1 | 5394 | |
2 | 3642 | |
3 | 3002 | |
4 | 2517 | |
5 | 2419 | |
6 | 2182 | |
0 | 1717 | 6.7% |
7 | 1712 | 6.6% |
9 | 1603 | 6.2% |
8 | 1557 | 6.0% |
Space Separator
Value | Count | Frequency (%) |
16989 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5240 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 63892 | |
Common | 47974 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 6771 | 10.6% |
서 | 6427 | 10.1% |
구 | 5981 | 9.4% |
시 | 5680 | 8.9% |
특 | 5663 | 8.9% |
별 | 5663 | 8.9% |
울 | 5663 | 8.9% |
강 | 890 | 1.4% |
신 | 853 | 1.3% |
관 | 814 | 1.3% |
Other values (174) | 19487 |
Common
Value | Count | Frequency (%) |
16989 | ||
1 | 5394 | 11.2% |
- | 5240 | 10.9% |
2 | 3642 | 7.6% |
3 | 3002 | 6.3% |
4 | 2517 | 5.2% |
5 | 2419 | 5.0% |
6 | 2182 | 4.5% |
0 | 1717 | 3.6% |
7 | 1712 | 3.6% |
Other values (2) | 3160 | 6.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 63892 | |
ASCII | 47974 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
16989 | ||
1 | 5394 | 11.2% |
- | 5240 | 10.9% |
2 | 3642 | 7.6% |
3 | 3002 | 6.3% |
4 | 2517 | 5.2% |
5 | 2419 | 5.0% |
6 | 2182 | 4.5% |
0 | 1717 | 3.6% |
7 | 1712 | 3.6% |
Other values (2) | 3160 | 6.6% |
Hangul
Value | Count | Frequency (%) |
동 | 6771 | 10.6% |
서 | 6427 | 10.1% |
구 | 5981 | 9.4% |
시 | 5680 | 8.9% |
특 | 5663 | 8.9% |
별 | 5663 | 8.9% |
울 | 5663 | 8.9% |
강 | 890 | 1.4% |
신 | 853 | 1.3% |
관 | 814 | 1.3% |
Other values (174) | 19487 |
연번 | 상호 | 업종 | 법정동 주소 | |
---|---|---|---|---|
0 | 1 | 운현고시원 | 고시원업 | 서울특별시 종로구 경운동 1-9 |
1 | 2 | 주식회사 에스에스디에이 | 고시원업 | 서울특별시 종로구 명륜3가 61-8 |
2 | 3 | 원룸텔경복궁굿스테이 | 고시원업 | 서울특별시 종로구 필운동 278-5 |
3 | 4 | 영하호 | 고시원업 | 서울특별시 종로구 창신동 283 |
4 | 5 | 대보빌딩(코쿤하우스) | 고시원업 | 서울특별시 종로구 이화동 36-2 |
5 | 6 | 비엔하우스 | 고시원업 | 서울특별시 종로구 이화동 125 |
6 | 7 | 동대문고시원 | 고시원업 | 서울특별시 종로구 창신동 651-16 |
7 | 8 | 21세기고시원 | 고시원업 | 서울특별시 종로구 창신동 330-2 |
8 | 9 | 밀레니엄 고시원 | 고시원업 | 서울특별시 종로구 창신동 463-1 |
9 | 10 | 굿스테이원룸텔 | 고시원업 | 서울특별시 종로구 명륜1가 16-21 |
연번 | 상호 | 업종 | 법정동 주소 | |
---|---|---|---|---|
5653 | 5654 | 신동양 | 고시원업 | 서울특별시 관악구 신림동 1666-44 |
5654 | 5655 | 신도시형 롯데원룸텔 | 고시원업 | 서울특별시 관악구 봉천동 972-29 |
5655 | 5656 | 학운원룸 | 고시원업 | 서울특별시 관악구 신림동 231-39 |
5656 | 5657 | 윤초고시원 | 고시원업 | 서울특별시 관악구 신림동 1554-21 |
5657 | 5658 | 서전 | 고시원업 | 서울특별시 관악구 신림동 1532-20 |
5658 | 5659 | 골든고시원 | 고시원업 | 서울특별시 관악구 신림동 1432-140 |
5659 | 5660 | 삼원고시원 | 고시원업 | 서울특별시 관악구 봉천동 1666-48 |
5660 | 5661 | 상록수고시텔 | 고시원업 | 서울특별시 관악구 신림동 112-37 |
5661 | 5662 | 모렉스빌고시원 | 고시원업 | 서울특별시 관악구 신림동 570-36 |
5662 | 5663 | 씨티빌고시원 | 고시원업 | 서울특별시 관악구 신림동 1568-12 |