Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 157 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 6.6 KiB |
Average record size in memory | 42.8 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 1 |
Text | 2 |
Dataset
Description | 서울특별시 강서구 고시원 현황 - 연번 : 고시원 개수 파악용연번 - 법정동 : 고시원이 위치한 동 - 상호 : 고시원명 - 주소 : 고시원 위치 - 우편번호 : 고시원별 우편번호 |
---|---|
Author | 서울특별시 강서구 |
URL | https://www.data.go.kr/data/15077684/fileData.do |
Reproduction
Analysis started | 2023-12-12 09:45:56.927087 |
---|---|
Analysis finished | 2023-12-12 09:45:57.707494 |
Duration | 0.78 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 157 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 79 |
Minimum | 1 |
---|---|
Maximum | 157 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 8.8 |
Q1 | 40 |
median | 79 |
Q3 | 118 |
95-th percentile | 149.2 |
Maximum | 157 |
Range | 156 |
Interquartile range (IQR) | 78 |
Descriptive statistics
Standard deviation | 45.466105 |
---|---|
Coefficient of variation (CV) | 0.57552031 |
Kurtosis | -1.2 |
Mean | 79 |
Median Absolute Deviation (MAD) | 39 |
Skewness | 0 |
Sum | 12403 |
Variance | 2067.1667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.6% |
109 | 1 | 0.6% |
102 | 1 | 0.6% |
103 | 1 | 0.6% |
104 | 1 | 0.6% |
105 | 1 | 0.6% |
106 | 1 | 0.6% |
107 | 1 | 0.6% |
108 | 1 | 0.6% |
110 | 1 | 0.6% |
Other values (147) | 147 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
157 | 1 | |
156 | 1 | |
155 | 1 | |
154 | 1 | |
153 | 1 | |
152 | 1 | |
151 | 1 | |
150 | 1 | |
149 | 1 | |
148 | 1 |
법정동
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 4.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.4 KiB |
화곡동 | |
---|---|
등촌동 | |
방화동 | |
공항동 | |
내발산동 | 7 |
Other values (2) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.044586 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 가양동 |
---|---|
2nd row | 가양동 |
3rd row | 가양동 |
4th row | 가양동 |
5th row | 가양동 |
Common Values
Value | Count | Frequency (%) |
화곡동 | 73 | |
등촌동 | 30 | |
방화동 | 21 | 13.4% |
공항동 | 13 | 8.3% |
내발산동 | 7 | 4.5% |
염창동 | 7 | 4.5% |
가양동 | 6 | 3.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
화곡동 | 73 | |
등촌동 | 30 | |
방화동 | 21 | 13.4% |
공항동 | 13 | 8.3% |
내발산동 | 7 | 4.5% |
염창동 | 7 | 4.5% |
가양동 | 6 | 3.8% |
상호
Text
Distinct | 151 |
---|---|
Distinct (%) | 96.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.4 KiB |
Value | Count | Frequency (%) |
고시원 | 5 | 2.9% |
고시텔 | 3 | 1.8% |
에덴고시원 | 2 | 1.2% |
그린하우스 | 2 | 1.2% |
로얄홈리빙텔(구,여명고시원 | 2 | 1.2% |
임탑고시원 | 2 | 1.2% |
라임하우스 | 2 | 1.2% |
웰빙하우스 | 2 | 1.2% |
화곡고시원 | 1 | 0.6% |
토마토 | 1 | 0.6% |
Other values (148) | 148 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 88 | 8.3% |
고 | 86 | 8.1% |
원 | 74 | 7.0% |
스 | 49 | 4.6% |
텔 | 34 | 3.2% |
우 | 34 | 3.2% |
하 | 32 | 3.0% |
리 | 31 | 2.9% |
) | 21 | 2.0% |
( | 21 | 2.0% |
Other values (216) | 594 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 942 | |
Close Punctuation | 21 | 2.0% |
Open Punctuation | 21 | 2.0% |
Other Punctuation | 20 | 1.9% |
Uppercase Letter | 17 | 1.6% |
Decimal Number | 14 | 1.3% |
Space Separator | 13 | 1.2% |
Lowercase Letter | 10 | 0.9% |
Dash Punctuation | 6 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 88 | 9.3% |
고 | 86 | 9.1% |
원 | 74 | 7.9% |
스 | 49 | 5.2% |
텔 | 34 | 3.6% |
우 | 34 | 3.6% |
하 | 32 | 3.4% |
리 | 31 | 3.3% |
구 | 20 | 2.1% |
빌 | 20 | 2.1% |
Other values (189) | 474 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 2 | |
A | 2 | |
O | 2 | |
U | 2 | |
E | 2 | |
W | 1 | |
S | 1 | |
H | 1 | |
G | 1 | |
N | 1 | |
Other values (2) | 2 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 3 | |
l | 2 | |
e | 2 | |
i | 2 | |
q | 1 | 10.0% |
Decimal Number
Value | Count | Frequency (%) |
1 | 6 | |
2 | 6 | |
0 | 1 | 7.1% |
3 | 1 | 7.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 15 | |
, | 5 | 25.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 21 |
Open Punctuation
Value | Count | Frequency (%) |
( | 21 |
Space Separator
Value | Count | Frequency (%) |
13 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 942 | |
Common | 95 | 8.9% |
Latin | 27 | 2.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 88 | 9.3% |
고 | 86 | 9.1% |
원 | 74 | 7.9% |
스 | 49 | 5.2% |
텔 | 34 | 3.6% |
우 | 34 | 3.6% |
하 | 32 | 3.4% |
리 | 31 | 3.3% |
구 | 20 | 2.1% |
빌 | 20 | 2.1% |
Other values (189) | 474 |
Latin
Value | Count | Frequency (%) |
s | 3 | |
B | 2 | 7.4% |
A | 2 | 7.4% |
l | 2 | 7.4% |
O | 2 | 7.4% |
U | 2 | 7.4% |
e | 2 | 7.4% |
i | 2 | 7.4% |
E | 2 | 7.4% |
W | 1 | 3.7% |
Other values (7) | 7 |
Common
Value | Count | Frequency (%) |
) | 21 | |
( | 21 | |
. | 15 | |
13 | ||
- | 6 | 6.3% |
1 | 6 | 6.3% |
2 | 6 | 6.3% |
, | 5 | 5.3% |
0 | 1 | 1.1% |
3 | 1 | 1.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 942 | |
ASCII | 122 | 11.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 88 | 9.3% |
고 | 86 | 9.1% |
원 | 74 | 7.9% |
스 | 49 | 5.2% |
텔 | 34 | 3.6% |
우 | 34 | 3.6% |
하 | 32 | 3.4% |
리 | 31 | 3.3% |
구 | 20 | 2.1% |
빌 | 20 | 2.1% |
Other values (189) | 474 |
ASCII
Value | Count | Frequency (%) |
) | 21 | |
( | 21 | |
. | 15 | |
13 | ||
- | 6 | 4.9% |
1 | 6 | 4.9% |
2 | 6 | 4.9% |
, | 5 | 4.1% |
s | 3 | 2.5% |
B | 2 | 1.6% |
Other values (17) | 24 |
주소
Text
Distinct | 151 |
---|---|
Distinct (%) | 96.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.4 KiB |
Length
Max length | 24 |
---|---|
Median length | 23 |
Mean length | 19.305732 |
Min length | 16 |
Characters and Unicode
Total characters | 3031 |
---|---|
Distinct characters | 52 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 145 ? |
---|---|
Unique (%) | 92.4% |
Sample
1st row | 서울특별시 강서구 양천로 443-36 |
---|---|
2nd row | 서울특별시 강서구 양천로 443-36 |
3rd row | 서울특별시 강서구 양천로 461 |
4th row | 서울특별시 강서구 양천로47가길 25-18 |
5th row | 서울특별시 강서구 화곡로72길 48 |
Value | Count | Frequency (%) |
서울특별시 | 157 | |
강서구 | 157 | |
강서로 | 9 | 1.4% |
강서로17길 | 8 | 1.3% |
양천로 | 6 | 1.0% |
화곡로68길 | 5 | 0.8% |
29 | 5 | 0.8% |
화곡로66길 | 5 | 0.8% |
방화동로 | 4 | 0.6% |
16 | 4 | 0.6% |
Other values (195) | 268 |
Most occurring characters
Value | Count | Frequency (%) |
471 | ||
서 | 355 | 11.7% |
강 | 198 | 6.5% |
특 | 157 | 5.2% |
별 | 157 | 5.2% |
시 | 157 | 5.2% |
구 | 157 | 5.2% |
울 | 157 | 5.2% |
로 | 157 | 5.2% |
길 | 123 | 4.1% |
Other values (42) | 942 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1931 | |
Decimal Number | 595 | 19.6% |
Space Separator | 471 | 15.5% |
Dash Punctuation | 34 | 1.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 355 | |
강 | 198 | |
특 | 157 | |
별 | 157 | |
시 | 157 | |
구 | 157 | |
울 | 157 | |
로 | 157 | |
길 | 123 | 6.4% |
화 | 49 | 2.5% |
Other values (30) | 264 |
Decimal Number
Value | Count | Frequency (%) |
1 | 114 | |
5 | 79 | |
3 | 78 | |
2 | 73 | |
6 | 65 | |
4 | 51 | |
7 | 44 | 7.4% |
9 | 34 | 5.7% |
8 | 30 | 5.0% |
0 | 27 | 4.5% |
Space Separator
Value | Count | Frequency (%) |
471 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 34 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1931 | |
Common | 1100 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 355 | |
강 | 198 | |
특 | 157 | |
별 | 157 | |
시 | 157 | |
구 | 157 | |
울 | 157 | |
로 | 157 | |
길 | 123 | 6.4% |
화 | 49 | 2.5% |
Other values (30) | 264 |
Common
Value | Count | Frequency (%) |
471 | ||
1 | 114 | 10.4% |
5 | 79 | 7.2% |
3 | 78 | 7.1% |
2 | 73 | 6.6% |
6 | 65 | 5.9% |
4 | 51 | 4.6% |
7 | 44 | 4.0% |
- | 34 | 3.1% |
9 | 34 | 3.1% |
Other values (2) | 57 | 5.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1931 | |
ASCII | 1100 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
471 | ||
1 | 114 | 10.4% |
5 | 79 | 7.2% |
3 | 78 | 7.1% |
2 | 73 | 6.6% |
6 | 65 | 5.9% |
4 | 51 | 4.6% |
7 | 44 | 4.0% |
- | 34 | 3.1% |
9 | 34 | 3.1% |
Other values (2) | 57 | 5.2% |
Hangul
Value | Count | Frequency (%) |
서 | 355 | |
강 | 198 | |
특 | 157 | |
별 | 157 | |
시 | 157 | |
구 | 157 | |
울 | 157 | |
로 | 157 | |
길 | 123 | 6.4% |
화 | 49 | 2.5% |
Other values (30) | 264 |
우편번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 78 |
---|---|
Distinct (%) | 49.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 7659.4522 |
Minimum | 7516 |
---|---|
Maximum | 7786 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.5 KiB |
Quantile statistics
Minimum | 7516 |
---|---|
5-th percentile | 7537.2 |
Q1 | 7591 |
median | 7649 |
Q3 | 7720 |
95-th percentile | 7779 |
Maximum | 7786 |
Range | 270 |
Interquartile range (IQR) | 129 |
Descriptive statistics
Standard deviation | 80.103494 |
---|---|
Coefficient of variation (CV) | 0.010458123 |
Kurtosis | -1.1946494 |
Mean | 7659.4522 |
Median Absolute Deviation (MAD) | 63 |
Skewness | 0.090920281 |
Sum | 1202534 |
Variance | 6416.5698 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
7620 | 13 | 8.3% |
7770 | 8 | 5.1% |
7591 | 5 | 3.2% |
7649 | 4 | 2.5% |
7773 | 4 | 2.5% |
7569 | 4 | 2.5% |
7785 | 4 | 2.5% |
7622 | 4 | 2.5% |
7551 | 3 | 1.9% |
7686 | 3 | 1.9% |
Other values (68) | 105 |
Value | Count | Frequency (%) |
7516 | 2 | |
7523 | 1 | 0.6% |
7526 | 1 | 0.6% |
7527 | 2 | |
7534 | 2 | |
7538 | 2 | |
7546 | 2 | |
7550 | 1 | 0.6% |
7551 | 3 | |
7558 | 2 |
Value | Count | Frequency (%) |
7786 | 1 | 0.6% |
7785 | 4 | |
7781 | 1 | 0.6% |
7779 | 3 | 1.9% |
7777 | 1 | 0.6% |
7776 | 3 | 1.9% |
7775 | 2 | 1.3% |
7773 | 4 | |
7770 | 8 | |
7769 | 1 | 0.6% |
연번 | 법정동 | 우편번호 | |
---|---|---|---|
연번 | 1.000 | 0.876 | 0.885 |
법정동 | 0.876 | 1.000 | 0.870 |
우편번호 | 0.885 | 0.870 | 1.000 |
연번 | 우편번호 | 법정동 | |
---|---|---|---|
연번 | 1.000 | 0.646 | 0.683 |
우편번호 | 0.646 | 1.000 | 0.656 |
법정동 | 0.683 | 0.656 | 1.000 |
연번 | 법정동 | 상호 | 주소 | 우편번호 | |
---|---|---|---|---|---|
0 | 1 | 가양동 | 에덴고시원 | 서울특별시 강서구 양천로 443-36 | 7527 |
1 | 2 | 가양동 | 에덴고시원 | 서울특별시 강서구 양천로 443-36 | 7527 |
2 | 3 | 가양동 | 주영고시텔 | 서울특별시 강서구 양천로 461 | 7526 |
3 | 4 | 가양동 | 밀레시티타워 | 서울특별시 강서구 양천로47가길 25-18 | 7523 |
4 | 5 | 가양동 | 해피하우스 | 서울특별시 강서구 화곡로72길 48 | 7534 |
5 | 6 | 가양동 | 노블하우스 | 서울특별시 강서구 화곡로72길 52 | 7534 |
6 | 7 | 공항동 | 샤인미니홈 | 서울특별시 강서구 공항대로2길 52 | 7622 |
7 | 8 | 공항동 | 궁민오피스텔 | 서울특별시 강서구 공항대로3길 21 | 7619 |
8 | 9 | 공항동 | 휘성 고시원 | 서울특별시 강서구 공항대로7나길 21 | 7619 |
9 | 10 | 공항동 | 송정빌리지 | 서울특별시 강서구 공항대로8가길 2-3 | 7624 |
연번 | 법정동 | 상호 | 주소 | 우편번호 | |
---|---|---|---|---|---|
147 | 148 | 화곡동 | 더큰 원룸텔 | 서울특별시 강서구 화곡로25길 7 | 7714 |
148 | 149 | 화곡동 | 프리미엄텔 | 서울특별시 강서구 화곡로26가길 24 | 7715 |
149 | 150 | 화곡동 | 기훈하우스(고인실건물) | 서울특별시 강서구 화곡로26길 69 | 7720 |
150 | 151 | 화곡동 | 화곡삼성고시원 | 서울특별시 강서구 화곡로27길 37 | 7702 |
151 | 152 | 화곡동 | 힐탑타운 | 서울특별시 강서구 화곡로29길 23 | 7701 |
152 | 153 | 화곡동 | 로즈펠리스 | 서울특별시 강서구 화곡로35길 5 | 7696 |
153 | 154 | 화곡동 | 진주타워 | 서울특별시 강서구 화곡로42나길 6-13 | 7678 |
154 | 155 | 화곡동 | 이모션하우스고시원 | 서울특별시 강서구 화곡로55길 22 | 7685 |
155 | 156 | 화곡동 | 02고시원 | 서울특별시 강서구 화곡로58길 22-3 | 7657 |
156 | 157 | 화곡동 | 장안고시원 | 서울특별시 강서구 화곡로60길 22 | 7654 |