Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 241 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 9.8 KiB |
Average record size in memory | 41.5 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 2 |
Text | 1 |
DateTime | 1 |
Dataset
Description | 서울시 영등포구 담배꽁초 전용 스레기통(꽁초픽 포함) 설치 현황입니다. 제공 데이터: 연번, 동명, 설치위치, 비고 등 |
---|---|
Author | 서울특별시 영등포구 |
URL | https://www.data.go.kr/data/15103114/fileData.do |
데이터기준일 has constant value "" | Constant |
동명 is highly overall correlated with 연번 and 1 other fields | High correlation |
비고 is highly overall correlated with 연번 and 1 other fields | High correlation |
연번 is highly overall correlated with 동명 and 1 other fields | High correlation |
비고 is highly imbalanced (75.0%) | Imbalance |
연번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 17:51:03.931730 |
---|---|
Analysis finished | 2023-12-12 17:51:04.560902 |
Duration | 0.63 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 241 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 121 |
Minimum | 1 |
---|---|
Maximum | 241 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 13 |
Q1 | 61 |
median | 121 |
Q3 | 181 |
95-th percentile | 229 |
Maximum | 241 |
Range | 240 |
Interquartile range (IQR) | 120 |
Descriptive statistics
Standard deviation | 69.714896 |
---|---|
Coefficient of variation (CV) | 0.57615616 |
Kurtosis | -1.2 |
Mean | 121 |
Median Absolute Deviation (MAD) | 60 |
Skewness | 0 |
Sum | 29161 |
Variance | 4860.1667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.4% |
182 | 1 | 0.4% |
154 | 1 | 0.4% |
155 | 1 | 0.4% |
156 | 1 | 0.4% |
157 | 1 | 0.4% |
158 | 1 | 0.4% |
159 | 1 | 0.4% |
160 | 1 | 0.4% |
161 | 1 | 0.4% |
Other values (231) | 231 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
241 | 1 | |
240 | 1 | |
239 | 1 | |
238 | 1 | |
237 | 1 | |
236 | 1 | |
235 | 1 | |
234 | 1 | |
233 | 1 | |
232 | 1 |
동명
Categorical
HIGH CORRELATION
 
Distinct | 17 |
---|---|
Distinct (%) | 7.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.0 KiB |
대림1동 | |
---|---|
영등포동 | |
문래동 | |
당산2동 | |
당산1동 | |
Other values (12) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.9253112 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | 당산1동 |
---|---|
2nd row | 당산1동 |
3rd row | 당산1동 |
4th row | 당산1동 |
5th row | 당산1동 |
Common Values
Value | Count | Frequency (%) |
대림1동 | 53 | |
영등포동 | 44 | |
문래동 | 29 | |
당산2동 | 21 | 8.7% |
당산1동 | 15 | 6.2% |
대림2동 | 15 | 6.2% |
신길5동 | 14 | 5.8% |
대림3동 | 8 | 3.3% |
신길6동 | 7 | 2.9% |
신길1동 | 7 | 2.9% |
Other values (7) | 28 |
Length
Value | Count | Frequency (%) |
대림1동 | 53 | |
영등포동 | 44 | |
문래동 | 29 | |
당산2동 | 21 | 8.7% |
당산1동 | 15 | 6.2% |
대림2동 | 15 | 6.2% |
신길5동 | 14 | 5.8% |
대림3동 | 8 | 3.3% |
신길1동 | 7 | 2.9% |
신길6동 | 7 | 2.9% |
Other values (7) | 28 |
주소
Text
Distinct | 206 |
---|---|
Distinct (%) | 85.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.0 KiB |
Length
Max length | 50 |
---|---|
Median length | 38 |
Mean length | 23.062241 |
Min length | 16 |
Characters and Unicode
Total characters | 5558 |
---|---|
Distinct characters | 248 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 185 ? |
---|---|
Unique (%) | 76.8% |
Sample
1st row | 서울특별시 영등포구 당산로32길 1-6 |
---|---|
2nd row | 서울특별시 영등포구 국회대로36길 7-3 |
3rd row | 서울특별시 영등포구 당산로32길 5 이차돌 |
4th row | 서울특별시 영등포구 국회대로34길 4 가화 |
5th row | 서울특별시 영등포구 국회대로34길 3 |
Value | Count | Frequency (%) |
서울특별시 | 243 | |
영등포구 | 241 | |
앞 | 19 | 1.7% |
대림로 | 18 | 1.6% |
디지털로 | 18 | 1.6% |
2 | 14 | 1.3% |
도림로 | 9 | 0.8% |
4 | 9 | 0.8% |
신풍로 | 8 | 0.7% |
신길로 | 7 | 0.6% |
Other values (334) | 531 |
Most occurring characters
Value | Count | Frequency (%) |
892 | 16.0% | |
영 | 293 | 5.3% |
포 | 269 | 4.8% |
등 | 266 | 4.8% |
시 | 253 | 4.6% |
서 | 247 | 4.4% |
울 | 245 | 4.4% |
별 | 243 | 4.4% |
특 | 243 | 4.4% |
구 | 242 | 4.4% |
Other values (238) | 2365 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3723 | |
Space Separator | 892 | 16.0% |
Decimal Number | 825 | 14.8% |
Dash Punctuation | 48 | 0.9% |
Close Punctuation | 30 | 0.5% |
Open Punctuation | 30 | 0.5% |
Uppercase Letter | 8 | 0.1% |
Other Punctuation | 1 | < 0.1% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
영 | 293 | 7.9% |
포 | 269 | 7.2% |
등 | 266 | 7.1% |
시 | 253 | 6.8% |
서 | 247 | 6.6% |
울 | 245 | 6.6% |
별 | 243 | 6.5% |
특 | 243 | 6.5% |
구 | 242 | 6.5% |
로 | 239 | 6.4% |
Other values (216) | 1183 |
Decimal Number
Value | Count | Frequency (%) |
1 | 179 | |
2 | 112 | |
3 | 111 | |
4 | 102 | |
5 | 66 | 8.0% |
9 | 60 | 7.3% |
6 | 52 | 6.3% |
7 | 50 | 6.1% |
8 | 50 | 6.1% |
0 | 43 | 5.2% |
Uppercase Letter
Value | Count | Frequency (%) |
U | 2 | |
S | 2 | |
G | 1 | |
R | 1 | |
T | 1 | |
C | 1 |
Space Separator
Value | Count | Frequency (%) |
892 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 48 |
Close Punctuation
Value | Count | Frequency (%) |
) | 30 |
Open Punctuation
Value | Count | Frequency (%) |
( | 30 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 1 |
Math Symbol
Value | Count | Frequency (%) |
× | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3723 | |
Common | 1827 | |
Latin | 8 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
영 | 293 | 7.9% |
포 | 269 | 7.2% |
등 | 266 | 7.1% |
시 | 253 | 6.8% |
서 | 247 | 6.6% |
울 | 245 | 6.6% |
별 | 243 | 6.5% |
특 | 243 | 6.5% |
구 | 242 | 6.5% |
로 | 239 | 6.4% |
Other values (216) | 1183 |
Common
Value | Count | Frequency (%) |
892 | ||
1 | 179 | 9.8% |
2 | 112 | 6.1% |
3 | 111 | 6.1% |
4 | 102 | 5.6% |
5 | 66 | 3.6% |
9 | 60 | 3.3% |
6 | 52 | 2.8% |
7 | 50 | 2.7% |
8 | 50 | 2.7% |
Other values (6) | 153 | 8.4% |
Latin
Value | Count | Frequency (%) |
U | 2 | |
S | 2 | |
G | 1 | |
R | 1 | |
T | 1 | |
C | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3723 | |
ASCII | 1834 | |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
892 | ||
1 | 179 | 9.8% |
2 | 112 | 6.1% |
3 | 111 | 6.1% |
4 | 102 | 5.6% |
5 | 66 | 3.6% |
9 | 60 | 3.3% |
6 | 52 | 2.8% |
7 | 50 | 2.7% |
8 | 50 | 2.7% |
Other values (11) | 160 | 8.7% |
Hangul
Value | Count | Frequency (%) |
영 | 293 | 7.9% |
포 | 269 | 7.2% |
등 | 266 | 7.1% |
시 | 253 | 6.8% |
서 | 247 | 6.6% |
울 | 245 | 6.6% |
별 | 243 | 6.5% |
특 | 243 | 6.5% |
구 | 242 | 6.5% |
로 | 239 | 6.4% |
Other values (216) | 1183 |
None
Value | Count | Frequency (%) |
× | 1 |
비고
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.0 KiB |
<NA> | |
---|---|
꽁초픽 | 9 |
동 자체보관 | 6 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 4.0124481 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 226 | |
꽁초픽 | 9 | 3.7% |
동 자체보관 | 6 | 2.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 226 | |
꽁초픽 | 9 | 3.6% |
동 | 6 | 2.4% |
자체보관 | 6 | 2.4% |
데이터기준일
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.0 KiB |
Minimum | 2022-08-03 00:00:00 |
---|---|
Maximum | 2022-08-03 00:00:00 |
연번 | 동명 | 비고 | |
---|---|---|---|
연번 | 1.000 | 0.935 | 1.000 |
동명 | 0.935 | 1.000 | 1.000 |
비고 | 1.000 | 1.000 | 1.000 |
동명 | 비고 | |
---|---|---|
동명 | 1.000 | 0.920 |
비고 | 0.920 | 1.000 |
연번 | 동명 | 비고 | |
---|---|---|---|
연번 | 1.000 | 0.721 | 0.920 |
동명 | 0.721 | 1.000 | 0.920 |
비고 | 0.920 | 0.920 | 1.000 |
연번 | 동명 | 주소 | 비고 | 데이터기준일 | |
---|---|---|---|---|---|
0 | 1 | 당산1동 | 서울특별시 영등포구 당산로32길 1-6 | <NA> | 2022-08-03 |
1 | 2 | 당산1동 | 서울특별시 영등포구 국회대로36길 7-3 | <NA> | 2022-08-03 |
2 | 3 | 당산1동 | 서울특별시 영등포구 당산로32길 5 이차돌 | <NA> | 2022-08-03 |
3 | 4 | 당산1동 | 서울특별시 영등포구 국회대로34길 4 가화 | <NA> | 2022-08-03 |
4 | 5 | 당산1동 | 서울특별시 영등포구 국회대로34길 3 | <NA> | 2022-08-03 |
5 | 6 | 당산1동 | 서울특별시 영등포구 당산로31길 4 | <NA> | 2022-08-03 |
6 | 7 | 당산1동 | 서울특별시 영등포구 당산로36길 14 | <NA> | 2022-08-03 |
7 | 8 | 당산1동 | 서울특별시 영등포구 당산로36길 14 | <NA> | 2022-08-03 |
8 | 9 | 당산1동 | 서울특별시 영등포구 양산로23길 17 | <NA> | 2022-08-03 |
9 | 10 | 당산1동 | 서울특별시 영등포구 양산로23길 11 | 동 자체보관 | 2022-08-03 |
연번 | 동명 | 주소 | 비고 | 데이터기준일 | |
---|---|---|---|---|---|
231 | 232 | 영등포동 | 서울특별시 영등포구 영등포로35가길 5(로젠빌) | <NA> | 2022-08-03 |
232 | 233 | 영등포동 | 서울특별시 영등포구 영등포로33길 15-1 | <NA> | 2022-08-03 |
233 | 234 | 영등포동 | 서울특별시 영등포구 영등포로33길 17 | <NA> | 2022-08-03 |
234 | 235 | 영등포동 | 서울특별시 영등포구 영중로 65 동방미식성 | <NA> | 2022-08-03 |
235 | 236 | 영등포동 | 서울특별시 영등포구 영등포로42길 21-2 | <NA> | 2022-08-03 |
236 | 237 | 영등포동 | 서울특별시 영등포구 경인로112길 4 | <NA> | 2022-08-03 |
237 | 238 | 영등포본동 | 서울특별시 영등포구 영신로15길 7 현대기술학원 정문 | <NA> | 2022-08-03 |
238 | 239 | 영등포본동 | 서울특별시 영등포구 영신로15길 7 현대기술학원 후문 | <NA> | 2022-08-03 |
239 | 240 | 영등포본동 | 서울특별시 영등포구 영신로17길 | <NA> | 2022-08-03 |
240 | 241 | 영등포본동 | 서울특별시 영등포구 도신로29길 28 | <NA> | 2022-08-03 |