Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 5383 |
Missing cells | 8 |
Missing cells (%) | < 0.1% |
Duplicate rows | 366 |
Duplicate rows (%) | 6.8% |
Total size in memory | 252.5 KiB |
Average record size in memory | 48.0 B |
Variable types
Unsupported | 1 |
---|---|
Categorical | 3 |
Text | 2 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15069/F/1/datasetView.do |
Dataset has 366 (6.8%) duplicate rows | Duplicates |
Unnamed: 1 is highly overall correlated with Unnamed: 5 | High correlation |
Unnamed: 4 is highly overall correlated with Unnamed: 5 | High correlation |
Unnamed: 5 is highly overall correlated with Unnamed: 1 and 1 other fields | High correlation |
Unnamed: 5 is highly imbalanced (53.8%) | Imbalance |
가로 쓰레기통 현황 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-03-13 06:32:36.103303 |
---|---|
Analysis finished | 2024-03-13 06:32:37.055739 |
Duration | 0.95 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
가로 쓰레기통 현황
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 1 |
---|---|
Missing (%) | < 0.1% |
Memory size | 42.2 KiB |
Unnamed: 1
Categorical
HIGH CORRELATION
 
Distinct | 27 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 42.2 KiB |
강남구 | |
---|---|
강서구 | 315 |
은평구 | 308 |
도봉구 | 303 |
용산구 | 278 |
Other values (22) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0572172 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 자치구명 |
4th row | 종로구 |
5th row | 종로구 |
Common Values
Value | Count | Frequency (%) |
강남구 | 974 | |
강서구 | 315 | 5.9% |
은평구 | 308 | 5.7% |
도봉구 | 303 | 5.6% |
용산구 | 278 | 5.2% |
종로구 | 272 | 5.1% |
마포구 | 254 | 4.7% |
서초구 | 246 | 4.6% |
동작구 | 230 | 4.3% |
구로구 | 221 | 4.1% |
Other values (17) | 1982 |
Length
Value | Count | Frequency (%) |
강남구 | 974 | |
강서구 | 315 | 5.9% |
은평구 | 308 | 5.7% |
도봉구 | 303 | 5.6% |
용산구 | 278 | 5.2% |
종로구 | 272 | 5.1% |
마포구 | 254 | 4.7% |
서초구 | 246 | 4.6% |
동작구 | 230 | 4.3% |
구로구 | 221 | 4.1% |
Other values (17) | 1982 |
Unnamed: 2
Text
Distinct | 3341 |
---|---|
Distinct (%) | 62.1% |
Missing | 2 |
Missing (%) | < 0.1% |
Memory size | 42.2 KiB |
Length
Max length | 19 |
---|---|
Median length | 18 |
Mean length | 8.0795391 |
Min length | 4 |
Characters and Unicode
Total characters | 43476 |
---|---|
Distinct characters | 286 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 1734 ? |
---|---|
Unique (%) | 32.2% |
Sample
1st row | 설치위치(도로명 주소) |
---|---|
2nd row | 사직로 125 |
3rd row | 사직로 125 |
4th row | 자하문로 28 |
5th row | 자하문로 28 |
Value | Count | Frequency (%) |
도봉로 | 111 | 1.1% |
테헤란로 | 90 | 0.9% |
영동대로 | 86 | 0.9% |
삼성로 | 82 | 0.8% |
봉은사로 | 74 | 0.8% |
통일로 | 67 | 0.7% |
압구정로 | 64 | 0.7% |
학동로 | 62 | 0.6% |
논현로 | 62 | 0.6% |
도산대로 | 60 | 0.6% |
Other values (2770) | 9081 |
Most occurring characters
Value | Count | Frequency (%) |
로 | 4654 | 10.7% |
4622 | 10.6% | |
1 | 3445 | 7.9% |
2 | 2432 | 5.6% |
3 | 1998 | 4.6% |
4 | 1604 | 3.7% |
5 | 1515 | 3.5% |
0 | 1433 | 3.3% |
동 | 1432 | 3.3% |
6 | 1374 | 3.2% |
Other values (276) | 18967 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 20071 | |
Decimal Number | 17157 | |
Space Separator | 4622 | 10.6% |
Dash Punctuation | 1158 | 2.7% |
Open Punctuation | 234 | 0.5% |
Close Punctuation | 233 | 0.5% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 4654 | |
동 | 1432 | 7.1% |
대 | 676 | 3.4% |
길 | 590 | 2.9% |
산 | 358 | 1.8% |
가 | 357 | 1.8% |
도 | 333 | 1.7% |
봉 | 322 | 1.6% |
남 | 288 | 1.4% |
천 | 263 | 1.3% |
Other values (261) | 10798 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3445 | |
2 | 2432 | |
3 | 1998 | |
4 | 1604 | |
5 | 1515 | |
0 | 1433 | |
6 | 1374 | 8.0% |
7 | 1287 | 7.5% |
8 | 1070 | 6.2% |
9 | 999 | 5.8% |
Space Separator
Value | Count | Frequency (%) |
4622 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1158 |
Open Punctuation
Value | Count | Frequency (%) |
( | 234 |
Close Punctuation
Value | Count | Frequency (%) |
) | 233 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 23405 | |
Hangul | 20071 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 4654 | |
동 | 1432 | 7.1% |
대 | 676 | 3.4% |
길 | 590 | 2.9% |
산 | 358 | 1.8% |
가 | 357 | 1.8% |
도 | 333 | 1.7% |
봉 | 322 | 1.6% |
남 | 288 | 1.4% |
천 | 263 | 1.3% |
Other values (261) | 10798 |
Common
Value | Count | Frequency (%) |
4622 | ||
1 | 3445 | |
2 | 2432 | |
3 | 1998 | |
4 | 1604 | 6.9% |
5 | 1515 | 6.5% |
0 | 1433 | 6.1% |
6 | 1374 | 5.9% |
7 | 1287 | 5.5% |
- | 1158 | 4.9% |
Other values (5) | 2537 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 23405 | |
Hangul | 20071 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
로 | 4654 | |
동 | 1432 | 7.1% |
대 | 676 | 3.4% |
길 | 590 | 2.9% |
산 | 358 | 1.8% |
가 | 357 | 1.8% |
도 | 333 | 1.7% |
봉 | 322 | 1.6% |
남 | 288 | 1.4% |
천 | 263 | 1.3% |
Other values (261) | 10798 |
ASCII
Value | Count | Frequency (%) |
4622 | ||
1 | 3445 | |
2 | 2432 | |
3 | 1998 | |
4 | 1604 | 6.9% |
5 | 1515 | 6.5% |
0 | 1433 | 6.1% |
6 | 1374 | 5.9% |
7 | 1287 | 5.5% |
- | 1158 | 4.9% |
Other values (5) | 2537 |
Unnamed: 3
Text
Distinct | 3524 |
---|---|
Distinct (%) | 65.5% |
Missing | 5 |
Missing (%) | 0.1% |
Memory size | 42.2 KiB |
Value | Count | Frequency (%) |
앞 | 1702 | 13.7% |
버스정류장 | 319 | 2.6% |
출구 | 158 | 1.3% |
도로변 | 106 | 0.9% |
횡단보도 | 101 | 0.8% |
옆 | 91 | 0.7% |
건너편 | 54 | 0.4% |
방면 | 49 | 0.4% |
1번출구 | 49 | 0.4% |
통일로 | 47 | 0.4% |
Other values (4859) | 9731 |
Most occurring characters
Value | Count | Frequency (%) |
7238 | 8.9% | |
1 | 3289 | 4.0% |
( | 2862 | 3.5% |
) | 2860 | 3.5% |
2 | 2619 | 3.2% |
0 | 2582 | 3.2% |
앞 | 2198 | 2.7% |
스 | 2160 | 2.6% |
- | 2130 | 2.6% |
장 | 2061 | 2.5% |
Other values (674) | 51545 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 49034 | |
Decimal Number | 15830 | 19.4% |
Space Separator | 7238 | 8.9% |
Open Punctuation | 2862 | 3.5% |
Close Punctuation | 2860 | 3.5% |
Dash Punctuation | 2130 | 2.6% |
Uppercase Letter | 901 | 1.1% |
Other Punctuation | 621 | 0.8% |
Lowercase Letter | 52 | 0.1% |
Math Symbol | 9 | < 0.1% |
Other values (2) | 7 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
앞 | 2198 | 4.5% |
스 | 2160 | 4.4% |
장 | 2061 | 4.2% |
정 | 2014 | 4.1% |
류 | 1835 | 3.7% |
버 | 1799 | 3.7% |
로 | 1213 | 2.5% |
역 | 1118 | 2.3% |
구 | 1099 | 2.2% |
동 | 1035 | 2.1% |
Other values (610) | 32502 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 167 | |
D | 119 | |
K | 81 | |
S | 76 | |
B | 57 | 6.3% |
G | 55 | 6.1% |
C | 53 | 5.9% |
O | 48 | 5.3% |
T | 47 | 5.2% |
L | 35 | 3.9% |
Other values (13) | 163 |
Lowercase Letter
Value | Count | Frequency (%) |
g | 8 | |
l | 7 | |
e | 5 | |
u | 5 | |
r | 5 | |
o | 3 | 5.8% |
d | 3 | 5.8% |
a | 3 | 5.8% |
w | 3 | 5.8% |
c | 3 | 5.8% |
Other values (4) | 7 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3289 | |
2 | 2619 | |
0 | 2582 | |
3 | 1881 | |
4 | 1110 | 7.0% |
6 | 1013 | 6.4% |
5 | 951 | 6.0% |
8 | 797 | 5.0% |
7 | 796 | 5.0% |
9 | 792 | 5.0% |
Other Punctuation
Value | Count | Frequency (%) |
. | 277 | |
, | 222 | |
: | 102 | 16.4% |
/ | 6 | 1.0% |
' | 5 | 0.8% |
• | 4 | 0.6% |
& | 4 | 0.6% |
· | 1 | 0.2% |
Math Symbol
Value | Count | Frequency (%) |
+ | 6 | |
~ | 2 | 22.2% |
∙ | 1 | 11.1% |
Space Separator
Value | Count | Frequency (%) |
7238 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2862 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2860 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2130 |
Control
Value | Count | Frequency (%) |
5 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 49036 | |
Common | 31555 | |
Latin | 953 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
앞 | 2198 | 4.5% |
스 | 2160 | 4.4% |
장 | 2061 | 4.2% |
정 | 2014 | 4.1% |
류 | 1835 | 3.7% |
버 | 1799 | 3.7% |
로 | 1213 | 2.5% |
역 | 1118 | 2.3% |
구 | 1099 | 2.2% |
동 | 1035 | 2.1% |
Other values (611) | 32504 |
Latin
Value | Count | Frequency (%) |
I | 167 | |
D | 119 | |
K | 81 | 8.5% |
S | 76 | 8.0% |
B | 57 | 6.0% |
G | 55 | 5.8% |
C | 53 | 5.6% |
O | 48 | 5.0% |
T | 47 | 4.9% |
L | 35 | 3.7% |
Other values (27) | 215 |
Common
Value | Count | Frequency (%) |
7238 | ||
1 | 3289 | |
( | 2862 | 9.1% |
) | 2860 | 9.1% |
2 | 2619 | 8.3% |
0 | 2582 | 8.2% |
- | 2130 | 6.8% |
3 | 1881 | 6.0% |
4 | 1110 | 3.5% |
6 | 1013 | 3.2% |
Other values (16) | 3971 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 49034 | |
ASCII | 32502 | |
Punctuation | 4 | < 0.1% |
None | 3 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
7238 | ||
1 | 3289 | |
( | 2862 | 8.8% |
) | 2860 | 8.8% |
2 | 2619 | 8.1% |
0 | 2582 | 7.9% |
- | 2130 | 6.6% |
3 | 1881 | 5.8% |
4 | 1110 | 3.4% |
6 | 1013 | 3.1% |
Other values (50) | 4918 |
Hangul
Value | Count | Frequency (%) |
앞 | 2198 | 4.5% |
스 | 2160 | 4.4% |
장 | 2061 | 4.2% |
정 | 2014 | 4.1% |
류 | 1835 | 3.7% |
버 | 1799 | 3.7% |
로 | 1213 | 2.5% |
역 | 1118 | 2.3% |
구 | 1099 | 2.2% |
동 | 1035 | 2.1% |
Other values (610) | 32502 |
Punctuation
Value | Count | Frequency (%) |
• | 4 |
None
Value | Count | Frequency (%) |
㈜ | 2 | |
· | 1 |
Math Operators
Value | Count | Frequency (%) |
∙ | 1 |
Unnamed: 4
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 42.2 KiB |
정류소(버스,택시 등) | |
---|---|
도로변(횡단보도 포함) | |
지하철역 입구 | |
상가지역 | 111 |
광장, 공원 | 70 |
Other values (3) | 62 |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 11.262865 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 설치 장소 유형 |
4th row | 지하철역 입구 |
5th row | 지하철역 입구 |
Common Values
Value | Count | Frequency (%) |
정류소(버스,택시 등) | 2901 | |
도로변(횡단보도 포함) | 1829 | |
지하철역 입구 | 410 | 7.6% |
상가지역 | 111 | 2.1% |
광장, 공원 | 70 | 1.3% |
기타 | 59 | 1.1% |
<NA> | 2 | < 0.1% |
설치 장소 유형 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정류소(버스,택시 | 2901 | |
등 | 2901 | |
도로변(횡단보도 | 1829 | |
포함 | 1829 | |
지하철역 | 410 | 3.9% |
입구 | 410 | 3.9% |
상가지역 | 111 | 1.0% |
광장 | 70 | 0.7% |
공원 | 70 | 0.7% |
기타 | 59 | 0.6% |
Other values (4) | 5 | < 0.1% |
Unnamed: 5
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 42.2 KiB |
일반쓰레기 | |
---|---|
재활용쓰레기 | |
<NA> | 2 |
수거 쓰레기 종류 | 1 |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 5.3314137 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 수거 쓰레기 종류 |
4th row | 일반쓰레기 |
5th row | 재활용쓰레기 |
Common Values
Value | Count | Frequency (%) |
일반쓰레기 | 3598 | |
재활용쓰레기 | 1782 | |
<NA> | 2 | < 0.1% |
수거 쓰레기 종류 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반쓰레기 | 3598 | |
재활용쓰레기 | 1782 | |
na | 2 | < 0.1% |
수거 | 1 | < 0.1% |
쓰레기 | 1 | < 0.1% |
종류 | 1 | < 0.1% |
Unnamed: 1 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|
Unnamed: 1 | 1.000 | 0.789 | 0.912 |
Unnamed: 4 | 0.789 | 1.000 | 0.771 |
Unnamed: 5 | 0.912 | 0.771 | 1.000 |
Unnamed: 1 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|
Unnamed: 1 | 1.000 | 0.484 | 0.775 |
Unnamed: 4 | 0.484 | 1.000 | 0.710 |
Unnamed: 5 | 0.775 | 0.710 | 1.000 |
Unnamed: 1 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|
Unnamed: 1 | 1.000 | 0.484 | 0.775 |
Unnamed: 4 | 0.484 | 1.000 | 0.710 |
Unnamed: 5 | 0.775 | 0.710 | 1.000 |
가로 쓰레기통 현황 | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|---|---|---|
0 | NaN | <NA> | <NA> | <NA> | <NA> | <NA> |
1 | 기준일자 : '23. 12. 31. | <NA> | <NA> | <NA> | <NA> | <NA> |
2 | 연번 | 자치구명 | 설치위치(도로명 주소) | 세부 위치 | 설치 장소 유형 | 수거 쓰레기 종류 |
3 | 1 | 종로구 | 사직로 125 | 경복궁역 4번출구 | 지하철역 입구 | 일반쓰레기 |
4 | 2 | 종로구 | 사직로 125 | 경복궁역 4번출구 | 지하철역 입구 | 재활용쓰레기 |
5 | 3 | 종로구 | 자하문로 28 | 스타벅스 앞 | 도로변(횡단보도 포함) | 일반쓰레기 |
6 | 4 | 종로구 | 자하문로 28 | 스타벅스 앞 | 도로변(횡단보도 포함) | 재활용쓰레기 |
7 | 5 | 종로구 | 자하문로 44 | 라파리나 카페 앞 | 도로변(횡단보도 포함) | 일반쓰레기 |
8 | 6 | 종로구 | 자하문로 44 | 라파리나 카페 앞 | 도로변(횡단보도 포함) | 재활용쓰레기 |
9 | 7 | 종로구 | 자하문로 68 | 평화제과 앞 | 도로변(횡단보도 포함) | 일반쓰레기 |
가로 쓰레기통 현황 | Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | |
---|---|---|---|---|---|---|
5373 | 5371 | 강동구 | 동남로71길 | 주양쇼핑 따릉이 대여소(1036) 앞 | 도로변(횡단보도 포함) | 일반쓰레기 |
5374 | 5372 | 강동구 | 고덕로 276 | 명일동 이마트 앞(상일동 방향) 횡단보도 | 도로변(횡단보도 포함) | 일반쓰레기 |
5375 | 5373 | 강동구 | 고덕로 276 | 명일동 이마트 앞(고덕동 방향) 횡단보도 | 도로변(횡단보도 포함) | 일반쓰레기 |
5376 | 5374 | 강동구 | 고덕로 276 | 강동아트센터(25-179) | 정류소(버스,택시 등) | 일반쓰레기 |
5377 | 5375 | 강동구 | 동남로 832 | 한영중고한영외고 앞(25-181) | 정류소(버스,택시 등) | 일반쓰레기 |
5378 | 5376 | 강동구 | 명일동 60 | 한영중고한영외고 맞은편(25-180) | 정류소(버스,택시 등) | 일반쓰레기 |
5379 | 5377 | 강동구 | 고덕로 269 | 고덕역 3번 출구(명덕성결교회 입구 부근) | 지하철역 입구 | 일반쓰레기 |
5380 | 5378 | 강동구 | 고덕동 313-1 | 배재중고등학교(25-141)(배재고등학교정문 옆) | 정류소(버스,택시 등) | 일반쓰레기 |
5381 | 5379 | 강동구 | 상일동 440-3 | 상일초교(중)(25-001) | 정류소(버스,택시 등) | 일반쓰레기 |
5382 | 5380 | 강동구 | 상일동 512 | 강동첨단업무단지,상일여고입구(25-310) | 정류소(버스,택시 등) | 일반쓰레기 |
Most frequently occurring
Unnamed: 1 | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | # duplicates | |
---|---|---|---|---|---|---|
271 | 송파구 | 장지동 896-1(위례중앙로) | 위례중앙광장(장지동 896-1) | 광장, 공원 | 재활용쓰레기 | 4 |
295 | 용산구 | 한남동 705-10 | 순천향대학병원(서초IC방면) 버스정류장(03-164) | 정류소(버스,택시 등) | 일반쓰레기 | 4 |
8 | 강동구 | 천호대로 1120 | 길동사거리,강동세무서(25-010) | 정류소(버스,택시 등) | 일반쓰레기 | 3 |
9 | 강동구 | 천호대로 1180 | 길동주민센터,둔촌2동주민센터(25-007) | 정류소(버스,택시 등) | 일반쓰레기 | 3 |
10 | 강동구 | 천호대로 1180 | 길동주민센터,둔촌2동주민센터(25-008) | 정류소(버스,택시 등) | 일반쓰레기 | 3 |
11 | 강동구 | 천호대로1240 | 강동자이,프라자아파트(25-005) | 정류소(버스,택시 등) | 일반쓰레기 | 3 |
12 | 강동구 | 천호대로1240 | 강동자이,프라자아파트(25-006) | 정류소(버스,택시 등) | 일반쓰레기 | 3 |
28 | 광진구 | 강변역로 50 | 동서울터미널 흡연부스 안 | 기타 | 일반쓰레기 | 3 |
33 | 구로구 | 가마산로 250 | 도로변 | 도로변(횡단보도 포함) | 일반쓰레기 | 3 |
51 | 동작구 | 노량진로 114-5 | 올리브 영 | 도로변(횡단보도 포함) | 재활용쓰레기 | 3 |