Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 5376 |
Missing cells | 5640 |
Missing cells (%) | 15.0% |
Duplicate rows | 761 |
Duplicate rows (%) | 14.2% |
Total size in memory | 299.4 KiB |
Average record size in memory | 57.0 B |
Variable types
Unsupported | 3 |
---|---|
Categorical | 2 |
Text | 2 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15069/F/1/datasetView.do |
Dataset has 761 (14.2%) duplicate rows | Duplicates |
Unnamed: 2 is highly overall correlated with Unnamed: 6 | High correlation |
Unnamed: 6 is highly overall correlated with Unnamed: 2 | High correlation |
Unnamed: 0 has 5376 (100.0%) missing values | Missing |
Unnamed: 3 has 232 (4.3%) missing values | Missing |
Unnamed: 0 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
서울시 가로쓰레기통 현황 (2021.6월 기준) is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 4 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-03-13 06:32:29.776233 |
---|---|
Analysis finished | 2024-03-13 06:32:30.521909 |
Duration | 0.75 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
Unnamed: 0
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 5376 |
---|---|
Missing (%) | 100.0% |
Memory size | 47.4 KiB |
서울시 가로쓰레기통 현황 (2021.6월 기준)
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 0 |
---|---|
Missing (%) | 0.0% |
Memory size | 42.1 KiB |
Unnamed: 2
Categorical
HIGH CORRELATION
 
Distinct | 26 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 42.1 KiB |
강남구 | |
---|---|
구로구 | 292 |
서대문구 | 290 |
강서 | 287 |
도봉구 | 280 |
Other values (21) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0228795 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 자치구명 |
---|---|
2nd row | 종로구 |
3rd row | 종로구 |
4th row | 종로구 |
5th row | 종로구 |
Common Values
Value | Count | Frequency (%) |
강남구 | 976 | |
구로구 | 292 | 5.4% |
서대문구 | 290 | 5.4% |
강서 | 287 | 5.3% |
도봉구 | 280 | 5.2% |
용산구 | 269 | 5.0% |
서초구 | 250 | 4.7% |
강북구 | 247 | 4.6% |
마포구 | 239 | 4.4% |
은평구 | 233 | 4.3% |
Other values (16) | 2013 |
Length
Value | Count | Frequency (%) |
강남구 | 976 | |
구로구 | 292 | 5.4% |
서대문구 | 290 | 5.4% |
강서 | 287 | 5.3% |
도봉구 | 280 | 5.2% |
용산구 | 269 | 5.0% |
서초구 | 250 | 4.7% |
강북구 | 247 | 4.6% |
마포구 | 239 | 4.4% |
은평구 | 233 | 4.3% |
Other values (16) | 2013 |
Unnamed: 3
Text
MISSING
 
Distinct | 587 |
---|---|
Distinct (%) | 11.4% |
Missing | 232 |
Missing (%) | 4.3% |
Memory size | 42.1 KiB |
Value | Count | Frequency (%) |
도봉로 | 150 | 2.8% |
남부순환로 | 116 | 2.2% |
영동대로 | 108 | 2.0% |
통일로 | 94 | 1.8% |
천호대로 | 81 | 1.5% |
테헤란로 | 80 | 1.5% |
삼성로 | 78 | 1.5% |
경인로 | 71 | 1.3% |
봉은사로 | 70 | 1.3% |
한강대로 | 68 | 1.3% |
Other values (584) | 4447 |
Most occurring characters
Value | Count | Frequency (%) |
로 | 4943 | |
대 | 742 | 3.8% |
동 | 585 | 3.0% |
도 | 337 | 1.7% |
산 | 327 | 1.7% |
봉 | 324 | 1.7% |
길 | 279 | 1.4% |
천 | 252 | 1.3% |
251 | 1.3% | |
남 | 227 | 1.2% |
Other values (262) | 11295 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 18177 | |
Decimal Number | 1049 | 5.4% |
Space Separator | 251 | 1.3% |
Control | 23 | 0.1% |
Open Punctuation | 20 | 0.1% |
Close Punctuation | 20 | 0.1% |
Dash Punctuation | 15 | 0.1% |
Math Symbol | 6 | < 0.1% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 4943 | |
대 | 742 | 4.1% |
동 | 585 | 3.2% |
도 | 337 | 1.9% |
산 | 327 | 1.8% |
봉 | 324 | 1.8% |
길 | 279 | 1.5% |
천 | 252 | 1.4% |
남 | 227 | 1.2% |
일 | 213 | 1.2% |
Other values (245) | 9948 |
Decimal Number
Value | Count | Frequency (%) |
1 | 223 | |
2 | 152 | |
5 | 112 | |
3 | 98 | |
0 | 85 | 8.1% |
9 | 84 | 8.0% |
7 | 78 | 7.4% |
8 | 77 | 7.3% |
4 | 75 | 7.1% |
6 | 65 | 6.2% |
Space Separator
Value | Count | Frequency (%) |
251 |
Control
Value | Count | Frequency (%) |
23 |
Open Punctuation
Value | Count | Frequency (%) |
( | 20 |
Close Punctuation
Value | Count | Frequency (%) |
) | 20 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 15 |
Math Symbol
Value | Count | Frequency (%) |
~ | 6 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 18177 | |
Common | 1385 | 7.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 4943 | |
대 | 742 | 4.1% |
동 | 585 | 3.2% |
도 | 337 | 1.9% |
산 | 327 | 1.8% |
봉 | 324 | 1.8% |
길 | 279 | 1.5% |
천 | 252 | 1.4% |
남 | 227 | 1.2% |
일 | 213 | 1.2% |
Other values (245) | 9948 |
Common
Value | Count | Frequency (%) |
251 | ||
1 | 223 | |
2 | 152 | |
5 | 112 | |
3 | 98 | 7.1% |
0 | 85 | 6.1% |
9 | 84 | 6.1% |
7 | 78 | 5.6% |
8 | 77 | 5.6% |
4 | 75 | 5.4% |
Other values (7) | 150 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 18177 | |
ASCII | 1385 | 7.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
로 | 4943 | |
대 | 742 | 4.1% |
동 | 585 | 3.2% |
도 | 337 | 1.9% |
산 | 327 | 1.8% |
봉 | 324 | 1.8% |
길 | 279 | 1.5% |
천 | 252 | 1.4% |
남 | 227 | 1.2% |
일 | 213 | 1.2% |
Other values (245) | 9948 |
ASCII
Value | Count | Frequency (%) |
251 | ||
1 | 223 | |
2 | 152 | |
5 | 112 | |
3 | 98 | 7.1% |
0 | 85 | 6.1% |
9 | 84 | 6.1% |
7 | 78 | 5.6% |
8 | 77 | 5.6% |
4 | 75 | 5.4% |
Other values (7) | 150 |
Unnamed: 4
Unsupported
REJECTED
  UNSUPPORTED
 
Missing | 0 |
---|---|
Missing (%) | 0.0% |
Memory size | 42.1 KiB |
Unnamed: 5
Text
Distinct | 332 |
---|---|
Distinct (%) | 6.2% |
Missing | 32 |
Missing (%) | 0.6% |
Memory size | 42.1 KiB |
Value | Count | Frequency (%) |
등 | 2107 | |
택시 | 1880 | |
정류소(버스 | 1425 | |
도로변(횡단보도 | 954 | 7.7% |
포함 | 954 | 7.7% |
도로(가로)변 | 542 | 4.4% |
입구 | 530 | 4.3% |
정류장(버스 | 455 | 3.7% |
지하철역 | 452 | 3.6% |
① | 394 | 3.2% |
Other values (375) | 2756 |
Most occurring characters
Value | Count | Frequency (%) |
7250 | 13.0% | |
) | 3543 | 6.4% |
( | 3543 | 6.4% |
도 | 2593 | 4.7% |
스 | 2548 | 4.6% |
버 | 2537 | 4.6% |
로 | 2395 | 4.3% |
정 | 2365 | 4.2% |
류 | 2358 | 4.2% |
등 | 2119 | 3.8% |
Other values (326) | 24472 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 38415 | |
Space Separator | 7250 | 13.0% |
Close Punctuation | 3543 | 6.4% |
Open Punctuation | 3543 | 6.4% |
Other Punctuation | 1854 | 3.3% |
Other Number | 924 | 1.7% |
Decimal Number | 150 | 0.3% |
Uppercase Letter | 38 | 0.1% |
Lowercase Letter | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 2593 | 6.7% |
스 | 2548 | 6.6% |
버 | 2537 | 6.6% |
로 | 2395 | 6.2% |
정 | 2365 | 6.2% |
류 | 2358 | 6.1% |
등 | 2119 | 5.5% |
시 | 2024 | 5.3% |
택 | 2021 | 5.3% |
소 | 1624 | 4.2% |
Other values (287) | 15831 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 7 | |
U | 6 | |
G | 4 | |
C | 4 | |
A | 3 | |
K | 3 | |
T | 3 | |
W | 2 | 5.3% |
B | 2 | 5.3% |
Y | 2 | 5.3% |
Other values (2) | 2 | 5.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 45 | |
2 | 26 | |
0 | 24 | |
3 | 16 | 10.7% |
4 | 12 | 8.0% |
9 | 6 | 4.0% |
6 | 6 | 4.0% |
5 | 5 | 3.3% |
8 | 5 | 3.3% |
7 | 5 | 3.3% |
Other Number
Value | Count | Frequency (%) |
① | 394 | |
③ | 219 | |
⑥ | 104 | 11.3% |
② | 103 | 11.1% |
⑤ | 37 | 4.0% |
④ | 36 | 3.9% |
⑦ | 31 | 3.4% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1 | |
w | 1 | |
o | 1 | |
r | 1 | |
l | 1 | |
d | 1 |
Space Separator
Value | Count | Frequency (%) |
7250 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3543 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3543 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1854 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 38415 | |
Common | 17264 | |
Latin | 44 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 2593 | 6.7% |
스 | 2548 | 6.6% |
버 | 2537 | 6.6% |
로 | 2395 | 6.2% |
정 | 2365 | 6.2% |
류 | 2358 | 6.1% |
등 | 2119 | 5.5% |
시 | 2024 | 5.3% |
택 | 2021 | 5.3% |
소 | 1624 | 4.2% |
Other values (287) | 15831 |
Common
Value | Count | Frequency (%) |
7250 | ||
) | 3543 | |
( | 3543 | |
, | 1854 | 10.7% |
① | 394 | 2.3% |
③ | 219 | 1.3% |
⑥ | 104 | 0.6% |
② | 103 | 0.6% |
1 | 45 | 0.3% |
⑤ | 37 | 0.2% |
Other values (11) | 172 | 1.0% |
Latin
Value | Count | Frequency (%) |
S | 7 | |
U | 6 | |
G | 4 | |
C | 4 | |
A | 3 | 6.8% |
K | 3 | 6.8% |
T | 3 | 6.8% |
W | 2 | 4.5% |
B | 2 | 4.5% |
Y | 2 | 4.5% |
Other values (8) | 8 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 38415 | |
ASCII | 16384 | |
Enclosed Alphanum | 924 | 1.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
7250 | ||
) | 3543 | |
( | 3543 | |
, | 1854 | 11.3% |
1 | 45 | 0.3% |
2 | 26 | 0.2% |
0 | 24 | 0.1% |
3 | 16 | 0.1% |
4 | 12 | 0.1% |
S | 7 | < 0.1% |
Other values (22) | 64 | 0.4% |
Hangul
Value | Count | Frequency (%) |
도 | 2593 | 6.7% |
스 | 2548 | 6.6% |
버 | 2537 | 6.6% |
로 | 2395 | 6.2% |
정 | 2365 | 6.2% |
류 | 2358 | 6.1% |
등 | 2119 | 5.5% |
시 | 2024 | 5.3% |
택 | 2021 | 5.3% |
소 | 1624 | 4.2% |
Other values (287) | 15831 |
Enclosed Alphanum
Value | Count | Frequency (%) |
① | 394 | |
③ | 219 | |
⑥ | 104 | 11.3% |
② | 103 | 11.1% |
⑤ | 37 | 4.0% |
④ | 36 | 3.9% |
⑦ | 31 | 3.4% |
Unnamed: 6
Categorical
HIGH CORRELATION
 
Distinct | 26 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 42.1 KiB |
일반쓰레기 | |
---|---|
재활용쓰레기 | |
재활용 | |
일반쓰레기 수거용 | |
① 일반쓰레기 | |
Other values (21) |
Length
Max length | 27 |
---|---|
Median length | 15 |
Mean length | 6.2613467 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 수거 쓰레기 종류(일반 쓰레기 / 재활용 쓰레기) |
---|---|
2nd row | 일반쓰레기 |
3rd row | 재활용 |
4th row | 일반쓰레기 |
5th row | 재활용 |
Common Values
Value | Count | Frequency (%) |
일반쓰레기 | 1896 | |
재활용쓰레기 | 586 | 10.9% |
재활용 | 522 | 9.7% |
일반쓰레기 수거용 | 380 | 7.1% |
① 일반쓰레기 | 329 | 6.1% |
일반쓰레기수거용 | 250 | 4.7% |
재활용쓰레기 | 205 | 3.8% |
일반쓰레기 | 205 | 3.8% |
① 정류장(버스 등) | 159 | 3.0% |
② 재활용품 수거용 | 153 | 2.8% |
Other values (16) | 691 | 12.9% |
Length
Value | Count | Frequency (%) |
일반쓰레기 | 2947 | |
재활용쓰레기 | 886 | 11.9% |
수거용 | 760 | 10.2% |
① | 628 | 8.4% |
재활용 | 613 | 8.2% |
② | 260 | 3.5% |
일반쓰레기수거용 | 250 | 3.4% |
등 | 168 | 2.3% |
정류장(버스 | 162 | 2.2% |
재활용품 | 153 | 2.1% |
Other values (19) | 622 | 8.4% |
Unnamed: 2 | Unnamed: 6 | |
---|---|---|
Unnamed: 2 | 1.000 | 0.973 |
Unnamed: 6 | 0.973 | 1.000 |
Unnamed: 6 | Unnamed: 2 | |
---|---|---|
Unnamed: 6 | 1.000 | 0.561 |
Unnamed: 2 | 0.561 | 1.000 |
Unnamed: 2 | Unnamed: 6 | |
---|---|---|
Unnamed: 2 | 1.000 | 0.561 |
Unnamed: 6 | 0.561 | 1.000 |
Unnamed: 0 | 서울시 가로쓰레기통 현황 (2021.6월 기준) | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | Unnamed: 6 | |
---|---|---|---|---|---|---|---|
0 | <NA> | 연번 | 자치구명 | 도로명 | 세부 위치(상세 주소) | 설치 지점 | 수거 쓰레기 종류(일반 쓰레기 / 재활용 쓰레기) |
1 | <NA> | 1 | 종로구 | 사직로 | 경복궁역 4번출구 | 지하철역 입구 | 일반쓰레기 |
2 | <NA> | 2 | 종로구 | 사직로 | 경복궁역 4번출구 | 지하철역 입구 | 재활용 |
3 | <NA> | 3 | 종로구 | 자하문로 | 자하문로 28 | 도로(가로)변 | 일반쓰레기 |
4 | <NA> | 4 | 종로구 | 자하문로 | 자하문로 28 | 도로(가로)변 | 재활용 |
5 | <NA> | 5 | 종로구 | 자하문로 | 자하문로 44 | 도로(가로)변 | 일반쓰레기 |
6 | <NA> | 6 | 종로구 | 자하문로 | 자하문로 44 | 도로(가로)변 | 재활용 |
7 | <NA> | 7 | 종로구 | 자하문로 | 자하문로 68(효자동 정류소) | 정류장(버스, 택시 등) | 일반쓰레기 |
8 | <NA> | 8 | 종로구 | 자하문로 | 자하문로 68(효자동 정류소) | 정류장(버스, 택시 등) | 재활용 |
9 | <NA> | 9 | 종로구 | 효자로 | 청와대 분수대(사랑채) | 광장 등 다중집합장소 | 일반쓰레기 |
Unnamed: 0 | 서울시 가로쓰레기통 현황 (2021.6월 기준) | Unnamed: 2 | Unnamed: 3 | Unnamed: 4 | Unnamed: 5 | Unnamed: 6 | |
---|---|---|---|---|---|---|---|
5366 | <NA> | 5366 | 도봉구 | 해등로 | 해등로 48 | 창1동주민센터 앞 | ⑥ 횡단보도 입구 |
5367 | <NA> | 5367 | 도봉구 | 해등로 | 해등로 139 | 미소애아파트 앞 버스정류장 | ① 정류장(버스, 택시 등) |
5368 | <NA> | 5368 | 도봉구 | 해등로 | 창동 347-5 | 창1동주민센터 버스정류장 | ① 정류장(버스, 택시 등) |
5369 | <NA> | 5369 | 도봉구 | 노해로 | 노해로62길 36 | 창북중학교 앞 횡단보도 | ⑥ 횡단보도 입구 |
5370 | <NA> | 5370 | 도봉구 | 노해로 | 창동 135-26 | 창동지하차도 이마트 건너편 횡단보도 | ⑥ 횡단보도 입구 |
5371 | <NA> | 5371 | 도봉구 | 해등로 | 해등로3길 41 | 삼환빌라 앞 횡단보도 | ⑥ 횡단보도 입구 |
5372 | <NA> | 5372 | 도봉구 | 해등로 | 해등로 103 | 창원초등학교 앞 횡단보도 | ⑥ 횡단보도 입구 |
5373 | <NA> | 5373 | 도봉구 | 도봉산길 | 도봉산길 27 | 도봉고등학교 건너편 횡단보도 | ⑥ 횡단보도 입구 |
5374 | <NA> | 5374 | 도봉구 | 도봉로 | 도봉동 620-23 | 신도봉사거리 도봉중학교방향 횡단보도 | ⑥ 횡단보도 입구 |
5375 | <NA> | 5375 | 도봉구 | 해등로 | 해등로 32 | 창1동 서울가든아파트 버스정류장 | ① 정류장(버스, 택시 등) |
Most frequently occurring
Unnamed: 2 | Unnamed: 3 | Unnamed: 5 | Unnamed: 6 | # duplicates | |
---|---|---|---|---|---|
473 | 서초구 | <NA> | 정류소(버스, 택시 등) | 재활용쓰레기 | 95 |
474 | 서초구 | <NA> | 지하철역 입구 | 재활용쓰레기 | 72 |
135 | 강동구 | 천호대로 | 버스중앙차로 | 일반쓰레기 | 37 |
203 | 강서 | 양천로 | 버스정류장 | 일반쓰레기 수거용 | 36 |
472 | 서초구 | <NA> | 상가지역 | 재활용쓰레기 | 36 |
324 | 금천구 | 시흥대로 | 정류소(버스, 택시 등) | 일반쓰레기 | 33 |
330 | 노원구 | 동일로 | 정류소(버스, 택시 등) | 일반쓰레기 | 31 |
454 | 서대문구 | 연세로 | ③ 도로(가로)변 | ② 재활용품 수거용 | 30 |
631 | 용산구 | 한강대로 | 도로(가로)변 | 일반쓰레기수거용 | 29 |
475 | 서초구 | <NA> | <NA> | 재활용쓰레기 | 28 |