Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 291 |
Missing cells | 10 |
Missing cells (%) | 0.7% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.3% |
Total size in memory | 12.1 KiB |
Average record size in memory | 42.5 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 광주광역시 5개 자치구에서 설치한 가로 쓰레기통 현황을 공공데이터 목록에 등록합니다. 광주광역시 자원순환과 등록(설치장소, 설치위치 등) |
---|---|
URL | https://www.data.go.kr/data/15056448/fileData.do |
Dataset has 1 (0.3%) duplicate rows | Duplicates |
데이터기준일자 is highly overall correlated with 연번 and 2 other fields | High correlation |
설치개수 is highly overall correlated with 데이터기준일자 | High correlation |
자치구명 is highly overall correlated with 연번 and 1 other fields | High correlation |
연번 is highly overall correlated with 자치구명 and 1 other fields | High correlation |
설치개수 is highly imbalanced (62.9%) | Imbalance |
데이터기준일자 is highly imbalanced (87.5%) | Imbalance |
연번 has 5 (1.7%) missing values | Missing |
설치장소 has 5 (1.7%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 12:30:46.583367 |
---|---|
Analysis finished | 2023-12-12 12:30:47.843524 |
Duration | 1.26 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 286 |
---|---|
Distinct (%) | 100.0% |
Missing | 5 |
Missing (%) | 1.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 241.07692 |
Minimum | 1 |
---|---|
Maximum | 440 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.7 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 15.25 |
Q1 | 87.25 |
median | 289.5 |
Q3 | 368.75 |
95-th percentile | 425.75 |
Maximum | 440 |
Range | 439 |
Interquartile range (IQR) | 281.5 |
Descriptive statistics
Standard deviation | 145.20674 |
---|---|
Coefficient of variation (CV) | 0.60232534 |
Kurtosis | -1.4408933 |
Mean | 241.07692 |
Median Absolute Deviation (MAD) | 110 |
Skewness | -0.33863051 |
Sum | 68948 |
Variance | 21084.998 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
336 | 1 | 0.3% |
342 | 1 | 0.3% |
341 | 1 | 0.3% |
340 | 1 | 0.3% |
339 | 1 | 0.3% |
338 | 1 | 0.3% |
337 | 1 | 0.3% |
335 | 1 | 0.3% |
344 | 1 | 0.3% |
334 | 1 | 0.3% |
Other values (276) | 276 | |
(Missing) | 5 | 1.7% |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
440 | 1 | |
439 | 1 | |
438 | 1 | |
437 | 1 | |
436 | 1 | |
435 | 1 | |
434 | 1 | |
433 | 1 | |
432 | 1 | |
431 | 1 |
자치구명
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 2.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
광주광역시 북구 | |
---|---|
광주광역시 광산구 | |
광주광역시 서구 | |
광주광역시 동구 | |
광주광역시 남구 |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 8.2027491 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 광주광역시 동구 |
---|---|
2nd row | 광주광역시 동구 |
3rd row | 광주광역시 동구 |
4th row | 광주광역시 동구 |
5th row | 광주광역시 동구 |
Common Values
Value | Count | Frequency (%) |
광주광역시 북구 | 92 | |
광주광역시 광산구 | 79 | |
광주광역시 서구 | 59 | |
광주광역시 동구 | 43 | |
광주광역시 남구 | 13 | 4.5% |
<NA> | 5 | 1.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
광주광역시 | 286 | |
북구 | 92 | 15.9% |
광산구 | 79 | 13.7% |
서구 | 59 | 10.2% |
동구 | 43 | 7.5% |
남구 | 13 | 2.3% |
na | 5 | 0.9% |
설치장소
Text
MISSING
 
Distinct | 286 |
---|---|
Distinct (%) | 100.0% |
Missing | 5 |
Missing (%) | 1.7% |
Memory size | 2.4 KiB |
Length
Max length | 28 |
---|---|
Median length | 20 |
Mean length | 11.265734 |
Min length | 3 |
Characters and Unicode
Total characters | 3222 |
---|---|
Distinct characters | 306 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 286 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 금남공원(지하도 입구) |
---|---|
2nd row | 삼성생명 앞 |
3rd row | YMCA 앞 |
4th row | 농협중앙회 앞 |
5th row | 금남로4가역 남선빌딩 앞 하나증권 |
Value | Count | Frequency (%) |
앞 | 79 | 12.7% |
맞은편 | 19 | 3.1% |
버스승강장 | 19 | 3.1% |
사거리 | 11 | 1.8% |
횡단보도 | 10 | 1.6% |
건너편 | 9 | 1.4% |
입구 | 9 | 1.4% |
방향 | 8 | 1.3% |
금호동 | 8 | 1.3% |
옆 | 6 | 1.0% |
Other values (363) | 443 |
Most occurring characters
Value | Count | Frequency (%) |
346 | 10.7% | |
) | 90 | 2.8% |
( | 89 | 2.8% |
장 | 88 | 2.7% |
앞 | 86 | 2.7% |
동 | 73 | 2.3% |
주 | 51 | 1.6% |
구 | 49 | 1.5% |
아 | 47 | 1.5% |
리 | 44 | 1.4% |
Other values (296) | 2259 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2608 | |
Space Separator | 346 | 10.7% |
Close Punctuation | 90 | 2.8% |
Open Punctuation | 89 | 2.8% |
Decimal Number | 53 | 1.6% |
Uppercase Letter | 27 | 0.8% |
Other Punctuation | 8 | 0.2% |
Lowercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 88 | 3.4% |
앞 | 86 | 3.3% |
동 | 73 | 2.8% |
주 | 51 | 2.0% |
구 | 49 | 1.9% |
아 | 47 | 1.8% |
리 | 44 | 1.7% |
교 | 42 | 1.6% |
스 | 42 | 1.6% |
파 | 41 | 1.6% |
Other values (265) | 2045 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 5 | |
S | 4 | |
C | 3 | |
G | 3 | |
T | 2 | 7.4% |
N | 2 | 7.4% |
B | 2 | 7.4% |
M | 2 | 7.4% |
D | 1 | 3.7% |
Y | 1 | 3.7% |
Other values (2) | 2 | 7.4% |
Decimal Number
Value | Count | Frequency (%) |
1 | 14 | |
3 | 10 | |
2 | 6 | |
4 | 6 | |
5 | 5 | 9.4% |
0 | 3 | 5.7% |
6 | 3 | 5.7% |
9 | 3 | 5.7% |
8 | 2 | 3.8% |
7 | 1 | 1.9% |
Other Punctuation
Value | Count | Frequency (%) |
· | 2 | |
& | 2 | |
. | 2 | |
/ | 1 | |
, | 1 |
Space Separator
Value | Count | Frequency (%) |
346 |
Close Punctuation
Value | Count | Frequency (%) |
) | 90 |
Open Punctuation
Value | Count | Frequency (%) |
( | 89 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2608 | |
Common | 586 | 18.2% |
Latin | 28 | 0.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 88 | 3.4% |
앞 | 86 | 3.3% |
동 | 73 | 2.8% |
주 | 51 | 2.0% |
구 | 49 | 1.9% |
아 | 47 | 1.8% |
리 | 44 | 1.7% |
교 | 42 | 1.6% |
스 | 42 | 1.6% |
파 | 41 | 1.6% |
Other values (265) | 2045 |
Common
Value | Count | Frequency (%) |
346 | ||
) | 90 | 15.4% |
( | 89 | 15.2% |
1 | 14 | 2.4% |
3 | 10 | 1.7% |
2 | 6 | 1.0% |
4 | 6 | 1.0% |
5 | 5 | 0.9% |
0 | 3 | 0.5% |
6 | 3 | 0.5% |
Other values (8) | 14 | 2.4% |
Latin
Value | Count | Frequency (%) |
K | 5 | |
S | 4 | |
C | 3 | |
G | 3 | |
T | 2 | 7.1% |
N | 2 | 7.1% |
B | 2 | 7.1% |
M | 2 | 7.1% |
D | 1 | 3.6% |
Y | 1 | 3.6% |
Other values (3) | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2608 | |
ASCII | 612 | 19.0% |
None | 2 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
346 | ||
) | 90 | 14.7% |
( | 89 | 14.5% |
1 | 14 | 2.3% |
3 | 10 | 1.6% |
2 | 6 | 1.0% |
4 | 6 | 1.0% |
K | 5 | 0.8% |
5 | 5 | 0.8% |
S | 4 | 0.7% |
Other values (20) | 37 | 6.0% |
Hangul
Value | Count | Frequency (%) |
장 | 88 | 3.4% |
앞 | 86 | 3.3% |
동 | 73 | 2.8% |
주 | 51 | 2.0% |
구 | 49 | 1.9% |
아 | 47 | 1.8% |
리 | 44 | 1.7% |
교 | 42 | 1.6% |
스 | 42 | 1.6% |
파 | 41 | 1.6% |
Other values (265) | 2045 |
None
Value | Count | Frequency (%) |
· | 2 |
설치개수
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
1 | |
---|---|
2 | |
3 | 5 |
<NA> | 5 |
4 | 1 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.0515464 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 239 | |
2 | 41 | 14.1% |
3 | 5 | 1.7% |
<NA> | 5 | 1.7% |
4 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 239 | |
2 | 41 | 14.1% |
3 | 5 | 1.7% |
na | 5 | 1.7% |
4 | 1 | 0.3% |
데이터기준일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.4 KiB |
2023-07-29 | |
---|---|
<NA> | 5 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.8969072 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-07-29 |
---|---|
2nd row | 2023-07-29 |
3rd row | 2023-07-29 |
4th row | 2023-07-29 |
5th row | 2023-07-29 |
Common Values
Value | Count | Frequency (%) |
2023-07-29 | 286 | |
<NA> | 5 | 1.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-07-29 | 286 | |
na | 5 | 1.7% |
연번 | 자치구명 | 설치개수 | |
---|---|---|---|
연번 | 1.000 | 0.983 | 0.339 |
자치구명 | 0.983 | 1.000 | 0.282 |
설치개수 | 0.339 | 0.282 | 1.000 |
데이터기준일자 | 설치개수 | 자치구명 | |
---|---|---|---|
데이터기준일자 | 1.000 | 1.000 | 1.000 |
설치개수 | 1.000 | 1.000 | 0.233 |
자치구명 | 1.000 | 0.233 | 1.000 |
연번 | 자치구명 | 설치개수 | 데이터기준일자 | |
---|---|---|---|---|
연번 | 1.000 | 0.970 | 0.221 | 1.000 |
자치구명 | 0.970 | 1.000 | 0.233 | 1.000 |
설치개수 | 0.221 | 0.233 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 | 1.000 |
연번 | 자치구명 | 설치장소 | 설치개수 | 데이터기준일자 | |
---|---|---|---|---|---|
0 | 1 | 광주광역시 동구 | 금남공원(지하도 입구) | 1 | 2023-07-29 |
1 | 2 | 광주광역시 동구 | 삼성생명 앞 | 1 | 2023-07-29 |
2 | 3 | 광주광역시 동구 | YMCA 앞 | 1 | 2023-07-29 |
3 | 4 | 광주광역시 동구 | 농협중앙회 앞 | 1 | 2023-07-29 |
4 | 5 | 광주광역시 동구 | 금남로4가역 남선빌딩 앞 하나증권 | 1 | 2023-07-29 |
5 | 6 | 광주광역시 동구 | 광주축협 횡단보도 양쪽(NC웨이브)1 | 1 | 2023-07-29 |
6 | 7 | 광주광역시 동구 | 광주축협 횡단보도 양쪽(NC웨이브)2 | 1 | 2023-07-29 |
7 | 8 | 광주광역시 동구 | 대신증권 앞 | 1 | 2023-07-29 |
8 | 9 | 광주광역시 동구 | 대인광장쪽 신정B/D | 1 | 2023-07-29 |
9 | 10 | 광주광역시 동구 | 전남여고 | 1 | 2023-07-29 |
연번 | 자치구명 | 설치장소 | 설치개수 | 데이터기준일자 | |
---|---|---|---|---|---|
281 | 436 | 광주광역시 광산구 | 하남중 앞 | 1 | 2023-07-29 |
282 | 437 | 광주광역시 광산구 | 호가정정류장(동곡로) | 2 | 2023-07-29 |
283 | 438 | 광주광역시 광산구 | 휴먼시아3단지 앞 삼거리 | 1 | 2023-07-29 |
284 | 439 | 광주광역시 광산구 | 흑석사거리 월곡동방향 | 1 | 2023-07-29 |
285 | 440 | 광주광역시 광산구 | 흑석사거리 홈플러스방향 | 1 | 2023-07-29 |
286 | <NA> | <NA> | <NA> | <NA> | <NA> |
287 | <NA> | <NA> | <NA> | <NA> | <NA> |
288 | <NA> | <NA> | <NA> | <NA> | <NA> |
289 | <NA> | <NA> | <NA> | <NA> | <NA> |
290 | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
연번 | 자치구명 | 설치장소 | 설치개수 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | 5 |