Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 54 |
Missing cells | 4 |
Missing cells (%) | 1.1% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.9% |
Total size in memory | 3.1 KiB |
Average record size in memory | 59.4 B |
Variable types
Categorical | 4 |
---|---|
Text | 2 |
Numeric | 1 |
Dataset
Description | 자치구,구분,위치_역명,주소_역본선구분,일평균발생량(톤/일),시설구분,현재이용가능 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15609/S/1/datasetView.do |
Dataset has 1 (1.9%) duplicate rows | Duplicates |
현재이용가능 is highly overall correlated with 일평균발생량(톤/일) and 3 other fields | High correlation |
구분 is highly overall correlated with 시설구분 and 1 other fields | High correlation |
시설구분 is highly overall correlated with 구분 and 1 other fields | High correlation |
자치구 is highly overall correlated with 현재이용가능 | High correlation |
일평균발생량(톤/일) is highly overall correlated with 현재이용가능 | High correlation |
시설구분 is highly imbalanced (53.4%) | Imbalance |
주소_역본선구분 has 1 (1.9%) missing values | Missing |
일평균발생량(톤/일) has 3 (5.6%) missing values | Missing |
일평균발생량(톤/일) has 4 (7.4%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-13 13:52:16.146264 |
---|---|
Analysis finished | 2024-03-13 13:52:17.284518 |
Duration | 1.14 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
자치구
Categorical
HIGH CORRELATION
 
Distinct | 20 |
---|---|
Distinct (%) | 37.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
용산구 | |
---|---|
구로구 | |
동작구 | |
영등포구 | |
종로구 | |
Other values (15) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0555556 |
Min length | 2 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 9.3% |
Sample
1st row | 관악구 |
---|---|
2nd row | 강남구 |
3rd row | 강남구 |
4th row | 송파구 |
5th row | 송파구 |
Common Values
Value | Count | Frequency (%) |
용산구 | 5 | 9.3% |
구로구 | 4 | 7.4% |
동작구 | 4 | 7.4% |
영등포구 | 4 | 7.4% |
종로구 | 4 | 7.4% |
송파구 | 4 | 7.4% |
성북구 | 4 | 7.4% |
금천구 | 3 | 5.6% |
관악구 | 3 | 5.6% |
마포구 | 3 | 5.6% |
Other values (10) | 16 |
Length
Value | Count | Frequency (%) |
용산구 | 5 | 9.3% |
동작구 | 4 | 7.4% |
영등포구 | 4 | 7.4% |
종로구 | 4 | 7.4% |
송파구 | 4 | 7.4% |
성북구 | 4 | 7.4% |
구로구 | 4 | 7.4% |
마포구 | 3 | 5.6% |
중구 | 3 | 5.6% |
관악구 | 3 | 5.6% |
Other values (10) | 16 |
구분
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 22.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
7호선 | |
---|---|
5호선 | |
6호선 | |
전력구 | |
3호선 | |
Other values (7) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.1111111 |
Min length | 3 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 5.6% |
Sample
1st row | 전력구 |
---|---|
2nd row | 3호선 |
3rd row | 3호선 |
4th row | 5호선 |
5th row | 5호선 |
Common Values
Value | Count | Frequency (%) |
7호선 | 13 | |
5호선 | 9 | |
6호선 | 9 | |
전력구 | 6 | |
3호선 | 4 | 7.4% |
공항철도 | 3 | 5.6% |
건축물 | 3 | 5.6% |
4호선 | 2 | 3.7% |
2호선 | 2 | 3.7% |
8호선 | 1 | 1.9% |
Other values (2) | 2 | 3.7% |
Length
Value | Count | Frequency (%) |
7호선 | 13 | |
5호선 | 9 | |
6호선 | 9 | |
전력구 | 6 | |
3호선 | 4 | 7.4% |
공항철도 | 3 | 5.6% |
건축물 | 3 | 5.6% |
4호선 | 2 | 3.7% |
2호선 | 2 | 3.7% |
8호선 | 1 | 1.9% |
Other values (2) | 2 | 3.7% |
위치_역명
Text
Distinct | 51 |
---|---|
Distinct (%) | 94.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
Value | Count | Frequency (%) |
대림 | 2 | 3.3% |
pit | 2 | 3.3% |
서울역 | 2 | 3.3% |
상도 | 2 | 3.3% |
신대방삼거리 | 1 | 1.7% |
영오전력구 | 1 | 1.7% |
재활용집하장 | 1 | 1.7% |
연신내 | 1 | 1.7% |
역촌 | 1 | 1.7% |
동아일보(김병관 | 1 | 1.7% |
Other values (46) | 46 |
Most occurring characters
Value | Count | Frequency (%) |
) | 14 | 4.4% |
( | 13 | 4.1% |
K | 9 | 2.9% |
대 | 8 | 2.5% |
선 | 8 | 2.5% |
본 | 8 | 2.5% |
0 | 8 | 2.5% |
동 | 7 | 2.2% |
역 | 7 | 2.2% |
신 | 7 | 2.2% |
Other values (112) | 226 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 220 | |
Decimal Number | 44 | 14.0% |
Uppercase Letter | 16 | 5.1% |
Close Punctuation | 14 | 4.4% |
Open Punctuation | 13 | 4.1% |
Space Separator | 6 | 1.9% |
Other Punctuation | 1 | 0.3% |
Dash Punctuation | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 8 | 3.6% |
선 | 8 | 3.6% |
본 | 8 | 3.6% |
동 | 7 | 3.2% |
역 | 7 | 3.2% |
신 | 7 | 3.2% |
구 | 7 | 3.2% |
장 | 5 | 2.3% |
문 | 5 | 2.3% |
전 | 5 | 2.3% |
Other values (94) | 153 |
Decimal Number
Value | Count | Frequency (%) |
0 | 8 | |
2 | 6 | |
6 | 5 | |
1 | 5 | |
7 | 4 | |
4 | 4 | |
8 | 4 | |
5 | 4 | |
3 | 4 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 9 | |
T | 3 | 18.8% |
I | 2 | 12.5% |
P | 2 | 12.5% |
Close Punctuation
Value | Count | Frequency (%) |
) | 14 |
Open Punctuation
Value | Count | Frequency (%) |
( | 13 |
Space Separator
Value | Count | Frequency (%) |
6 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 220 | |
Common | 79 | 25.1% |
Latin | 16 | 5.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 8 | 3.6% |
선 | 8 | 3.6% |
본 | 8 | 3.6% |
동 | 7 | 3.2% |
역 | 7 | 3.2% |
신 | 7 | 3.2% |
구 | 7 | 3.2% |
장 | 5 | 2.3% |
문 | 5 | 2.3% |
전 | 5 | 2.3% |
Other values (94) | 153 |
Common
Value | Count | Frequency (%) |
) | 14 | |
( | 13 | |
0 | 8 | |
6 | ||
2 | 6 | |
6 | 5 | 6.3% |
1 | 5 | 6.3% |
7 | 4 | 5.1% |
4 | 4 | 5.1% |
8 | 4 | 5.1% |
Other values (4) | 10 |
Latin
Value | Count | Frequency (%) |
K | 9 | |
T | 3 | 18.8% |
I | 2 | 12.5% |
P | 2 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 220 | |
ASCII | 95 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
) | 14 | |
( | 13 | |
K | 9 | |
0 | 8 | 8.4% |
6 | 6.3% | |
2 | 6 | 6.3% |
6 | 5 | 5.3% |
1 | 5 | 5.3% |
7 | 4 | 4.2% |
4 | 4 | 4.2% |
Other values (8) | 21 |
Hangul
Value | Count | Frequency (%) |
대 | 8 | 3.6% |
선 | 8 | 3.6% |
본 | 8 | 3.6% |
동 | 7 | 3.2% |
역 | 7 | 3.2% |
신 | 7 | 3.2% |
구 | 7 | 3.2% |
장 | 5 | 2.3% |
문 | 5 | 2.3% |
전 | 5 | 2.3% |
Other values (94) | 153 |
주소_역본선구분
Text
MISSING
 
Distinct | 29 |
---|---|
Distinct (%) | 54.7% |
Missing | 1 |
Missing (%) | 1.9% |
Memory size | 564.0 B |
Length
Max length | 49 |
---|---|
Median length | 32 |
Mean length | 11.018868 |
Min length | 2 |
Characters and Unicode
Total characters | 584 |
---|---|
Distinct characters | 102 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 26 ? |
---|---|
Unique (%) | 49.1% |
Sample
1st row | 신길환기구#2(관악구 신림동1467-7) |
---|---|
2nd row | 역사(도곡동 464-1(도곡동)) |
3rd row | 역사 |
4th row | 본선 |
5th row | 역사 |
Value | Count | Frequency (%) |
역사 | 19 | 17.8% |
본선 | 7 | 6.5% |
지하 | 3 | 2.8% |
사이 | 2 | 1.9% |
서대문구 | 2 | 1.9% |
역사(상도로49길 | 2 | 1.9% |
20(상도동 | 2 | 1.9% |
56-39 | 1 | 0.9% |
마곡지구8단지앞 | 1 | 0.9% |
252-6 | 1 | 0.9% |
Other values (67) | 67 |
Most occurring characters
Value | Count | Frequency (%) |
55 | 9.4% | |
( | 36 | 6.2% |
) | 36 | 6.2% |
사 | 33 | 5.7% |
역 | 33 | 5.7% |
동 | 27 | 4.6% |
1 | 21 | 3.6% |
2 | 19 | 3.3% |
로 | 18 | 3.1% |
구 | 16 | 2.7% |
Other values (92) | 290 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 326 | |
Decimal Number | 113 | 19.3% |
Space Separator | 55 | 9.4% |
Open Punctuation | 36 | 6.2% |
Close Punctuation | 36 | 6.2% |
Dash Punctuation | 11 | 1.9% |
Other Punctuation | 5 | 0.9% |
Uppercase Letter | 2 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 33 | 10.1% |
역 | 33 | 10.1% |
동 | 27 | 8.3% |
로 | 18 | 5.5% |
구 | 16 | 4.9% |
선 | 12 | 3.7% |
본 | 11 | 3.4% |
지 | 9 | 2.8% |
길 | 8 | 2.5% |
도 | 8 | 2.5% |
Other values (74) | 151 |
Decimal Number
Value | Count | Frequency (%) |
1 | 21 | |
2 | 19 | |
5 | 15 | |
4 | 12 | |
9 | 10 | |
6 | 10 | |
7 | 10 | |
3 | 6 | 5.3% |
8 | 6 | 5.3% |
0 | 4 | 3.5% |
Other Punctuation
Value | Count | Frequency (%) |
# | 3 | |
/ | 1 | 20.0% |
, | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
55 |
Open Punctuation
Value | Count | Frequency (%) |
( | 36 |
Close Punctuation
Value | Count | Frequency (%) |
) | 36 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 11 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 326 | |
Common | 256 | |
Latin | 2 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 33 | 10.1% |
역 | 33 | 10.1% |
동 | 27 | 8.3% |
로 | 18 | 5.5% |
구 | 16 | 4.9% |
선 | 12 | 3.7% |
본 | 11 | 3.4% |
지 | 9 | 2.8% |
길 | 8 | 2.5% |
도 | 8 | 2.5% |
Other values (74) | 151 |
Common
Value | Count | Frequency (%) |
55 | ||
( | 36 | |
) | 36 | |
1 | 21 | 8.2% |
2 | 19 | 7.4% |
5 | 15 | 5.9% |
4 | 12 | 4.7% |
- | 11 | 4.3% |
9 | 10 | 3.9% |
6 | 10 | 3.9% |
Other values (7) | 31 |
Latin
Value | Count | Frequency (%) |
S | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 326 | |
ASCII | 258 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
55 | ||
( | 36 | |
) | 36 | |
1 | 21 | 8.1% |
2 | 19 | 7.4% |
5 | 15 | 5.8% |
4 | 12 | 4.7% |
- | 11 | 4.3% |
9 | 10 | 3.9% |
6 | 10 | 3.9% |
Other values (8) | 33 |
Hangul
Value | Count | Frequency (%) |
사 | 33 | 10.1% |
역 | 33 | 10.1% |
동 | 27 | 8.3% |
로 | 18 | 5.5% |
구 | 16 | 4.9% |
선 | 12 | 3.7% |
본 | 11 | 3.4% |
지 | 9 | 2.8% |
길 | 8 | 2.5% |
도 | 8 | 2.5% |
Other values (74) | 151 |
일평균발생량(톤/일)
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 46 |
---|---|
Distinct (%) | 90.2% |
Missing | 3 |
Missing (%) | 5.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 534.49784 |
Minimum | 0 |
---|---|
Maximum | 5786.14 |
Zeros | 4 |
Zeros (%) | 7.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 618.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 108.5 |
median | 239.5 |
Q3 | 596.55 |
95-th percentile | 1620.3 |
Maximum | 5786.14 |
Range | 5786.14 |
Interquartile range (IQR) | 488.05 |
Descriptive statistics
Standard deviation | 893.27534 |
---|---|
Coefficient of variation (CV) | 1.6712422 |
Kurtosis | 24.131341 |
Mean | 534.49784 |
Median Absolute Deviation (MAD) | 210.37 |
Skewness | 4.3912261 |
Sum | 27259.39 |
Variance | 797940.84 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 4 | 7.4% |
239.5 | 2 | 3.7% |
468.0 | 2 | 3.7% |
160.3 | 1 | 1.9% |
269.37 | 1 | 1.9% |
112.0 | 1 | 1.9% |
380.73 | 1 | 1.9% |
41.3 | 1 | 1.9% |
685.1 | 1 | 1.9% |
460.7 | 1 | 1.9% |
Other values (36) | 36 | |
(Missing) | 3 | 5.6% |
Value | Count | Frequency (%) |
0.0 | 4 | |
0.3 | 1 | 1.9% |
1.43 | 1 | 1.9% |
20.0 | 1 | 1.9% |
31.93 | 1 | 1.9% |
41.3 | 1 | 1.9% |
43.2 | 1 | 1.9% |
104.0 | 1 | 1.9% |
104.9 | 1 | 1.9% |
108.0 | 1 | 1.9% |
Value | Count | Frequency (%) |
5786.14 | 1 | |
2029.77 | 1 | |
1623.6 | 1 | |
1617.0 | 1 | |
1608.4 | 1 | |
1340.0 | 1 | |
959.47 | 1 | |
946.0 | 1 | |
874.67 | 1 | |
813.71 | 1 |
시설구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 7.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
지하철 | |
---|---|
전력구 | |
기타 | 3 |
통신구 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.9444444 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 전력구 |
---|---|
2nd row | 지하철 |
3rd row | 지하철 |
4th row | 지하철 |
5th row | 지하철 |
Common Values
Value | Count | Frequency (%) |
지하철 | 44 | |
전력구 | 6 | 11.1% |
기타 | 3 | 5.6% |
통신구 | 1 | 1.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지하철 | 44 | |
전력구 | 6 | 11.1% |
기타 | 3 | 5.6% |
통신구 | 1 | 1.9% |
현재이용가능
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 3.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 564.0 B |
이용가능 | |
---|---|
<NA> |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | 이용가능 |
3rd row | 이용가능 |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
이용가능 | 29 | |
<NA> | 25 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
이용가능 | 29 | |
na | 25 |
자치구 | 구분 | 위치_역명 | 주소_역본선구분 | 일평균발생량(톤/일) | 시설구분 | |
---|---|---|---|---|---|---|
자치구 | 1.000 | 0.694 | 0.995 | 0.550 | 0.118 | 0.744 |
구분 | 0.694 | 1.000 | 0.953 | 0.544 | 0.648 | 1.000 |
위치_역명 | 0.995 | 0.953 | 1.000 | 1.000 | 1.000 | 1.000 |
주소_역본선구분 | 0.550 | 0.544 | 1.000 | 1.000 | 0.000 | 1.000 |
일평균발생량(톤/일) | 0.118 | 0.648 | 1.000 | 0.000 | 1.000 | 0.000 |
시설구분 | 0.744 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 |
현재이용가능 | 구분 | 시설구분 | 자치구 | |
---|---|---|---|---|
현재이용가능 | 1.000 | 1.000 | 1.000 | 1.000 |
구분 | 1.000 | 1.000 | 0.917 | 0.272 |
시설구분 | 1.000 | 0.917 | 1.000 | 0.359 |
자치구 | 1.000 | 0.272 | 0.359 | 1.000 |
일평균발생량(톤/일) | 자치구 | 구분 | 시설구분 | 현재이용가능 | |
---|---|---|---|---|---|
일평균발생량(톤/일) | 1.000 | 0.000 | 0.391 | 0.000 | 1.000 |
자치구 | 0.000 | 1.000 | 0.272 | 0.359 | 1.000 |
구분 | 0.391 | 0.272 | 1.000 | 0.917 | 1.000 |
시설구분 | 0.000 | 0.359 | 0.917 | 1.000 | 1.000 |
현재이용가능 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
자치구 | 구분 | 위치_역명 | 주소_역본선구분 | 일평균발생량(톤/일) | 시설구분 | 현재이용가능 | |
---|---|---|---|---|---|---|---|
0 | 관악구 | 전력구 | 신길전력구(신림정화단 앞, 당곡사거리)) | 신길환기구#2(관악구 신림동1467-7) | 345.0 | 전력구 | <NA> |
1 | 강남구 | 3호선 | 매봉 | 역사(도곡동 464-1(도곡동)) | 233.0 | 지하철 | 이용가능 |
2 | 강남구 | 3호선 | 가락시장 | 역사 | 417.3 | 지하철 | 이용가능 |
3 | 송파구 | 5호선 | 오금본선(3K600) | 본선 | 348.57 | 지하철 | <NA> |
4 | 송파구 | 5호선 | 방이 | 역사 | 0.0 | 지하철 | <NA> |
5 | 송파구 | 8호선 | 몽촌토성본선(4K074) | 본선 | 449.87 | 지하철 | <NA> |
6 | 송파구 | 9호선2단계 | 종합운동장역 | 역사 | 5786.14 | 지하철 | 이용가능 |
7 | 강동구 | 5호선 | 굽은다리 | 역사( 강동구 양재대로 1572 (명일동)) | 165.17 | 지하철 | 이용가능 |
8 | 종로구 | 3호선 | 독립문 | 역사(통일로 지하 247(현저동)) | 109.0 | 지하철 | <NA> |
9 | 종로구 | 4호선 | 동대문 | 역사 | 104.9 | 지하철 | <NA> |
자치구 | 구분 | 위치_역명 | 주소_역본선구분 | 일평균발생량(톤/일) | 시설구분 | 현재이용가능 | |
---|---|---|---|---|---|---|---|
44 | 금천구 | 전력구 | 시독전력구 | 시흥S/S내 집수정 | 108.0 | 전력구 | <NA> |
45 | 금천구 | 전력구 | 시흥변전소 | 금천구 시흥동 562-2(561-1) | 43.2 | 전력구 | 이용가능 |
46 | 영등포구 | 5호선 | 영등포시장 | 역사 | 1617.0 | 지하철 | 이용가능 |
47 | 영등포구 | 5호선 | 여의도본선(18K827) | 본선 | 1340.0 | 지하철 | 이용가능 |
48 | 영등포구 | 7호선 | 대림 | 역사 | 468.0 | 지하철 | 이용가능 |
49 | 영등포구 | 전력구 | 영오전력구 | 영오환기구#1 (영등포구 영중로119) | 124.0 | 전력구 | 이용가능 |
50 | 동작구 | 7호선 | 상도 | 역사(상도로49길 20(상도동)) | 239.5 | 지하철 | <NA> |
51 | 동작구 | 7호선 | 신대방삼거리 | 역사(상도로 지하 76(대방동)) | 689.9 | 지하철 | 이용가능 |
52 | 관악구 | 2호선 | 사당 | 역사(외선) | 0.3 | 지하철 | <NA> |
53 | 관악구 | 전력구 | 신림전력구(인헌초교앞) | 신림환기구#5(관악구 낙성대로15길 56-39) (관악구 남부순환로1942(낙성대동)) | 104.0 | 전력구 | <NA> |
Most frequently occurring
자치구 | 구분 | 위치_역명 | 주소_역본선구분 | 일평균발생량(톤/일) | 시설구분 | 현재이용가능 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 동작구 | 7호선 | 상도 | 역사(상도로49길 20(상도동)) | 239.5 | 지하철 | <NA> | 2 |