Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 33 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.8 KiB |
Average record size in memory | 55.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 2 |
Categorical | 1 |
Dataset
Description | 의정부시 빗물이용시설현황(연번, 건물명, 설치위치, 용량(세제곱미터), 용도, 설치년도)입니다. 조경용수, 청소용수, 화실세정수로 사용되고 있습니다. |
---|---|
URL | https://www.data.go.kr/data/15114047/fileData.do |
연번 is highly overall correlated with 설치년도 | High correlation |
설치년도 is highly overall correlated with 연번 and 1 other fields | High correlation |
용도 is highly overall correlated with 설치년도 | High correlation |
용도 is highly imbalanced (58.9%) | Imbalance |
연번 has unique values | Unique |
건물명 has unique values | Unique |
설치위치 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 12:08:32.616127 |
---|---|
Analysis finished | 2023-12-12 12:08:34.061417 |
Duration | 1.45 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 33 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 17 |
Minimum | 1 |
---|---|
Maximum | 33 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 429.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2.6 |
Q1 | 9 |
median | 17 |
Q3 | 25 |
95-th percentile | 31.4 |
Maximum | 33 |
Range | 32 |
Interquartile range (IQR) | 16 |
Descriptive statistics
Standard deviation | 9.6695398 |
---|---|
Coefficient of variation (CV) | 0.56879646 |
Kurtosis | -1.2 |
Mean | 17 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0 |
Sum | 561 |
Variance | 93.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 3.0% |
26 | 1 | 3.0% |
20 | 1 | 3.0% |
21 | 1 | 3.0% |
22 | 1 | 3.0% |
23 | 1 | 3.0% |
24 | 1 | 3.0% |
25 | 1 | 3.0% |
27 | 1 | 3.0% |
2 | 1 | 3.0% |
Other values (23) | 23 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
33 | 1 | |
32 | 1 | |
31 | 1 | |
30 | 1 | |
29 | 1 | |
28 | 1 | |
27 | 1 | |
26 | 1 | |
25 | 1 | |
24 | 1 |
건물명
Text
UNIQUE
 
Distinct | 33 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 396.0 B |
Value | Count | Frequency (%) |
베르디움 | 3 | 4.2% |
호반 | 3 | 4.2% |
증축 | 2 | 2.8% |
별관 | 2 | 2.8% |
1단지 | 2 | 2.8% |
직동-롯데캐슬골드파크 | 2 | 2.8% |
북부청사 | 2 | 2.8% |
효자중학교 | 1 | 1.4% |
부속병원 | 1 | 1.4% |
대방노블랜드 | 1 | 1.4% |
Other values (53) | 53 |
Most occurring characters
Value | Count | Frequency (%) |
43 | 11.2% | |
부 | 12 | 3.1% |
지 | 10 | 2.6% |
스 | 8 | 2.1% |
- | 7 | 1.8% |
의 | 7 | 1.8% |
정 | 7 | 1.8% |
청 | 6 | 1.6% |
학 | 6 | 1.6% |
교 | 6 | 1.6% |
Other values (137) | 273 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 311 | |
Space Separator | 43 | 11.2% |
Decimal Number | 12 | 3.1% |
Dash Punctuation | 7 | 1.8% |
Uppercase Letter | 4 | 1.0% |
Open Punctuation | 3 | 0.8% |
Close Punctuation | 3 | 0.8% |
Lowercase Letter | 2 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
부 | 12 | 3.9% |
지 | 10 | 3.2% |
스 | 8 | 2.6% |
의 | 7 | 2.3% |
정 | 7 | 2.3% |
청 | 6 | 1.9% |
학 | 6 | 1.9% |
교 | 6 | 1.9% |
동 | 6 | 1.9% |
공 | 6 | 1.9% |
Other values (126) | 237 |
Decimal Number
Value | Count | Frequency (%) |
1 | 5 | |
3 | 3 | |
2 | 3 | |
8 | 1 | 8.3% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 2 | |
L | 2 |
Space Separator
Value | Count | Frequency (%) |
43 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 7 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 311 | |
Common | 68 | 17.7% |
Latin | 6 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
부 | 12 | 3.9% |
지 | 10 | 3.2% |
스 | 8 | 2.6% |
의 | 7 | 2.3% |
정 | 7 | 2.3% |
청 | 6 | 1.9% |
학 | 6 | 1.9% |
교 | 6 | 1.9% |
동 | 6 | 1.9% |
공 | 6 | 1.9% |
Other values (126) | 237 |
Common
Value | Count | Frequency (%) |
43 | ||
- | 7 | 10.3% |
1 | 5 | 7.4% |
3 | 3 | 4.4% |
2 | 3 | 4.4% |
( | 3 | 4.4% |
) | 3 | 4.4% |
8 | 1 | 1.5% |
Latin
Value | Count | Frequency (%) |
B | 2 | |
L | 2 | |
e | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 311 | |
ASCII | 74 | 19.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
43 | ||
- | 7 | 9.5% |
1 | 5 | 6.8% |
3 | 3 | 4.1% |
2 | 3 | 4.1% |
( | 3 | 4.1% |
) | 3 | 4.1% |
B | 2 | 2.7% |
L | 2 | 2.7% |
e | 2 | 2.7% |
Hangul
Value | Count | Frequency (%) |
부 | 12 | 3.9% |
지 | 10 | 3.2% |
스 | 8 | 2.6% |
의 | 7 | 2.3% |
정 | 7 | 2.3% |
청 | 6 | 1.9% |
학 | 6 | 1.9% |
교 | 6 | 1.9% |
동 | 6 | 1.9% |
공 | 6 | 1.9% |
Other values (126) | 237 |
설치위치
Text
UNIQUE
 
Distinct | 33 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 396.0 B |
Length
Max length | 17 |
---|---|
Median length | 11 |
Mean length | 8.3333333 |
Min length | 5 |
Characters and Unicode
Total characters | 275 |
---|---|
Distinct characters | 58 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 33 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 부용로185번길15 |
---|---|
2nd row | 장곡로226번길 132 |
3rd row | 동일로454번길 150 |
4th row | 가능로 57 |
5th row | 시민로62 |
Value | Count | Frequency (%) |
외 | 2 | 3.3% |
시민로 | 2 | 3.3% |
1 | 2 | 3.3% |
민락로 | 2 | 3.3% |
용현동 | 2 | 3.3% |
고산 | 2 | 3.3% |
부용로185번길15 | 1 | 1.6% |
금오동 | 1 | 1.6% |
산25-36 | 1 | 1.6% |
19필지 | 1 | 1.6% |
Other values (45) | 45 |
Most occurring characters
Value | Count | Frequency (%) |
30 | 10.9% | |
로 | 23 | 8.4% |
1 | 18 | 6.5% |
3 | 14 | 5.1% |
5 | 14 | 5.1% |
2 | 13 | 4.7% |
번 | 11 | 4.0% |
민 | 10 | 3.6% |
4 | 9 | 3.3% |
6 | 8 | 2.9% |
Other values (48) | 125 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 137 | |
Decimal Number | 102 | |
Space Separator | 30 | 10.9% |
Dash Punctuation | 4 | 1.5% |
Uppercase Letter | 2 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 23 | |
번 | 11 | 8.0% |
민 | 10 | 7.3% |
동 | 8 | 5.8% |
길 | 7 | 5.1% |
용 | 6 | 4.4% |
지 | 5 | 3.6% |
산 | 4 | 2.9% |
락 | 4 | 2.9% |
송 | 3 | 2.2% |
Other values (34) | 56 |
Decimal Number
Value | Count | Frequency (%) |
1 | 18 | |
3 | 14 | |
5 | 14 | |
2 | 13 | |
4 | 9 | |
6 | 8 | |
0 | 8 | |
9 | 8 | |
8 | 6 | 5.9% |
7 | 4 | 3.9% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 1 | |
C | 1 |
Space Separator
Value | Count | Frequency (%) |
30 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 137 | |
Common | 136 | |
Latin | 2 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 23 | |
번 | 11 | 8.0% |
민 | 10 | 7.3% |
동 | 8 | 5.8% |
길 | 7 | 5.1% |
용 | 6 | 4.4% |
지 | 5 | 3.6% |
산 | 4 | 2.9% |
락 | 4 | 2.9% |
송 | 3 | 2.2% |
Other values (34) | 56 |
Common
Value | Count | Frequency (%) |
30 | ||
1 | 18 | |
3 | 14 | |
5 | 14 | |
2 | 13 | |
4 | 9 | 6.6% |
6 | 8 | 5.9% |
0 | 8 | 5.9% |
9 | 8 | 5.9% |
8 | 6 | 4.4% |
Other values (2) | 8 | 5.9% |
Latin
Value | Count | Frequency (%) |
S | 1 | |
C | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 138 | |
Hangul | 137 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
30 | ||
1 | 18 | |
3 | 14 | |
5 | 14 | |
2 | 13 | |
4 | 9 | 6.5% |
6 | 8 | 5.8% |
0 | 8 | 5.8% |
9 | 8 | 5.8% |
8 | 6 | 4.3% |
Other values (4) | 10 | 7.2% |
Hangul
Value | Count | Frequency (%) |
로 | 23 | |
번 | 11 | 8.0% |
민 | 10 | 7.3% |
동 | 8 | 5.8% |
길 | 7 | 5.1% |
용 | 6 | 4.4% |
지 | 5 | 3.6% |
산 | 4 | 2.9% |
락 | 4 | 2.9% |
송 | 3 | 2.2% |
Other values (34) | 56 |
용량(세제곱미터)
Real number (ℝ)
Distinct | 31 |
---|---|
Distinct (%) | 93.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 300.85515 |
Minimum | 11 |
---|---|
Maximum | 1203 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 429.0 B |
Quantile statistics
Minimum | 11 |
---|---|
5-th percentile | 16.8 |
Q1 | 88 |
median | 230 |
Q3 | 453.64 |
95-th percentile | 778.58 |
Maximum | 1203 |
Range | 1192 |
Interquartile range (IQR) | 365.64 |
Descriptive statistics
Standard deviation | 272.81924 |
---|---|
Coefficient of variation (CV) | 0.90681258 |
Kurtosis | 2.3616806 |
Mean | 300.85515 |
Median Absolute Deviation (MAD) | 161 |
Skewness | 1.3821514 |
Sum | 9928.22 |
Variance | 74430.336 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20.0 | 2 | 6.1% |
300.0 | 2 | 6.1% |
12.0 | 1 | 3.0% |
1203.0 | 1 | 3.0% |
88.0 | 1 | 3.0% |
784.4 | 1 | 3.0% |
65.0 | 1 | 3.0% |
538.0 | 1 | 3.0% |
69.0 | 1 | 3.0% |
220.0 | 1 | 3.0% |
Other values (21) | 21 |
Value | Count | Frequency (%) |
11.0 | 1 | |
12.0 | 1 | |
20.0 | 2 | |
27.0 | 1 | |
65.0 | 1 | |
69.0 | 1 | |
75.0 | 1 | |
88.0 | 1 | |
100.0 | 1 | |
103.8 | 1 |
Value | Count | Frequency (%) |
1203.0 | 1 | |
784.4 | 1 | |
774.7 | 1 | |
570.0 | 1 | |
542.0 | 1 | |
538.0 | 1 | |
528.53 | 1 | |
517.45 | 1 | |
453.64 | 1 | |
445.2 | 1 |
용도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 12.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 396.0 B |
조경용수 | |
---|---|
조경용수+청소용수 | |
화장실세정수 | 1 |
화장실세정수+조경용수 | 1 |
Length
Max length | 11 |
---|---|
Median length | 4 |
Mean length | 4.7272727 |
Min length | 4 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 6.1% |
Sample
1st row | 조경용수 |
---|---|
2nd row | 조경용수 |
3rd row | 조경용수 |
4th row | 조경용수 |
5th row | 화장실세정수 |
Common Values
Value | Count | Frequency (%) |
조경용수 | 28 | |
조경용수+청소용수 | 3 | 9.1% |
화장실세정수 | 1 | 3.0% |
화장실세정수+조경용수 | 1 | 3.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
조경용수 | 28 | |
조경용수+청소용수 | 3 | 9.1% |
화장실세정수 | 1 | 3.0% |
화장실세정수+조경용수 | 1 | 3.0% |
설치년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 42.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.9091 |
Minimum | 2003 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 429.0 B |
Quantile statistics
Minimum | 2003 |
---|---|
5-th percentile | 2008.6 |
Q1 | 2016 |
median | 2018 |
Q3 | 2020 |
95-th percentile | 2021 |
Maximum | 2022 |
Range | 19 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 4.3615052 |
---|---|
Coefficient of variation (CV) | 0.0021624699 |
Kurtosis | 2.2360392 |
Mean | 2016.9091 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -1.5440521 |
Sum | 66558 |
Variance | 19.022727 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2020 | 8 | |
2018 | 6 | |
2017 | 4 | |
2021 | 3 | 9.1% |
2014 | 2 | 6.1% |
2019 | 2 | 6.1% |
2003 | 1 | 3.0% |
2008 | 1 | 3.0% |
2009 | 1 | 3.0% |
2010 | 1 | 3.0% |
Other values (4) | 4 |
Value | Count | Frequency (%) |
2003 | 1 | 3.0% |
2008 | 1 | 3.0% |
2009 | 1 | 3.0% |
2010 | 1 | 3.0% |
2012 | 1 | 3.0% |
2013 | 1 | 3.0% |
2014 | 2 | 6.1% |
2016 | 1 | 3.0% |
2017 | 4 | |
2018 | 6 |
Value | Count | Frequency (%) |
2022 | 1 | 3.0% |
2021 | 3 | 9.1% |
2020 | 8 | |
2019 | 2 | 6.1% |
2018 | 6 | |
2017 | 4 | |
2016 | 1 | 3.0% |
2014 | 2 | 6.1% |
2013 | 1 | 3.0% |
2012 | 1 | 3.0% |
연번 | 건물명 | 설치위치 | 용량(세제곱미터) | 용도 | 설치년도 | |
---|---|---|---|---|---|---|
연번 | 1.000 | 1.000 | 1.000 | 0.359 | 0.584 | 0.838 |
건물명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
설치위치 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
용량(세제곱미터) | 0.359 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 |
용도 | 0.584 | 1.000 | 1.000 | 0.000 | 1.000 | 0.906 |
설치년도 | 0.838 | 1.000 | 1.000 | 0.000 | 0.906 | 1.000 |
연번 | 용량(세제곱미터) | 설치년도 | 용도 | |
---|---|---|---|---|
연번 | 1.000 | 0.485 | 0.980 | 0.336 |
용량(세제곱미터) | 0.485 | 1.000 | 0.499 | 0.000 |
설치년도 | 0.980 | 0.499 | 1.000 | 0.537 |
용도 | 0.336 | 0.000 | 0.537 | 1.000 |
연번 | 건물명 | 설치위치 | 용량(세제곱미터) | 용도 | 설치년도 | |
---|---|---|---|---|---|---|
0 | 1 | 효자중학교 | 부용로185번길15 | 12.0 | 조경용수 | 2003 |
1 | 2 | 동암중학교 | 장곡로226번길 132 | 20.0 | 조경용수 | 2008 |
2 | 3 | 발곡고등학교 | 동일로454번길 150 | 20.0 | 조경용수 | 2009 |
3 | 4 | 의정부공업고등학교 | 가능로 57 | 27.0 | 조경용수 | 2010 |
4 | 5 | 의정부역사 | 시민로62 | 240.0 | 화장실세정수 | 2012 |
5 | 6 | 송민학교 | 민락로 262 | 198.0 | 조경용수 | 2013 |
6 | 7 | 코스트코 홀세일 의정부점 | 용민로489번길 9 | 11.0 | 조경용수 | 2014 |
7 | 8 | 경기도교육청 북부청사 | 동일로700 | 230.0 | 화장실세정수+조경용수 | 2014 |
8 | 9 | 한국전력공사 경기북부지역본부 | 용민로19번길 80 | 172.5 | 조경용수 | 2016 |
9 | 10 | 호반 베르디움 1차 | 민락로211 | 774.7 | 조경용수+청소용수 | 2017 |
연번 | 건물명 | 설치위치 | 용량(세제곱미터) | 용도 | 설치년도 | |
---|---|---|---|---|---|---|
23 | 24 | 송학글래드스톤 앤 그레이스모나코 | 천보로 14 | 453.64 | 조경용수 | 2020 |
24 | 25 | 을지대 캠퍼스 및 부속병원 | 금오동 439-38 외 35 | 220.0 | 조경용수 | 2020 |
25 | 26 | 고산 대방노블랜드 | 고산 C5블럭 | 300.0 | 조경용수 | 2020 |
26 | 27 | 용현산업단지 기업지원센터 | 용현동 524-3번지 | 69.0 | 조경용수 | 2020 |
27 | 28 | 고산지구 3단지 (계룡건설) | 고산 S-3블럭 | 538.0 | 조경용수 | 2020 |
28 | 29 | 성암문화 체육비전센터 | 용현동 552번지 | 65.0 | 조경용수 | 2020 |
29 | 30 | 가능더샵 파크이비뉴 | 가능생활권2구역 | 300.0 | 조경용수 | 2021 |
30 | 31 | 탑석 센트럴자이 | 송산생활권1구역 | 784.4 | 조경용수 | 2021 |
31 | 32 | 송산3동 공공복합청사 | 낙양동 750번지 | 88.0 | 조경용수 | 2021 |
32 | 33 | 의정부역 센트럴 자이 위브캐슬 | 의정부동 380번지 | 1203.0 | 조경용수 | 2022 |