Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 1471 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 94.9 KiB |
Average record size in memory | 66.1 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 4 |
Text | 1 |
DateTime | 1 |
Dataset
Description | 세종특별자치시에서 운영 중인 스마트 워터 그리드에 대한 관할 행정동, 설치위치, 업종, 계량기 종류, 구경, 원격검침 단말기 설치여부에 관한 정보 입니다. |
---|---|
URL | https://www.data.go.kr/data/15103441/fileData.do |
원격검침단말기 설치여부 has constant value "" | Constant |
데이터기준일 has constant value "" | Constant |
연번 is highly overall correlated with 행정동 | High correlation |
구경 is highly overall correlated with 계량기종류 | High correlation |
행정동 is highly overall correlated with 연번 | High correlation |
계량기종류 is highly overall correlated with 구경 | High correlation |
업종 is highly imbalanced (50.2%) | Imbalance |
연번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 08:24:33.775718 |
---|---|
Analysis finished | 2023-12-12 08:24:34.700661 |
Duration | 0.92 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 1471 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 736 |
Minimum | 1 |
---|---|
Maximum | 1471 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 13.1 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 74.5 |
Q1 | 368.5 |
median | 736 |
Q3 | 1103.5 |
95-th percentile | 1397.5 |
Maximum | 1471 |
Range | 1470 |
Interquartile range (IQR) | 735 |
Descriptive statistics
Standard deviation | 424.78544 |
---|---|
Coefficient of variation (CV) | 0.57715413 |
Kurtosis | -1.2 |
Mean | 736 |
Median Absolute Deviation (MAD) | 368 |
Skewness | 0 |
Sum | 1082656 |
Variance | 180442.67 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
979 | 1 | 0.1% |
988 | 1 | 0.1% |
987 | 1 | 0.1% |
986 | 1 | 0.1% |
985 | 1 | 0.1% |
984 | 1 | 0.1% |
983 | 1 | 0.1% |
982 | 1 | 0.1% |
981 | 1 | 0.1% |
Other values (1461) | 1461 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
1471 | 1 | |
1470 | 1 | |
1469 | 1 | |
1468 | 1 | |
1467 | 1 | |
1466 | 1 | |
1465 | 1 | |
1464 | 1 | |
1463 | 1 | |
1462 | 1 |
행정동
Categorical
HIGH CORRELATION
 
Distinct | 13 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.6 KiB |
고운동 | |
---|---|
도담동 | |
아름동 | |
보람동 | |
한솔동 | |
Other values (8) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 가람동 |
---|---|
2nd row | 가람동 |
3rd row | 가람동 |
4th row | 가람동 |
5th row | 가람동 |
Common Values
Value | Count | Frequency (%) |
고운동 | 348 | |
도담동 | 216 | |
아름동 | 182 | |
보람동 | 127 | 8.6% |
한솔동 | 98 | 6.7% |
나성동 | 93 | 6.3% |
어진동 | 92 | 6.3% |
새롬동 | 73 | 5.0% |
다정동 | 63 | 4.3% |
소담동 | 63 | 4.3% |
Other values (3) | 116 | 7.9% |
Length
Value | Count | Frequency (%) |
고운동 | 348 | |
도담동 | 216 | |
아름동 | 182 | |
보람동 | 127 | 8.6% |
한솔동 | 98 | 6.7% |
나성동 | 93 | 6.3% |
어진동 | 92 | 6.3% |
새롬동 | 73 | 5.0% |
다정동 | 63 | 4.3% |
소담동 | 63 | 4.3% |
Other values (3) | 116 | 7.9% |
주소
Text
Distinct | 1252 |
---|---|
Distinct (%) | 85.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.6 KiB |
Length
Max length | 25 |
---|---|
Median length | 21 |
Mean length | 8.6437797 |
Min length | 5 |
Characters and Unicode
Total characters | 12715 |
---|---|
Distinct characters | 163 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 1077 ? |
---|---|
Unique (%) | 73.2% |
Sample
1st row | 가람동 765 |
---|---|
2nd row | 금송로 625 |
3rd row | 금송로 625 |
4th row | 금송로 650 |
5th row | 가람동 19번지 |
Value | Count | Frequency (%) |
한누리대로 | 108 | 3.6% |
마음로 | 52 | 1.7% |
고운동 | 51 | 1.7% |
나성동 | 44 | 1.5% |
보듬3로 | 43 | 1.4% |
남세종로 | 39 | 1.3% |
만남로 | 33 | 1.1% |
도담서5길 | 31 | 1.0% |
시청대로 | 31 | 1.0% |
어진동 | 29 | 1.0% |
Other values (864) | 2517 |
Most occurring characters
Value | Count | Frequency (%) |
2233 | ||
1 | 1042 | 8.2% |
로 | 932 | 7.3% |
3 | 617 | 4.9% |
2 | 598 | 4.7% |
4 | 416 | 3.3% |
길 | 397 | 3.1% |
5 | 375 | 2.9% |
6 | 351 | 2.8% |
- | 306 | 2.4% |
Other values (153) | 5448 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5587 | |
Decimal Number | 4516 | |
Space Separator | 2233 | 17.6% |
Dash Punctuation | 306 | 2.4% |
Uppercase Letter | 37 | 0.3% |
Math Symbol | 12 | 0.1% |
Close Punctuation | 9 | 0.1% |
Open Punctuation | 8 | 0.1% |
Lowercase Letter | 5 | < 0.1% |
Other Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 932 | 16.7% |
길 | 397 | 7.1% |
동 | 221 | 4.0% |
남 | 162 | 2.9% |
대 | 162 | 2.9% |
운 | 153 | 2.7% |
고 | 152 | 2.7% |
리 | 148 | 2.6% |
도 | 126 | 2.3% |
누 | 125 | 2.2% |
Other values (119) | 3009 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1042 | |
3 | 617 | |
2 | 598 | |
4 | 416 | 9.2% |
5 | 375 | 8.3% |
6 | 351 | 7.8% |
0 | 288 | 6.4% |
8 | 283 | 6.3% |
9 | 274 | 6.1% |
7 | 272 | 6.0% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 11 | |
H | 9 | |
D | 5 | |
B | 5 | |
A | 2 | 5.4% |
L | 1 | 2.7% |
R | 1 | 2.7% |
O | 1 | 2.7% |
S | 1 | 2.7% |
J | 1 | 2.7% |
Lowercase Letter
Value | Count | Frequency (%) |
f | 1 | |
g | 1 | |
u | 1 | |
a | 1 | |
n | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 8 | |
] | 1 | 11.1% |
Math Symbol
Value | Count | Frequency (%) |
> | 6 | |
< | 6 |
Other Punctuation
Value | Count | Frequency (%) |
: | 1 | |
, | 1 |
Space Separator
Value | Count | Frequency (%) |
2233 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 306 |
Open Punctuation
Value | Count | Frequency (%) |
( | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 7086 | |
Hangul | 5587 | |
Latin | 42 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 932 | 16.7% |
길 | 397 | 7.1% |
동 | 221 | 4.0% |
남 | 162 | 2.9% |
대 | 162 | 2.9% |
운 | 153 | 2.7% |
고 | 152 | 2.7% |
리 | 148 | 2.6% |
도 | 126 | 2.3% |
누 | 125 | 2.2% |
Other values (119) | 3009 |
Common
Value | Count | Frequency (%) |
2233 | ||
1 | 1042 | |
3 | 617 | 8.7% |
2 | 598 | 8.4% |
4 | 416 | 5.9% |
5 | 375 | 5.3% |
6 | 351 | 5.0% |
- | 306 | 4.3% |
0 | 288 | 4.1% |
8 | 283 | 4.0% |
Other values (9) | 577 | 8.1% |
Latin
Value | Count | Frequency (%) |
C | 11 | |
H | 9 | |
D | 5 | |
B | 5 | |
A | 2 | 4.8% |
f | 1 | 2.4% |
L | 1 | 2.4% |
g | 1 | 2.4% |
R | 1 | 2.4% |
O | 1 | 2.4% |
Other values (5) | 5 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 7128 | |
Hangul | 5587 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2233 | ||
1 | 1042 | |
3 | 617 | 8.7% |
2 | 598 | 8.4% |
4 | 416 | 5.8% |
5 | 375 | 5.3% |
6 | 351 | 4.9% |
- | 306 | 4.3% |
0 | 288 | 4.0% |
8 | 283 | 4.0% |
Other values (24) | 619 | 8.7% |
Hangul
Value | Count | Frequency (%) |
로 | 932 | 16.7% |
길 | 397 | 7.1% |
동 | 221 | 4.0% |
남 | 162 | 2.9% |
대 | 162 | 2.9% |
운 | 153 | 2.7% |
고 | 152 | 2.7% |
리 | 148 | 2.6% |
도 | 126 | 2.3% |
누 | 125 | 2.2% |
Other values (119) | 3009 |
업종
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.6 KiB |
일반용 | |
---|---|
가정용 | |
일반(학교) | 43 |
일반(유치원) | 22 |
일반(어린이집) | 6 |
Length
Max length | 8 |
---|---|
Median length | 3 |
Mean length | 3.1692726 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반용 |
---|---|
2nd row | 일반용 |
3rd row | 일반용 |
4th row | 일반용 |
5th row | 일반용 |
Common Values
Value | Count | Frequency (%) |
일반용 | 810 | |
가정용 | 588 | |
일반(학교) | 43 | 2.9% |
일반(유치원) | 22 | 1.5% |
일반(어린이집) | 6 | 0.4% |
대중탕용 | 2 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반용 | 810 | |
가정용 | 588 | |
일반(학교 | 43 | 2.9% |
일반(유치원 | 22 | 1.5% |
일반(어린이집 | 6 | 0.4% |
대중탕용 | 2 | 0.1% |
계량기종류
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.6 KiB |
디지털식 | |
---|---|
전자식 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8769545 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 디지털식 |
---|---|
2nd row | 전자식 |
3rd row | 전자식 |
4th row | 디지털식 |
5th row | 디지털식 |
Common Values
Value | Count | Frequency (%) |
디지털식 | 1290 | |
전자식 | 181 | 12.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
디지털식 | 1290 | |
전자식 | 181 | 12.3% |
구경
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 44.840925 |
Minimum | 13 |
---|---|
Maximum | 250 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 13.1 KiB |
Quantile statistics
Minimum | 13 |
---|---|
5-th percentile | 13 |
Q1 | 20 |
median | 40 |
Q3 | 50 |
95-th percentile | 100 |
Maximum | 250 |
Range | 237 |
Interquartile range (IQR) | 30 |
Descriptive statistics
Standard deviation | 28.903932 |
---|---|
Coefficient of variation (CV) | 0.64458822 |
Kurtosis | 5.3212065 |
Mean | 44.840925 |
Median Absolute Deviation (MAD) | 20 |
Skewness | 1.6873373 |
Sum | 65961 |
Variance | 835.43726 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
50 | 376 | |
20 | 324 | |
75 | 221 | |
25 | 199 | |
13 | 101 | 6.9% |
40 | 90 | 6.1% |
100 | 86 | 5.8% |
32 | 49 | 3.3% |
150 | 21 | 1.4% |
250 | 2 | 0.1% |
Value | Count | Frequency (%) |
13 | 101 | 6.9% |
20 | 324 | |
25 | 199 | |
32 | 49 | 3.3% |
40 | 90 | 6.1% |
50 | 376 | |
75 | 221 | |
100 | 86 | 5.8% |
150 | 21 | 1.4% |
200 | 2 | 0.1% |
Value | Count | Frequency (%) |
250 | 2 | 0.1% |
200 | 2 | 0.1% |
150 | 21 | 1.4% |
100 | 86 | 5.8% |
75 | 221 | |
50 | 376 | |
40 | 90 | 6.1% |
32 | 49 | 3.3% |
25 | 199 | |
20 | 324 |
원격검침단말기 설치여부
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.6 KiB |
설치완료 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 설치완료 |
---|---|
2nd row | 설치완료 |
3rd row | 설치완료 |
4th row | 설치완료 |
5th row | 설치완료 |
Common Values
Value | Count | Frequency (%) |
설치완료 | 1471 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
설치완료 | 1471 |
데이터기준일
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.6 KiB |
Minimum | 2023-07-11 00:00:00 |
---|---|
Maximum | 2023-07-11 00:00:00 |
연번 | 행정동 | 업종 | 계량기종류 | 구경 | |
---|---|---|---|---|---|
연번 | 1.000 | 0.944 | 0.291 | 0.355 | 0.363 |
행정동 | 0.944 | 1.000 | 0.388 | 0.318 | 0.472 |
업종 | 0.291 | 0.388 | 1.000 | 0.251 | 0.470 |
계량기종류 | 0.355 | 0.318 | 0.251 | 1.000 | 0.646 |
구경 | 0.363 | 0.472 | 0.470 | 0.646 | 1.000 |
계량기종류 | 행정동 | 업종 | |
---|---|---|---|
계량기종류 | 1.000 | 0.295 | 0.180 |
행정동 | 0.295 | 1.000 | 0.203 |
업종 | 0.180 | 0.203 | 1.000 |
연번 | 구경 | 행정동 | 업종 | 계량기종류 | |
---|---|---|---|---|---|
연번 | 1.000 | 0.170 | 0.790 | 0.157 | 0.271 |
구경 | 0.170 | 1.000 | 0.241 | 0.303 | 0.696 |
행정동 | 0.790 | 0.241 | 1.000 | 0.203 | 0.295 |
업종 | 0.157 | 0.303 | 0.203 | 1.000 | 0.180 |
계량기종류 | 0.271 | 0.696 | 0.295 | 0.180 | 1.000 |
연번 | 행정동 | 주소 | 업종 | 계량기종류 | 구경 | 원격검침단말기 설치여부 | 데이터기준일 | |
---|---|---|---|---|---|---|---|---|
0 | 1 | 가람동 | 가람동 765 | 일반용 | 디지털식 | 25 | 설치완료 | 2023-07-11 |
1 | 2 | 가람동 | 금송로 625 | 일반용 | 전자식 | 250 | 설치완료 | 2023-07-11 |
2 | 3 | 가람동 | 금송로 625 | 일반용 | 전자식 | 75 | 설치완료 | 2023-07-11 |
3 | 4 | 가람동 | 금송로 650 | 일반용 | 디지털식 | 25 | 설치완료 | 2023-07-11 |
4 | 5 | 가람동 | 가람동 19번지 | 일반용 | 디지털식 | 20 | 설치완료 | 2023-07-11 |
5 | 6 | 가람동 | 가람동 19-17번지 | 일반용 | 디지털식 | 20 | 설치완료 | 2023-07-11 |
6 | 7 | 가람동 | 금송로 687 | 일반용 | 디지털식 | 75 | 설치완료 | 2023-07-11 |
7 | 8 | 가람동 | 라온로 66 | 일반용 | 전자식 | 75 | 설치완료 | 2023-07-11 |
8 | 9 | 가람동 | 라온로 121 | 일반용 | 디지털식 | 100 | 설치완료 | 2023-07-11 |
9 | 10 | 가람동 | 라온로 82 | 일반용 | 디지털식 | 50 | 설치완료 | 2023-07-11 |
연번 | 행정동 | 주소 | 업종 | 계량기종류 | 구경 | 원격검침단말기 설치여부 | 데이터기준일 | |
---|---|---|---|---|---|---|---|---|
1461 | 1462 | 종촌동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1462 | 1463 | 고운동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1463 | 1464 | 고운동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1464 | 1465 | 도담동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1465 | 1466 | 고운동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1466 | 1467 | 한솔동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1467 | 1468 | 고운동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1468 | 1469 | 아름동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1469 | 1470 | 도담동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |
1470 | 1471 | 새롬동 | 시설사업소 녹지관리과 | 일반용 | 디지털식 | 13 | 설치완료 | 2023-07-11 |