Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 104 |
Missing cells | 20 |
Missing cells (%) | 3.8% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.0% |
Total size in memory | 4.4 KiB |
Average record size in memory | 43.3 B |
Variable types
Text | 2 |
---|---|
Numeric | 2 |
Categorical | 1 |
Dataset
Description | 대구광역시 북구 관내 특정토양오염관리대상시설 현황(시설명, 소재지도로명주소, 위치정보 등) 정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15006308/fileData.do |
Dataset has 1 (1.0%) duplicate rows | Duplicates |
위도 is highly overall correlated with 데이터기준일자 | High correlation |
경도 is highly overall correlated with 데이터기준일자 | High correlation |
데이터기준일자 is highly overall correlated with 위도 and 1 other fields | High correlation |
데이터기준일자 is highly imbalanced (72.2%) | Imbalance |
시설명 has 5 (4.8%) missing values | Missing |
소재지 도로명주소 has 5 (4.8%) missing values | Missing |
위도 has 5 (4.8%) missing values | Missing |
경도 has 5 (4.8%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 02:38:42.821232 |
---|---|
Analysis finished | 2023-12-12 02:38:43.958484 |
Duration | 1.14 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시설명
Text
MISSING
 
Distinct | 99 |
---|---|
Distinct (%) | 100.0% |
Missing | 5 |
Missing (%) | 4.8% |
Memory size | 964.0 B |
Value | Count | Frequency (%) |
주식회사 | 4 | 3.3% |
에이치디현대오일뱅크(주)직영 | 4 | 3.3% |
주)에이치씨대하에너지 | 2 | 1.7% |
케이케이(주)침산주유소 | 1 | 0.8% |
산동주유소 | 1 | 0.8% |
지에스칼텍스(주)구암주유소 | 1 | 0.8% |
칠곡매천주유소 | 1 | 0.8% |
한국광유(주 | 1 | 0.8% |
오일월드주유소 | 1 | 0.8% |
sk에너지(주)칠곡ic주유소 | 1 | 0.8% |
Other values (103) | 103 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 103 | 11.4% |
유 | 77 | 8.5% |
소 | 69 | 7.6% |
대 | 39 | 4.3% |
( | 35 | 3.9% |
) | 35 | 3.9% |
에 | 26 | 2.9% |
지 | 23 | 2.5% |
21 | 2.3% | |
이 | 15 | 1.7% |
Other values (170) | 463 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 781 | |
Open Punctuation | 35 | 3.9% |
Close Punctuation | 35 | 3.9% |
Space Separator | 21 | 2.3% |
Uppercase Letter | 18 | 2.0% |
Decimal Number | 9 | 1.0% |
Lowercase Letter | 5 | 0.6% |
Other Punctuation | 2 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 103 | 13.2% |
유 | 77 | 9.9% |
소 | 69 | 8.8% |
대 | 39 | 5.0% |
에 | 26 | 3.3% |
지 | 23 | 2.9% |
이 | 15 | 1.9% |
너 | 15 | 1.9% |
구 | 14 | 1.8% |
일 | 11 | 1.4% |
Other values (149) | 389 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 7 | |
K | 6 | |
C | 1 | 5.6% |
I | 1 | 5.6% |
E | 1 | 5.6% |
L | 1 | 5.6% |
F | 1 | 5.6% |
Decimal Number
Value | Count | Frequency (%) |
5 | 3 | |
2 | 2 | |
1 | 1 | 11.1% |
8 | 1 | 11.1% |
7 | 1 | 11.1% |
6 | 1 | 11.1% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 2 | |
s | 1 | |
l | 1 | |
f | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 35 |
Close Punctuation
Value | Count | Frequency (%) |
) | 35 |
Space Separator
Value | Count | Frequency (%) |
21 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 781 | |
Common | 102 | 11.3% |
Latin | 23 | 2.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 103 | 13.2% |
유 | 77 | 9.9% |
소 | 69 | 8.8% |
대 | 39 | 5.0% |
에 | 26 | 3.3% |
지 | 23 | 2.9% |
이 | 15 | 1.9% |
너 | 15 | 1.9% |
구 | 14 | 1.8% |
일 | 11 | 1.4% |
Other values (149) | 389 |
Latin
Value | Count | Frequency (%) |
S | 7 | |
K | 6 | |
e | 2 | 8.7% |
C | 1 | 4.3% |
I | 1 | 4.3% |
s | 1 | 4.3% |
E | 1 | 4.3% |
L | 1 | 4.3% |
F | 1 | 4.3% |
l | 1 | 4.3% |
Common
Value | Count | Frequency (%) |
( | 35 | |
) | 35 | |
21 | ||
5 | 3 | 2.9% |
, | 2 | 2.0% |
2 | 2 | 2.0% |
1 | 1 | 1.0% |
8 | 1 | 1.0% |
7 | 1 | 1.0% |
6 | 1 | 1.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 781 | |
ASCII | 125 | 13.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 103 | 13.2% |
유 | 77 | 9.9% |
소 | 69 | 8.8% |
대 | 39 | 5.0% |
에 | 26 | 3.3% |
지 | 23 | 2.9% |
이 | 15 | 1.9% |
너 | 15 | 1.9% |
구 | 14 | 1.8% |
일 | 11 | 1.4% |
Other values (149) | 389 |
ASCII
Value | Count | Frequency (%) |
( | 35 | |
) | 35 | |
21 | ||
S | 7 | 5.6% |
K | 6 | 4.8% |
5 | 3 | 2.4% |
, | 2 | 1.6% |
2 | 2 | 1.6% |
e | 2 | 1.6% |
C | 1 | 0.8% |
Other values (11) | 11 | 8.8% |
소재지 도로명주소
Text
MISSING
 
Distinct | 96 |
---|---|
Distinct (%) | 97.0% |
Missing | 5 |
Missing (%) | 4.8% |
Memory size | 964.0 B |
Length
Max length | 33 |
---|---|
Median length | 28 |
Mean length | 23.707071 |
Min length | 20 |
Characters and Unicode
Total characters | 2347 |
---|---|
Distinct characters | 81 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 94 ? |
---|---|
Unique (%) | 94.9% |
Sample
1st row | 대구광역시 북구 연암로 119 (산격동) |
---|---|
2nd row | 대구광역시 북구 동북로 9 (산격동) |
3rd row | 대구광역시 북구 칠곡중앙대로 174 (태전동) |
4th row | 대구광역시 북구 유통단지로3길 40 (산격동) |
5th row | 대구광역시 북구 칠곡중앙대로 624 (읍내동) |
Value | Count | Frequency (%) |
대구광역시 | 99 | |
북구 | 98 | |
산격동 | 17 | 3.4% |
노원동3가 | 15 | 3.0% |
침산동 | 11 | 2.2% |
칠곡중앙대로 | 11 | 2.2% |
노원로 | 10 | 2.0% |
태전동 | 8 | 1.6% |
호국로 | 7 | 1.4% |
동북로 | 7 | 1.4% |
Other values (159) | 215 |
Most occurring characters
Value | Count | Frequency (%) |
400 | ||
구 | 205 | 8.7% |
대 | 120 | 5.1% |
동 | 113 | 4.8% |
북 | 107 | 4.6% |
( | 99 | 4.2% |
광 | 99 | 4.2% |
역 | 99 | 4.2% |
시 | 99 | 4.2% |
) | 99 | 4.2% |
Other values (71) | 907 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1395 | |
Space Separator | 400 | 17.0% |
Decimal Number | 333 | 14.2% |
Open Punctuation | 99 | 4.2% |
Close Punctuation | 99 | 4.2% |
Dash Punctuation | 17 | 0.7% |
Other Punctuation | 4 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 205 | |
대 | 120 | 8.6% |
동 | 113 | 8.1% |
북 | 107 | 7.7% |
광 | 99 | 7.1% |
역 | 99 | 7.1% |
시 | 99 | 7.1% |
로 | 99 | 7.1% |
산 | 32 | 2.3% |
원 | 29 | 2.1% |
Other values (56) | 393 |
Decimal Number
Value | Count | Frequency (%) |
1 | 58 | |
2 | 57 | |
3 | 52 | |
4 | 38 | |
5 | 26 | |
6 | 23 | 6.9% |
8 | 21 | 6.3% |
9 | 20 | 6.0% |
0 | 19 | 5.7% |
7 | 19 | 5.7% |
Space Separator
Value | Count | Frequency (%) |
400 |
Open Punctuation
Value | Count | Frequency (%) |
( | 99 |
Close Punctuation
Value | Count | Frequency (%) |
) | 99 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 17 |
Other Punctuation
Value | Count | Frequency (%) |
, | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1395 | |
Common | 952 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 205 | |
대 | 120 | 8.6% |
동 | 113 | 8.1% |
북 | 107 | 7.7% |
광 | 99 | 7.1% |
역 | 99 | 7.1% |
시 | 99 | 7.1% |
로 | 99 | 7.1% |
산 | 32 | 2.3% |
원 | 29 | 2.1% |
Other values (56) | 393 |
Common
Value | Count | Frequency (%) |
400 | ||
( | 99 | 10.4% |
) | 99 | 10.4% |
1 | 58 | 6.1% |
2 | 57 | 6.0% |
3 | 52 | 5.5% |
4 | 38 | 4.0% |
5 | 26 | 2.7% |
6 | 23 | 2.4% |
8 | 21 | 2.2% |
Other values (5) | 79 | 8.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1395 | |
ASCII | 952 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
400 | ||
( | 99 | 10.4% |
) | 99 | 10.4% |
1 | 58 | 6.1% |
2 | 57 | 6.0% |
3 | 52 | 5.5% |
4 | 38 | 4.0% |
5 | 26 | 2.7% |
6 | 23 | 2.4% |
8 | 21 | 2.2% |
Other values (5) | 79 | 8.3% |
Hangul
Value | Count | Frequency (%) |
구 | 205 | |
대 | 120 | 8.6% |
동 | 113 | 8.1% |
북 | 107 | 7.7% |
광 | 99 | 7.1% |
역 | 99 | 7.1% |
시 | 99 | 7.1% |
로 | 99 | 7.1% |
산 | 32 | 2.3% |
원 | 29 | 2.1% |
Other values (56) | 393 |
위도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 96 |
---|---|
Distinct (%) | 97.0% |
Missing | 5 |
Missing (%) | 4.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 35.908296 |
Minimum | 35.877979 |
---|---|
Maximum | 35.958235 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 35.877979 |
---|---|
5-th percentile | 35.884085 |
Q1 | 35.894484 |
median | 35.901872 |
Q3 | 35.914187 |
95-th percentile | 35.950846 |
Maximum | 35.958235 |
Range | 0.08025617 |
Interquartile range (IQR) | 0.019702661 |
Descriptive statistics
Standard deviation | 0.02095534 |
---|---|
Coefficient of variation (CV) | 0.00058357936 |
Kurtosis | -0.0050652344 |
Mean | 35.908296 |
Median Absolute Deviation (MAD) | 0.010032052 |
Skewness | 1.0181505 |
Sum | 3554.9213 |
Variance | 0.00043912628 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
35.9012692821 | 3 | 2.9% |
35.9494992868 | 2 | 1.9% |
35.9406258489 | 1 | 1.0% |
35.9017300941 | 1 | 1.0% |
35.9430719567 | 1 | 1.0% |
35.9512318365 | 1 | 1.0% |
35.9062959781 | 1 | 1.0% |
35.9142007231 | 1 | 1.0% |
35.8908803058 | 1 | 1.0% |
35.9473620601 | 1 | 1.0% |
Other values (86) | 86 | |
(Missing) | 5 | 4.8% |
Value | Count | Frequency (%) |
35.8779787946 | 1 | |
35.8803484609 | 1 | |
35.882037633 | 1 | |
35.8831140319 | 1 | |
35.8834715843 | 1 | |
35.8841533661 | 1 | |
35.8846158888 | 1 | |
35.8861778348 | 1 | |
35.886255507 | 1 | |
35.8865775176 | 1 |
Value | Count | Frequency (%) |
35.958234965 | 1 | |
35.9581151841 | 1 | |
35.9561460236 | 1 | |
35.9527552483 | 1 | |
35.9512318365 | 1 | |
35.9508028327 | 1 | |
35.9505034096 | 1 | |
35.9494992868 | 2 | |
35.9494032125 | 1 | |
35.9473620601 | 1 |
경도
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 96 |
---|---|
Distinct (%) | 97.0% |
Missing | 5 |
Missing (%) | 4.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 128.58029 |
Minimum | 128.52157 |
---|---|
Maximum | 128.75746 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 128.52157 |
---|---|
5-th percentile | 128.54166 |
Q1 | 128.55495 |
median | 128.57838 |
Q3 | 128.59975 |
95-th percentile | 128.62143 |
Maximum | 128.75746 |
Range | 0.23588871 |
Interquartile range (IQR) | 0.044807543 |
Descriptive statistics
Standard deviation | 0.031787371 |
---|---|
Coefficient of variation (CV) | 0.00024721807 |
Kurtosis | 8.3872001 |
Mean | 128.58029 |
Median Absolute Deviation (MAD) | 0.022283118 |
Skewness | 1.663965 |
Sum | 12729.448 |
Variance | 0.0010104369 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
128.5877135216 | 3 | 2.9% |
128.5717287264 | 2 | 1.9% |
128.5703140804 | 1 | 1.0% |
128.5697193142 | 1 | 1.0% |
128.5420186051 | 1 | 1.0% |
128.5698335336 | 1 | 1.0% |
128.5477044603 | 1 | 1.0% |
128.5995646477 | 1 | 1.0% |
128.605705834 | 1 | 1.0% |
128.5727332193 | 1 | 1.0% |
Other values (86) | 86 | |
(Missing) | 5 | 4.8% |
Value | Count | Frequency (%) |
128.5215702633 | 1 | |
128.5256339777 | 1 | |
128.5302647748 | 1 | |
128.5339747579 | 1 | |
128.5396443381 | 1 | |
128.5418826955 | 1 | |
128.5420186051 | 1 | |
128.5420643565 | 1 | |
128.5460638757 | 1 | |
128.5465315407 | 1 |
Value | Count | Frequency (%) |
128.7574589687 | 1 | |
128.628997975 | 1 | |
128.6280030532 | 1 | |
128.6245031608 | 1 | |
128.6231196524 | 1 | |
128.6212433362 | 1 | |
128.6184251751 | 1 | |
128.6180468192 | 1 | |
128.6159290608 | 1 | |
128.615565403 | 1 |
데이터기준일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 964.0 B |
2023-05-15 | |
---|---|
<NA> | 5 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.7115385 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-05-15 |
---|---|
2nd row | 2023-05-15 |
3rd row | 2023-05-15 |
4th row | 2023-05-15 |
5th row | 2023-05-15 |
Common Values
Value | Count | Frequency (%) |
2023-05-15 | 99 | |
<NA> | 5 | 4.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-05-15 | 99 | |
na | 5 | 4.8% |
시설명 | 소재지 도로명주소 | 위도 | 경도 | |
---|---|---|---|---|
시설명 | 1.000 | 1.000 | 1.000 | 1.000 |
소재지 도로명주소 | 1.000 | 1.000 | 1.000 | 1.000 |
위도 | 1.000 | 1.000 | 1.000 | 0.405 |
경도 | 1.000 | 1.000 | 0.405 | 1.000 |
위도 | 경도 | 데이터기준일자 | |
---|---|---|---|
위도 | 1.000 | -0.208 | 1.000 |
경도 | -0.208 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 |
시설명 | 소재지 도로명주소 | 위도 | 경도 | 데이터기준일자 | |
---|---|---|---|---|---|
0 | 선진주유소 | 대구광역시 북구 연암로 119 (산격동) | 35.895222 | 128.594285 | 2023-05-15 |
1 | 태왕주유소 | 대구광역시 북구 동북로 9 (산격동) | 35.901872 | 128.594606 | 2023-05-15 |
2 | 대훈남주유소 | 대구광역시 북구 칠곡중앙대로 174 (태전동) | 35.91137 | 128.54892 | 2023-05-15 |
3 | (주)보광산업 | 대구광역시 북구 유통단지로3길 40 (산격동) | 35.907459 | 128.60397 | 2023-05-15 |
4 | 미희주유소 | 대구광역시 북구 칠곡중앙대로 624 (읍내동) | 35.950803 | 128.553372 | 2023-05-15 |
5 | 중앙주유소 | 대구광역시 북구 동북로 315 (복현동) | 35.89184 | 128.624503 | 2023-05-15 |
6 | 흥구석유(주)원대주유소 | 대구광역시 북구 팔달로 67 (노원동3가) | 35.890868 | 128.55809 | 2023-05-15 |
7 | 흥구석유(주)산격주유소 | 대구광역시 북구 동북로 39 (산격동) | 35.902312 | 128.597977 | 2023-05-15 |
8 | 해바라기self주유소 | 대구광역시 북구 대현로 81 (대현동) | 35.883114 | 128.608069 | 2023-05-15 |
9 | 공명주유소 | 대구광역시 북구 침산남로 43 (노원동1가) | 35.889303 | 128.580699 | 2023-05-15 |
시설명 | 소재지 도로명주소 | 위도 | 경도 | 데이터기준일자 | |
---|---|---|---|---|---|
94 | 주식회사 북대구아이씨주유소 | 대구광역시 북구 동북로 113 (산격동) | 35.902289 | 128.606356 | 2023-05-15 |
95 | 대현주유소 | 대구광역시 북구 대학로 16 (산격동) | 35.888845 | 128.603436 | 2023-05-15 |
96 | 대한송유관공사 영남지사 | 대구광역시 동구 대경로 31-27 (내곡동) | 35.880348 | 128.757459 | 2023-05-15 |
97 | 현대윤활유 | 대구광역시 북구 3공단로 144-1 (노원동3가) | 35.898312 | 128.567611 | 2023-05-15 |
98 | (주)에이치씨 대하에너지 연경주유소 | 대구광역시 북구 동화천로 207 (연경동) | 35.9416 | 128.613737 | 2023-05-15 |
99 | <NA> | <NA> | <NA> | <NA> | <NA> |
100 | <NA> | <NA> | <NA> | <NA> | <NA> |
101 | <NA> | <NA> | <NA> | <NA> | <NA> |
102 | <NA> | <NA> | <NA> | <NA> | <NA> |
103 | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
시설명 | 소재지 도로명주소 | 위도 | 경도 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | 5 |