Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 42 |
Missing cells | 45 |
Missing cells (%) | 17.9% |
Duplicate rows | 1 |
Duplicate rows (%) | 2.4% |
Total size in memory | 2.2 KiB |
Average record size in memory | 53.1 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 1 |
Text | 3 |
Dataset
Description | 경기도 오산시에 위치한 주유소 현황에 대한 데이터로 주유소명, 사업장소재지, 대표자, 사업장연면적 항목을 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/3072090/fileData.do |
Dataset has 1 (2.4%) duplicate rows | Duplicates |
연번 is highly overall correlated with 업종 | High correlation |
사업장연면적 is highly overall correlated with 업종 | High correlation |
업종 is highly overall correlated with 연번 and 1 other fields | High correlation |
연번 has 9 (21.4%) missing values | Missing |
상호 has 9 (21.4%) missing values | Missing |
성명(법인명) has 9 (21.4%) missing values | Missing |
사업장소재지 has 9 (21.4%) missing values | Missing |
사업장연면적 has 9 (21.4%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 11:20:34.350457 |
---|---|
Analysis finished | 2023-12-12 11:20:35.974153 |
Duration | 1.62 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 33 |
---|---|
Distinct (%) | 100.0% |
Missing | 9 |
Missing (%) | 21.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 17 |
Minimum | 1 |
---|---|
Maximum | 33 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 510.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2.6 |
Q1 | 9 |
median | 17 |
Q3 | 25 |
95-th percentile | 31.4 |
Maximum | 33 |
Range | 32 |
Interquartile range (IQR) | 16 |
Descriptive statistics
Standard deviation | 9.6695398 |
---|---|
Coefficient of variation (CV) | 0.56879646 |
Kurtosis | -1.2 |
Mean | 17 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0 |
Sum | 561 |
Variance | 93.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
26 | 1 | 2.4% |
20 | 1 | 2.4% |
21 | 1 | 2.4% |
22 | 1 | 2.4% |
23 | 1 | 2.4% |
24 | 1 | 2.4% |
25 | 1 | 2.4% |
27 | 1 | 2.4% |
2 | 1 | 2.4% |
28 | 1 | 2.4% |
Other values (23) | 23 | |
(Missing) | 9 | 21.4% |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
33 | 1 | |
32 | 1 | |
31 | 1 | |
30 | 1 | |
29 | 1 | |
28 | 1 | |
27 | 1 | |
26 | 1 | |
25 | 1 | |
24 | 1 |
업종
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 4.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 468.0 B |
주유소 | |
---|---|
<NA> |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.2142857 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 주유소 |
---|---|
2nd row | 주유소 |
3rd row | 주유소 |
4th row | 주유소 |
5th row | 주유소 |
Common Values
Value | Count | Frequency (%) |
주유소 | 33 | |
<NA> | 9 | 21.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
주유소 | 33 | |
na | 9 | 21.4% |
상호
Text
MISSING
 
Distinct | 33 |
---|---|
Distinct (%) | 100.0% |
Missing | 9 |
Missing (%) | 21.4% |
Memory size | 468.0 B |
Length
Max length | 25 |
---|---|
Median length | 24 |
Mean length | 9.5151515 |
Min length | 5 |
Characters and Unicode
Total characters | 314 |
---|---|
Distinct characters | 93 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 33 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | (주)양지 남부대로주유소 |
---|---|
2nd row | 동탄세마주유소 |
3rd row | 대명에너지(해솔) |
4th row | ㈜다원에너지직영 영일주유소 |
5th row | SK에너지(주)운암뜰 주유소 |
Value | Count | Frequency (%) |
에이치디현대오일뱅크(주)직영 | 2 | 4.9% |
kh에너지(주)직영 | 2 | 4.9% |
주유소 | 2 | 4.9% |
온새미주유소 | 1 | 2.4% |
동탄세마주유소 | 1 | 2.4% |
서동탄셀프주유소 | 1 | 2.4% |
우영주유소 | 1 | 2.4% |
오산세교셀프주유소 | 1 | 2.4% |
삼화주유소 | 1 | 2.4% |
까막셀프주유소 | 1 | 2.4% |
Other values (28) | 28 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 38 | 12.1% |
유 | 32 | 10.2% |
소 | 31 | 9.9% |
) | 11 | 3.5% |
오 | 11 | 3.5% |
( | 11 | 3.5% |
산 | 10 | 3.2% |
에 | 9 | 2.9% |
지 | 8 | 2.5% |
8 | 2.5% | |
Other values (83) | 145 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 267 | |
Close Punctuation | 11 | 3.5% |
Open Punctuation | 11 | 3.5% |
Space Separator | 8 | 2.5% |
Uppercase Letter | 8 | 2.5% |
Lowercase Letter | 6 | 1.9% |
Other Symbol | 2 | 0.6% |
Decimal Number | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 38 | 14.2% |
유 | 32 | 12.0% |
소 | 31 | 11.6% |
오 | 11 | 4.1% |
산 | 10 | 3.7% |
에 | 9 | 3.4% |
지 | 8 | 3.0% |
영 | 7 | 2.6% |
너 | 7 | 2.6% |
대 | 6 | 2.2% |
Other values (69) | 108 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 2 | |
k | 1 | |
f | 1 | |
l | 1 | |
e | 1 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 3 | |
S | 2 | |
H | 2 | |
G | 1 | 12.5% |
Close Punctuation
Value | Count | Frequency (%) |
) | 11 |
Open Punctuation
Value | Count | Frequency (%) |
( | 11 |
Space Separator
Value | Count | Frequency (%) |
8 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 269 | |
Common | 31 | 9.9% |
Latin | 14 | 4.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 38 | 14.1% |
유 | 32 | 11.9% |
소 | 31 | 11.5% |
오 | 11 | 4.1% |
산 | 10 | 3.7% |
에 | 9 | 3.3% |
지 | 8 | 3.0% |
영 | 7 | 2.6% |
너 | 7 | 2.6% |
대 | 6 | 2.2% |
Other values (70) | 110 |
Latin
Value | Count | Frequency (%) |
K | 3 | |
s | 2 | |
S | 2 | |
H | 2 | |
k | 1 | 7.1% |
f | 1 | 7.1% |
l | 1 | 7.1% |
e | 1 | 7.1% |
G | 1 | 7.1% |
Common
Value | Count | Frequency (%) |
) | 11 | |
( | 11 | |
8 | ||
2 | 1 | 3.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 267 | |
ASCII | 45 | 14.3% |
None | 2 | 0.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 38 | 14.2% |
유 | 32 | 12.0% |
소 | 31 | 11.6% |
오 | 11 | 4.1% |
산 | 10 | 3.7% |
에 | 9 | 3.4% |
지 | 8 | 3.0% |
영 | 7 | 2.6% |
너 | 7 | 2.6% |
대 | 6 | 2.2% |
Other values (69) | 108 |
ASCII
Value | Count | Frequency (%) |
) | 11 | |
( | 11 | |
8 | ||
K | 3 | 6.7% |
s | 2 | 4.4% |
S | 2 | 4.4% |
H | 2 | 4.4% |
k | 1 | 2.2% |
f | 1 | 2.2% |
l | 1 | 2.2% |
Other values (3) | 3 | 6.7% |
None
Value | Count | Frequency (%) |
㈜ | 2 |
성명(법인명)
Text
MISSING
 
Distinct | 28 |
---|---|
Distinct (%) | 84.8% |
Missing | 9 |
Missing (%) | 21.4% |
Memory size | 468.0 B |
Value | Count | Frequency (%) |
조정득 | 2 | 6.1% |
주영민 | 2 | 6.1% |
송준원 | 2 | 6.1% |
이시영 | 2 | 6.1% |
조경목 | 2 | 6.1% |
현오승 | 1 | 3.0% |
김회관 | 1 | 3.0% |
김태형 | 1 | 3.0% |
장지수 | 1 | 3.0% |
김복선 | 1 | 3.0% |
Other values (18) | 18 |
Most occurring characters
Value | Count | Frequency (%) |
김 | 8 | 8.1% |
영 | 5 | 5.1% |
이 | 5 | 5.1% |
조 | 4 | 4.0% |
정 | 4 | 4.0% |
민 | 4 | 4.0% |
준 | 4 | 4.0% |
박 | 4 | 4.0% |
주 | 3 | 3.0% |
형 | 3 | 3.0% |
Other values (37) | 55 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 99 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 8 | 8.1% |
영 | 5 | 5.1% |
이 | 5 | 5.1% |
조 | 4 | 4.0% |
정 | 4 | 4.0% |
민 | 4 | 4.0% |
준 | 4 | 4.0% |
박 | 4 | 4.0% |
주 | 3 | 3.0% |
형 | 3 | 3.0% |
Other values (37) | 55 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 99 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 8 | 8.1% |
영 | 5 | 5.1% |
이 | 5 | 5.1% |
조 | 4 | 4.0% |
정 | 4 | 4.0% |
민 | 4 | 4.0% |
준 | 4 | 4.0% |
박 | 4 | 4.0% |
주 | 3 | 3.0% |
형 | 3 | 3.0% |
Other values (37) | 55 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 99 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
김 | 8 | 8.1% |
영 | 5 | 5.1% |
이 | 5 | 5.1% |
조 | 4 | 4.0% |
정 | 4 | 4.0% |
민 | 4 | 4.0% |
준 | 4 | 4.0% |
박 | 4 | 4.0% |
주 | 3 | 3.0% |
형 | 3 | 3.0% |
Other values (37) | 55 |
사업장소재지
Text
MISSING
 
Distinct | 33 |
---|---|
Distinct (%) | 100.0% |
Missing | 9 |
Missing (%) | 21.4% |
Memory size | 468.0 B |
Length
Max length | 16 |
---|---|
Median length | 8 |
Mean length | 8.2424242 |
Min length | 6 |
Characters and Unicode
Total characters | 272 |
---|---|
Distinct characters | 45 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 33 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 남부대로 10 |
---|---|
2nd row | 외삼미로 162-12 |
3rd row | 경기대로 587 |
4th row | 남부대로 354 |
5th row | 경기대로 317 |
Value | Count | Frequency (%) |
경기대로 | 12 | 18.2% |
남부대로 | 5 | 7.6% |
문시로 | 2 | 3.0% |
동부대로 | 2 | 3.0% |
원동로 | 2 | 3.0% |
수도권제2순환고속도로 | 2 | 3.0% |
129 | 1 | 1.5% |
13-1 | 1 | 1.5% |
127 | 1 | 1.5% |
가장로 | 1 | 1.5% |
Other values (37) | 37 |
Most occurring characters
Value | Count | Frequency (%) |
37 | 13.6% | |
로 | 33 | 12.1% |
1 | 20 | 7.4% |
대 | 19 | 7.0% |
4 | 13 | 4.8% |
2 | 13 | 4.8% |
경 | 12 | 4.4% |
기 | 12 | 4.4% |
5 | 9 | 3.3% |
7 | 9 | 3.3% |
Other values (35) | 95 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 135 | |
Decimal Number | 96 | |
Space Separator | 37 | 13.6% |
Dash Punctuation | 4 | 1.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 33 | |
대 | 19 | |
경 | 12 | 8.9% |
기 | 12 | 8.9% |
부 | 7 | 5.2% |
남 | 5 | 3.7% |
동 | 5 | 3.7% |
도 | 4 | 3.0% |
산 | 3 | 2.2% |
제 | 2 | 1.5% |
Other values (23) | 33 |
Decimal Number
Value | Count | Frequency (%) |
1 | 20 | |
4 | 13 | |
2 | 13 | |
5 | 9 | |
7 | 9 | |
6 | 8 | 8.3% |
3 | 8 | 8.3% |
0 | 7 | 7.3% |
9 | 5 | 5.2% |
8 | 4 | 4.2% |
Space Separator
Value | Count | Frequency (%) |
37 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 137 | |
Hangul | 135 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 33 | |
대 | 19 | |
경 | 12 | 8.9% |
기 | 12 | 8.9% |
부 | 7 | 5.2% |
남 | 5 | 3.7% |
동 | 5 | 3.7% |
도 | 4 | 3.0% |
산 | 3 | 2.2% |
제 | 2 | 1.5% |
Other values (23) | 33 |
Common
Value | Count | Frequency (%) |
37 | ||
1 | 20 | |
4 | 13 | 9.5% |
2 | 13 | 9.5% |
5 | 9 | 6.6% |
7 | 9 | 6.6% |
6 | 8 | 5.8% |
3 | 8 | 5.8% |
0 | 7 | 5.1% |
9 | 5 | 3.6% |
Other values (2) | 8 | 5.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 137 | |
Hangul | 135 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
37 | ||
1 | 20 | |
4 | 13 | 9.5% |
2 | 13 | 9.5% |
5 | 9 | 6.6% |
7 | 9 | 6.6% |
6 | 8 | 5.8% |
3 | 8 | 5.8% |
0 | 7 | 5.1% |
9 | 5 | 3.6% |
Other values (2) | 8 | 5.8% |
Hangul
Value | Count | Frequency (%) |
로 | 33 | |
대 | 19 | |
경 | 12 | 8.9% |
기 | 12 | 8.9% |
부 | 7 | 5.2% |
남 | 5 | 3.7% |
동 | 5 | 3.7% |
도 | 4 | 3.0% |
산 | 3 | 2.2% |
제 | 2 | 1.5% |
Other values (23) | 33 |
사업장연면적
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 32 |
---|---|
Distinct (%) | 97.0% |
Missing | 9 |
Missing (%) | 21.4% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 577.62121 |
Minimum | 121 |
---|---|
Maximum | 1991 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 510.0 B |
Quantile statistics
Minimum | 121 |
---|---|
5-th percentile | 134.84 |
Q1 | 253 |
median | 392.81 |
Q3 | 666.85 |
95-th percentile | 1673.4 |
Maximum | 1991 |
Range | 1870 |
Interquartile range (IQR) | 413.85 |
Descriptive statistics
Standard deviation | 515.20237 |
---|---|
Coefficient of variation (CV) | 0.8919381 |
Kurtosis | 1.5479665 |
Mean | 577.62121 |
Median Absolute Deviation (MAD) | 184.19 |
Skewness | 1.5917176 |
Sum | 19061.5 |
Variance | 265433.48 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
432.77 | 2 | 4.8% |
269.64 | 1 | 2.4% |
577.0 | 1 | 2.4% |
1991.0 | 1 | 2.4% |
993.0 | 1 | 2.4% |
1385.0 | 1 | 2.4% |
1848.0 | 1 | 2.4% |
1524.0 | 1 | 2.4% |
666.85 | 1 | 2.4% |
1557.0 | 1 | 2.4% |
Other values (22) | 22 | |
(Missing) | 9 |
Value | Count | Frequency (%) |
121.0 | 1 | |
127.1 | 1 | |
140.0 | 1 | |
140.8 | 1 | |
185.0 | 1 | |
186.14 | 1 | |
199.59 | 1 | |
235.5 | 1 | |
253.0 | 1 | |
269.64 | 1 |
Value | Count | Frequency (%) |
1991.0 | 1 | |
1848.0 | 1 | |
1557.0 | 1 | |
1524.0 | 1 | |
1385.0 | 1 | |
993.0 | 1 | |
855.72 | 1 | |
781.2 | 1 | |
666.85 | 1 | |
577.0 | 1 |
연번 | 상호 | 성명(법인명) | 사업장소재지 | 사업장연면적 | |
---|---|---|---|---|---|
연번 | 1.000 | 1.000 | 0.850 | 1.000 | 0.000 |
상호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
성명(법인명) | 0.850 | 1.000 | 1.000 | 1.000 | 0.000 |
사업장소재지 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
사업장연면적 | 0.000 | 1.000 | 0.000 | 1.000 | 1.000 |
연번 | 사업장연면적 | 업종 | |
---|---|---|---|
연번 | 1.000 | 0.356 | 1.000 |
사업장연면적 | 0.356 | 1.000 | 1.000 |
업종 | 1.000 | 1.000 | 1.000 |
연번 | 업종 | 상호 | 성명(법인명) | 사업장소재지 | 사업장연면적 | |
---|---|---|---|---|---|---|
0 | 1 | 주유소 | (주)양지 남부대로주유소 | 이길준 | 남부대로 10 | 283.0 |
1 | 2 | 주유소 | 동탄세마주유소 | 엄광식 | 외삼미로 162-12 | 253.0 |
2 | 3 | 주유소 | 대명에너지(해솔) | 이시영 | 경기대로 587 | 781.2 |
3 | 4 | 주유소 | ㈜다원에너지직영 영일주유소 | 조정득 | 남부대로 354 | 408.54 |
4 | 5 | 주유소 | SK에너지(주)운암뜰 주유소 | 조경목 | 경기대로 317 | 379.05 |
5 | 6 | 주유소 | 차사랑주유소 | 이희광 | 경기대로 296 | 480.6 |
6 | 7 | 주유소 | 오산태양주유소 | 채선일 | 동부대로 574 | 392.81 |
7 | 8 | 주유소 | 한일주유소 | 김연분 | 원동로 47 | 235.5 |
8 | 9 | 주유소 | 오산제일주유소 | 김경수 | 원동로 74 | 855.72 |
9 | 10 | 주유소 | 온새미주유소 | 백주현 | 남부대로 482 | 354.37 |
연번 | 업종 | 상호 | 성명(법인명) | 사업장소재지 | 사업장연면적 | |
---|---|---|---|---|---|---|
32 | 33 | 주유소 | 대복제2주유소 | 김태형 | 남부대로 511 | 577.0 |
33 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
34 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
35 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
36 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
37 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
38 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
39 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
40 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
41 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
연번 | 업종 | 상호 | 성명(법인명) | 사업장소재지 | 사업장연면적 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 9 |