Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 164 |
Missing cells | 244 |
Missing cells (%) | 29.8% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.6% |
Total size in memory | 6.7 KiB |
Average record size in memory | 41.8 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 1 |
Text | 2 |
DateTime | 1 |
Dataset
Description | 인천광역시 서구관내에 위치한 우유류판매업 현황(판매업구분명, 사업장명칭,소재지(도로명))정보를 담은 데이터파일입니다. |
---|---|
Author | 인천광역시 서구 |
URL | https://www.data.go.kr/data/15088817/fileData.do |
데이터기준일자 has constant value "" | Constant |
Dataset has 1 (0.6%) duplicate rows | Duplicates |
연번 is highly overall correlated with 판매업구분명 | High correlation |
판매업구분명 is highly overall correlated with 연번 | High correlation |
연번 has 61 (37.2%) missing values | Missing |
사업장명칭 has 61 (37.2%) missing values | Missing |
소재지 has 61 (37.2%) missing values | Missing |
데이터기준일자 has 61 (37.2%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 21:51:36.760500 |
---|---|
Analysis finished | 2023-12-12 21:51:38.066579 |
Duration | 1.31 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 103 |
---|---|
Distinct (%) | 100.0% |
Missing | 61 |
Missing (%) | 37.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 52 |
Minimum | 1 |
---|---|
Maximum | 103 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.6 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 6.1 |
Q1 | 26.5 |
median | 52 |
Q3 | 77.5 |
95-th percentile | 97.9 |
Maximum | 103 |
Range | 102 |
Interquartile range (IQR) | 51 |
Descriptive statistics
Standard deviation | 29.877528 |
---|---|
Coefficient of variation (CV) | 0.57456784 |
Kurtosis | -1.2 |
Mean | 52 |
Median Absolute Deviation (MAD) | 26 |
Skewness | 0 |
Sum | 5356 |
Variance | 892.66667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
2 | 1 | 0.6% |
77 | 1 | 0.6% |
76 | 1 | 0.6% |
75 | 1 | 0.6% |
74 | 1 | 0.6% |
73 | 1 | 0.6% |
72 | 1 | 0.6% |
71 | 1 | 0.6% |
70 | 1 | 0.6% |
69 | 1 | 0.6% |
Other values (93) | 93 | |
(Missing) | 61 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
103 | 1 | |
102 | 1 | |
101 | 1 | |
100 | 1 | |
99 | 1 | |
98 | 1 | |
97 | 1 | |
96 | 1 | |
95 | 1 | |
94 | 1 |
판매업구분명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.4 KiB |
우유류판매업 | |
---|---|
<NA> |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.2560976 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 우유류판매업 |
---|---|
2nd row | 우유류판매업 |
3rd row | 우유류판매업 |
4th row | 우유류판매업 |
5th row | 우유류판매업 |
Common Values
Value | Count | Frequency (%) |
우유류판매업 | 103 | |
<NA> | 61 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
우유류판매업 | 103 | |
na | 61 |
사업장명칭
Text
MISSING
 
Distinct | 100 |
---|---|
Distinct (%) | 97.1% |
Missing | 61 |
Missing (%) | 37.2% |
Memory size | 1.4 KiB |
Length
Max length | 18 |
---|---|
Median length | 13 |
Mean length | 8.8737864 |
Min length | 2 |
Characters and Unicode
Total characters | 914 |
---|---|
Distinct characters | 161 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 97 ? |
---|---|
Unique (%) | 94.2% |
Sample
1st row | 주)서울우유 석남1동2동 고객센터 |
---|---|
2nd row | 삼양대관령우유서인천특약점 |
3rd row | 건국우유가정보급소 |
4th row | 서울우유가정동고객센터 |
5th row | 에치와이 가좌점 |
Value | Count | Frequency (%) |
서울우유 | 9 | 6.2% |
남양유업 | 4 | 2.8% |
주식회사 | 4 | 2.8% |
에치와이 | 3 | 2.1% |
연세우유 | 3 | 2.1% |
청라대리점 | 2 | 1.4% |
주)에치와이 | 2 | 1.4% |
고객센터 | 2 | 1.4% |
원당고객센터 | 2 | 1.4% |
검단점 | 2 | 1.4% |
Other values (108) | 112 |
Most occurring characters
Value | Count | Frequency (%) |
유 | 62 | 6.8% |
점 | 44 | 4.8% |
우 | 43 | 4.7% |
42 | 4.6% | |
리 | 38 | 4.2% |
대 | 36 | 3.9% |
인 | 24 | 2.6% |
주 | 24 | 2.6% |
) | 22 | 2.4% |
서 | 21 | 2.3% |
Other values (151) | 558 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 823 | |
Space Separator | 42 | 4.6% |
Close Punctuation | 22 | 2.4% |
Open Punctuation | 19 | 2.1% |
Uppercase Letter | 4 | 0.4% |
Other Punctuation | 2 | 0.2% |
Decimal Number | 2 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
유 | 62 | 7.5% |
점 | 44 | 5.3% |
우 | 43 | 5.2% |
리 | 38 | 4.6% |
대 | 36 | 4.4% |
인 | 24 | 2.9% |
주 | 24 | 2.9% |
서 | 21 | 2.6% |
남 | 20 | 2.4% |
양 | 19 | 2.3% |
Other values (140) | 492 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 1 | |
F | 1 | |
D | 1 | |
S | 1 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 | |
. | 1 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 |
Space Separator
Value | Count | Frequency (%) |
42 |
Close Punctuation
Value | Count | Frequency (%) |
) | 22 |
Open Punctuation
Value | Count | Frequency (%) |
( | 19 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 823 | |
Common | 87 | 9.5% |
Latin | 4 | 0.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
유 | 62 | 7.5% |
점 | 44 | 5.3% |
우 | 43 | 5.2% |
리 | 38 | 4.6% |
대 | 36 | 4.4% |
인 | 24 | 2.9% |
주 | 24 | 2.9% |
서 | 21 | 2.6% |
남 | 20 | 2.4% |
양 | 19 | 2.3% |
Other values (140) | 492 |
Common
Value | Count | Frequency (%) |
42 | ||
) | 22 | |
( | 19 | |
& | 1 | 1.1% |
1 | 1 | 1.1% |
2 | 1 | 1.1% |
. | 1 | 1.1% |
Latin
Value | Count | Frequency (%) |
B | 1 | |
F | 1 | |
D | 1 | |
S | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 823 | |
ASCII | 91 | 10.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
유 | 62 | 7.5% |
점 | 44 | 5.3% |
우 | 43 | 5.2% |
리 | 38 | 4.6% |
대 | 36 | 4.4% |
인 | 24 | 2.9% |
주 | 24 | 2.9% |
서 | 21 | 2.6% |
남 | 20 | 2.4% |
양 | 19 | 2.3% |
Other values (140) | 492 |
ASCII
Value | Count | Frequency (%) |
42 | ||
) | 22 | |
( | 19 | |
B | 1 | 1.1% |
& | 1 | 1.1% |
F | 1 | 1.1% |
1 | 1 | 1.1% |
2 | 1 | 1.1% |
D | 1 | 1.1% |
S | 1 | 1.1% |
소재지
Text
MISSING
 
Distinct | 94 |
---|---|
Distinct (%) | 91.3% |
Missing | 61 |
Missing (%) | 37.2% |
Memory size | 1.4 KiB |
Length
Max length | 46 |
---|---|
Median length | 40 |
Mean length | 27.495146 |
Min length | 16 |
Characters and Unicode
Total characters | 2832 |
---|---|
Distinct characters | 143 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 86 ? |
---|---|
Unique (%) | 83.5% |
Sample
1st row | 인천광역시 서구 거북로119번길 20 (석남동) |
---|---|
2nd row | 인천광역시 서구 가정로138번길 18 (가좌동) |
3rd row | 인천광역시 서구 가정동 172-8 |
4th row | 인천광역시 서구 원창로229번길 30 (가정동) |
5th row | 인천광역시 서구 건지로284번길 15 (가좌동) |
Value | Count | Frequency (%) |
인천광역시 | 103 | |
서구 | 103 | |
가좌동 | 21 | 3.9% |
석남동 | 10 | 1.9% |
왕길동 | 7 | 1.3% |
가정동 | 7 | 1.3% |
1층 | 7 | 1.3% |
심곡동 | 7 | 1.3% |
연희동 | 6 | 1.1% |
금곡동 | 6 | 1.1% |
Other values (188) | 257 |
Most occurring characters
Value | Count | Frequency (%) |
471 | 16.6% | |
1 | 128 | 4.5% |
서 | 108 | 3.8% |
동 | 107 | 3.8% |
시 | 105 | 3.7% |
천 | 104 | 3.7% |
인 | 103 | 3.6% |
광 | 103 | 3.6% |
역 | 103 | 3.6% |
구 | 103 | 3.6% |
Other values (133) | 1397 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1581 | |
Decimal Number | 523 | 18.5% |
Space Separator | 471 | 16.6% |
Open Punctuation | 87 | 3.1% |
Close Punctuation | 87 | 3.1% |
Dash Punctuation | 48 | 1.7% |
Other Punctuation | 30 | 1.1% |
Uppercase Letter | 5 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 108 | 6.8% |
동 | 107 | 6.8% |
시 | 105 | 6.6% |
천 | 104 | 6.6% |
인 | 103 | 6.5% |
광 | 103 | 6.5% |
역 | 103 | 6.5% |
구 | 103 | 6.5% |
로 | 86 | 5.4% |
길 | 79 | 5.0% |
Other values (113) | 580 |
Decimal Number
Value | Count | Frequency (%) |
1 | 128 | |
2 | 73 | |
3 | 73 | |
0 | 48 | 9.2% |
5 | 40 | 7.6% |
4 | 39 | 7.5% |
8 | 38 | 7.3% |
6 | 32 | 6.1% |
7 | 27 | 5.2% |
9 | 25 | 4.8% |
Uppercase Letter
Value | Count | Frequency (%) |
G | 1 | |
J | 1 | |
S | 1 | |
C | 1 | |
A | 1 |
Space Separator
Value | Count | Frequency (%) |
471 |
Open Punctuation
Value | Count | Frequency (%) |
( | 87 |
Close Punctuation
Value | Count | Frequency (%) |
) | 87 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 48 |
Other Punctuation
Value | Count | Frequency (%) |
, | 30 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1581 | |
Common | 1246 | |
Latin | 5 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 108 | 6.8% |
동 | 107 | 6.8% |
시 | 105 | 6.6% |
천 | 104 | 6.6% |
인 | 103 | 6.5% |
광 | 103 | 6.5% |
역 | 103 | 6.5% |
구 | 103 | 6.5% |
로 | 86 | 5.4% |
길 | 79 | 5.0% |
Other values (113) | 580 |
Common
Value | Count | Frequency (%) |
471 | ||
1 | 128 | 10.3% |
( | 87 | 7.0% |
) | 87 | 7.0% |
2 | 73 | 5.9% |
3 | 73 | 5.9% |
0 | 48 | 3.9% |
- | 48 | 3.9% |
5 | 40 | 3.2% |
4 | 39 | 3.1% |
Other values (5) | 152 | 12.2% |
Latin
Value | Count | Frequency (%) |
G | 1 | |
J | 1 | |
S | 1 | |
C | 1 | |
A | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1581 | |
ASCII | 1251 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
471 | ||
1 | 128 | 10.2% |
( | 87 | 7.0% |
) | 87 | 7.0% |
2 | 73 | 5.8% |
3 | 73 | 5.8% |
0 | 48 | 3.8% |
- | 48 | 3.8% |
5 | 40 | 3.2% |
4 | 39 | 3.1% |
Other values (10) | 157 | 12.5% |
Hangul
Value | Count | Frequency (%) |
서 | 108 | 6.8% |
동 | 107 | 6.8% |
시 | 105 | 6.6% |
천 | 104 | 6.6% |
인 | 103 | 6.5% |
광 | 103 | 6.5% |
역 | 103 | 6.5% |
구 | 103 | 6.5% |
로 | 86 | 5.4% |
길 | 79 | 5.0% |
Other values (113) | 580 |
데이터기준일자
Date
CONSTANT
  MISSING
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 61 |
Missing (%) | 37.2% |
Memory size | 1.4 KiB |
Minimum | 2022-09-05 00:00:00 |
---|---|
Maximum | 2022-09-05 00:00:00 |
연번 | 사업장명칭 | 소재지 | |
---|---|---|---|
연번 | 1.000 | 0.835 | 0.886 |
사업장명칭 | 0.835 | 1.000 | 0.993 |
소재지 | 0.886 | 0.993 | 1.000 |
연번 | 판매업구분명 | |
---|---|---|
연번 | 1.000 | 1.000 |
판매업구분명 | 1.000 | 1.000 |
연번 | 판매업구분명 | 사업장명칭 | 소재지 | 데이터기준일자 | |
---|---|---|---|---|---|
0 | 1 | 우유류판매업 | 주)서울우유 석남1동2동 고객센터 | 인천광역시 서구 거북로119번길 20 (석남동) | 2022-09-05 |
1 | 2 | 우유류판매업 | 삼양대관령우유서인천특약점 | 인천광역시 서구 가정로138번길 18 (가좌동) | 2022-09-05 |
2 | 3 | 우유류판매업 | 건국우유가정보급소 | 인천광역시 서구 가정동 172-8 | 2022-09-05 |
3 | 4 | 우유류판매업 | 서울우유가정동고객센터 | 인천광역시 서구 원창로229번길 30 (가정동) | 2022-09-05 |
4 | 5 | 우유류판매업 | 에치와이 가좌점 | 인천광역시 서구 건지로284번길 15 (가좌동) | 2022-09-05 |
5 | 6 | 우유류판매업 | 연세우유 인천계양대리점 | 인천광역시 서구 청라에메랄드로163번길 3-12, 101호 (연희동) | 2022-09-05 |
6 | 7 | 우유류판매업 | 연세우유 인천연희대리점 | 인천광역시 서구 심곡로132번길 16(심곡동) | 2022-09-05 |
7 | 8 | 우유류판매업 | 서울우유 인천연희고객센터 | 인천광역시 서구 대평로56번길 17 (연희동) | 2022-09-05 |
8 | 9 | 우유류판매업 | 서울우유 원당고객센터 | 인천광역시 서구 봉수대로 1328-2, C동 101호 (왕길동) | 2022-09-05 |
9 | 10 | 우유류판매업 | 매일우유연희대리점 | 인천광역시 서구 가정동 169-9 | 2022-09-05 |
연번 | 판매업구분명 | 사업장명칭 | 소재지 | 데이터기준일자 | |
---|---|---|---|---|---|
154 | <NA> | <NA> | <NA> | <NA> | <NA> |
155 | <NA> | <NA> | <NA> | <NA> | <NA> |
156 | <NA> | <NA> | <NA> | <NA> | <NA> |
157 | <NA> | <NA> | <NA> | <NA> | <NA> |
158 | <NA> | <NA> | <NA> | <NA> | <NA> |
159 | <NA> | <NA> | <NA> | <NA> | <NA> |
160 | <NA> | <NA> | <NA> | <NA> | <NA> |
161 | <NA> | <NA> | <NA> | <NA> | <NA> |
162 | <NA> | <NA> | <NA> | <NA> | <NA> |
163 | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
연번 | 판매업구분명 | 사업장명칭 | 소재지 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | 61 |