Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 10000 |
Missing cells | 19966 |
Missing cells (%) | 66.6% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 312.5 KiB |
Average record size in memory | 32.0 B |
Variable types
Categorical | 1 |
---|---|
Text | 2 |
Dataset
Description | 전라남도 강진군 담배소매인 지정 현황에 대한 데이터로 민원구분(구내/일반), 업소명, 업소 주소, 업소 연락처에 대한 정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15035628/fileData.do |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
민원구분(구내_일반 등) is highly imbalanced (98.2%) | Imbalance |
업소명 has 9983 (99.8%) missing values | Missing |
업소 주소 has 9983 (99.8%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 23:27:03.769557 |
---|---|
Analysis finished | 2023-12-12 23:27:04.156648 |
Duration | 0.39 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
민원구분(구내_일반 등)
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
일반소매인 | 17 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.0017 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 9983 | |
일반소매인 | 17 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 9983 | |
일반소매인 | 17 | 0.2% |
업소명
Text
MISSING
 
Distinct | 17 |
---|---|
Distinct (%) | 100.0% |
Missing | 9983 |
Missing (%) | 99.8% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
이마트24 | 2 | 8.3% |
신흥마트 | 1 | 4.2% |
강진아뜨리움점 | 1 | 4.2% |
장안식당 | 1 | 4.2% |
정민마트 | 1 | 4.2% |
도암연쇄점 | 1 | 4.2% |
주작마트 | 1 | 4.2% |
강진lh점 | 1 | 4.2% |
cu | 1 | 4.2% |
월궁정류소 | 1 | 4.2% |
Other values (13) | 13 |
Most occurring characters
Value | Count | Frequency (%) |
점 | 8 | 7.0% |
7 | 6.1% | |
강 | 7 | 6.1% |
진 | 7 | 6.1% |
마 | 6 | 5.3% |
트 | 5 | 4.4% |
2 | 4 | 3.5% |
슈 | 3 | 2.6% |
퍼 | 3 | 2.6% |
스 | 2 | 1.8% |
Other values (54) | 62 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 88 | |
Uppercase Letter | 11 | 9.6% |
Decimal Number | 8 | 7.0% |
Space Separator | 7 | 6.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
점 | 8 | 9.1% |
강 | 7 | 8.0% |
진 | 7 | 8.0% |
마 | 6 | 6.8% |
트 | 5 | 5.7% |
슈 | 3 | 3.4% |
퍼 | 3 | 3.4% |
스 | 2 | 2.3% |
장 | 2 | 2.3% |
량 | 2 | 2.3% |
Other values (40) | 43 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 2 | |
C | 1 | |
U | 1 | |
L | 1 | |
H | 1 | |
G | 1 | |
M | 1 | |
A | 1 | |
R | 1 | |
T | 1 |
Decimal Number
Value | Count | Frequency (%) |
2 | 4 | |
5 | 2 | |
4 | 2 |
Space Separator
Value | Count | Frequency (%) |
7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 88 | |
Common | 15 | 13.2% |
Latin | 11 | 9.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
점 | 8 | 9.1% |
강 | 7 | 8.0% |
진 | 7 | 8.0% |
마 | 6 | 6.8% |
트 | 5 | 5.7% |
슈 | 3 | 3.4% |
퍼 | 3 | 3.4% |
스 | 2 | 2.3% |
장 | 2 | 2.3% |
량 | 2 | 2.3% |
Other values (40) | 43 |
Latin
Value | Count | Frequency (%) |
S | 2 | |
C | 1 | |
U | 1 | |
L | 1 | |
H | 1 | |
G | 1 | |
M | 1 | |
A | 1 | |
R | 1 | |
T | 1 |
Common
Value | Count | Frequency (%) |
7 | ||
2 | 4 | |
5 | 2 | 13.3% |
4 | 2 | 13.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 88 | |
ASCII | 26 | 22.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
점 | 8 | 9.1% |
강 | 7 | 8.0% |
진 | 7 | 8.0% |
마 | 6 | 6.8% |
트 | 5 | 5.7% |
슈 | 3 | 3.4% |
퍼 | 3 | 3.4% |
스 | 2 | 2.3% |
장 | 2 | 2.3% |
량 | 2 | 2.3% |
Other values (40) | 43 |
ASCII
Value | Count | Frequency (%) |
7 | ||
2 | 4 | |
5 | 2 | 7.7% |
S | 2 | 7.7% |
4 | 2 | 7.7% |
C | 1 | 3.8% |
U | 1 | 3.8% |
L | 1 | 3.8% |
H | 1 | 3.8% |
G | 1 | 3.8% |
Other values (4) | 4 |
업소 주소
Text
MISSING
 
Distinct | 17 |
---|---|
Distinct (%) | 100.0% |
Missing | 9983 |
Missing (%) | 99.8% |
Memory size | 156.2 KiB |
Length
Max length | 23 |
---|---|
Median length | 22 |
Mean length | 20.117647 |
Min length | 18 |
Characters and Unicode
Total characters | 342 |
---|---|
Distinct characters | 56 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 전라남도 강진군 강진읍 보은로4길 7 |
---|---|
2nd row | 전라남도 강진군 병영면 병영성로 107-6 |
3rd row | 전라남도 강진군 마량면 미항로 137 |
4th row | 전라남도 강진군 성전면 무위사로 2 |
5th row | 전라남도 강진군 강진읍 중앙로 152-2 |
Value | Count | Frequency (%) |
전라남도 | 17 | |
강진군 | 17 | |
강진읍 | 7 | 8.2% |
칠량면 | 3 | 3.5% |
성전면 | 3 | 3.5% |
칠량로 | 2 | 2.4% |
영랑로 | 2 | 2.4% |
18 | 1 | 1.2% |
77 | 1 | 1.2% |
월하안운길 | 1 | 1.2% |
Other values (31) | 31 |
Most occurring characters
Value | Count | Frequency (%) |
68 | ||
강 | 25 | 7.3% |
진 | 24 | 7.0% |
전 | 21 | 6.1% |
도 | 20 | 5.8% |
라 | 17 | 5.0% |
남 | 17 | 5.0% |
군 | 17 | 5.0% |
로 | 14 | 4.1% |
면 | 10 | 2.9% |
Other values (46) | 109 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 229 | |
Space Separator | 68 | 19.9% |
Decimal Number | 42 | 12.3% |
Dash Punctuation | 3 | 0.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
강 | 25 | |
진 | 24 | |
전 | 21 | 9.2% |
도 | 20 | 8.7% |
라 | 17 | 7.4% |
남 | 17 | 7.4% |
군 | 17 | 7.4% |
로 | 14 | 6.1% |
면 | 10 | 4.4% |
읍 | 7 | 3.1% |
Other values (34) | 57 |
Decimal Number
Value | Count | Frequency (%) |
1 | 10 | |
2 | 6 | |
7 | 6 | |
5 | 5 | |
3 | 4 | 9.5% |
8 | 3 | 7.1% |
0 | 3 | 7.1% |
6 | 2 | 4.8% |
9 | 2 | 4.8% |
4 | 1 | 2.4% |
Space Separator
Value | Count | Frequency (%) |
68 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 229 | |
Common | 113 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
강 | 25 | |
진 | 24 | |
전 | 21 | 9.2% |
도 | 20 | 8.7% |
라 | 17 | 7.4% |
남 | 17 | 7.4% |
군 | 17 | 7.4% |
로 | 14 | 6.1% |
면 | 10 | 4.4% |
읍 | 7 | 3.1% |
Other values (34) | 57 |
Common
Value | Count | Frequency (%) |
68 | ||
1 | 10 | 8.8% |
2 | 6 | 5.3% |
7 | 6 | 5.3% |
5 | 5 | 4.4% |
3 | 4 | 3.5% |
8 | 3 | 2.7% |
- | 3 | 2.7% |
0 | 3 | 2.7% |
6 | 2 | 1.8% |
Other values (2) | 3 | 2.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 229 | |
ASCII | 113 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
68 | ||
1 | 10 | 8.8% |
2 | 6 | 5.3% |
7 | 6 | 5.3% |
5 | 5 | 4.4% |
3 | 4 | 3.5% |
8 | 3 | 2.7% |
- | 3 | 2.7% |
0 | 3 | 2.7% |
6 | 2 | 1.8% |
Other values (2) | 3 | 2.7% |
Hangul
Value | Count | Frequency (%) |
강 | 25 | |
진 | 24 | |
전 | 21 | 9.2% |
도 | 20 | 8.7% |
라 | 17 | 7.4% |
남 | 17 | 7.4% |
군 | 17 | 7.4% |
로 | 14 | 6.1% |
면 | 10 | 4.4% |
읍 | 7 | 3.1% |
Other values (34) | 57 |
업소명 | 업소 주소 | |
---|---|---|
업소명 | 1.000 | 1.000 |
업소 주소 | 1.000 | 1.000 |
민원구분(구내_일반 등) | 업소명 | 업소 주소 | |
---|---|---|---|
11154 | <NA> | <NA> | <NA> |
43745 | <NA> | <NA> | <NA> |
19815 | <NA> | <NA> | <NA> |
50978 | <NA> | <NA> | <NA> |
32344 | <NA> | <NA> | <NA> |
35204 | <NA> | <NA> | <NA> |
20613 | <NA> | <NA> | <NA> |
23003 | <NA> | <NA> | <NA> |
29106 | <NA> | <NA> | <NA> |
14359 | <NA> | <NA> | <NA> |
민원구분(구내_일반 등) | 업소명 | 업소 주소 | |
---|---|---|---|
56114 | <NA> | <NA> | <NA> |
37412 | <NA> | <NA> | <NA> |
9845 | <NA> | <NA> | <NA> |
47523 | <NA> | <NA> | <NA> |
61999 | <NA> | <NA> | <NA> |
60590 | <NA> | <NA> | <NA> |
30719 | <NA> | <NA> | <NA> |
14197 | <NA> | <NA> | <NA> |
4044 | <NA> | <NA> | <NA> |
55389 | <NA> | <NA> | <NA> |
Most frequently occurring
민원구분(구내_일반 등) | 업소명 | 업소 주소 | # duplicates | |
---|---|---|---|---|
0 | <NA> | <NA> | <NA> | 9983 |