Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 706 |
Missing cells | 36 |
Missing cells (%) | 0.8% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.1% |
Total size in memory | 33.9 KiB |
Average record size in memory | 49.2 B |
Variable types
Numeric | 1 |
---|---|
Text | 2 |
Categorical | 2 |
DateTime | 1 |
Dataset
Description | 대전광역시 동구 담배소매인 지정업소 현황에 관한 데이터로서, 업소명, 업소주소 및 지정일자 등의 정보를 포함하고 있습니다. |
---|---|
Author | 대전광역시 동구 |
URL | https://www.data.go.kr/data/15030121/fileData.do |
Dataset has 1 (0.1%) duplicate rows | Duplicates |
소매인구분 is highly overall correlated with 데이터기준일자 | High correlation |
데이터기준일자 is highly overall correlated with 연번 and 1 other fields | High correlation |
연번 is highly overall correlated with 데이터기준일자 | High correlation |
소매인구분 is highly imbalanced (52.5%) | Imbalance |
데이터기준일자 is highly imbalanced (90.1%) | Imbalance |
연번 has 9 (1.3%) missing values | Missing |
업소명 has 9 (1.3%) missing values | Missing |
업소주소 has 9 (1.3%) missing values | Missing |
지정일자 has 9 (1.3%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 22:52:15.955538 |
---|---|
Analysis finished | 2023-12-12 22:52:16.884634 |
Duration | 0.93 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 697 |
---|---|
Distinct (%) | 100.0% |
Missing | 9 |
Missing (%) | 1.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 349 |
Minimum | 1 |
---|---|
Maximum | 697 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 35.8 |
Q1 | 175 |
median | 349 |
Q3 | 523 |
95-th percentile | 662.2 |
Maximum | 697 |
Range | 696 |
Interquartile range (IQR) | 348 |
Descriptive statistics
Standard deviation | 201.35085 |
---|---|
Coefficient of variation (CV) | 0.57693655 |
Kurtosis | -1.2 |
Mean | 349 |
Median Absolute Deviation (MAD) | 174 |
Skewness | 0 |
Sum | 243253 |
Variance | 40542.167 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
469 | 1 | 0.1% |
461 | 1 | 0.1% |
462 | 1 | 0.1% |
463 | 1 | 0.1% |
464 | 1 | 0.1% |
465 | 1 | 0.1% |
466 | 1 | 0.1% |
467 | 1 | 0.1% |
468 | 1 | 0.1% |
470 | 1 | 0.1% |
Other values (687) | 687 | |
(Missing) | 9 | 1.3% |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
697 | 1 | |
696 | 1 | |
695 | 1 | |
694 | 1 | |
693 | 1 | |
692 | 1 | |
691 | 1 | |
690 | 1 | |
689 | 1 | |
688 | 1 |
업소명
Text
MISSING
 
Distinct | 683 |
---|---|
Distinct (%) | 98.0% |
Missing | 9 |
Missing (%) | 1.3% |
Memory size | 5.6 KiB |
Length
Max length | 25 |
---|---|
Median length | 19 |
Mean length | 7.8593974 |
Min length | 1 |
Characters and Unicode
Total characters | 5478 |
---|---|
Distinct characters | 415 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 670 ? |
---|---|
Unique (%) | 96.1% |
Sample
1st row | 지에스25 가오중앙점 |
---|---|
2nd row | 세븐일레븐 대전용전원룸점 |
3rd row | 이마트24 R 대전용전한빛점 |
4th row | 지에스25 복합터미널 2호점 |
5th row | 지에스25 대전한남대점 |
Value | Count | Frequency (%) |
씨유 | 49 | 5.0% |
세븐일레븐 | 37 | 3.8% |
지에스25 | 32 | 3.3% |
이마트24 | 30 | 3.0% |
gs25 | 12 | 1.2% |
주)코리아세븐 | 10 | 1.0% |
주식회사 | 8 | 0.8% |
지에스25(gs25 | 8 | 0.8% |
미니스톱 | 6 | 0.6% |
대전가오점 | 5 | 0.5% |
Other values (729) | 787 |
Most occurring characters
Value | Count | Frequency (%) |
293 | 5.3% | |
대 | 270 | 4.9% |
점 | 261 | 4.8% |
전 | 239 | 4.4% |
마 | 190 | 3.5% |
트 | 177 | 3.2% |
2 | 120 | 2.2% |
스 | 111 | 2.0% |
븐 | 87 | 1.6% |
유 | 83 | 1.5% |
Other values (405) | 3647 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4683 | |
Space Separator | 293 | 5.3% |
Decimal Number | 258 | 4.7% |
Uppercase Letter | 107 | 2.0% |
Close Punctuation | 53 | 1.0% |
Open Punctuation | 53 | 1.0% |
Lowercase Letter | 29 | 0.5% |
Other Punctuation | 1 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
대 | 270 | 5.8% |
점 | 261 | 5.6% |
전 | 239 | 5.1% |
마 | 190 | 4.1% |
트 | 177 | 3.8% |
스 | 111 | 2.4% |
븐 | 87 | 1.9% |
유 | 83 | 1.8% |
이 | 82 | 1.8% |
퍼 | 79 | 1.7% |
Other values (364) | 3104 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 32 | |
G | 29 | |
I | 7 | 6.5% |
C | 6 | 5.6% |
R | 5 | 4.7% |
Y | 4 | 3.7% |
K | 4 | 3.7% |
M | 3 | 2.8% |
L | 3 | 2.8% |
B | 2 | 1.9% |
Other values (8) | 12 | 11.2% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 5 | |
o | 5 | |
e | 5 | |
l | 2 | 6.9% |
r | 2 | 6.9% |
k | 2 | 6.9% |
w | 2 | 6.9% |
t | 2 | 6.9% |
c | 2 | 6.9% |
m | 1 | 3.4% |
Decimal Number
Value | Count | Frequency (%) |
2 | 120 | |
5 | 75 | |
4 | 46 | 17.8% |
1 | 7 | 2.7% |
0 | 6 | 2.3% |
3 | 3 | 1.2% |
6 | 1 | 0.4% |
Space Separator
Value | Count | Frequency (%) |
293 |
Close Punctuation
Value | Count | Frequency (%) |
) | 53 |
Open Punctuation
Value | Count | Frequency (%) |
( | 53 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4683 | |
Common | 659 | 12.0% |
Latin | 136 | 2.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
대 | 270 | 5.8% |
점 | 261 | 5.6% |
전 | 239 | 5.1% |
마 | 190 | 4.1% |
트 | 177 | 3.8% |
스 | 111 | 2.4% |
븐 | 87 | 1.9% |
유 | 83 | 1.8% |
이 | 82 | 1.8% |
퍼 | 79 | 1.7% |
Other values (364) | 3104 |
Latin
Value | Count | Frequency (%) |
S | 32 | |
G | 29 | |
I | 7 | 5.1% |
C | 6 | 4.4% |
s | 5 | 3.7% |
R | 5 | 3.7% |
o | 5 | 3.7% |
e | 5 | 3.7% |
Y | 4 | 2.9% |
K | 4 | 2.9% |
Other values (19) | 34 |
Common
Value | Count | Frequency (%) |
293 | ||
2 | 120 | |
5 | 75 | 11.4% |
) | 53 | 8.0% |
( | 53 | 8.0% |
4 | 46 | 7.0% |
1 | 7 | 1.1% |
0 | 6 | 0.9% |
3 | 3 | 0.5% |
. | 1 | 0.2% |
Other values (2) | 2 | 0.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4683 | |
ASCII | 795 | 14.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
293 | ||
2 | 120 | |
5 | 75 | 9.4% |
) | 53 | 6.7% |
( | 53 | 6.7% |
4 | 46 | 5.8% |
S | 32 | 4.0% |
G | 29 | 3.6% |
I | 7 | 0.9% |
1 | 7 | 0.9% |
Other values (31) | 80 | 10.1% |
Hangul
Value | Count | Frequency (%) |
대 | 270 | 5.8% |
점 | 261 | 5.6% |
전 | 239 | 5.1% |
마 | 190 | 4.1% |
트 | 177 | 3.8% |
스 | 111 | 2.4% |
븐 | 87 | 1.9% |
유 | 83 | 1.8% |
이 | 82 | 1.8% |
퍼 | 79 | 1.7% |
Other values (364) | 3104 |
업소주소
Text
MISSING
 
Distinct | 684 |
---|---|
Distinct (%) | 98.1% |
Missing | 9 |
Missing (%) | 1.3% |
Memory size | 5.6 KiB |
Length
Max length | 47 |
---|---|
Median length | 38 |
Mean length | 20.466284 |
Min length | 15 |
Characters and Unicode
Total characters | 14265 |
---|---|
Distinct characters | 222 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 674 ? |
---|---|
Unique (%) | 96.7% |
Sample
1st row | 대전광역시 동구 가오동 654 굿모닝타운 |
---|---|
2nd row | 대전광역시 동구 용전동 125-23 |
3rd row | 대전광역시 동구 용전동 26-1 |
4th row | 대전광역시 동구 용전동 63-3 대전복합터미널(서관) |
5th row | 대전광역시 동구 홍도동 78-11 |
Value | Count | Frequency (%) |
대전광역시 | 697 | |
동구 | 697 | |
가양동 | 95 | 3.1% |
용전동 | 79 | 2.6% |
용운동 | 57 | 1.8% |
1층 | 55 | 1.8% |
자양동 | 46 | 1.5% |
삼성동 | 42 | 1.4% |
성남동 | 41 | 1.3% |
판암동 | 35 | 1.1% |
Other values (832) | 1242 |
Most occurring characters
Value | Count | Frequency (%) |
2777 | ||
동 | 1435 | 10.1% |
전 | 799 | 5.6% |
대 | 783 | 5.5% |
1 | 750 | 5.3% |
시 | 711 | 5.0% |
구 | 706 | 4.9% |
역 | 703 | 4.9% |
광 | 697 | 4.9% |
- | 590 | 4.1% |
Other values (212) | 4314 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 7783 | |
Decimal Number | 3059 | 21.4% |
Space Separator | 2777 | 19.5% |
Dash Punctuation | 590 | 4.1% |
Other Punctuation | 15 | 0.1% |
Uppercase Letter | 15 | 0.1% |
Close Punctuation | 12 | 0.1% |
Open Punctuation | 12 | 0.1% |
Math Symbol | 1 | < 0.1% |
Lowercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 1435 | |
전 | 799 | |
대 | 783 | |
시 | 711 | |
구 | 706 | |
역 | 703 | |
광 | 697 | |
가 | 170 | 2.2% |
양 | 152 | 2.0% |
용 | 140 | 1.8% |
Other values (184) | 1487 |
Decimal Number
Value | Count | Frequency (%) |
1 | 750 | |
2 | 394 | |
3 | 328 | |
4 | 296 | 9.7% |
0 | 253 | 8.3% |
5 | 248 | 8.1% |
6 | 244 | 8.0% |
7 | 202 | 6.6% |
9 | 178 | 5.8% |
8 | 166 | 5.4% |
Uppercase Letter
Value | Count | Frequency (%) |
E | 3 | |
H | 2 | |
L | 2 | |
W | 2 | |
A | 1 | 6.7% |
K | 1 | 6.7% |
S | 1 | 6.7% |
V | 1 | 6.7% |
I | 1 | 6.7% |
C | 1 | 6.7% |
Other Punctuation
Value | Count | Frequency (%) |
. | 14 | |
/ | 1 | 6.7% |
Space Separator
Value | Count | Frequency (%) |
2777 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 590 |
Close Punctuation
Value | Count | Frequency (%) |
) | 12 |
Open Punctuation
Value | Count | Frequency (%) |
( | 12 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 7783 | |
Common | 6466 | |
Latin | 16 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 1435 | |
전 | 799 | |
대 | 783 | |
시 | 711 | |
구 | 706 | |
역 | 703 | |
광 | 697 | |
가 | 170 | 2.2% |
양 | 152 | 2.0% |
용 | 140 | 1.8% |
Other values (184) | 1487 |
Common
Value | Count | Frequency (%) |
2777 | ||
1 | 750 | 11.6% |
- | 590 | 9.1% |
2 | 394 | 6.1% |
3 | 328 | 5.1% |
4 | 296 | 4.6% |
0 | 253 | 3.9% |
5 | 248 | 3.8% |
6 | 244 | 3.8% |
7 | 202 | 3.1% |
Other values (7) | 384 | 5.9% |
Latin
Value | Count | Frequency (%) |
E | 3 | |
H | 2 | |
L | 2 | |
W | 2 | |
A | 1 | 6.2% |
K | 1 | 6.2% |
e | 1 | 6.2% |
S | 1 | 6.2% |
V | 1 | 6.2% |
I | 1 | 6.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 7783 | |
ASCII | 6482 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2777 | ||
1 | 750 | 11.6% |
- | 590 | 9.1% |
2 | 394 | 6.1% |
3 | 328 | 5.1% |
4 | 296 | 4.6% |
0 | 253 | 3.9% |
5 | 248 | 3.8% |
6 | 244 | 3.8% |
7 | 202 | 3.1% |
Other values (18) | 400 | 6.2% |
Hangul
Value | Count | Frequency (%) |
동 | 1435 | |
전 | 799 | |
대 | 783 | |
시 | 711 | |
구 | 706 | |
역 | 703 | |
광 | 697 | |
가 | 170 | 2.2% |
양 | 152 | 2.0% |
용 | 140 | 1.8% |
Other values (184) | 1487 |
소매인구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.6 KiB |
일반소매인 | |
---|---|
구내소매인 | |
<NA> | 9 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9872521 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반소매인 |
---|---|
2nd row | 일반소매인 |
3rd row | 일반소매인 |
4th row | 일반소매인 |
5th row | 일반소매인 |
Common Values
Value | Count | Frequency (%) |
일반소매인 | 577 | |
구내소매인 | 120 | 17.0% |
<NA> | 9 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반소매인 | 577 | |
구내소매인 | 120 | 17.0% |
na | 9 | 1.3% |
지정일자
Date
MISSING
 
Distinct | 602 |
---|---|
Distinct (%) | 86.4% |
Missing | 9 |
Missing (%) | 1.3% |
Memory size | 5.6 KiB |
Minimum | 1970-07-01 00:00:00 |
---|---|
Maximum | 2023-02-17 00:00:00 |
데이터기준일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.6 KiB |
2023-02-20 | |
---|---|
<NA> | 9 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.9235127 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-02-20 |
---|---|
2nd row | 2023-02-20 |
3rd row | 2023-02-20 |
4th row | 2023-02-20 |
5th row | 2023-02-20 |
Common Values
Value | Count | Frequency (%) |
2023-02-20 | 697 | |
<NA> | 9 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-02-20 | 697 | |
na | 9 | 1.3% |
연번 | 소매인구분 | |
---|---|---|
연번 | 1.000 | 0.101 |
소매인구분 | 0.101 | 1.000 |
소매인구분 | 데이터기준일자 | |
---|---|---|
소매인구분 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 |
연번 | 소매인구분 | 데이터기준일자 | |
---|---|---|---|
연번 | 1.000 | 0.077 | 1.000 |
소매인구분 | 0.077 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 |
연번 | 업소명 | 업소주소 | 소매인구분 | 지정일자 | 데이터기준일자 | |
---|---|---|---|---|---|---|
0 | 1 | 지에스25 가오중앙점 | 대전광역시 동구 가오동 654 굿모닝타운 | 일반소매인 | 2023-02-17 | 2023-02-20 |
1 | 2 | 세븐일레븐 대전용전원룸점 | 대전광역시 동구 용전동 125-23 | 일반소매인 | 2023-02-07 | 2023-02-20 |
2 | 3 | 이마트24 R 대전용전한빛점 | 대전광역시 동구 용전동 26-1 | 일반소매인 | 2023-02-06 | 2023-02-20 |
3 | 4 | 지에스25 복합터미널 2호점 | 대전광역시 동구 용전동 63-3 대전복합터미널(서관) | 일반소매인 | 2023-02-02 | 2023-02-20 |
4 | 5 | 지에스25 대전한남대점 | 대전광역시 동구 홍도동 78-11 | 일반소매인 | 2023-01-27 | 2023-02-20 |
5 | 6 | 씨스페이스 대전용운점 | 대전광역시 동구 용운동 317-11 | 일반소매인 | 2023-01-18 | 2023-02-20 |
6 | 7 | 전자담배 애드 | 대전광역시 동구 용전동 117-1 | 일반소매인 | 2023-01-12 | 2023-02-20 |
7 | 8 | 대전동구청직장상조회 | 대전광역시 동구 가오동 425 동구청 | 구내소매인 | 2023-01-10 | 2023-02-20 |
8 | 9 | 터미널전자담배 | 대전광역시 동구 용전동 63-3 대전복합터미널(서관) | 구내소매인 | 2023-01-06 | 2023-02-20 |
9 | 10 | 세븐일레븐 대전용전해피점 | 대전광역시 동구 용전동 177-7 용전빌라 | 일반소매인 | 2023-01-05 | 2023-02-20 |
연번 | 업소명 | 업소주소 | 소매인구분 | 지정일자 | 데이터기준일자 | |
---|---|---|---|---|---|---|
696 | 697 | 북권판매소 | 대전광역시 동구 대1동 152-5 | 일반소매인 | 1970-07-01 | 2023-02-20 |
697 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
698 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
699 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
700 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
701 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
702 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
703 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
704 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
705 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
연번 | 업소명 | 업소주소 | 소매인구분 | 지정일자 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 9 |