gimi9 Pandas Profiling

Dataset statistics

Number of variables	3
Number of observations	79
Missing cells	0
Missing cells (%)	0.0%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	2.1 KiB
Average record size in memory	26.7 B

Variable types

Numeric	1
Categorical	1
Text	1

Dataset

Description	JDC지정면세점의 2016.08부터 2017.04까지의 브랜드 언급 월별순위 데이터
Author	제주국제자유도시개발센터
URL	https://www.data.go.kr/data/15070427/fileData.do

Reproduction

Analysis started	2023-12-12 00:57:57.816341
Analysis finished	2023-12-12 00:57:58.317459
Duration	0.5 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

순위
Real number (ℝ)

Distinct	10
Distinct (%)	12.7%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	5.443038

Minimum	1
Maximum	10
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	843.0 B

Quantile statistics

Minimum	1
5-th percentile	1
Q1	3
median	5
Q3	8
95-th percentile	10
Maximum	10
Range	9
Interquartile range (IQR)	5

Descriptive statistics

Standard deviation	2.8633262
Coefficient of variation (CV)	0.52605295
Kurtosis	-1.2134465
Mean	5.443038
Median Absolute Deviation (MAD)	2
Skewness	0.010180947
Sum	430
Variance	8.1986368
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=10)

Value	Count	Frequency (%)
1	8	10.1%
2	8	10.1%
3	8	10.1%
4	8	10.1%
5	8	10.1%
6	8	10.1%
7	8	10.1%
8	8	10.1%
9	8	10.1%
10	7	8.9%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
1	8	10.1%
2	8	10.1%
3	8	10.1%
4	8	10.1%
5	8	10.1%
6	8	10.1%
7	8	10.1%
8	8	10.1%
9	8	10.1%
10	7	8.9%

Value	Count	Frequency (%)
10	7	8.9%
9	8	10.1%
8	8	10.1%
7	8	10.1%
6	8	10.1%
5	8	10.1%
4	8	10.1%
3	8	10.1%
2	8	10.1%
1	8	10.1%

품목
Categorical

Distinct	8
Distinct (%)	10.1%
Missing	0
Missing (%)	0.0%
Memory size	764.0 B

화장품	10
식품/건강	10
패션잡화	10
주류	10
향수	10
Other values (3)	29

Length

Max length	5
Median length	4
Mean length	3.0126582
Min length	2

Unique

Unique	0 ?
Unique (%)	0.0%

Sample

1st row	화장품
2nd row	화장품
3rd row	화장품
4th row	화장품
5th row	화장품

Common Values

Value	Count	Frequency (%)
화장품	10	12.7%
식품/건강	10	12.7%
패션잡화	10	12.7%
주류	10	12.7%
향수	10	12.7%
액세서리	10	12.7%
시계	10	12.7%
담배	9	11.4%

Length

Histogram of lengths of the category

Common Values (Plot)

Value	Count	Frequency (%)
화장품	10	12.7%
식품/건강	10	12.7%
패션잡화	10	12.7%
주류	10	12.7%
향수	10	12.7%
액세서리	10	12.7%
시계	10	12.7%
담배	9	11.4%

키워드
Text

Distinct	40
Distinct (%)	50.6%
Missing	0
Missing (%)	0.0%
Memory size	764.0 B

Length

Max length	5
Median length	4
Mean length	3.3544304
Min length	2

Characters and Unicode

Total characters	265
Distinct characters	83
Distinct categories	1 ?
Distinct scripts	1 ?
Distinct blocks	1 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	25 ?
Unique (%)	31.6%

Sample

1st row	예쁘다
2nd row	저렴하다
3rd row	촉촉하다
4th row	발색
5th row	선물

Value	Count	Frequency (%)
선물	8	10.1%
저렴하다	8	10.1%
예쁘다	7	8.9%
고급스럽다	5	6.3%
데일리	3	3.8%
할인	3	3.8%
심플하다	3	3.8%
만족스럽다	3	3.8%
맛있다	2	2.5%
향기	2	2.5%
Other values (30)	35	44.3%

Most occurring characters

Value	Count	Frequency (%)
다	44	16.6%
하	20	7.5%
스	10	3.8%
럽	10	3.8%
선	8	3.0%
물	8	3.0%
저	8	3.0%
렴	8	3.0%
쁘	8	3.0%
예	7	2.6%
Other values (73)	134	50.6%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	265	100.0%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
다	44	16.6%
하	20	7.5%
스	10	3.8%
럽	10	3.8%
선	8	3.0%
물	8	3.0%
저	8	3.0%
렴	8	3.0%
쁘	8	3.0%
예	7	2.6%
Other values (73)	134	50.6%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	265	100.0%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
다	44	16.6%
하	20	7.5%
스	10	3.8%
럽	10	3.8%
선	8	3.0%
물	8	3.0%
저	8	3.0%
렴	8	3.0%
쁘	8	3.0%
예	7	2.6%
Other values (73)	134	50.6%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	265	100.0%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
다	44	16.6%
하	20	7.5%
스	10	3.8%
럽	10	3.8%
선	8	3.0%
물	8	3.0%
저	8	3.0%
렴	8	3.0%
쁘	8	3.0%
예	7	2.6%
Other values (73)	134	50.6%

순위

순위

Phik (φk)
Auto

Heatmap
Table

	순위	품목	키워드
순위	1.000	0.000	0.500
품목	0.000	1.000	0.000
키워드	0.500	0.000	1.000

Heatmap
Table

	순위	품목
순위	1.000	0.000
품목	0.000	1.000

Count
Matrix

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

First rows
Last rows

	순위	품목	키워드
0	1	화장품	예쁘다
1	2	화장품	저렴하다
2	3	화장품	촉촉하다
3	4	화장품	발색
4	5	화장품	선물
5	6	화장품	지속력
6	7	화장품	고급스럽다
7	8	화장품	데일리
8	9	화장품	향기
9	10	화장품	색상

	순위	품목	키워드
69	1	시계	예쁘다
70	2	시계	만족스럽다
71	3	시계	여성스럽다
72	4	시계	데일리
73	5	시계	선물
74	6	시계	할인
75	7	시계	심플하다
76	8	시계	클래식하다
77	9	시계	서현진시계
78	10	시계	저렴하다

Overview

Variables

Common Values

Length

Common Values (Plot)

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Most occurring scripts

Most frequent character per script

Hangul

Most occurring blocks

Most frequent character per block

Hangul

Interactions

Correlations

Missing values

Sample