Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 63 |
Missing cells | 1 |
Missing cells (%) | 0.3% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.2 KiB |
Average record size in memory | 52.1 B |
Variable types
Categorical | 1 |
---|---|
Text | 2 |
Numeric | 2 |
Boolean | 1 |
Dataset
Description | 인천광역시시 화장품 제조기업 생산품(카테고리,제품명,용량정상가격(원),할인판매가(원),판매여부 등) 정보를 제공합니다 |
---|---|
Author | 인천광역시 |
URL | https://www.data.go.kr/data/3044187/fileData.do |
정상가격(원) is highly overall correlated with 할인판매가(원) and 1 other fields | High correlation |
할인판매가(원) is highly overall correlated with 정상가격(원) | High correlation |
판매여부 is highly overall correlated with 정상가격(원) | High correlation |
판매여부 is highly imbalanced (72.4%) | Imbalance |
용량 has 1 (1.6%) missing values | Missing |
제품명 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 20:16:48.552797 |
---|---|
Analysis finished | 2023-12-12 20:16:49.257513 |
Duration | 0.7 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
카테고리
Categorical
Distinct | 13 |
---|---|
Distinct (%) | 20.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 636.0 B |
팩&마스크 | |
---|---|
크림 | |
기능성 | |
클렌징 | |
헤어 | |
Other values (8) |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 3.4761905 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.6% |
Sample
1st row | 기초SET |
---|---|
2nd row | 기초SET |
3rd row | 기초SET |
4th row | 기초SET |
5th row | 팩&마스크 |
Common Values
Value | Count | Frequency (%) |
팩&마스크 | 9 | |
크림 | 8 | |
기능성 | 8 | |
클렌징 | 6 | |
헤어 | 6 | |
핸드,바디 | 5 | |
기초SET | 4 | |
세럼,수딩젤 | 4 | |
선케어 | 4 | |
베이비 | 3 | 4.8% |
Other values (3) | 6 |
Length
Value | Count | Frequency (%) |
팩&마스크 | 9 | |
크림 | 8 | |
기능성 | 8 | |
클렌징 | 6 | |
헤어 | 6 | |
핸드,바디 | 5 | |
기초set | 4 | |
세럼,수딩젤 | 4 | |
선케어 | 4 | |
베이비 | 3 | 4.8% |
Other values (3) | 6 |
제품명
Text
UNIQUE
 
Distinct | 63 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 636.0 B |
Length
Max length | 25 |
---|---|
Median length | 16 |
Mean length | 10.952381 |
Min length | 4 |
Characters and Unicode
Total characters | 690 |
---|---|
Distinct characters | 189 |
Distinct categories | 7 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 63 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 카놀라 로얄허니 기초세트 |
---|---|
2nd row | 진주5종(토너,에멀젼,에센스,크림,아이크림) |
3rd row | 홍삼 기초(토너, 에멀젼) |
4th row | 설안 5종 기초 세트 |
5th row | 꿀광 프리미엄 마스크팩 |
Value | Count | Frequency (%) |
크림 | 4 | 2.3% |
홍삼 | 4 | 2.3% |
린(潾 | 3 | 1.7% |
피부일기 | 3 | 1.7% |
마스크팩 | 3 | 1.7% |
프리미엄 | 3 | 1.7% |
마스크 | 3 | 1.7% |
오일 | 3 | 1.7% |
세럼 | 3 | 1.7% |
포리퓨어 | 3 | 1.7% |
Other values (127) | 144 |
Most occurring characters
Value | Count | Frequency (%) |
113 | 16.4% | |
스 | 28 | 4.1% |
크 | 23 | 3.3% |
리 | 16 | 2.3% |
트 | 16 | 2.3% |
이 | 15 | 2.2% |
림 | 13 | 1.9% |
어 | 12 | 1.7% |
, | 11 | 1.6% |
세 | 11 | 1.6% |
Other values (179) | 432 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 534 | |
Space Separator | 113 | 16.4% |
Other Punctuation | 12 | 1.7% |
Close Punctuation | 8 | 1.2% |
Open Punctuation | 8 | 1.2% |
Decimal Number | 8 | 1.2% |
Uppercase Letter | 7 | 1.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 28 | 5.2% |
크 | 23 | 4.3% |
리 | 16 | 3.0% |
트 | 16 | 3.0% |
이 | 15 | 2.8% |
림 | 13 | 2.4% |
어 | 12 | 2.2% |
세 | 11 | 2.1% |
마 | 11 | 2.1% |
아 | 10 | 1.9% |
Other values (167) | 379 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 4 | |
T | 1 | 14.3% |
E | 1 | 14.3% |
S | 1 | 14.3% |
Decimal Number
Value | Count | Frequency (%) |
3 | 4 | |
5 | 3 | |
4 | 1 | 12.5% |
Other Punctuation
Value | Count | Frequency (%) |
, | 11 | |
& | 1 | 8.3% |
Space Separator
Value | Count | Frequency (%) |
113 |
Close Punctuation
Value | Count | Frequency (%) |
) | 8 |
Open Punctuation
Value | Count | Frequency (%) |
( | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 531 | |
Common | 149 | 21.6% |
Latin | 7 | 1.0% |
Han | 3 | 0.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 28 | 5.3% |
크 | 23 | 4.3% |
리 | 16 | 3.0% |
트 | 16 | 3.0% |
이 | 15 | 2.8% |
림 | 13 | 2.4% |
어 | 12 | 2.3% |
세 | 11 | 2.1% |
마 | 11 | 2.1% |
아 | 10 | 1.9% |
Other values (166) | 376 |
Common
Value | Count | Frequency (%) |
113 | ||
, | 11 | 7.4% |
) | 8 | 5.4% |
( | 8 | 5.4% |
3 | 4 | 2.7% |
5 | 3 | 2.0% |
4 | 1 | 0.7% |
& | 1 | 0.7% |
Latin
Value | Count | Frequency (%) |
C | 4 | |
T | 1 | 14.3% |
E | 1 | 14.3% |
S | 1 | 14.3% |
Han
Value | Count | Frequency (%) |
潾 | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 531 | |
ASCII | 156 | 22.6% |
CJK | 3 | 0.4% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
113 | ||
, | 11 | 7.1% |
) | 8 | 5.1% |
( | 8 | 5.1% |
3 | 4 | 2.6% |
C | 4 | 2.6% |
5 | 3 | 1.9% |
T | 1 | 0.6% |
E | 1 | 0.6% |
S | 1 | 0.6% |
Other values (2) | 2 | 1.3% |
Hangul
Value | Count | Frequency (%) |
스 | 28 | 5.3% |
크 | 23 | 4.3% |
리 | 16 | 3.0% |
트 | 16 | 3.0% |
이 | 15 | 2.8% |
림 | 13 | 2.4% |
어 | 12 | 2.3% |
세 | 11 | 2.1% |
마 | 11 | 2.1% |
아 | 10 | 1.9% |
Other values (166) | 376 |
CJK
Value | Count | Frequency (%) |
潾 | 3 |
용량
Text
MISSING
 
Distinct | 36 |
---|---|
Distinct (%) | 58.1% |
Missing | 1 |
Missing (%) | 1.6% |
Memory size | 636.0 B |
Length
Max length | 17 |
---|---|
Median length | 16 |
Mean length | 6.1612903 |
Min length | 3 |
Characters and Unicode
Total characters | 382 |
---|---|
Distinct characters | 21 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 25 ? |
---|---|
Unique (%) | 40.3% |
Sample
1st row | 120ml,120ml,50ml |
---|---|
2nd row | 120ml, 50ml, 30ml |
3rd row | 120ml, 120ml |
4th row | 165ml,50ml,30ml |
5th row | 27ml*10 |
Value | Count | Frequency (%) |
50ml | 8 | 12.1% |
300ml | 5 | 7.6% |
100ml | 5 | 7.6% |
30ml | 5 | 7.6% |
150ml | 4 | 6.1% |
30mlx10개 | 3 | 4.5% |
120ml | 3 | 4.5% |
100g | 2 | 3.0% |
350ml | 2 | 3.0% |
200ml | 2 | 3.0% |
Other values (25) | 27 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 85 | |
m | 69 | |
l | 69 | |
1 | 32 | 8.4% |
5 | 31 | 8.1% |
3 | 19 | 5.0% |
2 | 18 | 4.7% |
, | 12 | 3.1% |
개 | 6 | 1.6% |
6 | 6 | 1.6% |
Other values (11) | 35 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 203 | |
Lowercase Letter | 151 | |
Other Punctuation | 18 | 4.7% |
Other Letter | 6 | 1.6% |
Space Separator | 4 | 1.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 85 | |
1 | 32 | 15.8% |
5 | 31 | 15.3% |
3 | 19 | 9.4% |
2 | 18 | 8.9% |
6 | 6 | 3.0% |
7 | 6 | 3.0% |
4 | 6 | 3.0% |
Lowercase Letter
Value | Count | Frequency (%) |
m | 69 | |
l | 69 | |
g | 5 | 3.3% |
x | 4 | 2.6% |
p | 1 | 0.7% |
a | 1 | 0.7% |
d | 1 | 0.7% |
s | 1 | 0.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 12 | |
* | 5 | |
/ | 1 | 5.6% |
Other Letter
Value | Count | Frequency (%) |
개 | 6 |
Space Separator
Value | Count | Frequency (%) |
4 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 225 | |
Latin | 151 | |
Hangul | 6 | 1.6% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 85 | |
1 | 32 | 14.2% |
5 | 31 | 13.8% |
3 | 19 | 8.4% |
2 | 18 | 8.0% |
, | 12 | 5.3% |
6 | 6 | 2.7% |
7 | 6 | 2.7% |
4 | 6 | 2.7% |
* | 5 | 2.2% |
Other values (2) | 5 | 2.2% |
Latin
Value | Count | Frequency (%) |
m | 69 | |
l | 69 | |
g | 5 | 3.3% |
x | 4 | 2.6% |
p | 1 | 0.7% |
a | 1 | 0.7% |
d | 1 | 0.7% |
s | 1 | 0.7% |
Hangul
Value | Count | Frequency (%) |
개 | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 376 | |
Hangul | 6 | 1.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 85 | |
m | 69 | |
l | 69 | |
1 | 32 | 8.5% |
5 | 31 | 8.2% |
3 | 19 | 5.1% |
2 | 18 | 4.8% |
, | 12 | 3.2% |
6 | 6 | 1.6% |
7 | 6 | 1.6% |
Other values (10) | 29 | 7.7% |
Hangul
Value | Count | Frequency (%) |
개 | 6 |
정상가격(원)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 35 |
---|---|
Distinct (%) | 55.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 41795.238 |
Minimum | 5000 |
---|---|
Maximum | 344000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 699.0 B |
Quantile statistics
Minimum | 5000 |
---|---|
5-th percentile | 8700 |
Q1 | 18000 |
median | 27600 |
Q3 | 40000 |
95-th percentile | 97700 |
Maximum | 344000 |
Range | 339000 |
Interquartile range (IQR) | 22000 |
Descriptive statistics
Standard deviation | 63268.433 |
---|---|
Coefficient of variation (CV) | 1.5137713 |
Kurtosis | 15.533118 |
Mean | 41795.238 |
Median Absolute Deviation (MAD) | 12400 |
Skewness | 3.9445534 |
Sum | 2633100 |
Variance | 4.0028947 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
29000 | 6 | 9.5% |
14000 | 5 | 7.9% |
40000 | 4 | 6.3% |
18000 | 4 | 6.3% |
12000 | 3 | 4.8% |
45000 | 3 | 4.8% |
25000 | 3 | 4.8% |
30000 | 3 | 4.8% |
28000 | 3 | 4.8% |
23000 | 2 | 3.2% |
Other values (25) | 27 |
Value | Count | Frequency (%) |
5000 | 1 | 1.6% |
6000 | 1 | 1.6% |
7000 | 1 | 1.6% |
8500 | 1 | 1.6% |
10500 | 1 | 1.6% |
11500 | 2 | 3.2% |
12000 | 3 | |
14000 | 5 | |
18000 | 4 | |
18500 | 1 | 1.6% |
Value | Count | Frequency (%) |
344000 | 1 | |
320000 | 1 | |
265000 | 1 | |
98000 | 1 | |
95000 | 1 | |
56000 | 1 | |
52000 | 1 | |
50000 | 1 | |
49000 | 1 | |
48000 | 1 |
할인판매가(원)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 33 |
---|---|
Distinct (%) | 52.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 19635.556 |
Minimum | 2500 |
---|---|
Maximum | 210000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 699.0 B |
Quantile statistics
Minimum | 2500 |
---|---|
5-th percentile | 5000 |
Q1 | 10000 |
median | 12860 |
Q3 | 18000 |
95-th percentile | 47400 |
Maximum | 210000 |
Range | 207500 |
Interquartile range (IQR) | 8000 |
Descriptive statistics
Standard deviation | 28975.406 |
---|---|
Coefficient of variation (CV) | 1.4756601 |
Kurtosis | 31.300012 |
Mean | 19635.556 |
Median Absolute Deviation (MAD) | 3860 |
Skewness | 5.2128212 |
Sum | 1237040 |
Variance | 8.3957417 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
12000 | 6 | 9.5% |
18000 | 6 | 9.5% |
10000 | 5 | 7.9% |
14000 | 4 | 6.3% |
9000 | 4 | 6.3% |
11160 | 3 | 4.8% |
20000 | 3 | 4.8% |
25000 | 2 | 3.2% |
5000 | 2 | 3.2% |
22000 | 2 | 3.2% |
Other values (23) | 26 |
Value | Count | Frequency (%) |
2500 | 1 | 1.6% |
3000 | 1 | 1.6% |
4000 | 1 | 1.6% |
5000 | 2 | |
6000 | 2 | |
6500 | 1 | 1.6% |
8000 | 1 | 1.6% |
8500 | 1 | 1.6% |
9000 | 4 | |
9500 | 1 | 1.6% |
Value | Count | Frequency (%) |
210000 | 1 | 1.6% |
92000 | 1 | 1.6% |
90000 | 1 | 1.6% |
48000 | 1 | 1.6% |
42000 | 1 | 1.6% |
28800 | 1 | 1.6% |
25000 | 2 | 3.2% |
22000 | 2 | 3.2% |
20000 | 3 | |
18000 | 6 |
판매여부
Boolean
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 195.0 B |
False | |
---|---|
True | 3 |
Value | Count | Frequency (%) |
False | 60 | |
True | 3 | 4.8% |
카테고리 | 제품명 | 용량 | 정상가격(원) | 할인판매가(원) | 판매여부 | |
---|---|---|---|---|---|---|
카테고리 | 1.000 | 1.000 | 0.944 | 0.501 | 0.108 | 0.000 |
제품명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
용량 | 0.944 | 1.000 | 1.000 | 0.967 | 0.988 | 1.000 |
정상가격(원) | 0.501 | 1.000 | 0.967 | 1.000 | 0.951 | 0.443 |
할인판매가(원) | 0.108 | 1.000 | 0.988 | 0.951 | 1.000 | 0.248 |
판매여부 | 0.000 | 1.000 | 1.000 | 0.443 | 0.248 | 1.000 |
카테고리 | 판매여부 | |
---|---|---|
카테고리 | 1.000 | 0.000 |
판매여부 | 0.000 | 1.000 |
정상가격(원) | 할인판매가(원) | 카테고리 | 판매여부 | |
---|---|---|---|---|
정상가격(원) | 1.000 | 0.911 | 0.280 | 0.526 |
할인판매가(원) | 0.911 | 1.000 | 0.057 | 0.296 |
카테고리 | 0.280 | 0.057 | 1.000 | 0.000 |
판매여부 | 0.526 | 0.296 | 0.000 | 1.000 |
카테고리 | 제품명 | 용량 | 정상가격(원) | 할인판매가(원) | 판매여부 | |
---|---|---|---|---|---|---|
0 | 기초SET | 카놀라 로얄허니 기초세트 | 120ml,120ml,50ml | 98000 | 42000 | N |
1 | 기초SET | 진주5종(토너,에멀젼,에센스,크림,아이크림) | 120ml, 50ml, 30ml | 344000 | 210000 | N |
2 | 기초SET | 홍삼 기초(토너, 에멀젼) | 120ml, 120ml | 50000 | 22000 | N |
3 | 기초SET | 설안 5종 기초 세트 | 165ml,50ml,30ml | 320000 | 90000 | N |
4 | 팩&마스크 | 꿀광 프리미엄 마스크팩 | 27ml*10 | 27600 | 12000 | N |
5 | 팩&마스크 | 마스크팩 5종 | 20ml | 7000 | 3000 | N |
6 | 팩&마스크 | 앰플마스크팩 3종 | 25ml | 18000 | 11500 | N |
7 | 팩&마스크 | 링클리페어 아이마스크 | 100g | 27000 | 13000 | N |
8 | 팩&마스크 | 굿나잇 필링 슬리핑팩 | 135g | 26000 | 14000 | N |
9 | 팩&마스크 | 피부일기 비피다바이옴 마스크 | 30mlx10개 | 12000 | 11160 | N |
카테고리 | 제품명 | 용량 | 정상가격(원) | 할인판매가(원) | 판매여부 | |
---|---|---|---|---|---|---|
53 | 핸드,바디 | 대나무 바디 3종세트 | 150ml,500ml,250ml | 30000 | 20000 | N |
54 | 핸드,바디 | 리얼 솔트 바디스크럽 | 270ml | 14000 | 9500 | N |
55 | 핸드,바디 | 올인원 바디워시 | 300ml | 18000 | 12860 | N |
56 | 헤어 | 프리미엄 샴푸SET | 550ml, 150ml | 52000 | 20000 | N |
57 | 헤어 | 스캘프 스파 샴푸 | 300ml | 18500 | 8000 | N |
58 | 헤어 | 헤어트리트먼트 오일 | 100ml | 21000 | 9000 | N |
59 | 헤어 | 아르간 헤어팩 | 300ml | 14000 | 9000 | N |
60 | 헤어 | 아르간 오일 샴푸 | 460ml | 18000 | 10000 | N |
61 | 헤어 | 헤어왁싱 컬러 3종(레드, 오렌지, 자연갈색) | 200g | 11500 | 4000 | N |
62 | 미용기기 | 스킨 쿨러 | <NA> | 28000 | 11000 | N |