Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 3999 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 104 |
Duplicate rows (%) | 2.6% |
Total size in memory | 93.9 KiB |
Average record size in memory | 24.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 2 |
Dataset
Description | 보건소 모바일 헬스케어 모바일 앱에서 식사일기 입력 시 활용하는 식품 목록 데이터로 음식명, 카테고리, 섭취단위를 제공합니다. |
---|---|
Author | 한국건강증진개발원 |
URL | https://www.data.go.kr/data/15068785/fileData.do |
Dataset has 104 (2.6%) duplicate rows | Duplicates |
섭취단위 is highly imbalanced (86.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 14:38:41.242815 |
---|---|
Analysis finished | 2023-12-12 14:38:41.899926 |
Duration | 0.66 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
음식명
Text
Distinct | 3862 |
---|---|
Distinct (%) | 96.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.4 KiB |
Length
Max length | 68 |
---|---|
Median length | 45 |
Mean length | 11.691173 |
Min length | 2 |
Characters and Unicode
Total characters | 46753 |
---|---|
Distinct characters | 920 |
Distinct categories | 14 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 3754 ? |
---|---|
Unique (%) | 93.9% |
Sample
1st row | 팥죽 |
---|---|
2nd row | 해산물을 곁들인 매콤한 토마토 스튜 |
3rd row | 호박죽 |
4th row | 흑임자 두부 죽 |
5th row | Oh!징어버거(삼강) |
Value | Count | Frequency (%) |
생것 | 170 | 1.9% |
유기농 | 68 | 0.8% |
풀무원 | 65 | 0.7% |
초콜릿 | 62 | 0.7% |
데친것 | 58 | 0.6% |
미니 | 58 | 0.6% |
마른것 | 50 | 0.6% |
청정원 | 44 | 0.5% |
오렌지 | 34 | 0.4% |
우유 | 33 | 0.4% |
Other values (4573) | 8300 |
Most occurring characters
Value | Count | Frequency (%) |
4947 | 10.6% | |
스 | 1162 | 2.5% |
, | 1038 | 2.2% |
) | 1035 | 2.2% |
( | 1026 | 2.2% |
이 | 841 | 1.8% |
리 | 789 | 1.7% |
기 | 627 | 1.3% |
라 | 551 | 1.2% |
치 | 550 | 1.2% |
Other values (910) | 34187 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 36097 | |
Space Separator | 4947 | 10.6% |
Other Punctuation | 1279 | 2.7% |
Close Punctuation | 1046 | 2.2% |
Open Punctuation | 1037 | 2.2% |
Decimal Number | 834 | 1.8% |
Uppercase Letter | 673 | 1.4% |
Lowercase Letter | 463 | 1.0% |
Connector Punctuation | 154 | 0.3% |
Other Symbol | 142 | 0.3% |
Other values (4) | 81 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 1162 | 3.2% |
이 | 841 | 2.3% |
리 | 789 | 2.2% |
기 | 627 | 1.7% |
라 | 551 | 1.5% |
치 | 550 | 1.5% |
드 | 549 | 1.5% |
크 | 503 | 1.4% |
트 | 492 | 1.4% |
오 | 487 | 1.3% |
Other values (827) | 29546 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 78 | 11.6% |
C | 50 | 7.4% |
L | 44 | 6.5% |
M | 44 | 6.5% |
O | 41 | 6.1% |
A | 40 | 5.9% |
B | 37 | 5.5% |
R | 37 | 5.5% |
I | 37 | 5.5% |
E | 35 | 5.2% |
Other values (15) | 230 |
Lowercase Letter
Value | Count | Frequency (%) |
g | 89 | |
a | 43 | 9.3% |
l | 36 | 7.8% |
e | 28 | 6.0% |
o | 27 | 5.8% |
s | 26 | 5.6% |
t | 20 | 4.3% |
i | 17 | 3.7% |
c | 17 | 3.7% |
n | 17 | 3.7% |
Other values (14) | 143 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1038 | |
& | 116 | 9.1% |
. | 42 | 3.3% |
% | 27 | 2.1% |
* | 27 | 2.1% |
/ | 13 | 1.0% |
; | 5 | 0.4% |
' | 3 | 0.2% |
? | 2 | 0.2% |
· | 2 | 0.2% |
Other values (2) | 4 | 0.3% |
Decimal Number
Value | Count | Frequency (%) |
0 | 263 | |
1 | 159 | |
2 | 107 | |
3 | 88 | 10.6% |
5 | 56 | 6.7% |
4 | 42 | 5.0% |
9 | 37 | 4.4% |
6 | 30 | 3.6% |
8 | 29 | 3.5% |
7 | 23 | 2.8% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1035 | |
] | 11 | 1.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1026 | |
[ | 11 | 1.1% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 141 | |
℃ | 1 | 0.7% |
Space Separator
Value | Count | Frequency (%) |
4947 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 154 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 65 |
Math Symbol
Value | Count | Frequency (%) |
+ | 10 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 5 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 36227 | |
Common | 9378 | 20.1% |
Latin | 1137 | 2.4% |
Han | 11 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 1162 | 3.2% |
이 | 841 | 2.3% |
리 | 789 | 2.2% |
기 | 627 | 1.7% |
라 | 551 | 1.5% |
치 | 550 | 1.5% |
드 | 549 | 1.5% |
크 | 503 | 1.4% |
트 | 492 | 1.4% |
오 | 487 | 1.3% |
Other values (823) | 29676 |
Latin
Value | Count | Frequency (%) |
g | 89 | 7.8% |
S | 78 | 6.9% |
C | 50 | 4.4% |
L | 44 | 3.9% |
M | 44 | 3.9% |
a | 43 | 3.8% |
O | 41 | 3.6% |
A | 40 | 3.5% |
B | 37 | 3.3% |
R | 37 | 3.3% |
Other values (40) | 634 |
Common
Value | Count | Frequency (%) |
4947 | ||
, | 1038 | 11.1% |
) | 1035 | 11.0% |
( | 1026 | 10.9% |
0 | 263 | 2.8% |
1 | 159 | 1.7% |
_ | 154 | 1.6% |
& | 116 | 1.2% |
2 | 107 | 1.1% |
3 | 88 | 0.9% |
Other values (22) | 445 | 4.7% |
Han
Value | Count | Frequency (%) |
秀 | 5 | |
愛 | 2 | 18.2% |
辛 | 2 | 18.2% |
新 | 1 | 9.1% |
入 | 1 | 9.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 36086 | |
ASCII | 10509 | 22.5% |
None | 145 | 0.3% |
CJK | 11 | < 0.1% |
Letterlike Symbols | 1 | < 0.1% |
Number Forms | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4947 | ||
, | 1038 | 9.9% |
) | 1035 | 9.8% |
( | 1026 | 9.8% |
0 | 263 | 2.5% |
1 | 159 | 1.5% |
_ | 154 | 1.5% |
& | 116 | 1.1% |
2 | 107 | 1.0% |
g | 89 | 0.8% |
Other values (68) | 1575 | 15.0% |
Hangul
Value | Count | Frequency (%) |
스 | 1162 | 3.2% |
이 | 841 | 2.3% |
리 | 789 | 2.2% |
기 | 627 | 1.7% |
라 | 551 | 1.5% |
치 | 550 | 1.5% |
드 | 549 | 1.5% |
크 | 503 | 1.4% |
트 | 492 | 1.4% |
오 | 487 | 1.3% |
Other values (822) | 29535 |
None
Value | Count | Frequency (%) |
㈜ | 141 | |
· | 2 | 1.4% |
? | 2 | 1.4% |
CJK
Value | Count | Frequency (%) |
秀 | 5 | |
愛 | 2 | 18.2% |
辛 | 2 | 18.2% |
新 | 1 | 9.1% |
入 | 1 | 9.1% |
Letterlike Symbols
Value | Count | Frequency (%) |
℃ | 1 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 |
카테고리
Categorical
Distinct | 36 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.4 KiB |
과자류 | |
---|---|
즉석섭취·편의식품류 | |
코코아가공품류 또는 초콜릿류 | |
과일·채소류음료 | |
채소류 | |
Other values (31) |
Length
Max length | 15 |
---|---|
Median length | 9 |
Mean length | 5.9217304 |
Min length | 2 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 죽 및 스프류 |
---|---|
2nd row | 죽 및 스프류 |
3rd row | 죽 및 스프류 |
4th row | 죽 및 스프류 |
5th row | 즉석섭취·편의식품류 |
Common Values
Value | Count | Frequency (%) |
과자류 | 1050 | |
즉석섭취·편의식품류 | 469 | |
코코아가공품류 또는 초콜릿류 | 449 | |
과일·채소류음료 | 394 | 9.9% |
채소류 | 297 | 7.4% |
가공유류 | 288 | 7.2% |
기타 | 279 | 7.0% |
피자 | 118 | 3.0% |
탄산음료류 | 109 | 2.7% |
커피 | 84 | 2.1% |
Other values (26) | 462 |
Length
Value | Count | Frequency (%) |
과자류 | 1050 | |
즉석섭취·편의식품류 | 469 | |
코코아가공품류 | 449 | |
또는 | 449 | |
초콜릿류 | 449 | |
과일·채소류음료 | 394 | 7.7% |
채소류 | 297 | 5.8% |
가공유류 | 288 | 5.7% |
기타 | 279 | 5.5% |
피자 | 118 | 2.3% |
Other values (37) | 851 |
섭취단위
Categorical
IMBALANCE
 
Distinct | 13 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 31.4 KiB |
봉 | |
---|---|
개 | 139 |
인분 | 109 |
팩 | 14 |
큰술 | 7 |
Other values (8) | 22 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.0310078 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 봉 |
---|---|
2nd row | 봉 |
3rd row | 봉 |
4th row | 봉 |
5th row | 봉 |
Common Values
Value | Count | Frequency (%) |
봉 | 3708 | |
개 | 139 | 3.5% |
인분 | 109 | 2.7% |
팩 | 14 | 0.4% |
큰술 | 7 | 0.2% |
포 | 6 | 0.2% |
병 | 5 | 0.1% |
잔 | 3 | 0.1% |
장 | 2 | 0.1% |
작은접시 | 2 | 0.1% |
Other values (3) | 4 | 0.1% |
Length
Value | Count | Frequency (%) |
봉 | 3708 | |
개 | 139 | 3.5% |
인분 | 109 | 2.7% |
팩 | 14 | 0.4% |
큰술 | 7 | 0.2% |
포 | 6 | 0.1% |
병 | 5 | 0.1% |
잔 | 3 | 0.1% |
컵 | 3 | 0.1% |
장 | 2 | < 0.1% |
Other values (3) | 4 | 0.1% |
카테고리 | 섭취단위 | |
---|---|---|
카테고리 | 1.000 | 0.806 |
섭취단위 | 0.806 | 1.000 |
카테고리 | 섭취단위 | |
---|---|---|
카테고리 | 1.000 | 0.397 |
섭취단위 | 0.397 | 1.000 |
카테고리 | 섭취단위 | |
---|---|---|
카테고리 | 1.000 | 0.397 |
섭취단위 | 0.397 | 1.000 |
음식명 | 카테고리 | 섭취단위 | |
---|---|---|---|
0 | 팥죽 | 죽 및 스프류 | 봉 |
1 | 해산물을 곁들인 매콤한 토마토 스튜 | 죽 및 스프류 | 봉 |
2 | 호박죽 | 죽 및 스프류 | 봉 |
3 | 흑임자 두부 죽 | 죽 및 스프류 | 봉 |
4 | Oh!징어버거(삼강) | 즉석섭취·편의식품류 | 봉 |
5 | 1,000냥참치햄샐러드김밥 | 즉석섭취·편의식품류 | 봉 |
6 | 1000냥왕김밥 | 즉석섭취·편의식품류 | 봉 |
7 | 1000천냥불고기김밥 | 즉석섭취·편의식품류 | 봉 |
8 | 1000천냥원조김밥 | 즉석섭취·편의식품류 | 봉 |
9 | 1000천냥참치김치김밥 | 즉석섭취·편의식품류 | 봉 |
음식명 | 카테고리 | 섭취단위 | |
---|---|---|---|
3989 | 미니볼리에 패스트리크림 | 과자류 | 봉 |
3990 | 미니스낵 베리필링 | 과자류 | 봉 |
3991 | 미니스낵 코코아크림 | 과자류 | 봉 |
3992 | 미니약과 | 과자류 | 봉 |
3993 | 미니약과 | 과자류 | 봉 |
3994 | 미니약과 | 과자류 | 봉 |
3995 | 미니양갱 | 과자류 | 봉 |
3996 | 미니와퍼딸기향 | 과자류 | 봉 |
3997 | 미니와퍼토란향 | 과자류 | 봉 |
3998 | 미니요우칸 네리 | 과자류 | 봉 |
Most frequently occurring
음식명 | 카테고리 | 섭취단위 | # duplicates | |
---|---|---|---|---|
45 | 리츠 크래커 | 과자류 | 봉 | 8 |
65 | 불고기버거 | 즉석섭취·편의식품류 | 봉 | 4 |
89 | 참치김치삼각김밥 | 즉석섭취·편의식품류 | 봉 | 4 |
90 | 참치마요네즈 | 즉석섭취·편의식품류 | 봉 | 4 |
27 | 데리야끼버거 | 즉석섭취·편의식품류 | 봉 | 3 |
32 | 두부과자 | 과자류 | 봉 | 3 |
36 | 두부스낵 | 과자류 | 봉 | 3 |
37 | 듬뿍넣은햄샌드 | 즉석섭취·편의식품류 | 봉 | 3 |
47 | 마늘바게트 | 과자류 | 봉 | 3 |
51 | 매직 치즈 샌드 크래커 | 과자류 | 봉 | 3 |