Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 729 |
Duplicate rows (%) | 7.3% |
Total size in memory | 468.8 KiB |
Average record size in memory | 48.0 B |
Variable types
Categorical | 2 |
---|---|
Text | 3 |
Dataset
Description | 21년 부터 22년까지 동물등록 정보와 관련하여 등록동물의 정보(축종, 품종, 성별, 이름, 색상 항목)를 제공합니다 |
---|---|
Author | 공공데이터포털 |
URL | https://www.data.go.kr/data/15114356/fileData.do |
Dataset has 729 (7.3%) duplicate rows | Duplicates |
축종 is highly imbalanced (81.1%) | Imbalance |
Reproduction
Analysis started | 2024-04-18 00:45:34.229046 |
---|---|
Analysis finished | 2024-04-18 00:45:35.878267 |
Duration | 1.65 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
축종
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
개 | |
---|---|
고양이 | 290 |
Length
Max length | 3 |
---|---|
Median length | 1 |
Mean length | 1.058 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 개 |
---|---|
2nd row | 개 |
3rd row | 개 |
4th row | 개 |
5th row | 개 |
Common Values
Value | Count | Frequency (%) |
개 | 9710 | |
고양이 | 290 | 2.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
개 | 9710 | |
고양이 | 290 | 2.9% |
이름
Text
Distinct | 3599 |
---|---|
Distinct (%) | 36.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
보리 | 163 | 1.6% |
콩이 | 131 | 1.3% |
코코 | 125 | 1.2% |
두부 | 110 | 1.1% |
호두 | 100 | 1.0% |
초코 | 90 | 0.9% |
구름 | 86 | 0.9% |
망고 | 80 | 0.8% |
뭉치 | 76 | 0.8% |
토리 | 74 | 0.7% |
Other values (3563) | 8973 |
Most occurring characters
Value | Count | Frequency (%) |
이 | 2199 | 10.0% |
리 | 836 | 3.8% |
코 | 432 | 2.0% |
미 | 394 | 1.8% |
두 | 391 | 1.8% |
구 | 358 | 1.6% |
루 | 334 | 1.5% |
콩 | 300 | 1.4% |
보 | 248 | 1.1% |
아 | 246 | 1.1% |
Other values (776) | 16151 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 21058 | |
Decimal Number | 286 | 1.3% |
Lowercase Letter | 238 | 1.1% |
Uppercase Letter | 181 | 0.8% |
Space Separator | 63 | 0.3% |
Dash Punctuation | 32 | 0.1% |
Close Punctuation | 11 | 0.1% |
Open Punctuation | 10 | < 0.1% |
Other Punctuation | 9 | < 0.1% |
Modifier Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 2199 | 10.4% |
리 | 836 | 4.0% |
코 | 432 | 2.1% |
미 | 394 | 1.9% |
두 | 391 | 1.9% |
구 | 358 | 1.7% |
루 | 334 | 1.6% |
콩 | 300 | 1.4% |
보 | 248 | 1.2% |
아 | 246 | 1.2% |
Other values (711) | 15320 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 18 | 9.9% |
I | 15 | 8.3% |
L | 15 | 8.3% |
B | 14 | 7.7% |
S | 11 | 6.1% |
T | 9 | 5.0% |
O | 9 | 5.0% |
C | 9 | 5.0% |
N | 8 | 4.4% |
K | 7 | 3.9% |
Other values (15) | 66 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 32 | |
i | 28 | |
e | 26 | |
n | 24 | |
o | 20 | 8.4% |
l | 14 | 5.9% |
y | 14 | 5.9% |
r | 11 | 4.6% |
u | 10 | 4.2% |
p | 8 | 3.4% |
Other values (12) | 51 |
Decimal Number
Value | Count | Frequency (%) |
0 | 73 | |
2 | 60 | |
1 | 41 | |
9 | 22 | 7.7% |
4 | 22 | 7.7% |
5 | 19 | 6.6% |
3 | 17 | 5.9% |
8 | 13 | 4.5% |
6 | 10 | 3.5% |
7 | 9 | 3.1% |
Other Punctuation
Value | Count | Frequency (%) |
& | 3 | |
; | 3 | |
# | 3 |
Space Separator
Value | Count | Frequency (%) |
63 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 32 |
Close Punctuation
Value | Count | Frequency (%) |
) | 11 |
Open Punctuation
Value | Count | Frequency (%) |
( | 10 |
Modifier Symbol
Value | Count | Frequency (%) |
` | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 21058 | |
Latin | 419 | 1.9% |
Common | 412 | 1.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 2199 | 10.4% |
리 | 836 | 4.0% |
코 | 432 | 2.1% |
미 | 394 | 1.9% |
두 | 391 | 1.9% |
구 | 358 | 1.7% |
루 | 334 | 1.6% |
콩 | 300 | 1.4% |
보 | 248 | 1.2% |
아 | 246 | 1.2% |
Other values (711) | 15320 |
Latin
Value | Count | Frequency (%) |
a | 32 | 7.6% |
i | 28 | 6.7% |
e | 26 | 6.2% |
n | 24 | 5.7% |
o | 20 | 4.8% |
A | 18 | 4.3% |
I | 15 | 3.6% |
L | 15 | 3.6% |
B | 14 | 3.3% |
l | 14 | 3.3% |
Other values (37) | 213 |
Common
Value | Count | Frequency (%) |
0 | 73 | |
63 | ||
2 | 60 | |
1 | 41 | |
- | 32 | |
9 | 22 | 5.3% |
4 | 22 | 5.3% |
5 | 19 | 4.6% |
3 | 17 | 4.1% |
8 | 13 | 3.2% |
Other values (8) | 50 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 21058 | |
ASCII | 831 | 3.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
이 | 2199 | 10.4% |
리 | 836 | 4.0% |
코 | 432 | 2.1% |
미 | 394 | 1.9% |
두 | 391 | 1.9% |
구 | 358 | 1.7% |
루 | 334 | 1.6% |
콩 | 300 | 1.4% |
보 | 248 | 1.2% |
아 | 246 | 1.2% |
Other values (711) | 15320 |
ASCII
Value | Count | Frequency (%) |
0 | 73 | 8.8% |
63 | 7.6% | |
2 | 60 | 7.2% |
1 | 41 | 4.9% |
- | 32 | 3.9% |
a | 32 | 3.9% |
i | 28 | 3.4% |
e | 26 | 3.1% |
n | 24 | 2.9% |
9 | 22 | 2.6% |
Other values (55) | 430 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
수컷 | |
---|---|
암컷 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 암컷 |
---|---|
2nd row | 암컷 |
3rd row | 수컷 |
4th row | 암컷 |
5th row | 수컷 |
Common Values
Value | Count | Frequency (%) |
수컷 | 5311 | |
암컷 | 4689 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
수컷 | 5311 | |
암컷 | 4689 |
품종
Text
Distinct | 133 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
믹스견 | 1989 | |
푸들 | 1407 | 11.0% |
말티즈 | 1255 | 9.8% |
포메라니안 | 1198 | 9.4% |
비숑 | 903 | 7.1% |
프리제 | 903 | 7.1% |
치와와 | 301 | 2.4% |
진도견 | 287 | 2.2% |
리트리버 | 230 | 1.8% |
라이카 | 202 | 1.6% |
Other values (149) | 4116 |
Most occurring characters
Value | Count | Frequency (%) |
2791 | 6.8% | |
스 | 2392 | 5.9% |
견 | 2321 | 5.7% |
믹 | 1996 | 4.9% |
리 | 1907 | 4.7% |
라 | 1666 | 4.1% |
들 | 1427 | 3.5% |
푸 | 1408 | 3.5% |
니 | 1388 | 3.4% |
안 | 1345 | 3.3% |
Other values (185) | 22154 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 37994 | |
Space Separator | 2791 | 6.8% |
Dash Punctuation | 10 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 2392 | 6.3% |
견 | 2321 | 6.1% |
믹 | 1996 | 5.3% |
리 | 1907 | 5.0% |
라 | 1666 | 4.4% |
들 | 1427 | 3.8% |
푸 | 1408 | 3.7% |
니 | 1388 | 3.7% |
안 | 1345 | 3.5% |
티 | 1293 | 3.4% |
Other values (183) | 20851 |
Space Separator
Value | Count | Frequency (%) |
2791 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 37994 | |
Common | 2801 | 6.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 2392 | 6.3% |
견 | 2321 | 6.1% |
믹 | 1996 | 5.3% |
리 | 1907 | 5.0% |
라 | 1666 | 4.4% |
들 | 1427 | 3.8% |
푸 | 1408 | 3.7% |
니 | 1388 | 3.7% |
안 | 1345 | 3.5% |
티 | 1293 | 3.4% |
Other values (183) | 20851 |
Common
Value | Count | Frequency (%) |
2791 | ||
- | 10 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 37994 | |
ASCII | 2801 | 6.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2791 | ||
- | 10 | 0.4% |
Hangul
Value | Count | Frequency (%) |
스 | 2392 | 6.3% |
견 | 2321 | 6.1% |
믹 | 1996 | 5.3% |
리 | 1907 | 5.0% |
라 | 1666 | 4.4% |
들 | 1427 | 3.8% |
푸 | 1408 | 3.7% |
니 | 1388 | 3.7% |
안 | 1345 | 3.5% |
티 | 1293 | 3.4% |
Other values (183) | 20851 |
색상
Text
Distinct | 315 |
---|---|
Distinct (%) | 3.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
흰색 | 3619 | |
갈색 | 1144 | 11.3% |
크림색 | 946 | 9.3% |
검정색 | 623 | 6.1% |
갈색&흰색 | 533 | 5.2% |
검정&흰색 | 443 | 4.4% |
회색 | 285 | 2.8% |
기타 | 248 | 2.4% |
황색 | 215 | 2.1% |
황갈색 | 155 | 1.5% |
Other values (295) | 1944 |
Most occurring characters
Value | Count | Frequency (%) |
색 | 9864 | |
흰 | 4844 | |
갈 | 2295 | 7.7% |
검 | 1498 | 5.0% |
& | 1373 | 4.6% |
정 | 1186 | 4.0% |
크 | 983 | 3.3% |
림 | 982 | 3.3% |
황 | 529 | 1.8% |
회 | 339 | 1.1% |
Other values (198) | 5882 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 26448 | |
Uppercase Letter | 1581 | 5.3% |
Other Punctuation | 1510 | 5.1% |
Space Separator | 156 | 0.5% |
Lowercase Letter | 39 | 0.1% |
Math Symbol | 17 | 0.1% |
Close Punctuation | 12 | < 0.1% |
Open Punctuation | 12 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
색 | 9864 | |
흰 | 4844 | |
갈 | 2295 | 8.7% |
검 | 1498 | 5.7% |
정 | 1186 | 4.5% |
크 | 983 | 3.7% |
림 | 982 | 3.7% |
황 | 529 | 2.0% |
회 | 339 | 1.3% |
은 | 264 | 1.0% |
Other values (152) | 3664 | 13.9% |
Uppercase Letter
Value | Count | Frequency (%) |
T | 187 | |
E | 173 | |
I | 163 | |
A | 134 | 8.5% |
W | 126 | 8.0% |
H | 121 | 7.7% |
L | 111 | 7.0% |
O | 79 | 5.0% |
R | 78 | 4.9% |
G | 65 | 4.1% |
Other values (12) | 344 |
Lowercase Letter
Value | Count | Frequency (%) |
r | 5 | |
w | 4 | |
o | 4 | |
n | 4 | |
e | 4 | |
c | 3 | |
b | 3 | |
a | 3 | |
l | 2 | 5.1% |
m | 2 | 5.1% |
Other values (5) | 5 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1373 | |
/ | 73 | 4.8% |
, | 44 | 2.9% |
· | 18 | 1.2% |
. | 2 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
156 |
Math Symbol
Value | Count | Frequency (%) |
+ | 17 |
Close Punctuation
Value | Count | Frequency (%) |
) | 12 |
Open Punctuation
Value | Count | Frequency (%) |
( | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 26448 | |
Common | 1707 | 5.7% |
Latin | 1620 | 5.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
색 | 9864 | |
흰 | 4844 | |
갈 | 2295 | 8.7% |
검 | 1498 | 5.7% |
정 | 1186 | 4.5% |
크 | 983 | 3.7% |
림 | 982 | 3.7% |
황 | 529 | 2.0% |
회 | 339 | 1.3% |
은 | 264 | 1.0% |
Other values (152) | 3664 | 13.9% |
Latin
Value | Count | Frequency (%) |
T | 187 | |
E | 173 | |
I | 163 | |
A | 134 | 8.3% |
W | 126 | 7.8% |
H | 121 | 7.5% |
L | 111 | 6.9% |
O | 79 | 4.9% |
R | 78 | 4.8% |
G | 65 | 4.0% |
Other values (27) | 383 |
Common
Value | Count | Frequency (%) |
& | 1373 | |
156 | 9.1% | |
/ | 73 | 4.3% |
, | 44 | 2.6% |
· | 18 | 1.1% |
+ | 17 | 1.0% |
) | 12 | 0.7% |
( | 12 | 0.7% |
. | 2 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 26448 | |
ASCII | 3309 | 11.1% |
None | 18 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
색 | 9864 | |
흰 | 4844 | |
갈 | 2295 | 8.7% |
검 | 1498 | 5.7% |
정 | 1186 | 4.5% |
크 | 983 | 3.7% |
림 | 982 | 3.7% |
황 | 529 | 2.0% |
회 | 339 | 1.3% |
은 | 264 | 1.0% |
Other values (152) | 3664 | 13.9% |
ASCII
Value | Count | Frequency (%) |
& | 1373 | |
T | 187 | 5.7% |
E | 173 | 5.2% |
I | 163 | 4.9% |
156 | 4.7% | |
A | 134 | 4.0% |
W | 126 | 3.8% |
H | 121 | 3.7% |
L | 111 | 3.4% |
O | 79 | 2.4% |
Other values (35) | 686 |
None
Value | Count | Frequency (%) |
· | 18 |
축종 | 성별 | |
---|---|---|
축종 | 1.000 | 0.022 |
성별 | 0.022 | 1.000 |
성별 | 축종 | |
---|---|---|
성별 | 1.000 | 0.014 |
축종 | 0.014 | 1.000 |
축종 | 성별 | |
---|---|---|
축종 | 1.000 | 0.014 |
성별 | 0.014 | 1.000 |
축종 | 이름 | 성별 | 품종 | 색상 | |
---|---|---|---|---|---|
39554 | 개 | 설 | 암컷 | 사모예드 | 흰색 |
91992 | 개 | 짱아 | 암컷 | 말티즈 | 흰색 |
52199 | 개 | 쿠꾸 | 수컷 | 비숑 프리제 | 흰색 |
98300 | 개 | 배찌 | 암컷 | 믹스견 | 크림색 |
69030 | 개 | 짱아 | 수컷 | 믹스견 | 바둑이 |
96828 | 개 | 흑구 | 수컷 | 믹스견 | 검정색 |
69452 | 개 | 가을 | 암컷 | 푸들 | 크림색 |
1213 | 개 | 뽀삐 | 수컷 | 비숑 프리제 | 흰색 |
14708 | 개 | 영웅 | 수컷 | 진도견 | 흰색 |
34478 | 개 | 까무 | 수컷 | 푸들 | 검정색 |
축종 | 이름 | 성별 | 품종 | 색상 | |
---|---|---|---|---|---|
90274 | 개 | 감자 | 수컷 | 믹스견 | 검정&흰색 |
56070 | 고양이 | 비비안 | 암컷 | 페르시안 | 기타 |
91898 | 개 | 강쇠 | 수컷 | 진도견 | 검정색 |
59732 | 개 | 마루 | 암컷 | 골든 리트리버 | 금색 |
15748 | 개 | 까미 | 암컷 | 토이 푸들 | 회색 |
31598 | 개 | 티모 | 수컷 | 믹스견 | 갈색&흰색 |
15342 | 개 | 효순이 | 암컷 | 진도견 | 황색 |
97756 | 개 | 뽀미 | 암컷 | 푸들 | 실버 |
45970 | 개 | 주디 | 암컷 | 이탈리안 그레이 하운드 | 검정색 |
77291 | 개 | 쿠퍼 | 수컷 | 푸들 | 갈색 |
Most frequently occurring
축종 | 이름 | 성별 | 품종 | 색상 | # duplicates | |
---|---|---|---|---|---|---|
107 | 개 | 두부 | 수컷 | 비숑 프리제 | 흰색 | 20 |
22 | 개 | 구름 | 수컷 | 말티즈 | 흰색 | 18 |
24 | 개 | 구름 | 수컷 | 비숑 프리제 | 흰색 | 14 |
105 | 개 | 두부 | 수컷 | 말티즈 | 흰색 | 14 |
258 | 개 | 뭉치 | 수컷 | 비숑 프리제 | 흰색 | 14 |
389 | 개 | 사랑이 | 암컷 | 말티즈 | 흰색 | 14 |
550 | 개 | 코코 | 수컷 | 말티즈 | 흰색 | 14 |
110 | 개 | 두부 | 암컷 | 말티즈 | 흰색 | 12 |
261 | 개 | 뭉치 | 수컷 | 포메라니안 | 흰색 | 12 |
535 | 개 | 초코 | 수컷 | 푸들 | 갈색 | 11 |