Overview

Dataset statistics

Number of variables3
Number of observations1001
Missing cells0
Missing cells (%)0.0%
Duplicate rows55
Duplicate rows (%)5.5%
Total size in memory23.6 KiB
Average record size in memory24.1 B

Variable types

Text2
Categorical1

Dataset

Description해당 데이터는경상북도 경산시에 소재한 축산업 현황에 대한 자료로경산시 내에 축산 농장명, 축종, 농장소재 주소 를 표기한 자료입니다.
Author경상북도 경산시
URLhttps://www.data.go.kr/data/15034261/fileData.do

Alerts

Dataset has 55 (5.5%) duplicate rowsDuplicates
주사육업종 is highly imbalanced (69.9%)Imbalance

Reproduction

Analysis started2024-03-14 23:22:40.982120
Analysis finished2024-03-14 23:22:41.578800
Duration0.6 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct842
Distinct (%)84.1%
Missing0
Missing (%)0.0%
Memory size7.9 KiB
2024-03-15T08:22:42.312827image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length17
Median length4
Mean length4.2957043
Min length2

Characters and Unicode

Total characters4300
Distinct characters300
Distinct categories7 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique720 ?
Unique (%)71.9%

Sample

1st row매남농장
2nd row진희
3rd row한수농장
4th row조왕근
5th row상호농장
ValueCountFrequency (%)
농장 22
 
2.1%
대성농장 7
 
0.7%
대원농장 5
 
0.5%
우리농장 5
 
0.5%
푸른농장 5
 
0.5%
소월농장 4
 
0.4%
영신농장 4
 
0.4%
마곡농장 4
 
0.4%
경산농장 3
 
0.3%
대영농장 3
 
0.3%
Other values (837) 979
94.0%
2024-03-15T08:22:43.668778image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
937
21.8%
770
 
17.9%
182
 
4.2%
92
 
2.1%
77
 
1.8%
63
 
1.5%
54
 
1.3%
52
 
1.2%
44
 
1.0%
43
 
1.0%
Other values (290) 1986
46.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 4210
97.9%
Space Separator 40
 
0.9%
Decimal Number 27
 
0.6%
Uppercase Letter 12
 
0.3%
Close Punctuation 5
 
0.1%
Open Punctuation 5
 
0.1%
Other Punctuation 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
937
22.3%
770
18.3%
182
 
4.3%
92
 
2.2%
77
 
1.8%
63
 
1.5%
54
 
1.3%
52
 
1.2%
44
 
1.0%
43
 
1.0%
Other values (277) 1896
45.0%
Uppercase Letter
ValueCountFrequency (%)
K 3
25.0%
O 3
25.0%
N 2
16.7%
J 2
16.7%
S 1
 
8.3%
U 1
 
8.3%
Decimal Number
ValueCountFrequency (%)
2 24
88.9%
1 2
 
7.4%
3 1
 
3.7%
Space Separator
ValueCountFrequency (%)
40
100.0%
Close Punctuation
ValueCountFrequency (%)
) 5
100.0%
Open Punctuation
ValueCountFrequency (%)
( 5
100.0%
Other Punctuation
ValueCountFrequency (%)
. 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 4210
97.9%
Common 78
 
1.8%
Latin 12
 
0.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
937
22.3%
770
18.3%
182
 
4.3%
92
 
2.2%
77
 
1.8%
63
 
1.5%
54
 
1.3%
52
 
1.2%
44
 
1.0%
43
 
1.0%
Other values (277) 1896
45.0%
Common
ValueCountFrequency (%)
40
51.3%
2 24
30.8%
) 5
 
6.4%
( 5
 
6.4%
1 2
 
2.6%
3 1
 
1.3%
. 1
 
1.3%
Latin
ValueCountFrequency (%)
K 3
25.0%
O 3
25.0%
N 2
16.7%
J 2
16.7%
S 1
 
8.3%
U 1
 
8.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 4210
97.9%
ASCII 90
 
2.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
937
22.3%
770
18.3%
182
 
4.3%
92
 
2.2%
77
 
1.8%
63
 
1.5%
54
 
1.3%
52
 
1.2%
44
 
1.0%
43
 
1.0%
Other values (277) 1896
45.0%
ASCII
ValueCountFrequency (%)
40
44.4%
2 24
26.7%
) 5
 
5.6%
( 5
 
5.6%
K 3
 
3.3%
O 3
 
3.3%
N 2
 
2.2%
J 2
 
2.2%
1 2
 
2.2%
S 1
 
1.1%
Other values (3) 3
 
3.3%

주사육업종
Categorical

IMBALANCE 

Distinct11
Distinct (%)1.1%
Missing0
Missing (%)0.0%
Memory size7.9 KiB
한우
843 
젖소
 
51
돼지
 
43
육우
 
21
종계/산란계
 
13
Other values (6)
 
30

Length

Max length6
Median length2
Mean length2.0509491
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row한우
2nd row한우
3rd row한우
4th row한우
5th row한우

Common Values

ValueCountFrequency (%)
한우 843
84.2%
젖소 51
 
5.1%
돼지 43
 
4.3%
육우 21
 
2.1%
종계/산란계 13
 
1.3%
육계 10
 
1.0%
9
 
0.9%
염소 5
 
0.5%
부화용알생산 2
 
0.2%
산양 2
 
0.2%

Length

2024-03-15T08:22:44.121643image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
한우 843
84.2%
젖소 51
 
5.1%
돼지 43
 
4.3%
육우 21
 
2.1%
종계/산란계 13
 
1.3%
육계 10
 
1.0%
9
 
0.9%
염소 5
 
0.5%
부화용알생산 2
 
0.2%
산양 2
 
0.2%
Distinct132
Distinct (%)13.2%
Missing0
Missing (%)0.0%
Memory size7.9 KiB
2024-03-15T08:22:45.222994image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length19
Median length16
Mean length15.865135
Min length12

Characters and Unicode

Total characters15881
Distinct characters110
Distinct categories4 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique20 ?
Unique (%)2.0%

Sample

1st row경상북도 경산시 용성면 매남리
2nd row경상북도 경산시 와촌면 덕촌리
3rd row경상북도 경산시 와촌면 덕촌리
4th row경상북도 경산시 용성면 용천리
5th row경상북도 경산시 하양읍 환상리
ValueCountFrequency (%)
경상북도 1001
25.3%
경산시 1001
25.3%
용성면 290
 
7.3%
와촌면 151
 
3.8%
남천면 119
 
3.0%
남산면 102
 
2.6%
자인면 92
 
2.3%
진량읍 80
 
2.0%
압량읍 67
 
1.7%
하양읍 55
 
1.4%
Other values (127) 999
25.2%
2024-03-15T08:22:46.702955image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
3004
18.9%
2017
12.7%
1156
 
7.3%
1030
 
6.5%
1025
 
6.5%
1022
 
6.4%
1014
 
6.4%
967
 
6.1%
754
 
4.7%
322
 
2.0%
Other values (100) 3570
22.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 12849
80.9%
Space Separator 3004
 
18.9%
Open Punctuation 14
 
0.1%
Close Punctuation 14
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2017
15.7%
1156
 
9.0%
1030
 
8.0%
1025
 
8.0%
1022
 
8.0%
1014
 
7.9%
967
 
7.5%
754
 
5.9%
322
 
2.5%
293
 
2.3%
Other values (97) 3249
25.3%
Space Separator
ValueCountFrequency (%)
3004
100.0%
Open Punctuation
ValueCountFrequency (%)
( 14
100.0%
Close Punctuation
ValueCountFrequency (%)
) 14
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 12835
80.8%
Common 3032
 
19.1%
Han 14
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2017
15.7%
1156
 
9.0%
1030
 
8.0%
1025
 
8.0%
1022
 
8.0%
1014
 
7.9%
967
 
7.5%
754
 
5.9%
322
 
2.5%
293
 
2.3%
Other values (95) 3235
25.2%
Common
ValueCountFrequency (%)
3004
99.1%
( 14
 
0.5%
) 14
 
0.5%
Han
ValueCountFrequency (%)
10
71.4%
4
 
28.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 12835
80.8%
ASCII 3032
 
19.1%
CJK 14
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
3004
99.1%
( 14
 
0.5%
) 14
 
0.5%
Hangul
ValueCountFrequency (%)
2017
15.7%
1156
 
9.0%
1030
 
8.0%
1025
 
8.0%
1022
 
8.0%
1014
 
7.9%
967
 
7.5%
754
 
5.9%
322
 
2.5%
293
 
2.3%
Other values (95) 3235
25.2%
CJK
ValueCountFrequency (%)
10
71.4%
4
 
28.6%

Missing values

2024-03-15T08:22:41.337442image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-15T08:22:41.493893image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

사업장명칭주사육업종사업장소재지
0매남농장한우경상북도 경산시 용성면 매남리
1진희한우경상북도 경산시 와촌면 덕촌리
2한수농장한우경상북도 경산시 와촌면 덕촌리
3조왕근한우경상북도 경산시 용성면 용천리
4상호농장한우경상북도 경산시 하양읍 환상리
5신외석돼지경상북도 경산시 와촌면 박사리
6김수용돼지경상북도 경산시 와촌면 대동리
7장수농장한우경상북도 경산시 와촌면 계전리
8고광옥한우경상북도 경산시 하양읍 사기리
9전오장한우경상북도 경산시 하양읍 사기리
사업장명칭주사육업종사업장소재지
991육일농장염소경상북도 경산시 자인면 북사리
992타기농장한우경상북도 경산시 용성면 내촌리
993안심농장한우경상북도 경산시 와촌면 계전리
994삼성한우농장한우경상북도 경산시 용성면 고은리
995대평목장한우경상북도 경산시 자인면 남신리
996자인축사한우경상북도 경산시 자인면 북사리
997대평2목장한우경상북도 경산시 자인면 남신리
998태천농장한우경상북도 경산시 자인면 계남리
999청우원 한우농장2한우경상북도 경산시 남천면 흥산리
1000도덕염소농장염소경상북도 경산시 용성면 도덕리

Duplicate rows

Most frequently occurring

사업장명칭주사육업종사업장소재지# duplicates
28소월농장한우경상북도 경산시 와촌면 소월리4
3구일농장한우경상북도 경산시 남천면 구일리3
14대성농장한우경상북도 경산시 용성면 대종리3
18마곡농장한우경상북도 경산시 진량읍 마곡리3
35오산농장한우경상북도 경산시 용성면 미산리3
36외촌농장한우경상북도 경산시 용성면 외촌리3
37용전목장한우경상북도 경산시 용성면 용전리3
47평천농장한우경상북도 경산시 와촌면 상암리3
0가척목장한우경상북도 경산시 용성면 가척리2
1계전농장한우경상북도 경산시 와촌면 계전리2