Overview

Dataset statistics

Number of variables3
Number of observations344
Missing cells0
Missing cells (%)0.0%
Duplicate rows24
Duplicate rows (%)7.0%
Total size in memory8.2 KiB
Average record size in memory24.4 B

Variable types

Text2
Categorical1

Dataset

Description전북특별자치도 김제시 가금류 농장 현황입니다. (사업장명칭, 주사육업종, 사업장소재지)* 연락처 등 개인정보 포함 제외
Author전북특별자치도 김제시
URLhttps://www.data.go.kr/data/15077226/fileData.do

Alerts

Dataset has 24 (7.0%) duplicate rowsDuplicates

Reproduction

Analysis started2024-03-14 10:03:18.834085
Analysis finished2024-03-14 10:03:19.559404
Duration0.73 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct281
Distinct (%)81.7%
Missing0
Missing (%)0.0%
Memory size2.8 KiB
2024-03-14T19:03:20.678669image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length12
Median length4
Mean length4.3401163
Min length2

Characters and Unicode

Total characters1493
Distinct characters213
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique234 ?
Unique (%)68.0%

Sample

1st row덕우농장
2nd row관상농장
3rd row이상농장
4th row청정오리나라
5th row금정농장
ValueCountFrequency (%)
가나안농장 5
 
1.4%
대성농장 5
 
1.4%
태성농장 4
 
1.1%
햇살농장 3
 
0.9%
금구농장 3
 
0.9%
재현농장 3
 
0.9%
청봉농장 3
 
0.9%
김제농장 3
 
0.9%
강인농장 3
 
0.9%
문경농장 3
 
0.9%
Other values (276) 314
90.0%
2024-03-14T19:03:22.386781image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
317
21.2%
316
21.2%
24
 
1.6%
21
 
1.4%
19
 
1.3%
18
 
1.2%
17
 
1.1%
16
 
1.1%
15
 
1.0%
15
 
1.0%
Other values (203) 715
47.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1462
97.9%
Decimal Number 19
 
1.3%
Space Separator 5
 
0.3%
Close Punctuation 3
 
0.2%
Open Punctuation 3
 
0.2%
Other Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
317
21.7%
316
21.6%
24
 
1.6%
21
 
1.4%
19
 
1.3%
18
 
1.2%
17
 
1.2%
16
 
1.1%
15
 
1.0%
15
 
1.0%
Other values (195) 684
46.8%
Decimal Number
ValueCountFrequency (%)
2 9
47.4%
1 7
36.8%
3 2
 
10.5%
4 1
 
5.3%
Space Separator
ValueCountFrequency (%)
5
100.0%
Close Punctuation
ValueCountFrequency (%)
) 3
100.0%
Open Punctuation
ValueCountFrequency (%)
( 3
100.0%
Other Punctuation
ValueCountFrequency (%)
& 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1462
97.9%
Common 31
 
2.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
317
21.7%
316
21.6%
24
 
1.6%
21
 
1.4%
19
 
1.3%
18
 
1.2%
17
 
1.2%
16
 
1.1%
15
 
1.0%
15
 
1.0%
Other values (195) 684
46.8%
Common
ValueCountFrequency (%)
2 9
29.0%
1 7
22.6%
5
16.1%
) 3
 
9.7%
( 3
 
9.7%
3 2
 
6.5%
& 1
 
3.2%
4 1
 
3.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1462
97.9%
ASCII 31
 
2.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
317
21.7%
316
21.6%
24
 
1.6%
21
 
1.4%
19
 
1.3%
18
 
1.2%
17
 
1.2%
16
 
1.1%
15
 
1.0%
15
 
1.0%
Other values (195) 684
46.8%
ASCII
ValueCountFrequency (%)
2 9
29.0%
1 7
22.6%
5
16.1%
) 3
 
9.7%
( 3
 
9.7%
3 2
 
6.5%
& 1
 
3.2%
4 1
 
3.2%

주사육업종
Categorical

Distinct4
Distinct (%)1.2%
Missing0
Missing (%)0.0%
Memory size2.8 KiB
산란계
159 
육계
147 
오리
28 
종계/산란계
 
10

Length

Max length6
Median length2
Mean length2.5784884
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row산란계
2nd row육계
3rd row육계
4th row오리
5th row산란계

Common Values

ValueCountFrequency (%)
산란계 159
46.2%
육계 147
42.7%
오리 28
 
8.1%
종계/산란계 10
 
2.9%

Length

2024-03-14T19:03:22.641553image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-14T19:03:22.864928image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
산란계 159
46.2%
육계 147
42.7%
오리 28
 
8.1%
종계/산란계 10
 
2.9%
Distinct87
Distinct (%)25.3%
Missing0
Missing (%)0.0%
Memory size2.8 KiB
2024-03-14T19:03:23.589460image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length19
Median length19
Mean length18.723837
Min length14

Characters and Unicode

Total characters6441
Distinct characters93
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique41 ?
Unique (%)11.9%

Sample

1st row전북특별자치도 김제시 금구면 용지리
2nd row전북특별자치도 김제시 청하면 관상리
3rd row전북특별자치도 김제시 청하면 대청리
4th row전북특별자치도 김제시 용지면 신정리
5th row전북특별자치도 김제시 용지면 신정리
ValueCountFrequency (%)
전북특별자치도 344
25.4%
김제시 344
25.4%
용지면 162
12.0%
용수리 45
 
3.3%
장신리 43
 
3.2%
금구면 37
 
2.7%
신정리 36
 
2.7%
금산면 22
 
1.6%
백산면 19
 
1.4%
황산면 17
 
1.3%
Other values (88) 283
20.9%
2024-03-14T19:03:24.830531image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1016
15.8%
349
 
5.4%
346
 
5.4%
345
 
5.4%
344
 
5.3%
344
 
5.3%
344
 
5.3%
344
 
5.3%
344
 
5.3%
344
 
5.3%
Other values (83) 2321
36.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 5425
84.2%
Space Separator 1016
 
15.8%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
349
 
6.4%
346
 
6.4%
345
 
6.4%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
Other values (82) 1977
36.4%
Space Separator
ValueCountFrequency (%)
1016
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 5425
84.2%
Common 1016
 
15.8%

Most frequent character per script

Hangul
ValueCountFrequency (%)
349
 
6.4%
346
 
6.4%
345
 
6.4%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
Other values (82) 1977
36.4%
Common
ValueCountFrequency (%)
1016
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 5425
84.2%
ASCII 1016
 
15.8%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1016
100.0%
Hangul
ValueCountFrequency (%)
349
 
6.4%
346
 
6.4%
345
 
6.4%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
344
 
6.3%
Other values (82) 1977
36.4%

Correlations

2024-03-14T19:03:25.081445image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
주사육업종사업장소재지(지번)
주사육업종1.0000.853
사업장소재지(지번)0.8531.000

Missing values

2024-03-14T19:03:19.202807image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-14T19:03:19.455451image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

사업장명칭주사육업종사업장소재지(지번)
0덕우농장산란계전북특별자치도 김제시 금구면 용지리
1관상농장육계전북특별자치도 김제시 청하면 관상리
2이상농장육계전북특별자치도 김제시 청하면 대청리
3청정오리나라오리전북특별자치도 김제시 용지면 신정리
4금정농장산란계전북특별자치도 김제시 용지면 신정리
5진농장산란계전북특별자치도 김제시 용지면 용수리
6비룡농장산란계전북특별자치도 김제시 용지면 신정리
7벧엘농장산란계전북특별자치도 김제시 용지면 용수리
8신금농장산란계전북특별자치도 김제시 용지면 신정리
9푸른농장육계전북특별자치도 김제시 금구면 선암리
사업장명칭주사육업종사업장소재지(지번)
334초원농산육계전북특별자치도 김제시 명덕동
335만석양계장육계전북특별자치도 김제시 청하면 대청리
336태성농장육계전북특별자치도 김제시 금구면 용지리
337권성윤농장육계전북특별자치도 김제시 금산면 용산리
338효창오리오리전북특별자치도 김제시 용지면 송산리
339대성농장산란계전북특별자치도 김제시 용지면 장신리
340시후농장육계전북특별자치도 김제시 금구면 낙성리
341써니농장육계전북특별자치도 김제시 금구면 용복리
342주식회사 하림육계전북특별자치도 김제시 진봉면 가실리
343거산농장육계전북특별자치도 김제시 만경읍 송상리

Duplicate rows

Most frequently occurring

사업장명칭주사육업종사업장소재지(지번)# duplicates
19천우농장육계전북특별자치도 김제시 금산면 용산리3
20청봉농장육계전북특별자치도 김제시 진봉면 가실리3
0가나안농장산란계전북특별자치도 김제시 용지면 신정리2
1가나안농장산란계전북특별자치도 김제시 용지면 예촌리2
2강인농장산란계전북특별자치도 김제시 용지면 신정리2
3규석농장육계전북특별자치도 김제시 청하면 관상리2
4금구농장오리전북특별자치도 김제시 금구면 낙성리2
5김농장산란계전북특별자치도 김제시 용지면 용수리2
6대성농장산란계전북특별자치도 김제시 용지면 용수리2
7대성농장산란계전북특별자치도 김제시 용지면 장신리2