Overview

Dataset statistics

Number of variables5
Number of observations190
Missing cells23
Missing cells (%)2.4%
Duplicate rows2
Duplicate rows (%)1.1%
Total size in memory7.6 KiB
Average record size in memory40.7 B

Variable types

Text2
Categorical3

Dataset

Description경기도 이천시 양돈농가에 대한 사업장명칭, 등록축종, 사업장소재지(지번), 사업장소재지(도로명)에 대한 정보를 제공합니다. 사육두수, 동수(계), 면적(계)는 개인정보 보호를 위해서 공개하지 않습니다.
Author경기도 이천시
URLhttps://www.data.go.kr/data/15127280/fileData.do

Alerts

등록축종 has constant value ""Constant
데이터기준일자 has constant value ""Constant
Dataset has 2 (1.1%) duplicate rowsDuplicates
사업장소재지(도로명) has 23 (12.1%) missing valuesMissing

Reproduction

Analysis started2024-03-23 05:47:10.750989
Analysis finished2024-03-23 05:47:11.416372
Duration0.67 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct185
Distinct (%)97.4%
Missing0
Missing (%)0.0%
Memory size1.6 KiB
2024-03-23T14:47:11.780761image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length22
Median length4
Mean length5.3263158
Min length2

Characters and Unicode

Total characters1012
Distinct characters198
Distinct categories8 ?
Distinct scripts4 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique181 ?
Unique (%)95.3%

Sample

1st row문태식
2nd row원재농장
3rd row그린농장
4th row모전영농조합법인
5th row농업회사법인(주)선진한마을 오름설성농장
ValueCountFrequency (%)
주식회사 6
 
2.9%
농업회사법인 4
 
1.9%
형제농장 3
 
1.4%
농업회사법인(주)선진한마을 3
 
1.4%
농장 3
 
1.4%
하나농장 2
 
1.0%
설성농장 2
 
1.0%
동원농장 2
 
1.0%
일우농장 1
 
0.5%
에스디팜 1
 
0.5%
Other values (182) 182
87.1%
2024-03-23T14:47:12.773891image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
176
 
17.4%
163
 
16.1%
19
 
1.9%
18
 
1.8%
17
 
1.7%
17
 
1.7%
( 17
 
1.7%
) 17
 
1.7%
16
 
1.6%
16
 
1.6%
Other values (188) 536
53.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 932
92.1%
Space Separator 19
 
1.9%
Open Punctuation 17
 
1.7%
Close Punctuation 17
 
1.7%
Decimal Number 15
 
1.5%
Lowercase Letter 7
 
0.7%
Uppercase Letter 3
 
0.3%
Other Punctuation 2
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
176
 
18.9%
163
 
17.5%
18
 
1.9%
17
 
1.8%
17
 
1.8%
16
 
1.7%
16
 
1.7%
16
 
1.7%
14
 
1.5%
13
 
1.4%
Other values (172) 466
50.0%
Lowercase Letter
ValueCountFrequency (%)
a 2
28.6%
l 1
14.3%
m 1
14.3%
r 1
14.3%
d 1
14.3%
n 1
14.3%
Uppercase Letter
ValueCountFrequency (%)
F 1
33.3%
D 1
33.3%
R 1
33.3%
Decimal Number
ValueCountFrequency (%)
2 9
60.0%
1 6
40.0%
Other Punctuation
ValueCountFrequency (%)
, 1
50.0%
& 1
50.0%
Space Separator
ValueCountFrequency (%)
19
100.0%
Open Punctuation
ValueCountFrequency (%)
( 17
100.0%
Close Punctuation
ValueCountFrequency (%)
) 17
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 931
92.0%
Common 70
 
6.9%
Latin 10
 
1.0%
Han 1
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
176
 
18.9%
163
 
17.5%
18
 
1.9%
17
 
1.8%
17
 
1.8%
16
 
1.7%
16
 
1.7%
16
 
1.7%
14
 
1.5%
13
 
1.4%
Other values (171) 465
49.9%
Latin
ValueCountFrequency (%)
a 2
20.0%
l 1
10.0%
m 1
10.0%
r 1
10.0%
F 1
10.0%
d 1
10.0%
n 1
10.0%
D 1
10.0%
R 1
10.0%
Common
ValueCountFrequency (%)
19
27.1%
( 17
24.3%
) 17
24.3%
2 9
12.9%
1 6
 
8.6%
, 1
 
1.4%
& 1
 
1.4%
Han
ValueCountFrequency (%)
1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 931
92.0%
ASCII 80
 
7.9%
CJK 1
 
0.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
176
 
18.9%
163
 
17.5%
18
 
1.9%
17
 
1.8%
17
 
1.8%
16
 
1.7%
16
 
1.7%
16
 
1.7%
14
 
1.5%
13
 
1.4%
Other values (171) 465
49.9%
ASCII
ValueCountFrequency (%)
19
23.8%
( 17
21.2%
) 17
21.2%
2 9
11.2%
1 6
 
7.5%
a 2
 
2.5%
, 1
 
1.2%
l 1
 
1.2%
m 1
 
1.2%
r 1
 
1.2%
Other values (6) 6
 
7.5%
CJK
ValueCountFrequency (%)
1
100.0%

등록축종
Categorical

CONSTANT 

Distinct1
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size1.6 KiB
돼지
190 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row돼지
2nd row돼지
3rd row돼지
4th row돼지
5th row돼지

Common Values

ValueCountFrequency (%)
돼지 190
100.0%

Length

2024-03-23T14:47:13.063462image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-23T14:47:13.278414image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
돼지 190
100.0%
Distinct10
Distinct (%)5.3%
Missing0
Missing (%)0.0%
Memory size1.6 KiB
경기도 이천시 설성면
45 
경기도 이천시 모가면
26 
경기도 이천시 대월면
23 
경기도 이천시 장호원읍
21 
경기도 이천시 율면
18 
Other values (5)
57 

Length

Max length12
Median length11
Mean length11.015789
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경기도 이천시 신둔면
2nd row경기도 이천시 신둔면
3rd row경기도 이천시 설성면
4th row경기도 이천시 백사면
5th row경기도 이천시 설성면

Common Values

ValueCountFrequency (%)
경기도 이천시 설성면 45
23.7%
경기도 이천시 모가면 26
13.7%
경기도 이천시 대월면 23
12.1%
경기도 이천시 장호원읍 21
11.1%
경기도 이천시 율면 18
 
9.5%
경기도 이천시 호법면 14
 
7.4%
경기도 이천시 백사면 13
 
6.8%
경기도 이천시 부발읍 13
 
6.8%
경기도 이천시 신둔면 11
 
5.8%
경기도 이천시 마장면 6
 
3.2%

Length

2024-03-23T14:47:13.496453image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-23T14:47:13.757941image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
경기도 190
33.3%
이천시 190
33.3%
설성면 45
 
7.9%
모가면 26
 
4.6%
대월면 23
 
4.0%
장호원읍 21
 
3.7%
율면 18
 
3.2%
호법면 14
 
2.5%
백사면 13
 
2.3%
부발읍 13
 
2.3%
Other values (2) 17
 
3.0%
Distinct54
Distinct (%)32.3%
Missing23
Missing (%)12.1%
Memory size1.6 KiB
2024-03-23T14:47:14.150405image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length17
Median length15
Mean length15.389222
Min length14

Characters and Unicode

Total characters2570
Distinct characters76
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique15 ?
Unique (%)9.0%

Sample

1st row경기도 이천시 신둔면 석동로
2nd row경기도 이천시 신둔면 이여로
3rd row경기도 이천시 설성면 진상미로
4th row경기도 이천시 백사면 이여로
5th row경기도 이천시 설성면 설성로
ValueCountFrequency (%)
경기도 167
25.0%
이천시 167
25.0%
설성면 39
 
5.8%
대월면 22
 
3.3%
모가면 20
 
3.0%
장호원읍 19
 
2.8%
율면 16
 
2.4%
진상미로 15
 
2.2%
백사면 12
 
1.8%
대월로 12
 
1.8%
Other values (48) 179
26.8%
2024-03-23T14:47:14.861295image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
502
19.5%
179
 
7.0%
176
 
6.8%
173
 
6.7%
170
 
6.6%
167
 
6.5%
167
 
6.5%
165
 
6.4%
136
 
5.3%
76
 
3.0%
Other values (66) 659
25.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2068
80.5%
Space Separator 502
 
19.5%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
179
 
8.7%
176
 
8.5%
173
 
8.4%
170
 
8.2%
167
 
8.1%
167
 
8.1%
165
 
8.0%
136
 
6.6%
76
 
3.7%
59
 
2.9%
Other values (65) 600
29.0%
Space Separator
ValueCountFrequency (%)
502
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2068
80.5%
Common 502
 
19.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
179
 
8.7%
176
 
8.5%
173
 
8.4%
170
 
8.2%
167
 
8.1%
167
 
8.1%
165
 
8.0%
136
 
6.6%
76
 
3.7%
59
 
2.9%
Other values (65) 600
29.0%
Common
ValueCountFrequency (%)
502
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2068
80.5%
ASCII 502
 
19.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
502
100.0%
Hangul
ValueCountFrequency (%)
179
 
8.7%
176
 
8.5%
173
 
8.4%
170
 
8.2%
167
 
8.1%
167
 
8.1%
165
 
8.0%
136
 
6.6%
76
 
3.7%
59
 
2.9%
Other values (65) 600
29.0%

데이터기준일자
Categorical

CONSTANT 

Distinct1
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size1.6 KiB
2024-03-01
190 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2024-03-01
2nd row2024-03-01
3rd row2024-03-01
4th row2024-03-01
5th row2024-03-01

Common Values

ValueCountFrequency (%)
2024-03-01 190
100.0%

Length

2024-03-23T14:47:15.080957image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-23T14:47:15.301185image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2024-03-01 190
100.0%

Correlations

2024-03-23T14:47:15.424070image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
사업장소재지(지번)사업장소재지(도로명)
사업장소재지(지번)1.0001.000
사업장소재지(도로명)1.0001.000

Missing values

2024-03-23T14:47:11.117770image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-23T14:47:11.342228image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

사업장명칭등록축종사업장소재지(지번)사업장소재지(도로명)데이터기준일자
0문태식돼지경기도 이천시 신둔면경기도 이천시 신둔면 석동로2024-03-01
1원재농장돼지경기도 이천시 신둔면경기도 이천시 신둔면 이여로2024-03-01
2그린농장돼지경기도 이천시 설성면경기도 이천시 설성면 진상미로2024-03-01
3모전영농조합법인돼지경기도 이천시 백사면경기도 이천시 백사면 이여로2024-03-01
4농업회사법인(주)선진한마을 오름설성농장돼지경기도 이천시 설성면경기도 이천시 설성면 설성로2024-03-01
5다우농장돼지경기도 이천시 모가면경기도 이천시 모가면 진상미로2024-03-01
6양성농장(1)돼지경기도 이천시 호법면경기도 이천시 호법면 이섭대천로2024-03-01
7설성농장돼지경기도 이천시 설성면<NA>2024-03-01
8은혜농장돼지경기도 이천시 마장면경기도 이천시 마장면 마도로2024-03-01
9선희농장돼지경기도 이천시 모가면경기도 이천시 모가면 공원로2024-03-01
사업장명칭등록축종사업장소재지(지번)사업장소재지(도로명)데이터기준일자
180리치팜제2농장돼지경기도 이천시 율면경기도 이천시 율면 고월로2024-03-01
181석강양평농장돼지경기도 이천시 대월면경기도 이천시 대월면 대월로2024-03-01
182수정농장돼지경기도 이천시 설성면경기도 이천시 설성면 원설로2024-03-01
183더드림 농장돼지경기도 이천시 대월면경기도 이천시 대월면 대월로2024-03-01
184일우농장돼지경기도 이천시 모가면경기도 이천시 모가면 사실로2024-03-01
185주식회사 엠젠솔루션돼지경기도 이천시 장호원읍경기도 이천시 장호원읍 경충대로2024-03-01
186더조은팜돼지경기도 이천시 신둔면경기도 이천시 신둔면 석동로2024-03-01
187형제농장돼지경기도 이천시 설성면경기도 이천시 설성면 대죽로2024-03-01
188가야농장돼지경기도 이천시 부발읍경기도 이천시 부발읍 중부대로2024-03-01
189행죽농장돼지경기도 이천시 설성면<NA>2024-03-01

Duplicate rows

Most frequently occurring

사업장명칭등록축종사업장소재지(지번)사업장소재지(도로명)데이터기준일자# duplicates
0설성농장돼지경기도 이천시 설성면<NA>2024-03-012
1형제농장돼지경기도 이천시 설성면경기도 이천시 설성면 대죽로2024-03-012