Overview

Dataset statistics

Number of variables7
Number of observations4462
Missing cells64
Missing cells (%)0.2%
Duplicate rows120
Duplicate rows (%)2.7%
Total size in memory248.5 KiB
Average record size in memory57.0 B

Variable types

Categorical4
Text1
Numeric1
DateTime1

Alerts

Dataset has 120 (2.7%) duplicate rowsDuplicates
가축전염병명 is highly overall correlated with 축종명High correlation
축종명 is highly overall correlated with 가축전염병명High correlation
감염두수 has 64 (1.4%) missing valuesMissing
감염두수 is highly skewed (γ1 = 36.56072851)Skewed
감염두수 has 113 (2.5%) zerosZeros

Reproduction

Analysis started2023-12-10 20:59:37.584157
Analysis finished2023-12-10 20:59:38.386423
Duration0.8 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

시군명
Categorical

Distinct30
Distinct (%)0.7%
Missing0
Missing (%)0.0%
Memory size35.0 KiB
화성시
613 
안성시
516 
용인시
423 
평택시
361 
포천시
327 
Other values (25)
2222 

Length

Max length4
Median length3
Mean length3.0425818
Min length3

Unique

Unique3 ?
Unique (%)0.1%

Sample

1st row가평군
2nd row가평군
3rd row가평군
4th row가평군
5th row가평군

Common Values

ValueCountFrequency (%)
화성시 613
13.7%
안성시 516
11.6%
용인시 423
9.5%
평택시 361
 
8.1%
포천시 327
 
7.3%
이천시 316
 
7.1%
양평군 264
 
5.9%
파주시 252
 
5.6%
여주시 203
 
4.5%
양주시 199
 
4.5%
Other values (20) 988
22.1%

Length

2023-12-11T05:59:38.449873image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
화성시 613
13.7%
안성시 516
11.6%
용인시 423
9.5%
평택시 361
 
8.1%
포천시 327
 
7.3%
이천시 316
 
7.1%
양평군 264
 
5.9%
파주시 252
 
5.6%
여주시 203
 
4.5%
양주시 199
 
4.5%
Other values (20) 988
22.1%

가축전염병명
Categorical

HIGH CORRELATION 

Distinct15
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size35.0 KiB
결핵병
1969 
브루셀라병
1099 
돼지오제스키병
390 
가금티프스
198 
고병원성 조류인플루엔자
 
179
Other values (10)
627 

Length

Max length16
Median length12
Mean length4.8955625
Min length3

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row뉴캣슬병
2nd row결핵병
3rd row결핵병
4th row가금티프스
5th row가금티프스

Common Values

ValueCountFrequency (%)
결핵병 1969
44.1%
브루셀라병 1099
24.6%
돼지오제스키병 390
 
8.7%
가금티프스 198
 
4.4%
고병원성 조류인플루엔자 179
 
4.0%
낭충봉아부패병 175
 
3.9%
돼지생식기호흡기증후군 147
 
3.3%
구제역 107
 
2.4%
고병원성조류인플루엔자 84
 
1.9%
뉴캣슬병 58
 
1.3%
Other values (5) 56
 
1.3%

Length

2023-12-11T05:59:38.556441image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
결핵병 1969
42.4%
브루셀라병 1099
23.7%
돼지오제스키병 390
 
8.4%
가금티프스 198
 
4.3%
고병원성 179
 
3.9%
조류인플루엔자 179
 
3.9%
낭충봉아부패병 175
 
3.8%
돼지생식기호흡기증후군 147
 
3.2%
구제역 107
 
2.3%
고병원성조류인플루엔자 84
 
1.8%
Other values (6) 114
 
2.5%
Distinct953
Distinct (%)21.4%
Missing0
Missing (%)0.0%
Memory size35.0 KiB
2023-12-11T05:59:38.842345image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length20
Median length15
Mean length14.805468
Min length10

Characters and Unicode

Total characters66062
Distinct characters261
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique290 ?
Unique (%)6.5%

Sample

1st row경기도 가평군 하면
2nd row경기도 가평군 청평면 상천리
3rd row경기도 가평군 하면 현리
4th row경기도 가평군 설악면 위곡리
5th row경기도 가평군 설악면 송산리
ValueCountFrequency (%)
경기도 4462
25.3%
화성시 613
 
3.5%
안성시 516
 
2.9%
용인시 423
 
2.4%
처인구 410
 
2.3%
평택시 361
 
2.1%
포천시 327
 
1.9%
이천시 316
 
1.8%
양평군 264
 
1.5%
파주시 252
 
1.4%
Other values (978) 9664
54.9%
2023-12-11T05:59:39.291039image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
13146
19.9%
4663
 
7.1%
4499
 
6.8%
4468
 
6.8%
3904
 
5.9%
3697
 
5.6%
2826
 
4.3%
1375
 
2.1%
1207
 
1.8%
1125
 
1.7%
Other values (251) 25152
38.1%

Most occurring categories

ValueCountFrequency (%)
Other Letter 52915
80.1%
Space Separator 13146
 
19.9%
Decimal Number 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
4663
 
8.8%
4499
 
8.5%
4468
 
8.4%
3904
 
7.4%
3697
 
7.0%
2826
 
5.3%
1375
 
2.6%
1207
 
2.3%
1125
 
2.1%
1014
 
1.9%
Other values (249) 24137
45.6%
Space Separator
ValueCountFrequency (%)
13146
100.0%
Decimal Number
ValueCountFrequency (%)
1 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 52915
80.1%
Common 13147
 
19.9%

Most frequent character per script

Hangul
ValueCountFrequency (%)
4663
 
8.8%
4499
 
8.5%
4468
 
8.4%
3904
 
7.4%
3697
 
7.0%
2826
 
5.3%
1375
 
2.6%
1207
 
2.3%
1125
 
2.1%
1014
 
1.9%
Other values (249) 24137
45.6%
Common
ValueCountFrequency (%)
13146
> 99.9%
1 1
 
< 0.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 52915
80.1%
ASCII 13147
 
19.9%

Most frequent character per block

ASCII
ValueCountFrequency (%)
13146
> 99.9%
1 1
 
< 0.1%
Hangul
ValueCountFrequency (%)
4663
 
8.8%
4499
 
8.5%
4468
 
8.4%
3904
 
7.4%
3697
 
7.0%
2826
 
5.3%
1375
 
2.6%
1207
 
2.3%
1125
 
2.1%
1014
 
1.9%
Other values (249) 24137
45.6%

축종명
Categorical

HIGH CORRELATION 

Distinct46
Distinct (%)1.0%
Missing0
Missing (%)0.0%
Memory size35.0 KiB
소-젖소
1313 
소-한우
1140 
돼지
435 
소-육우
229 
218 
Other values (41)
1127 

Length

Max length7
Median length4
Mean length3.8648588
Min length1

Unique

Unique8 ?
Unique (%)0.2%

Sample

1st row
2nd row
3rd row소-육우
4th row닭-육계
5th row닭-육계

Common Values

ValueCountFrequency (%)
소-젖소 1313
29.4%
소-한우 1140
25.5%
돼지 435
 
9.7%
소-육우 229
 
5.1%
218
 
4.9%
닭-산란계 198
 
4.4%
닭-육계 146
 
3.3%
벌-재래종 144
 
3.2%
사슴-엘크 122
 
2.7%
돼지-육성돈 93
 
2.1%
Other values (36) 424
 
9.5%

Length

2023-12-11T05:59:39.464518image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
소-젖소 1313
29.4%
소-한우 1140
25.5%
돼지 435
 
9.7%
소-육우 229
 
5.1%
218
 
4.9%
닭-산란계 198
 
4.4%
닭-육계 146
 
3.3%
벌-재래종 144
 
3.2%
사슴-엘크 122
 
2.7%
돼지-육성돈 93
 
2.1%
Other values (36) 424
 
9.5%

감염두수
Real number (ℝ)

MISSING  SKEWED  ZEROS 

Distinct231
Distinct (%)5.3%
Missing64
Missing (%)1.4%
Infinite0
Infinite (%)0.0%
Mean836.99
Minimum0
Maximum443000
Zeros113
Zeros (%)2.5%
Negative0
Negative (%)0.0%
Memory size39.3 KiB
2023-12-11T05:59:39.612462image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile1
Q11
median3
Q39
95-th percentile1000
Maximum443000
Range443000
Interquartile range (IQR)8

Descriptive statistics

Standard deviation8382.1731
Coefficient of variation (CV)10.014663
Kurtosis1802.2388
Mean836.99
Median Absolute Deviation (MAD)2
Skewness36.560729
Sum3681082
Variance70260826
MonotonicityNot monotonic
2023-12-11T05:59:39.735968image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1346
30.2%
2 616
13.8%
3 364
 
8.2%
4 278
 
6.2%
5 176
 
3.9%
6 168
 
3.8%
0 113
 
2.5%
10 98
 
2.2%
7 96
 
2.2%
8 91
 
2.0%
Other values (221) 1052
23.6%
ValueCountFrequency (%)
0 113
 
2.5%
1 1346
30.2%
2 616
13.8%
3 364
 
8.2%
4 278
 
6.2%
5 176
 
3.9%
6 168
 
3.8%
7 96
 
2.2%
8 91
 
2.0%
9 72
 
1.6%
ValueCountFrequency (%)
443000 1
 
< 0.1%
154800 1
 
< 0.1%
110000 1
 
< 0.1%
107000 1
 
< 0.1%
64890 1
 
< 0.1%
46000 3
0.1%
44500 1
 
< 0.1%
42911 1
 
< 0.1%
42000 1
 
< 0.1%
40000 4
0.1%
Distinct2596
Distinct (%)58.2%
Missing0
Missing (%)0.0%
Memory size35.0 KiB
Minimum1995-06-22 00:00:00
Maximum2023-01-03 00:00:00
2023-12-11T05:59:39.882706image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-11T05:59:40.043749image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
Distinct38
Distinct (%)0.9%
Missing0
Missing (%)0.0%
Memory size35.0 KiB
경기 남부지소
1035 
경기도축산위생연구소
720 
경기 동부지소
566 
경기북부 북부지소
502 
조류질병과
276 
Other values (33)
1363 

Length

Max length13
Median length12
Mean length8.2064097
Min length4

Unique

Unique8 ?
Unique (%)0.2%

Sample

1st row동북부지소
2nd row동북부지소
3rd row동북부지소
4th row동북부지소
5th row동북부지소

Common Values

ValueCountFrequency (%)
경기 남부지소 1035
23.2%
경기도축산위생연구소 720
16.1%
경기 동부지소 566
12.7%
경기북부 북부지소 502
11.3%
조류질병과 276
 
6.2%
경기도북부축산위생연구소 274
 
6.1%
경기 서부지소 185
 
4.1%
동북부지소 183
 
4.1%
경기 북부 동물위생시험소 142
 
3.2%
경기 북부 북부지소 115
 
2.6%
Other values (28) 464
10.4%

Length

2023-12-11T05:59:40.188326image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
경기 2051
27.5%
남부지소 1043
14.0%
경기도축산위생연구소 720
 
9.7%
북부지소 623
 
8.4%
동부지소 566
 
7.6%
경기북부 502
 
6.7%
조류질병과 276
 
3.7%
경기도북부축산위생연구소 274
 
3.7%
북부 258
 
3.5%
동물위생시험소 250
 
3.4%
Other values (26) 886
11.9%

Interactions

2023-12-11T05:59:38.081893image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-11T05:59:40.272239image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
시군명가축전염병명축종명감염두수병성감정기관명
시군명1.0000.6730.6910.0000.851
가축전염병명0.6731.0000.9580.2160.882
축종명0.6910.9581.0000.0000.882
감염두수0.0000.2160.0001.0000.000
병성감정기관명0.8510.8820.8820.0001.000
2023-12-11T05:59:40.381345image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
축종명가축전염병명시군명병성감정기관명
축종명1.0000.6280.1930.341
가축전염병명0.6281.0000.2320.483
시군명0.1930.2321.0000.336
병성감정기관명0.3410.4830.3361.000
2023-12-11T05:59:40.483448image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
감염두수시군명가축전염병명축종명병성감정기관명
감염두수1.0000.0000.0930.0000.000
시군명0.0001.0000.2320.1930.336
가축전염병명0.0930.2321.0000.6280.483
축종명0.0000.1930.6281.0000.341
병성감정기관명0.0000.3360.4830.3411.000

Missing values

2023-12-11T05:59:38.180282image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-11T05:59:38.312231image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

시군명가축전염병명농장소재지축종명감염두수진단일자병성감정기관명
0가평군뉴캣슬병경기도 가평군 하면702000-05-23동북부지소
1가평군결핵병경기도 가평군 청평면 상천리12002-10-10동북부지소
2가평군결핵병경기도 가평군 하면 현리소-육우52003-09-05동북부지소
3가평군가금티프스경기도 가평군 설악면 위곡리닭-육계20002003-11-10동북부지소
4가평군가금티프스경기도 가평군 설악면 송산리닭-육계80002003-11-24동북부지소
5가평군가금티프스경기도 가평군 설악면 가일리닭-산란계20002003-11-29제일바이오
6가평군가금티프스경기도 가평군 설악면 가일리닭-산란계20002003-11-29제일바이오
7가평군뉴캣슬병경기도 가평군 청평면 상천리닭-육계160002004-01-17동북부지소
8가평군가금티프스경기도 가평군 설악면 이천리닭-육계100002004-04-03동북부지소
9가평군결핵병경기도 가평군 설악면 회곡리소-젖소62004-06-03동북부지소
시군명가축전염병명농장소재지축종명감염두수진단일자병성감정기관명
4452화성시결핵병경기도 화성시 매송면 숙곡리소-젖소12022-01-19경기도 동물위생시험소
4453화성시브루셀라병경기도 화성시 우정읍 주곡리소-한우12022-01-21경기도 동물위생시험소
4454화성시고병원성조류인플루엔자경기도 화성시 남양읍 온석리닭-산란계02022-01-23조류인플루엔자연구진단과
4455화성시고병원성조류인플루엔자경기도 화성시 향남읍 상신리닭-산란계02022-01-23조류인플루엔자연구진단과
4456화성시결핵병경기도 화성시 매송면 숙곡리소-젖소362022-01-28경기도 동물위생시험소
4457화성시결핵병경기도 화성시 매송면 천천리소-젖소12022-06-22경기도 동물위생시험소
4458화성시결핵병경기도 화성시 매송면 천천리소-젖소102022-07-01경기도 동물위생시험소
4459화성시결핵병경기도 화성시 정남면 고지리사슴-엘크102022-08-04경기도 동물위생시험소
4460화성시결핵병경기도 화성시 정남면 고지리사슴-엘크62022-08-04경기도 동물위생시험소
4461화성시고병원성조류인플루엔자경기도 화성시 향남읍 구문천리닭-종계02022-11-17조류인플루엔자연구진단과

Duplicate rows

Most frequently occurring

시군명가축전염병명농장소재지축종명감염두수진단일자병성감정기관명# duplicates
63용인시돼지오제스키병경기도 용인시 처인구 포곡읍 신원리돼지12000-12-05경기 남부지소5
107포천시고병원성 조류인플루엔자경기도 포천시 영북면 자일리닭-산란계02016-12-07조류질병과4
17성남시고병원성 조류인플루엔자경기도 성남시 중원구 성남동닭-토종닭12014-12-29조류질병과3
19시흥시결핵병경기도 시흥시 방산동소-젖소32000-03-23경기도축산위생연구소3
64용인시돼지오제스키병경기도 용인시 처인구 포곡읍 신원리돼지12001-12-14경기 남부지소3
68용인시돼지오제스키병경기도 용인시 처인구 포곡읍 신원리돼지22000-12-05경기 남부지소3
71용인시돼지오제스키병경기도 용인시 처인구 포곡읍 신원리돼지42000-12-05경기 남부지소3
74용인시돼지오제스키병경기도 용인시 처인구 포곡읍 신원리돼지82000-12-05경기 남부지소3
77용인시돼지오제스키병경기도 용인시 처인구 포곡읍 유운리돼지22002-12-07경기 남부지소3
108포천시고병원성 조류인플루엔자경기도 포천시 영북면 자일리닭-산란계02016-12-09조류질병과3