Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 84 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.1 KiB |
Average record size in memory | 50.6 B |
Variable types
Text | 1 |
---|---|
Categorical | 4 |
Numeric | 1 |
Dataset
Description | 청주시 축산농장 현황 (주소, 축주명, 축종 등) |
---|---|
Author | 충청북도 청주시 |
URL | https://www.data.go.kr/data/15021577/fileData.do |
축주명 is highly overall correlated with 비 고 | High correlation |
축종 is highly overall correlated with 사육규모 and 2 other fields | High correlation |
품종 is highly overall correlated with 축종 and 1 other fields | High correlation |
비 고 is highly overall correlated with 사육규모 and 3 other fields | High correlation |
사육규모 is highly overall correlated with 축종 and 1 other fields | High correlation |
비 고 is highly imbalanced (58.6%) | Imbalance |
Reproduction
Analysis started | 2023-12-13 00:48:34.394348 |
---|---|
Analysis finished | 2023-12-13 00:48:34.876015 |
Duration | 0.48 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
주소
Text
Distinct | 64 |
---|---|
Distinct (%) | 76.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 804.0 B |
Length
Max length | 20 |
---|---|
Median length | 16 |
Mean length | 16.214286 |
Min length | 15 |
Characters and Unicode
Total characters | 1362 |
---|---|
Distinct characters | 92 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 51 ? |
---|---|
Unique (%) | 60.7% |
Sample
1st row | 충청북도 청주시 가덕면 계산리 |
---|---|
2nd row | 충청북도 청주시 가덕면 내암리 |
3rd row | 충청북도 청주시 가덕면 삼항2리 |
4th row | 충청북도 청주시 가덕면 삼항리 |
5th row | 충청북도 청주시 가덕면 인차리 |
Value | Count | Frequency (%) |
충청북도 | 84 | |
청주시 | 84 | |
북이면 | 20 | 5.9% |
미원면 | 12 | 3.6% |
가덕면 | 12 | 3.6% |
오창읍 | 8 | 2.4% |
옥산면 | 8 | 2.4% |
오송읍 | 6 | 1.8% |
화상리 | 6 | 1.8% |
강내면 | 5 | 1.5% |
Other values (67) | 93 |
Most occurring characters
Value | Count | Frequency (%) |
263 | ||
청 | 169 | |
북 | 106 | 7.8% |
도 | 87 | 6.4% |
충 | 84 | 6.2% |
주 | 84 | 6.2% |
시 | 84 | 6.2% |
리 | 83 | 6.1% |
면 | 65 | 4.8% |
이 | 25 | 1.8% |
Other values (82) | 312 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1097 | |
Space Separator | 263 | 19.3% |
Decimal Number | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
청 | 169 | |
북 | 106 | 9.7% |
도 | 87 | 7.9% |
충 | 84 | 7.7% |
주 | 84 | 7.7% |
시 | 84 | 7.7% |
리 | 83 | 7.6% |
면 | 65 | 5.9% |
이 | 25 | 2.3% |
읍 | 18 | 1.6% |
Other values (79) | 292 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 |
Space Separator
Value | Count | Frequency (%) |
263 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1097 | |
Common | 265 | 19.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
청 | 169 | |
북 | 106 | 9.7% |
도 | 87 | 7.9% |
충 | 84 | 7.7% |
주 | 84 | 7.7% |
시 | 84 | 7.7% |
리 | 83 | 7.6% |
면 | 65 | 5.9% |
이 | 25 | 2.3% |
읍 | 18 | 1.6% |
Other values (79) | 292 |
Common
Value | Count | Frequency (%) |
263 | ||
1 | 1 | 0.4% |
2 | 1 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1097 | |
ASCII | 265 | 19.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
263 | ||
1 | 1 | 0.4% |
2 | 1 | 0.4% |
Hangul
Value | Count | Frequency (%) |
청 | 169 | |
북 | 106 | 9.7% |
도 | 87 | 7.9% |
충 | 84 | 7.7% |
주 | 84 | 7.7% |
시 | 84 | 7.7% |
리 | 83 | 7.6% |
면 | 65 | 5.9% |
이 | 25 | 2.3% |
읍 | 18 | 1.6% |
Other values (79) | 292 |
축주명
Categorical
HIGH CORRELATION
 
Distinct | 23 |
---|---|
Distinct (%) | 27.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 804.0 B |
이○○ | |
---|---|
김○○ | |
박○○ | |
최○○ | |
강○○ | |
Other values (18) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 7.1% |
Sample
1st row | 이○○ |
---|---|
2nd row | 이○○ |
3rd row | 전○○ |
4th row | 오○○ |
5th row | 강○○ |
Common Values
Value | Count | Frequency (%) |
이○○ | 17 | |
김○○ | 17 | |
박○○ | 9 | |
최○○ | 5 | 6.0% |
강○○ | 4 | 4.8% |
유○○ | 3 | 3.6% |
장○○ | 3 | 3.6% |
홍○○ | 2 | 2.4% |
한○○ | 2 | 2.4% |
정○○ | 2 | 2.4% |
Other values (13) | 20 |
Length
Value | Count | Frequency (%) |
이○○ | 17 | |
김○○ | 17 | |
박○○ | 9 | |
최○○ | 5 | 6.0% |
강○○ | 4 | 4.8% |
유○○ | 3 | 3.6% |
장○○ | 3 | 3.6% |
전○○ | 2 | 2.4% |
변○○ | 2 | 2.4% |
지○○ | 2 | 2.4% |
Other values (13) | 20 |
축종
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 4.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 804.0 B |
닭 | |
---|---|
오리 | |
메추리 | 3 |
<NA> | 1 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.3690476 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.2% |
Sample
1st row | 닭 |
---|---|
2nd row | 닭 |
3rd row | 닭 |
4th row | 닭 |
5th row | 닭 |
Common Values
Value | Count | Frequency (%) |
닭 | 58 | |
오리 | 22 | 26.2% |
메추리 | 3 | 3.6% |
<NA> | 1 | 1.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
닭 | 58 | |
오리 | 22 | 26.2% |
메추리 | 3 | 3.6% |
na | 1 | 1.2% |
품종
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 8.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 804.0 B |
육계 | |
---|---|
육용오리 | |
토종닭 | |
산란계 | |
육종계 | 3 |
Other values (2) |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 2.8809524 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.2% |
Sample
1st row | 육계 |
---|---|
2nd row | 육계 |
3rd row | 육계 |
4th row | 육계 |
5th row | 육계 |
Common Values
Value | Count | Frequency (%) |
육계 | 37 | |
육용오리 | 21 | |
토종닭 | 15 | |
산란계 | 4 | 4.8% |
육종계 | 3 | 3.6% |
산란메추리 | 3 | 3.6% |
종오리 | 1 | 1.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
육계 | 37 | |
육용오리 | 21 | |
토종닭 | 15 | |
산란계 | 4 | 4.8% |
육종계 | 3 | 3.6% |
산란메추리 | 3 | 3.6% |
종오리 | 1 | 1.2% |
사육규모
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 46 |
---|---|
Distinct (%) | 54.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 31745.238 |
Minimum | 300 |
---|---|
Maximum | 170000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 888.0 B |
Quantile statistics
Minimum | 300 |
---|---|
5-th percentile | 4690 |
Q1 | 13750 |
median | 24750 |
Q3 | 46700 |
95-th percentile | 69700 |
Maximum | 170000 |
Range | 169700 |
Interquartile range (IQR) | 32950 |
Descriptive statistics
Standard deviation | 26248.127 |
---|---|
Coefficient of variation (CV) | 0.82683669 |
Kurtosis | 8.2313934 |
Mean | 31745.238 |
Median Absolute Deviation (MAD) | 14750 |
Skewness | 2.1444723 |
Sum | 2666600 |
Variance | 6.8896419 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
30000 | 6 | 7.1% |
50000 | 6 | 7.1% |
10000 | 5 | 6.0% |
15000 | 5 | 6.0% |
40000 | 4 | 4.8% |
60000 | 4 | 4.8% |
12000 | 3 | 3.6% |
20000 | 3 | 3.6% |
19000 | 3 | 3.6% |
35000 | 3 | 3.6% |
Other values (36) | 42 |
Value | Count | Frequency (%) |
300 | 1 | 1.2% |
400 | 1 | 1.2% |
1000 | 2 | 2.4% |
4600 | 1 | 1.2% |
5200 | 1 | 1.2% |
6400 | 1 | 1.2% |
7500 | 1 | 1.2% |
9000 | 2 | 2.4% |
9500 | 1 | 1.2% |
10000 | 5 |
Value | Count | Frequency (%) |
170000 | 1 | 1.2% |
95000 | 1 | 1.2% |
87000 | 1 | 1.2% |
82000 | 1 | 1.2% |
70000 | 1 | 1.2% |
68000 | 1 | 1.2% |
64000 | 1 | 1.2% |
60000 | 4 | |
59000 | 1 | 1.2% |
55000 | 1 | 1.2% |
비 고
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 804.0 B |
<NA> | |
---|---|
AI | 7 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8333333 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 77 | |
AI | 7 | 8.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 77 | |
ai | 7 | 8.3% |
주소 | 축주명 | 축종 | 품종 | 사육규모 | |
---|---|---|---|---|---|
주소 | 1.000 | 0.803 | 0.908 | 0.975 | 0.738 |
축주명 | 0.803 | 1.000 | 0.627 | 0.509 | 0.460 |
축종 | 0.908 | 0.627 | 1.000 | 1.000 | 0.647 |
품종 | 0.975 | 0.509 | 1.000 | 1.000 | 0.742 |
사육규모 | 0.738 | 0.460 | 0.647 | 0.742 | 1.000 |
축주명 | 축종 | 품종 | 비 고 | |
---|---|---|---|---|
축주명 | 1.000 | 0.354 | 0.213 | 1.000 |
축종 | 0.354 | 1.000 | 0.975 | 1.000 |
품종 | 0.213 | 0.975 | 1.000 | 1.000 |
비 고 | 1.000 | 1.000 | 1.000 | 1.000 |
사육규모 | 축주명 | 축종 | 품종 | 비 고 | |
---|---|---|---|---|---|
사육규모 | 1.000 | 0.192 | 0.521 | 0.335 | 1.000 |
축주명 | 0.192 | 1.000 | 0.354 | 0.213 | 1.000 |
축종 | 0.521 | 0.354 | 1.000 | 0.975 | 1.000 |
품종 | 0.335 | 0.213 | 0.975 | 1.000 | 1.000 |
비 고 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
주소 | 축주명 | 축종 | 품종 | 사육규모 | 비 고 | |
---|---|---|---|---|---|---|
0 | 충청북도 청주시 가덕면 계산리 | 이○○ | 닭 | 육계 | 40000 | <NA> |
1 | 충청북도 청주시 가덕면 내암리 | 이○○ | 닭 | 육계 | 19000 | <NA> |
2 | 충청북도 청주시 가덕면 삼항2리 | 전○○ | 닭 | 육계 | 12000 | <NA> |
3 | 충청북도 청주시 가덕면 삼항리 | 오○○ | 닭 | 육계 | 12000 | <NA> |
4 | 충청북도 청주시 가덕면 인차리 | 강○○ | 닭 | 육계 | 18000 | <NA> |
5 | 충청북도 청주시 가덕면 행정리 | 김○○ | 닭 | 육계 | 60000 | <NA> |
6 | 충청북도 청주시 강내면 연정리 | 이○○ | 닭 | 육계 | 40000 | <NA> |
7 | 충청북도 청주시 강내면 저산리 | 이○○ | 닭 | 육계 | 40000 | <NA> |
8 | 충청북도 청주시 남이면 비룡리 | 이○○ | 닭 | 육계 | 30000 | <NA> |
9 | 충청북도 청주시 남이면 상발리 | 박○○ | 닭 | 육계 | 33000 | <NA> |
주소 | 축주명 | 축종 | 품종 | 사육규모 | 비 고 | |
---|---|---|---|---|---|---|
74 | 충청북도 청주시 내수읍 도원리 | 김○○ | 오리 | 육용오리 | 5200 | <NA> |
75 | 충청북도 청주시 옥산면 장남리 | 공○○ | 오리 | 육용오리 | 7500 | <NA> |
76 | 충청북도 청주시 옥산면 신촌리 | 윤○○ | 오리 | 육용오리 | 25000 | <NA> |
77 | 충청북도 청주시 옥산면 신촌리 | 박○○ | 오리 | 육용오리 | 9500 | <NA> |
78 | 충청북도 청주시 오창읍 도암리 | 연○○ | 오리 | 육용오리 | 12000 | <NA> |
79 | 충청북도 청주시 오창읍 성재리 | 유○○ | 오리 | 육용오리 | 10600 | AI |
80 | 충청북도 청주시 오창읍 괴정리 | 김○○ | 오리 | 육용오리 | 14000 | <NA> |
81 | 충청북도 청주시 오송읍 쌍청리 | 변○○ | 오리 | 육용오리 | 15000 | AI |
82 | 충청북도 청주시 미원면 운교리 | 이○○ | 오리 | 육용오리 | 16000 | <NA> |
83 | 충청북도 청주시 미원면 월용리 산 | 조○○ | 오리 | 종오리 | 6400 | <NA> |