Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 68 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.6 KiB |
Average record size in memory | 69.9 B |
Variable types
Categorical | 4 |
---|---|
DateTime | 1 |
Text | 1 |
Numeric | 2 |
Dataset
Description | 우량치어 생산보급 현황 |
---|---|
Author | 경기도 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=7XF42W0V59M23VV6OEH71023049&infSeq=1 |
분양량 is highly overall correlated with 세입액(원) | High correlation |
세입액(원) is highly overall correlated with 분양량 | High correlation |
집계년도 is highly overall correlated with 어종명 and 1 other fields | High correlation |
어종명 is highly overall correlated with 집계년도 and 1 other fields | High correlation |
단가(원) is highly overall correlated with 집계년도 and 1 other fields | High correlation |
단가(원) is highly imbalanced (52.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 23:00:23.773913 |
---|---|
Analysis finished | 2023-12-10 23:00:24.625394 |
Duration | 0.85 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
집계년도
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 5.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 676.0 B |
2020 | |
---|---|
2017 | |
2018 | |
2019 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2020 |
---|---|
2nd row | 2020 |
3rd row | 2020 |
4th row | 2020 |
5th row | 2020 |
Common Values
Value | Count | Frequency (%) |
2020 | 24 | |
2017 | 17 | |
2018 | 15 | |
2019 | 12 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2020 | 24 | |
2017 | 17 | |
2018 | 15 | |
2019 | 12 |
어종명
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 5.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 676.0 B |
송어 | |
---|---|
산천어 | |
송어전암컷 | |
송어일반란 |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.7794118 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 송어 |
---|---|
2nd row | 송어 |
3rd row | 송어 |
4th row | 송어 |
5th row | 송어 |
Common Values
Value | Count | Frequency (%) |
송어 | 41 | |
산천어 | 14 | 20.6% |
송어전암컷 | 8 | 11.8% |
송어일반란 | 5 | 7.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
송어 | 41 | |
산천어 | 14 | 20.6% |
송어전암컷 | 8 | 11.8% |
송어일반란 | 5 | 7.4% |
분양일
Date
Distinct | 12 |
---|---|
Distinct (%) | 17.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 676.0 B |
Minimum | 2017-08-28 00:00:00 |
---|---|
Maximum | 2020-04-22 00:00:00 |
지역명
Categorical
Distinct | 14 |
---|---|
Distinct (%) | 20.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 676.0 B |
경기 | |
---|---|
충남 | |
강원 | |
서울 | |
인천 | |
Other values (9) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 4.4% |
Sample
1st row | 경기 |
---|---|
2nd row | 경기 |
3rd row | 충남 |
4th row | 충북 |
5th row | 전북 |
Common Values
Value | Count | Frequency (%) |
경기 | 16 | |
충남 | 11 | |
강원 | 10 | |
서울 | 6 | 8.8% |
인천 | 5 | 7.4% |
전남 | 4 | 5.9% |
충북 | 3 | 4.4% |
전북 | 3 | 4.4% |
경북 | 3 | 4.4% |
광주 | 2 | 2.9% |
Other values (4) | 5 | 7.4% |
Length
Value | Count | Frequency (%) |
경기 | 16 | |
충남 | 11 | |
강원 | 10 | |
서울 | 6 | 8.8% |
인천 | 5 | 7.4% |
전남 | 4 | 5.9% |
충북 | 3 | 4.4% |
전북 | 3 | 4.4% |
경북 | 3 | 4.4% |
광주 | 2 | 2.9% |
Other values (4) | 5 | 7.4% |
성명
Text
Distinct | 55 |
---|---|
Distinct (%) | 80.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 676.0 B |
Value | Count | Frequency (%) |
외 | 68 | |
이*호 | 4 | 2.9% |
최*수 | 4 | 2.9% |
유*선 | 3 | 2.2% |
김*수 | 3 | 2.2% |
민*훈 | 2 | 1.5% |
남*현 | 2 | 1.5% |
김*윤 | 2 | 1.5% |
최*석 | 1 | 0.7% |
이*담 | 1 | 0.7% |
Other values (46) | 46 |
Most occurring characters
Value | Count | Frequency (%) |
* | 68 | |
68 | ||
외 | 68 | |
김 | 16 | 4.7% |
이 | 15 | 4.4% |
호 | 8 | 2.4% |
최 | 7 | 2.1% |
수 | 7 | 2.1% |
남 | 4 | 1.2% |
원 | 4 | 1.2% |
Other values (50) | 75 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 204 | |
Other Punctuation | 68 | 20.0% |
Space Separator | 68 | 20.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
외 | 68 | |
김 | 16 | 7.8% |
이 | 15 | 7.4% |
호 | 8 | 3.9% |
최 | 7 | 3.4% |
수 | 7 | 3.4% |
남 | 4 | 2.0% |
원 | 4 | 2.0% |
선 | 4 | 2.0% |
유 | 4 | 2.0% |
Other values (48) | 67 |
Other Punctuation
Value | Count | Frequency (%) |
* | 68 |
Space Separator
Value | Count | Frequency (%) |
68 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 204 | |
Common | 136 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
외 | 68 | |
김 | 16 | 7.8% |
이 | 15 | 7.4% |
호 | 8 | 3.9% |
최 | 7 | 3.4% |
수 | 7 | 3.4% |
남 | 4 | 2.0% |
원 | 4 | 2.0% |
선 | 4 | 2.0% |
유 | 4 | 2.0% |
Other values (48) | 67 |
Common
Value | Count | Frequency (%) |
* | 68 | |
68 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 204 | |
ASCII | 136 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 68 | |
68 |
Hangul
Value | Count | Frequency (%) |
외 | 68 | |
김 | 16 | 7.8% |
이 | 15 | 7.4% |
호 | 8 | 3.9% |
최 | 7 | 3.4% |
수 | 7 | 3.4% |
남 | 4 | 2.0% |
원 | 4 | 2.0% |
선 | 4 | 2.0% |
유 | 4 | 2.0% |
Other values (48) | 67 |
분양량
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 40 |
---|---|
Distinct (%) | 58.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5723.5294 |
Minimum | 100 |
---|---|
Maximum | 77550 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 744.0 B |
Quantile statistics
Minimum | 100 |
---|---|
5-th percentile | 200 |
Q1 | 600 |
median | 1500 |
Q3 | 3350 |
95-th percentile | 27480 |
Maximum | 77550 |
Range | 77450 |
Interquartile range (IQR) | 2750 |
Descriptive statistics
Standard deviation | 12599.018 |
---|---|
Coefficient of variation (CV) | 2.2012673 |
Kurtosis | 17.677222 |
Mean | 5723.5294 |
Median Absolute Deviation (MAD) | 1000 |
Skewness | 3.9342719 |
Sum | 389200 |
Variance | 1.5873526 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1500 | 6 | 8.8% |
500 | 6 | 8.8% |
1000 | 5 | 7.4% |
200 | 5 | 7.4% |
2000 | 3 | 4.4% |
1300 | 3 | 4.4% |
300 | 3 | 4.4% |
1100 | 2 | 2.9% |
600 | 2 | 2.9% |
2500 | 2 | 2.9% |
Other values (30) | 31 |
Value | Count | Frequency (%) |
100 | 2 | 2.9% |
200 | 5 | |
300 | 3 | |
500 | 6 | |
600 | 2 | 2.9% |
700 | 1 | 1.5% |
800 | 1 | 1.5% |
950 | 1 | 1.5% |
1000 | 5 | |
1100 | 2 | 2.9% |
Value | Count | Frequency (%) |
77550 | 1 | |
50450 | 1 | |
37000 | 1 | |
30000 | 1 | |
22800 | 1 | |
21000 | 1 | |
20000 | 1 | |
12000 | 1 | |
11200 | 1 | |
10000 | 1 |
세입액(원)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 42 |
---|---|
Distinct (%) | 61.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1399058.8 |
Minimum | 25000 |
---|---|
Maximum | 19387500 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 744.0 B |
Quantile statistics
Minimum | 25000 |
---|---|
5-th percentile | 50000 |
Q1 | 150000 |
median | 375000 |
Q3 | 806250 |
95-th percentile | 6712500 |
Maximum | 19387500 |
Range | 19362500 |
Interquartile range (IQR) | 656250 |
Descriptive statistics
Standard deviation | 3122229.5 |
---|---|
Coefficient of variation (CV) | 2.2316642 |
Kurtosis | 18.546861 |
Mean | 1399058.8 |
Median Absolute Deviation (MAD) | 250000 |
Skewness | 4.0401763 |
Sum | 95136000 |
Variance | 9.7483168 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
375000 | 6 | 8.8% |
125000 | 5 | 7.4% |
50000 | 5 | 7.4% |
250000 | 4 | 5.9% |
150000 | 3 | 4.4% |
325000 | 3 | 4.4% |
400000 | 2 | 2.9% |
75000 | 2 | 2.9% |
500000 | 2 | 2.9% |
625000 | 2 | 2.9% |
Other values (32) | 34 |
Value | Count | Frequency (%) |
25000 | 2 | 2.9% |
50000 | 5 | |
54000 | 1 | 1.5% |
75000 | 2 | 2.9% |
125000 | 5 | |
150000 | 3 | |
175000 | 1 | 1.5% |
198000 | 1 | 1.5% |
200000 | 1 | 1.5% |
237500 | 1 | 1.5% |
Value | Count | Frequency (%) |
19387500 | 1 | |
12612500 | 1 | |
9250000 | 1 | |
7500000 | 1 | |
5250000 | 1 | |
5000000 | 1 | |
4104000 | 1 | |
3000000 | 1 | |
2800000 | 1 | |
1800000 | 2 |
단가(원)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 4.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 676.0 B |
250 | |
---|---|
300 | 5 |
180 | 5 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 250 |
---|---|
2nd row | 250 |
3rd row | 250 |
4th row | 250 |
5th row | 250 |
Common Values
Value | Count | Frequency (%) |
250 | 58 | |
300 | 5 | 7.4% |
180 | 5 | 7.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
250 | 58 | |
300 | 5 | 7.4% |
180 | 5 | 7.4% |
집계년도 | 어종명 | 분양일 | 지역명 | 성명 | 분양량 | 세입액(원) | 단가(원) | |
---|---|---|---|---|---|---|---|---|
집계년도 | 1.000 | 0.869 | 1.000 | 0.000 | 0.263 | 0.225 | 0.273 | 0.516 |
어종명 | 0.869 | 1.000 | 0.740 | 0.000 | 0.000 | 0.000 | 0.000 | 0.748 |
분양일 | 1.000 | 0.740 | 1.000 | 0.000 | 0.946 | 0.000 | 0.000 | 0.684 |
지역명 | 0.000 | 0.000 | 0.000 | 1.000 | 0.939 | 0.000 | 0.000 | 0.000 |
성명 | 0.263 | 0.000 | 0.946 | 0.939 | 1.000 | 0.000 | 0.000 | 0.000 |
분양량 | 0.225 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
세입액(원) | 0.273 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
단가(원) | 0.516 | 0.748 | 0.684 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
지역명 | 단가(원) | 집계년도 | 어종명 | |
---|---|---|---|---|
지역명 | 1.000 | 0.000 | 0.000 | 0.000 |
단가(원) | 0.000 | 1.000 | 0.513 | 0.790 |
집계년도 | 0.000 | 0.513 | 1.000 | 0.533 |
어종명 | 0.000 | 0.790 | 0.533 | 1.000 |
분양량 | 세입액(원) | 집계년도 | 어종명 | 지역명 | 단가(원) | |
---|---|---|---|---|---|---|
분양량 | 1.000 | 0.997 | 0.148 | 0.000 | 0.000 | 0.000 |
세입액(원) | 0.997 | 1.000 | 0.189 | 0.000 | 0.000 | 0.000 |
집계년도 | 0.148 | 0.189 | 1.000 | 0.533 | 0.000 | 0.513 |
어종명 | 0.000 | 0.000 | 0.533 | 1.000 | 0.000 | 0.790 |
지역명 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
단가(원) | 0.000 | 0.000 | 0.513 | 0.790 | 0.000 | 1.000 |
집계년도 | 어종명 | 분양일 | 지역명 | 성명 | 분양량 | 세입액(원) | 단가(원) | |
---|---|---|---|---|---|---|---|---|
0 | 2020 | 송어 | 2020-03-23 | 경기 | 김*수 외 | 2400 | 400000 | 250 |
1 | 2020 | 송어 | 2020-04-22 | 경기 | 최*원 외 | 5700 | 1425000 | 250 |
2 | 2020 | 송어 | 2020-03-23 | 충남 | 이*호 외 | 3100 | 775000 | 250 |
3 | 2020 | 송어 | 2020-03-23 | 충북 | 이*선 외 | 500 | 125000 | 250 |
4 | 2020 | 송어 | 2020-03-24 | 전북 | 최*석 외 | 1000 | 250000 | 250 |
5 | 2020 | 송어 | 2020-03-24 | 강원 | 임*원 외 | 1300 | 325000 | 250 |
6 | 2020 | 송어 | 2020-03-24 | 경기 | 김*엽 외 | 200 | 50000 | 250 |
7 | 2020 | 송어 | 2020-03-25 | 전남 | 김*완 외 | 1000 | 250000 | 250 |
8 | 2020 | 송어 | 2020-03-25 | 충남 | 송*호 외 | 100 | 25000 | 250 |
9 | 2020 | 송어 | 2020-03-25 | 경기 | 강*호 외 | 1000 | 250000 | 250 |
집계년도 | 어종명 | 분양일 | 지역명 | 성명 | 분양량 | 세입액(원) | 단가(원) | |
---|---|---|---|---|---|---|---|---|
58 | 2017 | 송어전암컷 | 2017-08-28 | 서울 | 이*남 외 | 3300 | 825000 | 250 |
59 | 2017 | 산천어 | 2017-08-28 | 경북 | 최*수 외 | 200 | 50000 | 250 |
60 | 2017 | 송어전암컷 | 2017-08-28 | 경북 | 최*수 외 | 200 | 50000 | 250 |
61 | 2017 | 산천어 | 2017-08-28 | 경기 | 김*호 외 | 2550 | 637500 | 250 |
62 | 2017 | 송어일반란 | 2017-08-28 | 경기 | 엄*성 외 | 22800 | 4104000 | 180 |
63 | 2017 | 송어전암컷 | 2017-08-28 | 경기 | 유*선 외 | 50450 | 12612500 | 250 |
64 | 2017 | 산천어 | 2017-08-28 | 강원 | 김*수 외 | 1500 | 375000 | 250 |
65 | 2017 | 송어일반란 | 2017-08-28 | 충북 | 최*수 외 | 1100 | 198000 | 180 |
66 | 2017 | 송어전암컷 | 2017-08-28 | 강원 | 박*호 외 | 500 | 125000 | 250 |
67 | 2017 | 송어일반란 | 2017-08-28 | 강원 | 이*진 외 | 10000 | 1800000 | 180 |