Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 3610 |
Missing cells | 3610 |
Missing cells (%) | 14.3% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 215.2 KiB |
Average record size in memory | 61.0 B |
Variable types
Categorical | 2 |
---|---|
Unsupported | 1 |
Text | 1 |
Numeric | 3 |
Dataset
Description | 공인중개사의 업무 및 부동산 거래신고에 관한 법률 제27조에 의해 신고된 농지(논,밭,과수원)의 실거래 가격 정보(읍.면.동별 평균, 최저,최고가) |
---|---|
Author | 농림축산식품부 |
URL | https://data.mafra.go.kr/opendata/data/indexOpenDataDetail.do?data_id=20220217000000002080 |
QU is highly overall correlated with YEAR | High correlation |
YEAR is highly overall correlated with QU | High correlation |
LNDPCL is highly overall correlated with MUMMPC | High correlation |
MUMMPC is highly overall correlated with LNDPCL and 1 other fields | High correlation |
MXMMPC is highly overall correlated with MUMMPC | High correlation |
ORDR has 3610 (100.0%) missing values | Missing |
ORDR is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
LNDPCL has 169 (4.7%) zeros | Zeros |
MUMMPC has 173 (4.8%) zeros | Zeros |
MXMMPC has 169 (4.7%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-11 03:25:31.756884 |
---|---|
Analysis finished | 2023-12-11 03:25:33.686652 |
Duration | 1.93 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
YEAR
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 28.3 KiB |
2011 | |
---|---|
2010 | |
2012 | |
2013 | |
2014 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2011 |
---|---|
2nd row | 2011 |
3rd row | 2011 |
4th row | 2011 |
5th row | 2011 |
Common Values
Value | Count | Frequency (%) |
2011 | 722 | |
2010 | 722 | |
2012 | 722 | |
2013 | 722 | |
2014 | 722 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2011 | 722 | |
2010 | 722 | |
2012 | 722 | |
2013 | 722 | |
2014 | 722 |
QU
Categorical
HIGH CORRELATION
 
Distinct | 15 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 28.3 KiB |
2011년 3분기 | |
---|---|
2010년 3분기 | |
2012년 3분기 | |
2014년 3분기 | |
2013년 3분기 | |
Other values (10) |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2011년 1분기 |
---|---|
2nd row | 2011년 1분기 |
3rd row | 2011년 1분기 |
4th row | 2011년 1분기 |
5th row | 2011년 1분기 |
Common Values
Value | Count | Frequency (%) |
2011년 3분기 | 242 | 6.7% |
2010년 3분기 | 242 | 6.7% |
2012년 3분기 | 242 | 6.7% |
2014년 3분기 | 242 | 6.7% |
2013년 3분기 | 242 | 6.7% |
2011년 1분기 | 240 | 6.6% |
2011년 2분기 | 240 | 6.6% |
2010년 1분기 | 240 | 6.6% |
2010년 2분기 | 240 | 6.6% |
2012년 1분기 | 240 | 6.6% |
Other values (5) | 1200 |
Length
Value | Count | Frequency (%) |
3분기 | 1210 | |
1분기 | 1200 | |
2분기 | 1200 | |
2011년 | 722 | |
2010년 | 722 | |
2012년 | 722 | |
2014년 | 722 | |
2013년 | 722 |
ORDR
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 3610 |
---|---|
Missing (%) | 100.0% |
Memory size | 31.9 KiB |
AREANM
Text
Distinct | 242 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 28.3 KiB |
Length
Max length | 15 |
---|---|
Median length | 8 |
Mean length | 8.5554017 |
Min length | 7 |
Characters and Unicode
Total characters | 30885 |
---|---|
Distinct characters | 144 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경상남도 창원시 진해구 |
---|---|
2nd row | 경상남도 진주시 |
3rd row | 경상남도 통영시 |
4th row | 경상남도 사천시 |
5th row | 경상남도 김해시 |
Value | Count | Frequency (%) |
경기도 | 675 | 8.7% |
경상북도 | 360 | 4.7% |
경상남도 | 330 | 4.3% |
전라남도 | 330 | 4.3% |
강원도 | 270 | 3.5% |
충청남도 | 270 | 3.5% |
서울특별시 | 225 | 2.9% |
전라북도 | 225 | 2.9% |
부산광역시 | 225 | 2.9% |
충청북도 | 205 | 2.7% |
Other values (240) | 4610 |
Most occurring characters
Value | Count | Frequency (%) |
4115 | 13.3% | |
도 | 2770 | 9.0% |
시 | 2425 | 7.9% |
구 | 1495 | 4.8% |
경 | 1410 | 4.6% |
군 | 1335 | 4.3% |
남 | 1170 | 3.8% |
북 | 910 | 2.9% |
광 | 825 | 2.7% |
상 | 750 | 2.4% |
Other values (134) | 13680 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 26770 | |
Space Separator | 4115 | 13.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 2770 | 10.3% |
시 | 2425 | 9.1% |
구 | 1495 | 5.6% |
경 | 1410 | 5.3% |
군 | 1335 | 5.0% |
남 | 1170 | 4.4% |
북 | 910 | 3.4% |
광 | 825 | 3.1% |
상 | 750 | 2.8% |
기 | 720 | 2.7% |
Other values (133) | 12960 |
Space Separator
Value | Count | Frequency (%) |
4115 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 26770 | |
Common | 4115 | 13.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 2770 | 10.3% |
시 | 2425 | 9.1% |
구 | 1495 | 5.6% |
경 | 1410 | 5.3% |
군 | 1335 | 5.0% |
남 | 1170 | 4.4% |
북 | 910 | 3.4% |
광 | 825 | 3.1% |
상 | 750 | 2.8% |
기 | 720 | 2.7% |
Other values (133) | 12960 |
Common
Value | Count | Frequency (%) |
4115 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 26770 | |
ASCII | 4115 | 13.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4115 |
Hangul
Value | Count | Frequency (%) |
도 | 2770 | 10.3% |
시 | 2425 | 9.1% |
구 | 1495 | 5.6% |
경 | 1410 | 5.3% |
군 | 1335 | 5.0% |
남 | 1170 | 4.4% |
북 | 910 | 3.4% |
광 | 825 | 3.1% |
상 | 750 | 2.8% |
기 | 720 | 2.7% |
Other values (133) | 12960 |
LNDPCL
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 985 |
---|---|
Distinct (%) | 27.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 888.68781 |
Minimum | 0 |
---|---|
Maximum | 5059 |
Zeros | 169 |
Zeros (%) | 4.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 31.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 57.5 |
median | 690 |
Q3 | 1516 |
95-th percentile | 2548 |
Maximum | 5059 |
Range | 5059 |
Interquartile range (IQR) | 1458.5 |
Descriptive statistics
Standard deviation | 889.29682 |
---|---|
Coefficient of variation (CV) | 1.0006853 |
Kurtosis | 0.1573235 |
Mean | 888.68781 |
Median Absolute Deviation (MAD) | 659 |
Skewness | 0.8577825 |
Sum | 3208163 |
Variance | 790848.83 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 169 | 4.7% |
2 | 67 | 1.9% |
1 | 58 | 1.6% |
3 | 56 | 1.6% |
5 | 40 | 1.1% |
4 | 39 | 1.1% |
14 | 25 | 0.7% |
8 | 23 | 0.6% |
9 | 22 | 0.6% |
13 | 20 | 0.6% |
Other values (975) | 3091 |
Value | Count | Frequency (%) |
0 | 169 | |
1 | 58 | 1.6% |
2 | 67 | 1.9% |
3 | 56 | 1.6% |
4 | 39 | 1.1% |
5 | 40 | 1.1% |
6 | 16 | 0.4% |
7 | 17 | 0.5% |
8 | 23 | 0.6% |
9 | 22 | 0.6% |
Value | Count | Frequency (%) |
5059 | 3 | |
4259 | 3 | |
4141 | 3 | |
4069 | 1 | < 0.1% |
3948 | 3 | |
3894 | 3 | |
3543 | 3 | |
3491 | 1 | < 0.1% |
3411 | 3 | |
3386 | 3 |
MUMMPC
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 1001 |
---|---|
Distinct (%) | 27.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 45591.909 |
Minimum | 0 |
---|---|
Maximum | 3040000 |
Zeros | 173 |
Zeros (%) | 4.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 31.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 18 |
Q1 | 571.75 |
median | 2150 |
Q3 | 18120 |
95-th percentile | 257380 |
Maximum | 3040000 |
Range | 3040000 |
Interquartile range (IQR) | 17548.25 |
Descriptive statistics
Standard deviation | 143142.13 |
---|---|
Coefficient of variation (CV) | 3.1396388 |
Kurtosis | 101.75113 |
Mean | 45591.909 |
Median Absolute Deviation (MAD) | 1939 |
Skewness | 7.8013975 |
Sum | 1.6458679 × 108 |
Variance | 2.0489668 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 173 | 4.8% |
470 | 27 | 0.7% |
220 | 27 | 0.7% |
790 | 24 | 0.7% |
300 | 24 | 0.7% |
240 | 23 | 0.6% |
380 | 23 | 0.6% |
400 | 23 | 0.6% |
480 | 22 | 0.6% |
370 | 22 | 0.6% |
Other values (991) | 3222 |
Value | Count | Frequency (%) |
0 | 173 | |
10 | 7 | 0.2% |
18 | 2 | 0.1% |
20 | 9 | 0.2% |
30 | 9 | 0.2% |
32 | 2 | 0.1% |
40 | 9 | 0.2% |
50 | 3 | 0.1% |
70 | 3 | 0.1% |
80 | 4 | 0.1% |
Value | Count | Frequency (%) |
3040000 | 1 | < 0.1% |
2142860 | 3 | |
1115108 | 1 | < 0.1% |
1115100 | 1 | < 0.1% |
907550 | 3 | |
891890 | 3 | |
890000 | 3 | |
882500 | 3 | |
873730 | 3 | |
819849 | 2 |
MXMMPC
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 1436 |
---|---|
Distinct (%) | 39.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 353013.36 |
Minimum | 0 |
---|---|
Maximum | 4000000 |
Zeros | 169 |
Zeros (%) | 4.7% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 31.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 15150 |
Q1 | 61930 |
median | 188970 |
Q3 | 465990 |
95-th percentile | 1202530 |
Maximum | 4000000 |
Range | 4000000 |
Interquartile range (IQR) | 404060 |
Descriptive statistics
Standard deviation | 434411.07 |
---|---|
Coefficient of variation (CV) | 1.2305797 |
Kurtosis | 9.6292947 |
Mean | 353013.36 |
Median Absolute Deviation (MAD) | 151710 |
Skewness | 2.5301982 |
Sum | 1.2743782 × 109 |
Variance | 1.8871298 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 169 | 4.7% |
45450 | 9 | 0.2% |
303030 | 9 | 0.2% |
600000 | 9 | 0.2% |
100000 | 7 | 0.2% |
33330 | 7 | 0.2% |
19000 | 6 | 0.2% |
153510 | 6 | 0.2% |
72360 | 6 | 0.2% |
46490 | 6 | 0.2% |
Other values (1426) | 3376 |
Value | Count | Frequency (%) |
0 | 169 | |
11900 | 3 | 0.1% |
12240 | 3 | 0.1% |
12690 | 3 | 0.1% |
13470 | 1 | < 0.1% |
15150 | 3 | 0.1% |
15320 | 3 | 0.1% |
15910 | 3 | 0.1% |
16166 | 1 | < 0.1% |
16510 | 3 | 0.1% |
Value | Count | Frequency (%) |
4000000 | 3 | |
3040000 | 1 | < 0.1% |
3032260 | 3 | |
2860220 | 3 | |
2629540 | 3 | |
2459020 | 3 | |
2441260 | 3 | |
2419942 | 1 | < 0.1% |
2272727 | 1 | < 0.1% |
2197802 | 2 |
YEAR | QU | LNDPCL | MUMMPC | MXMMPC | |
---|---|---|---|---|---|
YEAR | 1.000 | 1.000 | 0.328 | 0.050 | 0.113 |
QU | 1.000 | 1.000 | 0.261 | 0.000 | 0.000 |
LNDPCL | 0.328 | 0.261 | 1.000 | 0.156 | 0.365 |
MUMMPC | 0.050 | 0.000 | 0.156 | 1.000 | 0.551 |
MXMMPC | 0.113 | 0.000 | 0.365 | 0.551 | 1.000 |
QU | YEAR | |
---|---|---|
QU | 1.000 | 0.999 |
YEAR | 0.999 | 1.000 |
LNDPCL | MUMMPC | MXMMPC | YEAR | QU | |
---|---|---|---|---|---|
LNDPCL | 1.000 | -0.508 | -0.380 | 0.142 | 0.100 |
MUMMPC | -0.508 | 1.000 | 0.804 | 0.034 | 0.000 |
MXMMPC | -0.380 | 0.804 | 1.000 | 0.065 | 0.000 |
YEAR | 0.142 | 0.034 | 0.065 | 1.000 | 0.999 |
QU | 0.100 | 0.000 | 0.000 | 0.999 | 1.000 |
YEAR | QU | ORDR | AREANM | LNDPCL | MUMMPC | MXMMPC | |
---|---|---|---|---|---|---|---|
0 | 2011 | 2011년 1분기 | <NA> | 경상남도 창원시 진해구 | 196 | 20160 | 273220 |
1 | 2011 | 2011년 1분기 | <NA> | 경상남도 진주시 | 2071 | 720 | 142860 |
2 | 2011 | 2011년 1분기 | <NA> | 경상남도 통영시 | 1131 | 300 | 242540 |
3 | 2011 | 2011년 1분기 | <NA> | 경상남도 사천시 | 1157 | 1430 | 160680 |
4 | 2011 | 2011년 1분기 | <NA> | 경상남도 김해시 | 1892 | 470 | 438630 |
5 | 2011 | 2011년 1분기 | <NA> | 경상남도 밀양시 | 3015 | 380 | 165000 |
6 | 2011 | 2011년 1분기 | <NA> | 경상남도 거제시 | 1815 | 2700 | 440250 |
7 | 2011 | 2011년 1분기 | <NA> | 경상남도 양산시 | 889 | 5370 | 303030 |
8 | 2011 | 2011년 1분기 | <NA> | 경상남도 의령군 | 1313 | 520 | 51410 |
9 | 2011 | 2011년 1분기 | <NA> | 경상남도 함안군 | 2761 | 960 | 213330 |
YEAR | QU | ORDR | AREANM | LNDPCL | MUMMPC | MXMMPC | |
---|---|---|---|---|---|---|---|
3600 | 2013 | 2013년 1분기 | <NA> | 서울특별시 종로구 | 2 | 29910 | 43450 |
3601 | 2013 | 2013년 1분기 | <NA> | 서울특별시 중랑구 | 2 | 891890 | 1344260 |
3602 | 2013 | 2013년 1분기 | <NA> | 서울특별시 성북구 | 0 | 0 | 0 |
3603 | 2013 | 2013년 1분기 | <NA> | 서울특별시 강북구 | 7 | 311320 | 1500000 |
3604 | 2013 | 2013년 1분기 | <NA> | 서울특별시 도봉구 | 2 | 732020 | 1202530 |
3605 | 2013 | 2013년 1분기 | <NA> | 서울특별시 노원구 | 5 | 163780 | 412800 |
3606 | 2013 | 2013년 1분기 | <NA> | 서울특별시 은평구 | 4 | 205480 | 2180000 |
3607 | 2013 | 2013년 1분기 | <NA> | 서울특별시 마포구 | 0 | 0 | 0 |
3608 | 2013 | 2013년 1분기 | <NA> | 서울특별시 강서구 | 13 | 132330 | 1542310 |
3609 | 2013 | 2013년 1분기 | <NA> | 서울특별시 구로구 | 4 | 117650 | 1058780 |