Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 92 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.7 KiB |
Average record size in memory | 52.4 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 2 |
Text | 1 |
Dataset
Description | 공공용지 수용재결취득 토지면적 및 보상금액 현황을 아래와 같이 제공합니다. 제공현황 - 사업종류,사업명,사업시행자,토지_면적(㎡),토지_보상금액(원) 등 |
---|---|
URL | https://www.data.go.kr/data/15049034/fileData.do |
토지_면적(제곱미터) is highly overall correlated with 토지_보상금액(원) | High correlation |
토지_보상금액(원) is highly overall correlated with 토지_면적(제곱미터) | High correlation |
사업시행자 is highly imbalanced (62.1%) | Imbalance |
순번 has unique values | Unique |
토지_면적(제곱미터) has unique values | Unique |
토지_보상금액(원) has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 23:08:23.647909 |
---|---|
Analysis finished | 2023-12-12 23:08:25.274755 |
Duration | 1.63 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
UNIQUE
 
Distinct | 92 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 46.5 |
Minimum | 1 |
---|---|
Maximum | 92 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 960.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 5.55 |
Q1 | 23.75 |
median | 46.5 |
Q3 | 69.25 |
95-th percentile | 87.45 |
Maximum | 92 |
Range | 91 |
Interquartile range (IQR) | 45.5 |
Descriptive statistics
Standard deviation | 26.70206 |
---|---|
Coefficient of variation (CV) | 0.57423785 |
Kurtosis | -1.2 |
Mean | 46.5 |
Median Absolute Deviation (MAD) | 23 |
Skewness | 0 |
Sum | 4278 |
Variance | 713 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 1.1% |
60 | 1 | 1.1% |
69 | 1 | 1.1% |
68 | 1 | 1.1% |
67 | 1 | 1.1% |
66 | 1 | 1.1% |
65 | 1 | 1.1% |
64 | 1 | 1.1% |
63 | 1 | 1.1% |
62 | 1 | 1.1% |
Other values (82) | 82 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
92 | 1 | |
91 | 1 | |
90 | 1 | |
89 | 1 | |
88 | 1 | |
87 | 1 | |
86 | 1 | |
85 | 1 | |
84 | 1 | |
83 | 1 |
사업종류
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 868.0 B |
수도 | |
---|---|
댐 | |
단지 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 1.5978261 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 댐 |
---|---|
2nd row | 수도 |
3rd row | 수도 |
4th row | 댐 |
5th row | 댐 |
Common Values
Value | Count | Frequency (%) |
수도 | 40 | |
댐 | 37 | |
단지 | 15 | 16.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
수도 | 40 | |
댐 | 37 | |
단지 | 15 | 16.3% |
사업명
Text
Distinct | 91 |
---|---|
Distinct (%) | 98.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 868.0 B |
Length
Max length | 33 |
---|---|
Median length | 24 |
Mean length | 16.695652 |
Min length | 8 |
Characters and Unicode
Total characters | 1536 |
---|---|
Distinct characters | 185 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 90 ? |
---|---|
Unique (%) | 97.8% |
Sample
1st row | 부항다목적댐건설사업 |
---|---|
2nd row | 금강북부급수체계조정(청양계통) |
3rd row | 낙동강중부권급수체계구축사업 |
4th row | 용담댐 직하류 하천정비공사 |
5th row | 경인 아라뱃길사업 |
Value | Count | Frequency (%) |
직하류 | 10 | 4.6% |
건설사업 | 8 | 3.7% |
하천정비공사 | 6 | 2.7% |
급수체계조정사업 | 5 | 2.3% |
시화2단계(송산그린시티 | 4 | 1.8% |
용수공급사업 | 4 | 1.8% |
운문댐 | 4 | 1.8% |
용수공급시설 | 3 | 1.4% |
친수구역 | 3 | 1.4% |
사업 | 3 | 1.4% |
Other values (144) | 169 |
Most occurring characters
Value | Count | Frequency (%) |
127 | 8.3% | |
업 | 93 | 6.1% |
사 | 93 | 6.1% |
수 | 62 | 4.0% |
) | 37 | 2.4% |
( | 37 | 2.4% |
하 | 36 | 2.3% |
계 | 34 | 2.2% |
댐 | 34 | 2.2% |
설 | 33 | 2.1% |
Other values (175) | 950 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1276 | |
Space Separator | 127 | 8.3% |
Close Punctuation | 38 | 2.5% |
Open Punctuation | 38 | 2.5% |
Uppercase Letter | 26 | 1.7% |
Decimal Number | 25 | 1.6% |
Letter Number | 4 | 0.3% |
Connector Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 93 | 7.3% |
사 | 93 | 7.3% |
수 | 62 | 4.9% |
하 | 36 | 2.8% |
계 | 34 | 2.7% |
댐 | 34 | 2.7% |
설 | 33 | 2.6% |
공 | 32 | 2.5% |
시 | 32 | 2.5% |
도 | 28 | 2.2% |
Other values (156) | 799 |
Uppercase Letter
Value | Count | Frequency (%) |
M | 6 | |
V | 6 | |
T | 6 | |
I | 4 | |
S | 2 | 7.7% |
K | 2 | 7.7% |
Decimal Number
Value | Count | Frequency (%) |
2 | 13 | |
1 | 6 | |
3 | 3 | 12.0% |
7 | 2 | 8.0% |
4 | 1 | 4.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 37 | |
] | 1 | 2.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 37 | |
[ | 1 | 2.6% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 2 | |
Ⅲ | 2 |
Space Separator
Value | Count | Frequency (%) |
127 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1276 | |
Common | 230 | 15.0% |
Latin | 30 | 2.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 93 | 7.3% |
사 | 93 | 7.3% |
수 | 62 | 4.9% |
하 | 36 | 2.8% |
계 | 34 | 2.7% |
댐 | 34 | 2.7% |
설 | 33 | 2.6% |
공 | 32 | 2.5% |
시 | 32 | 2.5% |
도 | 28 | 2.2% |
Other values (156) | 799 |
Common
Value | Count | Frequency (%) |
127 | ||
) | 37 | 16.1% |
( | 37 | 16.1% |
2 | 13 | 5.7% |
1 | 6 | 2.6% |
3 | 3 | 1.3% |
7 | 2 | 0.9% |
_ | 2 | 0.9% |
[ | 1 | 0.4% |
] | 1 | 0.4% |
Latin
Value | Count | Frequency (%) |
M | 6 | |
V | 6 | |
T | 6 | |
I | 4 | |
Ⅱ | 2 | 6.7% |
S | 2 | 6.7% |
K | 2 | 6.7% |
Ⅲ | 2 | 6.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1276 | |
ASCII | 256 | 16.7% |
Number Forms | 4 | 0.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
127 | ||
) | 37 | 14.5% |
( | 37 | 14.5% |
2 | 13 | 5.1% |
M | 6 | 2.3% |
1 | 6 | 2.3% |
V | 6 | 2.3% |
T | 6 | 2.3% |
I | 4 | 1.6% |
3 | 3 | 1.2% |
Other values (7) | 11 | 4.3% |
Hangul
Value | Count | Frequency (%) |
업 | 93 | 7.3% |
사 | 93 | 7.3% |
수 | 62 | 4.9% |
하 | 36 | 2.8% |
계 | 34 | 2.7% |
댐 | 34 | 2.7% |
설 | 33 | 2.6% |
공 | 32 | 2.5% |
시 | 32 | 2.5% |
도 | 28 | 2.2% |
Other values (156) | 799 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 2 | |
Ⅲ | 2 |
사업시행자
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 6.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 868.0 B |
국토교통부 | |
---|---|
한국수자원공사 | 7 |
환경부 | 6 |
강원도 | 1 |
세종특별자치시 | 1 |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 5.0434783 |
Min length | 3 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 3.3% |
Sample
1st row | 국토교통부 |
---|---|
2nd row | 한국수자원공사 |
3rd row | 국토교통부 |
4th row | 국토교통부 |
5th row | 국토교통부 |
Common Values
Value | Count | Frequency (%) |
국토교통부 | 76 | |
한국수자원공사 | 7 | 7.6% |
환경부 | 6 | 6.5% |
강원도 | 1 | 1.1% |
세종특별자치시 | 1 | 1.1% |
금강유역환경청 | 1 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국토교통부 | 76 | |
한국수자원공사 | 7 | 7.6% |
환경부 | 6 | 6.5% |
강원도 | 1 | 1.1% |
세종특별자치시 | 1 | 1.1% |
금강유역환경청 | 1 | 1.1% |
토지_면적(제곱미터)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 92 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 57811.2 |
Minimum | 15 |
---|---|
Maximum | 1285399 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 960.0 B |
Quantile statistics
Minimum | 15 |
---|---|
5-th percentile | 152.55 |
Q1 | 1886 |
median | 5152.5 |
Q3 | 33147.65 |
95-th percentile | 339319.05 |
Maximum | 1285399 |
Range | 1285384 |
Interquartile range (IQR) | 31261.65 |
Descriptive statistics
Standard deviation | 175896.55 |
---|---|
Coefficient of variation (CV) | 3.0426034 |
Kurtosis | 28.561429 |
Mean | 57811.2 |
Median Absolute Deviation (MAD) | 4590 |
Skewness | 4.9943275 |
Sum | 5318630.4 |
Variance | 3.0939598 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
219507.0 | 1 | 1.1% |
42427.0 | 1 | 1.1% |
46867.0 | 1 | 1.1% |
1122.0 | 1 | 1.1% |
847.0 | 1 | 1.1% |
331.0 | 1 | 1.1% |
33677.0 | 1 | 1.1% |
992.0 | 1 | 1.1% |
54481.0 | 1 | 1.1% |
2950.0 | 1 | 1.1% |
Other values (82) | 82 |
Value | Count | Frequency (%) |
15.0 | 1 | |
41.0 | 1 | |
43.0 | 1 | |
69.0 | 1 | |
141.0 | 1 | |
162.0 | 1 | |
264.0 | 1 | |
331.0 | 1 | |
380.0 | 1 | |
524.0 | 1 |
Value | Count | Frequency (%) |
1285399.0 | 1 | |
655502.0 | 1 | |
611069.2 | 1 | |
542271.349 | 1 | |
485756.0 | 1 | |
219507.0 | 1 | |
121892.0 | 1 | |
120263.0 | 1 | |
96476.3 | 1 | |
87238.0 | 1 |
토지_보상금액(원)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 92 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.165295 × 109 |
Minimum | 516750 |
---|---|
Maximum | 6.998292 × 1010 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 960.0 B |
Quantile statistics
Minimum | 516750 |
---|---|
5-th percentile | 3662891.5 |
Q1 | 76228332 |
median | 3.1029791 × 108 |
Q3 | 7.4661286 × 108 |
95-th percentile | 8.0679603 × 109 |
Maximum | 6.998292 × 1010 |
Range | 6.9982403 × 1010 |
Interquartile range (IQR) | 6.7038452 × 108 |
Descriptive statistics
Standard deviation | 8.008396 × 109 |
---|---|
Coefficient of variation (CV) | 3.6985242 |
Kurtosis | 58.216778 |
Mean | 2.165295 × 109 |
Median Absolute Deviation (MAD) | 2.5967415 × 108 |
Skewness | 7.1823457 |
Sum | 1.9920714 × 1011 |
Variance | 6.4134406 × 1019 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1525424240 | 1 | 1.1% |
3175547179 | 1 | 1.1% |
878150700 | 1 | 1.1% |
27853000 | 1 | 1.1% |
21810250 | 1 | 1.1% |
38194500 | 1 | 1.1% |
1174357950 | 1 | 1.1% |
34635800 | 1 | 1.1% |
3751787330 | 1 | 1.1% |
322911400 | 1 | 1.1% |
Other values (82) | 82 |
Value | Count | Frequency (%) |
516750 | 1 | |
1790040 | 1 | |
1902160 | 1 | |
1917730 | 1 | |
2647080 | 1 | |
4494010 | 1 | |
13792000 | 1 | |
14964900 | 1 | |
18167000 | 1 | |
18210040 | 1 |
Value | Count | Frequency (%) |
69982919860 | 1 | |
24311657210 | 1 | |
19159290380 | 1 | |
10519289990 | 1 | |
9734916200 | 1 | |
6704087280 | 1 | |
6084316968 | 1 | |
5937202450 | 1 | |
4230778880 | 1 | |
4025912680 | 1 |
순번 | 사업종류 | 사업명 | 사업시행자 | 토지_면적(제곱미터) | 토지_보상금액(원) | |
---|---|---|---|---|---|---|
순번 | 1.000 | 0.126 | 0.943 | 0.252 | 0.027 | 0.089 |
사업종류 | 0.126 | 1.000 | 1.000 | 0.070 | 0.510 | 0.246 |
사업명 | 0.943 | 1.000 | 1.000 | 0.837 | 1.000 | 1.000 |
사업시행자 | 0.252 | 0.070 | 0.837 | 1.000 | 0.000 | 0.000 |
토지_면적(제곱미터) | 0.027 | 0.510 | 1.000 | 0.000 | 1.000 | 0.929 |
토지_보상금액(원) | 0.089 | 0.246 | 1.000 | 0.000 | 0.929 | 1.000 |
사업시행자 | 사업종류 | |
---|---|---|
사업시행자 | 1.000 | 0.014 |
사업종류 | 0.014 | 1.000 |
순번 | 토지_면적(제곱미터) | 토지_보상금액(원) | 사업종류 | 사업시행자 | |
---|---|---|---|---|---|
순번 | 1.000 | -0.132 | -0.148 | 0.064 | 0.128 |
토지_면적(제곱미터) | -0.132 | 1.000 | 0.850 | 0.238 | 0.000 |
토지_보상금액(원) | -0.148 | 0.850 | 1.000 | 0.189 | 0.000 |
사업종류 | 0.064 | 0.238 | 0.189 | 1.000 | 0.014 |
사업시행자 | 0.128 | 0.000 | 0.000 | 0.014 | 1.000 |
순번 | 사업종류 | 사업명 | 사업시행자 | 토지_면적(제곱미터) | 토지_보상금액(원) | |
---|---|---|---|---|---|---|
0 | 1 | 댐 | 부항다목적댐건설사업 | 국토교통부 | 219507.0 | 1525424240 |
1 | 2 | 수도 | 금강북부급수체계조정(청양계통) | 한국수자원공사 | 3766.8 | 87700910 |
2 | 3 | 수도 | 낙동강중부권급수체계구축사업 | 국토교통부 | 3706.0 | 76938980 |
3 | 4 | 댐 | 용담댐 직하류 하천정비공사 | 국토교통부 | 65891.1 | 808980350 |
4 | 5 | 댐 | 경인 아라뱃길사업 | 국토교통부 | 21396.0 | 6704087280 |
5 | 6 | 수도 | 포천복합화력 용수공급사업 | 국토교통부 | 69.0 | 1790040 |
6 | 7 | 댐 | 굴포천방수로건설사업 | 국토교통부 | 902.0 | 200437330 |
7 | 8 | 댐 | 충주댐 치수능력증대사업 | 국토교통부 | 7852.0 | 567959800 |
8 | 9 | 수도 | 고덕산업단지 용수공급시설 설치사업 | 국토교통부 | 24460.7 | 1783936330 |
9 | 10 | 단지 | 부여 규암지구 친수구역 조성사업 | 국토교통부 | 41.0 | 4494010 |
순번 | 사업종류 | 사업명 | 사업시행자 | 토지_면적(제곱미터) | 토지_보상금액(원) | |
---|---|---|---|---|---|---|
82 | 83 | 수도 | 금강남부권급수체계구축사업(익산계통) | 국토교통부 | 4069.6 | 88522240 |
83 | 84 | 댐 | 성덕댐 건설사업 | 한국수자원공사 | 55817.0 | 420990790 |
84 | 85 | 댐 | 안동댐 치수능력증대사업 | 국토교통부 | 66501.0 | 437405000 |
85 | 86 | 단지 | 시화MTV 광역교통시설 해안로 확장사업 | 국토교통부 | 2469.0 | 399895290 |
86 | 87 | 수도 | 대청댐계통(Ⅲ)광역상수도사업(1차) | 국토교통부 | 6012.0 | 457940560 |
87 | 88 | 댐 | 운문댐 직하류 하천정비공사(1공구) | 국토교통부 | 7147.9 | 205567690 |
88 | 89 | 댐 | 군남홍수조절지건설사업 | 국토교통부 | 1821.0 | 53303790 |
89 | 90 | 댐 | 남강댐 소문제 및 속사제 하천개수공사 | 국토교통부 | 2448.0 | 102765150 |
90 | 91 | 댐 | 군위댐 직하류 하천정비공사 | 국토교통부 | 9329.0 | 430714600 |
91 | 92 | 수도 | 진안계통 급수체계조정사업 | 국토교통부 | 601.0 | 14964900 |