Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 796 |
Missing cells | 232 |
Missing cells (%) | 4.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 46.0 KiB |
Average record size in memory | 59.2 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 경기도 안양시 공간정보시스템 포장도로 현황정보(포장도로순번, 포장도로사용형태, 포장도로연장, 포장도로경과지,포장도로결정면적, 포장도로 데이터기준)데이터 입니다 |
---|---|
URL | https://www.data.go.kr/data/15042413/fileData.do |
데이터기준 has constant value "" | Constant |
연 장 is highly overall correlated with 결정면적 | High correlation |
결정면적 is highly overall correlated with 연 장 | High correlation |
사용형태 is highly overall correlated with 기 능 | High correlation |
기 능 is highly overall correlated with 사용형태 | High correlation |
사용형태 is highly imbalanced (82.0%) | Imbalance |
기 능 is highly imbalanced (73.7%) | Imbalance |
주요경과지 has 232 (29.1%) missing values | Missing |
순번 has unique values | Unique |
연 장 has 46 (5.8%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 21:06:36.848735 |
---|---|
Analysis finished | 2023-12-12 21:06:38.434839 |
Duration | 1.59 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
UNIQUE
 
Distinct | 796 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 398.5 |
Minimum | 1 |
---|---|
Maximum | 796 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 7.1 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 40.75 |
Q1 | 199.75 |
median | 398.5 |
Q3 | 597.25 |
95-th percentile | 756.25 |
Maximum | 796 |
Range | 795 |
Interquartile range (IQR) | 397.5 |
Descriptive statistics
Standard deviation | 229.9297 |
---|---|
Coefficient of variation (CV) | 0.57698795 |
Kurtosis | -1.2 |
Mean | 398.5 |
Median Absolute Deviation (MAD) | 199 |
Skewness | 0 |
Sum | 317206 |
Variance | 52867.667 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
525 | 1 | 0.1% |
527 | 1 | 0.1% |
528 | 1 | 0.1% |
529 | 1 | 0.1% |
530 | 1 | 0.1% |
531 | 1 | 0.1% |
532 | 1 | 0.1% |
533 | 1 | 0.1% |
534 | 1 | 0.1% |
Other values (786) | 786 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
796 | 1 | |
795 | 1 | |
794 | 1 | |
793 | 1 | |
792 | 1 | |
791 | 1 | |
790 | 1 | |
789 | 1 | |
788 | 1 | |
787 | 1 |
사용형태
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.3 KiB |
시도중 일반도로 | |
---|---|
미분류 | 37 |
지방도 | 1 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.7613065 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 시도중 일반도로 |
---|---|
2nd row | 시도중 일반도로 |
3rd row | 시도중 일반도로 |
4th row | 시도중 일반도로 |
5th row | 시도중 일반도로 |
Common Values
Value | Count | Frequency (%) |
시도중 일반도로 | 758 | |
미분류 | 37 | 4.6% |
지방도 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
시도중 | 758 | |
일반도로 | 758 | |
미분류 | 37 | 2.4% |
지방도 | 1 | 0.1% |
기 능
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.3 KiB |
국지도로 | |
---|---|
미분류 | 38 |
보조간선도로 | 14 |
집산도로 | 12 |
주간선도로 | 10 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 국지도로 |
---|---|
2nd row | 국지도로 |
3rd row | 국지도로 |
4th row | 국지도로 |
5th row | 국지도로 |
Common Values
Value | Count | Frequency (%) |
국지도로 | 722 | |
미분류 | 38 | 4.8% |
보조간선도로 | 14 | 1.8% |
집산도로 | 12 | 1.5% |
주간선도로 | 10 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국지도로 | 722 | |
미분류 | 38 | 4.8% |
보조간선도로 | 14 | 1.8% |
집산도로 | 12 | 1.5% |
주간선도로 | 10 | 1.3% |
연 장
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 662 |
---|---|
Distinct (%) | 83.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 336.85641 |
Minimum | 0 |
---|---|
Maximum | 10530 |
Zeros | 46 |
Zeros (%) | 5.8% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 7.1 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 131.975 |
median | 226.05 |
Q3 | 366 |
95-th percentile | 846.125 |
Maximum | 10530 |
Range | 10530 |
Interquartile range (IQR) | 234.025 |
Descriptive statistics
Standard deviation | 575.24818 |
---|---|
Coefficient of variation (CV) | 1.7076955 |
Kurtosis | 163.54086 |
Mean | 336.85641 |
Median Absolute Deviation (MAD) | 107.1 |
Skewness | 10.919266 |
Sum | 268137.7 |
Variance | 330910.47 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 46 | 5.8% |
320.0 | 5 | 0.6% |
210.0 | 4 | 0.5% |
178.699996948242 | 4 | 0.5% |
300.0 | 3 | 0.4% |
244.0 | 3 | 0.4% |
192.0 | 3 | 0.4% |
120.0 | 3 | 0.4% |
201.0 | 3 | 0.4% |
131.0 | 3 | 0.4% |
Other values (652) | 719 |
Value | Count | Frequency (%) |
0.0 | 46 | |
1.0 | 1 | 0.1% |
9.5 | 1 | 0.1% |
16.7000007629395 | 1 | 0.1% |
40.0 | 1 | 0.1% |
42.0 | 1 | 0.1% |
46.4000015258789 | 1 | 0.1% |
46.7999992370605 | 1 | 0.1% |
48.7999992370605 | 1 | 0.1% |
49.0 | 1 | 0.1% |
Value | Count | Frequency (%) |
10530.0 | 1 | |
7786.2998046875 | 1 | |
3895.39990234375 | 1 | |
3720.80004882813 | 1 | |
3704.0 | 1 | |
2697.60009765625 | 1 | |
2353.30004882813 | 1 | |
2142.5 | 1 | |
2109.0 | 1 | |
1939.40002441406 | 1 |
주요경과지
Text
MISSING
 
Distinct | 520 |
---|---|
Distinct (%) | 92.2% |
Missing | 232 |
Missing (%) | 29.1% |
Memory size | 6.3 KiB |
Length
Max length | 18 |
---|---|
Median length | 15 |
Mean length | 8.2251773 |
Min length | 3 |
Characters and Unicode
Total characters | 4639 |
---|---|
Distinct characters | 327 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 479 ? |
---|---|
Unique (%) | 84.9% |
Sample
1st row | 연현초교,LG아파트,석수전철아파트 |
---|---|
2nd row | 국민연금관리공단,관양아파트 |
3rd row | 안양공고 |
4th row | 관일청도체육관 |
5th row | 성원아파트 |
Value | Count | Frequency (%) |
안양청과시장 | 3 | 0.5% |
성원아파트 | 3 | 0.5% |
삼성아파트 | 3 | 0.5% |
호계공원 | 2 | 0.4% |
샛별한양아파트 | 2 | 0.4% |
양지초교 | 2 | 0.4% |
벽산아파트,신한아파트 | 2 | 0.4% |
삼익아파트 | 2 | 0.4% |
대림주택 | 2 | 0.4% |
귀인중학교 | 2 | 0.4% |
Other values (510) | 541 |
Most occurring characters
Value | Count | Frequency (%) |
아 | 263 | 5.7% |
파 | 258 | 5.6% |
, | 250 | 5.4% |
트 | 249 | 5.4% |
양 | 112 | 2.4% |
안 | 108 | 2.3% |
교 | 98 | 2.1% |
빌 | 96 | 2.1% |
라 | 87 | 1.9% |
원 | 86 | 1.9% |
Other values (317) | 3032 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4302 | |
Other Punctuation | 251 | 5.4% |
Decimal Number | 58 | 1.3% |
Other Symbol | 13 | 0.3% |
Uppercase Letter | 11 | 0.2% |
Open Punctuation | 2 | < 0.1% |
Close Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
아 | 263 | 6.1% |
파 | 258 | 6.0% |
트 | 249 | 5.8% |
양 | 112 | 2.6% |
안 | 108 | 2.5% |
교 | 98 | 2.3% |
빌 | 96 | 2.2% |
라 | 87 | 2.0% |
원 | 86 | 2.0% |
성 | 80 | 1.9% |
Other values (298) | 2865 |
Decimal Number
Value | Count | Frequency (%) |
2 | 18 | |
1 | 14 | |
3 | 8 | |
5 | 5 | 8.6% |
7 | 4 | 6.9% |
8 | 3 | 5.2% |
9 | 3 | 5.2% |
4 | 2 | 3.4% |
6 | 1 | 1.7% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 4 | |
G | 4 | |
K | 1 | 9.1% |
S | 1 | 9.1% |
P | 1 | 9.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 250 | |
. | 1 | 0.4% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 13 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4315 | |
Common | 313 | 6.7% |
Latin | 11 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
아 | 263 | 6.1% |
파 | 258 | 6.0% |
트 | 249 | 5.8% |
양 | 112 | 2.6% |
안 | 108 | 2.5% |
교 | 98 | 2.3% |
빌 | 96 | 2.2% |
라 | 87 | 2.0% |
원 | 86 | 2.0% |
성 | 80 | 1.9% |
Other values (299) | 2878 |
Common
Value | Count | Frequency (%) |
, | 250 | |
2 | 18 | 5.8% |
1 | 14 | 4.5% |
3 | 8 | 2.6% |
5 | 5 | 1.6% |
7 | 4 | 1.3% |
8 | 3 | 1.0% |
9 | 3 | 1.0% |
( | 2 | 0.6% |
4 | 2 | 0.6% |
Other values (3) | 4 | 1.3% |
Latin
Value | Count | Frequency (%) |
L | 4 | |
G | 4 | |
K | 1 | 9.1% |
S | 1 | 9.1% |
P | 1 | 9.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4302 | |
ASCII | 324 | 7.0% |
None | 13 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
아 | 263 | 6.1% |
파 | 258 | 6.0% |
트 | 249 | 5.8% |
양 | 112 | 2.6% |
안 | 108 | 2.5% |
교 | 98 | 2.3% |
빌 | 96 | 2.2% |
라 | 87 | 2.0% |
원 | 86 | 2.0% |
성 | 80 | 1.9% |
Other values (298) | 2865 |
ASCII
Value | Count | Frequency (%) |
, | 250 | |
2 | 18 | 5.6% |
1 | 14 | 4.3% |
3 | 8 | 2.5% |
5 | 5 | 1.5% |
L | 4 | 1.2% |
G | 4 | 1.2% |
7 | 4 | 1.2% |
8 | 3 | 0.9% |
9 | 3 | 0.9% |
Other values (8) | 11 | 3.4% |
None
Value | Count | Frequency (%) |
㈜ | 13 |
결정면적
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 707 |
---|---|
Distinct (%) | 88.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9939.0386 |
Minimum | 0 |
---|---|
Maximum | 514419.4 |
Zeros | 2 |
Zeros (%) | 0.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 7.1 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 386.775 |
Q1 | 1020.3 |
median | 2212.6 |
Q3 | 6095.8 |
95-th percentile | 32717.3 |
Maximum | 514419.4 |
Range | 514419.4 |
Interquartile range (IQR) | 5075.5 |
Descriptive statistics
Standard deviation | 37649.925 |
---|---|
Coefficient of variation (CV) | 3.7880852 |
Kurtosis | 100.73189 |
Mean | 9939.0386 |
Median Absolute Deviation (MAD) | 1521.75 |
Skewness | 9.2113965 |
Sum | 7911474.7 |
Variance | 1.4175169 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
9018.5 | 7 | 0.9% |
12076.4 | 7 | 0.9% |
15525.0 | 5 | 0.6% |
38255.4 | 4 | 0.5% |
7429.7 | 4 | 0.5% |
9774.5 | 3 | 0.4% |
65831.8 | 3 | 0.4% |
5211.9 | 3 | 0.4% |
20303.0 | 3 | 0.4% |
6121.3 | 3 | 0.4% |
Other values (697) | 754 |
Value | Count | Frequency (%) |
0.0 | 2 | |
87.5 | 1 | |
112.4 | 1 | |
130.0 | 1 | |
144.3 | 1 | |
174.6 | 2 | |
184.3 | 1 | |
208.1 | 1 | |
209.8 | 1 | |
211.6 | 1 |
Value | Count | Frequency (%) |
514419.4 | 1 | |
482293.6 | 1 | |
438024.4 | 1 | |
272466.2 | 1 | |
235242.0 | 1 | |
229945.8 | 2 | |
224489.0 | 1 | |
186635.2 | 1 | |
148215.6 | 1 | |
135555.5 | 1 |
데이터기준
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.3 KiB |
2023-07-18 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-07-18 |
---|---|
2nd row | 2023-07-18 |
3rd row | 2023-07-18 |
4th row | 2023-07-18 |
5th row | 2023-07-18 |
Common Values
Value | Count | Frequency (%) |
2023-07-18 | 796 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-07-18 | 796 |
순번 | 사용형태 | 기 능 | 연 장 | 결정면적 | |
---|---|---|---|---|---|
순번 | 1.000 | 0.044 | 0.492 | 0.157 | 0.156 |
사용형태 | 0.044 | 1.000 | 0.695 | 0.000 | 0.000 |
기 능 | 0.492 | 0.695 | 1.000 | 0.454 | 0.520 |
연 장 | 0.157 | 0.000 | 0.454 | 1.000 | 0.820 |
결정면적 | 0.156 | 0.000 | 0.520 | 0.820 | 1.000 |
기 능 | 사용형태 | |
---|---|---|
기 능 | 1.000 | 0.675 |
사용형태 | 0.675 | 1.000 |
순번 | 연 장 | 결정면적 | 사용형태 | 기 능 | |
---|---|---|---|---|---|
순번 | 1.000 | -0.051 | -0.063 | 0.025 | 0.225 |
연 장 | -0.051 | 1.000 | 0.551 | 0.000 | 0.328 |
결정면적 | -0.063 | 0.551 | 1.000 | 0.000 | 0.352 |
사용형태 | 0.025 | 0.000 | 0.000 | 1.000 | 0.675 |
기 능 | 0.225 | 0.328 | 0.352 | 0.675 | 1.000 |
순번 | 사용형태 | 기 능 | 연 장 | 주요경과지 | 결정면적 | 데이터기준 | |
---|---|---|---|---|---|---|---|
0 | 1 | 시도중 일반도로 | 국지도로 | 1742.400024 | 연현초교,LG아파트,석수전철아파트 | 16245.9 | 2023-07-18 |
1 | 2 | 시도중 일반도로 | 국지도로 | 481.799988 | <NA> | 2281.6 | 2023-07-18 |
2 | 3 | 시도중 일반도로 | 국지도로 | 138.800003 | <NA> | 1099.6 | 2023-07-18 |
3 | 4 | 시도중 일반도로 | 국지도로 | 188.300003 | 국민연금관리공단,관양아파트 | 1505.5 | 2023-07-18 |
4 | 5 | 시도중 일반도로 | 국지도로 | 258.0 | 안양공고 | 1403.9 | 2023-07-18 |
5 | 6 | 미분류 | 미분류 | 0.0 | <NA> | 903.1 | 2023-07-18 |
6 | 7 | 시도중 일반도로 | 국지도로 | 186.399994 | <NA> | 688.8 | 2023-07-18 |
7 | 8 | 시도중 일반도로 | 국지도로 | 109.900002 | 관일청도체육관 | 7429.7 | 2023-07-18 |
8 | 9 | 시도중 일반도로 | 국지도로 | 112.0 | <NA> | 1293.8 | 2023-07-18 |
9 | 10 | 시도중 일반도로 | 국지도로 | 213.600006 | 성원아파트 | 6121.3 | 2023-07-18 |
순번 | 사용형태 | 기 능 | 연 장 | 주요경과지 | 결정면적 | 데이터기준 | |
---|---|---|---|---|---|---|---|
786 | 787 | 시도중 일반도로 | 국지도로 | 609.099976 | <NA> | 5590.3 | 2023-07-18 |
787 | 788 | 시도중 일반도로 | 국지도로 | 532.5 | 태영아파트,신기중학교 | 6704.1 | 2023-07-18 |
788 | 789 | 시도중 일반도로 | 국지도로 | 209.0 | 무궁화코롱아파트,신기초교 | 2009.7 | 2023-07-18 |
789 | 790 | 시도중 일반도로 | 국지도로 | 154.199997 | 평촌반석교회 | 1175.0 | 2023-07-18 |
790 | 791 | 시도중 일반도로 | 국지도로 | 179.699997 | 협성골드프라자 | 2116.2 | 2023-07-18 |
791 | 792 | 시도중 일반도로 | 국지도로 | 236.0 | <NA> | 1366.7 | 2023-07-18 |
792 | 793 | 시도중 일반도로 | 국지도로 | 316.200012 | 평촌롯데아파트,평촌초교 | 2043.8 | 2023-07-18 |
793 | 794 | 미분류 | 미분류 | 0.0 | 양지초교 | 7130.6 | 2023-07-18 |
794 | 795 | 시도중 일반도로 | 국지도로 | 321.399994 | 효성아파트 | 2026.5 | 2023-07-18 |
795 | 796 | 시도중 일반도로 | 국지도로 | 147.300003 | 남서울안양의원 | 667.4 | 2023-07-18 |