Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 30 |
Missing cells | 30 |
Missing cells (%) | 14.3% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.9 KiB |
Average record size in memory | 64.4 B |
Variable types
Categorical | 4 |
---|---|
Text | 2 |
Unsupported | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 경기콘텐츠진흥원 |
URL | https://www.bigdata-region.kr/#/dataset/7bdcdffc-e7a1-4964-8d68-707dbbd2fc94 |
시도명 has constant value "" | Constant |
기준년도 has constant value "" | Constant |
주택가격지수(현황) is highly overall correlated with 아파트가격지수(현황) | High correlation |
아파트가격지수(현황) is highly overall correlated with 주택가격지수(현황) | High correlation |
주택가격지수(현황) is highly imbalanced (64.7%) | Imbalance |
건물지수(현황) has 30 (100.0%) missing values | Missing |
건물지수(현황) is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-10 14:14:38.753699 |
---|---|
Analysis finished | 2023-12-10 14:14:39.628471 |
Duration | 0.87 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
경기도 |
---|
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경기도 |
---|---|
2nd row | 경기도 |
3rd row | 경기도 |
4th row | 경기도 |
5th row | 경기도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 30 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
경기도 | 30 |
시군구명
Text
Distinct | 17 |
---|---|
Distinct (%) | 56.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
안성시 | 5 | |
여주시 | 4 | 11.4% |
성남시 | 3 | 8.6% |
파주시 | 2 | 5.7% |
군포시 | 2 | 5.7% |
부천시 | 2 | 5.7% |
수정구 | 2 | 5.7% |
양주시 | 2 | 5.7% |
양평군 | 2 | 5.7% |
의왕시 | 1 | 2.9% |
Other values (10) | 10 |
Most occurring characters
Value | Count | Frequency (%) |
시 | 27 | |
주 | 9 | 8.1% |
성 | 8 | 7.2% |
안 | 5 | 4.5% |
구 | 5 | 4.5% |
군 | 5 | 4.5% |
천 | 5 | 4.5% |
5 | 4.5% | |
여 | 4 | 3.6% |
양 | 4 | 3.6% |
Other values (23) | 34 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 106 | |
Space Separator | 5 | 4.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 27 | |
주 | 9 | 8.5% |
성 | 8 | 7.5% |
안 | 5 | 4.7% |
구 | 5 | 4.7% |
군 | 5 | 4.7% |
천 | 5 | 4.7% |
여 | 4 | 3.8% |
양 | 4 | 3.8% |
남 | 3 | 2.8% |
Other values (22) | 31 |
Space Separator
Value | Count | Frequency (%) |
5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 106 | |
Common | 5 | 4.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 27 | |
주 | 9 | 8.5% |
성 | 8 | 7.5% |
안 | 5 | 4.7% |
구 | 5 | 4.7% |
군 | 5 | 4.7% |
천 | 5 | 4.7% |
여 | 4 | 3.8% |
양 | 4 | 3.8% |
남 | 3 | 2.8% |
Other values (22) | 31 |
Common
Value | Count | Frequency (%) |
5 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 106 | |
ASCII | 5 | 4.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
시 | 27 | |
주 | 9 | 8.5% |
성 | 8 | 7.5% |
안 | 5 | 4.7% |
구 | 5 | 4.7% |
군 | 5 | 4.7% |
천 | 5 | 4.7% |
여 | 4 | 3.8% |
양 | 4 | 3.8% |
남 | 3 | 2.8% |
Other values (22) | 31 |
ASCII
Value | Count | Frequency (%) |
5 |
행정동명
Text
Distinct | 29 |
---|---|
Distinct (%) | 96.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
성남동 | 2 | 6.7% |
중대동 | 1 | 3.3% |
남방동 | 1 | 3.3% |
서패동 | 1 | 3.3% |
부발읍 | 1 | 3.3% |
구갈동 | 1 | 3.3% |
이동 | 1 | 3.3% |
군남면 | 1 | 3.3% |
흥천면 | 1 | 3.3% |
오금동 | 1 | 3.3% |
Other values (19) | 19 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 25 | |
면 | 5 | 5.7% |
남 | 4 | 4.5% |
대 | 3 | 3.4% |
성 | 2 | 2.3% |
안 | 2 | 2.3% |
연 | 2 | 2.3% |
강 | 2 | 2.3% |
흥 | 2 | 2.3% |
신 | 2 | 2.3% |
Other values (35) | 39 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 88 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 25 | |
면 | 5 | 5.7% |
남 | 4 | 4.5% |
대 | 3 | 3.4% |
성 | 2 | 2.3% |
안 | 2 | 2.3% |
연 | 2 | 2.3% |
강 | 2 | 2.3% |
흥 | 2 | 2.3% |
신 | 2 | 2.3% |
Other values (35) | 39 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 88 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 25 | |
면 | 5 | 5.7% |
남 | 4 | 4.5% |
대 | 3 | 3.4% |
성 | 2 | 2.3% |
안 | 2 | 2.3% |
연 | 2 | 2.3% |
강 | 2 | 2.3% |
흥 | 2 | 2.3% |
신 | 2 | 2.3% |
Other values (35) | 39 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 88 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 25 | |
면 | 5 | 5.7% |
남 | 4 | 4.5% |
대 | 3 | 3.4% |
성 | 2 | 2.3% |
안 | 2 | 2.3% |
연 | 2 | 2.3% |
강 | 2 | 2.3% |
흥 | 2 | 2.3% |
신 | 2 | 2.3% |
Other values (35) | 39 |
기준년도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
2019 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2019 |
---|---|
2nd row | 2019 |
3rd row | 2019 |
4th row | 2019 |
5th row | 2019 |
Common Values
Value | Count | Frequency (%) |
2019 | 30 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2019 | 30 |
건물지수(현황)
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 30 |
---|---|
Missing (%) | 100.0% |
Memory size | 402.0 B |
주택가격지수(현황)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
<NA> | |
---|---|
0 | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
<NA> | 28 | |
0 | 2 | 6.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 28 | |
0 | 2 | 6.7% |
아파트가격지수(현황)
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
0 | |
---|---|
<NA> |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 2.2 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 0 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 18 | |
<NA> | 12 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 18 | |
na | 12 |
시군구명 | 행정동명 | |
---|---|---|
시군구명 | 1.000 | 0.951 |
행정동명 | 0.951 | 1.000 |
주택가격지수(현황) | 아파트가격지수(현황) | |
---|---|---|
주택가격지수(현황) | 1.000 | 1.000 |
아파트가격지수(현황) | 1.000 | 1.000 |
주택가격지수(현황) | 아파트가격지수(현황) | |
---|---|---|
주택가격지수(현황) | 1.000 | 1.000 |
아파트가격지수(현황) | 1.000 | 1.000 |
시도명 | 시군구명 | 행정동명 | 기준년도 | 건물지수(현황) | 주택가격지수(현황) | 아파트가격지수(현황) | |
---|---|---|---|---|---|---|---|
0 | 경기도 | 광주시 | 중대동 | 2019 | <NA> | <NA> | 0 |
1 | 경기도 | 광명시 | 하안동 | 2019 | <NA> | <NA> | <NA> |
2 | 경기도 | 군포시 | 당동 | 2019 | <NA> | <NA> | <NA> |
3 | 경기도 | 동두천시 | 지행동 | 2019 | <NA> | <NA> | <NA> |
4 | 경기도 | 군포시 | 둔대동 | 2019 | <NA> | 0 | 0 |
5 | 경기도 | 부천시 | 괴안동 | 2019 | <NA> | <NA> | <NA> |
6 | 경기도 | 부천시 | 소사동 | 2019 | <NA> | <NA> | <NA> |
7 | 경기도 | 성남시 수정구 | 오야동 | 2019 | <NA> | <NA> | 0 |
8 | 경기도 | 성남시 수정구 | 창곡동 | 2019 | <NA> | <NA> | <NA> |
9 | 경기도 | 성남시 중원구 | 성남동 | 2019 | <NA> | <NA> | <NA> |
시도명 | 시군구명 | 행정동명 | 기준년도 | 건물지수(현황) | 주택가격지수(현황) | 아파트가격지수(현황) | |
---|---|---|---|---|---|---|---|
20 | 경기도 | 여주시 | 대신면 | 2019 | <NA> | <NA> | 0 |
21 | 경기도 | 여주시 | 연라동 | 2019 | <NA> | <NA> | 0 |
22 | 경기도 | 여주시 | 오금동 | 2019 | <NA> | <NA> | 0 |
23 | 경기도 | 여주시 | 흥천면 | 2019 | <NA> | <NA> | 0 |
24 | 경기도 | 연천군 | 군남면 | 2019 | <NA> | <NA> | 0 |
25 | 경기도 | 의왕시 | 이동 | 2019 | <NA> | <NA> | 0 |
26 | 경기도 | 용인시 기흥구 | 구갈동 | 2019 | <NA> | <NA> | <NA> |
27 | 경기도 | 이천시 | 부발읍 | 2019 | <NA> | <NA> | <NA> |
28 | 경기도 | 파주시 | 서패동 | 2019 | <NA> | <NA> | 0 |
29 | 경기도 | 파주시 | 연다산동 | 2019 | <NA> | <NA> | 0 |