Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 678 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 33.9 KiB |
Average record size in memory | 51.2 B |
Variable types
Numeric | 3 |
---|---|
Text | 2 |
DateTime | 1 |
Dataset
Description | 한국부동산원(구.한국감정원)에서 제공하는 신규 아파트 단지 목록 데이터입니다. - (대상) 22.01.01. ~ 22.12.31. 사용승인분 |
---|---|
URL | https://www.data.go.kr/data/15120697/fileData.do |
단지코드 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 00:35:06.913334 |
---|---|
Analysis finished | 2023-12-12 00:35:08.382097 |
Duration | 1.47 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
단지코드
Real number (ℝ)
UNIQUE
 
Distinct | 678 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20436783 |
Minimum | 20336743 |
---|---|
Maximum | 20442243 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.1 KiB |
Quantile statistics
Minimum | 20336743 |
---|---|
5-th percentile | 20432008 |
Q1 | 20433591 |
median | 20438031 |
Q3 | 20440076 |
95-th percentile | 20441539 |
Maximum | 20442243 |
Range | 105500 |
Interquartile range (IQR) | 6485.25 |
Descriptive statistics
Standard deviation | 5984.0149 |
---|---|
Coefficient of variation (CV) | 0.00029280611 |
Kurtosis | 130.41146 |
Mean | 20436783 |
Median Absolute Deviation (MAD) | 2796.5 |
Skewness | -8.9670431 |
Sum | 1.3856139 × 1010 |
Variance | 35808435 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20439501 | 1 | 0.1% |
20434958 | 1 | 0.1% |
20431931 | 1 | 0.1% |
20439221 | 1 | 0.1% |
20441960 | 1 | 0.1% |
20438906 | 1 | 0.1% |
20432505 | 1 | 0.1% |
20435005 | 1 | 0.1% |
20437754 | 1 | 0.1% |
20438869 | 1 | 0.1% |
Other values (668) | 668 |
Value | Count | Frequency (%) |
20336743 | 1 | |
20380966 | 1 | |
20391486 | 1 | |
20416306 | 1 | |
20416937 | 1 | |
20418633 | 1 | |
20418833 | 1 | |
20421617 | 1 | |
20430802 | 1 | |
20430951 | 1 |
Value | Count | Frequency (%) |
20442243 | 1 | |
20442223 | 1 | |
20442171 | 1 | |
20442157 | 1 | |
20442137 | 1 | |
20442129 | 1 | |
20442125 | 1 | |
20442121 | 1 | |
20442077 | 1 | |
20441964 | 1 |
단지명
Text
Distinct | 677 |
---|---|
Distinct (%) | 99.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
Length
Max length | 23 |
---|---|
Median length | 19 |
Mean length | 9.1179941 |
Min length | 2 |
Characters and Unicode
Total characters | 6182 |
---|---|
Distinct characters | 427 |
Distinct categories | 10 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 676 ? |
---|---|
Unique (%) | 99.7% |
Sample
1st row | 힐스테이트창경궁 |
---|---|
2nd row | 청계랜드힐아파트 |
3rd row | 용산원효루미니 |
4th row | 용산소미글로벌리버파크 |
5th row | 히페리온리버팰리스 |
Value | Count | Frequency (%) |
엘리하임 | 2 | 0.3% |
해오름마을14단지푸르지오파르세나 | 1 | 0.1% |
김포양곡엘에이치1단지아파트 | 1 | 0.1% |
위례숲우미린 | 1 | 0.1% |
위례중흥에스-클래스 | 1 | 0.1% |
위례우미린 | 1 | 0.1% |
용인죽전경기행복주택 | 1 | 0.1% |
한화포레나수지동천 | 1 | 0.1% |
힐스테이트광교산 | 1 | 0.1% |
수지스카이뷰푸르지오 | 1 | 0.1% |
Other values (667) | 667 |
Most occurring characters
Value | Count | Frequency (%) |
트 | 222 | 3.6% |
스 | 192 | 3.1% |
파 | 164 | 2.7% |
아 | 157 | 2.5% |
지 | 156 | 2.5% |
이 | 146 | 2.4% |
리 | 130 | 2.1% |
단 | 99 | 1.6% |
시 | 92 | 1.5% |
1 | 87 | 1.4% |
Other values (417) | 4737 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5542 | |
Decimal Number | 276 | 4.5% |
Uppercase Letter | 238 | 3.8% |
Lowercase Letter | 42 | 0.7% |
Open Punctuation | 28 | 0.5% |
Close Punctuation | 28 | 0.5% |
Dash Punctuation | 17 | 0.3% |
Letter Number | 8 | 0.1% |
Other Punctuation | 2 | < 0.1% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
트 | 222 | 4.0% |
스 | 192 | 3.5% |
파 | 164 | 3.0% |
아 | 157 | 2.8% |
지 | 156 | 2.8% |
이 | 146 | 2.6% |
리 | 130 | 2.3% |
단 | 99 | 1.8% |
시 | 92 | 1.7% |
크 | 81 | 1.5% |
Other values (365) | 4103 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 42 | |
H | 38 | |
S | 16 | 6.7% |
I | 14 | 5.9% |
T | 14 | 5.9% |
E | 13 | 5.5% |
A | 13 | 5.5% |
C | 11 | 4.6% |
M | 11 | 4.6% |
D | 9 | 3.8% |
Other values (12) | 57 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 19 | |
t | 4 | 9.5% |
y | 4 | 9.5% |
i | 3 | 7.1% |
h | 3 | 7.1% |
c | 2 | 4.8% |
k | 2 | 4.8% |
s | 2 | 4.8% |
r | 1 | 2.4% |
d | 1 | 2.4% |
Decimal Number
Value | Count | Frequency (%) |
1 | 87 | |
2 | 76 | |
3 | 29 | 10.5% |
0 | 21 | 7.6% |
4 | 20 | 7.2% |
6 | 12 | 4.3% |
5 | 11 | 4.0% |
8 | 9 | 3.3% |
9 | 6 | 2.2% |
7 | 5 | 1.8% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 4 | |
Ⅰ | 2 | |
Ⅲ | 2 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 | |
' | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 28 |
Close Punctuation
Value | Count | Frequency (%) |
) | 28 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 17 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5540 | |
Common | 352 | 5.7% |
Latin | 288 | 4.7% |
Han | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
트 | 222 | 4.0% |
스 | 192 | 3.5% |
파 | 164 | 3.0% |
아 | 157 | 2.8% |
지 | 156 | 2.8% |
이 | 146 | 2.6% |
리 | 130 | 2.3% |
단 | 99 | 1.8% |
시 | 92 | 1.7% |
크 | 81 | 1.5% |
Other values (364) | 4101 |
Latin
Value | Count | Frequency (%) |
L | 42 | |
H | 38 | 13.2% |
e | 19 | 6.6% |
S | 16 | 5.6% |
I | 14 | 4.9% |
T | 14 | 4.9% |
E | 13 | 4.5% |
A | 13 | 4.5% |
C | 11 | 3.8% |
M | 11 | 3.8% |
Other values (26) | 97 |
Common
Value | Count | Frequency (%) |
1 | 87 | |
2 | 76 | |
3 | 29 | 8.2% |
( | 28 | 8.0% |
) | 28 | 8.0% |
0 | 21 | 6.0% |
4 | 20 | 5.7% |
- | 17 | 4.8% |
6 | 12 | 3.4% |
5 | 11 | 3.1% |
Other values (6) | 23 | 6.5% |
Han
Value | Count | Frequency (%) |
愛 | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5540 | |
ASCII | 632 | 10.2% |
Number Forms | 8 | 0.1% |
CJK | 2 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
트 | 222 | 4.0% |
스 | 192 | 3.5% |
파 | 164 | 3.0% |
아 | 157 | 2.8% |
지 | 156 | 2.8% |
이 | 146 | 2.6% |
리 | 130 | 2.3% |
단 | 99 | 1.8% |
시 | 92 | 1.7% |
크 | 81 | 1.5% |
Other values (364) | 4101 |
ASCII
Value | Count | Frequency (%) |
1 | 87 | 13.8% |
2 | 76 | 12.0% |
L | 42 | 6.6% |
H | 38 | 6.0% |
3 | 29 | 4.6% |
( | 28 | 4.4% |
) | 28 | 4.4% |
0 | 21 | 3.3% |
4 | 20 | 3.2% |
e | 19 | 3.0% |
Other values (39) | 244 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 4 | |
Ⅰ | 2 | |
Ⅲ | 2 |
CJK
Value | Count | Frequency (%) |
愛 | 2 |
소재지
Text
Distinct | 415 |
---|---|
Distinct (%) | 61.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
Length
Max length | 17 |
---|---|
Median length | 16 |
Mean length | 12.340708 |
Min length | 10 |
Characters and Unicode
Total characters | 8367 |
---|---|
Distinct characters | 233 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 275 ? |
---|---|
Unique (%) | 40.6% |
Sample
1st row | 서울특별시 종로구 충신동 |
---|---|
2nd row | 서울특별시 중구 황학동 |
3rd row | 서울특별시 용산구 원효로1가 |
4th row | 서울특별시 용산구 원효로3가 |
5th row | 서울특별시 성동구 송정동 |
Value | Count | Frequency (%) |
경기도 | 198 | 9.8% |
서울특별시 | 111 | 5.5% |
부천시 | 54 | 2.7% |
부산광역시 | 45 | 2.2% |
인천광역시 | 45 | 2.2% |
충청남도 | 45 | 2.2% |
전라남도 | 36 | 1.8% |
대구광역시 | 36 | 1.8% |
서구 | 33 | 1.6% |
중구 | 24 | 1.2% |
Other values (563) | 1400 |
Most occurring characters
Value | Count | Frequency (%) |
1362 | 16.3% | |
동 | 622 | 7.4% |
시 | 559 | 6.7% |
구 | 412 | 4.9% |
도 | 392 | 4.7% |
광 | 254 | 3.0% |
경 | 239 | 2.9% |
기 | 209 | 2.5% |
서 | 201 | 2.4% |
역 | 192 | 2.3% |
Other values (223) | 3925 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6989 | |
Space Separator | 1362 | 16.3% |
Decimal Number | 16 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 622 | 8.9% |
시 | 559 | 8.0% |
구 | 412 | 5.9% |
도 | 392 | 5.6% |
광 | 254 | 3.6% |
경 | 239 | 3.4% |
기 | 209 | 3.0% |
서 | 201 | 2.9% |
역 | 192 | 2.7% |
남 | 173 | 2.5% |
Other values (219) | 3736 |
Decimal Number
Value | Count | Frequency (%) |
1 | 10 | |
3 | 4 | 25.0% |
2 | 2 | 12.5% |
Space Separator
Value | Count | Frequency (%) |
1362 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6989 | |
Common | 1378 | 16.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 622 | 8.9% |
시 | 559 | 8.0% |
구 | 412 | 5.9% |
도 | 392 | 5.6% |
광 | 254 | 3.6% |
경 | 239 | 3.4% |
기 | 209 | 3.0% |
서 | 201 | 2.9% |
역 | 192 | 2.7% |
남 | 173 | 2.5% |
Other values (219) | 3736 |
Common
Value | Count | Frequency (%) |
1362 | ||
1 | 10 | 0.7% |
3 | 4 | 0.3% |
2 | 2 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6989 | |
ASCII | 1378 | 16.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1362 | ||
1 | 10 | 0.7% |
3 | 4 | 0.3% |
2 | 2 | 0.1% |
Hangul
Value | Count | Frequency (%) |
동 | 622 | 8.9% |
시 | 559 | 8.0% |
구 | 412 | 5.9% |
도 | 392 | 5.6% |
광 | 254 | 3.6% |
경 | 239 | 3.4% |
기 | 209 | 3.0% |
서 | 201 | 2.9% |
역 | 192 | 2.7% |
남 | 173 | 2.5% |
Other values (219) | 3736 |
시군구코드
Real number (ℝ)
Distinct | 172 |
---|---|
Distinct (%) | 25.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 33873.587 |
Minimum | 11110 |
---|---|
Maximum | 50130 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.1 KiB |
Quantile statistics
Minimum | 11110 |
---|---|
5-th percentile | 11380 |
Q1 | 27237.5 |
median | 41190 |
Q3 | 42130 |
95-th percentile | 47761.5 |
Maximum | 50130 |
Range | 39020 |
Interquartile range (IQR) | 14892.5 |
Descriptive statistics
Standard deviation | 12069.959 |
---|---|
Coefficient of variation (CV) | 0.3563236 |
Kurtosis | -0.69527187 |
Mean | 33873.587 |
Median Absolute Deviation (MAD) | 6090 |
Skewness | -0.7444966 |
Sum | 22966292 |
Variance | 1.456839 × 108 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
41190 | 54 | 8.0% |
41590 | 21 | 3.1% |
28260 | 21 | 3.1% |
41281 | 14 | 2.1% |
11680 | 13 | 1.9% |
31140 | 11 | 1.6% |
41630 | 11 | 1.6% |
50110 | 11 | 1.6% |
44200 | 11 | 1.6% |
11380 | 11 | 1.6% |
Other values (162) | 500 |
Value | Count | Frequency (%) |
11110 | 1 | 0.1% |
11140 | 1 | 0.1% |
11170 | 2 | 0.3% |
11200 | 1 | 0.1% |
11215 | 5 | |
11230 | 1 | 0.1% |
11260 | 5 | |
11290 | 6 | |
11305 | 6 | |
11320 | 3 |
Value | Count | Frequency (%) |
50130 | 3 | 0.4% |
50110 | 11 | |
48880 | 1 | 0.1% |
48860 | 1 | 0.1% |
48850 | 2 | 0.3% |
48740 | 1 | 0.1% |
48330 | 4 | 0.6% |
48310 | 1 | 0.1% |
48270 | 3 | 0.4% |
48250 | 1 | 0.1% |
읍면동코드
Real number (ℝ)
Distinct | 95 |
---|---|
Distinct (%) | 14.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14279.544 |
Minimum | 10100 |
---|---|
Maximum | 41021 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.1 KiB |
Quantile statistics
Minimum | 10100 |
---|---|
5-th percentile | 10100 |
Q1 | 10500 |
median | 11300 |
Q3 | 13275 |
95-th percentile | 26222 |
Maximum | 41021 |
Range | 30921 |
Interquartile range (IQR) | 2775 |
Descriptive statistics
Standard deviation | 6686.2746 |
---|---|
Coefficient of variation (CV) | 0.46824146 |
Kurtosis | 2.5876446 |
Mean | 14279.544 |
Median Absolute Deviation (MAD) | 1000 |
Skewness | 1.8986722 |
Sum | 9681531 |
Variance | 44706268 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10200 | 48 | 7.1% |
10100 | 47 | 6.9% |
10300 | 37 | 5.5% |
10800 | 34 | 5.0% |
10400 | 33 | 4.9% |
10600 | 28 | 4.1% |
10500 | 27 | 4.0% |
11300 | 23 | 3.4% |
10700 | 23 | 3.4% |
10900 | 21 | 3.1% |
Other values (85) | 357 |
Value | Count | Frequency (%) |
10100 | 47 | |
10200 | 48 | |
10300 | 37 | |
10400 | 33 | |
10500 | 27 | |
10600 | 28 | |
10700 | 23 | |
10800 | 34 | |
10900 | 21 | |
11000 | 16 | 2.4% |
Value | Count | Frequency (%) |
41021 | 2 | |
40024 | 1 | |
39031 | 1 | |
39028 | 1 | |
39021 | 1 | |
37026 | 1 | |
37022 | 1 | |
36046 | 1 | |
36021 | 2 | |
34025 | 2 |
준공일자
Date
Distinct | 222 |
---|---|
Distinct (%) | 32.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
Minimum | 2022-01-05 00:00:00 |
---|---|
Maximum | 2022-12-30 00:00:00 |
단지코드 | 시군구코드 | 읍면동코드 | |
---|---|---|---|
단지코드 | 1.000 | 0.022 | 0.056 |
시군구코드 | 0.022 | 1.000 | 0.414 |
읍면동코드 | 0.056 | 0.414 | 1.000 |
단지코드 | 시군구코드 | 읍면동코드 | |
---|---|---|---|
단지코드 | 1.000 | 0.116 | 0.101 |
시군구코드 | 0.116 | 1.000 | 0.448 |
읍면동코드 | 0.101 | 0.448 | 1.000 |
단지코드 | 단지명 | 소재지 | 시군구코드 | 읍면동코드 | 준공일자 | |
---|---|---|---|---|---|---|
0 | 20439501 | 힐스테이트창경궁 | 서울특별시 종로구 충신동 | 11110 | 16700 | 2022-09-29 |
1 | 20432203 | 청계랜드힐아파트 | 서울특별시 중구 황학동 | 11140 | 16500 | 2022-02-07 |
2 | 20435423 | 용산원효루미니 | 서울특별시 용산구 원효로1가 | 11170 | 11200 | 2022-04-28 |
3 | 20437907 | 용산소미글로벌리버파크 | 서울특별시 용산구 원효로3가 | 11170 | 11700 | 2022-07-06 |
4 | 20431766 | 히페리온리버팰리스 | 서울특별시 성동구 송정동 | 11200 | 11800 | 2022-01-14 |
5 | 20439181 | 리마크빌군자 | 서울특별시 광진구 중곡동 | 11215 | 10100 | 2022-08-30 |
6 | 20432091 | 현대팰리스 | 서울특별시 광진구 구의동 | 11215 | 10300 | 2022-01-24 |
7 | 20437221 | 광진더프레236 | 서울특별시 광진구 구의동 | 11215 | 10300 | 2022-06-10 |
8 | 20438235 | 스타파크 | 서울특별시 광진구 구의동 | 11215 | 10300 | 2022-07-22 |
9 | 20432911 | 더메종건대 | 서울특별시 광진구 화양동 | 11215 | 10700 | 2022-03-18 |
단지코드 | 단지명 | 소재지 | 시군구코드 | 읍면동코드 | 준공일자 | |
---|---|---|---|---|---|---|
668 | 20440759 | 엔알누리8차 | 제주특별자치도 제주시 노형동 | 50110 | 12200 | 2022-11-08 |
669 | 20435325 | 제이씨티팰리스 | 제주특별자치도 제주시 외도일동 | 50110 | 12300 | 2022-05-09 |
670 | 20438150 | 더펠리스5차 | 제주특별자치도 제주시 외도일동 | 50110 | 12300 | 2022-07-15 |
671 | 20441386 | (633-16) | 제주특별자치도 제주시 외도일동 | 50110 | 12300 | 2022-12-13 |
672 | 20432479 | 까사빌4차 | 제주특별자치도 제주시 연동 | 50110 | 13700 | 2022-02-11 |
673 | 20441429 | 하귀푸르미르 | 제주특별자치도 제주시 애월읍 | 50110 | 25341 | 2022-12-14 |
674 | 20436908 | 광영타운 | 제주특별자치도 제주시 조천읍 | 50110 | 25921 | 2022-05-27 |
675 | 20432370 | 아델리스 | 제주특별자치도 서귀포시 서귀동 | 50130 | 10100 | 2022-02-08 |
676 | 20431699 | 포스트동홍2차아파트 | 제주특별자치도 서귀포시 동홍동 | 50130 | 10500 | 2022-01-11 |
677 | 20433550 | 더아란치아파크 | 제주특별자치도 서귀포시 신효동 | 50130 | 10900 | 2022-04-13 |