Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 518 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 2 |
Duplicate rows (%) | 0.4% |
Total size in memory | 25.4 KiB |
Average record size in memory | 50.3 B |
Variable types
Categorical | 3 |
---|---|
Text | 1 |
Numeric | 2 |
Dataset
Description | 전라남도 나주시 관내 원룸 및 오피스텔 데이터입니다. 소재지주소, 주용도, 가구수, 사용승인연도 등에 관한 데이터를 제공합니다. |
---|---|
Author | 전라남도 나주시 |
URL | https://www.data.go.kr/data/15077537/fileData.do |
데이터기준일자 has constant value "" | Constant |
Dataset has 2 (0.4%) duplicate rows | Duplicates |
구분 is highly overall correlated with 가구수 and 1 other fields | High correlation |
주용도 is highly overall correlated with 가구수 and 1 other fields | High correlation |
가구수 is highly overall correlated with 구분 and 1 other fields | High correlation |
구분 is highly imbalanced (85.2%) | Imbalance |
주용도 is highly imbalanced (85.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 14:37:42.923263 |
---|---|
Analysis finished | 2023-12-12 14:37:43.707529 |
Duration | 0.78 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.2 KiB |
원룸 | |
---|---|
오피스텔 | 11 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.042471 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 원룸 |
---|---|
2nd row | 원룸 |
3rd row | 원룸 |
4th row | 원룸 |
5th row | 원룸 |
Common Values
Value | Count | Frequency (%) |
원룸 | 507 | |
오피스텔 | 11 | 2.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
원룸 | 507 | |
오피스텔 | 11 | 2.1% |
소재지지번주소
Text
Distinct | 510 |
---|---|
Distinct (%) | 98.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.2 KiB |
Length
Max length | 24 |
---|---|
Median length | 23 |
Mean length | 18.996139 |
Min length | 15 |
Characters and Unicode
Total characters | 9840 |
---|---|
Distinct characters | 85 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 506 ? |
---|---|
Unique (%) | 97.7% |
Sample
1st row | 전라남도 나주시 경현동 276 |
---|---|
2nd row | 전라남도 나주시 경현동 439-3 |
3rd row | 전라남도 나주시 경현동 561-1 |
4th row | 전라남도 나주시 공산면 동촌리 310-6 |
5th row | 전라남도 나주시 과원동 10-1 |
Value | Count | Frequency (%) |
전라남도 | 518 | |
나주시 | 518 | |
빛가람동 | 171 | 7.9% |
송월동 | 92 | 4.2% |
대호동 | 75 | 3.5% |
이창동 | 57 | 2.6% |
남평읍 | 28 | 1.3% |
산포면 | 27 | 1.2% |
매성리 | 25 | 1.2% |
동사리 | 24 | 1.1% |
Other values (551) | 636 |
Most occurring characters
Value | Count | Frequency (%) |
1653 | ||
남 | 552 | 5.6% |
도 | 529 | 5.4% |
시 | 520 | 5.3% |
전 | 519 | 5.3% |
나 | 518 | 5.3% |
주 | 518 | 5.3% |
라 | 518 | 5.3% |
1 | 498 | 5.1% |
동 | 447 | 4.5% |
Other values (75) | 3568 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5646 | |
Decimal Number | 2140 | 21.7% |
Space Separator | 1653 | 16.8% |
Dash Punctuation | 401 | 4.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
남 | 552 | |
도 | 529 | |
시 | 520 | |
전 | 519 | |
나 | 518 | |
주 | 518 | |
라 | 518 | |
동 | 447 | 7.9% |
빛 | 171 | 3.0% |
가 | 171 | 3.0% |
Other values (63) | 1183 |
Decimal Number
Value | Count | Frequency (%) |
1 | 498 | |
2 | 288 | |
4 | 250 | |
3 | 242 | |
0 | 186 | 8.7% |
7 | 185 | 8.6% |
5 | 168 | 7.9% |
6 | 124 | 5.8% |
8 | 111 | 5.2% |
9 | 88 | 4.1% |
Space Separator
Value | Count | Frequency (%) |
1653 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 401 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5646 | |
Common | 4194 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
남 | 552 | |
도 | 529 | |
시 | 520 | |
전 | 519 | |
나 | 518 | |
주 | 518 | |
라 | 518 | |
동 | 447 | 7.9% |
빛 | 171 | 3.0% |
가 | 171 | 3.0% |
Other values (63) | 1183 |
Common
Value | Count | Frequency (%) |
1653 | ||
1 | 498 | 11.9% |
- | 401 | 9.6% |
2 | 288 | 6.9% |
4 | 250 | 6.0% |
3 | 242 | 5.8% |
0 | 186 | 4.4% |
7 | 185 | 4.4% |
5 | 168 | 4.0% |
6 | 124 | 3.0% |
Other values (2) | 199 | 4.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5646 | |
ASCII | 4194 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1653 | ||
1 | 498 | 11.9% |
- | 401 | 9.6% |
2 | 288 | 6.9% |
4 | 250 | 6.0% |
3 | 242 | 5.8% |
0 | 186 | 4.4% |
7 | 185 | 4.4% |
5 | 168 | 4.0% |
6 | 124 | 3.0% |
Other values (2) | 199 | 4.7% |
Hangul
Value | Count | Frequency (%) |
남 | 552 | |
도 | 529 | |
시 | 520 | |
전 | 519 | |
나 | 518 | |
주 | 518 | |
라 | 518 | |
동 | 447 | 7.9% |
빛 | 171 | 3.0% |
가 | 171 | 3.0% |
Other values (63) | 1183 |
주용도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.2 KiB |
단독주택 | |
---|---|
업무시설 | 11 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 단독주택 |
---|---|
2nd row | 단독주택 |
3rd row | 단독주택 |
4th row | 단독주택 |
5th row | 단독주택 |
Common Values
Value | Count | Frequency (%) |
단독주택 | 507 | |
업무시설 | 11 | 2.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단독주택 | 507 | |
업무시설 | 11 | 2.1% |
가구수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 28 |
---|---|
Distinct (%) | 5.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 17.025097 |
Minimum | 2 |
---|---|
Maximum | 1315 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.7 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 2 |
Q1 | 3 |
median | 4 |
Q3 | 15 |
95-th percentile | 19 |
Maximum | 1315 |
Range | 1313 |
Interquartile range (IQR) | 12 |
Descriptive statistics
Standard deviation | 87.533234 |
---|---|
Coefficient of variation (CV) | 5.1414237 |
Kurtosis | 182.26949 |
Mean | 17.025097 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 12.98019 |
Sum | 8819 |
Variance | 7662.0671 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 166 | |
2 | 66 | 12.7% |
19 | 49 | 9.5% |
15 | 38 | 7.3% |
18 | 35 | 6.8% |
4 | 31 | 6.0% |
12 | 20 | 3.9% |
16 | 19 | 3.7% |
14 | 13 | 2.5% |
13 | 11 | 2.1% |
Other values (18) | 70 |
Value | Count | Frequency (%) |
2 | 66 | 12.7% |
3 | 166 | |
4 | 31 | 6.0% |
5 | 7 | 1.4% |
6 | 10 | 1.9% |
7 | 1 | 0.2% |
8 | 10 | 1.9% |
9 | 8 | 1.5% |
10 | 10 | 1.9% |
11 | 4 | 0.8% |
Value | Count | Frequency (%) |
1315 | 1 | |
1288 | 1 | |
559 | 1 | |
367 | 1 | |
264 | 1 | |
260 | 1 | |
234 | 1 | |
156 | 1 | |
30 | 1 | |
24 | 1 |
사용승인년도
Real number (ℝ)
Distinct | 39 |
---|---|
Distinct (%) | 7.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2013.0734 |
Minimum | 1910 |
---|---|
Maximum | 2023 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.7 KiB |
Quantile statistics
Minimum | 1910 |
---|---|
5-th percentile | 1996.85 |
Q1 | 2013 |
median | 2015 |
Q3 | 2017 |
95-th percentile | 2021 |
Maximum | 2023 |
Range | 113 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 11.607309 |
---|---|
Coefficient of variation (CV) | 0.0057659641 |
Kurtosis | 40.328165 |
Mean | 2013.0734 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -5.7085086 |
Sum | 1042772 |
Variance | 134.72962 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2014 | 103 | |
2015 | 80 | |
2013 | 46 | |
2012 | 38 | 7.3% |
2018 | 30 | 5.8% |
2021 | 30 | 5.8% |
2016 | 29 | 5.6% |
2022 | 24 | 4.6% |
2019 | 23 | 4.4% |
2017 | 22 | 4.2% |
Other values (29) | 93 |
Value | Count | Frequency (%) |
1910 | 1 | |
1914 | 1 | |
1915 | 1 | |
1935 | 1 | |
1948 | 2 | |
1950 | 1 | |
1972 | 1 | |
1976 | 1 | |
1977 | 1 | |
1979 | 1 |
Value | Count | Frequency (%) |
2023 | 1 | 0.2% |
2022 | 24 | 4.6% |
2021 | 30 | 5.8% |
2020 | 21 | 4.1% |
2019 | 23 | 4.4% |
2018 | 30 | 5.8% |
2017 | 22 | 4.2% |
2016 | 29 | 5.6% |
2015 | 80 | |
2014 | 103 |
데이터기준일자
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.2 KiB |
2023-01-30 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-01-30 |
---|---|
2nd row | 2023-01-30 |
3rd row | 2023-01-30 |
4th row | 2023-01-30 |
5th row | 2023-01-30 |
Common Values
Value | Count | Frequency (%) |
2023-01-30 | 518 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-01-30 | 518 |
구분 | 주용도 | 가구수 | 사용승인년도 | |
---|---|---|---|---|
구분 | 1.000 | 0.997 | 0.714 | 0.000 |
주용도 | 0.997 | 1.000 | 0.714 | 0.000 |
가구수 | 0.714 | 0.714 | 1.000 | 0.000 |
사용승인년도 | 0.000 | 0.000 | 0.000 | 1.000 |
구분 | 주용도 | |
---|---|---|
구분 | 1.000 | 0.953 |
주용도 | 0.953 | 1.000 |
가구수 | 사용승인년도 | 구분 | 주용도 | |
---|---|---|---|---|
가구수 | 1.000 | 0.075 | 0.847 | 0.847 |
사용승인년도 | 0.075 | 1.000 | 0.000 | 0.000 |
구분 | 0.847 | 0.000 | 1.000 | 0.953 |
주용도 | 0.847 | 0.000 | 0.953 | 1.000 |
구분 | 소재지지번주소 | 주용도 | 가구수 | 사용승인년도 | 데이터기준일자 | |
---|---|---|---|---|---|---|
0 | 원룸 | 전라남도 나주시 경현동 276 | 단독주택 | 14 | 2013 | 2023-01-30 |
1 | 원룸 | 전라남도 나주시 경현동 439-3 | 단독주택 | 2 | 2012 | 2023-01-30 |
2 | 원룸 | 전라남도 나주시 경현동 561-1 | 단독주택 | 14 | 2012 | 2023-01-30 |
3 | 원룸 | 전라남도 나주시 공산면 동촌리 310-6 | 단독주택 | 2 | 2010 | 2023-01-30 |
4 | 원룸 | 전라남도 나주시 과원동 10-1 | 단독주택 | 18 | 2012 | 2023-01-30 |
5 | 원룸 | 전라남도 나주시 교동 153 | 단독주택 | 13 | 2012 | 2023-01-30 |
6 | 원룸 | 전라남도 나주시 교동 153-2 | 단독주택 | 5 | 2014 | 2023-01-30 |
7 | 원룸 | 전라남도 나주시 금계동 86 | 단독주택 | 4 | 1995 | 2023-01-30 |
8 | 원룸 | 전라남도 나주시 금계동 104 | 단독주택 | 12 | 2012 | 2023-01-30 |
9 | 오피스텔 | 전라남도 나주시 금계동 104-1 | 업무시설 | 30 | 2004 | 2023-01-30 |
구분 | 소재지지번주소 | 주용도 | 가구수 | 사용승인년도 | 데이터기준일자 | |
---|---|---|---|---|---|---|
508 | 원룸 | 전라남도 나주시 송월동 1177 | 단독주택 | 17 | 2022 | 2023-01-30 |
509 | 원룸 | 전라남도 나주시 빛가람동 83-4 | 단독주택 | 3 | 2022 | 2023-01-30 |
510 | 원룸 | 전라남도 나주시 송월동 1163 | 단독주택 | 15 | 2022 | 2023-01-30 |
511 | 원룸 | 전라남도 나주시 빛가람동 89-4 | 단독주택 | 3 | 2022 | 2023-01-30 |
512 | 원룸 | 전라남도 나주시 송월동 1366 | 단독주택 | 11 | 2022 | 2023-01-30 |
513 | 원룸 | 전라남도 나주시 송월동 1367 | 단독주택 | 13 | 2022 | 2023-01-30 |
514 | 원룸 | 전라남도 나주시 이창동 715-6 | 단독주택 | 10 | 2022 | 2023-01-30 |
515 | 원룸 | 전라남도 나주시 이창동 715-5 | 단독주택 | 19 | 2022 | 2023-01-30 |
516 | 원룸 | 전라남도 나주시 송월동 1185 | 단독주택 | 19 | 2023 | 2023-01-30 |
517 | 오피스텔 | 전라남도 나주시 빛가람동 334 | 업무시설 | 559 | 2022 | 2023-01-30 |
Most frequently occurring
구분 | 소재지지번주소 | 주용도 | 가구수 | 사용승인년도 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | 원룸 | 전라남도 나주시 다도면 판촌리 1415 | 단독주택 | 2 | 2017 | 2023-01-30 | 6 |
1 | 원룸 | 전라남도 나주시 빛가람동 84-13 | 단독주택 | 3 | 2021 | 2023-01-30 | 2 |