Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 3 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 673.8 KiB |
Average record size in memory | 69.0 B |
Variable types
Numeric | 5 |
---|---|
Categorical | 1 |
Text | 1 |
Dataset
Description | 평균연령 집계 현황 |
---|---|
Author | 행정안전부 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=9QW509KIRCMVKLZR47OY27389949&infSeq=1 |
Dataset has 3 (< 0.1%) duplicate rows | Duplicates |
남자 평균연령 is highly overall correlated with 여자 평균연령 and 1 other fields | High correlation |
여자 평균연령 is highly overall correlated with 남자 평균연령 and 1 other fields | High correlation |
평균연령 is highly overall correlated with 남자 평균연령 and 1 other fields | High correlation |
행정구역구분명 is highly imbalanced (75.5%) | Imbalance |
Reproduction
Analysis started | 2024-04-11 02:51:30.354429 |
---|---|
Analysis finished | 2024-04-11 02:51:36.789617 |
Duration | 6.44 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
Distinct | 15 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.967 |
Minimum | 2010 |
---|---|
Maximum | 2024 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2010 |
---|---|
5-th percentile | 2011 |
Q1 | 2014 |
median | 2017 |
Q3 | 2020 |
95-th percentile | 2023 |
Maximum | 2024 |
Range | 14 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 3.944473 |
---|---|
Coefficient of variation (CV) | 0.0019556458 |
Kurtosis | -1.1543117 |
Mean | 2016.967 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.014727699 |
Sum | 20169670 |
Variance | 15.558867 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2018 | 777 | 7.8% |
2017 | 763 | 7.6% |
2022 | 757 | 7.6% |
2016 | 756 | 7.6% |
2014 | 755 | 7.5% |
2013 | 740 | 7.4% |
2023 | 740 | 7.4% |
2019 | 732 | 7.3% |
2020 | 725 | 7.2% |
2021 | 695 | 7.0% |
Other values (5) | 2560 |
Value | Count | Frequency (%) |
2010 | 308 | 3.1% |
2011 | 695 | |
2012 | 683 | |
2013 | 740 | |
2014 | 755 | |
2015 | 683 | |
2016 | 756 | |
2017 | 763 | |
2018 | 777 | |
2019 | 732 |
Value | Count | Frequency (%) |
2024 | 191 | 1.9% |
2023 | 740 | |
2022 | 757 | |
2021 | 695 | |
2020 | 725 | |
2019 | 732 | |
2018 | 777 | |
2017 | 763 | |
2016 | 756 | |
2015 | 683 |
월
Real number (ℝ)
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.5309 |
Minimum | 1 |
---|---|
Maximum | 12 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 7 |
Q3 | 10 |
95-th percentile | 12 |
Maximum | 12 |
Range | 11 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 3.466792 |
---|---|
Coefficient of variation (CV) | 0.53082914 |
Kurtosis | -1.2405914 |
Mean | 6.5309 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.019012059 |
Sum | 65309 |
Variance | 12.018647 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 961 | |
8 | 865 | |
9 | 865 | |
11 | 854 | |
7 | 849 | |
10 | 848 | |
12 | 834 | |
1 | 824 | |
2 | 804 | |
5 | 780 | |
Other values (2) | 1516 |
Value | Count | Frequency (%) |
1 | 824 | |
2 | 804 | |
3 | 961 | |
4 | 766 | |
5 | 780 | |
6 | 750 | |
7 | 849 | |
8 | 865 | |
9 | 865 | |
10 | 848 |
Value | Count | Frequency (%) |
12 | 834 | |
11 | 854 | |
10 | 848 | |
9 | 865 | |
8 | 865 | |
7 | 849 | |
6 | 750 | |
5 | 780 | |
4 | 766 | |
3 | 961 |
행정구역구분명
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
읍면동 | |
---|---|
시군 | 486 |
구 | 302 |
도 | 15 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.888 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 읍면동 |
---|---|
2nd row | 읍면동 |
3rd row | 읍면동 |
4th row | 읍면동 |
5th row | 구 |
Common Values
Value | Count | Frequency (%) |
읍면동 | 9197 | |
시군 | 486 | 4.9% |
구 | 302 | 3.0% |
도 | 15 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
읍면동 | 9197 | |
시군 | 486 | 4.9% |
구 | 302 | 3.0% |
도 | 15 | 0.1% |
행정구역명
Text
Distinct | 962 |
---|---|
Distinct (%) | 9.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 17 |
---|---|
Median length | 16 |
Mean length | 12.8903 |
Min length | 3 |
Characters and Unicode
Total characters | 128903 |
---|---|
Distinct characters | 214 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 156 ? |
---|---|
Unique (%) | 1.6% |
Sample
1st row | 경기도 안성시 안성3동 |
---|---|
2nd row | 경기도 양평군 양서면 |
3rd row | 경기도 고양시 덕양구 주교동 |
4th row | 경기도 성남시 중원구 상대원1동 |
5th row | 경기도 성남시 중원구 |
Value | Count | Frequency (%) |
경기도 | 10000 | |
성남시 | 864 | 2.6% |
수원시 | 774 | 2.3% |
고양시 | 715 | 2.1% |
안양시 | 566 | 1.7% |
용인시 | 561 | 1.7% |
부천시 | 488 | 1.5% |
안산시 | 485 | 1.5% |
화성시 | 462 | 1.4% |
분당구 | 382 | 1.1% |
Other values (668) | 18017 |
Most occurring characters
Value | Count | Frequency (%) |
24287 | ||
기 | 10226 | 7.9% |
도 | 10157 | 7.9% |
경 | 10020 | 7.8% |
시 | 9778 | 7.6% |
동 | 7827 | 6.1% |
구 | 4425 | 3.4% |
양 | 2819 | 2.2% |
안 | 2493 | 1.9% |
성 | 1923 | 1.5% |
Other values (204) | 44948 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 101225 | |
Space Separator | 24287 | 18.8% |
Decimal Number | 3391 | 2.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 10226 | 10.1% |
도 | 10157 | 10.0% |
경 | 10020 | 9.9% |
시 | 9778 | 9.7% |
동 | 7827 | 7.7% |
구 | 4425 | 4.4% |
양 | 2819 | 2.8% |
안 | 2493 | 2.5% |
성 | 1923 | 1.9% |
면 | 1732 | 1.7% |
Other values (194) | 39825 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1293 | |
2 | 1209 | |
3 | 558 | |
4 | 167 | 4.9% |
6 | 46 | 1.4% |
5 | 41 | 1.2% |
7 | 36 | 1.1% |
8 | 26 | 0.8% |
9 | 15 | 0.4% |
Space Separator
Value | Count | Frequency (%) |
24287 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 101225 | |
Common | 27678 | 21.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 10226 | 10.1% |
도 | 10157 | 10.0% |
경 | 10020 | 9.9% |
시 | 9778 | 9.7% |
동 | 7827 | 7.7% |
구 | 4425 | 4.4% |
양 | 2819 | 2.8% |
안 | 2493 | 2.5% |
성 | 1923 | 1.9% |
면 | 1732 | 1.7% |
Other values (194) | 39825 |
Common
Value | Count | Frequency (%) |
24287 | ||
1 | 1293 | 4.7% |
2 | 1209 | 4.4% |
3 | 558 | 2.0% |
4 | 167 | 0.6% |
6 | 46 | 0.2% |
5 | 41 | 0.1% |
7 | 36 | 0.1% |
8 | 26 | 0.1% |
9 | 15 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 101225 | |
ASCII | 27678 | 21.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
24287 | ||
1 | 1293 | 4.7% |
2 | 1209 | 4.4% |
3 | 558 | 2.0% |
4 | 167 | 0.6% |
6 | 46 | 0.2% |
5 | 41 | 0.1% |
7 | 36 | 0.1% |
8 | 26 | 0.1% |
9 | 15 | 0.1% |
Hangul
Value | Count | Frequency (%) |
기 | 10226 | 10.1% |
도 | 10157 | 10.0% |
경 | 10020 | 9.9% |
시 | 9778 | 9.7% |
동 | 7827 | 7.7% |
구 | 4425 | 4.4% |
양 | 2819 | 2.8% |
안 | 2493 | 2.5% |
성 | 1923 | 1.9% |
면 | 1732 | 1.7% |
Other values (194) | 39825 |
남자 평균연령
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 283 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 40.55281 |
Minimum | 29.2 |
---|---|
Maximum | 61.3 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 29.2 |
---|---|
5-th percentile | 34 |
Q1 | 37.1 |
median | 39.8 |
Q3 | 43.225 |
95-th percentile | 49.7 |
Maximum | 61.3 |
Range | 32.1 |
Interquartile range (IQR) | 6.125 |
Descriptive statistics
Standard deviation | 4.7816107 |
---|---|
Coefficient of variation (CV) | 0.11791071 |
Kurtosis | 0.43535603 |
Mean | 40.55281 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.74527776 |
Sum | 405528.1 |
Variance | 22.8638 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
39.4 | 111 | 1.1% |
38.0 | 105 | 1.1% |
37.4 | 103 | 1.0% |
40.8 | 103 | 1.0% |
39.7 | 102 | 1.0% |
36.8 | 102 | 1.0% |
37.8 | 101 | 1.0% |
36.9 | 98 | 1.0% |
40.0 | 98 | 1.0% |
36.5 | 98 | 1.0% |
Other values (273) | 8979 |
Value | Count | Frequency (%) |
29.2 | 1 | < 0.1% |
29.3 | 2 | |
29.4 | 2 | |
29.6 | 1 | < 0.1% |
29.7 | 1 | < 0.1% |
29.8 | 1 | < 0.1% |
30.1 | 4 | |
30.2 | 3 | |
30.4 | 4 | |
30.5 | 3 |
Value | Count | Frequency (%) |
61.3 | 1 | |
61.0 | 1 | |
60.5 | 1 | |
60.3 | 1 | |
59.3 | 1 | |
59.0 | 1 | |
58.3 | 1 | |
58.0 | 1 | |
57.9 | 1 | |
57.8 | 1 |
여자 평균연령
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 315 |
---|---|
Distinct (%) | 3.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 42.64002 |
Minimum | 29.9 |
---|---|
Maximum | 63.5 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 29.9 |
---|---|
5-th percentile | 35.3 |
Q1 | 38.7 |
median | 41.7 |
Q3 | 45.7 |
95-th percentile | 53.4 |
Maximum | 63.5 |
Range | 33.6 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 5.4652749 |
---|---|
Coefficient of variation (CV) | 0.12817243 |
Kurtosis | 0.38115579 |
Mean | 42.64002 |
Median Absolute Deviation (MAD) | 3.4 |
Skewness | 0.7618138 |
Sum | 426400.2 |
Variance | 29.869229 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
41.1 | 101 | 1.0% |
40.4 | 101 | 1.0% |
39.6 | 96 | 1.0% |
40.8 | 93 | 0.9% |
40.9 | 92 | 0.9% |
38.2 | 92 | 0.9% |
39.5 | 92 | 0.9% |
38.7 | 91 | 0.9% |
39.9 | 89 | 0.9% |
39.3 | 89 | 0.9% |
Other values (305) | 9064 |
Value | Count | Frequency (%) |
29.9 | 1 | < 0.1% |
30.2 | 1 | < 0.1% |
30.4 | 1 | < 0.1% |
30.5 | 2 | |
30.6 | 3 | |
30.7 | 4 | |
30.8 | 1 | < 0.1% |
30.9 | 2 | |
31.0 | 1 | < 0.1% |
31.1 | 3 |
Value | Count | Frequency (%) |
63.5 | 1 | < 0.1% |
62.6 | 1 | < 0.1% |
62.5 | 2 | |
62.2 | 2 | |
61.9 | 1 | < 0.1% |
61.8 | 1 | < 0.1% |
61.5 | 3 | |
61.3 | 1 | < 0.1% |
61.2 | 1 | < 0.1% |
61.1 | 2 |
평균연령
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 296 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 41.57275 |
Minimum | 29.8 |
---|---|
Maximum | 61.1 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 29.8 |
---|---|
5-th percentile | 34.7 |
Q1 | 37.9 |
median | 40.8 |
Q3 | 44.4 |
95-th percentile | 51.5 |
Maximum | 61.1 |
Range | 31.3 |
Interquartile range (IQR) | 6.5 |
Descriptive statistics
Standard deviation | 5.0740086 |
---|---|
Coefficient of variation (CV) | 0.12205131 |
Kurtosis | 0.35391857 |
Mean | 41.57275 |
Median Absolute Deviation (MAD) | 3.2 |
Skewness | 0.73656361 |
Sum | 415727.5 |
Variance | 25.745563 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
39.4 | 112 | 1.1% |
40.0 | 106 | 1.1% |
38.7 | 102 | 1.0% |
39.7 | 100 | 1.0% |
37.4 | 99 | 1.0% |
38.8 | 99 | 1.0% |
39.1 | 96 | 1.0% |
38.6 | 96 | 1.0% |
40.3 | 96 | 1.0% |
41.1 | 95 | 0.9% |
Other values (286) | 8999 |
Value | Count | Frequency (%) |
29.8 | 2 | |
29.9 | 3 | |
30.0 | 2 | |
30.2 | 1 | < 0.1% |
30.3 | 2 | |
30.4 | 1 | < 0.1% |
30.5 | 1 | < 0.1% |
30.6 | 1 | < 0.1% |
30.7 | 3 | |
30.8 | 2 |
Value | Count | Frequency (%) |
61.1 | 1 | < 0.1% |
59.8 | 1 | < 0.1% |
59.3 | 1 | < 0.1% |
59.2 | 2 | |
59.1 | 2 | |
59.0 | 2 | |
58.9 | 2 | |
58.7 | 1 | < 0.1% |
58.6 | 3 | |
58.5 | 2 |
연도 | 월 | 행정구역구분명 | 남자 평균연령 | 여자 평균연령 | 평균연령 | |
---|---|---|---|---|---|---|
연도 | 1.000 | 0.124 | 0.000 | 0.498 | 0.461 | 0.479 |
월 | 0.124 | 1.000 | 0.021 | 0.000 | 0.000 | 0.015 |
행정구역구분명 | 0.000 | 0.021 | 1.000 | 0.116 | 0.130 | 0.127 |
남자 평균연령 | 0.498 | 0.000 | 0.116 | 1.000 | 0.969 | 0.978 |
여자 평균연령 | 0.461 | 0.000 | 0.130 | 0.969 | 1.000 | 0.995 |
평균연령 | 0.479 | 0.015 | 0.127 | 0.978 | 0.995 | 1.000 |
연도 | 월 | 남자 평균연령 | 여자 평균연령 | 평균연령 | 행정구역구분명 | |
---|---|---|---|---|---|---|
연도 | 1.000 | -0.094 | 0.468 | 0.425 | 0.448 | 0.000 |
월 | -0.094 | 1.000 | -0.012 | -0.012 | -0.012 | 0.012 |
남자 평균연령 | 0.468 | -0.012 | 1.000 | 0.989 | 0.997 | 0.070 |
여자 평균연령 | 0.425 | -0.012 | 0.989 | 1.000 | 0.997 | 0.078 |
평균연령 | 0.448 | -0.012 | 0.997 | 0.997 | 1.000 | 0.076 |
행정구역구분명 | 0.000 | 0.012 | 0.070 | 0.078 | 0.076 | 1.000 |
연도 | 월 | 행정구역구분명 | 행정구역명 | 남자 평균연령 | 여자 평균연령 | 평균연령 | |
---|---|---|---|---|---|---|---|
61870 | 2015 | 11 | 읍면동 | 경기도 안성시 안성3동 | 37.3 | 39.6 | 38.5 |
44246 | 2018 | 4 | 읍면동 | 경기도 양평군 양서면 | 47.0 | 48.9 | 48.0 |
96987 | 2010 | 12 | 읍면동 | 경기도 고양시 덕양구 주교동 | 36.9 | 39.1 | 38.0 |
81694 | 2013 | 2 | 읍면동 | 경기도 성남시 중원구 상대원1동 | 37.2 | 38.8 | 38.0 |
46515 | 2017 | 12 | 구 | 경기도 성남시 중원구 | 41.0 | 42.8 | 41.9 |
40663 | 2018 | 10 | 읍면동 | 경기도 의정부시 송산2동 | 36.1 | 37.8 | 36.9 |
42016 | 2018 | 7 | 읍면동 | 경기도 가평군 청평면 | 46.7 | 49.7 | 48.2 |
24542 | 2021 | 1 | 읍면동 | 경기도 하남시 감북동 | 47.8 | 50.3 | 48.9 |
56733 | 2016 | 7 | 읍면동 | 경기도 군포시 금정동 | 40.5 | 42.2 | 41.3 |
34410 | 2019 | 8 | 읍면동 | 경기도 안산시 상록구 해양동 | 37.9 | 38.9 | 38.4 |
연도 | 월 | 행정구역구분명 | 행정구역명 | 남자 평균연령 | 여자 평균연령 | 평균연령 | |
---|---|---|---|---|---|---|---|
65335 | 2015 | 5 | 읍면동 | 경기도 부천시 소사구 송내1동 | 38.8 | 40.8 | 39.8 |
60509 | 2016 | 1 | 읍면동 | 경기도 성남시 분당구 정자1동 | 38.6 | 38.7 | 38.7 |
66431 | 2015 | 3 | 읍면동 | 경기도 고양시 일산동구 식사동 | 35.0 | 35.9 | 35.5 |
16829 | 2022 | 1 | 읍면동 | 경기도 광명시 광명5동 | 43.8 | 46.8 | 45.3 |
19790 | 2021 | 9 | 읍면동 | 경기도 화성시 향남읍 | 36.9 | 37.6 | 37.2 |
77637 | 2013 | 9 | 읍면동 | 경기도 안양시 만안구 석수3동 | 36.2 | 38.3 | 37.2 |
32468 | 2019 | 11 | 읍면동 | 경기도 남양주시 화도읍 | 40.0 | 42.0 | 41.0 |
57844 | 2016 | 6 | 읍면동 | 경기도 화성시 양감면 | 47.3 | 51.4 | 49.0 |
10665 | 2022 | 11 | 읍면동 | 경기도 고양시 덕양구 흥도동 | 39.6 | 40.4 | 40.0 |
86087 | 2012 | 7 | 읍면동 | 경기도 용인시 기흥구 동백동 | 32.1 | 33.7 | 32.9 |
Most frequently occurring
연도 | 월 | 행정구역구분명 | 행정구역명 | 남자 평균연령 | 여자 평균연령 | 평균연령 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 2023 | 3 | 읍면동 | 경기도 고양시 일산서구 주엽1동 | 43.2 | 46.1 | 44.7 | 2 |
1 | 2023 | 3 | 읍면동 | 경기도 파주시 금촌1동 | 45.3 | 48.3 | 46.7 | 2 |
2 | 2023 | 3 | 읍면동 | 경기도 화성시 매송면 | 49.9 | 53.4 | 51.6 | 2 |