Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 4836 |
Missing cells (%) | 6.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 673.8 KiB |
Average record size in memory | 69.0 B |
Variable types
Numeric | 5 |
---|---|
Categorical | 1 |
Text | 1 |
Dataset
Description | 출생등록 집계 현황 |
---|---|
Author | 경기도 |
URL | https://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=OP0142VLK0EIR2ZHCH7S27357997&infSeq=1 |
총 등록 인구수 is highly overall correlated with 남자 등록 인구수 and 2 other fields | High correlation |
남자 등록 인구수 is highly overall correlated with 총 등록 인구수 and 2 other fields | High correlation |
여자 등록 인구수 is highly overall correlated with 총 등록 인구수 and 2 other fields | High correlation |
행정구역구분명 is highly overall correlated with 총 등록 인구수 and 2 other fields | High correlation |
행정구역구분명 is highly imbalanced (74.5%) | Imbalance |
남자 등록 인구수 has 2418 (24.2%) missing values | Missing |
여자 등록 인구수 has 2418 (24.2%) missing values | Missing |
총 등록 인구수 is highly skewed (γ1 = 22.50062442) | Skewed |
남자 등록 인구수 is highly skewed (γ1 = 21.27294731) | Skewed |
여자 등록 인구수 is highly skewed (γ1 = 21.34806904) | Skewed |
총 등록 인구수 has 539 (5.4%) zeros | Zeros |
남자 등록 인구수 has 835 (8.3%) zeros | Zeros |
여자 등록 인구수 has 831 (8.3%) zeros | Zeros |
Reproduction
Analysis started | 2024-04-11 04:52:03.172632 |
---|---|
Analysis finished | 2024-04-11 04:52:07.410315 |
Duration | 4.24 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연도
Real number (ℝ)
Distinct | 15 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.929 |
Minimum | 2010 |
---|---|
Maximum | 2024 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2010 |
---|---|
5-th percentile | 2011 |
Q1 | 2014 |
median | 2017 |
Q3 | 2020 |
95-th percentile | 2023 |
Maximum | 2024 |
Range | 14 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 3.9779569 |
---|---|
Coefficient of variation (CV) | 0.0019722841 |
Kurtosis | -1.1666139 |
Mean | 2016.929 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.015576905 |
Sum | 20169290 |
Variance | 15.824141 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2022 | 767 | 7.7% |
2018 | 749 | 7.5% |
2019 | 747 | 7.5% |
2016 | 742 | 7.4% |
2014 | 736 | 7.4% |
2015 | 732 | 7.3% |
2020 | 731 | 7.3% |
2023 | 722 | 7.2% |
2011 | 716 | 7.2% |
2017 | 712 | 7.1% |
Other values (5) | 2646 |
Value | Count | Frequency (%) |
2010 | 350 | |
2011 | 716 | |
2012 | 704 | |
2013 | 699 | |
2014 | 736 | |
2015 | 732 | |
2016 | 742 | |
2017 | 712 | |
2018 | 749 | |
2019 | 747 |
Value | Count | Frequency (%) |
2024 | 197 | 2.0% |
2023 | 722 | |
2022 | 767 | |
2021 | 696 | |
2020 | 731 | |
2019 | 747 | |
2018 | 749 | |
2017 | 712 | |
2016 | 742 | |
2015 | 732 |
월
Real number (ℝ)
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.5598 |
Minimum | 1 |
---|---|
Maximum | 12 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 7 |
Q3 | 10 |
95-th percentile | 12 |
Maximum | 12 |
Range | 11 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 3.4834519 |
---|---|
Coefficient of variation (CV) | 0.5310302 |
Kurtosis | -1.2439961 |
Mean | 6.5598 |
Median Absolute Deviation (MAD) | 3 |
Skewness | -0.033797065 |
Sum | 65598 |
Variance | 12.134437 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 920 | |
10 | 872 | |
12 | 868 | |
9 | 863 | |
8 | 857 | |
11 | 846 | |
1 | 838 | |
7 | 836 | |
2 | 820 | |
6 | 792 | |
Other values (2) | 1488 |
Value | Count | Frequency (%) |
1 | 838 | |
2 | 820 | |
3 | 920 | |
4 | 749 | |
5 | 739 | |
6 | 792 | |
7 | 836 | |
8 | 857 | |
9 | 863 | |
10 | 872 |
Value | Count | Frequency (%) |
12 | 868 | |
11 | 846 | |
10 | 872 | |
9 | 863 | |
8 | 857 | |
7 | 836 | |
6 | 792 | |
5 | 739 | |
4 | 749 | |
3 | 920 |
행정구역구분명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
읍면동 | |
---|---|
시군 | 530 |
구 | 297 |
도 | 19 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.8838 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 읍면동 |
---|---|
2nd row | 읍면동 |
3rd row | 읍면동 |
4th row | 읍면동 |
5th row | 시군 |
Common Values
Value | Count | Frequency (%) |
읍면동 | 9154 | |
시군 | 530 | 5.3% |
구 | 297 | 3.0% |
도 | 19 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
읍면동 | 9154 | |
시군 | 530 | 5.3% |
구 | 297 | 3.0% |
도 | 19 | 0.2% |
행정구역명
Text
Distinct | 1004 |
---|---|
Distinct (%) | 10.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 17 |
---|---|
Median length | 16 |
Mean length | 12.8475 |
Min length | 3 |
Characters and Unicode
Total characters | 128475 |
---|---|
Distinct characters | 212 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 130 ? |
---|---|
Unique (%) | 1.3% |
Sample
1st row | 경기도 고양시 덕양구 신도동 |
---|---|
2nd row | 경기도 고양시 일산동구 마두2동 |
3rd row | 경기도 고양시 일산동구 마두1동 |
4th row | 경기도 파주시 운정2동 |
5th row | 경기도 이천시 |
Value | Count | Frequency (%) |
경기도 | 10000 | |
성남시 | 889 | 2.7% |
수원시 | 777 | 2.3% |
고양시 | 767 | 2.3% |
용인시 | 603 | 1.8% |
안양시 | 551 | 1.7% |
부천시 | 482 | 1.4% |
화성시 | 425 | 1.3% |
안산시 | 412 | 1.2% |
분당구 | 401 | 1.2% |
Other values (678) | 17978 |
Most occurring characters
Value | Count | Frequency (%) |
23865 | ||
기 | 10279 | 8.0% |
도 | 10141 | 7.9% |
경 | 10011 | 7.8% |
시 | 9673 | 7.5% |
동 | 7743 | 6.0% |
구 | 4431 | 3.4% |
양 | 2897 | 2.3% |
안 | 2392 | 1.9% |
성 | 1890 | 1.5% |
Other values (202) | 45153 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 101190 | |
Space Separator | 23865 | 18.6% |
Decimal Number | 3420 | 2.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 10279 | 10.2% |
도 | 10141 | 10.0% |
경 | 10011 | 9.9% |
시 | 9673 | 9.6% |
동 | 7743 | 7.7% |
구 | 4431 | 4.4% |
양 | 2897 | 2.9% |
안 | 2392 | 2.4% |
성 | 1890 | 1.9% |
천 | 1758 | 1.7% |
Other values (192) | 39975 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1261 | |
1 | 1255 | |
3 | 563 | |
4 | 163 | 4.8% |
5 | 46 | 1.3% |
7 | 45 | 1.3% |
6 | 42 | 1.2% |
9 | 24 | 0.7% |
8 | 21 | 0.6% |
Space Separator
Value | Count | Frequency (%) |
23865 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 101190 | |
Common | 27285 | 21.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 10279 | 10.2% |
도 | 10141 | 10.0% |
경 | 10011 | 9.9% |
시 | 9673 | 9.6% |
동 | 7743 | 7.7% |
구 | 4431 | 4.4% |
양 | 2897 | 2.9% |
안 | 2392 | 2.4% |
성 | 1890 | 1.9% |
천 | 1758 | 1.7% |
Other values (192) | 39975 |
Common
Value | Count | Frequency (%) |
23865 | ||
2 | 1261 | 4.6% |
1 | 1255 | 4.6% |
3 | 563 | 2.1% |
4 | 163 | 0.6% |
5 | 46 | 0.2% |
7 | 45 | 0.2% |
6 | 42 | 0.2% |
9 | 24 | 0.1% |
8 | 21 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 101190 | |
ASCII | 27285 | 21.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
23865 | ||
2 | 1261 | 4.6% |
1 | 1255 | 4.6% |
3 | 563 | 2.1% |
4 | 163 | 0.6% |
5 | 46 | 0.2% |
7 | 45 | 0.2% |
6 | 42 | 0.2% |
9 | 24 | 0.1% |
8 | 21 | 0.1% |
Hangul
Value | Count | Frequency (%) |
기 | 10279 | 10.2% |
도 | 10141 | 10.0% |
경 | 10011 | 9.9% |
시 | 9673 | 9.6% |
동 | 7743 | 7.7% |
구 | 4431 | 4.4% |
양 | 2897 | 2.9% |
안 | 2392 | 2.4% |
성 | 1890 | 1.9% |
천 | 1758 | 1.7% |
Other values (192) | 39975 |
총 등록 인구수
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 472 |
---|---|
Distinct (%) | 4.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 49.2429 |
Minimum | 0 |
---|---|
Maximum | 11501 |
Zeros | 539 |
Zeros (%) | 5.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 5 |
median | 12 |
Q3 | 25 |
95-th percentile | 165 |
Maximum | 11501 |
Range | 11501 |
Interquartile range (IQR) | 20 |
Descriptive statistics
Standard deviation | 373.06409 |
---|---|
Coefficient of variation (CV) | 7.5759975 |
Kurtosis | 547.01789 |
Mean | 49.2429 |
Median Absolute Deviation (MAD) | 9 |
Skewness | 22.500624 |
Sum | 492429 |
Variance | 139176.81 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 539 | 5.4% |
1 | 520 | 5.2% |
2 | 485 | 4.9% |
3 | 404 | 4.0% |
5 | 388 | 3.9% |
4 | 388 | 3.9% |
6 | 381 | 3.8% |
9 | 347 | 3.5% |
8 | 339 | 3.4% |
10 | 335 | 3.4% |
Other values (462) | 5874 |
Value | Count | Frequency (%) |
0 | 539 | |
1 | 520 | |
2 | 485 | |
3 | 404 | |
4 | 388 | |
5 | 388 | |
6 | 381 | |
7 | 334 | |
8 | 339 | |
9 | 347 |
Value | Count | Frequency (%) |
11501 | 1 | |
10378 | 1 | |
10275 | 1 | |
9696 | 1 | |
9555 | 1 | |
9519 | 1 | |
9234 | 1 | |
9044 | 1 | |
8453 | 1 | |
8401 | 1 |
남자 등록 인구수
Real number (ℝ)
HIGH CORRELATION
  MISSING
  SKEWED
  ZEROS
 
Distinct | 269 |
---|---|
Distinct (%) | 3.5% |
Missing | 2418 |
Missing (%) | 24.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 24.041414 |
Minimum | 0 |
---|---|
Maximum | 4992 |
Zeros | 835 |
Zeros (%) | 8.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 2 |
median | 6 |
Q3 | 12 |
95-th percentile | 75 |
Maximum | 4992 |
Range | 4992 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 187.88749 |
---|---|
Coefficient of variation (CV) | 7.8151596 |
Kurtosis | 481.41772 |
Mean | 24.041414 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 21.272947 |
Sum | 182282 |
Variance | 35301.708 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 835 | 8.3% |
1 | 715 | 7.1% |
3 | 593 | 5.9% |
2 | 567 | 5.7% |
4 | 515 | 5.1% |
5 | 484 | 4.8% |
6 | 452 | 4.5% |
7 | 383 | 3.8% |
8 | 346 | 3.5% |
9 | 299 | 3.0% |
Other values (259) | 2393 | |
(Missing) | 2418 |
Value | Count | Frequency (%) |
0 | 835 | |
1 | 715 | |
2 | 567 | |
3 | 593 | |
4 | 515 | |
5 | 484 | |
6 | 452 | |
7 | 383 | |
8 | 346 | |
9 | 299 | 3.0% |
Value | Count | Frequency (%) |
4992 | 1 | |
4859 | 1 | |
4842 | 1 | |
4653 | 1 | |
4640 | 1 | |
4337 | 1 | |
4253 | 1 | |
4213 | 1 | |
3763 | 1 | |
3675 | 1 |
여자 등록 인구수
Real number (ℝ)
HIGH CORRELATION
  MISSING
  SKEWED
  ZEROS
 
Distinct | 266 |
---|---|
Distinct (%) | 3.5% |
Missing | 2418 |
Missing (%) | 24.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 22.935109 |
Minimum | 0 |
---|---|
Maximum | 4713 |
Zeros | 831 |
Zeros (%) | 8.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 2 |
median | 5 |
Q3 | 11 |
95-th percentile | 71 |
Maximum | 4713 |
Range | 4713 |
Interquartile range (IQR) | 9 |
Descriptive statistics
Standard deviation | 179.36262 |
---|---|
Coefficient of variation (CV) | 7.8204388 |
Kurtosis | 485.88298 |
Mean | 22.935109 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 21.348069 |
Sum | 173894 |
Variance | 32170.949 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 831 | 8.3% |
1 | 736 | 7.4% |
2 | 643 | 6.4% |
4 | 577 | 5.8% |
3 | 557 | 5.6% |
5 | 490 | 4.9% |
6 | 463 | 4.6% |
7 | 389 | 3.9% |
8 | 346 | 3.5% |
9 | 314 | 3.1% |
Other values (256) | 2236 | |
(Missing) | 2418 |
Value | Count | Frequency (%) |
0 | 831 | |
1 | 736 | |
2 | 643 | |
3 | 557 | |
4 | 577 | |
5 | 490 | |
6 | 463 | |
7 | 389 | |
8 | 346 | |
9 | 314 | 3.1% |
Value | Count | Frequency (%) |
4713 | 1 | |
4704 | 1 | |
4660 | 1 | |
4581 | 1 | |
4404 | 1 | |
4200 | 1 | |
4064 | 1 | |
4002 | 1 | |
3654 | 1 | |
3427 | 1 |
연도 | 월 | 행정구역구분명 | 총 등록 인구수 | 남자 등록 인구수 | 여자 등록 인구수 | |
---|---|---|---|---|---|---|
연도 | 1.000 | 0.121 | 0.011 | 0.041 | 0.019 | 0.019 |
월 | 0.121 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
행정구역구분명 | 0.011 | 0.000 | 1.000 | 0.887 | 0.709 | 0.709 |
총 등록 인구수 | 0.041 | 0.000 | 0.887 | 1.000 | 0.946 | 0.946 |
남자 등록 인구수 | 0.019 | 0.000 | 0.709 | 0.946 | 1.000 | 1.000 |
여자 등록 인구수 | 0.019 | 0.000 | 0.709 | 0.946 | 1.000 | 1.000 |
연도 | 월 | 총 등록 인구수 | 남자 등록 인구수 | 여자 등록 인구수 | 행정구역구분명 | |
---|---|---|---|---|---|---|
연도 | 1.000 | -0.081 | -0.184 | -0.134 | -0.135 | 0.010 |
월 | -0.081 | 1.000 | -0.009 | -0.015 | -0.021 | 0.000 |
총 등록 인구수 | -0.184 | -0.009 | 1.000 | 0.967 | 0.958 | 0.577 |
남자 등록 인구수 | -0.134 | -0.015 | 0.967 | 1.000 | 0.865 | 0.578 |
여자 등록 인구수 | -0.135 | -0.021 | 0.958 | 0.865 | 1.000 | 0.578 |
행정구역구분명 | 0.010 | 0.000 | 0.577 | 0.578 | 0.578 | 1.000 |
연도 | 월 | 행정구역구분명 | 행정구역명 | 총 등록 인구수 | 남자 등록 인구수 | 여자 등록 인구수 | |
---|---|---|---|---|---|---|---|
74527 | 2014 | 1 | 읍면동 | 경기도 고양시 덕양구 신도동 | 5 | 2 | 3 |
55084 | 2016 | 9 | 읍면동 | 경기도 고양시 일산동구 마두2동 | 4 | 2 | 2 |
33 | 2024 | 3 | 읍면동 | 경기도 고양시 일산동구 마두1동 | 7 | 6 | 1 |
34811 | 2019 | 7 | 읍면동 | 경기도 파주시 운정2동 | 64 | 31 | 33 |
73803 | 2014 | 3 | 시군 | 경기도 이천시 | 159 | 79 | 80 |
1555 | 2024 | 1 | 읍면동 | 경기도 성남시 수정구 수진2동 | 3 | 1 | 2 |
81031 | 2013 | 3 | 읍면동 | 경기도 파주시 월롱면 | 4 | <NA> | <NA> |
92002 | 2011 | 8 | 읍면동 | 경기도 남양주시 호평동 | 38 | <NA> | <NA> |
44219 | 2018 | 3 | 읍면동 | 경기도 남양주시 화도읍동부출장소 | 6 | 3 | 3 |
4825 | 2023 | 8 | 읍면동 | 경기도 안성시 양성면 | 0 | 0 | 0 |
연도 | 월 | 행정구역구분명 | 행정구역명 | 총 등록 인구수 | 남자 등록 인구수 | 여자 등록 인구수 | |
---|---|---|---|---|---|---|---|
56294 | 2016 | 7 | 읍면동 | 경기도 고양시 덕양구 화전동 | 1 | 0 | 1 |
83614 | 2012 | 10 | 읍면동 | 경기도 군포시 오금동 | 48 | <NA> | <NA> |
27938 | 2020 | 6 | 읍면동 | 경기도 부천시 대산동 | 40 | 22 | 18 |
33032 | 2019 | 10 | 읍면동 | 경기도 이천시 창전동 | 8 | 5 | 3 |
95957 | 2011 | 2 | 읍면동 | 경기도 평택시 고덕면 | 14 | <NA> | <NA> |
8983 | 2023 | 1 | 읍면동 | 경기도 김포시 양촌읍 | 14 | 9 | 5 |
61786 | 2015 | 10 | 읍면동 | 경기도 가평군 하면 | 11 | 4 | 7 |
12120 | 2022 | 8 | 읍면동 | 경기도 부천시 상동 | 49 | 22 | 27 |
70850 | 2014 | 8 | 읍면동 | 경기도 포천시 일동면 | 5 | 3 | 2 |
69010 | 2014 | 11 | 읍면동 | 경기도 평택시 신장2동 | 4 | 0 | 4 |