Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 2960 |
Missing cells (%) | 5.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 478.5 KiB |
Average record size in memory | 49.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 3 |
Numeric | 1 |
Dataset
Description | 6세이상 교육정도별 인구(초등학교, 중학교, 고등학교, 대학교(2,3년제), 대학교(4년제 이상), 대학원(석박사 과정), 받지 않았음(미취학 포함))에 대한 정보입니다. * 인구주택 총조사 자료(5년주기 생성) |
---|---|
Author | 인천광역시 |
URL | https://data.incheon.go.kr/findData/publicDataDetail?dataId=15055008&srcSe=7661IVAWM27C61E190 |
2020 년 has 2960 (29.6%) missing values | Missing |
Reproduction
Analysis started | 2024-03-18 04:19:12.869580 |
---|---|
Analysis finished | 2024-03-18 04:19:13.825576 |
Duration | 0.96 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
행정구역별(동읍면)
Text
Distinct | 169 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
부평6동 | 76 | 0.8% |
불은면 | 71 | 0.7% |
연수2동 | 71 | 0.7% |
가정1동 | 70 | 0.7% |
효성2동 | 67 | 0.7% |
작전1동 | 67 | 0.7% |
자월면 | 66 | 0.7% |
마전동 | 66 | 0.7% |
영종동 | 66 | 0.7% |
용유동 | 66 | 0.7% |
Other values (159) | 9314 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 8436 | |
2 | 1896 | 5.0% |
1 | 1889 | 5.0% |
3 | 1211 | 3.2% |
면 | 1188 | 3.2% |
송 | 834 | 2.2% |
수 | 798 | 2.1% |
부 | 792 | 2.1% |
도 | 774 | 2.1% |
산 | 762 | 2.0% |
Other values (107) | 19091 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 30910 | |
Decimal Number | 6424 | 17.1% |
Other Punctuation | 337 | 0.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 8436 | |
면 | 1188 | 3.8% |
송 | 834 | 2.7% |
수 | 798 | 2.6% |
부 | 792 | 2.6% |
도 | 774 | 2.5% |
산 | 762 | 2.5% |
구 | 716 | 2.3% |
현 | 565 | 1.8% |
평 | 540 | 1.7% |
Other values (98) | 15505 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1896 | |
1 | 1889 | |
3 | 1211 | |
4 | 707 | 11.0% |
5 | 352 | 5.5% |
6 | 256 | 4.0% |
8 | 60 | 0.9% |
7 | 53 | 0.8% |
Other Punctuation
Value | Count | Frequency (%) |
· | 337 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 30910 | |
Common | 6761 | 17.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 8436 | |
면 | 1188 | 3.8% |
송 | 834 | 2.7% |
수 | 798 | 2.6% |
부 | 792 | 2.6% |
도 | 774 | 2.5% |
산 | 762 | 2.5% |
구 | 716 | 2.3% |
현 | 565 | 1.8% |
평 | 540 | 1.7% |
Other values (98) | 15505 |
Common
Value | Count | Frequency (%) |
2 | 1896 | |
1 | 1889 | |
3 | 1211 | |
4 | 707 | 10.5% |
5 | 352 | 5.2% |
· | 337 | 5.0% |
6 | 256 | 3.8% |
8 | 60 | 0.9% |
7 | 53 | 0.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 30910 | |
ASCII | 6424 | 17.1% |
None | 337 | 0.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 8436 | |
면 | 1188 | 3.8% |
송 | 834 | 2.7% |
수 | 798 | 2.6% |
부 | 792 | 2.6% |
도 | 774 | 2.5% |
산 | 762 | 2.5% |
구 | 716 | 2.3% |
현 | 565 | 1.8% |
평 | 540 | 1.7% |
Other values (98) | 15505 |
ASCII
Value | Count | Frequency (%) |
2 | 1896 | |
1 | 1889 | |
3 | 1211 | |
4 | 707 | 11.0% |
5 | 352 | 5.5% |
6 | 256 | 4.0% |
8 | 60 | 0.9% |
7 | 53 | 0.8% |
None
Value | Count | Frequency (%) |
· | 337 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여자 | |
---|---|
남자 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남자 |
---|---|
2nd row | 남자 |
3rd row | 남자 |
4th row | 남자 |
5th row | 남자 |
Common Values
Value | Count | Frequency (%) |
여자 | 5003 | |
남자 | 4997 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여자 | 5003 | |
남자 | 4997 |
연령별
Categorical
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
50-59세 | |
---|---|
20-29세 | |
10-19세 | |
70세 이상 | |
40-49세 | |
Other values (3) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.7586 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 70세 이상 |
---|---|
2nd row | 50-59세 |
3rd row | 20-29세 |
4th row | 50-59세 |
5th row | 20-29세 |
Common Values
Value | Count | Frequency (%) |
50-59세 | 1295 | |
20-29세 | 1274 | |
10-19세 | 1263 | |
70세 이상 | 1253 | |
40-49세 | 1251 | |
60-69세 | 1230 | |
30-39세 | 1227 | |
6-9세 | 1207 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
50-59세 | 1295 | |
20-29세 | 1274 | |
10-19세 | 1263 | |
70세 | 1253 | |
이상 | 1253 | |
40-49세 | 1251 | |
60-69세 | 1230 | |
30-39세 | 1227 | |
6-9세 | 1207 |
교육정도별
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
고등학교 | |
---|---|
대학교(4년제 이상) | |
대학원(석박사 과정) | |
대학교(2,3년제) | |
받지 않았음(미취학 포함) | |
Other values (2) |
Length
Max length | 14 |
---|---|
Median length | 11 |
Mean length | 8.1491 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 받지 않았음(미취학 포함) |
---|---|
2nd row | 받지 않았음(미취학 포함) |
3rd row | 대학원(석박사 과정) |
4th row | 초등학교 |
5th row | 초등학교 |
Common Values
Value | Count | Frequency (%) |
고등학교 | 1467 | |
대학교(4년제 이상) | 1441 | |
대학원(석박사 과정) | 1431 | |
대학교(2,3년제) | 1430 | |
받지 않았음(미취학 포함) | 1423 | |
중학교 | 1423 | |
초등학교 | 1385 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
고등학교 | 1467 | |
대학교(4년제 | 1441 | |
이상 | 1441 | |
대학원(석박사 | 1431 | |
과정 | 1431 | |
대학교(2,3년제 | 1430 | |
받지 | 1423 | |
않았음(미취학 | 1423 | |
포함 | 1423 | |
중학교 | 1423 |
2020 년
Real number (ℝ)
MISSING
 
Distinct | 1355 |
---|---|
Distinct (%) | 19.2% |
Missing | 2960 |
Missing (%) | 29.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 870.92699 |
Minimum | 1 |
---|---|
Maximum | 159239 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 6 |
Q1 | 31 |
median | 124 |
Q3 | 375 |
95-th percentile | 1498.05 |
Maximum | 159239 |
Range | 159238 |
Interquartile range (IQR) | 344 |
Descriptive statistics
Standard deviation | 5739.4169 |
---|---|
Coefficient of variation (CV) | 6.5900092 |
Kurtosis | 287.87933 |
Mean | 870.92699 |
Median Absolute Deviation (MAD) | 110 |
Skewness | 15.214195 |
Sum | 6131326 |
Variance | 32940906 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
8 | 103 | 1.0% |
7 | 97 | 1.0% |
5 | 78 | 0.8% |
12 | 78 | 0.8% |
4 | 76 | 0.8% |
13 | 73 | 0.7% |
2 | 69 | 0.7% |
3 | 69 | 0.7% |
9 | 66 | 0.7% |
14 | 62 | 0.6% |
Other values (1345) | 6269 | |
(Missing) | 2960 |
Value | Count | Frequency (%) |
1 | 49 | |
2 | 69 | |
3 | 69 | |
4 | 76 | |
5 | 78 | |
6 | 60 | |
7 | 97 | |
8 | 103 | |
9 | 66 | |
10 | 61 |
Value | Count | Frequency (%) |
159239 | 1 | |
154893 | 1 | |
109967 | 1 | |
107602 | 1 | |
94379 | 1 | |
93220 | 1 | |
91070 | 1 | |
90986 | 1 | |
90342 | 1 | |
86622 | 1 |
성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|
성별 | 1.000 | 0.000 | 0.000 | 0.021 |
연령별 | 0.000 | 1.000 | 0.000 | 0.078 |
교육정도별 | 0.000 | 0.000 | 1.000 | 0.059 |
2020 년 | 0.021 | 0.078 | 0.059 | 1.000 |
연령별 | 성별 | 교육정도별 | |
---|---|---|---|
연령별 | 1.000 | 0.000 | 0.000 |
성별 | 0.000 | 1.000 | 0.000 |
교육정도별 | 0.000 | 0.000 | 1.000 |
2020 년 | 성별 | 연령별 | 교육정도별 | |
---|---|---|---|---|
2020 년 | 1.000 | 0.016 | 0.026 | 0.032 |
성별 | 0.016 | 1.000 | 0.000 | 0.000 |
연령별 | 0.026 | 0.000 | 1.000 | 0.000 |
교육정도별 | 0.032 | 0.000 | 0.000 | 1.000 |
행정구역별(동읍면) | 성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|---|
18752 | 자월면 | 남자 | 70세 이상 | 받지 않았음(미취학 포함) | 12 |
9897 | 삼산2동 | 남자 | 50-59세 | 받지 않았음(미취학 포함) | <NA> |
6403 | 만수4동 | 남자 | 20-29세 | 대학원(석박사 과정) | 19 |
16387 | 도화2·3동 | 남자 | 50-59세 | 초등학교 | 22 |
17710 | 교동면 | 남자 | 20-29세 | 초등학교 | <NA> |
15663 | 주안6동 | 여자 | 50-59세 | 대학교(4년제 이상) | 173 |
9632 | 십정1동 | 남자 | 6-9세 | 초등학교 | 198 |
2121 | 만석동 | 여자 | 70세 이상 | 초등학교 | 274 |
6501 | 만수5동 | 남자 | 6-9세 | 대학원(석박사 과정) | <NA> |
9588 | 일신동 | 여자 | 10-19세 | 대학원(석박사 과정) | <NA> |
행정구역별(동읍면) | 성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|---|
15810 | 주안8동 | 남자 | 20-29세 | 대학교(4년제 이상) | 612 |
6195 | 만수2동 | 남자 | 50-59세 | 초등학교 | 8 |
7538 | 부평1동 | 남자 | 40-49세 | 받지 않았음(미취학 포함) | <NA> |
4747 | 송도2동 | 남자 | 60-69세 | 중학교 | 19 |
2522 | 송현3동 | 여자 | 6-9세 | 고등학교 | <NA> |
14058 | 미추홀구 | 여자 | 6-9세 | 고등학교 | <NA> |
5184 | 구월1동 | 남자 | 40-49세 | 대학교(4년제 이상) | 1097 |
839 | 신흥동 | 남자 | 70세 이상 | 받지 않았음(미취학 포함) | 27 |
15114 | 주안1동 | 여자 | 70세 이상 | 중학교 | 140 |
1500 | 용유동 | 남자 | 60-69세 | 고등학교 | 273 |