Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 2986 |
Missing cells (%) | 6.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 478.5 KiB |
Average record size in memory | 49.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 3 |
Numeric | 1 |
Dataset
Description | 6세이상 교육정도별 인구(초등학교, 중학교, 고등학교, 대학교(2,3년제), 대학교(4년제 이상), 대학원(석박사 과정), 받지 않았음(미취학 포함))에 대한 정보입니다. * 인구주택 총조사 자료(5년주기 생성) |
---|---|
Author | 인천광역시 |
URL | https://data.incheon.go.kr/findData/publicDataDetail?dataId=15055008&srcSe=7661IVAWM27C61E190 |
2020 년 has 2986 (29.9%) missing values | Missing |
Reproduction
Analysis started | 2024-04-20 15:46:51.156456 |
---|---|
Analysis finished | 2024-04-20 15:46:52.057849 |
Duration | 0.9 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
행정구역별(동읍면)
Text
Distinct | 169 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
삼산2동 | 70 | 0.7% |
청라3동 | 70 | 0.7% |
삼산면 | 70 | 0.7% |
영흥면 | 69 | 0.7% |
만석동 | 69 | 0.7% |
강화군 | 68 | 0.7% |
만수5동 | 68 | 0.7% |
연안동 | 68 | 0.7% |
원당동 | 67 | 0.7% |
계산1동 | 67 | 0.7% |
Other values (159) | 9314 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 8463 | |
2 | 1908 | 5.1% |
1 | 1887 | 5.0% |
3 | 1261 | 3.3% |
면 | 1208 | 3.2% |
송 | 798 | 2.1% |
산 | 788 | 2.1% |
부 | 783 | 2.1% |
도 | 764 | 2.0% |
수 | 757 | 2.0% |
Other values (107) | 19110 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 30931 | |
Decimal Number | 6437 | 17.1% |
Other Punctuation | 359 | 1.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 8463 | |
면 | 1208 | 3.9% |
송 | 798 | 2.6% |
산 | 788 | 2.5% |
부 | 783 | 2.5% |
도 | 764 | 2.5% |
수 | 757 | 2.4% |
구 | 687 | 2.2% |
현 | 580 | 1.9% |
평 | 558 | 1.8% |
Other values (98) | 15545 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1908 | |
1 | 1887 | |
3 | 1261 | |
4 | 683 | 10.6% |
5 | 346 | 5.4% |
6 | 242 | 3.8% |
8 | 57 | 0.9% |
7 | 53 | 0.8% |
Other Punctuation
Value | Count | Frequency (%) |
· | 359 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 30931 | |
Common | 6796 | 18.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 8463 | |
면 | 1208 | 3.9% |
송 | 798 | 2.6% |
산 | 788 | 2.5% |
부 | 783 | 2.5% |
도 | 764 | 2.5% |
수 | 757 | 2.4% |
구 | 687 | 2.2% |
현 | 580 | 1.9% |
평 | 558 | 1.8% |
Other values (98) | 15545 |
Common
Value | Count | Frequency (%) |
2 | 1908 | |
1 | 1887 | |
3 | 1261 | |
4 | 683 | 10.1% |
· | 359 | 5.3% |
5 | 346 | 5.1% |
6 | 242 | 3.6% |
8 | 57 | 0.8% |
7 | 53 | 0.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 30931 | |
ASCII | 6437 | 17.1% |
None | 359 | 1.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 8463 | |
면 | 1208 | 3.9% |
송 | 798 | 2.6% |
산 | 788 | 2.5% |
부 | 783 | 2.5% |
도 | 764 | 2.5% |
수 | 757 | 2.4% |
구 | 687 | 2.2% |
현 | 580 | 1.9% |
평 | 558 | 1.8% |
Other values (98) | 15545 |
ASCII
Value | Count | Frequency (%) |
2 | 1908 | |
1 | 1887 | |
3 | 1261 | |
4 | 683 | 10.6% |
5 | 346 | 5.4% |
6 | 242 | 3.8% |
8 | 57 | 0.9% |
7 | 53 | 0.8% |
None
Value | Count | Frequency (%) |
· | 359 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
남자 | |
---|---|
여자 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남자 |
---|---|
2nd row | 여자 |
3rd row | 여자 |
4th row | 남자 |
5th row | 남자 |
Common Values
Value | Count | Frequency (%) |
남자 | 5003 | |
여자 | 4997 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남자 | 5003 | |
여자 | 4997 |
연령별
Categorical
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
70세 이상 | |
---|---|
10-19세 | |
40-49세 | |
50-59세 | |
30-39세 | |
Other values (3) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.7522 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 30-39세 |
---|---|
2nd row | 6-9세 |
3rd row | 30-39세 |
4th row | 60-69세 |
5th row | 6-9세 |
Common Values
Value | Count | Frequency (%) |
70세 이상 | 1284 | |
10-19세 | 1256 | |
40-49세 | 1249 | |
50-59세 | 1246 | |
30-39세 | 1245 | |
20-29세 | 1242 | |
6-9세 | 1239 | |
60-69세 | 1239 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
70세 | 1284 | |
이상 | 1284 | |
10-19세 | 1256 | |
40-49세 | 1249 | |
50-59세 | 1246 | |
30-39세 | 1245 | |
20-29세 | 1242 | |
6-9세 | 1239 | |
60-69세 | 1239 |
교육정도별
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대학교(2,3년제) | |
---|---|
대학교(4년제 이상) | |
대학원(석박사 과정) | |
고등학교 | |
초등학교 | |
Other values (2) |
Length
Max length | 14 |
---|---|
Median length | 11 |
Mean length | 8.1515 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대학원(석박사 과정) |
---|---|
2nd row | 초등학교 |
3rd row | 받지 않았음(미취학 포함) |
4th row | 대학교(4년제 이상) |
5th row | 초등학교 |
Common Values
Value | Count | Frequency (%) |
대학교(2,3년제) | 1460 | |
대학교(4년제 이상) | 1458 | |
대학원(석박사 과정) | 1438 | |
고등학교 | 1428 | |
초등학교 | 1420 | |
중학교 | 1407 | |
받지 않았음(미취학 포함) | 1389 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대학교(2,3년제 | 1460 | |
대학교(4년제 | 1458 | |
이상 | 1458 | |
대학원(석박사 | 1438 | |
과정 | 1438 | |
고등학교 | 1428 | |
초등학교 | 1420 | |
중학교 | 1407 | |
받지 | 1389 | |
않았음(미취학 | 1389 |
2020 년
Real number (ℝ)
MISSING
 
Distinct | 1340 |
---|---|
Distinct (%) | 19.1% |
Missing | 2986 |
Missing (%) | 29.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 770.96393 |
Minimum | 1 |
---|---|
Maximum | 154893 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 6 |
Q1 | 29 |
median | 117 |
Q3 | 359 |
95-th percentile | 1373.1 |
Maximum | 154893 |
Range | 154892 |
Interquartile range (IQR) | 330 |
Descriptive statistics
Standard deviation | 5040.2266 |
---|---|
Coefficient of variation (CV) | 6.5375647 |
Kurtosis | 327.715 |
Mean | 770.96393 |
Median Absolute Deviation (MAD) | 104 |
Skewness | 16.162914 |
Sum | 5407541 |
Variance | 25403884 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
7 | 111 | 1.1% |
8 | 88 | 0.9% |
6 | 82 | 0.8% |
12 | 82 | 0.8% |
9 | 80 | 0.8% |
4 | 78 | 0.8% |
5 | 76 | 0.8% |
2 | 76 | 0.8% |
14 | 69 | 0.7% |
11 | 63 | 0.6% |
Other values (1330) | 6209 | |
(Missing) | 2986 |
Value | Count | Frequency (%) |
1 | 56 | |
2 | 76 | |
3 | 63 | |
4 | 78 | |
5 | 76 | |
6 | 82 | |
7 | 111 | |
8 | 88 | |
9 | 80 | |
10 | 52 |
Value | Count | Frequency (%) |
154893 | 1 | |
128364 | 1 | |
97154 | 1 | |
94379 | 1 | |
94088 | 1 | |
90342 | 1 | |
86988 | 1 | |
86622 | 1 | |
85060 | 1 | |
73890 | 1 |
성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|
성별 | 1.000 | 0.000 | 0.000 | 0.000 |
연령별 | 0.000 | 1.000 | 0.000 | 0.067 |
교육정도별 | 0.000 | 0.000 | 1.000 | 0.060 |
2020 년 | 0.000 | 0.067 | 0.060 | 1.000 |
연령별 | 성별 | 교육정도별 | |
---|---|---|---|
연령별 | 1.000 | 0.000 | 0.000 |
성별 | 0.000 | 1.000 | 0.000 |
교육정도별 | 0.000 | 0.000 | 1.000 |
2020 년 | 성별 | 연령별 | 교육정도별 | |
---|---|---|---|---|
2020 년 | 1.000 | 0.000 | 0.033 | 0.031 |
성별 | 0.000 | 1.000 | 0.000 | 0.000 |
연령별 | 0.033 | 0.000 | 1.000 | 0.000 |
교육정도별 | 0.031 | 0.000 | 0.000 | 1.000 |
행정구역별(동읍면) | 성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|---|
11786 | 가정1동 | 남자 | 30-39세 | 대학원(석박사 과정) | 136 |
11144 | 계산4동 | 여자 | 6-9세 | 초등학교 | 348 |
3443 | 옥련1동 | 여자 | 30-39세 | 받지 않았음(미취학 포함) | <NA> |
6878 | 논현1동 | 남자 | 60-69세 | 대학교(4년제 이상) | 256 |
7392 | 부평구 | 남자 | 6-9세 | 초등학교 | 5942 |
1611 | 운서동 | 남자 | 60-69세 | 중학교 | 102 |
17476 | 양사면 | 남자 | 6-9세 | 대학교(4년제 이상) | <NA> |
10709 | 작전1동 | 여자 | 10-19세 | 받지 않았음(미취학 포함) | <NA> |
10537 | 계산3동 | 남자 | 10-19세 | 고등학교 | 363 |
4438 | 옥련2동 | 여자 | 20-29세 | 초등학교 | <NA> |
행정구역별(동읍면) | 성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|---|
5855 | 간석3동 | 남자 | 40-49세 | 대학교(2,3년제) | 372 |
8848 | 갈산1동 | 남자 | 6-9세 | 초등학교 | 157 |
16496 | 강화군 | 남자 | 40-49세 | 대학교(4년제 이상) | 866 |
12861 | 가좌4동 | 여자 | 50-59세 | 고등학교 | 609 |
14148 | 숭의2동 | 남자 | 50-59세 | 중학교 | 150 |
17736 | 교동면 | 남자 | 50-59세 | 대학원(석박사 과정) | 11 |
1088 | 율목동 | 여자 | 30-39세 | 대학교(2,3년제) | 42 |
8023 | 부평5동 | 여자 | 20-29세 | 중학교 | 22 |
13505 | 불로대곡동 | 여자 | 10-19세 | 고등학교 | 456 |
1567 | 용유동 | 여자 | 70세 이상 | 받지 않았음(미취학 포함) | 60 |