Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 2970 |
Missing cells (%) | 5.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 478.5 KiB |
Average record size in memory | 49.0 B |
Variable types
Text | 1 |
---|---|
Categorical | 3 |
Numeric | 1 |
Dataset
Description | 6세이상 교육정도별 인구(초등학교, 중학교, 고등학교, 대학교(2,3년제), 대학교(4년제 이상), 대학원(석박사 과정), 받지 않았음(미취학 포함))에 대한 정보입니다.* 인구주택 총조사 자료(5년주기 생성) |
---|---|
Author | 인천광역시 |
URL | https://www.data.go.kr/data/15055008/fileData.do |
2020 년 has 2970 (29.7%) missing values | Missing |
Reproduction
Analysis started | 2023-12-23 08:02:48.841437 |
---|---|
Analysis finished | 2023-12-23 08:02:51.202188 |
Duration | 2.36 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
행정구역별(동읍면)
Text
Distinct | 169 |
---|---|
Distinct (%) | 1.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
가좌1동 | 73 | 0.7% |
주안6동 | 73 | 0.7% |
구월2동 | 72 | 0.7% |
교동면 | 71 | 0.7% |
남촌도림동 | 69 | 0.7% |
가좌3동 | 69 | 0.7% |
계산2동 | 69 | 0.7% |
삼산2동 | 68 | 0.7% |
중구 | 68 | 0.7% |
송월동 | 68 | 0.7% |
Other values (159) | 9300 |
Most occurring characters
Value | Count | Frequency (%) |
동 | 8454 | |
2 | 1869 | 5.0% |
1 | 1843 | 4.9% |
3 | 1228 | 3.3% |
면 | 1209 | 3.2% |
송 | 813 | 2.2% |
수 | 760 | 2.0% |
도 | 756 | 2.0% |
부 | 754 | 2.0% |
산 | 745 | 2.0% |
Other values (107) | 19249 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 30966 | |
Decimal Number | 6364 | 16.9% |
Other Punctuation | 350 | 0.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 8454 | |
면 | 1209 | 3.9% |
송 | 813 | 2.6% |
수 | 760 | 2.5% |
도 | 756 | 2.4% |
부 | 754 | 2.4% |
산 | 745 | 2.4% |
구 | 709 | 2.3% |
현 | 584 | 1.9% |
안 | 545 | 1.8% |
Other values (98) | 15637 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1869 | |
1 | 1843 | |
3 | 1228 | |
4 | 701 | 11.0% |
5 | 364 | 5.7% |
6 | 245 | 3.8% |
7 | 60 | 0.9% |
8 | 54 | 0.8% |
Other Punctuation
Value | Count | Frequency (%) |
· | 350 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 30966 | |
Common | 6714 | 17.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 8454 | |
면 | 1209 | 3.9% |
송 | 813 | 2.6% |
수 | 760 | 2.5% |
도 | 756 | 2.4% |
부 | 754 | 2.4% |
산 | 745 | 2.4% |
구 | 709 | 2.3% |
현 | 584 | 1.9% |
안 | 545 | 1.8% |
Other values (98) | 15637 |
Common
Value | Count | Frequency (%) |
2 | 1869 | |
1 | 1843 | |
3 | 1228 | |
4 | 701 | 10.4% |
5 | 364 | 5.4% |
· | 350 | 5.2% |
6 | 245 | 3.6% |
7 | 60 | 0.9% |
8 | 54 | 0.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 30966 | |
ASCII | 6364 | 16.9% |
None | 350 | 0.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
동 | 8454 | |
면 | 1209 | 3.9% |
송 | 813 | 2.6% |
수 | 760 | 2.5% |
도 | 756 | 2.4% |
부 | 754 | 2.4% |
산 | 745 | 2.4% |
구 | 709 | 2.3% |
현 | 584 | 1.9% |
안 | 545 | 1.8% |
Other values (98) | 15637 |
ASCII
Value | Count | Frequency (%) |
2 | 1869 | |
1 | 1843 | |
3 | 1228 | |
4 | 701 | 11.0% |
5 | 364 | 5.7% |
6 | 245 | 3.8% |
7 | 60 | 0.9% |
8 | 54 | 0.8% |
None
Value | Count | Frequency (%) |
· | 350 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여자 | |
---|---|
남자 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남자 |
---|---|
2nd row | 여자 |
3rd row | 남자 |
4th row | 여자 |
5th row | 여자 |
Common Values
Value | Count | Frequency (%) |
여자 | 5021 | |
남자 | 4979 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여자 | 5021 | |
남자 | 4979 |
연령별
Categorical
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
60-69세 | |
---|---|
30-39세 | |
70세 이상 | |
40-49세 | |
50-59세 | |
Other values (3) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.752 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 6-9세 |
---|---|
2nd row | 20-29세 |
3rd row | 50-59세 |
4th row | 50-59세 |
5th row | 60-69세 |
Common Values
Value | Count | Frequency (%) |
60-69세 | 1306 | |
30-39세 | 1262 | |
70세 이상 | 1256 | |
40-49세 | 1246 | |
50-59세 | 1244 | |
6-9세 | 1240 | |
10-19세 | 1228 | |
20-29세 | 1218 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
60-69세 | 1306 | |
30-39세 | 1262 | |
70세 | 1256 | |
이상 | 1256 | |
40-49세 | 1246 | |
50-59세 | 1244 | |
6-9세 | 1240 | |
10-19세 | 1228 | |
20-29세 | 1218 |
교육정도별
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대학교(4년제 이상) | |
---|---|
대학교(2,3년제) | |
초등학교 | |
고등학교 | |
중학교 | |
Other values (2) |
Length
Max length | 14 |
---|---|
Median length | 11 |
Mean length | 8.1286 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대학교(4년제 이상) |
---|---|
2nd row | 고등학교 |
3rd row | 받지 않았음(미취학 포함) |
4th row | 대학교(2,3년제) |
5th row | 대학원(석박사 과정) |
Common Values
Value | Count | Frequency (%) |
대학교(4년제 이상) | 1463 | |
대학교(2,3년제) | 1445 | |
초등학교 | 1430 | |
고등학교 | 1429 | |
중학교 | 1426 | |
대학원(석박사 과정) | 1423 | |
받지 않았음(미취학 포함) | 1384 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대학교(4년제 | 1463 | |
이상 | 1463 | |
대학교(2,3년제 | 1445 | |
초등학교 | 1430 | |
고등학교 | 1429 | |
중학교 | 1426 | |
대학원(석박사 | 1423 | |
과정 | 1423 | |
받지 | 1384 | |
않았음(미취학 | 1384 |
2020 년
Real number (ℝ)
MISSING
 
Distinct | 1372 |
---|---|
Distinct (%) | 19.5% |
Missing | 2970 |
Missing (%) | 29.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 831.72589 |
Minimum | 1 |
---|---|
Maximum | 159239 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 6 |
Q1 | 31 |
median | 121 |
Q3 | 365 |
95-th percentile | 1494.65 |
Maximum | 159239 |
Range | 159238 |
Interquartile range (IQR) | 334 |
Descriptive statistics
Standard deviation | 5568.4627 |
---|---|
Coefficient of variation (CV) | 6.6950696 |
Kurtosis | 344.44581 |
Mean | 831.72589 |
Median Absolute Deviation (MAD) | 107 |
Skewness | 16.531688 |
Sum | 5847033 |
Variance | 31007777 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
7 | 102 | 1.0% |
8 | 100 | 1.0% |
4 | 80 | 0.8% |
6 | 77 | 0.8% |
13 | 72 | 0.7% |
2 | 69 | 0.7% |
10 | 68 | 0.7% |
9 | 66 | 0.7% |
12 | 66 | 0.7% |
5 | 66 | 0.7% |
Other values (1362) | 6264 | |
(Missing) | 2970 |
Value | Count | Frequency (%) |
1 | 51 | |
2 | 69 | |
3 | 62 | |
4 | 80 | |
5 | 66 | |
6 | 77 | |
7 | 102 | |
8 | 100 | |
9 | 66 | |
10 | 68 |
Value | Count | Frequency (%) |
159239 | 1 | |
154893 | 1 | |
132978 | 1 | |
128364 | 1 | |
107602 | 1 | |
90342 | 1 | |
86622 | 1 | |
85060 | 1 | |
84395 | 1 | |
73890 | 1 |
성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|
성별 | 1.000 | 0.000 | 0.000 | 0.015 |
연령별 | 0.000 | 1.000 | 0.000 | 0.050 |
교육정도별 | 0.000 | 0.000 | 1.000 | 0.048 |
2020 년 | 0.015 | 0.050 | 0.048 | 1.000 |
교육정도별 | 성별 | 연령별 | |
---|---|---|---|
교육정도별 | 1.000 | 0.000 | 0.000 |
성별 | 0.000 | 1.000 | 0.000 |
연령별 | 0.000 | 0.000 | 1.000 |
2020 년 | 성별 | 연령별 | 교육정도별 | |
---|---|---|---|---|
2020 년 | 1.000 | 0.015 | 0.024 | 0.025 |
성별 | 0.015 | 1.000 | 0.000 | 0.000 |
연령별 | 0.024 | 0.000 | 1.000 | 0.000 |
교육정도별 | 0.025 | 0.000 | 0.000 | 1.000 |
행정구역별(동읍면) | 성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|---|
18365 | 백령면 | 남자 | 6-9세 | 대학교(4년제 이상) | <NA> |
1752 | 영종동 | 여자 | 20-29세 | 고등학교 | 186 |
489 | 중구 | 남자 | 50-59세 | 받지 않았음(미취학 포함) | <NA> |
542 | 중구 | 여자 | 50-59세 | 대학교(2,3년제) | 893 |
3127 | 송림6동 | 여자 | 60-69세 | 대학원(석박사 과정) | 4 |
789 | 신흥동 | 남자 | 6-9세 | 대학원(석박사 과정) | <NA> |
4009 | 청학동 | 여자 | 40-49세 | 대학원(석박사 과정) | 38 |
7832 | 부평3동 | 여자 | 60-69세 | 받지 않았음(미취학 포함) | <NA> |
16229 | 숭의1·3동 | 여자 | 60-69세 | 대학교(2,3년제) | 51 |
16619 | 강화읍 | 남자 | 60-69세 | 중학교 | 358 |
행정구역별(동읍면) | 성별 | 연령별 | 교육정도별 | 2020 년 | |
---|---|---|---|---|---|
12457 | 가좌1동 | 남자 | 30-39세 | 대학교(4년제 이상) | 160 |
7332 | 서창2동 | 남자 | 70세 이상 | 대학교(2,3년제) | 53 |
8401 | 산곡3동 | 남자 | 6-9세 | 중학교 | <NA> |
3357 | 연수구 | 여자 | 70세 이상 | 대학교(4년제 이상) | 467 |
9537 | 일신동 | 남자 | 20-29세 | 대학교(2,3년제) | 387 |
11644 | 검암경서동 | 여자 | 70세 이상 | 대학교(2,3년제) | 1 |
16597 | 강화읍 | 남자 | 30-39세 | 초등학교 | <NA> |
11775 | 가정1동 | 남자 | 20-29세 | 중학교 | 12 |
3781 | 연수2동 | 여자 | 40-49세 | 중학교 | 18 |
9733 | 십정1동 | 여자 | 60-69세 | 대학교(2,3년제) | 29 |