Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 667 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 67.9 KiB |
Average record size in memory | 104.2 B |
Variable types
Categorical | 13 |
---|
Dataset
Description | 시도명,시군구명,학교급,학교명,교사 내부 관제 (대),교사 외부 관제 (대),총 합계 (대),화소 50만 이하 (대),화소 51~100만 미만 (대),화소 100~130만 미만 (대),화소 130~200만 미만 (대),화소 200만 이상 (대),데이터기준일자 |
---|---|
URL | https://data.gwd.go.kr//dataset/view?infId=OA-12982 |
학교명 has a high cardinality: 653 distinct values | High cardinality |
교사 외부 관제 (대) has a high cardinality: 71 distinct values | High cardinality |
총 합계 (대) has a high cardinality: 74 distinct values | High cardinality |
화소 200만 이상 (대) has a high cardinality: 74 distinct values | High cardinality |
화소 51~100만 미만 (대) is highly correlated with 화소 200만 이상 (대) and 5 other fields | High correlation |
화소 200만 이상 (대) is highly correlated with 화소 51~100만 미만 (대) and 6 other fields | High correlation |
데이터기준일자 is highly correlated with 화소 200만 이상 (대) and 5 other fields | High correlation |
화소 50만 이하 (대) is highly correlated with 화소 200만 이상 (대) and 5 other fields | High correlation |
학교급 is highly correlated with 화소 51~100만 미만 (대) and 5 other fields | High correlation |
교사 내부 관제 (대) is highly correlated with 화소 51~100만 미만 (대) and 5 other fields | High correlation |
시도명 is highly correlated with 화소 200만 이상 (대) and 5 other fields | High correlation |
화소 100~130만 미만 (대) is highly correlated with 화소 200만 이상 (대) and 5 other fields | High correlation |
총 합계 (대) is highly correlated with 화소 51~100만 미만 (대) and 6 other fields | High correlation |
화소 130~200만 미만 (대) is highly correlated with 화소 200만 이상 (대) and 5 other fields | High correlation |
교사 외부 관제 (대) is highly correlated with 화소 51~100만 미만 (대) and 5 other fields | High correlation |
시군구명 is highly correlated with 화소 51~100만 미만 (대) and 5 other fields | High correlation |
Reproduction
Analysis started | 2022-08-11 14:11:37.574564 |
---|---|
Analysis finished | 2022-08-11 14:11:41.768762 |
Duration | 4.19 seconds |
Software version | pandas-profiling v3.2.0 |
Download configuration | config.json |
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
강원도 | |
---|---|
SIDO_NM | 1 |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 3.005997001 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | SIDO_NM |
---|---|
2nd row | 강원도 |
3rd row | 강원도 |
4th row | 강원도 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
강원도 | 666 | |
SIDO_NM | 1 | 0.1% |
Length
Category Frequency Plot
Value | Count | Frequency (%) |
강원도 | 666 | |
sido_nm | 1 | 0.1% |
Distinct | 20 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
원주시 | |
---|---|
춘천시 | |
강릉시 | |
홍천군 | |
삼척시 | |
Other values (15) |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.005997001 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | GOV_NM |
---|---|
2nd row | 화천군 |
3rd row | 화천군 |
4th row | 화천군 |
5th row | 화천군 |
Common Values
Value | Count | Frequency (%) |
원주시 | 90 | |
춘천시 | 78 | |
강릉시 | 62 | 9.3% |
홍천군 | 49 | 7.3% |
삼척시 | 40 | 6.0% |
정선군 | 35 | 5.2% |
영월군 | 34 | 5.1% |
횡성군 | 34 | 5.1% |
평창군 | 32 | 4.8% |
인제군 | 27 | 4.0% |
Other values (10) | 186 |
Length
Value | Count | Frequency (%) |
원주시 | 90 | |
춘천시 | 78 | |
강릉시 | 62 | 9.3% |
홍천군 | 49 | 7.3% |
삼척시 | 41 | 6.1% |
정선군 | 35 | 5.2% |
영월군 | 34 | 5.1% |
횡성군 | 34 | 5.1% |
평창군 | 32 | 4.8% |
동해시 | 27 | 4.0% |
Other values (9) | 185 |
Distinct | 5 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
초 | |
---|---|
중 | |
고 | |
특 | 8 |
SCHOOL_GRADE | 1 |
Length
Max length | 12 |
---|---|
Median length | 1 |
Mean length | 1.016491754 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | SCHOOL_GRADE |
---|---|
2nd row | 중 |
3rd row | 중 |
4th row | 중 |
5th row | 중 |
Common Values
Value | Count | Frequency (%) |
초 | 379 | |
중 | 163 | |
고 | 116 | 17.4% |
특 | 8 | 1.2% |
SCHOOL_GRADE | 1 | 0.1% |
Length
Category Frequency Plot
Value | Count | Frequency (%) |
초 | 379 | |
중 | 163 | |
고 | 116 | 17.4% |
특 | 8 | 1.2% |
school_grade | 1 | 0.1% |
Distinct | 653 |
---|---|
Distinct (%) | 97.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
중앙초등학교 | 4 |
---|---|
교동초등학교 | 4 |
남산초등학교 | 3 |
속초초등학교 | 2 |
조양초등학교 | 2 |
Other values (648) |
Length
Max length | 10 |
---|---|
Median length | 6 |
Mean length | 6.125937031 |
Min length | 4 |
Unique
Unique | 644 ? |
---|---|
Unique (%) | 96.6% |
Sample
1st row | SCHOOL_NM |
---|---|
2nd row | 화천중학교 |
3rd row | 상서중학교 |
4th row | 사내중학교 |
5th row | 간동중학교 |
Common Values
Value | Count | Frequency (%) |
중앙초등학교 | 4 | 0.6% |
교동초등학교 | 4 | 0.6% |
남산초등학교 | 3 | 0.4% |
속초초등학교 | 2 | 0.3% |
조양초등학교 | 2 | 0.3% |
반곡초등학교 | 2 | 0.3% |
북평초등학교 | 2 | 0.3% |
원당초등학교 | 2 | 0.3% |
신동초등학교 | 2 | 0.3% |
사내중학교 | 1 | 0.1% |
Other values (643) | 643 |
Length
Value | Count | Frequency (%) |
중앙초등학교 | 4 | 0.6% |
교동초등학교 | 4 | 0.6% |
남산초등학교 | 3 | 0.4% |
기린초 | 2 | 0.3% |
속초초등학교 | 2 | 0.3% |
조양초등학교 | 2 | 0.3% |
반곡초등학교 | 2 | 0.3% |
북평초등학교 | 2 | 0.3% |
원당초등학교 | 2 | 0.3% |
신동초등학교 | 2 | 0.3% |
Other values (663) | 664 |
Distinct | 23 |
---|---|
Distinct (%) | 3.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
0 | |
---|---|
1 | |
2 | |
3 | |
4 | 28 |
Other values (18) |
Length
Max length | 13 |
---|---|
Median length | 1 |
Mean length | 1.044977511 |
Min length | 1 |
Unique
Unique | 8 ? |
---|---|
Unique (%) | 1.2% |
Sample
1st row | INTERNAL_CCTV |
---|---|
2nd row | 4 |
3rd row | 0 |
4th row | 3 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 408 | |
1 | 56 | 8.4% |
2 | 51 | 7.6% |
3 | 44 | 6.6% |
4 | 28 | 4.2% |
8 | 17 | 2.5% |
6 | 14 | 2.1% |
5 | 14 | 2.1% |
9 | 8 | 1.2% |
7 | 8 | 1.2% |
Other values (13) | 19 | 2.8% |
Length
Value | Count | Frequency (%) |
0 | 408 | |
1 | 56 | 8.4% |
2 | 51 | 7.6% |
3 | 44 | 6.6% |
4 | 28 | 4.2% |
8 | 17 | 2.5% |
6 | 14 | 2.1% |
5 | 14 | 2.1% |
9 | 8 | 1.2% |
7 | 8 | 1.2% |
Other values (13) | 19 | 2.8% |
Distinct | 71 |
---|---|
Distinct (%) | 10.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
9 | |
---|---|
10 | |
11 | 44 |
16 | 42 |
8 | 42 |
Other values (66) |
Length
Max length | 13 |
---|---|
Median length | 2 |
Mean length | 1.769115442 |
Min length | 1 |
Unique
Unique | 19 ? |
---|---|
Unique (%) | 2.8% |
Sample
1st row | EXTERNAL_CCTV |
---|---|
2nd row | 9 |
3rd row | 15 |
4th row | 18 |
5th row | 10 |
Common Values
Value | Count | Frequency (%) |
9 | 51 | 7.6% |
10 | 46 | 6.9% |
11 | 44 | 6.6% |
16 | 42 | 6.3% |
8 | 42 | 6.3% |
13 | 40 | 6.0% |
12 | 38 | 5.7% |
14 | 31 | 4.6% |
7 | 20 | 3.0% |
0 | 20 | 3.0% |
Other values (61) | 293 |
Length
Value | Count | Frequency (%) |
9 | 51 | 7.6% |
10 | 46 | 6.9% |
11 | 44 | 6.6% |
16 | 42 | 6.3% |
8 | 42 | 6.3% |
13 | 40 | 6.0% |
12 | 38 | 5.7% |
14 | 31 | 4.6% |
0 | 20 | 3.0% |
7 | 20 | 3.0% |
Other values (61) | 293 |
Distinct | 74 |
---|---|
Distinct (%) | 11.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
16 | |
---|---|
12 | |
9 | 39 |
13 | 36 |
14 | 36 |
Other values (69) |
Length
Max length | 10 |
---|---|
Median length | 2 |
Mean length | 1.821589205 |
Min length | 1 |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 2.5% |
Sample
1st row | CCTV_TOTAL |
---|---|
2nd row | 13 |
3rd row | 15 |
4th row | 21 |
5th row | 10 |
Common Values
Value | Count | Frequency (%) |
16 | 50 | 7.5% |
12 | 48 | 7.2% |
9 | 39 | 5.8% |
13 | 36 | 5.4% |
14 | 36 | 5.4% |
8 | 35 | 5.2% |
10 | 32 | 4.8% |
11 | 32 | 4.8% |
15 | 27 | 4.0% |
0 | 20 | 3.0% |
Other values (64) | 312 |
Length
Value | Count | Frequency (%) |
16 | 50 | 7.5% |
12 | 48 | 7.2% |
9 | 39 | 5.8% |
14 | 36 | 5.4% |
13 | 36 | 5.4% |
8 | 35 | 5.2% |
10 | 32 | 4.8% |
11 | 32 | 4.8% |
15 | 27 | 4.0% |
0 | 20 | 3.0% |
Other values (64) | 312 |
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
0 | |
---|---|
LESS_THEN_P50 | 1 |
Length
Max length | 13 |
---|---|
Median length | 1 |
Mean length | 1.017991004 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | LESS_THEN_P50 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 666 | |
LESS_THEN_P50 | 1 | 0.1% |
Length
Category Frequency Plot
Value | Count | Frequency (%) |
0 | 666 | |
less_then_p50 | 1 | 0.1% |
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
0 | |
---|---|
P51_P100 | 1 |
Length
Max length | 8 |
---|---|
Median length | 1 |
Mean length | 1.010494753 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | P51_P100 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 666 | |
P51_P100 | 1 | 0.1% |
Length
Category Frequency Plot
Value | Count | Frequency (%) |
0 | 666 | |
p51_p100 | 1 | 0.1% |
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
0 | |
---|---|
P100_P130 | 1 |
Length
Max length | 9 |
---|---|
Median length | 1 |
Mean length | 1.011994003 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | P100_P130 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 666 | |
P100_P130 | 1 | 0.1% |
Length
Category Frequency Plot
Value | Count | Frequency (%) |
0 | 666 | |
p100_p130 | 1 | 0.1% |
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
0 | |
---|---|
P130_P200 | 1 |
Length
Max length | 9 |
---|---|
Median length | 1 |
Mean length | 1.011994003 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | P130_P200 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 666 | |
P130_P200 | 1 | 0.1% |
Length
Category Frequency Plot
Value | Count | Frequency (%) |
0 | 666 | |
p130_p200 | 1 | 0.1% |
Distinct | 74 |
---|---|
Distinct (%) | 11.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
16 | |
---|---|
12 | |
9 | 39 |
13 | 36 |
14 | 36 |
Other values (69) |
Length
Max length | 14 |
---|---|
Median length | 2 |
Mean length | 1.827586207 |
Min length | 1 |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 2.5% |
Sample
1st row | MORE_THEN_P200 |
---|---|
2nd row | 13 |
3rd row | 15 |
4th row | 21 |
5th row | 10 |
Common Values
Value | Count | Frequency (%) |
16 | 50 | 7.5% |
12 | 48 | 7.2% |
9 | 39 | 5.8% |
13 | 36 | 5.4% |
14 | 36 | 5.4% |
8 | 35 | 5.2% |
10 | 32 | 4.8% |
11 | 32 | 4.8% |
15 | 27 | 4.0% |
0 | 20 | 3.0% |
Other values (64) | 312 |
Length
Value | Count | Frequency (%) |
16 | 50 | 7.5% |
12 | 48 | 7.2% |
9 | 39 | 5.8% |
14 | 36 | 5.4% |
13 | 36 | 5.4% |
8 | 35 | 5.2% |
10 | 32 | 4.8% |
11 | 32 | 4.8% |
15 | 27 | 4.0% |
0 | 20 | 3.0% |
Other values (64) | 312 |
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.3 KiB |
20200224 | |
---|---|
STD_DT | 1 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 7.997001499 |
Min length | 6 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | STD_DT |
---|---|
2nd row | 20200224 |
3rd row | 20200224 |
4th row | 20200224 |
5th row | 20200224 |
Common Values
Value | Count | Frequency (%) |
20200224 | 666 | |
STD_DT | 1 | 0.1% |
Length
Category Frequency Plot
Value | Count | Frequency (%) |
20200224 | 666 | |
std_dt | 1 | 0.1% |
Phik (φk)
Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.Cramér's V (φc)
Cramér's V is an association measure for nominal random variables. The coefficient ranges from 0 to 1, with 0 indicating independence and 1 indicating perfect association. The empirical estimators used for Cramér's V have been proved to be biased, even for large samples. We use a bias-corrected measure that has been proposed by Bergsma in 2013 that can be found here.First rows
시도명 | 시군구명 | 학교급 | 학교명 | 교사 내부 관제 (대) | 교사 외부 관제 (대) | 총 합계 (대) | 화소 50만 이하 (대) | 화소 51~100만 미만 (대) | 화소 100~130만 미만 (대) | 화소 130~200만 미만 (대) | 화소 200만 이상 (대) | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | SIDO_NM | GOV_NM | SCHOOL_GRADE | SCHOOL_NM | INTERNAL_CCTV | EXTERNAL_CCTV | CCTV_TOTAL | LESS_THEN_P50 | P51_P100 | P100_P130 | P130_P200 | MORE_THEN_P200 | STD_DT |
1 | 강원도 | 화천군 | 중 | 화천중학교 | 4 | 9 | 13 | 0 | 0 | 0 | 0 | 13 | 20200224 |
2 | 강원도 | 화천군 | 중 | 상서중학교 | 0 | 15 | 15 | 0 | 0 | 0 | 0 | 15 | 20200224 |
3 | 강원도 | 화천군 | 중 | 사내중학교 | 3 | 18 | 21 | 0 | 0 | 0 | 0 | 21 | 20200224 |
4 | 강원도 | 화천군 | 중 | 간동중학교 | 0 | 10 | 10 | 0 | 0 | 0 | 0 | 10 | 20200224 |
5 | 강원도 | 양구군 | 중 | 해안중학교 | 0 | 12 | 12 | 0 | 0 | 0 | 0 | 12 | 20200224 |
6 | 강원도 | 양구군 | 중 | 양구중학교 | 1 | 13 | 14 | 0 | 0 | 0 | 0 | 14 | 20200224 |
7 | 강원도 | 양구군 | 중 | 대암중학교 | 0 | 11 | 11 | 0 | 0 | 0 | 0 | 11 | 20200224 |
8 | 강원도 | 양구군 | 중 | 방산중학교 | 0 | 4 | 4 | 0 | 0 | 0 | 0 | 4 | 20200224 |
9 | 강원도 | 양구군 | 중 | 석천중학교 | 0 | 19 | 19 | 0 | 0 | 0 | 0 | 19 | 20200224 |
Last rows
시도명 | 시군구명 | 학교급 | 학교명 | 교사 내부 관제 (대) | 교사 외부 관제 (대) | 총 합계 (대) | 화소 50만 이하 (대) | 화소 51~100만 미만 (대) | 화소 100~130만 미만 (대) | 화소 130~200만 미만 (대) | 화소 200만 이상 (대) | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
657 | 강원도 | 정선군 | 중 | 고한중학교 | 0 | 10 | 10 | 0 | 0 | 0 | 0 | 10 | 20200224 |
658 | 강원도 | 정선군 | 중 | 나전중학교 | 0 | 11 | 11 | 0 | 0 | 0 | 0 | 11 | 20200224 |
659 | 강원도 | 정선군 | 중 | 사북중학교 | 0 | 16 | 16 | 0 | 0 | 0 | 0 | 16 | 20200224 |
660 | 강원도 | 정선군 | 중 | 여량중학교 | 0 | 15 | 15 | 0 | 0 | 0 | 0 | 15 | 20200224 |
661 | 강원도 | 정선군 | 중 | 임계중학교 | 0 | 16 | 16 | 0 | 0 | 0 | 0 | 16 | 20200224 |
662 | 강원도 | 정선군 | 중 | 정선중학교 | 0 | 31 | 31 | 0 | 0 | 0 | 0 | 31 | 20200224 |
663 | 강원도 | 정선군 | 중 | 함백중학교 | 3 | 18 | 21 | 0 | 0 | 0 | 0 | 21 | 20200224 |
664 | 강원도 | 정선군 | 중 | 화동중학교 | 0 | 11 | 11 | 0 | 0 | 0 | 0 | 11 | 20200224 |
665 | 강원도 | 정선군 | 중 | 문곡중학교 | 2 | 18 | 20 | 0 | 0 | 0 | 0 | 20 | 20200224 |
666 | 강원도 | 철원군 | 중 | 김화여자중학교 | 6 | 7 | 13 | 0 | 0 | 0 | 0 | 13 | 20200224 |