Overview

Dataset statistics

Number of variables10
Number of observations10000
Missing cells10001
Missing cells (%)10.0%
Duplicate rows342
Duplicate rows (%)3.4%
Total size in memory878.9 KiB
Average record size in memory90.0 B

Variable types

Numeric2
Categorical5
Text2
Boolean1

Dataset

Description경기도_급식비 집행 실적_지출 내역 현황
Author경기도
URLhttps://data.gg.go.kr/portal/data/service/selectServicePage.do?&infId=B2MD6KXTHEQHFTTHU57P23384812&infSeq=2

Alerts

Dataset has 342 (3.4%) duplicate rowsDuplicates
시군명 is highly overall correlated with 지역교육청명 and 1 other fieldsHigh correlation
지역명 is highly overall correlated with 시군명 and 1 other fieldsHigh correlation
학생1인당급식비 (1식 기준)(원) is highly overall correlated with 제외여부High correlation
지역교육청명 is highly overall correlated with 시군명 and 2 other fieldsHigh correlation
설립구분명 is highly overall correlated with 지역교육청명High correlation
제외여부 is highly overall correlated with 학생1인당급식비 (1식 기준)(원)High correlation
설립구분명 is highly imbalanced (69.3%)Imbalance
제외여부 is highly imbalanced (90.5%)Imbalance
제외사유 has 9879 (98.8%) missing valuesMissing
학생1인당급식비 (1식 기준)(원) has 122 (1.2%) missing valuesMissing

Reproduction

Analysis started2023-12-10 21:43:16.452117
Analysis finished2023-12-10 21:43:18.499145
Duration2.05 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

기준년도
Real number (ℝ)

Distinct6
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2017.2898
Minimum2015
Maximum2020
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size166.0 KiB
2023-12-11T06:43:18.563171image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2015
5-th percentile2015
Q12016
median2017
Q32019
95-th percentile2020
Maximum2020
Range5
Interquartile range (IQR)3

Descriptive statistics

Standard deviation1.6161303
Coefficient of variation (CV)0.00080113938
Kurtosis-1.1819256
Mean2017.2898
Median Absolute Deviation (MAD)1
Skewness0.085197582
Sum20172898
Variance2.6118771
MonotonicityNot monotonic
2023-12-11T06:43:18.677079image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=6)
ValueCountFrequency (%)
2016 1836
18.4%
2015 1810
18.1%
2019 1799
18.0%
2018 1792
17.9%
2017 1775
17.8%
2020 988
9.9%
ValueCountFrequency (%)
2015 1810
18.1%
2016 1836
18.4%
2017 1775
17.8%
2018 1792
17.9%
2019 1799
18.0%
2020 988
9.9%
ValueCountFrequency (%)
2020 988
9.9%
2019 1799
18.0%
2018 1792
17.9%
2017 1775
17.8%
2016 1836
18.4%
2015 1810
18.1%

시군명
Categorical

HIGH CORRELATION 

Distinct31
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
수원시
805 
용인시
724 
성남시
680 
고양시
666 
화성시
 
630
Other values (26)
6495 

Length

Max length4
Median length3
Mean length3.0904
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row화성시
2nd row안산시
3rd row수원시
4th row평택시
5th row성남시

Common Values

ValueCountFrequency (%)
수원시 805
 
8.1%
용인시 724
 
7.2%
성남시 680
 
6.8%
고양시 666
 
6.7%
화성시 630
 
6.3%
부천시 545
 
5.5%
남양주시 508
 
5.1%
안산시 454
 
4.5%
파주시 450
 
4.5%
평택시 449
 
4.5%
Other values (21) 4089
40.9%

Length

2023-12-11T06:43:18.799716image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
수원시 805
 
8.1%
용인시 724
 
7.2%
성남시 680
 
6.8%
고양시 666
 
6.7%
화성시 630
 
6.3%
부천시 545
 
5.5%
남양주시 508
 
5.1%
안산시 454
 
4.5%
파주시 450
 
4.5%
평택시 449
 
4.5%
Other values (21) 4089
40.9%

지역교육청명
Categorical

HIGH CORRELATION 

Distinct27
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
경기도교육청
2075 
경기도화성오산교육지원청
667 
경기도수원교육지원청
627 
경기도용인교육지원청
602 
경기도고양교육지원청
 
508
Other values (22)
5521 

Length

Max length13
Median length10
Mean length9.7079
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경기도화성오산교육지원청
2nd row경기도안산교육지원청
3rd row경기도수원교육지원청
4th row경기도평택교육지원청
5th row경기도성남교육지원청

Common Values

ValueCountFrequency (%)
경기도교육청 2075
20.8%
경기도화성오산교육지원청 667
 
6.7%
경기도수원교육지원청 627
 
6.3%
경기도용인교육지원청 602
 
6.0%
경기도고양교육지원청 508
 
5.1%
경기도성남교육지원청 505
 
5.1%
경기도구리남양주교육지원청 499
 
5.0%
경기도부천교육지원청 409
 
4.1%
경기도안산교육지원청 355
 
3.5%
경기도파주교육지원청 354
 
3.5%
Other values (17) 3399
34.0%

Length

2023-12-11T06:43:18.930099image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
경기도교육청 2075
20.8%
경기도화성오산교육지원청 667
 
6.7%
경기도수원교육지원청 627
 
6.3%
경기도용인교육지원청 602
 
6.0%
경기도고양교육지원청 508
 
5.1%
경기도성남교육지원청 505
 
5.1%
경기도구리남양주교육지원청 499
 
5.0%
경기도부천교육지원청 409
 
4.1%
경기도안산교육지원청 355
 
3.5%
경기도파주교육지원청 354
 
3.5%
Other values (17) 3399
34.0%

지역명
Categorical

HIGH CORRELATION 

Distinct42
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
경기도 화성시
 
630
경기도 부천시
 
545
경기도 남양주시
 
508
경기도 파주시
 
450
경기도 평택시
 
449
Other values (37)
7418 

Length

Max length12
Median length7
Mean length8.608
Min length7

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경기도 화성시
2nd row경기도 안산시 단원구
3rd row경기도 수원시 장안구
4th row경기도 평택시
5th row경기도 성남시 중원구

Common Values

ValueCountFrequency (%)
경기도 화성시 630
 
6.3%
경기도 부천시 545
 
5.5%
경기도 남양주시 508
 
5.1%
경기도 파주시 450
 
4.5%
경기도 평택시 449
 
4.5%
경기도 성남시 분당구 377
 
3.8%
경기도 시흥시 325
 
3.2%
경기도 김포시 311
 
3.1%
경기도 의정부시 304
 
3.0%
경기도 고양시 덕양구 294
 
2.9%
Other values (32) 5807
58.1%

Length

2023-12-11T06:43:19.061875image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
경기도 10000
42.2%
수원시 805
 
3.4%
용인시 724
 
3.1%
성남시 680
 
2.9%
고양시 666
 
2.8%
화성시 630
 
2.7%
부천시 545
 
2.3%
남양주시 508
 
2.1%
안산시 454
 
1.9%
파주시 450
 
1.9%
Other values (39) 8239
34.8%
Distinct2467
Distinct (%)24.7%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-11T06:43:19.354648image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length24
Median length6
Mean length6.2656
Min length4

Characters and Unicode

Total characters62656
Distinct characters335
Distinct categories4 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique141 ?
Unique (%)1.4%

Sample

1st row화성동화중학교
2nd row안산대월초등학교
3rd row효천초등학교
4th row평택초등학교
5th row금광중학교
ValueCountFrequency (%)
삼성초등학교 12
 
0.1%
탑동초등학교 10
 
0.1%
만안초등학교 9
 
0.1%
부천일신초등학교 9
 
0.1%
평택성동초등학교 9
 
0.1%
화현초등학교 9
 
0.1%
양감초등학교 9
 
0.1%
고강초등학교 8
 
0.1%
원삼초등학교 8
 
0.1%
고산초등학교 8
 
0.1%
Other values (2458) 9915
99.1%
2023-12-11T06:43:19.732991image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
10237
16.3%
10149
16.2%
7274
 
11.6%
5366
 
8.6%
2860
 
4.6%
2151
 
3.4%
632
 
1.0%
601
 
1.0%
595
 
0.9%
587
 
0.9%
Other values (325) 22204
35.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 62552
99.8%
Lowercase Letter 82
 
0.1%
Uppercase Letter 16
 
< 0.1%
Space Separator 6
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
10237
16.4%
10149
16.2%
7274
 
11.6%
5366
 
8.6%
2860
 
4.6%
2151
 
3.4%
632
 
1.0%
601
 
1.0%
595
 
1.0%
587
 
0.9%
Other values (312) 22100
35.3%
Lowercase Letter
ValueCountFrequency (%)
s 24
29.3%
i 12
14.6%
n 12
14.6%
e 10
12.2%
u 6
 
7.3%
g 6
 
7.3%
l 6
 
7.3%
h 6
 
7.3%
Uppercase Letter
ValueCountFrequency (%)
E 6
37.5%
B 6
37.5%
T 2
 
12.5%
I 2
 
12.5%
Space Separator
ValueCountFrequency (%)
6
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 62552
99.8%
Latin 98
 
0.2%
Common 6
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
10237
16.4%
10149
16.2%
7274
 
11.6%
5366
 
8.6%
2860
 
4.6%
2151
 
3.4%
632
 
1.0%
601
 
1.0%
595
 
1.0%
587
 
0.9%
Other values (312) 22100
35.3%
Latin
ValueCountFrequency (%)
s 24
24.5%
i 12
12.2%
n 12
12.2%
e 10
10.2%
u 6
 
6.1%
E 6
 
6.1%
g 6
 
6.1%
l 6
 
6.1%
h 6
 
6.1%
B 6
 
6.1%
Other values (2) 4
 
4.1%
Common
ValueCountFrequency (%)
6
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 62552
99.8%
ASCII 104
 
0.2%

Most frequent character per block

Hangul
ValueCountFrequency (%)
10237
16.4%
10149
16.2%
7274
 
11.6%
5366
 
8.6%
2860
 
4.6%
2151
 
3.4%
632
 
1.0%
601
 
1.0%
595
 
1.0%
587
 
0.9%
Other values (312) 22100
35.3%
ASCII
ValueCountFrequency (%)
s 24
23.1%
i 12
11.5%
n 12
11.5%
e 10
9.6%
u 6
 
5.8%
E 6
 
5.8%
g 6
 
5.8%
l 6
 
5.8%
h 6
 
5.8%
6
 
5.8%
Other values (3) 10
9.6%

학교급명
Categorical

Distinct7
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
<NA>
6368 
초등학교
1907 
중학교
948 
고등학교
714 
특수학교
 
51
Other values (2)
 
12

Length

Max length4
Median length4
Mean length3.904
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row중학교
2nd row<NA>
3rd row<NA>
4th row초등학교
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 6368
63.7%
초등학교 1907
 
19.1%
중학교 948
 
9.5%
고등학교 714
 
7.1%
특수학교 51
 
0.5%
방통중 8
 
0.1%
방통고 4
 
< 0.1%

Length

2023-12-11T06:43:19.867640image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T06:43:19.966707image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
na 6368
63.7%
초등학교 1907
 
19.1%
중학교 948
 
9.5%
고등학교 714
 
7.1%
특수학교 51
 
0.5%
방통중 8
 
0.1%
방통고 4
 
< 0.1%

설립구분명
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct3
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
공립
8965 
사립
1028 
국립
 
7

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row공립
2nd row공립
3rd row공립
4th row공립
5th row공립

Common Values

ValueCountFrequency (%)
공립 8965
89.6%
사립 1028
 
10.3%
국립 7
 
0.1%

Length

2023-12-11T06:43:20.070766image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T06:43:20.158435image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
공립 8965
89.6%
사립 1028
 
10.3%
국립 7
 
0.1%

제외여부
Boolean

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size87.9 KiB
False
9878 
True
 
122
ValueCountFrequency (%)
False 9878
98.8%
True 122
 
1.2%
2023-12-11T06:43:20.246876image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

제외사유
Text

MISSING 

Distinct83
Distinct (%)68.6%
Missing9879
Missing (%)98.8%
Memory size156.2 KiB
2023-12-11T06:43:20.566749image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length49
Median length31
Mean length19.22314
Min length3

Characters and Unicode

Total characters2326
Distinct characters128
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique57 ?
Unique (%)47.1%

Sample

1st row2016년 개교로 인하여 자료가 없음
2nd row이상없음
3rd row분교 정보공시 제외 항목임
4th row본교 신설학교로 전년도 집행 실적 없음
5th row신설학교로 자료기준일 2015학년도에 해당사항 없음
ValueCountFrequency (%)
없음 51
 
10.1%
전년도 30
 
5.9%
신설학교이므로 20
 
3.9%
제외 19
 
3.7%
자료가 17
 
3.4%
3월 12
 
2.4%
신설학교로 10
 
2.0%
해당사항 9
 
1.8%
2015년 9
 
1.8%
개교 8
 
1.6%
Other values (144) 322
63.5%
2023-12-11T06:43:21.027780image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
392
 
16.9%
101
 
4.3%
75
 
3.2%
1 74
 
3.2%
73
 
3.1%
72
 
3.1%
0 71
 
3.1%
71
 
3.1%
65
 
2.8%
. 63
 
2.7%
Other values (118) 1269
54.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1573
67.6%
Space Separator 392
 
16.9%
Decimal Number 284
 
12.2%
Other Punctuation 63
 
2.7%
Open Punctuation 7
 
0.3%
Close Punctuation 7
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
101
 
6.4%
75
 
4.8%
73
 
4.6%
72
 
4.6%
71
 
4.5%
65
 
4.1%
61
 
3.9%
58
 
3.7%
48
 
3.1%
41
 
2.6%
Other values (104) 908
57.7%
Decimal Number
ValueCountFrequency (%)
1 74
26.1%
0 71
25.0%
2 60
21.1%
3 24
 
8.5%
5 20
 
7.0%
6 12
 
4.2%
7 8
 
2.8%
9 6
 
2.1%
8 6
 
2.1%
4 3
 
1.1%
Space Separator
ValueCountFrequency (%)
392
100.0%
Other Punctuation
ValueCountFrequency (%)
. 63
100.0%
Open Punctuation
ValueCountFrequency (%)
( 7
100.0%
Close Punctuation
ValueCountFrequency (%)
) 7
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1573
67.6%
Common 753
32.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
101
 
6.4%
75
 
4.8%
73
 
4.6%
72
 
4.6%
71
 
4.5%
65
 
4.1%
61
 
3.9%
58
 
3.7%
48
 
3.1%
41
 
2.6%
Other values (104) 908
57.7%
Common
ValueCountFrequency (%)
392
52.1%
1 74
 
9.8%
0 71
 
9.4%
. 63
 
8.4%
2 60
 
8.0%
3 24
 
3.2%
5 20
 
2.7%
6 12
 
1.6%
7 8
 
1.1%
( 7
 
0.9%
Other values (4) 22
 
2.9%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1573
67.6%
ASCII 753
32.4%

Most frequent character per block

ASCII
ValueCountFrequency (%)
392
52.1%
1 74
 
9.8%
0 71
 
9.4%
. 63
 
8.4%
2 60
 
8.0%
3 24
 
3.2%
5 20
 
2.7%
6 12
 
1.6%
7 8
 
1.1%
( 7
 
0.9%
Other values (4) 22
 
2.9%
Hangul
ValueCountFrequency (%)
101
 
6.4%
75
 
4.8%
73
 
4.6%
72
 
4.6%
71
 
4.5%
65
 
4.1%
61
 
3.9%
58
 
3.7%
48
 
3.1%
41
 
2.6%
Other values (104) 908
57.7%

학생1인당급식비 (1식 기준)(원)
Real number (ℝ)

HIGH CORRELATION  MISSING 

Distinct303
Distinct (%)3.1%
Missing122
Missing (%)1.2%
Infinite0
Infinite (%)0.0%
Mean3403.0816
Minimum0
Maximum5500
Zeros6
Zeros (%)0.1%
Negative0
Negative (%)0.0%
Memory size166.0 KiB
2023-12-11T06:43:21.200282image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile2600
Q12940
median3370
Q33800
95-th percentile4480
Maximum5500
Range5500
Interquartile range (IQR)860

Descriptive statistics

Standard deviation588.87055
Coefficient of variation (CV)0.17304038
Kurtosis0.11793259
Mean3403.0816
Median Absolute Deviation (MAD)430
Skewness0.30178456
Sum33615640
Variance346768.52
MonotonicityNot monotonic
2023-12-11T06:43:21.328217image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
3200 246
 
2.5%
4000 242
 
2.4%
3400 237
 
2.4%
3700 227
 
2.3%
2680 227
 
2.3%
3800 226
 
2.3%
2940 211
 
2.1%
3500 203
 
2.0%
3600 201
 
2.0%
2580 192
 
1.9%
Other values (293) 7666
76.7%
ValueCountFrequency (%)
0 6
0.1%
1220 1
 
< 0.1%
1230 1
 
< 0.1%
1570 2
 
< 0.1%
1690 3
< 0.1%
1780 1
 
< 0.1%
1830 1
 
< 0.1%
1930 1
 
< 0.1%
1960 1
 
< 0.1%
2080 1
 
< 0.1%
ValueCountFrequency (%)
5500 2
 
< 0.1%
5230 1
 
< 0.1%
5200 1
 
< 0.1%
5160 1
 
< 0.1%
5130 2
 
< 0.1%
5110 2
 
< 0.1%
5100 1
 
< 0.1%
5000 8
0.1%
4998 1
 
< 0.1%
4980 9
0.1%

Interactions

2023-12-11T06:43:17.631164image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-11T06:43:17.451759image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-11T06:43:17.714255image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-11T06:43:17.547156image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-11T06:43:21.417087image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
기준년도시군명지역교육청명지역명학교급명설립구분명제외여부제외사유학생1인당급식비 (1식 기준)(원)
기준년도1.0000.0000.0000.0000.0000.0000.0170.9750.440
시군명0.0001.0000.9921.0000.1260.2980.0950.9870.248
지역교육청명0.0000.9921.0000.9940.7580.9390.0710.9800.500
지역명0.0001.0000.9941.0000.2090.4000.1230.9890.265
학교급명0.0000.1260.7580.2091.0000.6150.6260.5000.612
설립구분명0.0000.2980.9390.4000.6151.0000.0171.0000.385
제외여부0.0170.0950.0710.1230.6260.0171.000NaNNaN
제외사유0.9750.9870.9800.9890.5001.000NaN1.000NaN
학생1인당급식비 (1식 기준)(원)0.4400.2480.5000.2650.6120.385NaNNaN1.000
2023-12-11T06:43:21.546203image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
제외여부설립구분명학교급명시군명지역명지역교육청명
제외여부1.0000.0280.4560.0810.0980.061
설립구분명0.0281.0000.3150.1560.2030.752
학교급명0.4560.3151.0000.0550.0850.455
시군명0.0810.1560.0551.0000.9990.859
지역명0.0980.2030.0850.9991.0000.859
지역교육청명0.0610.7520.4550.8590.8591.000
2023-12-11T06:43:21.642823image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
기준년도학생1인당급식비 (1식 기준)(원)시군명지역교육청명지역명학교급명설립구분명제외여부
기준년도1.0000.3890.0000.0000.0000.0000.0000.037
학생1인당급식비 (1식 기준)(원)0.3891.0000.0940.1900.0980.4120.1841.000
시군명0.0000.0941.0000.8590.9990.0550.1560.081
지역교육청명0.0000.1900.8591.0000.8590.4550.7520.061
지역명0.0000.0980.9990.8591.0000.0850.2030.098
학교급명0.0000.4120.0550.4550.0851.0000.3150.456
설립구분명0.0000.1840.1560.7520.2030.3151.0000.028
제외여부0.0371.0000.0810.0610.0980.4560.0281.000

Missing values

2023-12-11T06:43:17.857292image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-11T06:43:18.021179image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-11T06:43:18.428018image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

기준년도시군명지역교육청명지역명학교명학교급명설립구분명제외여부제외사유학생1인당급식비 (1식 기준)(원)
264742015화성시경기도화성오산교육지원청경기도 화성시화성동화중학교중학교공립N<NA>3250
12742020안산시경기도안산교육지원청경기도 안산시 단원구안산대월초등학교<NA>공립N<NA>3120
235192015수원시경기도수원교육지원청경기도 수원시 장안구효천초등학교<NA>공립N<NA>2550
259552015평택시경기도평택교육지원청경기도 평택시평택초등학교초등학교공립N<NA>2850
41442019성남시경기도성남교육지원청경기도 성남시 중원구금광중학교<NA>공립N<NA>4060
11202020시흥시경기도시흥교육지원청경기도 시흥시은빛초등학교<NA>공립N<NA>3120
105492018오산시경기도화성오산교육지원청경기도 오산시오산고현초등학교초등학교공립N<NA>2680
208562016이천시경기도교육청경기도 이천시다원학교특수학교공립Y2016년 개교로 인하여 자료가 없음<NA>
95002018수원시경기도수원교육지원청경기도 수원시 권선구상촌초등학교초등학교공립N<NA>3010
47312019시흥시경기도시흥교육지원청경기도 시흥시배곧한울초등학교<NA>공립N<NA>2940
기준년도시군명지역교육청명지역명학교명학교급명설립구분명제외여부제외사유학생1인당급식비 (1식 기준)(원)
246512015양주시경기도동두천양주교육지원청경기도 양주시은현초등학교초등학교공립N<NA>3050
233792015성남시경기도성남교육지원청경기도 성남시 수정구수진중학교중학교공립N<NA>3300
100482018안양시경기도안양과천교육지원청경기도 안양시 동안구대안여자중학교중학교공립N<NA>3720
207102016의정부시경기도의정부교육지원청경기도 의정부시금오중학교<NA>공립N<NA>3420
26252019고양시경기도교육청경기도 고양시 일산서구주엽고등학교<NA>공립N<NA>4500
222982015광주시경기도광주하남교육지원청경기도 광주시분원초등학교초등학교공립N<NA>1570
240702015안산시경기도안산교육지원청경기도 안산시 단원구화랑초등학교초등학교공립N<NA>2860
75842018고양시경기도고양교육지원청경기도 고양시 덕양구고양용현초등학교<NA>공립N<NA>3010
261922015하남시경기도교육청경기도 하남시한국애니메이션고등학교<NA>공립N<NA>2950
203402016용인시경기도용인교육지원청경기도 용인시 기흥구보라중학교<NA>공립N<NA>3320

Duplicate rows

Most frequently occurring

기준년도시군명지역교육청명지역명학교명학교급명설립구분명제외여부제외사유학생1인당급식비 (1식 기준)(원)# duplicates
02019가평군경기도가평교육지원청경기도 가평군미원초등학교<NA>공립N<NA>33202
12019가평군경기도가평교육지원청경기도 가평군미원초등학교위곡분교장<NA>공립N<NA>33202
22019가평군경기도가평교육지원청경기도 가평군상천초등학교<NA>공립N<NA>38202
32019가평군경기도가평교육지원청경기도 가평군율길초등학교<NA>공립N<NA>35702
42019가평군경기도가평교육지원청경기도 가평군청심국제중학교<NA>사립N<NA>43602
52019고양시경기도고양교육지원청경기도 고양시 덕양구가람중학교<NA>공립N<NA>42102
62019고양시경기도고양교육지원청경기도 고양시 덕양구가람초등학교<NA>공립N<NA>31202
72019고양시경기도고양교육지원청경기도 고양시 덕양구고양오금초등학교<NA>공립N<NA>33202
82019고양시경기도고양교육지원청경기도 고양시 덕양구도래울초등학교<NA>공립N<NA>29402
92019고양시경기도고양교육지원청경기도 고양시 덕양구성라초등학교<NA>공립N<NA>31202