"������������ ���������_���������������������������_20171019.csv"의 파일명이 "경상북도 상주시_상주박물관소장유물_20171019.csv"으로 변경 됨.

Overview

Dataset statistics

Number of variables11
Number of observations1040
Missing cells2526
Missing cells (%)22.1%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory91.5 KiB
Average record size in memory90.1 B

Variable types

Numeric2
Categorical9

Dataset

Description상주박물관에서 소장하고 있는 유물정보에 대한 데이터로 유물명, 주수량, 시대, 장르, 재질, 크기 등의 항목을 제공합니다. )
Author경상북도 상주시
URLhttps://www.data.go.kr/data/3049752/fileData.do

Alerts

데이터기준일 has constant value "2017-10-19" Constant
유물명 has a high cardinality: 650 distinct values High cardinality
크기 has a high cardinality: 970 distinct values High cardinality
유물설명 has a high cardinality: 244 distinct values High cardinality
시대 is highly correlated with 데이터기준일High correlation
장르 is highly correlated with 데이터기준일High correlation
데이터기준일 is highly correlated with 시대 and 4 other fieldsHigh correlation
재질 is highly correlated with 데이터기준일High correlation
문화재지정 is highly correlated with 데이터기준일High correlation
출토지/소장자 is highly correlated with 데이터기준일High correlation
출토지/소장자 has 921 (88.6%) missing values Missing
문화재지정 has 793 (76.2%) missing values Missing
유물설명 has 791 (76.1%) missing values Missing

Reproduction

Analysis started2022-07-24 07:48:17.221672
Analysis finished2022-07-24 07:48:20.086268
Duration2.86 seconds
Software versionpandas-profiling v3.2.0
Download configurationconfig.json

Variables

번호
Real number (ℝ≥0)

Distinct1038
Distinct (%)100.0%
Missing2
Missing (%)0.2%
Infinite0
Infinite (%)0.0%
Mean519.5
Minimum1
Maximum1038
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size9.3 KiB
2022-07-24T16:48:20.171804image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile52.85
Q1260.25
median519.5
Q3778.75
95-th percentile986.15
Maximum1038
Range1037
Interquartile range (IQR)518.5

Descriptive statistics

Standard deviation299.7890925
Coefficient of variation (CV)0.5770723629
Kurtosis-1.2
Mean519.5
Median Absolute Deviation (MAD)259.5
Skewness0
Sum539241
Variance89873.5
MonotonicityStrictly increasing
2022-07-24T16:48:20.358732image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
661
 
0.1%
161
 
0.1%
31
 
0.1%
41
 
0.1%
51
 
0.1%
61
 
0.1%
71
 
0.1%
81
 
0.1%
91
 
0.1%
101
 
0.1%
Other values (1028)1028
98.8%
(Missing)2
 
0.2%
ValueCountFrequency (%)
11
0.1%
21
0.1%
31
0.1%
41
0.1%
51
0.1%
61
0.1%
71
0.1%
81
0.1%
91
0.1%
101
0.1%
ValueCountFrequency (%)
10381
0.1%
10371
0.1%
10361
0.1%
10351
0.1%
10341
0.1%
10331
0.1%
10321
0.1%
10311
0.1%
10301
0.1%
10291
0.1%

유물명
Categorical

HIGH CARDINALITY

Distinct650
Distinct (%)62.6%
Missing2
Missing (%)0.2%
Memory size8.2 KiB
간찰
 
56
김영기 고신
 
31
교지
 
29
고신
 
17
조정록 준호구
 
14
Other values (645)
891 

Length

Max length33
Median length24
Mean length6.063583815
Min length1

Unique

Unique553 ?
Unique (%)53.3%

Sample

1st row휘찬려사 彙纂麗史 (1)~(23)
2nd row후집 後集 (1) ~(5)
3rd row효자공실록부양리 공문집 孝子公實錄附陽里 公文集 (1)~(2)
4th row함창향교교지 咸昌鄕校校誌
5th row학용요의변정록 學庸要義卞正錄

Common Values

ValueCountFrequency (%)
간찰56
 
5.4%
김영기 고신31
 
3.0%
교지29
 
2.8%
고신17
 
1.6%
조정록 준호구14
 
1.3%
류심춘 간찰14
 
1.3%
백자접시12
 
1.2%
김용관 고신10
 
1.0%
10
 
1.0%
분재기10
 
1.0%
Other values (640)835
80.3%

Length

2022-07-24T16:48:20.550264image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
간찰175
 
10.1%
고신77
 
4.4%
준호구71
 
4.1%
김영기34
 
2.0%
영남지도34
 
2.0%
교지29
 
1.7%
26
 
1.5%
지형도24
 
1.4%
시문집18
 
1.0%
1950년대16
 
0.9%
Other values (816)1236
71.0%

주수량
Real number (ℝ≥0)

Distinct20
Distinct (%)1.9%
Missing2
Missing (%)0.2%
Infinite0
Infinite (%)0.0%
Mean1.625240848
Minimum1
Maximum47
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size9.3 KiB
2022-07-24T16:48:20.798097image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile1
Q11
median1
Q31
95-th percentile4
Maximum47
Range46
Interquartile range (IQR)0

Descriptive statistics

Standard deviation2.899675553
Coefficient of variation (CV)1.784151289
Kurtosis109.2268509
Mean1.625240848
Median Absolute Deviation (MAD)0
Skewness8.999236682
Sum1687
Variance8.408118312
MonotonicityNot monotonic
2022-07-24T16:48:20.929385image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram with fixed size bins (bins=20)
ValueCountFrequency (%)
1899
86.4%
252
 
5.0%
325
 
2.4%
414
 
1.3%
514
 
1.3%
144
 
0.4%
74
 
0.4%
164
 
0.4%
124
 
0.4%
133
 
0.3%
Other values (10)15
 
1.4%
ValueCountFrequency (%)
1899
86.4%
252
 
5.0%
325
 
2.4%
414
 
1.3%
514
 
1.3%
63
 
0.3%
74
 
0.4%
82
 
0.2%
91
 
0.1%
102
 
0.2%
ValueCountFrequency (%)
471
 
0.1%
431
 
0.1%
251
 
0.1%
231
 
0.1%
171
 
0.1%
164
0.4%
152
0.2%
144
0.4%
133
0.3%
124
0.4%

시대
Categorical

HIGH CORRELATION

Distinct11
Distinct (%)1.1%
Missing3
Missing (%)0.3%
Memory size8.2 KiB
조선
659 
근/현대
200 
기타
93 
일제강점기
 
52
대한제국
 
9
Other values (6)
 
24

Length

Max length5
Median length2
Mean length2.572806172
Min length1

Unique

Unique2 ?
Unique (%)0.2%

Sample

1st row기타
2nd row기타
3rd row기타
4th row기타
5th row기타

Common Values

ValueCountFrequency (%)
조선659
63.4%
근/현대200
 
19.2%
기타93
 
8.9%
일제강점기52
 
5.0%
대한제국9
 
0.9%
광복이후8
 
0.8%
삼국6
 
0.6%
고려6
 
0.6%
통일신라2
 
0.2%
1
 
0.1%
(Missing)3
 
0.3%

Length

2022-07-24T16:48:21.084474image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
조선659
63.5%
근/현대200
 
19.3%
기타93
 
9.0%
일제강점기52
 
5.0%
대한제국9
 
0.9%
광복이후8
 
0.8%
삼국6
 
0.6%
고려6
 
0.6%
통일신라2
 
0.2%
1
 
0.1%

장르
Categorical

HIGH CORRELATION

Distinct8
Distinct (%)0.8%
Missing3
Missing (%)0.3%
Memory size8.2 KiB
고문서
551 
민속품
214 
고서
143 
서화
63 
공예
 
49
Other values (3)
 
17

Length

Max length3
Median length3
Mean length2.737704918
Min length2

Unique

Unique1 ?
Unique (%)0.1%

Sample

1st row고서
2nd row고서
3rd row고서
4th row고서
5th row고서

Common Values

ValueCountFrequency (%)
고문서551
53.0%
민속품214
 
20.6%
고서143
 
13.8%
서화63
 
6.1%
공예49
 
4.7%
기타13
 
1.2%
건축3
 
0.3%
조선1
 
0.1%
(Missing)3
 
0.3%

Length

2022-07-24T16:48:21.244028image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Category Frequency Plot

2022-07-24T16:48:21.400300image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
ValueCountFrequency (%)
고문서551
53.1%
민속품214
 
20.6%
고서143
 
13.8%
서화63
 
6.1%
공예49
 
4.7%
기타13
 
1.3%
건축3
 
0.3%
조선1
 
0.1%

재질
Categorical

HIGH CORRELATION

Distinct10
Distinct (%)1.0%
Missing3
Missing (%)0.3%
Memory size8.2 KiB
822 
금속
 
75
목재
 
60
도자기
 
44
사직
 
13
Other values (5)
 
23

Length

Max length3
Median length1
Mean length1.24975892
Min length1

Unique

Unique1 ?
Unique (%)0.1%

Sample

1st row
2nd row
3rd row
4th row
5th row

Common Values

ValueCountFrequency (%)
822
79.0%
금속75
 
7.2%
목재60
 
5.8%
도자기44
 
4.2%
사직13
 
1.2%
토제11
 
1.1%
기타6
 
0.6%
석재3
 
0.3%
유리2
 
0.2%
고서1
 
0.1%
(Missing)3
 
0.3%

Length

2022-07-24T16:48:21.556933image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Category Frequency Plot

2022-07-24T16:48:21.728856image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
ValueCountFrequency (%)
822
79.3%
금속75
 
7.2%
목재60
 
5.8%
도자기44
 
4.2%
사직13
 
1.3%
토제11
 
1.1%
기타6
 
0.6%
석재3
 
0.3%
유리2
 
0.2%
고서1
 
0.1%

크기
Categorical

HIGH CARDINALITY

Distinct970
Distinct (%)93.8%
Missing6
Missing (%)0.6%
Memory size8.2 KiB
14.1×9.1
 
7
78.5×98.5cm
 
7
56.1x46.8cm
 
6
32cm
 
3
30.0×20.0cm
 
3
Other values (965)
1008 

Length

Max length72
Median length11
Mean length11.84622824
Min length3

Unique

Unique928 ?
Unique (%)89.7%

Sample

1st row27.6×19.8cm
2nd row28.3×19.2cm
3rd row25.9×18.6cm
4th row26.5 × 19.0cm
5th row29.1 × 18.5cm

Common Values

ValueCountFrequency (%)
14.1×9.17
 
0.7%
78.5×98.5cm7
 
0.7%
56.1x46.8cm6
 
0.6%
32cm3
 
0.3%
30.0×20.0cm3
 
0.3%
9.4×15.0cm3
 
0.3%
32.5cm3
 
0.3%
78×98cm3
 
0.3%
12cm3
 
0.3%
10cm3
 
0.3%
Other values (960)993
95.5%
(Missing)6
 
0.6%

Length

2022-07-24T16:48:21.917067image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
×15
 
1.2%
높이14
 
1.1%
112
 
0.9%
길이8
 
0.6%
14.1×9.17
 
0.5%
27
 
0.5%
78.5×98.5cm7
 
0.5%
전체길이7
 
0.5%
56.1x46.8cm6
 
0.5%
지름6
 
0.5%
Other values (1106)1205
93.1%

출토지/소장자
Categorical

HIGH CORRELATION
MISSING

Distinct16
Distinct (%)13.4%
Missing921
Missing (%)88.6%
Memory size8.2 KiB
조용중 기증
68 
경북 상주시 모서면 호음리 일원
29 
이상무 기증
 
4
김행일 기증
 
4
정춘목 기증
 
2
Other values (11)
12 

Length

Max length17
Median length6
Mean length8.991596639
Min length6

Unique

Unique10 ?
Unique (%)8.4%

Sample

1st row조용중 기증
2nd row경북 상주시 모서면 호음리 일원
3rd row경북 상주시 모서면 호음리 일원
4th row조용중 기증
5th row조용중 기증

Common Values

ValueCountFrequency (%)
조용중 기증68
 
6.5%
경북 상주시 모서면 호음리 일원29
 
2.8%
이상무 기증4
 
0.4%
김행일 기증4
 
0.4%
정춘목 기증2
 
0.2%
경북 상주시 개운동 일원2
 
0.2%
권기순 기증1
 
0.1%
김주진 기증1
 
0.1%
김경락 기증1
 
0.1%
장무광 기증1
 
0.1%
Other values (6)6
 
0.6%
(Missing)921
88.6%

Length

2022-07-24T16:48:22.098272image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
기증86
25.7%
조용중68
20.4%
경북33
 
9.9%
상주시33
 
9.9%
일원33
 
9.9%
모서면29
 
8.7%
호음리29
 
8.7%
이상무4
 
1.2%
김행일4
 
1.2%
정춘목2
 
0.6%
Other values (12)13
 
3.9%

문화재지정
Categorical

HIGH CORRELATION
MISSING

Distinct3
Distinct (%)1.2%
Missing793
Missing (%)76.2%
Memory size8.2 KiB
X
179 
보물 1004호
61 
보물 1003호
 
7

Length

Max length8
Median length1
Mean length2.927125506
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st rowX
2nd rowX
3rd rowX
4th row보물 1003호
5th rowX

Common Values

ValueCountFrequency (%)
X179
 
17.2%
보물 1004호61
 
5.9%
보물 1003호7
 
0.7%
(Missing)793
76.2%

Length

2022-07-24T16:48:22.248203image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Category Frequency Plot

2022-07-24T16:48:22.389106image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
ValueCountFrequency (%)
x179
56.8%
보물68
 
21.6%
1004호61
 
19.4%
1003호7
 
2.2%

유물설명
Categorical

HIGH CARDINALITY
MISSING

Distinct244
Distinct (%)98.0%
Missing791
Missing (%)76.1%
Memory size8.2 KiB
바디집(틀)로 상태는 양호하다. 베틀의 한 부속인 바디의 테로 베를 짤 때 날실을 고르는 역할을 하는 바디의 양 옆을 막아 고정시키는 역할을 한다. 바디집은 바디의 위와 아래에 끼우는 두 짝의 나무테로 날 가운데에 홈에 바디를 끼우고 양쪽 마구리에는 나무나 쇠로 만들어진 비녀로 위짝과 아래짝을 연결하여 다시 굵은 노끈이나 천을 8자형으로 걸어 단단히 고정시켜 베틀에 장착한다.
 
3
仁祖가 趙基遠을 從4品 定略將軍行忠武衛副司果에 명하는 교지임, 조기원정략장군행충무위부사과교지(趙基遠定略將軍行忠武衛副司果敎旨)
 
2
仁祖가 趙基遠을 從6品 秉節校尉行忠武衛副司勇에 명하는 고신임, 조기원병절교위행충무위부사맹교첩(趙基遠秉節校尉行忠武衛副司猛敎牒)
 
2
仁祖가 趙基遠을 從3品 中訓大夫 司憲府監察직에 명하는 교지임, 조기원중훈대부행사헌부감찰교지(趙基遠中訓大夫行司憲府監察敎旨)
 
2
일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 동문의 실경모습으로 전체적으로 엽서의 보존상태는 양호?
 
1
Other values (239)
239 

Length

Max length631
Median length140
Mean length97.51004016
Min length7

Unique

Unique240 ?
Unique (%)96.4%

Sample

1st row일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주수비대의 실경모습으로 전체적으로 엽서의 보존상태는 양호?
2nd row일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성내 시가의 실경모습으로 전체적으로 엽서의 보존상태는 양호?
3rd row일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주구 재판소의 실경모습으로 전체적으로 엽서의 보존상태는 양호?
4th row일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 남문의 실경모습으로 전체적으로 엽서의 보존상태는 양호?
5th row일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 북문의 실경모습으로 전체적으로 엽서의 보존상태는 양호?

Common Values

ValueCountFrequency (%)
바디집(틀)로 상태는 양호하다. 베틀의 한 부속인 바디의 테로 베를 짤 때 날실을 고르는 역할을 하는 바디의 양 옆을 막아 고정시키는 역할을 한다. 바디집은 바디의 위와 아래에 끼우는 두 짝의 나무테로 날 가운데에 홈에 바디를 끼우고 양쪽 마구리에는 나무나 쇠로 만들어진 비녀로 위짝과 아래짝을 연결하여 다시 굵은 노끈이나 천을 8자형으로 걸어 단단히 고정시켜 베틀에 장착한다.3
 
0.3%
仁祖가 趙基遠을 從4品 定略將軍行忠武衛副司果에 명하는 교지임, 조기원정략장군행충무위부사과교지(趙基遠定略將軍行忠武衛副司果敎旨)2
 
0.2%
仁祖가 趙基遠을 從6品 秉節校尉行忠武衛副司勇에 명하는 고신임, 조기원병절교위행충무위부사맹교첩(趙基遠秉節校尉行忠武衛副司猛敎牒)2
 
0.2%
仁祖가 趙基遠을 從3品 中訓大夫 司憲府監察직에 명하는 교지임, 조기원중훈대부행사헌부감찰교지(趙基遠中訓大夫行司憲府監察敎旨)2
 
0.2%
일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 동문의 실경모습으로 전체적으로 엽서의 보존상태는 양호?1
 
0.1%
둥근 원형으로 된 비짐으로 상태는 가마에서 열로 인해 원형에서 조금 변한 것 외에는 양호하다. 이들 비짐들은 모래를 위주로 만들어졌는데, 위에 올려진 자기들의 유약이 흐러내려 겉표면이 딱딱하게 된 것으로 보인다.1
 
0.1%
비단 천 표지에 제책한 면 위에 금속류로 다시 제책하였다. 앞, 뒷면 모두양호하며 표지 포함 총28장이다. 첫 장은 책의 기록경위가 기록되어 있는데, 壬辰倭亂때 소실된 것을 萬曆34年(1606)에 중수한 것이라 전한다. 둘째장부터 상주목사 명록을 기록하고 있다.1
 
0.1%
필사본, 본문 첫장에 ‘豈謂吾生輩...’등으로 시작되며 4월14일부터 6월6일까지 52일의 記事가 기록됨.1
 
0.1%
전체적으로 엽서의 보존상태는 양호?1
 
0.1%
?일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 서문의 실경모습으로1
 
0.1%
Other values (234)234
 
22.5%
(Missing)791
76.1%

Length

2022-07-24T16:48:22.545056image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
있다170
 
3.1%
있으며108
 
2.0%
조금77
 
1.4%
상태는62
 
1.1%
있고49
 
0.9%
명하는45
 
0.8%
양호한45
 
0.8%
되어37
 
0.7%
부분에35
 
0.6%
접히는34
 
0.6%
Other values (2280)4845
88.0%

데이터기준일
Categorical

CONSTANT
HIGH CORRELATION
REJECTED

Distinct1
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size8.2 KiB
2017-10-19
1040 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2017-10-19
2nd row2017-10-19
3rd row2017-10-19
4th row2017-10-19
5th row2017-10-19

Common Values

ValueCountFrequency (%)
2017-10-191040
100.0%

Length

2022-07-24T16:48:22.707791image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Histogram of lengths of the category

Category Frequency Plot

2022-07-24T16:48:22.934605image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
ValueCountFrequency (%)
2017-10-191040
100.0%

Interactions

2022-07-24T16:48:18.330108image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-07-24T16:48:17.852259image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-07-24T16:48:18.567462image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
2022-07-24T16:48:18.093269image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Correlations

2022-07-24T16:48:23.016650image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Pearson's r

The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.

To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
2022-07-24T16:48:23.149227image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Spearman's ρ

The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.

To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
2022-07-24T16:48:23.282031image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Kendall's τ

Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.

To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.
2022-07-24T16:48:23.426753image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Phik (φk)

Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.
2022-07-24T16:48:23.601689image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/

Cramér's V (φc)

Cramér's V is an association measure for nominal random variables. The coefficient ranges from 0 to 1, with 0 indicating independence and 1 indicating perfect association. The empirical estimators used for Cramér's V have been proved to be biased, even for large samples. We use a bias-corrected measure that has been proposed by Bergsma in 2013 that can be found here.

Missing values

2022-07-24T16:48:18.950320image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
A simple visualization of nullity by column.
2022-07-24T16:48:19.448645image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2022-07-24T16:48:19.811561image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.
2022-07-24T16:48:19.993357image/svg+xmlMatplotlib v3.4.3, https://matplotlib.org/