Dataset statistics
Number of variables | 11 |
---|---|
Number of observations | 1040 |
Missing cells | 2526 |
Missing cells (%) | 22.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 91.5 KiB |
Average record size in memory | 90.1 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 9 |
Dataset
Description | 상주박물관에서 소장하고 있는 유물정보에 대한 데이터로 유물명, 주수량, 시대, 장르, 재질, 크기 등의 항목을 제공합니다. ) |
---|---|
Author | 경상북도 상주시 |
URL | https://www.data.go.kr/data/3049752/fileData.do |
데이터기준일 has constant value "2017-10-19" | Constant |
유물명 has a high cardinality: 650 distinct values | High cardinality |
크기 has a high cardinality: 970 distinct values | High cardinality |
유물설명 has a high cardinality: 244 distinct values | High cardinality |
시대 is highly correlated with 데이터기준일 | High correlation |
장르 is highly correlated with 데이터기준일 | High correlation |
데이터기준일 is highly correlated with 시대 and 4 other fields | High correlation |
재질 is highly correlated with 데이터기준일 | High correlation |
문화재지정 is highly correlated with 데이터기준일 | High correlation |
출토지/소장자 is highly correlated with 데이터기준일 | High correlation |
출토지/소장자 has 921 (88.6%) missing values | Missing |
문화재지정 has 793 (76.2%) missing values | Missing |
유물설명 has 791 (76.1%) missing values | Missing |
Reproduction
Analysis started | 2022-07-24 07:48:17.221672 |
---|---|
Analysis finished | 2022-07-24 07:48:20.086268 |
Duration | 2.86 seconds |
Software version | pandas-profiling v3.2.0 |
Download configuration | config.json |
번호
Real number (ℝ≥0)
Distinct | 1038 |
---|---|
Distinct (%) | 100.0% |
Missing | 2 |
Missing (%) | 0.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 519.5 |
Minimum | 1 |
---|---|
Maximum | 1038 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 52.85 |
Q1 | 260.25 |
median | 519.5 |
Q3 | 778.75 |
95-th percentile | 986.15 |
Maximum | 1038 |
Range | 1037 |
Interquartile range (IQR) | 518.5 |
Descriptive statistics
Standard deviation | 299.7890925 |
---|---|
Coefficient of variation (CV) | 0.5770723629 |
Kurtosis | -1.2 |
Mean | 519.5 |
Median Absolute Deviation (MAD) | 259.5 |
Skewness | 0 |
Sum | 539241 |
Variance | 89873.5 |
Monotonicity | Strictly increasing |
Histogram with fixed size bins (bins=50)
Value | Count | Frequency (%) |
66 | 1 | 0.1% |
16 | 1 | 0.1% |
3 | 1 | 0.1% |
4 | 1 | 0.1% |
5 | 1 | 0.1% |
6 | 1 | 0.1% |
7 | 1 | 0.1% |
8 | 1 | 0.1% |
9 | 1 | 0.1% |
10 | 1 | 0.1% |
Other values (1028) | 1028 | |
(Missing) | 2 | 0.2% |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
1038 | 1 | |
1037 | 1 | |
1036 | 1 | |
1035 | 1 | |
1034 | 1 | |
1033 | 1 | |
1032 | 1 | |
1031 | 1 | |
1030 | 1 | |
1029 | 1 |
Distinct | 650 |
---|---|
Distinct (%) | 62.6% |
Missing | 2 |
Missing (%) | 0.2% |
Memory size | 8.2 KiB |
간찰 | 56 |
---|---|
김영기 고신 | 31 |
교지 | 29 |
고신 | 17 |
조정록 준호구 | 14 |
Other values (645) |
Length
Max length | 33 |
---|---|
Median length | 24 |
Mean length | 6.063583815 |
Min length | 1 |
Unique
Unique | 553 ? |
---|---|
Unique (%) | 53.3% |
Sample
1st row | 휘찬려사 彙纂麗史 (1)~(23) |
---|---|
2nd row | 후집 後集 (1) ~(5) |
3rd row | 효자공실록부양리 공문집 孝子公實錄附陽里 公文集 (1)~(2) |
4th row | 함창향교교지 咸昌鄕校校誌 |
5th row | 학용요의변정록 學庸要義卞正錄 |
Common Values
Value | Count | Frequency (%) |
간찰 | 56 | 5.4% |
김영기 고신 | 31 | 3.0% |
교지 | 29 | 2.8% |
고신 | 17 | 1.6% |
조정록 준호구 | 14 | 1.3% |
류심춘 간찰 | 14 | 1.3% |
백자접시 | 12 | 1.2% |
김용관 고신 | 10 | 1.0% |
문 | 10 | 1.0% |
분재기 | 10 | 1.0% |
Other values (640) | 835 |
Length
Histogram of lengths of the category
Value | Count | Frequency (%) |
간찰 | 175 | 10.1% |
고신 | 77 | 4.4% |
준호구 | 71 | 4.1% |
김영기 | 34 | 2.0% |
영남지도 | 34 | 2.0% |
교지 | 29 | 1.7% |
26 | 1.5% | |
지형도 | 24 | 1.4% |
시문집 | 18 | 1.0% |
1950년대 | 16 | 0.9% |
Other values (816) | 1236 |
주수량
Real number (ℝ≥0)
Distinct | 20 |
---|---|
Distinct (%) | 1.9% |
Missing | 2 |
Missing (%) | 0.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.625240848 |
Minimum | 1 |
---|---|
Maximum | 47 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 4 |
Maximum | 47 |
Range | 46 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 2.899675553 |
---|---|
Coefficient of variation (CV) | 1.784151289 |
Kurtosis | 109.2268509 |
Mean | 1.625240848 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 8.999236682 |
Sum | 1687 |
Variance | 8.408118312 |
Monotonicity | Not monotonic |
Histogram with fixed size bins (bins=20)
Value | Count | Frequency (%) |
1 | 899 | |
2 | 52 | 5.0% |
3 | 25 | 2.4% |
4 | 14 | 1.3% |
5 | 14 | 1.3% |
14 | 4 | 0.4% |
7 | 4 | 0.4% |
16 | 4 | 0.4% |
12 | 4 | 0.4% |
13 | 3 | 0.3% |
Other values (10) | 15 | 1.4% |
Value | Count | Frequency (%) |
1 | 899 | |
2 | 52 | 5.0% |
3 | 25 | 2.4% |
4 | 14 | 1.3% |
5 | 14 | 1.3% |
6 | 3 | 0.3% |
7 | 4 | 0.4% |
8 | 2 | 0.2% |
9 | 1 | 0.1% |
10 | 2 | 0.2% |
Value | Count | Frequency (%) |
47 | 1 | 0.1% |
43 | 1 | 0.1% |
25 | 1 | 0.1% |
23 | 1 | 0.1% |
17 | 1 | 0.1% |
16 | 4 | |
15 | 2 | |
14 | 4 | |
13 | 3 | |
12 | 4 |
Distinct | 11 |
---|---|
Distinct (%) | 1.1% |
Missing | 3 |
Missing (%) | 0.3% |
Memory size | 8.2 KiB |
조선 | |
---|---|
근/현대 | |
기타 | |
일제강점기 | 52 |
대한제국 | 9 |
Other values (6) | 24 |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.572806172 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 기타 |
---|---|
2nd row | 기타 |
3rd row | 기타 |
4th row | 기타 |
5th row | 기타 |
Common Values
Value | Count | Frequency (%) |
조선 | 659 | |
근/현대 | 200 | 19.2% |
기타 | 93 | 8.9% |
일제강점기 | 52 | 5.0% |
대한제국 | 9 | 0.9% |
광복이후 | 8 | 0.8% |
삼국 | 6 | 0.6% |
고려 | 6 | 0.6% |
통일신라 | 2 | 0.2% |
지 | 1 | 0.1% |
(Missing) | 3 | 0.3% |
Length
Histogram of lengths of the category
Value | Count | Frequency (%) |
조선 | 659 | |
근/현대 | 200 | 19.3% |
기타 | 93 | 9.0% |
일제강점기 | 52 | 5.0% |
대한제국 | 9 | 0.9% |
광복이후 | 8 | 0.8% |
삼국 | 6 | 0.6% |
고려 | 6 | 0.6% |
통일신라 | 2 | 0.2% |
지 | 1 | 0.1% |
Distinct | 8 |
---|---|
Distinct (%) | 0.8% |
Missing | 3 |
Missing (%) | 0.3% |
Memory size | 8.2 KiB |
고문서 | |
---|---|
민속품 | |
고서 | |
서화 | |
공예 | 49 |
Other values (3) | 17 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.737704918 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 고서 |
---|---|
2nd row | 고서 |
3rd row | 고서 |
4th row | 고서 |
5th row | 고서 |
Common Values
Value | Count | Frequency (%) |
고문서 | 551 | |
민속품 | 214 | 20.6% |
고서 | 143 | 13.8% |
서화 | 63 | 6.1% |
공예 | 49 | 4.7% |
기타 | 13 | 1.2% |
건축 | 3 | 0.3% |
조선 | 1 | 0.1% |
(Missing) | 3 | 0.3% |
Length
Histogram of lengths of the category
Category Frequency Plot
Value | Count | Frequency (%) |
고문서 | 551 | |
민속품 | 214 | 20.6% |
고서 | 143 | 13.8% |
서화 | 63 | 6.1% |
공예 | 49 | 4.7% |
기타 | 13 | 1.3% |
건축 | 3 | 0.3% |
조선 | 1 | 0.1% |
Distinct | 10 |
---|---|
Distinct (%) | 1.0% |
Missing | 3 |
Missing (%) | 0.3% |
Memory size | 8.2 KiB |
지 | |
---|---|
금속 | 75 |
목재 | 60 |
도자기 | 44 |
사직 | 13 |
Other values (5) | 23 |
Length
Max length | 3 |
---|---|
Median length | 1 |
Mean length | 1.24975892 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 지 |
---|---|
2nd row | 지 |
3rd row | 지 |
4th row | 지 |
5th row | 지 |
Common Values
Value | Count | Frequency (%) |
지 | 822 | |
금속 | 75 | 7.2% |
목재 | 60 | 5.8% |
도자기 | 44 | 4.2% |
사직 | 13 | 1.2% |
토제 | 11 | 1.1% |
기타 | 6 | 0.6% |
석재 | 3 | 0.3% |
유리 | 2 | 0.2% |
고서 | 1 | 0.1% |
(Missing) | 3 | 0.3% |
Length
Histogram of lengths of the category
Category Frequency Plot
Value | Count | Frequency (%) |
지 | 822 | |
금속 | 75 | 7.2% |
목재 | 60 | 5.8% |
도자기 | 44 | 4.2% |
사직 | 13 | 1.3% |
토제 | 11 | 1.1% |
기타 | 6 | 0.6% |
석재 | 3 | 0.3% |
유리 | 2 | 0.2% |
고서 | 1 | 0.1% |
Distinct | 970 |
---|---|
Distinct (%) | 93.8% |
Missing | 6 |
Missing (%) | 0.6% |
Memory size | 8.2 KiB |
14.1×9.1 | 7 |
---|---|
78.5×98.5cm | 7 |
56.1x46.8cm | 6 |
32cm | 3 |
30.0×20.0cm | 3 |
Other values (965) |
Length
Max length | 72 |
---|---|
Median length | 11 |
Mean length | 11.84622824 |
Min length | 3 |
Unique
Unique | 928 ? |
---|---|
Unique (%) | 89.7% |
Sample
1st row | 27.6×19.8cm |
---|---|
2nd row | 28.3×19.2cm |
3rd row | 25.9×18.6cm |
4th row | 26.5 × 19.0cm |
5th row | 29.1 × 18.5cm |
Common Values
Value | Count | Frequency (%) |
14.1×9.1 | 7 | 0.7% |
78.5×98.5cm | 7 | 0.7% |
56.1x46.8cm | 6 | 0.6% |
32cm | 3 | 0.3% |
30.0×20.0cm | 3 | 0.3% |
9.4×15.0cm | 3 | 0.3% |
32.5cm | 3 | 0.3% |
78×98cm | 3 | 0.3% |
12cm | 3 | 0.3% |
10cm | 3 | 0.3% |
Other values (960) | 993 | |
(Missing) | 6 | 0.6% |
Length
Histogram of lengths of the category
Value | Count | Frequency (%) |
× | 15 | 1.2% |
높이 | 14 | 1.1% |
1 | 12 | 0.9% |
길이 | 8 | 0.6% |
14.1×9.1 | 7 | 0.5% |
2 | 7 | 0.5% |
78.5×98.5cm | 7 | 0.5% |
전체길이 | 7 | 0.5% |
56.1x46.8cm | 6 | 0.5% |
지름 | 6 | 0.5% |
Other values (1106) | 1205 |
Distinct | 16 |
---|---|
Distinct (%) | 13.4% |
Missing | 921 |
Missing (%) | 88.6% |
Memory size | 8.2 KiB |
조용중 기증 | |
---|---|
경북 상주시 모서면 호음리 일원 | |
이상무 기증 | 4 |
김행일 기증 | 4 |
정춘목 기증 | 2 |
Other values (11) |
Length
Max length | 17 |
---|---|
Median length | 6 |
Mean length | 8.991596639 |
Min length | 6 |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 8.4% |
Sample
1st row | 조용중 기증 |
---|---|
2nd row | 경북 상주시 모서면 호음리 일원 |
3rd row | 경북 상주시 모서면 호음리 일원 |
4th row | 조용중 기증 |
5th row | 조용중 기증 |
Common Values
Value | Count | Frequency (%) |
조용중 기증 | 68 | 6.5% |
경북 상주시 모서면 호음리 일원 | 29 | 2.8% |
이상무 기증 | 4 | 0.4% |
김행일 기증 | 4 | 0.4% |
정춘목 기증 | 2 | 0.2% |
경북 상주시 개운동 일원 | 2 | 0.2% |
권기순 기증 | 1 | 0.1% |
김주진 기증 | 1 | 0.1% |
김경락 기증 | 1 | 0.1% |
장무광 기증 | 1 | 0.1% |
Other values (6) | 6 | 0.6% |
(Missing) | 921 |
Length
Histogram of lengths of the category
Value | Count | Frequency (%) |
기증 | 86 | |
조용중 | 68 | |
경북 | 33 | 9.9% |
상주시 | 33 | 9.9% |
일원 | 33 | 9.9% |
모서면 | 29 | 8.7% |
호음리 | 29 | 8.7% |
이상무 | 4 | 1.2% |
김행일 | 4 | 1.2% |
정춘목 | 2 | 0.6% |
Other values (12) | 13 | 3.9% |
Distinct | 3 |
---|---|
Distinct (%) | 1.2% |
Missing | 793 |
Missing (%) | 76.2% |
Memory size | 8.2 KiB |
X | |
---|---|
보물 1004호 | |
보물 1003호 | 7 |
Length
Max length | 8 |
---|---|
Median length | 1 |
Mean length | 2.927125506 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | X |
---|---|
2nd row | X |
3rd row | X |
4th row | 보물 1003호 |
5th row | X |
Common Values
Value | Count | Frequency (%) |
X | 179 | 17.2% |
보물 1004호 | 61 | 5.9% |
보물 1003호 | 7 | 0.7% |
(Missing) | 793 |
Length
Histogram of lengths of the category
Category Frequency Plot
Value | Count | Frequency (%) |
x | 179 | |
보물 | 68 | 21.6% |
1004호 | 61 | 19.4% |
1003호 | 7 | 2.2% |
Distinct | 244 |
---|---|
Distinct (%) | 98.0% |
Missing | 791 |
Missing (%) | 76.1% |
Memory size | 8.2 KiB |
바디집(틀)로 상태는 양호하다. 베틀의 한 부속인 바디의 테로 베를 짤 때 날실을 고르는 역할을 하는 바디의 양 옆을 막아 고정시키는 역할을 한다. 바디집은 바디의 위와 아래에 끼우는 두 짝의 나무테로 날 가운데에 홈에 바디를 끼우고 양쪽 마구리에는 나무나 쇠로 만들어진 비녀로 위짝과 아래짝을 연결하여 다시 굵은 노끈이나 천을 8자형으로 걸어 단단히 고정시켜 베틀에 장착한다. | 3 |
---|---|
仁祖가 趙基遠을 從4品 定略將軍行忠武衛副司果에 명하는 교지임, 조기원정략장군행충무위부사과교지(趙基遠定略將軍行忠武衛副司果敎旨) | 2 |
仁祖가 趙基遠을 從6品 秉節校尉行忠武衛副司勇에 명하는 고신임, 조기원병절교위행충무위부사맹교첩(趙基遠秉節校尉行忠武衛副司猛敎牒) | 2 |
仁祖가 趙基遠을 從3品 中訓大夫 司憲府監察직에 명하는 교지임, 조기원중훈대부행사헌부감찰교지(趙基遠中訓大夫行司憲府監察敎旨) | 2 |
일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 동문의 실경모습으로 전체적으로 엽서의 보존상태는 양호? | 1 |
Other values (239) |
Length
Max length | 631 |
---|---|
Median length | 140 |
Mean length | 97.51004016 |
Min length | 7 |
Unique
Unique | 240 ? |
---|---|
Unique (%) | 96.4% |
Sample
1st row | 일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주수비대의 실경모습으로 전체적으로 엽서의 보존상태는 양호? |
---|---|
2nd row | 일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성내 시가의 실경모습으로 전체적으로 엽서의 보존상태는 양호? |
3rd row | 일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주구 재판소의 실경모습으로 전체적으로 엽서의 보존상태는 양호? |
4th row | 일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 남문의 실경모습으로 전체적으로 엽서의 보존상태는 양호? |
5th row | 일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 북문의 실경모습으로 전체적으로 엽서의 보존상태는 양호? |
Common Values
Value | Count | Frequency (%) |
바디집(틀)로 상태는 양호하다. 베틀의 한 부속인 바디의 테로 베를 짤 때 날실을 고르는 역할을 하는 바디의 양 옆을 막아 고정시키는 역할을 한다. 바디집은 바디의 위와 아래에 끼우는 두 짝의 나무테로 날 가운데에 홈에 바디를 끼우고 양쪽 마구리에는 나무나 쇠로 만들어진 비녀로 위짝과 아래짝을 연결하여 다시 굵은 노끈이나 천을 8자형으로 걸어 단단히 고정시켜 베틀에 장착한다. | 3 | 0.3% |
仁祖가 趙基遠을 從4品 定略將軍行忠武衛副司果에 명하는 교지임, 조기원정략장군행충무위부사과교지(趙基遠定略將軍行忠武衛副司果敎旨) | 2 | 0.2% |
仁祖가 趙基遠을 從6品 秉節校尉行忠武衛副司勇에 명하는 고신임, 조기원병절교위행충무위부사맹교첩(趙基遠秉節校尉行忠武衛副司猛敎牒) | 2 | 0.2% |
仁祖가 趙基遠을 從3品 中訓大夫 司憲府監察직에 명하는 교지임, 조기원중훈대부행사헌부감찰교지(趙基遠中訓大夫行司憲府監察敎旨) | 2 | 0.2% |
일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 동문의 실경모습으로 전체적으로 엽서의 보존상태는 양호? | 1 | 0.1% |
둥근 원형으로 된 비짐으로 상태는 가마에서 열로 인해 원형에서 조금 변한 것 외에는 양호하다. 이들 비짐들은 모래를 위주로 만들어졌는데, 위에 올려진 자기들의 유약이 흐러내려 겉표면이 딱딱하게 된 것으로 보인다. | 1 | 0.1% |
비단 천 표지에 제책한 면 위에 금속류로 다시 제책하였다. 앞, 뒷면 모두양호하며 표지 포함 총28장이다. 첫 장은 책의 기록경위가 기록되어 있는데, 壬辰倭亂때 소실된 것을 萬曆34年(1606)에 중수한 것이라 전한다. 둘째장부터 상주목사 명록을 기록하고 있다. | 1 | 0.1% |
필사본, 본문 첫장에 ‘豈謂吾生輩...’등으로 시작되며 4월14일부터 6월6일까지 52일의 記事가 기록됨. | 1 | 0.1% |
전체적으로 엽서의 보존상태는 양호? | 1 | 0.1% |
?일제강점기에 엄선하여 제작한 회엽서로 당시의 경상북도 상주성 서문의 실경모습으로 | 1 | 0.1% |
Other values (234) | 234 | 22.5% |
(Missing) | 791 |
Length
Histogram of lengths of the category
Value | Count | Frequency (%) |
있다 | 170 | 3.1% |
있으며 | 108 | 2.0% |
조금 | 77 | 1.4% |
상태는 | 62 | 1.1% |
있고 | 49 | 0.9% |
명하는 | 45 | 0.8% |
양호한 | 45 | 0.8% |
되어 | 37 | 0.7% |
부분에 | 35 | 0.6% |
접히는 | 34 | 0.6% |
Other values (2280) | 4845 |
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.2 KiB |
2017-10-19 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2017-10-19 |
---|---|
2nd row | 2017-10-19 |
3rd row | 2017-10-19 |
4th row | 2017-10-19 |
5th row | 2017-10-19 |
Common Values
Value | Count | Frequency (%) |
2017-10-19 | 1040 |
Length
Histogram of lengths of the category
Category Frequency Plot
Value | Count | Frequency (%) |
2017-10-19 | 1040 |
Pearson's r
The Pearson's correlation coefficient (r) is a measure of linear correlation between two variables. It's value lies between -1 and +1, -1 indicating total negative linear correlation, 0 indicating no linear correlation and 1 indicating total positive linear correlation. Furthermore, r is invariant under separate changes in location and scale of the two variables, implying that for a linear function the angle to the x-axis does not affect r.To calculate r for two variables X and Y, one divides the covariance of X and Y by the product of their standard deviations.
Spearman's ρ
The Spearman's rank correlation coefficient (ρ) is a measure of monotonic correlation between two variables, and is therefore better in catching nonlinear monotonic correlations than Pearson's r. It's value lies between -1 and +1, -1 indicating total negative monotonic correlation, 0 indicating no monotonic correlation and 1 indicating total positive monotonic correlation.To calculate ρ for two variables X and Y, one divides the covariance of the rank variables of X and Y by the product of their standard deviations.
Kendall's τ
Similarly to Spearman's rank correlation coefficient, the Kendall rank correlation coefficient (τ) measures ordinal association between two variables. It's value lies between -1 and +1, -1 indicating total negative correlation, 0 indicating no correlation and 1 indicating total positive correlation.To calculate τ for two variables X and Y, one determines the number of concordant and discordant pairs of observations. τ is given by the number of concordant pairs minus the discordant pairs divided by the total number of pairs.
Phik (φk)
Phik (φk) is a new and practical correlation coefficient that works consistently between categorical, ordinal and interval variables, captures non-linear dependency and reverts to the Pearson correlation coefficient in case of a bivariate normal input distribution. There is extensive documentation available here.Cramér's V (φc)
Cramér's V is an association measure for nominal random variables. The coefficient ranges from 0 to 1, with 0 indicating independence and 1 indicating perfect association. The empirical estimators used for Cramér's V have been proved to be biased, even for large samples. We use a bias-corrected measure that has been proposed by Bergsma in 2013 that can be found here. A simple visualization of nullity by column.
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.