Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 8316 |
Missing cells | 3 |
Missing cells (%) | < 0.1% |
Duplicate rows | 1968 |
Duplicate rows (%) | 23.7% |
Total size in memory | 479.3 KiB |
Average record size in memory | 59.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 5 |
Dataset
Description | 보건 복지부에서 조혈모 세포 기증 현황에 대해서 (남,녀 성별, 연령, 시도, 기증 년 월, 구분) 정보를 제공합니다. |
---|---|
Author | 보건복지부 |
URL | https://www.data.go.kr/data/15075226/fileData.do |
건수 has constant value "" | Constant |
Dataset has 1968 (23.7%) duplicate rows | Duplicates |
기증연 is highly overall correlated with 장기 | High correlation |
장기 is highly overall correlated with 기증연 | High correlation |
장기 is highly imbalanced (86.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-23 07:57:52.144040 |
---|---|
Analysis finished | 2023-12-23 07:58:00.781023 |
Duration | 8.64 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기증연
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2020.3011 |
Minimum | 2017 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 73.2 KiB |
Quantile statistics
Minimum | 2017 |
---|---|
5-th percentile | 2018 |
Q1 | 2019 |
median | 2020 |
Q3 | 2021 |
95-th percentile | 2022 |
Maximum | 2022 |
Range | 5 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.2727794 |
---|---|
Coefficient of variation (CV) | 0.00062999492 |
Kurtosis | -0.91136347 |
Mean | 2020.3011 |
Median Absolute Deviation (MAD) | 1 |
Skewness | -0.24659832 |
Sum | 16800824 |
Variance | 1.6199675 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2021 | 2062 | |
2020 | 2004 | |
2022 | 1824 | |
2019 | 1696 | |
2018 | 680 | 8.2% |
2017 | 50 | 0.6% |
Value | Count | Frequency (%) |
2017 | 50 | 0.6% |
2018 | 680 | 8.2% |
2019 | 1696 | |
2020 | 2004 | |
2021 | 2062 | |
2022 | 1824 |
Value | Count | Frequency (%) |
2022 | 1824 | |
2021 | 2062 | |
2020 | 2004 | |
2019 | 1696 | |
2018 | 680 | 8.2% |
2017 | 50 | 0.6% |
장기
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.1 KiB |
말초혈 | |
---|---|
골수 | 161 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.9806397 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 말초혈 |
---|---|
2nd row | 말초혈 |
3rd row | 말초혈 |
4th row | 말초혈 |
5th row | 말초혈 |
Common Values
Value | Count | Frequency (%) |
말초혈 | 8155 | |
골수 | 161 | 1.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
말초혈 | 8155 | |
골수 | 161 | 1.9% |
시도
Categorical
Distinct | 13 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.1 KiB |
서울 | |
---|---|
경기 | |
부산 | |
대구 | 429 |
대전 | 351 |
Other values (8) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0084175 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울 |
---|---|
2nd row | 서울 |
3rd row | 서울 |
4th row | 서울 |
5th row | 서울 |
Common Values
Value | Count | Frequency (%) |
서울 | 4900 | |
경기 | 1063 | 12.8% |
부산 | 566 | 6.8% |
대구 | 429 | 5.2% |
대전 | 351 | 4.2% |
인천 | 233 | 2.8% |
전남 | 221 | 2.7% |
경남 | 150 | 1.8% |
울산 | 147 | 1.8% |
전북 | 139 | 1.7% |
Other values (3) | 117 | 1.4% |
Length
Value | Count | Frequency (%) |
서울 | 4900 | |
경기 | 1063 | 12.8% |
부산 | 566 | 6.8% |
대구 | 429 | 5.2% |
대전 | 351 | 4.2% |
인천 | 233 | 2.8% |
전남 | 221 | 2.7% |
경남 | 150 | 1.8% |
울산 | 147 | 1.8% |
전북 | 139 | 1.7% |
Other values (3) | 117 | 1.4% |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.1 KiB |
남자 | |
---|---|
여자 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여자 |
---|---|
2nd row | 남자 |
3rd row | 남자 |
4th row | 남자 |
5th row | 남자 |
Common Values
Value | Count | Frequency (%) |
남자 | 5466 | |
여자 | 2850 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남자 | 5466 | |
여자 | 2850 |
연령
Real number (ℝ)
Distinct | 76 |
---|---|
Distinct (%) | 0.9% |
Missing | 3 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 34.334657 |
Minimum | 0 |
---|---|
Maximum | 79 |
Zeros | 1 |
Zeros (%) | < 0.1% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 73.2 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 19 |
Q1 | 26 |
median | 32 |
Q3 | 42 |
95-th percentile | 57 |
Maximum | 79 |
Range | 79 |
Interquartile range (IQR) | 16 |
Descriptive statistics
Standard deviation | 11.92171 |
---|---|
Coefficient of variation (CV) | 0.34722088 |
Kurtosis | -0.0070940693 |
Mean | 34.334657 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0.5167843 |
Sum | 285424 |
Variance | 142.12716 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
28 | 383 | 4.6% |
27 | 372 | 4.5% |
24 | 354 | 4.3% |
29 | 333 | 4.0% |
26 | 330 | 4.0% |
25 | 318 | 3.8% |
23 | 301 | 3.6% |
30 | 299 | 3.6% |
33 | 291 | 3.5% |
38 | 256 | 3.1% |
Other values (66) | 5076 |
Value | Count | Frequency (%) |
0 | 1 | < 0.1% |
1 | 4 | < 0.1% |
2 | 9 | |
3 | 9 | |
4 | 9 | |
5 | 9 | |
6 | 9 | |
7 | 16 | |
8 | 13 | |
9 | 13 |
Value | Count | Frequency (%) |
79 | 1 | < 0.1% |
74 | 1 | < 0.1% |
73 | 4 | < 0.1% |
72 | 4 | < 0.1% |
71 | 3 | < 0.1% |
70 | 3 | < 0.1% |
69 | 3 | < 0.1% |
68 | 5 | 0.1% |
67 | 15 | |
66 | 18 |
혈액형
Categorical
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.1 KiB |
A | |
---|---|
O | |
B | |
AB |
Length
Max length | 2 |
---|---|
Median length | 1 |
Mean length | 1.1041366 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | A |
---|---|
2nd row | A |
3rd row | A |
4th row | B |
5th row | B |
Common Values
Value | Count | Frequency (%) |
A | 2940 | |
O | 2321 | |
B | 2189 | |
AB | 866 | 10.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
a | 2940 | |
o | 2321 | |
b | 2189 | |
ab | 866 | 10.4% |
건수
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 65.1 KiB |
1 |
---|
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 8316 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 8316 |
기증연 | 장기 | 시도 | 성별 | 연령 | 혈액형 | |
---|---|---|---|---|---|---|
기증연 | 1.000 | 0.094 | 0.106 | 0.040 | 0.087 | 0.000 |
장기 | 0.094 | 1.000 | 0.096 | 0.028 | 0.408 | 0.000 |
시도 | 0.106 | 0.096 | 1.000 | 0.089 | 0.117 | 0.062 |
성별 | 0.040 | 0.028 | 0.089 | 1.000 | 0.154 | 0.000 |
연령 | 0.087 | 0.408 | 0.117 | 0.154 | 1.000 | 0.020 |
혈액형 | 0.000 | 0.000 | 0.062 | 0.000 | 0.020 | 1.000 |
장기 | 시도 | 성별 | 혈액형 | |
---|---|---|---|---|
장기 | 1.000 | 0.075 | 0.018 | 0.000 |
시도 | 0.075 | 1.000 | 0.069 | 0.029 |
성별 | 0.018 | 0.069 | 1.000 | 0.000 |
혈액형 | 0.000 | 0.029 | 0.000 | 1.000 |
기증연 | 연령 | 장기 | 시도 | 성별 | 혈액형 | |
---|---|---|---|---|---|---|
기증연 | 1.000 | 0.014 | 0.517 | 0.052 | 0.048 | 0.000 |
연령 | 0.014 | 1.000 | 0.313 | 0.049 | 0.118 | 0.012 |
장기 | 0.517 | 0.313 | 1.000 | 0.075 | 0.018 | 0.000 |
시도 | 0.052 | 0.049 | 0.075 | 1.000 | 0.069 | 0.029 |
성별 | 0.048 | 0.118 | 0.018 | 0.069 | 1.000 | 0.000 |
혈액형 | 0.000 | 0.012 | 0.000 | 0.029 | 0.000 | 1.000 |
기증연 | 장기 | 시도 | 성별 | 연령 | 혈액형 | 건수 | |
---|---|---|---|---|---|---|---|
0 | 2018 | 말초혈 | 서울 | 여자 | 22 | A | 1 |
1 | 2018 | 말초혈 | 서울 | 남자 | 39 | A | 1 |
2 | 2018 | 말초혈 | 서울 | 남자 | 27 | A | 1 |
3 | 2018 | 말초혈 | 서울 | 남자 | 41 | B | 1 |
4 | 2018 | 말초혈 | 서울 | 남자 | 41 | B | 1 |
5 | 2018 | 말초혈 | 서울 | 남자 | 36 | A | 1 |
6 | 2018 | 말초혈 | 서울 | 남자 | 49 | B | 1 |
7 | 2018 | 말초혈 | 서울 | 여자 | 2 | B | 1 |
8 | 2018 | 말초혈 | 서울 | 여자 | 21 | B | 1 |
9 | 2018 | 말초혈 | 서울 | 여자 | 55 | AB | 1 |
기증연 | 장기 | 시도 | 성별 | 연령 | 혈액형 | 건수 | |
---|---|---|---|---|---|---|---|
8306 | 2017 | 골수 | <NA> | 남자 | 34 | O | 1 |
8307 | 2022 | 골수 | <NA> | 남자 | 30 | A | 1 |
8308 | 2019 | 골수 | <NA> | 여자 | 34 | A | 1 |
8309 | 2019 | 골수 | <NA> | 남자 | 36 | A | 1 |
8310 | 2018 | 말초혈 | <NA> | 남자 | 21 | A | 1 |
8311 | 2018 | 말초혈 | <NA> | 여자 | 25 | A | 1 |
8312 | 2019 | 골수 | <NA> | 여자 | 20 | B | 1 |
8313 | 2019 | 말초혈 | <NA> | 남자 | 40 | O | 1 |
8314 | 2021 | 말초혈 | <NA> | 여자 | 29 | O | 1 |
8315 | 2020 | 말초혈 | <NA> | 남자 | 42 | AB | 1 |
Most frequently occurring
기증연 | 장기 | 시도 | 성별 | 연령 | 혈액형 | 건수 | # duplicates | |
---|---|---|---|---|---|---|---|---|
779 | 2020 | 말초혈 | 서울 | 남자 | 27 | A | 1 | 21 |
1265 | 2021 | 말초혈 | 서울 | 남자 | 28 | A | 1 | 20 |
1272 | 2021 | 말초혈 | 서울 | 남자 | 29 | O | 1 | 18 |
350 | 2019 | 말초혈 | 서울 | 남자 | 33 | A | 1 | 16 |
1253 | 2021 | 말초혈 | 서울 | 남자 | 25 | A | 1 | 16 |
1269 | 2021 | 말초혈 | 서울 | 남자 | 29 | A | 1 | 16 |
786 | 2020 | 말초혈 | 서울 | 남자 | 28 | O | 1 | 15 |
808 | 2020 | 말초혈 | 서울 | 남자 | 35 | A | 1 | 15 |
1267 | 2021 | 말초혈 | 서울 | 남자 | 28 | B | 1 | 15 |
1699 | 2022 | 말초혈 | 서울 | 남자 | 24 | O | 1 | 15 |