Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 1141 |
Missing cells | 1141 |
Missing cells (%) | 20.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 48.0 KiB |
Average record size in memory | 43.1 B |
Variable types
Text | 2 |
---|---|
Numeric | 2 |
Unsupported | 1 |
Dataset
Description | 한국보훈복지의료공단 대구보훈병원에서 퇴원한 환자의 국제분류질병코드에 관한 통계입니다. 국비환자, 사비환자로 나누어져 있습니다. |
---|---|
URL | https://www.data.go.kr/data/15066475/fileData.do |
국비 is highly overall correlated with 사비 | High correlation |
사비 is highly overall correlated with 국비 | High correlation |
Unnamed: 4 has 1141 (100.0%) missing values | Missing |
사비 is highly skewed (γ1 = 31.93406768) | Skewed |
Unnamed: 4 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
사비 has 678 (59.4%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 22:19:25.792033 |
---|---|
Analysis finished | 2023-12-12 22:19:26.999815 |
Duration | 1.21 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상병코드
Text
Distinct | 1135 |
---|---|
Distinct (%) | 99.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.0 KiB |
Value | Count | Frequency (%) |
k621 | 2 | 0.2% |
j129 | 2 | 0.2% |
e1164 | 2 | 0.2% |
x5999 | 2 | 0.2% |
s32890 | 2 | 0.2% |
n401 | 2 | 0.2% |
m7979 | 1 | 0.1% |
m751 | 1 | 0.1% |
m8159 | 1 | 0.1% |
m7938 | 1 | 0.1% |
Other values (1125) | 1125 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 628 | |
1 | 517 | |
2 | 468 | |
9 | 459 | |
8 | 379 | 7.6% |
4 | 320 | 6.4% |
5 | 312 | 6.2% |
3 | 280 | 5.6% |
6 | 249 | 5.0% |
7 | 239 | 4.8% |
Other values (24) | 1141 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 3851 | |
Uppercase Letter | 1141 | 22.9% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
M | 140 | |
K | 118 | 10.3% |
I | 111 | 9.7% |
S | 104 | 9.1% |
C | 89 | 7.8% |
J | 62 | 5.4% |
H | 53 | 4.6% |
E | 52 | 4.6% |
R | 51 | 4.5% |
G | 43 | 3.8% |
Other values (14) | 318 |
Decimal Number
Value | Count | Frequency (%) |
0 | 628 | |
1 | 517 | |
2 | 468 | |
9 | 459 | |
8 | 379 | |
4 | 320 | |
5 | 312 | |
3 | 280 | |
6 | 249 | 6.5% |
7 | 239 | 6.2% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 3851 | |
Latin | 1141 | 22.9% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
M | 140 | |
K | 118 | 10.3% |
I | 111 | 9.7% |
S | 104 | 9.1% |
C | 89 | 7.8% |
J | 62 | 5.4% |
H | 53 | 4.6% |
E | 52 | 4.6% |
R | 51 | 4.5% |
G | 43 | 3.8% |
Other values (14) | 318 |
Common
Value | Count | Frequency (%) |
0 | 628 | |
1 | 517 | |
2 | 468 | |
9 | 459 | |
8 | 379 | |
4 | 320 | |
5 | 312 | |
3 | 280 | |
6 | 249 | 6.5% |
7 | 239 | 6.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 4992 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 628 | |
1 | 517 | |
2 | 468 | |
9 | 459 | |
8 | 379 | 7.6% |
4 | 320 | 6.4% |
5 | 312 | 6.2% |
3 | 280 | 5.6% |
6 | 249 | 5.0% |
7 | 239 | 4.8% |
Other values (24) | 1141 |
상병명
Text
Distinct | 1134 |
---|---|
Distinct (%) | 99.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.0 KiB |
Length
Max length | 71 |
---|---|
Median length | 49 |
Mean length | 16.850131 |
Min length | 1 |
Characters and Unicode
Total characters | 19226 |
---|---|
Distinct characters | 511 |
Distinct categories | 8 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 1127 ? |
---|---|
Unique (%) | 98.8% |
Sample
1st row | 살모넬라장염 |
---|---|
2nd row | 클로스트리듐 디피실리에 의한 장결장염 |
3rd row | 상세불명의 바이러스성 장감염 |
4th row | 감염성 기원의 기타 및 상세불명의 위장염 및 결장염 |
5th row | 상세불명 기원의 위장염 및 결장염 |
Value | Count | Frequency (%) |
상세불명의 | 279 | 5.9% |
기타 | 213 | 4.5% |
및 | 190 | 4.0% |
신생물 | 105 | 2.2% |
상세불명 | 100 | 2.1% |
악성 | 88 | 1.9% |
동반한 | 82 | 1.7% |
폐쇄성 | 74 | 1.6% |
또는 | 70 | 1.5% |
골절 | 62 | 1.3% |
Other values (1365) | 3432 |
Most occurring characters
Value | Count | Frequency (%) |
3554 | 18.5% | |
의 | 822 | 4.3% |
상 | 555 | 2.9% |
성 | 533 | 2.8% |
명 | 442 | 2.3% |
세 | 411 | 2.1% |
불 | 407 | 2.1% |
, | 370 | 1.9% |
기 | 325 | 1.7% |
증 | 241 | 1.3% |
Other values (501) | 11566 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 14851 | |
Space Separator | 3554 | 18.5% |
Other Punctuation | 419 | 2.2% |
Decimal Number | 189 | 1.0% |
Close Punctuation | 73 | 0.4% |
Open Punctuation | 73 | 0.4% |
Uppercase Letter | 66 | 0.3% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
의 | 822 | 5.5% |
상 | 555 | 3.7% |
성 | 533 | 3.6% |
명 | 442 | 3.0% |
세 | 411 | 2.8% |
불 | 407 | 2.7% |
기 | 325 | 2.2% |
증 | 241 | 1.6% |
타 | 236 | 1.6% |
장 | 232 | 1.6% |
Other values (463) | 10647 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 9 | |
G | 8 | |
I | 8 | |
B | 6 | |
E | 6 | |
L | 5 | |
N | 4 | 6.1% |
C | 3 | 4.5% |
H | 3 | 4.5% |
S | 3 | 4.5% |
Other values (7) | 11 |
Decimal Number
Value | Count | Frequency (%) |
0 | 49 | |
2 | 38 | |
1 | 32 | |
3 | 21 | |
9 | 15 | 7.9% |
4 | 10 | 5.3% |
5 | 8 | 4.2% |
6 | 6 | 3.2% |
8 | 5 | 2.6% |
7 | 5 | 2.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 370 | |
. | 25 | 6.0% |
* | 15 | 3.6% |
† | 8 | 1.9% |
/ | 1 | 0.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 54 | |
] | 19 | 26.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 54 | |
[ | 19 | 26.0% |
Space Separator
Value | Count | Frequency (%) |
3554 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 14842 | |
Common | 4309 | 22.4% |
Latin | 66 | 0.3% |
Han | 9 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
의 | 822 | 5.5% |
상 | 555 | 3.7% |
성 | 533 | 3.6% |
명 | 442 | 3.0% |
세 | 411 | 2.8% |
불 | 407 | 2.7% |
기 | 325 | 2.2% |
증 | 241 | 1.6% |
타 | 236 | 1.6% |
장 | 232 | 1.6% |
Other values (454) | 10638 |
Common
Value | Count | Frequency (%) |
3554 | ||
, | 370 | 8.6% |
) | 54 | 1.3% |
( | 54 | 1.3% |
0 | 49 | 1.1% |
2 | 38 | 0.9% |
1 | 32 | 0.7% |
. | 25 | 0.6% |
3 | 21 | 0.5% |
] | 19 | 0.4% |
Other values (11) | 93 | 2.2% |
Latin
Value | Count | Frequency (%) |
T | 9 | |
G | 8 | |
I | 8 | |
B | 6 | |
E | 6 | |
L | 5 | |
N | 4 | 6.1% |
C | 3 | 4.5% |
H | 3 | 4.5% |
S | 3 | 4.5% |
Other values (7) | 11 |
Han
Value | Count | Frequency (%) |
丹 | 1 | |
毒 | 1 | |
薦 | 1 | |
梨 | 1 | |
狀 | 1 | |
洞 | 1 | |
骨 | 1 | |
複 | 1 | |
視 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 14842 | |
ASCII | 4367 | 22.7% |
Punctuation | 8 | < 0.1% |
CJK | 8 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3554 | ||
, | 370 | 8.5% |
) | 54 | 1.2% |
( | 54 | 1.2% |
0 | 49 | 1.1% |
2 | 38 | 0.9% |
1 | 32 | 0.7% |
. | 25 | 0.6% |
3 | 21 | 0.5% |
] | 19 | 0.4% |
Other values (27) | 151 | 3.5% |
Hangul
Value | Count | Frequency (%) |
의 | 822 | 5.5% |
상 | 555 | 3.7% |
성 | 533 | 3.6% |
명 | 442 | 3.0% |
세 | 411 | 2.8% |
불 | 407 | 2.7% |
기 | 325 | 2.2% |
증 | 241 | 1.6% |
타 | 236 | 1.6% |
장 | 232 | 1.6% |
Other values (454) | 10638 |
Punctuation
Value | Count | Frequency (%) |
† | 8 |
CJK
Value | Count | Frequency (%) |
丹 | 1 | |
毒 | 1 | |
薦 | 1 | |
狀 | 1 | |
洞 | 1 | |
骨 | 1 | |
複 | 1 | |
視 | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
梨 | 1 |
국비
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 68 |
---|---|
Distinct (%) | 6.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.7984224 |
Minimum | 1 |
---|---|
Maximum | 503 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 4 |
95-th percentile | 27 |
Maximum | 503 |
Range | 502 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 22.481018 |
---|---|
Coefficient of variation (CV) | 3.3067992 |
Kurtosis | 221.78086 |
Mean | 6.7984224 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 12.066437 |
Sum | 7757 |
Variance | 505.39617 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 555 | |
2 | 170 | 14.9% |
3 | 98 | 8.6% |
4 | 62 | 5.4% |
5 | 44 | 3.9% |
6 | 28 | 2.5% |
8 | 19 | 1.7% |
7 | 19 | 1.7% |
12 | 11 | 1.0% |
9 | 10 | 0.9% |
Other values (58) | 125 | 11.0% |
Value | Count | Frequency (%) |
1 | 555 | |
2 | 170 | 14.9% |
3 | 98 | 8.6% |
4 | 62 | 5.4% |
5 | 44 | 3.9% |
6 | 28 | 2.5% |
7 | 19 | 1.7% |
8 | 19 | 1.7% |
9 | 10 | 0.9% |
10 | 9 | 0.8% |
Value | Count | Frequency (%) |
503 | 1 | |
181 | 1 | |
171 | 1 | |
156 | 1 | |
152 | 1 | |
150 | 2 | |
131 | 1 | |
116 | 1 | |
115 | 1 | |
109 | 1 |
사비
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 47 |
---|---|
Distinct (%) | 4.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.6091148 |
Minimum | 0 |
---|---|
Maximum | 1788 |
Zeros | 678 |
Zeros (%) | 59.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.2 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 2 |
95-th percentile | 18 |
Maximum | 1788 |
Range | 1788 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 53.87127 |
---|---|
Coefficient of variation (CV) | 11.687986 |
Kurtosis | 1056.2116 |
Mean | 4.6091148 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 31.934068 |
Sum | 5259 |
Variance | 2902.1137 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 678 | |
1 | 170 | 14.9% |
2 | 73 | 6.4% |
3 | 50 | 4.4% |
4 | 31 | 2.7% |
5 | 15 | 1.3% |
8 | 11 | 1.0% |
7 | 11 | 1.0% |
6 | 10 | 0.9% |
9 | 8 | 0.7% |
Other values (37) | 84 | 7.4% |
Value | Count | Frequency (%) |
0 | 678 | |
1 | 170 | 14.9% |
2 | 73 | 6.4% |
3 | 50 | 4.4% |
4 | 31 | 2.7% |
5 | 15 | 1.3% |
6 | 10 | 0.9% |
7 | 11 | 1.0% |
8 | 11 | 1.0% |
9 | 8 | 0.7% |
Value | Count | Frequency (%) |
1788 | 1 | |
156 | 1 | |
145 | 1 | |
86 | 1 | |
82 | 1 | |
76 | 1 | |
73 | 1 | |
58 | 1 | |
55 | 2 | |
54 | 2 |
Unnamed: 4
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 1141 |
---|---|
Missing (%) | 100.0% |
Memory size | 10.2 KiB |
국비 | 사비 | |
---|---|---|
국비 | 1.000 | 0.408 |
사비 | 0.408 | 1.000 |
국비 | 사비 | |
---|---|---|
국비 | 1.000 | 0.623 |
사비 | 0.623 | 1.000 |
상병코드 | 상병명 | 국비 | 사비 | Unnamed: 4 | |
---|---|---|---|---|---|
0 | A020 | 살모넬라장염 | 1 | 1 | <NA> |
1 | A047 | 클로스트리듐 디피실리에 의한 장결장염 | 2 | 0 | <NA> |
2 | A084 | 상세불명의 바이러스성 장감염 | 6 | 0 | <NA> |
3 | A090 | 감염성 기원의 기타 및 상세불명의 위장염 및 결장염 | 8 | 5 | <NA> |
4 | A099 | 상세불명 기원의 위장염 및 결장염 | 37 | 27 | <NA> |
5 | A1500 | 배양 유무에 관계없이 가래 현미경 검사로 확인된 공동이 있는 폐결핵 | 1 | 0 | <NA> |
6 | A1501 | 배양 유무에 관계없이 가래 현미경 검사로 확인된 공동이 없거나 상세불명의 폐결핵 | 1 | 2 | <NA> |
7 | A1621 | 세균학적 또는 조직학적 확인에 대한 언급이 없는 공동이 없거나 상세불명의 폐결핵 | 1 | 0 | <NA> |
8 | A1681 | 세균학적 또는 조직학적 확인에 대한 언급이 없는 공동이 없거나 상세불명의 기타 호흡기결핵 | 1 | 0 | <NA> |
9 | A169 | 세균학적 또는 조직학적 확인에 대한 언급이 없는 상세불명의 호흡기결핵 | 1 | 0 | <NA> |
상병코드 | 상병명 | 국비 | 사비 | Unnamed: 4 | |
---|---|---|---|---|---|
1131 | Z904 | 소화관의 기타 부분의 후천성 결여 | 4 | 0 | <NA> |
1132 | Z933 | 결장조루상태 | 2 | 1 | <NA> |
1133 | Z942 | 폐이식상태 | 1 | 0 | <NA> |
1134 | Z944 | 간이식상태 | 4 | 0 | <NA> |
1135 | Z950 | 심장전자장치의 존재 | 1 | 1 | <NA> |
1136 | Z951 | 대동맥관상동맥우회로이식편의 존재 | 6 | 3 | <NA> |
1137 | Z955 | 관상동맥혈관성형 삽입물 및 이식편의 존재 | 171 | 0 | <NA> |
1138 | Z961 | 안구내렌즈의 존재 | 59 | 35 | <NA> |
1139 | Z9664 | 무릎관절삽입물의 존재 | 2 | 0 | <NA> |
1140 | Z988 | 기타 명시된 수술후 상태 | 8 | 0 | <NA> |