Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 206 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.0 KiB |
Average record size in memory | 34.6 B |
Variable types
Text | 2 |
---|---|
Numeric | 2 |
Dataset
Description | N/A |
---|---|
Author | 한국보훈복지의료공단 |
URL | https://data.incheon.go.kr/findData/publicDataDetail?dataId=15066488&srcSe=7661IVAWM27C61E190 |
Reproduction
Analysis started | 2024-03-18 04:38:28.827194 |
---|---|
Analysis finished | 2024-03-18 04:38:29.855744 |
Duration | 1.03 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상병코드
Text
UNIQUE
 
Distinct | 206 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
Value | Count | Frequency (%) |
a090 | 1 | 0.5% |
m509 | 1 | 0.5% |
m512 | 1 | 0.5% |
m4809 | 1 | 0.5% |
m4836 | 1 | 0.5% |
m4854 | 1 | 0.5% |
m4855 | 1 | 0.5% |
m4856 | 1 | 0.5% |
m4859 | 1 | 0.5% |
m500 | 1 | 0.5% |
Other values (196) | 196 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 127 | |
1 | 98 | |
9 | 87 | |
2 | 78 | 8.5% |
8 | 66 | 7.2% |
4 | 60 | 6.5% |
3 | 58 | 6.3% |
5 | 55 | 6.0% |
6 | 44 | 4.8% |
M | 39 | 4.3% |
Other values (19) | 205 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 711 | |
Uppercase Letter | 206 | 22.5% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
M | 39 | |
K | 22 | |
S | 22 | |
E | 15 | 7.3% |
N | 13 | 6.3% |
G | 13 | 6.3% |
C | 13 | 6.3% |
D | 12 | 5.8% |
J | 11 | 5.3% |
R | 11 | 5.3% |
Other values (9) | 35 |
Decimal Number
Value | Count | Frequency (%) |
0 | 127 | |
1 | 98 | |
9 | 87 | |
2 | 78 | |
8 | 66 | |
4 | 60 | |
3 | 58 | |
5 | 55 | |
6 | 44 | 6.2% |
7 | 38 | 5.3% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 711 | |
Latin | 206 | 22.5% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
M | 39 | |
K | 22 | |
S | 22 | |
E | 15 | 7.3% |
N | 13 | 6.3% |
G | 13 | 6.3% |
C | 13 | 6.3% |
D | 12 | 5.8% |
J | 11 | 5.3% |
R | 11 | 5.3% |
Other values (9) | 35 |
Common
Value | Count | Frequency (%) |
0 | 127 | |
1 | 98 | |
9 | 87 | |
2 | 78 | |
8 | 66 | |
4 | 60 | |
3 | 58 | |
5 | 55 | |
6 | 44 | 6.2% |
7 | 38 | 5.3% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 917 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 127 | |
1 | 98 | |
9 | 87 | |
2 | 78 | 8.5% |
8 | 66 | 7.2% |
4 | 60 | 6.5% |
3 | 58 | 6.3% |
5 | 55 | 6.0% |
6 | 44 | 4.8% |
M | 39 | 4.3% |
Other values (19) | 205 |
상병명
Text
UNIQUE
 
Distinct | 206 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
Length
Max length | 66 |
---|---|
Median length | 35.5 |
Mean length | 17.436893 |
Min length | 2 |
Characters and Unicode
Total characters | 3592 |
---|---|
Distinct characters | 340 |
Distinct categories | 10 ? |
Distinct scripts | 4 ? |
Distinct blocks | 4 ? |
Unique
Unique | 206 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 감염성 기원의 기타 및 상세불명의 위장염 및 결장염 |
---|---|
2nd row | 상세불명 기원의 위장염 및 결장염 |
3rd row | 상세불명의 마이코박테리아감염 |
4th row | 고충증 |
5th row | 상세불명의 식도의 악성 신생물 |
Value | Count | Frequency (%) |
상세불명의 | 63 | 7.5% |
및 | 40 | 4.7% |
기타 | 37 | 4.4% |
동반한 | 24 | 2.8% |
신생물 | 22 | 2.6% |
않은 | 18 | 2.1% |
상세불명 | 16 | 1.9% |
폐쇄성 | 14 | 1.7% |
악성 | 12 | 1.4% |
당뇨병 | 11 | 1.3% |
Other values (368) | 588 |
Most occurring characters
Value | Count | Frequency (%) |
642 | 17.9% | |
의 | 149 | 4.1% |
상 | 100 | 2.8% |
성 | 96 | 2.7% |
명 | 90 | 2.5% |
세 | 84 | 2.3% |
불 | 83 | 2.3% |
, | 76 | 2.1% |
증 | 66 | 1.8% |
기 | 56 | 1.6% |
Other values (330) | 2150 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2683 | |
Space Separator | 642 | 17.9% |
Other Punctuation | 85 | 2.4% |
Lowercase Letter | 77 | 2.1% |
Decimal Number | 41 | 1.1% |
Open Punctuation | 20 | 0.6% |
Close Punctuation | 20 | 0.6% |
Uppercase Letter | 17 | 0.5% |
Dash Punctuation | 5 | 0.1% |
Math Symbol | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
의 | 149 | 5.6% |
상 | 100 | 3.7% |
성 | 96 | 3.6% |
명 | 90 | 3.4% |
세 | 84 | 3.1% |
불 | 83 | 3.1% |
증 | 66 | 2.5% |
기 | 56 | 2.1% |
병 | 48 | 1.8% |
부 | 44 | 1.6% |
Other values (281) | 1867 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 11 | |
i | 9 | |
r | 8 | |
t | 7 | |
e | 7 | |
d | 6 | |
a | 5 | |
o | 5 | |
n | 4 | 5.2% |
p | 4 | 5.2% |
Other values (8) | 11 |
Decimal Number
Value | Count | Frequency (%) |
2 | 11 | |
1 | 8 | |
9 | 5 | |
3 | 5 | |
0 | 5 | |
8 | 2 | 4.9% |
5 | 2 | 4.9% |
4 | 1 | 2.4% |
7 | 1 | 2.4% |
6 | 1 | 2.4% |
Uppercase Letter
Value | Count | Frequency (%) |
G | 6 | |
P | 2 | 11.8% |
N | 2 | 11.8% |
F | 1 | 5.9% |
U | 1 | 5.9% |
O | 1 | 5.9% |
C | 1 | 5.9% |
M | 1 | 5.9% |
S | 1 | 5.9% |
D | 1 | 5.9% |
Other Punctuation
Value | Count | Frequency (%) |
, | 76 | |
* | 5 | 5.9% |
. | 3 | 3.5% |
† | 1 | 1.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 17 | |
[ | 3 | 15.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 17 | |
] | 3 | 15.0% |
Space Separator
Value | Count | Frequency (%) |
642 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Math Symbol
Value | Count | Frequency (%) |
+ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2681 | |
Common | 815 | 22.7% |
Latin | 94 | 2.6% |
Han | 2 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
의 | 149 | 5.6% |
상 | 100 | 3.7% |
성 | 96 | 3.6% |
명 | 90 | 3.4% |
세 | 84 | 3.1% |
불 | 83 | 3.1% |
증 | 66 | 2.5% |
기 | 56 | 2.1% |
병 | 48 | 1.8% |
부 | 44 | 1.6% |
Other values (279) | 1865 |
Latin
Value | Count | Frequency (%) |
s | 11 | |
i | 9 | 9.6% |
r | 8 | 8.5% |
t | 7 | 7.4% |
e | 7 | 7.4% |
G | 6 | 6.4% |
d | 6 | 6.4% |
a | 5 | 5.3% |
o | 5 | 5.3% |
n | 4 | 4.3% |
Other values (18) | 26 |
Common
Value | Count | Frequency (%) |
642 | ||
, | 76 | 9.3% |
( | 17 | 2.1% |
) | 17 | 2.1% |
2 | 11 | 1.3% |
1 | 8 | 1.0% |
9 | 5 | 0.6% |
- | 5 | 0.6% |
* | 5 | 0.6% |
3 | 5 | 0.6% |
Other values (11) | 24 | 2.9% |
Han
Value | Count | Frequency (%) |
勞 | 1 | |
虛 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2681 | |
ASCII | 908 | 25.3% |
CJK | 2 | 0.1% |
Punctuation | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
642 | ||
, | 76 | 8.4% |
( | 17 | 1.9% |
) | 17 | 1.9% |
2 | 11 | 1.2% |
s | 11 | 1.2% |
i | 9 | 1.0% |
1 | 8 | 0.9% |
r | 8 | 0.9% |
t | 7 | 0.8% |
Other values (38) | 102 | 11.2% |
Hangul
Value | Count | Frequency (%) |
의 | 149 | 5.6% |
상 | 100 | 3.7% |
성 | 96 | 3.6% |
명 | 90 | 3.4% |
세 | 84 | 3.1% |
불 | 83 | 3.1% |
증 | 66 | 2.5% |
기 | 56 | 2.1% |
병 | 48 | 1.8% |
부 | 44 | 1.6% |
Other values (279) | 1865 |
CJK
Value | Count | Frequency (%) |
勞 | 1 | |
虛 | 1 |
Punctuation
Value | Count | Frequency (%) |
† | 1 |
국비
Real number (ℝ)
ZEROS
 
Distinct | 13 |
---|---|
Distinct (%) | 6.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.3592233 |
Minimum | 0 |
---|---|
Maximum | 42 |
Zeros | 108 |
Zeros (%) | 52.4% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 0 |
Q3 | 1 |
95-th percentile | 4 |
Maximum | 42 |
Range | 42 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 4.1067568 |
---|---|
Coefficient of variation (CV) | 3.0213996 |
Kurtosis | 55.624989 |
Mean | 1.3592233 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 6.8234862 |
Sum | 280 |
Variance | 16.865451 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 108 | |
1 | 64 | |
2 | 12 | 5.8% |
3 | 9 | 4.4% |
4 | 3 | 1.5% |
5 | 2 | 1.0% |
6 | 2 | 1.0% |
11 | 1 | 0.5% |
17 | 1 | 0.5% |
20 | 1 | 0.5% |
Other values (3) | 3 | 1.5% |
Value | Count | Frequency (%) |
0 | 108 | |
1 | 64 | |
2 | 12 | 5.8% |
3 | 9 | 4.4% |
4 | 3 | 1.5% |
5 | 2 | 1.0% |
6 | 2 | 1.0% |
11 | 1 | 0.5% |
15 | 1 | 0.5% |
17 | 1 | 0.5% |
Value | Count | Frequency (%) |
42 | 1 | 0.5% |
26 | 1 | 0.5% |
20 | 1 | 0.5% |
17 | 1 | 0.5% |
15 | 1 | 0.5% |
11 | 1 | 0.5% |
6 | 2 | 1.0% |
5 | 2 | 1.0% |
4 | 3 | 1.5% |
3 | 9 |
사비
Real number (ℝ)
ZEROS
 
Distinct | 13 |
---|---|
Distinct (%) | 6.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2.1941748 |
Minimum | 0 |
---|---|
Maximum | 64 |
Zeros | 48 |
Zeros (%) | 23.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 5 |
Maximum | 64 |
Range | 64 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 5.7831686 |
---|---|
Coefficient of variation (CV) | 2.6356919 |
Kurtosis | 69.065346 |
Mean | 2.1941748 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 7.5408784 |
Sum | 452 |
Variance | 33.445039 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 93 | |
0 | 48 | |
2 | 31 | 15.0% |
3 | 13 | 6.3% |
4 | 7 | 3.4% |
5 | 5 | 2.4% |
6 | 2 | 1.0% |
29 | 2 | 1.0% |
19 | 1 | 0.5% |
21 | 1 | 0.5% |
Other values (3) | 3 | 1.5% |
Value | Count | Frequency (%) |
0 | 48 | |
1 | 93 | |
2 | 31 | 15.0% |
3 | 13 | 6.3% |
4 | 7 | 3.4% |
5 | 5 | 2.4% |
6 | 2 | 1.0% |
7 | 1 | 0.5% |
19 | 1 | 0.5% |
21 | 1 | 0.5% |
Value | Count | Frequency (%) |
64 | 1 | 0.5% |
29 | 2 | 1.0% |
24 | 1 | 0.5% |
21 | 1 | 0.5% |
19 | 1 | 0.5% |
7 | 1 | 0.5% |
6 | 2 | 1.0% |
5 | 5 | 2.4% |
4 | 7 | |
3 | 13 |
국비 | 사비 | |
---|---|---|
국비 | 1.000 | 0.816 |
사비 | 0.816 | 1.000 |
국비 | 사비 | |
---|---|---|
국비 | 1.000 | -0.133 |
사비 | -0.133 | 1.000 |
상병코드 | 상병명 | 국비 | 사비 | |
---|---|---|---|---|
0 | A090 | 감염성 기원의 기타 및 상세불명의 위장염 및 결장염 | 1 | 2 |
1 | A099 | 상세불명 기원의 위장염 및 결장염 | 2 | 3 |
2 | A319 | 상세불명의 마이코박테리아감염 | 1 | 0 |
3 | B701 | 고충증 | 0 | 2 |
4 | C159 | 상세불명의 식도의 악성 신생물 | 0 | 1 |
5 | C1691 | 상세불명의 위의 악성 신생물, 진행형 | 1 | 0 |
6 | C189 | 상세불명의 결장의 악성 신생물 | 1 | 2 |
7 | C220 | 간세포암종의 악성 신생물 | 0 | 3 |
8 | C252 | 췌장의 꼬리의 악성 신생물 | 0 | 2 |
9 | C3491 | 상세불명의 기관지 또는 폐의 악성 신생물, 오른쪽 | 4 | 0 |
상병코드 | 상병명 | 국비 | 사비 | |
---|---|---|---|---|
196 | S7600 | 엉덩이의 근육 및 힘줄의 손상, 열상 | 0 | 1 |
197 | S82320 | 비골골절(모든 부분)을 동반한 경골 몸통의 골절, 폐쇄성 | 1 | 1 |
198 | S82430 | 비골만의 몸통의 골절, 폐쇄성 | 0 | 1 |
199 | S82820 | 양측 복사골절, 발목, 폐쇄성 | 0 | 1 |
200 | S82830 | 삼복사골절, 발목, 폐쇄성 | 0 | 2 |
201 | S8320 | 내측반달연골의 찢김 | 0 | 1 |
202 | T814 | 달리 분류되지 않은 처치에 따른 감염 | 0 | 1 |
203 | U071 | 바이러스가 확인된 코로나바이러스 질환 2019 [바이러스가 확인된 코로나-19] | 3 | 64 |
204 | Z048 | 기타 명시된 이유의 검사 및 관찰 | 1 | 0 |
205 | Z470 | 골절판 및 기타 내부고정장치의 제거를 포함한 추적치료를 위하여 보건서비스와 접하고 있는 사람 | 0 | 1 |