Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.4 KiB |
Average record size in memory | 34.3 B |
Variable types
Text | 3 |
---|---|
Numeric | 1 |
Dataset
Description | 알코올 사용 장애 환자들의 다양한 공존 질환의 진단명과 진단코드, 최초진단일, 진단 데이터가 포함됨. 주요 동반질환은 소화계통의 질환, 정신 및 행동장애, 내분비질환, 순환기계 질환 등이 포함됨. 진단코드는 ICD-11 코드와 SNOMED-CT 코드로 매핑됨. |
---|---|
Author | 가톨릭대학교 서울성모병원 |
URL | http://cmcdata.net/data/dataset/coexistence-disease-data-alcohol-use-disorder |
RID has unique values | Unique |
Reproduction
Analysis started | 2023-10-08 18:56:20.556207 |
---|---|
Analysis finished | 2023-10-08 18:56:22.256037 |
Duration | 1.7 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
RID
Text
UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
r0000347 | 1 | 1.0% |
r0000413 | 1 | 1.0% |
r0000425 | 1 | 1.0% |
r0000424 | 1 | 1.0% |
r0000423 | 1 | 1.0% |
r0000422 | 1 | 1.0% |
r0000421 | 1 | 1.0% |
r0000420 | 1 | 1.0% |
r0000419 | 1 | 1.0% |
r0000418 | 1 | 1.0% |
Other values (90) | 90 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 421 | |
R | 100 | 12.5% |
4 | 74 | 9.2% |
3 | 69 | 8.6% |
5 | 23 | 2.9% |
9 | 20 | 2.5% |
2 | 20 | 2.5% |
8 | 20 | 2.5% |
1 | 19 | 2.4% |
7 | 17 | 2.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 700 | |
Uppercase Letter | 100 | 12.5% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 421 | |
4 | 74 | 10.6% |
3 | 69 | 9.9% |
5 | 23 | 3.3% |
9 | 20 | 2.9% |
2 | 20 | 2.9% |
8 | 20 | 2.9% |
1 | 19 | 2.7% |
7 | 17 | 2.4% |
6 | 17 | 2.4% |
Uppercase Letter
Value | Count | Frequency (%) |
R | 100 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 700 | |
Latin | 100 | 12.5% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 421 | |
4 | 74 | 10.6% |
3 | 69 | 9.9% |
5 | 23 | 3.3% |
9 | 20 | 2.9% |
2 | 20 | 2.9% |
8 | 20 | 2.9% |
1 | 19 | 2.7% |
7 | 17 | 2.4% |
6 | 17 | 2.4% |
Latin
Value | Count | Frequency (%) |
R | 100 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 800 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 421 | |
R | 100 | 12.5% |
4 | 74 | 9.2% |
3 | 69 | 8.6% |
5 | 23 | 2.9% |
9 | 20 | 2.5% |
2 | 20 | 2.5% |
8 | 20 | 2.5% |
1 | 19 | 2.4% |
7 | 17 | 2.1% |
CODIAG_GRP1
Text
Distinct | 61 |
---|---|
Distinct (%) | 61.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Length
Max length | 75 |
---|---|
Median length | 48 |
Mean length | 31.81 |
Min length | 14 |
Characters and Unicode
Total characters | 3181 |
---|---|
Distinct characters | 182 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 44 ? |
---|---|
Unique (%) | 44.0% |
Sample
1st row | 피부 및 피하조직의 질환-피부 및 피하조직의 감염-연조직염 |
---|---|
2nd row | 정신 및 행동장애-수면-각성 장애-기타 수면장애 |
3rd row | 정신 및 행동장애-수면-각성 장애-기타 수면장애 |
4th row | 순환계통의 질환-허혈성심질환-협심증 |
5th row | 소화계통의 질환-담낭, 담도 및 췌장의 장애-담석증 |
Value | Count | Frequency (%) |
및 | 133 | 19.4% |
소화계통의 | 32 | 4.7% |
증상 | 29 | 4.2% |
질환-간의 | 18 | 2.6% |
검사의 | 16 | 2.3% |
임상 | 16 | 2.3% |
징후와 | 16 | 2.3% |
정신 | 16 | 2.3% |
질환-식도 | 12 | 1.8% |
위 | 12 | 1.8% |
Other values (184) | 385 |
Most occurring characters
Value | Count | Frequency (%) |
585 | 18.4% | |
- | 208 | 6.5% |
의 | 141 | 4.4% |
및 | 133 | 4.2% |
환 | 106 | 3.3% |
질 | 104 | 3.3% |
장 | 92 | 2.9% |
상 | 89 | 2.8% |
애 | 65 | 2.0% |
증 | 64 | 2.0% |
Other values (172) | 1594 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2334 | |
Space Separator | 585 | 18.4% |
Dash Punctuation | 208 | 6.5% |
Other Punctuation | 51 | 1.6% |
Uppercase Letter | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
의 | 141 | 6.0% |
및 | 133 | 5.7% |
환 | 106 | 4.5% |
질 | 104 | 4.5% |
장 | 92 | 3.9% |
상 | 89 | 3.8% |
애 | 65 | 2.8% |
증 | 64 | 2.7% |
통 | 61 | 2.6% |
계 | 57 | 2.4% |
Other values (168) | 1422 |
Space Separator
Value | Count | Frequency (%) |
585 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 208 |
Other Punctuation
Value | Count | Frequency (%) |
, | 51 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2334 | |
Common | 844 | 26.5% |
Latin | 3 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
의 | 141 | 6.0% |
및 | 133 | 5.7% |
환 | 106 | 4.5% |
질 | 104 | 4.5% |
장 | 92 | 3.9% |
상 | 89 | 3.8% |
애 | 65 | 2.8% |
증 | 64 | 2.7% |
통 | 61 | 2.6% |
계 | 57 | 2.4% |
Other values (168) | 1422 |
Common
Value | Count | Frequency (%) |
585 | ||
- | 208 | 24.6% |
, | 51 | 6.0% |
Latin
Value | Count | Frequency (%) |
B | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2334 | |
ASCII | 847 | 26.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
585 | ||
- | 208 | 24.6% |
, | 51 | 6.0% |
B | 3 | 0.4% |
Hangul
Value | Count | Frequency (%) |
의 | 141 | 6.0% |
및 | 133 | 5.7% |
환 | 106 | 4.5% |
질 | 104 | 4.5% |
장 | 92 | 3.9% |
상 | 89 | 3.8% |
애 | 65 | 2.8% |
증 | 64 | 2.7% |
통 | 61 | 2.6% |
계 | 57 | 2.4% |
Other values (168) | 1422 |
CODIAG_CD
Text
Distinct | 82 |
---|---|
Distinct (%) | 82.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
k760 | 5 | 5.0% |
f329 | 3 | 3.0% |
k742 | 3 | 3.0% |
k210 | 2 | 2.0% |
l039 | 2 | 2.0% |
b181 | 2 | 2.0% |
k746 | 2 | 2.0% |
k219 | 2 | 2.0% |
r509 | 2 | 2.0% |
r418 | 2 | 2.0% |
Other values (72) | 75 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 47 | |
1 | 42 | |
9 | 37 | |
2 | 34 | 8.4% |
4 | 33 | 8.1% |
K | 31 | 7.7% |
7 | 26 | 6.4% |
3 | 26 | 6.4% |
8 | 24 | 5.9% |
6 | 20 | 4.9% |
Other values (15) | 85 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 305 | |
Uppercase Letter | 100 | 24.7% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
K | 31 | |
R | 16 | |
F | 12 | 12.0% |
E | 5 | 5.0% |
G | 5 | 5.0% |
J | 5 | 5.0% |
L | 4 | 4.0% |
M | 4 | 4.0% |
B | 3 | 3.0% |
D | 3 | 3.0% |
Other values (5) | 12 | 12.0% |
Decimal Number
Value | Count | Frequency (%) |
0 | 47 | |
1 | 42 | |
9 | 37 | |
2 | 34 | |
4 | 33 | |
7 | 26 | |
3 | 26 | |
8 | 24 | |
6 | 20 | |
5 | 16 | 5.2% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 305 | |
Latin | 100 | 24.7% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
K | 31 | |
R | 16 | |
F | 12 | 12.0% |
E | 5 | 5.0% |
G | 5 | 5.0% |
J | 5 | 5.0% |
L | 4 | 4.0% |
M | 4 | 4.0% |
B | 3 | 3.0% |
D | 3 | 3.0% |
Other values (5) | 12 | 12.0% |
Common
Value | Count | Frequency (%) |
0 | 47 | |
1 | 42 | |
9 | 37 | |
2 | 34 | |
4 | 33 | |
7 | 26 | |
3 | 26 | |
8 | 24 | |
6 | 20 | |
5 | 16 | 5.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 405 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 47 | |
1 | 42 | |
9 | 37 | |
2 | 34 | 8.4% |
4 | 33 | 8.1% |
K | 31 | 7.7% |
7 | 26 | 6.4% |
3 | 26 | 6.4% |
8 | 24 | 5.9% |
6 | 20 | 4.9% |
Other values (15) | 85 |
DIAG_1ST_DD
Real number (ℝ)
Distinct | 10 |
---|---|
Distinct (%) | 10.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2011.93 |
Minimum | 2008 |
---|---|
Maximum | 2017 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 2008 |
---|---|
5-th percentile | 2008 |
Q1 | 2009 |
median | 2011 |
Q3 | 2014 |
95-th percentile | 2017 |
Maximum | 2017 |
Range | 9 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 3.0359962 |
---|---|
Coefficient of variation (CV) | 0.0015089969 |
Kurtosis | -1.3011531 |
Mean | 2011.93 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 0.31995257 |
Sum | 201193 |
Variance | 9.2172727 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2009 | 19 | |
2010 | 12 | |
2014 | 12 | |
2008 | 12 | |
2017 | 10 | |
2016 | 9 | |
2011 | 9 | |
2013 | 6 | 6.0% |
2012 | 6 | 6.0% |
2015 | 5 | 5.0% |
Value | Count | Frequency (%) |
2008 | 12 | |
2009 | 19 | |
2010 | 12 | |
2011 | 9 | |
2012 | 6 | 6.0% |
2013 | 6 | 6.0% |
2014 | 12 | |
2015 | 5 | 5.0% |
2016 | 9 | |
2017 | 10 |
Value | Count | Frequency (%) |
2017 | 10 | |
2016 | 9 | |
2015 | 5 | 5.0% |
2014 | 12 | |
2013 | 6 | 6.0% |
2012 | 6 | 6.0% |
2011 | 9 | |
2010 | 12 | |
2009 | 19 | |
2008 | 12 |
RID | CODIAG_GRP1 | CODIAG_CD | DIAG_1ST_DD | |
---|---|---|---|---|
RID | 1.000 | 1.000 | 1.000 | 1.000 |
CODIAG_GRP1 | 1.000 | 1.000 | 1.000 | 0.655 |
CODIAG_CD | 1.000 | 1.000 | 1.000 | 0.866 |
DIAG_1ST_DD | 1.000 | 0.655 | 0.866 | 1.000 |
RID | CODIAG_GRP1 | CODIAG_CD | DIAG_1ST_DD | |
---|---|---|---|---|
0 | R0000347 | 피부 및 피하조직의 질환-피부 및 피하조직의 감염-연조직염 | L039 | 2013 |
1 | R0000348 | 정신 및 행동장애-수면-각성 장애-기타 수면장애 | G479 | 2017 |
2 | R0000349 | 정신 및 행동장애-수면-각성 장애-기타 수면장애 | G478 | 2010 |
3 | R0000350 | 순환계통의 질환-허혈성심질환-협심증 | I200 | 2014 |
4 | R0000351 | 소화계통의 질환-담낭, 담도 및 췌장의 장애-담석증 | K8020 | 2014 |
5 | R0000352 | 정신 및 행동장애-신경인지장애-알츠하이머 병으로 인한 신경인지장애 | F009 | 2014 |
6 | R0000353 | 증상, 징후와 임상 및 검사의 이상소견-순환계통 및 호흡계통의 증상 및 징후-목구멍 및 가슴의 통증 | R074 | 2009 |
7 | R0000354 | 손상, 중독 및 외인에 의한 특정 기타 결과-흉부의 손상-흉부의 손상 | S22330 | 2016 |
8 | R0000355 | 증상, 징후와 임상 및 검사의 이상소견-인지, 지각, 정서상태 및 행위에 관련된 증상 및 징후-인지기능 및 자각에 관련된 증상 및 징후 | R413 | 2010 |
9 | R0000356 | 소화계통의 질환-간의 질환-분류되지 않은 지방간 | K760 | 2017 |
RID | CODIAG_GRP1 | CODIAG_CD | DIAG_1ST_DD | |
---|---|---|---|---|
90 | R0000443 | 정신 및 행동장애-기분장애-우울장애 | F329 | 2010 |
91 | R0000444 | 신경계통의 질환-우발적 및 발작적 장애-기타두통 | G442 | 2010 |
92 | R0000445 | 소화계통의 질환-장의 기타 질환-기타 기능성 장장애 | K599 | 2017 |
93 | R0000446 | 소화계통의 질환-식도, 위 및 십이지장의 질환-위-식도역류병 | K210 | 2009 |
94 | R0000447 | 감영성 및 기생충성 질환-바이러스 간염-만성 B형 간염 | B181 | 2015 |
95 | R0000448 | 내분비질환, 영양 및 대사-당뇨-당뇨 | E149 | 2011 |
96 | R0000449 | 소화계통의 질환-간의 질환-간의 섬유증 및 경변증 | K742 | 2009 |
97 | R0000450 | 증상, 징후와 임상 및 검사의 이상소견-인지, 지각, 정서상태 및 행위에 관련된 증상 및 징후-인지기능 및 자각에 관련된 증상 및 징후 | R418 | 2009 |
98 | R0000451 | 신생물-악성 신생물-간 및 간내 담관의 악성 신생물 | C221 | 2015 |
99 | R0000452 | 소화계통의 질환-간의 질환-분류되지 않은 지방간 | K760 | 2009 |