Overview

Dataset statistics

Number of variables5
Number of observations316
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory12.8 KiB
Average record size in memory41.4 B

Variable types

Categorical4
Numeric1

Dataset

Description1. 기간 : 2019년~2021년 2. 코드 : T311~T319 (T311,T312,T313,T314,T315,T316,T317,T318,T319) 3. 제공변수 : 진료년도, 상병코드(4단), 시·도 구분, 환자수 * 수진기준(한의분류 제외, 약국 제외) * 건강보험 급여실적(의료급여 제외)이며, 비급여는 제외 - 2022년 6월 지급분까지 반영 * 아래 질병통계 자료는 요양기관에서 환자진료중 진단명이 확정되지 않은 상태에서의 호소, 증세 등에 따라 일차진단명을 부여하고 청구한 내역중 주진단명 기준으로 발췌한 것이므로 최종확정된 질병과는 다를수 있음
Author국민건강보험공단
URLhttps://www.data.go.kr/data/15107139/fileData.do

Alerts

주상병코드 is highly overall correlated with 상병명High correlation
상병명 is highly overall correlated with 주상병코드High correlation

Reproduction

Analysis started2023-12-12 01:25:33.706765
Analysis finished2023-12-12 01:25:34.298974
Duration0.59 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

진료년도
Categorical

Distinct3
Distinct (%)0.9%
Missing0
Missing (%)0.0%
Memory size2.6 KiB
2019년
108 
2021년
105 
2020년
103 

Length

Max length5
Median length5
Mean length5
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2019년
2nd row2019년
3rd row2019년
4th row2019년
5th row2019년

Common Values

ValueCountFrequency (%)
2019년 108
34.2%
2021년 105
33.2%
2020년 103
32.6%

Length

2023-12-12T10:25:34.378824image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:25:34.498699image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2019년 108
34.2%
2021년 105
33.2%
2020년 103
32.6%

주상병코드
Categorical

HIGH CORRELATION 

Distinct9
Distinct (%)2.8%
Missing0
Missing (%)0.0%
Memory size2.6 KiB
T311
50 
T312
50 
T313
47 
T314
43 
T315
33 
Other values (4)
93 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st rowT311
2nd rowT311
3rd rowT311
4th rowT311
5th rowT311

Common Values

ValueCountFrequency (%)
T311 50
15.8%
T312 50
15.8%
T313 47
14.9%
T314 43
13.6%
T315 33
10.4%
T319 29
9.2%
T318 27
8.5%
T317 25
7.9%
T316 12
 
3.8%

Length

2023-12-12T10:25:34.645653image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:25:34.778014image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
t311 50
15.8%
t312 50
15.8%
t313 47
14.9%
t314 43
13.6%
t315 33
10.4%
t319 29
9.2%
t318 27
8.5%
t317 25
7.9%
t316 12
 
3.8%

상병명
Categorical

HIGH CORRELATION 

Distinct9
Distinct (%)2.8%
Missing0
Missing (%)0.0%
Memory size2.6 KiB
신체표면의10-19%를침범한화상
50 
신체표면의20-29%를침범한화상
50 
신체표면의30-39%를침범한화상
47 
신체표면의40-49%를침범한화상
43 
신체표면의50-59%를침범한화상
33 
Other values (4)
93 

Length

Max length17
Median length17
Mean length16.908228
Min length16

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row신체표면의10-19%를침범한화상
2nd row신체표면의10-19%를침범한화상
3rd row신체표면의10-19%를침범한화상
4th row신체표면의10-19%를침범한화상
5th row신체표면의10-19%를침범한화상

Common Values

ValueCountFrequency (%)
신체표면의10-19%를침범한화상 50
15.8%
신체표면의20-29%를침범한화상 50
15.8%
신체표면의30-39%를침범한화상 47
14.9%
신체표면의40-49%를침범한화상 43
13.6%
신체표면의50-59%를침범한화상 33
10.4%
신체표면의90%이상을침범한화상 29
9.2%
신체표면의80-89%를침범한화상 27
8.5%
신체표면의70-79%를침범한화상 25
7.9%
신체표면의60-69%를침범한화상 12
 
3.8%

Length

2023-12-12T10:25:34.925071image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:25:35.066152image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
신체표면의10-19%를침범한화상 50
15.8%
신체표면의20-29%를침범한화상 50
15.8%
신체표면의30-39%를침범한화상 47
14.9%
신체표면의40-49%를침범한화상 43
13.6%
신체표면의50-59%를침범한화상 33
10.4%
신체표면의90%이상을침범한화상 29
9.2%
신체표면의80-89%를침범한화상 27
8.5%
신체표면의70-79%를침범한화상 25
7.9%
신체표면의60-69%를침범한화상 12
 
3.8%

시도
Categorical

Distinct17
Distinct (%)5.4%
Missing0
Missing (%)0.0%
Memory size2.6 KiB
경기도
25 
충청남도
25 
경상남도
23 
서울특별시
23 
대전광역시
22 
Other values (12)
198 

Length

Max length7
Median length5
Mean length4.4873418
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row서울특별시
2nd row부산광역시
3rd row대구광역시
4th row인천광역시
5th row광주광역시

Common Values

ValueCountFrequency (%)
경기도 25
 
7.9%
충청남도 25
 
7.9%
경상남도 23
 
7.3%
서울특별시 23
 
7.3%
대전광역시 22
 
7.0%
전라북도 22
 
7.0%
부산광역시 20
 
6.3%
경상북도 20
 
6.3%
울산광역시 20
 
6.3%
인천광역시 19
 
6.0%
Other values (7) 97
30.7%

Length

2023-12-12T10:25:35.230043image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
경기도 25
 
7.9%
충청남도 25
 
7.9%
경상남도 23
 
7.3%
서울특별시 23
 
7.3%
대전광역시 22
 
7.0%
전라북도 22
 
7.0%
경상북도 20
 
6.3%
울산광역시 20
 
6.3%
부산광역시 20
 
6.3%
인천광역시 19
 
6.0%
Other values (7) 97
30.7%

진료실인원(명)
Real number (ℝ)

Distinct51
Distinct (%)16.1%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean12.696203
Minimum1
Maximum285
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size2.9 KiB
2023-12-12T10:25:35.382364image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile1
Q12
median4
Q310
95-th percentile55
Maximum285
Range284
Interquartile range (IQR)8

Descriptive statistics

Standard deviation29.257414
Coefficient of variation (CV)2.3044225
Kurtosis37.846362
Mean12.696203
Median Absolute Deviation (MAD)3
Skewness5.5503371
Sum4012
Variance855.9963
MonotonicityNot monotonic
2023-12-12T10:25:35.535105image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 74
23.4%
2 52
16.5%
3 26
 
8.2%
4 25
 
7.9%
5 15
 
4.7%
7 13
 
4.1%
8 10
 
3.2%
6 10
 
3.2%
12 8
 
2.5%
10 7
 
2.2%
Other values (41) 76
24.1%
ValueCountFrequency (%)
1 74
23.4%
2 52
16.5%
3 26
 
8.2%
4 25
 
7.9%
5 15
 
4.7%
6 10
 
3.2%
7 13
 
4.1%
8 10
 
3.2%
9 6
 
1.9%
10 7
 
2.2%
ValueCountFrequency (%)
285 1
0.3%
212 1
0.3%
171 1
0.3%
167 1
0.3%
166 1
0.3%
148 1
0.3%
83 1
0.3%
71 1
0.3%
67 1
0.3%
62 2
0.6%

Interactions

2023-12-12T10:25:34.004310image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T10:25:35.653067image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
진료년도주상병코드상병명시도진료실인원(명)
진료년도1.0000.3360.3360.0000.160
주상병코드0.3361.0001.0000.0000.430
상병명0.3361.0001.0000.0000.430
시도0.0000.0000.0001.0000.000
진료실인원(명)0.1600.4300.4300.0001.000
2023-12-12T10:25:35.784689image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
시도주상병코드상병명진료년도
시도1.0000.0000.0000.000
주상병코드0.0001.0001.0000.156
상병명0.0001.0001.0000.156
진료년도0.0000.1560.1561.000
2023-12-12T10:25:35.915056image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
진료실인원(명)진료년도주상병코드상병명시도
진료실인원(명)1.0000.0660.2280.2280.000
진료년도0.0661.0000.1560.1560.000
주상병코드0.2280.1561.0001.0000.000
상병명0.2280.1561.0001.0000.000
시도0.0000.0000.0000.0001.000

Missing values

2023-12-12T10:25:34.150097image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T10:25:34.259330image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

진료년도주상병코드상병명시도진료실인원(명)
02019년T311신체표면의10-19%를침범한화상서울특별시167
12019년T311신체표면의10-19%를침범한화상부산광역시83
22019년T311신체표면의10-19%를침범한화상대구광역시18
32019년T311신체표면의10-19%를침범한화상인천광역시67
42019년T311신체표면의10-19%를침범한화상광주광역시5
52019년T311신체표면의10-19%를침범한화상대전광역시45
62019년T311신체표면의10-19%를침범한화상울산광역시22
72019년T311신체표면의10-19%를침범한화상세종특별자치시14
82019년T311신체표면의10-19%를침범한화상경기도285
92019년T311신체표면의10-19%를침범한화상강원도24
진료년도주상병코드상병명시도진료실인원(명)
3062021년T318신체표면의80-89%를침범한화상충청북도1
3072021년T318신체표면의80-89%를침범한화상충청남도1
3082021년T318신체표면의80-89%를침범한화상전라북도3
3092021년T318신체표면의80-89%를침범한화상경상북도1
3102021년T318신체표면의80-89%를침범한화상경상남도2
3112021년T319신체표면의90%이상을침범한화상서울특별시1
3122021년T319신체표면의90%이상을침범한화상인천광역시1
3132021년T319신체표면의90%이상을침범한화상경기도1
3142021년T319신체표면의90%이상을침범한화상충청남도4
3152021년T319신체표면의90%이상을침범한화상전라북도2