Overview

Dataset statistics

Number of variables6
Number of observations462
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory22.2 KiB
Average record size in memory49.3 B

Variable types

Categorical5
Numeric1

Dataset

Description1. 2018~2022년 진료일기준(한의분류 제외, 약국 제외), 연령(연말기준)2. 건강보험 및 의료급여 실적이며, 비급여는 제외- 2023년 6월 심사분까지 반영3. 해당 질병통계 자료는 요양기관에서 환자진료 중 진단명이 확정되지 않은 상태에서의 호소, 증세 등에 따라일차진단명을 부여하고 청구한 내역 중 주진단명으로 발췌한 것이므로 최종 확정된 질병과는 다를 수 있음4. 분류 조건<그룹1> 아래의 주상병코드 and 수가코드○ 주상병코드 : I60(거미막하출혈), I61(뇌내출혈), I62(기타 비외상성 두개내출혈), I63(뇌경색증),I65(뇌경색증을 유발하지 않은 뇌전동맥의 폐쇄 및 협착), I66(뇌경색증을 유발하지 않은 대뇌동맥의 폐쇄 및 협착)○ 수가코드 : M6636, M6637, M6639, O2056, O2059<그룹2> 아래의 주상병코드 and 수가코드○ 주상병코드 : I20(협심증), I21(급성 심근경색증), I22(후속심근경색증), I23(급성 심근경색증 후 특정 현존 합병증), I25(만성 허혈심장병)○ 수가코드 : M6638, M6639, O0260, O1950수가코드 설명은 KOICD(질병분류정보센터)에서 확인하시기 바랍니다.※ 민원인의 공공데이터 제공 신청에 따라 발췌된 데이터입니다.
Author국민건강보험공단
URLhttps://www.data.go.kr/data/15126883/fileData.do

Alerts

보험자구분 is highly overall correlated with 구분High correlation
구분 is highly overall correlated with 보험자구분High correlation

Reproduction

Analysis started2024-03-14 22:59:07.310867
Analysis finished2024-03-14 22:59:08.425259
Duration1.11 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

보험자구분
Categorical

HIGH CORRELATION 

Distinct2
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size3.7 KiB
건강보험
265 
의료급여
197 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row건강보험
2nd row건강보험
3rd row건강보험
4th row건강보험
5th row건강보험

Common Values

ValueCountFrequency (%)
건강보험 265
57.4%
의료급여 197
42.6%

Length

2024-03-15T07:59:08.532962image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T07:59:08.712559image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
건강보험 265
57.4%
의료급여 197
42.6%

구분
Categorical

HIGH CORRELATION 

Distinct4
Distinct (%)0.9%
Missing0
Missing (%)0.0%
Memory size3.7 KiB
그룹 1
143 
그룹 2
122 
그룹2
99 
그룹1
98 

Length

Max length4
Median length4
Mean length3.5735931
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row그룹 1
2nd row그룹 1
3rd row그룹 1
4th row그룹 1
5th row그룹 1

Common Values

ValueCountFrequency (%)
그룹 1 143
31.0%
그룹 2 122
26.4%
그룹2 99
21.4%
그룹1 98
21.2%

Length

2024-03-15T07:59:08.910203image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T07:59:09.340797image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
그룹 265
36.5%
1 143
19.7%
2 122
16.8%
그룹2 99
 
13.6%
그룹1 98
 
13.5%

진료년도
Categorical

Distinct5
Distinct (%)1.1%
Missing0
Missing (%)0.0%
Memory size3.7 KiB
2018년
94 
2019년
94 
2020년
93 
2021년
92 
2022년
89 

Length

Max length5
Median length5
Mean length5
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2018년
2nd row2018년
3rd row2018년
4th row2018년
5th row2018년

Common Values

ValueCountFrequency (%)
2018년 94
20.3%
2019년 94
20.3%
2020년 93
20.1%
2021년 92
19.9%
2022년 89
19.3%

Length

2024-03-15T07:59:09.670530image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T07:59:09.848767image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2018년 94
20.3%
2019년 94
20.3%
2020년 93
20.1%
2021년 92
19.9%
2022년 89
19.3%

성별
Categorical

Distinct2
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size3.7 KiB
남자
244 
여자
218 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row남자
2nd row남자
3rd row남자
4th row남자
5th row남자

Common Values

ValueCountFrequency (%)
남자 244
52.8%
여자 218
47.2%

Length

2024-03-15T07:59:10.066446image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T07:59:10.341291image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
남자 244
52.8%
여자 218
47.2%

연령
Categorical

Distinct17
Distinct (%)3.7%
Missing0
Missing (%)0.0%
Memory size3.7 KiB
50~54세
40 
80세 이상
40 
45~49세
40 
55~59세
40 
60~64세
40 
Other values (12)
262 

Length

Max length6
Median length6
Mean length5.978355
Min length4

Unique

Unique1 ?
Unique (%)0.2%

Sample

1st row10~14세
2nd row15~19세
3rd row20~24세
4th row25~29세
5th row30~34세

Common Values

ValueCountFrequency (%)
50~54세 40
8.7%
80세 이상 40
8.7%
45~49세 40
8.7%
55~59세 40
8.7%
60~64세 40
8.7%
65~69세 40
8.7%
70~74세 40
8.7%
75~79세 40
8.7%
40~44세 33
7.1%
35~39세 31
 
6.7%
Other values (7) 78
16.9%

Length

2024-03-15T07:59:10.643582image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
50~54세 40
 
8.0%
80세 40
 
8.0%
이상 40
 
8.0%
45~49세 40
 
8.0%
55~59세 40
 
8.0%
60~64세 40
 
8.0%
65~69세 40
 
8.0%
70~74세 40
 
8.0%
75~79세 40
 
8.0%
40~44세 33
 
6.6%
Other values (8) 109
21.7%

진료인원(명)
Real number (ℝ)

Distinct179
Distinct (%)38.7%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean110.39394
Minimum0
Maximum1085
Zeros4
Zeros (%)0.9%
Negative0
Negative (%)0.0%
Memory size4.2 KiB
2024-03-15T07:59:10.902311image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile1
Q16
median24
Q3121.75
95-th percentile534.35
Maximum1085
Range1085
Interquartile range (IQR)115.75

Descriptive statistics

Standard deviation179.40653
Coefficient of variation (CV)1.6251484
Kurtosis4.9004205
Mean110.39394
Median Absolute Deviation (MAD)22
Skewness2.1848333
Sum51002
Variance32186.703
MonotonicityNot monotonic
2024-03-15T07:59:11.221196image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 38
 
8.2%
2 29
 
6.3%
3 19
 
4.1%
5 13
 
2.8%
9 12
 
2.6%
4 10
 
2.2%
7 9
 
1.9%
11 8
 
1.7%
19 8
 
1.7%
22 8
 
1.7%
Other values (169) 308
66.7%
ValueCountFrequency (%)
0 4
 
0.9%
1 38
8.2%
2 29
6.3%
3 19
4.1%
4 10
 
2.2%
5 13
 
2.8%
6 6
 
1.3%
7 9
 
1.9%
8 7
 
1.5%
9 12
 
2.6%
ValueCountFrequency (%)
1085 1
0.2%
931 1
0.2%
877 1
0.2%
863 1
0.2%
730 1
0.2%
720 1
0.2%
695 1
0.2%
673 1
0.2%
672 1
0.2%
662 1
0.2%

Interactions

2024-03-15T07:59:07.772841image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-03-15T07:59:11.386647image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
보험자구분구분진료년도성별연령진료인원(명)
보험자구분1.0001.0000.0000.0000.2730.638
구분1.0001.0000.0000.0000.1730.463
진료년도0.0000.0001.0000.0000.0000.000
성별0.0000.0000.0001.0000.0000.391
연령0.2730.1730.0000.0001.0000.363
진료인원(명)0.6380.4630.0000.3910.3631.000
2024-03-15T07:59:11.588691image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
보험자구분구분연령성별진료년도
보험자구분1.0000.9980.2410.0000.000
구분0.9981.0000.0950.0000.000
연령0.2410.0951.0000.0000.000
성별0.0000.0000.0001.0000.000
진료년도0.0000.0000.0000.0001.000
2024-03-15T07:59:11.879618image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
진료인원(명)보험자구분구분진료년도성별연령
진료인원(명)1.0000.4910.2920.0000.2980.148
보험자구분0.4911.0000.9980.0000.0000.241
구분0.2920.9981.0000.0000.0000.095
진료년도0.0000.0000.0001.0000.0000.000
성별0.2980.0000.0000.0001.0000.000
연령0.1480.2410.0950.0000.0001.000

Missing values

2024-03-15T07:59:08.104880image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-15T07:59:08.341966image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

보험자구분구분진료년도성별연령진료인원(명)
0건강보험그룹 12018년남자10~14세2
1건강보험그룹 12018년남자15~19세2
2건강보험그룹 12018년남자20~24세5
3건강보험그룹 12018년남자25~29세5
4건강보험그룹 12018년남자30~34세9
5건강보험그룹 12018년남자35~39세30
6건강보험그룹 12018년남자40~44세53
7건강보험그룹 12018년남자45~49세85
8건강보험그룹 12018년남자50~54세136
9건강보험그룹 12018년남자55~59세233
보험자구분구분진료년도성별연령진료인원(명)
452의료급여그룹22022년남자80세 이상23
453의료급여그룹22022년여자35~39세1
454의료급여그룹22022년여자45~49세2
455의료급여그룹22022년여자50~54세1
456의료급여그룹22022년여자55~59세3
457의료급여그룹22022년여자60~64세7
458의료급여그룹22022년여자65~69세5
459의료급여그룹22022년여자70~74세16
460의료급여그룹22022년여자75~79세16
461의료급여그룹22022년여자80세 이상27