Overview

Dataset statistics

Number of variables6
Number of observations3300
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory161.3 KiB
Average record size in memory50.0 B

Variable types

Categorical5
Numeric1

Dataset

Description* 데이터 수정(연령 구간 0세, 1~4세 분리 적용) 2018년~2022년 간 특정 질환에 대한 ①연도별 산정특례 신규 등록건수 및 ②연도말 기준 적용건수 현황 1. 산출기준 (신규등록) 각 연도별 산정특례 신규등록자 수 (연도말 적용) 각 연도말 기준 산정특례 적용자 수 2. 연도: 2018년~2022년(5년) 3. 질환구분 * 보건복지부 고시 「본인일부부담금 산정특례에 관한 기준」 (이하, ‘고시’) - 중증화상: 고시 [별표 3] 중증질환자 산정특례 대상질환 구분4 - 중증치매(V800): 고시 [별표4의2] 중증난치질환자 산정특례 대상질환 구분6 - 중증치매(V810): 고시 [별표4의2] 중증난치질환자 산정특례 대상질환 구분7 - 희귀질환: 고시 [별표4] 희귀질환자 산정특례 대상 질환(극희귀질환·기타염색체이상질환·상세불명희귀질환 포함) - 중증난치질환: 고시 [별표4의2] 중증난치질환자 산정특례 대상질환 구분 1~5 - 결핵(V000): 고시 [별표5] 시행령 별표2 제3호 가목 3)에 따른 결핵질환의 적용 범위의 결핵질환 - 암: 고시 [별표 3] 중증질환자 산정특례 대상 의 구분1에 해당하는 경우 - 신규암: 신청당시 암 산정특례 등록 이력이 없거나, 기 등록된 암의 특례기간 종료 이후 추가 발생한 암을 등록·신청하는 경우 - 중복암: 암 산정특례 적용기간 중 등록한 암과 다른 암종이 추가로 발생(전이암 제외)하여 등록·신청하는 경우 ※ ‘암’ 연도말 적용 시 구분, ‘신규암’ 및 ‘중복암’ 신규 등록 시 구분 4. 성별: 남, 여 5. 연령: 0세, 1~4세, 5세부터는 5세 단위 구분 6. 건수: 등록건수 및 적용건수
URLhttps://www.data.go.kr/data/15113453/fileData.do

Alerts

등록건수 has 400 (12.1%) zerosZeros

Reproduction

Analysis started2023-12-11 23:14:35.870212
Analysis finished2023-12-11 23:14:36.666802
Duration0.8 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

산출기준
Categorical

Distinct2
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size25.9 KiB
신규등록자
1760 
연도말 적용자
1540 

Length

Max length7
Median length5
Mean length5.9333333
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row신규등록자
2nd row신규등록자
3rd row신규등록자
4th row신규등록자
5th row신규등록자

Common Values

ValueCountFrequency (%)
신규등록자 1760
53.3%
연도말 적용자 1540
46.7%

Length

2023-12-12T08:14:36.777206image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T08:14:36.913744image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
신규등록자 1760
36.4%
연도말 1540
31.8%
적용자 1540
31.8%

연도
Categorical

Distinct5
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size25.9 KiB
2018
660 
2019
660 
2020
660 
2021
660 
2022
660 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2018
2nd row2018
3rd row2018
4th row2018
5th row2018

Common Values

ValueCountFrequency (%)
2018 660
20.0%
2019 660
20.0%
2020 660
20.0%
2021 660
20.0%
2022 660
20.0%

Length

2023-12-12T08:14:37.037973image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T08:14:37.163274image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2018 660
20.0%
2019 660
20.0%
2020 660
20.0%
2021 660
20.0%
2022 660
20.0%

질환구분
Categorical

Distinct9
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size25.9 KiB
중증화상
440 
중증치매(V800)
440 
중증치매(V810)
440 
희귀질환(극희귀질환·기타염색체이상질환·상세불명희귀질환 포함)
440 
중증난치
440 
Other values (4)
1100 

Length

Max length33
Median length10
Mean length9.6666667
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row중증화상
2nd row중증화상
3rd row중증화상
4th row중증화상
5th row중증화상

Common Values

ValueCountFrequency (%)
중증화상 440
13.3%
중증치매(V800) 440
13.3%
중증치매(V810) 440
13.3%
희귀질환(극희귀질환·기타염색체이상질환·상세불명희귀질환 포함) 440
13.3%
중증난치 440
13.3%
결핵(V000) 440
13.3%
신규암 220
6.7%
중복암 220
6.7%
220
6.7%

Length

2023-12-12T08:14:37.319832image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T08:14:37.768068image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
중증화상 440
11.8%
중증치매(v800 440
11.8%
중증치매(v810 440
11.8%
희귀질환(극희귀질환·기타염색체이상질환·상세불명희귀질환 440
11.8%
포함 440
11.8%
중증난치 440
11.8%
결핵(v000 440
11.8%
신규암 220
5.9%
중복암 220
5.9%
220
5.9%

성별
Categorical

Distinct2
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size25.9 KiB
1650 
1650 

Length

Max length1
Median length1
Mean length1
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row
2nd row
3rd row
4th row
5th row

Common Values

ValueCountFrequency (%)
1650
50.0%
1650
50.0%

Length

2023-12-12T08:14:37.926693image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T08:14:38.063013image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
1650
50.0%
1650
50.0%

연령
Categorical

Distinct22
Distinct (%)0.7%
Missing0
Missing (%)0.0%
Memory size25.9 KiB
0
 
150
1~4
 
150
5~9
 
150
10~14
 
150
15~19
 
150
Other values (17)
2550 

Length

Max length6
Median length5
Mean length4.6818182
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row0
2nd row1~4
3rd row5~9
4th row10~14
5th row15~19

Common Values

ValueCountFrequency (%)
0 150
 
4.5%
1~4 150
 
4.5%
5~9 150
 
4.5%
10~14 150
 
4.5%
15~19 150
 
4.5%
20~24 150
 
4.5%
25~29 150
 
4.5%
30~34 150
 
4.5%
35~39 150
 
4.5%
40~44 150
 
4.5%
Other values (12) 1800
54.5%

Length

2023-12-12T08:14:38.170740image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
0 150
 
4.3%
55~59 150
 
4.3%
100 150
 
4.3%
95~99 150
 
4.3%
90~94 150
 
4.3%
85~89 150
 
4.3%
80~84 150
 
4.3%
75~79 150
 
4.3%
70~74 150
 
4.3%
65~69 150
 
4.3%
Other values (13) 1950
56.5%

등록건수
Real number (ℝ)

ZEROS 

Distinct1671
Distinct (%)50.6%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean3003.4388
Minimum0
Maximum98290
Zeros400
Zeros (%)12.1%
Negative0
Negative (%)0.0%
Memory size29.1 KiB
2023-12-12T08:14:38.316446image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q122.75
median336
Q31627.25
95-th percentile15271.6
Maximum98290
Range98290
Interquartile range (IQR)1604.5

Descriptive statistics

Standard deviation8661.6923
Coefficient of variation (CV)2.883925
Kurtosis41.233459
Mean3003.4388
Median Absolute Deviation (MAD)336
Skewness5.7281607
Sum9911348
Variance75024914
MonotonicityNot monotonic
2023-12-12T08:14:38.495245image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
0 400
 
12.1%
1 95
 
2.9%
2 48
 
1.5%
3 33
 
1.0%
4 28
 
0.8%
5 26
 
0.8%
10 19
 
0.6%
19 15
 
0.5%
12 15
 
0.5%
7 15
 
0.5%
Other values (1661) 2606
79.0%
ValueCountFrequency (%)
0 400
12.1%
1 95
 
2.9%
2 48
 
1.5%
3 33
 
1.0%
4 28
 
0.8%
5 26
 
0.8%
6 14
 
0.4%
7 15
 
0.5%
8 10
 
0.3%
9 10
 
0.3%
ValueCountFrequency (%)
98290 1
< 0.1%
94874 1
< 0.1%
93338 1
< 0.1%
89571 1
< 0.1%
88004 1
< 0.1%
81994 1
< 0.1%
80211 1
< 0.1%
80140 1
< 0.1%
78354 1
< 0.1%
76054 1
< 0.1%

Interactions

2023-12-12T08:14:36.302072image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T08:14:38.595655image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
산출기준연도질환구분성별연령등록건수
산출기준1.0000.0000.4400.0000.0000.263
연도0.0001.0000.0000.0000.0000.167
질환구분0.4400.0001.0000.0000.0000.434
성별0.0000.0000.0001.0000.0000.000
연령0.0000.0000.0000.0001.0000.213
등록건수0.2630.1670.4340.0000.2131.000
2023-12-12T08:14:38.734211image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
산출기준연도연령질환구분성별
산출기준1.0000.0000.0000.4410.000
연도0.0001.0000.0000.0000.000
연령0.0000.0001.0000.0000.000
질환구분0.4410.0000.0001.0000.000
성별0.0000.0000.0000.0001.000
2023-12-12T08:14:38.882754image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
등록건수산출기준연도질환구분성별연령
등록건수1.0000.2020.0700.2140.0000.080
산출기준0.2021.0000.0000.4410.0000.000
연도0.0700.0001.0000.0000.0000.000
질환구분0.2140.4410.0001.0000.0000.000
성별0.0000.0000.0000.0001.0000.000
연령0.0800.0000.0000.0000.0001.000

Missing values

2023-12-12T08:14:36.473787image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T08:14:36.613936image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

산출기준연도질환구분성별연령등록건수
0신규등록자2018중증화상0296
1신규등록자2018중증화상1~41037
2신규등록자2018중증화상5~9297
3신규등록자2018중증화상10~14228
4신규등록자2018중증화상15~19269
5신규등록자2018중증화상20~24420
6신규등록자2018중증화상25~29442
7신규등록자2018중증화상30~34402
8신규등록자2018중증화상35~39479
9신규등록자2018중증화상40~44441
산출기준연도질환구분성별연령등록건수
3290연도말 적용자202255~5981994
3291연도말 적용자202260~6494874
3292연도말 적용자202265~6978354
3293연도말 적용자202270~7461027
3294연도말 적용자202275~7948819
3295연도말 적용자202280~8440395
3296연도말 적용자202285~8919088
3297연도말 적용자202290~945719
3298연도말 적용자202295~99919
3299연도말 적용자2022100 이상109