Overview

Dataset statistics

Number of variables5
Number of observations1100
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory45.2 KiB
Average record size in memory42.1 B

Variable types

Categorical4
Numeric1

Dataset

Description중증화상, 결핵, 중증질환(신규암, 재등록암, 중복암) 등록자 수 1. 연도: 2017년 ~ 2021년 2. 구분: 중증화상, 결핵, 신규암, 재등록암, 중복암 3. 성별: 남, 여 4. 연령: 5세 단위(연도말 기준 만 나이) - 단, 0세와 1~4세 구분(0세, 1~4세/5~9세/…/100세 이상) 5. 등록자수: 연도 내 구분별 중복 제거 6. 구분질환 설명 ①중증화상: 보건복지부 고시 「본인일부부담금 산정특례에 관한 기준」(이하 ‘복지부 고시’) [별표3] 중증질환자 산정특례 대상의 구분4에 해당하는 경우 ②결핵: 복지부 고시 [별표5] 시행령 별표2 제3호 가목 3)에 따른 결핵질환의 적용 범위의 결핵질환 ③암: 복지부 고시 [별표3] 중증질환자 산정특례 대상의 구분1에 해당하는 경우 ④신규암: 신청 당시 암 산정특례 등록이력이 없거나, 기등록된 암의 특례기간 종료 이후 추가 발생한 암을 등록 · 신청하는 경우 ⑤재등록암: 암 산정특례 기간 종료 시점에 재등록 사유가 발생하여 등록 · 신청하는 경우 * (재등록 사유) 암환자가 특례기간 종료시점에 잔존암, 전이암이 있거나, 추가로 재발이 확인되는 경우로서 암조직의 제거ㆍ소멸을 목적으로 수술, 방사선ㆍ호르몬 등의 항암치료 중인 경우이거나, 항암제를 계속 투여 중인 경우 ⑥중복암: 암 산정특례 적용기간 중 등록한 암과 다른 암종이 추가로 발생(전이암 제외)하여 등록 · 신청하는 경우
URLhttps://www.data.go.kr/data/15113661/fileData.do

Alerts

등록자수 has 47 (4.3%) zerosZeros

Reproduction

Analysis started2023-12-12 15:12:35.613919
Analysis finished2023-12-12 15:12:36.226577
Duration0.61 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연도
Categorical

Distinct5
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size8.7 KiB
2017
220 
2018
220 
2019
220 
2020
220 
2021
220 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2017
2nd row2017
3rd row2017
4th row2017
5th row2017

Common Values

ValueCountFrequency (%)
2017 220
20.0%
2018 220
20.0%
2019 220
20.0%
2020 220
20.0%
2021 220
20.0%

Length

2023-12-13T00:12:36.334838image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T00:12:36.512308image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2017 220
20.0%
2018 220
20.0%
2019 220
20.0%
2020 220
20.0%
2021 220
20.0%

구분
Categorical

Distinct5
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size8.7 KiB
중증화상
220 
결핵
220 
신규암
220 
재등록암
220 
중복암
220 

Length

Max length4
Median length3
Mean length3.2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row중증화상
2nd row중증화상
3rd row중증화상
4th row중증화상
5th row중증화상

Common Values

ValueCountFrequency (%)
중증화상 220
20.0%
결핵 220
20.0%
신규암 220
20.0%
재등록암 220
20.0%
중복암 220
20.0%

Length

2023-12-13T00:12:36.711130image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T00:12:36.874696image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
중증화상 220
20.0%
결핵 220
20.0%
신규암 220
20.0%
재등록암 220
20.0%
중복암 220
20.0%

성별
Categorical

Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size8.7 KiB
550 
550 

Length

Max length1
Median length1
Mean length1
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row
2nd row
3rd row
4th row
5th row

Common Values

ValueCountFrequency (%)
550
50.0%
550
50.0%

Length

2023-12-13T00:12:37.068899image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T00:12:37.222703image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
550
50.0%
550
50.0%

연령
Categorical

Distinct22
Distinct (%)2.0%
Missing0
Missing (%)0.0%
Memory size8.7 KiB
0
 
50
1~4
 
50
5~9
 
50
10~14
 
50
15~19
 
50
Other values (17)
850 

Length

Max length6
Median length5
Mean length4.6818182
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row0
2nd row1~4
3rd row5~9
4th row10~14
5th row15~19

Common Values

ValueCountFrequency (%)
0 50
 
4.5%
1~4 50
 
4.5%
5~9 50
 
4.5%
10~14 50
 
4.5%
15~19 50
 
4.5%
20~24 50
 
4.5%
25~29 50
 
4.5%
30~34 50
 
4.5%
35~39 50
 
4.5%
40~44 50
 
4.5%
Other values (12) 600
54.5%

Length

2023-12-13T00:12:37.366564image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
0 50
 
4.3%
55~59 50
 
4.3%
100 50
 
4.3%
95~99 50
 
4.3%
90~94 50
 
4.3%
85~89 50
 
4.3%
80~84 50
 
4.3%
75~79 50
 
4.3%
70~74 50
 
4.3%
65~69 50
 
4.3%
Other values (13) 650
56.5%

등록자수
Real number (ℝ)

ZEROS 

Distinct713
Distinct (%)64.8%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean1692.2191
Minimum0
Maximum22572
Zeros47
Zeros (%)4.3%
Negative0
Negative (%)0.0%
Memory size9.8 KiB
2023-12-13T00:12:37.517027image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile1
Q151
median357.5
Q31100.5
95-th percentile11646.25
Maximum22572
Range22572
Interquartile range (IQR)1049.5

Descriptive statistics

Standard deviation3909.2418
Coefficient of variation (CV)2.3101275
Kurtosis10.308803
Mean1692.2191
Median Absolute Deviation (MAD)336.5
Skewness3.2905403
Sum1861441
Variance15282172
MonotonicityNot monotonic
2023-12-13T00:12:37.654509image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
0 47
 
4.3%
1 18
 
1.6%
2 15
 
1.4%
12 13
 
1.2%
3 8
 
0.7%
4 8
 
0.7%
22 7
 
0.6%
5 7
 
0.6%
7 7
 
0.6%
10 7
 
0.6%
Other values (703) 963
87.5%
ValueCountFrequency (%)
0 47
4.3%
1 18
 
1.6%
2 15
 
1.4%
3 8
 
0.7%
4 8
 
0.7%
5 7
 
0.6%
6 3
 
0.3%
7 7
 
0.6%
8 5
 
0.5%
9 4
 
0.4%
ValueCountFrequency (%)
22572 1
0.1%
21804 1
0.1%
21801 1
0.1%
20710 1
0.1%
20235 1
0.1%
20061 1
0.1%
19961 1
0.1%
19777 1
0.1%
19592 1
0.1%
19459 1
0.1%

Interactions

2023-12-13T00:12:35.890481image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T00:12:37.744153image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연도구분성별연령등록자수
연도1.0000.0000.0000.0000.000
구분0.0001.0000.0000.0000.661
성별0.0000.0001.0000.0000.224
연령0.0000.0000.0001.0000.488
등록자수0.0000.6610.2240.4881.000
2023-12-13T00:12:37.855128image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분연도연령성별
구분1.0000.0000.0000.000
연도0.0001.0000.0000.000
연령0.0000.0001.0000.000
성별0.0000.0000.0001.000
2023-12-13T00:12:37.949293image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
등록자수연도구분성별연령
등록자수1.0000.0000.3330.1710.202
연도0.0001.0000.0000.0000.000
구분0.3330.0001.0000.0000.000
성별0.1710.0000.0001.0000.000
연령0.2020.0000.0000.0001.000

Missing values

2023-12-13T00:12:36.029896image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T00:12:36.168414image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연도구분성별연령등록자수
02017중증화상0378
12017중증화상1~41005
22017중증화상5~9263
32017중증화상10~14165
42017중증화상15~19212
52017중증화상20~24371
62017중증화상25~29418
72017중증화상30~34365
82017중증화상35~39405
92017중증화상40~44419
연도구분성별연령등록자수
10902021중복암55~591595
10912021중복암60~642102
10922021중복암65~691800
10932021중복암70~741523
10942021중복암75~791378
10952021중복암80~841018
10962021중복암85~89474
10972021중복암90~94106
10982021중복암95~9921
10992021중복암100 이상2