Overview

Dataset statistics

Number of variables7
Number of observations822
Missing cells326
Missing cells (%)5.7%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory45.1 KiB
Average record size in memory56.2 B

Variable types

Categorical5
Text2

Dataset

Description1. 주소지 구분: 수진자 주소지 기준, 요양기관 주소지 기준2. 진료년도: 2013년, 2022년(진료일기준)3. (시도) 강원도, 경상북도, (시군구) 동해시, 태백시, 삼척시, 영월군, 정선군, 안동시, 영주시, 영양군, 봉화군, 울진군4. 주상병코드: 그룹 구분 해당 파일 확인5. 상급종합병원 및 종합병원의 입원 진료인원이며 건강보험 급여실적(2023년 6월 심사분까지 반영)- 의료급여 제외, 비급여 제외, 한의분류 제외6. 관내 진료인원: 수진자 주소지와 입원 진료받은 요양기관 주소지가 일치하는 경우관외 진료인원: 수진자 주소지와 입원 진료받은 요양기관 주소지가 일치하지 않는 경우7. 개인정보 보호를 위해 시군구 단위의 5인 미만 자료는 '*' 처리※ 해당 질병통계 자료는 요양기관에서 환자진료 중 진단명이 확정되지 않은 상태에서의 호소, 증세 등에 따라일차진단명을 부여하고 청구한 내역 중 주진단명 기준으로 발췌한 것이므로 최종 확정된 질병과는 다를 수 있음※ 민원인의 공공데이터 제공 신청에 따라 발췌 및 구성된 데이터입니다.
Author국민건강보험공단
URLhttps://www.data.go.kr/data/15126917/fileData.do

Alerts

시군구 is highly overall correlated with 시도High correlation
시도 is highly overall correlated with 시군구High correlation
관내진료인원(명) has 298 (36.3%) missing valuesMissing
관외진료인원(명) has 28 (3.4%) missing valuesMissing

Reproduction

Analysis started2024-03-14 18:29:38.919357
Analysis finished2024-03-14 18:29:40.318740
Duration1.4 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

주소지 구분
Categorical

Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
수진자 주소지 기준
555 
요양기관 주소지 기준
267 

Length

Max length11
Median length10
Mean length10.324818
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row수진자 주소지 기준
2nd row수진자 주소지 기준
3rd row수진자 주소지 기준
4th row수진자 주소지 기준
5th row수진자 주소지 기준

Common Values

ValueCountFrequency (%)
수진자 주소지 기준 555
67.5%
요양기관 주소지 기준 267
32.5%

Length

2024-03-15T03:29:40.618161image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T03:29:40.964517image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
주소지 822
33.3%
기준 822
33.3%
수진자 555
22.5%
요양기관 267
 
10.8%

진료년도
Categorical

Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
2022년
426 
2013년
396 

Length

Max length5
Median length5
Mean length5
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2013년
2nd row2013년
3rd row2013년
4th row2013년
5th row2013년

Common Values

ValueCountFrequency (%)
2022년 426
51.8%
2013년 396
48.2%

Length

2024-03-15T03:29:41.148642image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T03:29:41.323200image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2022년 426
51.8%
2013년 396
48.2%

시도
Categorical

HIGH CORRELATION 

Distinct2
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
강원도
464 
경상북도
358 

Length

Max length4
Median length3
Mean length3.4355231
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row강원도
2nd row강원도
3rd row강원도
4th row강원도
5th row강원도

Common Values

ValueCountFrequency (%)
강원도 464
56.4%
경상북도 358
43.6%

Length

2024-03-15T03:29:41.510106image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T03:29:41.694631image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
강원도 464
56.4%
경상북도 358
43.6%

시군구
Categorical

HIGH CORRELATION 

Distinct10
Distinct (%)1.2%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
안동시
112 
삼척시
105 
동해시
104 
태백시
103 
영월군
97 
Other values (5)
301 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row동해시
2nd row동해시
3rd row동해시
4th row동해시
5th row동해시

Common Values

ValueCountFrequency (%)
안동시 112
13.6%
삼척시 105
12.8%
동해시 104
12.7%
태백시 103
12.5%
영월군 97
11.8%
영주시 80
9.7%
봉화군 56
6.8%
정선군 55
6.7%
영양군 55
6.7%
울진군 55
6.7%

Length

2024-03-15T03:29:41.906082image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T03:29:42.257022image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
안동시 112
13.6%
삼척시 105
12.8%
동해시 104
12.7%
태백시 103
12.5%
영월군 97
11.8%
영주시 80
9.7%
봉화군 56
6.8%
정선군 55
6.7%
영양군 55
6.7%
울진군 55
6.7%

주상병코드
Categorical

Distinct28
Distinct (%)3.4%
Missing0
Missing (%)0.0%
Memory size6.5 KiB
특정감염성 및 기생충성 질환(A00 - B99)
 
31
소화기계의 질환(K00 - K93)
 
31
호흡기계의 질환(J00 - J99)
 
31
내분비 영양 및 대사질환(E00 - E90)
 
31
정신 및 행동장애(F00 - F99)
 
31
Other values (23)
667 

Length

Max length51
Median length37
Mean length25.947689
Min length14

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row특정감염성 및 기생충성 질환(A00 - B99)
2nd row신생물(C00 - D48)
3rd row혈액 및 조혈기관의 질환과 면역기전을 침범한 특정 장애(D50 - D89)
4th row내분비 영양 및 대사질환(E00 - E90)
5th row정신 및 행동장애(F00 - F99)

Common Values

ValueCountFrequency (%)
특정감염성 및 기생충성 질환(A00 - B99) 31
 
3.8%
소화기계의 질환(K00 - K93) 31
 
3.8%
호흡기계의 질환(J00 - J99) 31
 
3.8%
내분비 영양 및 대사질환(E00 - E90) 31
 
3.8%
정신 및 행동장애(F00 - F99) 31
 
3.8%
신경계의 질환(G00 - G99) 31
 
3.8%
귀 및 유양돌기의 질환(H60 - H95) 31
 
3.8%
순환기계의 질환(I00 - I99) 31
 
3.8%
혈액 및 조혈기관의 질환과 면역기전을 침범한 특정 장애(D50 - D89) 31
 
3.8%
피부 및 피하조직의 질환(L00 - L99) 31
 
3.8%
Other values (18) 512
62.3%

Length

2024-03-15T03:29:42.749331image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
625
 
13.1%
334
 
7.0%
특정 62
 
1.3%
결합조직의 31
 
0.6%
신생물(c00 31
 
0.6%
n99 31
 
0.6%
질환(n00 31
 
0.6%
비뇨생식기계의 31
 
0.6%
m99 31
 
0.6%
질환(m00 31
 
0.6%
Other values (121) 3544
74.1%
Distinct151
Distinct (%)28.8%
Missing298
Missing (%)36.3%
Memory size6.5 KiB
2024-03-15T03:29:43.909243image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length4
Median length3
Mean length2.1450382
Min length1

Characters and Unicode

Total characters1124
Distinct characters11
Distinct categories2 ?
Distinct scripts1 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row359
2nd row55
3rd row*
4th row56
5th row44
ValueCountFrequency (%)
94
 
17.9%
5 16
 
3.1%
8 12
 
2.3%
16 10
 
1.9%
25 10
 
1.9%
24 8
 
1.5%
65 8
 
1.5%
328 6
 
1.1%
15 6
 
1.1%
44 6
 
1.1%
Other values (141) 348
66.4%
2024-03-15T03:29:45.496652image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1 174
15.5%
2 126
11.2%
5 116
10.3%
4 102
9.1%
3 98
8.7%
* 94
8.4%
6 94
8.4%
8 92
8.2%
7 90
8.0%
9 76
6.8%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 1030
91.6%
Other Punctuation 94
 
8.4%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
1 174
16.9%
2 126
12.2%
5 116
11.3%
4 102
9.9%
3 98
9.5%
6 94
9.1%
8 92
8.9%
7 90
8.7%
9 76
7.4%
0 62
 
6.0%
Other Punctuation
ValueCountFrequency (%)
* 94
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 1124
100.0%

Most frequent character per script

Common
ValueCountFrequency (%)
1 174
15.5%
2 126
11.2%
5 116
10.3%
4 102
9.1%
3 98
8.7%
* 94
8.4%
6 94
8.4%
8 92
8.2%
7 90
8.0%
9 76
6.8%

Most occurring blocks

ValueCountFrequency (%)
ASCII 1124
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1 174
15.5%
2 126
11.2%
5 116
10.3%
4 102
9.1%
3 98
8.7%
* 94
8.4%
6 94
8.4%
8 92
8.2%
7 90
8.0%
9 76
6.8%
Distinct342
Distinct (%)43.1%
Missing28
Missing (%)3.4%
Memory size6.5 KiB
2024-03-15T03:29:47.018629image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length4
Median length3
Mean length2.3274559
Min length1

Characters and Unicode

Total characters1848
Distinct characters11
Distinct categories2 ?
Distinct scripts1 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique208 ?
Unique (%)26.2%

Sample

1st row247
2nd row873
3rd row37
4th row123
5th row39
ValueCountFrequency (%)
63
 
7.9%
10 15
 
1.9%
11 13
 
1.6%
28 13
 
1.6%
31 11
 
1.4%
29 10
 
1.3%
43 10
 
1.3%
40 8
 
1.0%
16 8
 
1.0%
35 8
 
1.0%
Other values (332) 635
80.0%
2024-03-15T03:29:48.755444image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1 339
18.3%
2 247
13.4%
3 230
12.4%
4 191
10.3%
5 156
8.4%
6 134
 
7.3%
7 128
 
6.9%
9 121
 
6.5%
0 120
 
6.5%
8 119
 
6.4%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 1785
96.6%
Other Punctuation 63
 
3.4%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
1 339
19.0%
2 247
13.8%
3 230
12.9%
4 191
10.7%
5 156
8.7%
6 134
 
7.5%
7 128
 
7.2%
9 121
 
6.8%
0 120
 
6.7%
8 119
 
6.7%
Other Punctuation
ValueCountFrequency (%)
* 63
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 1848
100.0%

Most frequent character per script

Common
ValueCountFrequency (%)
1 339
18.3%
2 247
13.4%
3 230
12.4%
4 191
10.3%
5 156
8.4%
6 134
 
7.3%
7 128
 
6.9%
9 121
 
6.5%
0 120
 
6.5%
8 119
 
6.4%

Most occurring blocks

ValueCountFrequency (%)
ASCII 1848
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1 339
18.3%
2 247
13.4%
3 230
12.4%
4 191
10.3%
5 156
8.4%
6 134
 
7.3%
7 128
 
6.9%
9 121
 
6.5%
0 120
 
6.5%
8 119
 
6.4%

Correlations

2024-03-15T03:29:48.973861image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
주소지 구분진료년도시도시군구주상병코드
주소지 구분1.0000.0200.2770.5470.000
진료년도0.0201.0000.0000.0000.000
시도0.2770.0001.0001.0000.000
시군구0.5470.0001.0001.0000.000
주상병코드0.0000.0000.0000.0001.000
2024-03-15T03:29:49.272889image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
주상병코드시군구시도진료년도주소지 구분
주상병코드1.0000.0000.0000.0000.000
시군구0.0001.0000.9950.0000.420
시도0.0000.9951.0000.0000.179
진료년도0.0000.0000.0001.0000.012
주소지 구분0.0000.4200.1790.0121.000
2024-03-15T03:29:49.540519image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
주소지 구분진료년도시도시군구주상병코드
주소지 구분1.0000.0120.1790.4200.000
진료년도0.0121.0000.0000.0000.000
시도0.1790.0001.0000.9950.000
시군구0.4200.0000.9951.0000.000
주상병코드0.0000.0000.0000.0001.000

Missing values

2024-03-15T03:29:39.466194image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-15T03:29:39.876333image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2024-03-15T03:29:40.181513image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

주소지 구분진료년도시도시군구주상병코드관내진료인원(명)관외진료인원(명)
0수진자 주소지 기준2013년강원도동해시특정감염성 및 기생충성 질환(A00 - B99)359247
1수진자 주소지 기준2013년강원도동해시신생물(C00 - D48)55873
2수진자 주소지 기준2013년강원도동해시혈액 및 조혈기관의 질환과 면역기전을 침범한 특정 장애(D50 - D89)*37
3수진자 주소지 기준2013년강원도동해시내분비 영양 및 대사질환(E00 - E90)56123
4수진자 주소지 기준2013년강원도동해시정신 및 행동장애(F00 - F99)4439
5수진자 주소지 기준2013년강원도동해시신경계의 질환(G00 - G99)46160
6수진자 주소지 기준2013년강원도동해시눈및눈부속기의 질환(H00 - H59)<NA>142
7수진자 주소지 기준2013년강원도동해시귀 및 유양돌기의 질환(H60 - H95)4765
8수진자 주소지 기준2013년강원도동해시순환기계의 질환(I00 - I99)139786
9수진자 주소지 기준2013년강원도동해시호흡기계의 질환(J00 - J99)531462
주소지 구분진료년도시도시군구주상병코드관내진료인원(명)관외진료인원(명)
812요양기관 주소지 기준2022년경상북도안동시C50 C79.80 D05 D24 D48.62548
813요양기관 주소지 기준2022년경상북도안동시C53 C79.81 D06 D26.0 D39.01112
814요양기관 주소지 기준2022년경상북도안동시C73 C79.88 D09.3 D34 D44.0 C75.0 D09.38 D35.1 D44.2511
815요양기관 주소지 기준2022년경상북도영주시C16 C78.8 D00.2 D13.1 D37.15*
816요양기관 주소지 기준2022년경상북도영주시C18 C78.5 D01.0 D12.6 D37.4**
817요양기관 주소지 기준2022년경상북도영주시C34 C78.0 D02.2 D14.3 D38.1**
818요양기관 주소지 기준2022년경상북도영주시C22 C78.7 D01.5 D13.4 D37.6*<NA>
819요양기관 주소지 기준2022년경상북도영주시C50 C79.80 D05 D24 D48.6**
820요양기관 주소지 기준2022년경상북도영주시C53 C79.81 D06 D26.0 D39.0*<NA>
821요양기관 주소지 기준2022년경상북도영주시C73 C79.88 D09.3 D34 D44.0 C75.0 D09.38 D35.1 D44.2**