Overview

Dataset statistics

Number of variables6
Number of observations2011
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory96.4 KiB
Average record size in memory49.1 B

Variable types

Categorical5
Text1

Dataset

Description비진행성 연소성 원위부 상지 근위축(G128)의 성별 연령별 환자수 입니다.1. 진료일기준(한의분류 제외, 약국 제외), 연령(연말기준)2. 건강보험 급여실적(의료급여 제외)이며, 비급여는 제외- 2023년 6월 지급분까지 반영3. 아래 질병통계 자료는 요양기관에서 환자진료중 진단명이 확정되지 않은 상태에서의 호소, 증세 등에 따라일차진단명을 부여하고 청구한 내역중 주진단명 기준으로 발췌한 것이므로 최종확정된 질병과는 다를수 있음주상병코드: G128
Author국민건강보험공단
URLhttps://www.data.go.kr/data/15125132/fileData.do

Alerts

진료인원(명) is highly imbalanced (81.3%)Imbalance

Reproduction

Analysis started2023-12-12 21:19:16.540451
Analysis finished2023-12-12 21:19:17.144761
Duration0.6 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

진료년도
Categorical

Distinct13
Distinct (%)0.6%
Missing0
Missing (%)0.0%
Memory size15.8 KiB
2012년
189 
2011년
182 
2015년
181 
2013년
179 
2016년
171 
Other values (8)
1109 

Length

Max length5
Median length5
Mean length5
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2010년
2nd row2010년
3rd row2010년
4th row2010년
5th row2010년

Common Values

ValueCountFrequency (%)
2012년 189
9.4%
2011년 182
9.1%
2015년 181
9.0%
2013년 179
8.9%
2016년 171
8.5%
2014년 165
8.2%
2010년 163
8.1%
2017년 153
7.6%
2018년 148
7.4%
2019년 133
 
6.6%
Other values (3) 347
17.3%

Length

2023-12-13T06:19:17.203553image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
2012년 189
9.4%
2011년 182
9.1%
2015년 181
9.0%
2013년 179
8.9%
2016년 171
8.5%
2014년 165
8.2%
2010년 163
8.1%
2017년 153
7.6%
2018년 148
7.4%
2019년 133
 
6.6%
Other values (3) 347
17.3%

시도
Categorical

Distinct17
Distinct (%)0.8%
Missing0
Missing (%)0.0%
Memory size15.8 KiB
서울특별시
399 
경기도
399 
부산광역시
276 
경상남도
154 
경상북도
98 
Other values (12)
685 

Length

Max length7
Median length5
Mean length4.3436101
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row서울특별시
2nd row서울특별시
3rd row서울특별시
4th row서울특별시
5th row서울특별시

Common Values

ValueCountFrequency (%)
서울특별시 399
19.8%
경기도 399
19.8%
부산광역시 276
13.7%
경상남도 154
 
7.7%
경상북도 98
 
4.9%
충청남도 98
 
4.9%
인천광역시 88
 
4.4%
전라북도 72
 
3.6%
전라남도 68
 
3.4%
대전광역시 67
 
3.3%
Other values (7) 292
14.5%

Length

2023-12-13T06:19:17.345230image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
서울특별시 399
19.8%
경기도 399
19.8%
부산광역시 276
13.7%
경상남도 154
 
7.7%
경상북도 98
 
4.9%
충청남도 98
 
4.9%
인천광역시 88
 
4.4%
전라북도 72
 
3.6%
전라남도 68
 
3.4%
대전광역시 67
 
3.3%
Other values (7) 292
14.5%
Distinct10
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size15.8 KiB
상급종합병원
765 
의원
543 
종합병원
304 
병원
193 
요양병원
169 
Other values (5)
 
37

Length

Max length6
Median length5
Mean length4.0193933
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row상급종합병원
2nd row상급종합병원
3rd row상급종합병원
4th row상급종합병원
5th row상급종합병원

Common Values

ValueCountFrequency (%)
상급종합병원 765
38.0%
의원 543
27.0%
종합병원 304
 
15.1%
병원 193
 
9.6%
요양병원 169
 
8.4%
보건소 23
 
1.1%
한방병원 5
 
0.2%
보건진료소 4
 
0.2%
보건지소 4
 
0.2%
치과병원 1
 
< 0.1%

Length

2023-12-13T06:19:17.475111image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T06:19:17.611271image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
상급종합병원 765
38.0%
의원 543
27.0%
종합병원 304
 
15.1%
병원 193
 
9.6%
요양병원 169
 
8.4%
보건소 23
 
1.1%
한방병원 5
 
0.2%
보건진료소 4
 
0.2%
보건지소 4
 
0.2%
치과병원 1
 
< 0.1%

연령
Text

Distinct94
Distinct (%)4.7%
Missing0
Missing (%)0.0%
Memory size15.8 KiB
2023-12-13T06:19:17.928941image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length3
Median length3
Mean length2.9398309
Min length2

Characters and Unicode

Total characters5912
Distinct characters11
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique3 ?
Unique (%)0.1%

Sample

1st row3세
2nd row6세
3rd row7세
4th row7세
5th row9세
ValueCountFrequency (%)
19세 63
 
3.1%
56세 52
 
2.6%
20세 46
 
2.3%
58세 44
 
2.2%
62세 43
 
2.1%
69세 42
 
2.1%
18세 41
 
2.0%
61세 41
 
2.0%
57세 40
 
2.0%
63세 39
 
1.9%
Other values (84) 1560
77.6%
2023-12-13T06:19:18.384535image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2011
34.0%
6 586
 
9.9%
5 584
 
9.9%
2 468
 
7.9%
1 465
 
7.9%
7 443
 
7.5%
4 359
 
6.1%
3 318
 
5.4%
8 260
 
4.4%
9 215
 
3.6%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 3901
66.0%
Other Letter 2011
34.0%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
6 586
15.0%
5 584
15.0%
2 468
12.0%
1 465
11.9%
7 443
11.4%
4 359
9.2%
3 318
8.2%
8 260
6.7%
9 215
 
5.5%
0 203
 
5.2%
Other Letter
ValueCountFrequency (%)
2011
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 3901
66.0%
Hangul 2011
34.0%

Most frequent character per script

Common
ValueCountFrequency (%)
6 586
15.0%
5 584
15.0%
2 468
12.0%
1 465
11.9%
7 443
11.4%
4 359
9.2%
3 318
8.2%
8 260
6.7%
9 215
 
5.5%
0 203
 
5.2%
Hangul
ValueCountFrequency (%)
2011
100.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 3901
66.0%
Hangul 2011
34.0%

Most frequent character per block

Hangul
ValueCountFrequency (%)
2011
100.0%
ASCII
ValueCountFrequency (%)
6 586
15.0%
5 584
15.0%
2 468
12.0%
1 465
11.9%
7 443
11.4%
4 359
9.2%
3 318
8.2%
8 260
6.7%
9 215
 
5.5%
0 203
 
5.2%

성별
Categorical

Distinct2
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size15.8 KiB
남자
1398 
여자
613 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row남자
2nd row남자
3rd row남자
4th row여자
5th row남자

Common Values

ValueCountFrequency (%)
남자 1398
69.5%
여자 613
30.5%

Length

2023-12-13T06:19:18.536261image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T06:19:18.649941image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
남자 1398
69.5%
여자 613
30.5%

진료인원(명)
Categorical

IMBALANCE 

Distinct3
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size15.8 KiB
1
1913 
2
 
92
3
 
6

Length

Max length1
Median length1
Mean length1
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row1
2nd row2
3rd row1
4th row1
5th row1

Common Values

ValueCountFrequency (%)
1 1913
95.1%
2 92
 
4.6%
3 6
 
0.3%

Length

2023-12-13T06:19:18.763613image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T06:19:18.891221image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
1 1913
95.1%
2 92
 
4.6%
3 6
 
0.3%

Correlations

2023-12-13T06:19:18.973143image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
진료년도시도요양기관종별연령성별진료인원(명)
진료년도1.0000.1560.1850.2270.0530.018
시도0.1561.0000.3320.0000.1570.126
요양기관종별0.1850.3321.0000.4890.2890.135
연령0.2270.0000.4891.0000.3050.109
성별0.0530.1570.2890.3051.0000.044
진료인원(명)0.0180.1260.1350.1090.0441.000
2023-12-13T06:19:19.092050image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
성별요양기관종별진료인원(명)진료년도시도
성별1.0000.2210.0730.0490.141
요양기관종별0.2211.0000.0810.0770.135
진료인원(명)0.0730.0811.0000.0100.067
진료년도0.0490.0770.0101.0000.055
시도0.1410.1350.0670.0551.000
2023-12-13T06:19:19.196168image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
진료년도시도요양기관종별성별진료인원(명)
진료년도1.0000.0550.0770.0490.010
시도0.0551.0000.1350.1410.067
요양기관종별0.0770.1351.0000.2210.081
성별0.0490.1410.2211.0000.073
진료인원(명)0.0100.0670.0810.0731.000

Missing values

2023-12-13T06:19:16.972794image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T06:19:17.092979image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

진료년도시도요양기관종별연령성별진료인원(명)
02010년서울특별시상급종합병원3세남자1
12010년서울특별시상급종합병원6세남자2
22010년서울특별시상급종합병원7세남자1
32010년서울특별시상급종합병원7세여자1
42010년서울특별시상급종합병원9세남자1
52010년서울특별시상급종합병원9세여자1
62010년서울특별시상급종합병원11세남자1
72010년서울특별시상급종합병원17세여자1
82010년서울특별시상급종합병원18세남자2
92010년서울특별시상급종합병원19세남자1
진료년도시도요양기관종별연령성별진료인원(명)
20012022년경상남도상급종합병원24세남자1
20022022년경상남도상급종합병원32세여자1
20032022년경상남도상급종합병원33세여자1
20042022년경상남도상급종합병원53세남자1
20052022년경상남도병원17세여자1
20062022년경상남도병원48세남자1
20072022년경상남도병원61세남자1
20082022년경상남도요양병원43세남자1
20092022년경상남도의원55세여자1
20102022년제주특별자치도종합병원62세남자1