Overview

Dataset statistics

Number of variables5
Number of observations80
Missing cells2
Missing cells (%)0.5%
Duplicate rows1
Duplicate rows (%)1.2%
Total size in memory3.3 KiB
Average record size in memory41.6 B

Variable types

Categorical4
Text1

Dataset

Description등록장애인 중 병역판정검사 대상자
Author병무청
URLhttps://www.data.go.kr/data/3066480/fileData.do

Alerts

Dataset has 1 (1.2%) duplicate rowsDuplicates
장애구분 is highly overall correlated with 장애구분2 and 1 other fieldsHigh correlation
장애구분2 is highly overall correlated with 장애구분 and 1 other fieldsHigh correlation
장애정도 is highly overall correlated with 장애상태High correlation
장애상태 is highly overall correlated with 장애구분 and 2 other fieldsHigh correlation
장애정도 is highly imbalanced (83.3%)Imbalance
장애상태2 has 2 (2.5%) missing valuesMissing

Reproduction

Analysis started2023-12-12 21:28:29.905495
Analysis finished2023-12-12 21:28:30.350334
Duration0.44 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

장애구분
Categorical

HIGH CORRELATION 

Distinct8
Distinct (%)10.0%
Missing0
Missing (%)0.0%
Memory size772.0 B
지체장애인
53 
청각장애인
시각장애인
 
5
언어장애인
 
5
안면장애인
 
3
Other values (3)

Length

Max length25
Median length5
Mean length5.75
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row지체장애인
2nd row지체장애인
3rd row지체장애인
4th row지체장애인
5th row지체장애인

Common Values

ValueCountFrequency (%)
지체장애인 53
66.2%
청각장애인 7
 
8.8%
시각장애인 5
 
6.2%
언어장애인 5
 
6.2%
안면장애인 3
 
3.8%
창자샛길(장루)장애인 및 요로샛길(요루)장애인 3
 
3.8%
뇌병변장애인 2
 
2.5%
<NA> 2
 
2.5%

Length

2023-12-13T06:28:30.413973image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T06:28:30.881764image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
지체장애인 53
61.6%
청각장애인 7
 
8.1%
시각장애인 5
 
5.8%
언어장애인 5
 
5.8%
안면장애인 3
 
3.5%
창자샛길(장루)장애인 3
 
3.5%
3
 
3.5%
요로샛길(요루)장애인 3
 
3.5%
뇌병변장애인 2
 
2.3%
na 2
 
2.3%

장애구분2
Categorical

HIGH CORRELATION 

Distinct12
Distinct (%)15.0%
Missing0
Missing (%)0.0%
Memory size772.0 B
관절장애
27 
지체기능장애
18 
변형 등의 장애
시각장애인
청력장애
Other values (7)
20 

Length

Max length25
Median length8
Mean length5.75
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row절단장애
2nd row절단장애
3rd row절단장애
4th row관절장애
5th row관절장애

Common Values

ValueCountFrequency (%)
관절장애 27
33.8%
지체기능장애 18
22.5%
변형 등의 장애 5
 
6.2%
시각장애인 5
 
6.2%
청력장애 5
 
6.2%
언어장애인 5
 
6.2%
절단장애 3
 
3.8%
안면장애인 3
 
3.8%
창자샛길(장루)장애인 및 요로샛길(요루)장애인 3
 
3.8%
뇌병변장애인 2
 
2.5%
Other values (2) 4
 
5.0%

Length

2023-12-13T06:28:31.019885image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
관절장애 27
28.1%
지체기능장애 18
18.8%
변형 5
 
5.2%
등의 5
 
5.2%
장애 5
 
5.2%
시각장애인 5
 
5.2%
청력장애 5
 
5.2%
언어장애인 5
 
5.2%
절단장애 3
 
3.1%
안면장애인 3
 
3.1%
Other values (6) 15
15.6%

장애정도
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct3
Distinct (%)3.8%
Missing0
Missing (%)0.0%
Memory size772.0 B
장애의 정도가 심하지 않은 장애인
77 
<NA>
 
2
장애의 정도가 심한 장애인
 
1

Length

Max length18
Median length18
Mean length17.6
Min length4

Unique

Unique1 ?
Unique (%)1.2%

Sample

1st row장애의 정도가 심하지 않은 장애인
2nd row장애의 정도가 심하지 않은 장애인
3rd row장애의 정도가 심하지 않은 장애인
4th row장애의 정도가 심하지 않은 장애인
5th row장애의 정도가 심하지 않은 장애인

Common Values

ValueCountFrequency (%)
장애의 정도가 심하지 않은 장애인 77
96.2%
<NA> 2
 
2.5%
장애의 정도가 심한 장애인 1
 
1.2%

Length

2023-12-13T06:28:31.146024image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T06:28:31.248856image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
장애의 78
19.9%
정도가 78
19.9%
장애인 78
19.9%
심하지 77
19.7%
않은 77
19.7%
na 2
 
0.5%
심한 1
 
0.3%

장애상태
Categorical

HIGH CORRELATION 

Distinct37
Distinct (%)46.2%
Missing0
Missing (%)0.0%
Memory size772.0 B
상지관절
15 
하지관절
12 
상지기능
11 
하지기능
상지절단
 
3
Other values (32)
35 

Length

Max length138
Median length4
Mean length20.0625
Min length4

Unique

Unique30 ?
Unique (%)37.5%

Sample

1st row상지절단
2nd row상지절단
3rd row상지절단
4th row상지관절
5th row상지관절

Common Values

ValueCountFrequency (%)
상지관절 15
18.8%
하지관절 12
15.0%
상지기능 11
13.8%
하지기능 4
 
5.0%
상지절단 3
 
3.8%
척추장애 3
 
3.8%
<NA> 2
 
2.5%
좋은 눈의 시력이 0.2 이하인 사람 1
 
1.2%
두 귀에 들리는 보통 말소리의 최대의 명료도가 50% 이하인 사람 1
 
1.2%
두 귀의 청력손실이 각각 70데시벨(dB) 이상인 사람 1
 
1.2%
Other values (27) 27
33.8%

Length

2023-12-13T06:28:31.399502image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
사람 26
 
6.8%
상지관절 15
 
3.9%
하지관절 12
 
3.1%
상지기능 11
 
2.9%
8
 
2.1%
있으며 7
 
1.8%
이상인 6
 
1.6%
귀의 5
 
1.3%
눈의 5
 
1.3%
이하인 5
 
1.3%
Other values (202) 284
74.0%

장애상태2
Text

MISSING 

Distinct78
Distinct (%)100.0%
Missing2
Missing (%)2.5%
Memory size772.0 B
2023-12-13T06:28:31.654278image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length138
Median length58
Mean length46.948718
Min length11

Characters and Unicode

Total characters3662
Distinct characters252
Distinct categories11 ?
Distinct scripts3 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique78 ?
Unique (%)100.0%

Sample

1st row한 손의 엄지손가락을 손허리손가락관절(중수수지관절) 이상 부위에서 잃은 사람
2nd row한 손의 엄지손가락을 지관절 이상 부위에서 잃은 사람
3rd row한 손의 둘째손가락을 포함하여 2개의 손가락을 근위지관절 이상 부위에서 잃은 사람
4th row한 팔의 3대 관절 중 한 관절의 운동범위가 75% 이상 감소한 사람
5th row두 손의 엄지손가락의 관절총운동범위가 각각 75% 이상 감소된 사람
ValueCountFrequency (%)
사람 59
 
6.5%
41
 
4.5%
이상 38
 
4.2%
각각 31
 
3.4%
감소된 28
 
3.1%
손의 24
 
2.6%
75 21
 
2.3%
운동범위가 18
 
2.0%
17
 
1.9%
50 16
 
1.8%
Other values (268) 617
67.8%
2023-12-13T06:28:32.129585image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
839
 
22.9%
104
 
2.8%
103
 
2.8%
102
 
2.8%
76
 
2.1%
76
 
2.1%
75
 
2.0%
66
 
1.8%
62
 
1.7%
58
 
1.6%
Other values (242) 2101
57.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2442
66.7%
Space Separator 839
 
22.9%
Decimal Number 214
 
5.8%
Other Punctuation 73
 
2.0%
Close Punctuation 29
 
0.8%
Open Punctuation 29
 
0.8%
Lowercase Letter 14
 
0.4%
Uppercase Letter 11
 
0.3%
Math Symbol 8
 
0.2%
Other Symbol 2
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
104
 
4.3%
103
 
4.2%
102
 
4.2%
76
 
3.1%
76
 
3.1%
75
 
3.1%
66
 
2.7%
62
 
2.5%
58
 
2.4%
52
 
2.1%
Other values (211) 1668
68.3%
Decimal Number
ValueCountFrequency (%)
5 51
23.8%
0 43
20.1%
3 24
11.2%
7 22
10.3%
1 21
9.8%
2 18
 
8.4%
6 11
 
5.1%
4 9
 
4.2%
9 8
 
3.7%
8 7
 
3.3%
Uppercase Letter
ValueCountFrequency (%)
B 5
45.5%
S 2
 
18.2%
P 1
 
9.1%
F 1
 
9.1%
A 1
 
9.1%
I 1
 
9.1%
Other Punctuation
ValueCountFrequency (%)
% 47
64.4%
, 17
 
23.3%
. 4
 
5.5%
/ 4
 
5.5%
: 1
 
1.4%
Lowercase Letter
ValueCountFrequency (%)
d 5
35.7%
i 3
21.4%
l 3
21.4%
e 3
21.4%
Space Separator
ValueCountFrequency (%)
839
100.0%
Close Punctuation
ValueCountFrequency (%)
) 29
100.0%
Open Punctuation
ValueCountFrequency (%)
( 29
100.0%
Math Symbol
ValueCountFrequency (%)
8
100.0%
Other Symbol
ValueCountFrequency (%)
2
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2442
66.7%
Common 1195
32.6%
Latin 25
 
0.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
104
 
4.3%
103
 
4.2%
102
 
4.2%
76
 
3.1%
76
 
3.1%
75
 
3.1%
66
 
2.7%
62
 
2.5%
58
 
2.4%
52
 
2.1%
Other values (211) 1668
68.3%
Common
ValueCountFrequency (%)
839
70.2%
5 51
 
4.3%
% 47
 
3.9%
0 43
 
3.6%
) 29
 
2.4%
( 29
 
2.4%
3 24
 
2.0%
7 22
 
1.8%
1 21
 
1.8%
2 18
 
1.5%
Other values (11) 72
 
6.0%
Latin
ValueCountFrequency (%)
B 5
20.0%
d 5
20.0%
i 3
12.0%
l 3
12.0%
e 3
12.0%
S 2
 
8.0%
P 1
 
4.0%
F 1
 
4.0%
A 1
 
4.0%
I 1
 
4.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2439
66.6%
ASCII 1210
33.0%
Math Operators 8
 
0.2%
Compat Jamo 3
 
0.1%
CJK Compat 2
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
839
69.3%
5 51
 
4.2%
% 47
 
3.9%
0 43
 
3.6%
) 29
 
2.4%
( 29
 
2.4%
3 24
 
2.0%
7 22
 
1.8%
1 21
 
1.7%
2 18
 
1.5%
Other values (19) 87
 
7.2%
Hangul
ValueCountFrequency (%)
104
 
4.3%
103
 
4.2%
102
 
4.2%
76
 
3.1%
76
 
3.1%
75
 
3.1%
66
 
2.7%
62
 
2.5%
58
 
2.4%
52
 
2.1%
Other values (210) 1665
68.3%
Math Operators
ValueCountFrequency (%)
8
100.0%
Compat Jamo
ValueCountFrequency (%)
3
100.0%
CJK Compat
ValueCountFrequency (%)
2
100.0%

Correlations

2023-12-13T06:28:32.232750image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
장애구분장애구분2장애정도장애상태장애상태2
장애구분1.0001.0000.2281.0001.000
장애구분21.0001.0000.2771.0001.000
장애정도0.2280.2771.0001.0001.000
장애상태1.0001.0001.0001.0001.000
장애상태21.0001.0001.0001.0001.000
2023-12-13T06:28:32.323208image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
장애구분장애상태장애구분2장애정도
장애구분1.0000.7690.9710.233
장애상태0.7691.0000.7920.743
장애구분20.9710.7921.0000.246
장애정도0.2330.7430.2461.000
2023-12-13T06:28:32.430222image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
장애구분장애구분2장애정도장애상태
장애구분1.0000.9710.2330.769
장애구분20.9711.0000.2460.792
장애정도0.2330.2461.0000.743
장애상태0.7690.7920.7431.000

Missing values

2023-12-13T06:28:30.215782image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T06:28:30.313259image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

장애구분장애구분2장애정도장애상태장애상태2
0지체장애인절단장애장애의 정도가 심하지 않은 장애인상지절단한 손의 엄지손가락을 손허리손가락관절(중수수지관절) 이상 부위에서 잃은 사람
1지체장애인절단장애장애의 정도가 심하지 않은 장애인상지절단한 손의 엄지손가락을 지관절 이상 부위에서 잃은 사람
2지체장애인절단장애장애의 정도가 심하지 않은 장애인상지절단한 손의 둘째손가락을 포함하여 2개의 손가락을 근위지관절 이상 부위에서 잃은 사람
3지체장애인관절장애장애의 정도가 심하지 않은 장애인상지관절한 팔의 3대 관절 중 한 관절의 운동범위가 75% 이상 감소한 사람
4지체장애인관절장애장애의 정도가 심하지 않은 장애인상지관절두 손의 엄지손가락의 관절총운동범위가 각각 75% 이상 감소된 사람
5지체장애인관절장애장애의 정도가 심하지 않은 장애인상지관절한 손의 엄지손가락과 둘째손가락의 관절총운동범위가 각각 75% 이상 감소된 사람
6지체장애인관절장애장애의 정도가 심하지 않은 장애인상지관절한 손의 엄지손가락 또는 둘째손가락을 포함하여 3개 손가락의 관절총운동범위가 각각 75% 이상 감소된 사람
7지체장애인관절장애장애의 정도가 심하지 않은 장애인상지관절한 손의 엄지손가락 또는 둘째손가락을 포함하여 4개 손가락의 관절총운동범위가 각각 50% 이상 75% 미만 감소된 사람
8지체장애인관절장애장애의 정도가 심하지 않은 장애인상지관절한 팔의 3대 관절 중 2개의 운동범위가 50% 이상 75% 미만 감소된 사람
9지체장애인관절장애장애의 정도가 심하지 않은 장애인상지관절한 팔의 모든 3대 관절의 운동범위가 각각 25% 이상 50% 미만 감소된 사람
장애구분장애구분2장애정도장애상태장애상태2
70언어장애인언어장애인장애의 정도가 심하지 않은 장애인매우 제한된 표현만을 할 수 있는 표현언어지수가 25∼65인 경우로서 지적장애 또는 자폐성장애로 판정되지 아니하는 경우매우 제한된 표현만을 할 수 있는 표현언어지수가 25∼65인 경우로서 지적장애 또는 자폐성장애로 판정되지 아니하는 경우
71언어장애인언어장애인장애의 정도가 심하지 않은 장애인매우 제한된 이해만을 할 수 있는 수용언어지수가 25∼65인 경우로서 지적장애 또는 자폐성장애로 판정되지 아니하는 경우매우 제한된 이해만을 할 수 있는 수용언어지수가 25∼65인 경우로서 지적장애 또는 자폐성장애로 판정되지 아니하는 경우
72안면장애인안면장애인장애의 정도가 심하지 않은 장애인노출된 안면부의 60% 이상의 변형이 있는 사람노출된 안면부의 60% 이상의 변형이 있는 사람
73안면장애인안면장애인장애의 정도가 심하지 않은 장애인노출된 안면부의 45% 이상이 변형된 사람노출된 안면부의 45% 이상이 변형된 사람
74안면장애인안면장애인장애의 정도가 심하지 않은 장애인코 형태의 1/3 이상이 없어진 사람코 형태의 1/3 이상이 없어진 사람
75창자샛길(장루)장애인 및 요로샛길(요루)장애인창자샛길(장루)장애인 및 요로샛길(요루)장애인장애의 정도가 심하지 않은 장애인창자샛길 또는 요로샛길을 가진 사람창자샛길 또는 요로샛길을 가진 사람
76창자샛길(장루)장애인 및 요로샛길(요루)장애인창자샛길(장루)장애인 및 요로샛길(요루)장애인장애의 정도가 심하지 않은 장애인방광샛길(방광루)을 가지고 있으며, 합병증으로 창자피부샛길(장피누공)이 있는 사람방광샛길(방광루)을 가지고 있으며, 합병증으로 창자피부샛길(장피누공)이 있는 사람
77창자샛길(장루)장애인 및 요로샛길(요루)장애인창자샛길(장루)장애인 및 요로샛길(요루)장애인장애의 정도가 심하지 않은 장애인방광샛길을 가진 사람방광샛길을 가진 사람
78<NA><NA><NA><NA><NA>
79<NA><NA><NA><NA><NA>

Duplicate rows

Most frequently occurring

장애구분장애구분2장애정도장애상태장애상태2# duplicates
0<NA><NA><NA><NA><NA>2