Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 1156 |
Missing cells (%) | 1.7% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
Numeric | 2 |
---|---|
DateTime | 1 |
Categorical | 3 |
Text | 1 |
Dataset
Description | 한국장애인고용공단 장애인 취업 현황(순번,취업일자,연령,장애유형,중증여부,근무지역,취업직종대분류) |
---|---|
Author | 한국장애인고용공단 |
URL | https://www.data.go.kr/data/15088956/fileData.do |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
연령 is highly overall correlated with 중증여부 | High correlation |
장애유형 is highly overall correlated with 중증여부 | High correlation |
중증여부 is highly overall correlated with 연령 and 1 other fields | High correlation |
순번 has 289 (2.9%) missing values | Missing |
취업일자 has 289 (2.9%) missing values | Missing |
연령 has 289 (2.9%) missing values | Missing |
근무지역 has 289 (2.9%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 23:00:43.898138 |
---|---|
Analysis finished | 2023-12-12 23:00:45.451775 |
Duration | 1.55 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
MISSING
 
Distinct | 9711 |
---|---|
Distinct (%) | 100.0% |
Missing | 289 |
Missing (%) | 2.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 22502.442 |
Minimum | 7 |
---|---|
Maximum | 45116 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 7 |
---|---|
5-th percentile | 2050 |
Q1 | 11363.5 |
median | 22476 |
Q3 | 33828.5 |
95-th percentile | 42779.5 |
Maximum | 45116 |
Range | 45109 |
Interquartile range (IQR) | 22465 |
Descriptive statistics
Standard deviation | 13024.919 |
---|---|
Coefficient of variation (CV) | 0.57882246 |
Kurtosis | -1.1847378 |
Mean | 22502.442 |
Median Absolute Deviation (MAD) | 11234 |
Skewness | 0.0019305164 |
Sum | 2.1852122 × 108 |
Variance | 1.6964852 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
10572 | 1 | < 0.1% |
22401 | 1 | < 0.1% |
13876 | 1 | < 0.1% |
42708 | 1 | < 0.1% |
16389 | 1 | < 0.1% |
23213 | 1 | < 0.1% |
34280 | 1 | < 0.1% |
7736 | 1 | < 0.1% |
40539 | 1 | < 0.1% |
22773 | 1 | < 0.1% |
Other values (9701) | 9701 | |
(Missing) | 289 | 2.9% |
Value | Count | Frequency (%) |
7 | 1 | |
20 | 1 | |
25 | 1 | |
28 | 1 | |
32 | 1 | |
34 | 1 | |
35 | 1 | |
45 | 1 | |
47 | 1 | |
48 | 1 |
Value | Count | Frequency (%) |
45116 | 1 | |
45113 | 1 | |
45109 | 1 | |
45107 | 1 | |
45105 | 1 | |
45104 | 1 | |
45102 | 1 | |
45088 | 1 | |
45085 | 1 | |
45073 | 1 |
취업일자
Date
MISSING
 
Distinct | 316 |
---|---|
Distinct (%) | 3.3% |
Missing | 289 |
Missing (%) | 2.9% |
Memory size | 156.2 KiB |
Minimum | 2022-01-01 00:00:00 |
---|---|
Maximum | 2022-12-30 00:00:00 |
연령
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 69 |
---|---|
Distinct (%) | 0.7% |
Missing | 289 |
Missing (%) | 2.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 45.684584 |
Minimum | 17 |
---|---|
Maximum | 85 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 17 |
---|---|
5-th percentile | 20 |
Q1 | 28 |
median | 46 |
Q3 | 62 |
95-th percentile | 74 |
Maximum | 85 |
Range | 68 |
Interquartile range (IQR) | 34 |
Descriptive statistics
Standard deviation | 17.992506 |
---|---|
Coefficient of variation (CV) | 0.39384195 |
Kurtosis | -1.310383 |
Mean | 45.684584 |
Median Absolute Deviation (MAD) | 17 |
Skewness | 0.10263758 |
Sum | 443643 |
Variance | 323.73027 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
22 | 277 | 2.8% |
20 | 254 | 2.5% |
23 | 253 | 2.5% |
25 | 251 | 2.5% |
24 | 249 | 2.5% |
27 | 249 | 2.5% |
62 | 247 | 2.5% |
21 | 241 | 2.4% |
28 | 240 | 2.4% |
26 | 230 | 2.3% |
Other values (59) | 7220 | |
(Missing) | 289 | 2.9% |
Value | Count | Frequency (%) |
17 | 2 | < 0.1% |
18 | 46 | 0.5% |
19 | 210 | |
20 | 254 | |
21 | 241 | |
22 | 277 | |
23 | 253 | |
24 | 249 | |
25 | 251 | |
26 | 230 |
Value | Count | Frequency (%) |
85 | 4 | < 0.1% |
84 | 3 | < 0.1% |
83 | 16 | 0.2% |
82 | 11 | 0.1% |
81 | 18 | 0.2% |
80 | 33 | |
79 | 45 | |
78 | 41 | |
77 | 57 | |
76 | 63 |
장애유형
Categorical
HIGH CORRELATION
 
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
지체장애 | |
---|---|
지적장애 | |
시각장애 | |
청각장애 | |
뇌병변장애 | |
Other values (13) |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 4.1048 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 청각장애 |
---|---|
2nd row | 뇌병변장애 |
3rd row | 지적장애 |
4th row | 지체장애 |
5th row | 자폐성장애 |
Common Values
Value | Count | Frequency (%) |
지체장애 | 3136 | |
지적장애 | 2736 | |
시각장애 | 1004 | 10.0% |
청각장애 | 850 | 8.5% |
뇌병변장애 | 699 | 7.0% |
정신장애 | 532 | 5.3% |
<NA> | 289 | 2.9% |
자폐성장애 | 282 | 2.8% |
신장장애 | 196 | 2.0% |
언어장애 | 84 | 0.8% |
Other values (8) | 192 | 1.9% |
Length
Value | Count | Frequency (%) |
지체장애 | 3136 | |
지적장애 | 2736 | |
시각장애 | 1004 | 10.0% |
청각장애 | 850 | 8.5% |
뇌병변장애 | 699 | 7.0% |
정신장애 | 532 | 5.3% |
na | 289 | 2.9% |
자폐성장애 | 282 | 2.8% |
신장장애 | 196 | 2.0% |
언어장애 | 84 | 0.8% |
Other values (9) | 193 | 1.9% |
중증여부
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
중증 | |
---|---|
경증 | |
<NA> | 289 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0578 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 경증 |
---|---|
2nd row | 중증 |
3rd row | 중증 |
4th row | 경증 |
5th row | 중증 |
Common Values
Value | Count | Frequency (%) |
중증 | 5659 | |
경증 | 4052 | |
<NA> | 289 | 2.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
중증 | 5659 | |
경증 | 4052 | |
na | 289 | 2.9% |
근무지역
Text
MISSING
 
Distinct | 264 |
---|---|
Distinct (%) | 2.7% |
Missing | 289 |
Missing (%) | 2.9% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
서울 | 2131 | 10.6% |
경기 | 1953 | 9.7% |
부산 | 591 | 2.9% |
경남 | 509 | 2.5% |
경북 | 501 | 2.5% |
인천 | 478 | 2.4% |
충북 | 449 | 2.2% |
충남 | 430 | 2.1% |
대구 | 406 | 2.0% |
전남 | 381 | 1.9% |
Other values (246) | 12296 |
Most occurring characters
Value | Count | Frequency (%) |
10414 | ||
구 | 5794 | 9.5% |
시 | 4490 | 7.4% |
경 | 3080 | 5.0% |
서 | 2938 | 4.8% |
울 | 2488 | 4.1% |
남 | 2291 | 3.8% |
기 | 2013 | 3.3% |
주 | 1734 | 2.8% |
산 | 1704 | 2.8% |
Other values (139) | 24049 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 50453 | |
Space Separator | 10414 | 17.1% |
Open Punctuation | 64 | 0.1% |
Close Punctuation | 64 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 5794 | 11.5% |
시 | 4490 | 8.9% |
경 | 3080 | 6.1% |
서 | 2938 | 5.8% |
울 | 2488 | 4.9% |
남 | 2291 | 4.5% |
기 | 2013 | 4.0% |
주 | 1734 | 3.4% |
산 | 1704 | 3.4% |
북 | 1637 | 3.2% |
Other values (136) | 22284 |
Space Separator
Value | Count | Frequency (%) |
10414 |
Open Punctuation
Value | Count | Frequency (%) |
( | 64 |
Close Punctuation
Value | Count | Frequency (%) |
) | 64 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 50453 | |
Common | 10542 | 17.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 5794 | 11.5% |
시 | 4490 | 8.9% |
경 | 3080 | 6.1% |
서 | 2938 | 5.8% |
울 | 2488 | 4.9% |
남 | 2291 | 4.5% |
기 | 2013 | 4.0% |
주 | 1734 | 3.4% |
산 | 1704 | 3.4% |
북 | 1637 | 3.2% |
Other values (136) | 22284 |
Common
Value | Count | Frequency (%) |
10414 | ||
( | 64 | 0.6% |
) | 64 | 0.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 50453 | |
ASCII | 10542 | 17.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
10414 | ||
( | 64 | 0.6% |
) | 64 | 0.6% |
Hangul
Value | Count | Frequency (%) |
구 | 5794 | 11.5% |
시 | 4490 | 8.9% |
경 | 3080 | 6.1% |
서 | 2938 | 5.8% |
울 | 2488 | 4.9% |
남 | 2291 | 4.5% |
기 | 2013 | 4.0% |
주 | 1734 | 3.4% |
산 | 1704 | 3.4% |
북 | 1637 | 3.2% |
Other values (136) | 22284 |
취업직종대분류
Categorical
Distinct | 34 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경영·행정·사무직 | |
---|---|
청소 및 기타 개인서비스직 | |
제조 단순직 | |
경호·경비직 | |
보건·의료직 | |
Other values (29) |
Length
Max length | 33 |
---|---|
Median length | 23 |
Mean length | 10.092 |
Min length | 3 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 경영·행정·사무직 |
---|---|
2nd row | 스포츠·레크리에이션직 |
3rd row | 제조 단순직 |
4th row | 건설·채굴직 |
5th row | 스포츠·레크리에이션직 |
Common Values
Value | Count | Frequency (%) |
경영·행정·사무직 | 3672 | |
청소 및 기타 개인서비스직 | 2536 | |
제조 단순직 | 672 | 6.7% |
경호·경비직 | 478 | 4.8% |
보건·의료직 | 439 | 4.4% |
음식 서비스직 | 328 | 3.3% |
<NA> | 289 | 2.9% |
인쇄·목재·공예 및 기타 설치·정비·생산직 | 197 | 2.0% |
돌봄 서비스직(간병·육아) | 191 | 1.9% |
영업·판매직 | 153 | 1.5% |
Other values (24) | 1045 | 10.4% |
Length
Value | Count | Frequency (%) |
경영·행정·사무직 | 3672 | |
및 | 2800 | |
기타 | 2733 | |
개인서비스직 | 2536 | |
청소 | 2536 | |
제조 | 703 | 3.5% |
단순직 | 672 | 3.4% |
경호·경비직 | 478 | 2.4% |
보건·의료직 | 439 | 2.2% |
설치·정비·생산직 | 405 | 2.0% |
Other values (37) | 3003 |
순번 | 연령 | 장애유형 | 중증여부 | 취업직종대분류 | |
---|---|---|---|---|---|
순번 | 1.000 | 0.155 | 0.127 | 0.109 | 0.461 |
연령 | 0.155 | 1.000 | 0.553 | 0.665 | 0.415 |
장애유형 | 0.127 | 0.553 | 1.000 | 0.732 | 0.470 |
중증여부 | 0.109 | 0.665 | 0.732 | 1.000 | 0.375 |
취업직종대분류 | 0.461 | 0.415 | 0.470 | 0.375 | 1.000 |
장애유형 | 중증여부 | 취업직종대분류 | |
---|---|---|---|
장애유형 | 1.000 | 0.673 | 0.147 |
중증여부 | 0.673 | 1.000 | 0.318 |
취업직종대분류 | 0.147 | 0.318 | 1.000 |
순번 | 연령 | 장애유형 | 중증여부 | 취업직종대분류 | |
---|---|---|---|---|---|
순번 | 1.000 | -0.077 | 0.050 | 0.083 | 0.181 |
연령 | -0.077 | 1.000 | 0.251 | 0.517 | 0.159 |
장애유형 | 0.050 | 0.251 | 1.000 | 0.673 | 0.147 |
중증여부 | 0.083 | 0.517 | 0.673 | 1.000 | 0.318 |
취업직종대분류 | 0.181 | 0.159 | 0.147 | 0.318 | 1.000 |
순번 | 취업일자 | 연령 | 장애유형 | 중증여부 | 근무지역 | 취업직종대분류 | |
---|---|---|---|---|---|---|---|
1936 | 1937 | 2022-01-01 | 67 | 청각장애 | 경증 | 경기 수원시 | 경영·행정·사무직 |
6536 | 6537 | 2022-09-07 | 60 | 뇌병변장애 | 중증 | 서울 영등포구 | 스포츠·레크리에이션직 |
42210 | 42211 | 2022-02-28 | 28 | 지적장애 | 중증 | 경남 창원시 의창구 | 제조 단순직 |
17494 | 17495 | 2022-05-09 | 70 | 지체장애 | 경증 | 광주 북구 | 건설·채굴직 |
3373 | 3374 | 2022-04-11 | 21 | 자폐성장애 | 중증 | 서울 강서구 | 스포츠·레크리에이션직 |
30965 | 30966 | 2022-02-17 | 41 | 지적장애 | 중증 | 전남 담양군 | 인쇄·목재·공예 및 기타 설치·정비·생산직 |
25261 | 25262 | 2022-01-01 | 62 | 간장애 | 경증 | 경북 구미시 | 청소 및 기타 개인서비스직 |
31401 | 31402 | 2022-08-09 | 50 | 지적장애 | 중증 | 광주 서구 | 제조 단순직 |
13472 | 13473 | 2022-10-11 | 22 | 자폐성장애 | 중증 | 서울 강남구 | 영업·판매직 |
36763 | 36764 | 2022-08-08 | 61 | 청각장애 | 중증 | 서울 성동구 | 청소 및 기타 개인서비스직 |
순번 | 취업일자 | 연령 | 장애유형 | 중증여부 | 근무지역 | 취업직종대분류 | |
---|---|---|---|---|---|---|---|
20781 | 20782 | 2022-02-01 | 66 | 지체장애 | 경증 | 서울 금천구 | 경호·경비직 |
37954 | 37955 | 2022-07-04 | 43 | 정신장애 | 중증 | 경북 포항시 북구 | 제조 단순직 |
38982 | 38983 | 2022-11-11 | 23 | 지적장애 | 중증 | 서울 종로구 | 스포츠·레크리에이션직 |
15733 | 15734 | 2022-09-01 | 55 | 지체장애 | 경증 | 서울 종로구 | 경호·경비직 |
42388 | 42389 | 2022-01-01 | 52 | 지적장애 | 중증 | 경북 경산시 | 제조 단순직 |
17896 | 17897 | 2022-01-03 | 65 | 지체장애 | 경증 | 전북 남원시 | 경영·행정·사무직 |
22722 | 22723 | 2022-03-01 | 23 | 지적장애 | 중증 | 인천 서구 | 음식 서비스직 |
40884 | 40885 | 2022-08-24 | 35 | 지적장애 | 중증 | 인천 계양구 | 제조 단순직 |
2205 | 2206 | 2022-01-01 | 51 | 심장장애 | 경증 | 대구 동구 | 경영·행정·사무직 |
9242 | 9243 | 2022-08-01 | 24 | 지적장애 | 중증 | 서울 영등포구 | 청소 및 기타 개인서비스직 |
Most frequently occurring
순번 | 취업일자 | 연령 | 장애유형 | 중증여부 | 근무지역 | 취업직종대분류 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 289 |