Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 2661 |
Missing cells | 5409 |
Missing cells (%) | 15.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 278.2 KiB |
Average record size in memory | 107.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 6 |
Text | 5 |
Boolean | 1 |
Dataset
Description | 한국교통안전공단 철도자격관리시스템의 철도관련 기관 정보 데이터, 응시자격코드 데이터, 시스템을 구성하는 데이터를 포함하고있습니다. |
---|---|
Author | 한국교통안전공단 |
URL | https://www.data.go.kr/data/15064510/fileData.do |
대분류 has constant value "" | Constant |
영문 테이블명 is highly overall correlated with 순번 and 5 other fields | High correlation |
소지면허코드 is highly overall correlated with 순번 and 4 other fields | High correlation |
면허경력구분 is highly overall correlated with 순번 and 4 other fields | High correlation |
경력년수 is highly overall correlated with 순번 and 4 other fields | High correlation |
사용여부 is highly overall correlated with 순번 and 4 other fields | High correlation |
한글 테이블명 is highly overall correlated with 순번 and 5 other fields | High correlation |
순번 is highly overall correlated with 영문 테이블명 and 5 other fields | High correlation |
면허경력구분 is highly imbalanced (96.0%) | Imbalance |
소지면허코드 is highly imbalanced (98.4%) | Imbalance |
경력년수 is highly imbalanced (98.7%) | Imbalance |
상위(분류)코드 has 644 (24.2%) missing values | Missing |
기관코드 has 2114 (79.4%) missing values | Missing |
경력유형코드 has 2651 (99.6%) missing values | Missing |
순번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 10:39:11.390711 |
---|---|
Analysis finished | 2023-12-12 10:39:12.844612 |
Duration | 1.45 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 2661 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1331 |
Minimum | 1 |
---|---|
Maximum | 2661 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 23.5 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 134 |
Q1 | 666 |
median | 1331 |
Q3 | 1996 |
95-th percentile | 2528 |
Maximum | 2661 |
Range | 2660 |
Interquartile range (IQR) | 1330 |
Descriptive statistics
Standard deviation | 768.30886 |
---|---|
Coefficient of variation (CV) | 0.57724182 |
Kurtosis | -1.2 |
Mean | 1331 |
Median Absolute Deviation (MAD) | 665 |
Skewness | 0 |
Sum | 3541791 |
Variance | 590298.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
1769 | 1 | < 0.1% |
1771 | 1 | < 0.1% |
1772 | 1 | < 0.1% |
1773 | 1 | < 0.1% |
1774 | 1 | < 0.1% |
1775 | 1 | < 0.1% |
1776 | 1 | < 0.1% |
1777 | 1 | < 0.1% |
1778 | 1 | < 0.1% |
Other values (2651) | 2651 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
2661 | 1 | |
2660 | 1 | |
2659 | 1 | |
2658 | 1 | |
2657 | 1 | |
2656 | 1 | |
2655 | 1 | |
2654 | 1 | |
2653 | 1 | |
2652 | 1 |
대분류
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
시스템 관리용 코드 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 시스템 관리용 코드 |
---|---|
2nd row | 시스템 관리용 코드 |
3rd row | 시스템 관리용 코드 |
4th row | 시스템 관리용 코드 |
5th row | 시스템 관리용 코드 |
Common Values
Value | Count | Frequency (%) |
시스템 관리용 코드 | 2661 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
시스템 | 2661 | |
관리용 | 2661 | |
코드 | 2661 |
영문 테이블명
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
TB_QM1001 | |
---|---|
TB_SM1005 | |
TB_SM1018 | |
TB_SM1004 | 75 |
TB_LM1048 | 22 |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | TB_QM1001 |
---|---|
2nd row | TB_QM1001 |
3rd row | TB_QM1001 |
4th row | TB_QM1001 |
5th row | TB_QM1001 |
Common Values
Value | Count | Frequency (%) |
TB_QM1001 | 1371 | |
TB_SM1005 | 646 | |
TB_SM1018 | 547 | 20.6% |
TB_SM1004 | 75 | 2.8% |
TB_LM1048 | 22 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
tb_qm1001 | 1371 | |
tb_sm1005 | 646 | |
tb_sm1018 | 547 | 20.6% |
tb_sm1004 | 75 | 2.8% |
tb_lm1048 | 22 | 0.8% |
한글 테이블명
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
지사 시업소 | |
---|---|
공통상세코드 | |
철도운영기관별담당사무소코드 | |
공통분류코드 | 75 |
응시자격코드 | 22 |
Length
Max length | 14 |
---|---|
Median length | 6 |
Mean length | 7.6444946 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지사 시업소 |
---|---|
2nd row | 지사 시업소 |
3rd row | 지사 시업소 |
4th row | 지사 시업소 |
5th row | 지사 시업소 |
Common Values
Value | Count | Frequency (%) |
지사 시업소 | 1371 | |
공통상세코드 | 646 | |
철도운영기관별담당사무소코드 | 547 | 20.6% |
공통분류코드 | 75 | 2.8% |
응시자격코드 | 22 | 0.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
지사 | 1371 | |
시업소 | 1371 | |
공통상세코드 | 646 | |
철도운영기관별담당사무소코드 | 547 | 13.6% |
공통분류코드 | 75 | 1.9% |
응시자격코드 | 22 | 0.5% |
상위(분류)코드
Text
MISSING
 
Distinct | 141 |
---|---|
Distinct (%) | 7.0% |
Missing | 644 |
Missing (%) | 24.2% |
Memory size | 20.9 KiB |
Value | Count | Frequency (%) |
sm008 | 174 | 8.6% |
10106000 | 136 | 6.7% |
10103000 | 100 | 5.0% |
10117000 | 100 | 5.0% |
10108000 | 95 | 4.7% |
20202000 | 72 | 3.6% |
10114000 | 70 | 3.5% |
10102000 | 66 | 3.3% |
10115000 | 61 | 3.0% |
10109000 | 57 | 2.8% |
Other values (131) | 1086 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 7098 | |
1 | 2838 | 20.5% |
2 | 915 | 6.6% |
M | 646 | 4.7% |
8 | 347 | 2.5% |
3 | 320 | 2.3% |
S | 302 | 2.2% |
6 | 264 | 1.9% |
L | 221 | 1.6% |
7 | 184 | 1.3% |
Other values (8) | 728 | 5.3% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 12377 | |
Uppercase Letter | 1363 | 9.8% |
Space Separator | 122 | 0.9% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 7098 | |
1 | 2838 | 22.9% |
2 | 915 | 7.4% |
8 | 347 | 2.8% |
3 | 320 | 2.6% |
6 | 264 | 2.1% |
7 | 184 | 1.5% |
4 | 166 | 1.3% |
5 | 136 | 1.1% |
9 | 109 | 0.9% |
Uppercase Letter
Value | Count | Frequency (%) |
M | 646 | |
S | 302 | |
L | 221 | 16.2% |
Q | 123 | 9.0% |
A | 70 | 5.1% |
H | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
122 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 12500 | |
Latin | 1363 | 9.8% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 7098 | |
1 | 2838 | 22.7% |
2 | 915 | 7.3% |
8 | 347 | 2.8% |
3 | 320 | 2.6% |
6 | 264 | 2.1% |
7 | 184 | 1.5% |
4 | 166 | 1.3% |
5 | 136 | 1.1% |
122 | 1.0% | |
Other values (2) | 110 | 0.9% |
Latin
Value | Count | Frequency (%) |
M | 646 | |
S | 302 | |
L | 221 | 16.2% |
Q | 123 | 9.0% |
A | 70 | 5.1% |
H | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 13863 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 7098 | |
1 | 2838 | 20.5% |
2 | 915 | 6.6% |
M | 646 | 4.7% |
8 | 347 | 2.5% |
3 | 320 | 2.3% |
S | 302 | 2.2% |
6 | 264 | 1.9% |
L | 221 | 1.6% |
7 | 184 | 1.3% |
Other values (8) | 728 | 5.3% |
(상세)코드번호
Text
Distinct | 2641 |
---|---|
Distinct (%) | 99.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
Value | Count | Frequency (%) |
10 | 2 | 0.1% |
12 | 2 | 0.1% |
sm008 | 2 | 0.1% |
13 | 2 | 0.1% |
8 | 2 | 0.1% |
7 | 2 | 0.1% |
2 | 2 | 0.1% |
5 | 2 | 0.1% |
4 | 2 | 0.1% |
11 | 2 | 0.1% |
Other values (2630) | 2641 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 6129 | |
1 | 3836 | |
2 | 1781 | 9.9% |
3 | 1036 | 5.8% |
M | 721 | 4.0% |
4 | 720 | 4.0% |
8 | 690 | 3.8% |
6 | 650 | 3.6% |
5 | 646 | 3.6% |
7 | 540 | 3.0% |
Other values (8) | 1252 | 7.0% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 16544 | |
Uppercase Letter | 1447 | 8.0% |
Space Separator | 8 | < 0.1% |
Dash Punctuation | 2 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 6129 | |
1 | 3836 | |
2 | 1781 | 10.8% |
3 | 1036 | 6.3% |
4 | 720 | 4.4% |
8 | 690 | 4.2% |
6 | 650 | 3.9% |
5 | 646 | 3.9% |
7 | 540 | 3.3% |
9 | 516 | 3.1% |
Uppercase Letter
Value | Count | Frequency (%) |
M | 721 | |
S | 318 | |
L | 255 | 17.6% |
Q | 148 | 10.2% |
A | 3 | 0.2% |
H | 2 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
8 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 16554 | |
Latin | 1447 | 8.0% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 6129 | |
1 | 3836 | |
2 | 1781 | 10.8% |
3 | 1036 | 6.3% |
4 | 720 | 4.3% |
8 | 690 | 4.2% |
6 | 650 | 3.9% |
5 | 646 | 3.9% |
7 | 540 | 3.3% |
9 | 516 | 3.1% |
Other values (2) | 10 | 0.1% |
Latin
Value | Count | Frequency (%) |
M | 721 | |
S | 318 | |
L | 255 | 17.6% |
Q | 148 | 10.2% |
A | 3 | 0.2% |
H | 2 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 18001 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 6129 | |
1 | 3836 | |
2 | 1781 | 9.9% |
3 | 1036 | 5.8% |
M | 721 | 4.0% |
4 | 720 | 4.0% |
8 | 690 | 3.8% |
6 | 650 | 3.6% |
5 | 646 | 3.6% |
7 | 540 | 3.0% |
Other values (8) | 1252 | 7.0% |
코드명
Text
Distinct | 2256 |
---|---|
Distinct (%) | 84.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
Value | Count | Frequency (%) |
기타부서 | 30 | 1.0% |
코드 | 25 | 0.8% |
본사 | 22 | 0.7% |
경력자 | 16 | 0.5% |
엑셀저장 | 15 | 0.5% |
지원 | 13 | 0.4% |
궤도신호사업소 | 10 | 0.3% |
삭제 | 10 | 0.3% |
소지 | 10 | 0.3% |
경력 | 9 | 0.3% |
Other values (2247) | 2868 |
Most occurring characters
Value | Count | Frequency (%) |
사 | 868 | 5.3% |
소 | 827 | 5.0% |
업 | 771 | 4.7% |
역 | 657 | 4.0% |
기 | 484 | 3.0% |
전 | 453 | 2.8% |
372 | 2.3% | |
시 | 341 | 2.1% |
부 | 308 | 1.9% |
무 | 284 | 1.7% |
Other values (413) | 11038 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15272 | |
Space Separator | 372 | 2.3% |
Decimal Number | 213 | 1.3% |
Close Punctuation | 177 | 1.1% |
Open Punctuation | 177 | 1.1% |
Uppercase Letter | 98 | 0.6% |
Other Punctuation | 41 | 0.2% |
Dash Punctuation | 29 | 0.2% |
Lowercase Letter | 22 | 0.1% |
Other Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 868 | 5.7% |
소 | 827 | 5.4% |
업 | 771 | 5.0% |
역 | 657 | 4.3% |
기 | 484 | 3.2% |
전 | 453 | 3.0% |
시 | 341 | 2.2% |
부 | 308 | 2.0% |
무 | 284 | 1.9% |
신 | 253 | 1.7% |
Other values (377) | 10026 |
Uppercase Letter
Value | Count | Frequency (%) |
X | 55 | |
C | 12 | 12.2% |
S | 11 | 11.2% |
G | 5 | 5.1% |
K | 4 | 4.1% |
L | 3 | 3.1% |
O | 3 | 3.1% |
N | 2 | 2.0% |
D | 1 | 1.0% |
B | 1 | 1.0% |
Decimal Number
Value | Count | Frequency (%) |
2 | 56 | |
1 | 52 | |
0 | 24 | |
3 | 22 | 10.3% |
5 | 15 | 7.0% |
7 | 13 | 6.1% |
8 | 10 | 4.7% |
6 | 10 | 4.7% |
4 | 7 | 3.3% |
9 | 4 | 1.9% |
Lowercase Letter
Value | Count | Frequency (%) |
x | 14 | |
t | 2 | 9.1% |
l | 2 | 9.1% |
i | 2 | 9.1% |
s | 1 | 4.5% |
e | 1 | 4.5% |
Close Punctuation
Value | Count | Frequency (%) |
) | 176 | |
] | 1 | 0.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 176 | |
[ | 1 | 0.6% |
Other Punctuation
Value | Count | Frequency (%) |
, | 22 | |
/ | 19 |
Space Separator
Value | Count | Frequency (%) |
372 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 29 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15274 | |
Common | 1009 | 6.2% |
Latin | 120 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 868 | 5.7% |
소 | 827 | 5.4% |
업 | 771 | 5.0% |
역 | 657 | 4.3% |
기 | 484 | 3.2% |
전 | 453 | 3.0% |
시 | 341 | 2.2% |
부 | 308 | 2.0% |
무 | 284 | 1.9% |
신 | 253 | 1.7% |
Other values (378) | 10028 |
Common
Value | Count | Frequency (%) |
372 | ||
) | 176 | |
( | 176 | |
2 | 56 | 5.6% |
1 | 52 | 5.2% |
- | 29 | 2.9% |
0 | 24 | 2.4% |
, | 22 | 2.2% |
3 | 22 | 2.2% |
/ | 19 | 1.9% |
Other values (8) | 61 | 6.0% |
Latin
Value | Count | Frequency (%) |
X | 55 | |
x | 14 | 11.7% |
C | 12 | 10.0% |
S | 11 | 9.2% |
G | 5 | 4.2% |
K | 4 | 3.3% |
L | 3 | 2.5% |
O | 3 | 2.5% |
t | 2 | 1.7% |
N | 2 | 1.7% |
Other values (7) | 9 | 7.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 15272 | |
ASCII | 1129 | 6.9% |
None | 2 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
사 | 868 | 5.7% |
소 | 827 | 5.4% |
업 | 771 | 5.0% |
역 | 657 | 4.3% |
기 | 484 | 3.2% |
전 | 453 | 3.0% |
시 | 341 | 2.2% |
부 | 308 | 2.0% |
무 | 284 | 1.9% |
신 | 253 | 1.7% |
Other values (377) | 10026 |
ASCII
Value | Count | Frequency (%) |
372 | ||
) | 176 | |
( | 176 | |
2 | 56 | 5.0% |
X | 55 | 4.9% |
1 | 52 | 4.6% |
- | 29 | 2.6% |
0 | 24 | 2.1% |
, | 22 | 1.9% |
3 | 22 | 1.9% |
Other values (25) | 145 | 12.8% |
None
Value | Count | Frequency (%) |
㈜ | 2 |
기관코드
Text
MISSING
 
Distinct | 56 |
---|---|
Distinct (%) | 10.2% |
Missing | 2114 |
Missing (%) | 79.4% |
Memory size | 20.9 KiB |
Value | Count | Frequency (%) |
1001 | 314 | |
2001 | 54 | 9.9% |
2018 | 19 | 3.5% |
2003 | 18 | 3.3% |
2007 | 14 | 2.6% |
1003 | 12 | 2.2% |
2011 | 9 | 1.6% |
2006 | 8 | 1.5% |
2005 | 6 | 1.1% |
2004 | 6 | 1.1% |
Other values (46) | 87 | 15.9% |
Most occurring characters
Value | Count | Frequency (%) |
0 | 1027 | |
1 | 837 | |
2 | 192 | 8.7% |
3 | 42 | 1.9% |
8 | 34 | 1.5% |
7 | 19 | 0.9% |
5 | 17 | 0.8% |
6 | 16 | 0.7% |
4 | 15 | 0.7% |
9 | 12 | 0.5% |
Other values (2) | 6 | 0.3% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 2211 | |
Dash Punctuation | 3 | 0.1% |
Uppercase Letter | 3 | 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 1027 | |
1 | 837 | |
2 | 192 | 8.7% |
3 | 42 | 1.9% |
8 | 34 | 1.5% |
7 | 19 | 0.9% |
5 | 17 | 0.8% |
6 | 16 | 0.7% |
4 | 15 | 0.7% |
9 | 12 | 0.5% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Uppercase Letter
Value | Count | Frequency (%) |
H | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 2214 | |
Latin | 3 | 0.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 1027 | |
1 | 837 | |
2 | 192 | 8.7% |
3 | 42 | 1.9% |
8 | 34 | 1.5% |
7 | 19 | 0.9% |
5 | 17 | 0.8% |
6 | 16 | 0.7% |
4 | 15 | 0.7% |
9 | 12 | 0.5% |
Latin
Value | Count | Frequency (%) |
H | 3 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2217 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 1027 | |
1 | 837 | |
2 | 192 | 8.7% |
3 | 42 | 1.9% |
8 | 34 | 1.5% |
7 | 19 | 0.9% |
5 | 17 | 0.8% |
6 | 16 | 0.7% |
4 | 15 | 0.7% |
9 | 12 | 0.5% |
Other values (2) | 6 | 0.3% |
면허경력구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
<NA> | |
---|---|
LM028002 | 11 |
LM028003 | 10 |
LM028001 | 1 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.0330703 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 2639 | |
LM028002 | 11 | 0.4% |
LM028003 | 10 | 0.4% |
LM028001 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 2639 | |
lm028002 | 11 | 0.4% |
lm028003 | 10 | 0.4% |
lm028001 | 1 | < 0.1% |
소지면허코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
<NA> | |
---|---|
4 | 2 |
3 | 2 |
2 | 2 |
5 | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9898534 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 2652 | |
4 | 2 | 0.1% |
3 | 2 | 0.1% |
2 | 2 | 0.1% |
5 | 2 | 0.1% |
1 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 2652 | |
4 | 2 | 0.1% |
3 | 2 | 0.1% |
2 | 2 | 0.1% |
5 | 2 | 0.1% |
1 | 1 | < 0.1% |
경력유형코드
Text
MISSING
 
Distinct | 6 |
---|---|
Distinct (%) | 60.0% |
Missing | 2651 |
Missing (%) | 99.6% |
Memory size | 20.9 KiB |
Value | Count | Frequency (%) |
lm034006 | 5 | |
lm034001 | 1 | 10.0% |
lm034003 | 1 | 10.0% |
lm034002 | 1 | 10.0% |
lm034005 | 1 | 10.0% |
lm034004 | 1 | 10.0% |
Most occurring characters
Value | Count | Frequency (%) |
0 | 30 | |
3 | 11 | 13.8% |
4 | 11 | 13.8% |
L | 10 | 12.5% |
M | 10 | 12.5% |
6 | 5 | 6.2% |
1 | 1 | 1.2% |
2 | 1 | 1.2% |
5 | 1 | 1.2% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 60 | |
Uppercase Letter | 20 | 25.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 30 | |
3 | 11 | 18.3% |
4 | 11 | 18.3% |
6 | 5 | 8.3% |
1 | 1 | 1.7% |
2 | 1 | 1.7% |
5 | 1 | 1.7% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 10 | |
M | 10 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 60 | |
Latin | 20 | 25.0% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 30 | |
3 | 11 | 18.3% |
4 | 11 | 18.3% |
6 | 5 | 8.3% |
1 | 1 | 1.7% |
2 | 1 | 1.7% |
5 | 1 | 1.7% |
Latin
Value | Count | Frequency (%) |
L | 10 | |
M | 10 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 80 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 30 | |
3 | 11 | 13.8% |
4 | 11 | 13.8% |
L | 10 | 12.5% |
M | 10 | 12.5% |
6 | 5 | 6.2% |
1 | 1 | 1.2% |
2 | 1 | 1.2% |
5 | 1 | 1.2% |
경력년수
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 20.9 KiB |
<NA> | |
---|---|
1 | 2 |
3 | 2 |
2 | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9932356 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 2655 | |
1 | 2 | 0.1% |
3 | 2 | 0.1% |
2 | 2 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 2655 | |
1 | 2 | 0.1% |
3 | 2 | 0.1% |
2 | 2 | 0.1% |
사용여부
Boolean
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
True | |
---|---|
False |
Value | Count | Frequency (%) |
True | 1831 | |
False | 830 |
순번 | 영문 테이블명 | 한글 테이블명 | 기관코드 | 면허경력구분 | 소지면허코드 | 경력유형코드 | 경력년수 | 사용여부 | |
---|---|---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.959 | 0.959 | 0.306 | NaN | NaN | NaN | NaN | 0.811 |
영문 테이블명 | 0.959 | 1.000 | 1.000 | NaN | NaN | NaN | NaN | NaN | 0.434 |
한글 테이블명 | 0.959 | 1.000 | 1.000 | NaN | NaN | NaN | NaN | NaN | 0.434 |
기관코드 | 0.306 | NaN | NaN | 1.000 | NaN | NaN | NaN | NaN | 0.116 |
면허경력구분 | NaN | NaN | NaN | NaN | 1.000 | NaN | 0.000 | NaN | 0.000 |
소지면허코드 | NaN | NaN | NaN | NaN | NaN | 1.000 | NaN | NaN | 1.000 |
경력유형코드 | NaN | NaN | NaN | NaN | 0.000 | NaN | 1.000 | 1.000 | NaN |
경력년수 | NaN | NaN | NaN | NaN | NaN | NaN | 1.000 | 1.000 | NaN |
사용여부 | 0.811 | 0.434 | 0.434 | 0.116 | 0.000 | 1.000 | NaN | NaN | 1.000 |
영문 테이블명 | 소지면허코드 | 면허경력구분 | 경력년수 | 사용여부 | 한글 테이블명 | |
---|---|---|---|---|---|---|
영문 테이블명 | 1.000 | 1.000 | 1.000 | 1.000 | 0.527 | 1.000 |
소지면허코드 | 1.000 | 1.000 | 1.000 | NaN | 0.756 | 1.000 |
면허경력구분 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 |
경력년수 | 1.000 | NaN | 1.000 | 1.000 | 1.000 | 1.000 |
사용여부 | 0.527 | 0.756 | 0.000 | 1.000 | 1.000 | 0.527 |
한글 테이블명 | 1.000 | 1.000 | 1.000 | 1.000 | 0.527 | 1.000 |
순번 | 영문 테이블명 | 한글 테이블명 | 면허경력구분 | 소지면허코드 | 경력년수 | 사용여부 | |
---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.721 | 0.721 | 1.000 | 1.000 | 1.000 | 0.644 |
영문 테이블명 | 0.721 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.527 |
한글 테이블명 | 0.721 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.527 |
면허경력구분 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 |
소지면허코드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.756 |
경력년수 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 |
사용여부 | 0.644 | 0.527 | 0.527 | 0.000 | 0.756 | 1.000 | 1.000 |
순번 | 대분류 | 영문 테이블명 | 한글 테이블명 | 상위(분류)코드 | (상세)코드번호 | 코드명 | 기관코드 | 면허경력구분 | 소지면허코드 | 경력유형코드 | 경력년수 | 사용여부 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20301000 | 20301004 | 안전관리실 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
1 | 2 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20301000 | 20301005 | 경영지원처 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
2 | 3 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20301000 | 20301006 | 열차운영처 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
3 | 4 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20301000 | 20301007 | 영업처 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
4 | 5 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20301000 | 20301008 | 차량처 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
5 | 6 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20301000 | 20301009 | 전기기계설비처 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
6 | 7 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20301000 | 20301010 | 신호통신처 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
7 | 8 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20301000 | 20301011 | 시설처 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
8 | 9 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 2003 | 20302000 | 현업 | <NA> | <NA> | <NA> | <NA> | <NA> | N |
9 | 10 | 시스템 관리용 코드 | TB_QM1001 | 지사 시업소 | 20302000 | 20302001 | 제1영업소 | <NA> | <NA> | <NA> | <NA> | <NA> | Y |
순번 | 대분류 | 영문 테이블명 | 한글 테이블명 | 상위(분류)코드 | (상세)코드번호 | 코드명 | 기관코드 | 면허경력구분 | 소지면허코드 | 경력유형코드 | 경력년수 | 사용여부 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2651 | 2652 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 11 | 철도관련업무3년 경력 | <NA> | LM028003 | <NA> | LM034006 | 3 | Y |
2652 | 2653 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 12 | 전동차차장2년 경력 | <NA> | LM028003 | <NA> | LM034004 | 2 | Y |
2653 | 2654 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 14 | 제1종전기차량운전면허 소지 (운전경력 2년 이상) | <NA> | LM028002 | 2 | <NA> | <NA> | Y |
2654 | 2655 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 15 | 철도장비운전면허 소지 (일반응시-5과목) | <NA> | LM028002 | 5 | <NA> | <NA> | Y |
2655 | 2656 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 17 | 운전업무 경력 | <NA> | LM028003 | <NA> | LM034006 | <NA> | Y |
2656 | 2657 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 18 | 신호업무 경력 | <NA> | LM028003 | <NA> | LM034006 | <NA> | Y |
2657 | 2658 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 19 | 철도차량운전면허 소지 | <NA> | LM028002 | <NA> | <NA> | <NA> | Y |
2658 | 2659 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 20 | 미경과조치 | <NA> | LM028003 | <NA> | <NA> | <NA> | Y |
2659 | 2660 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 21 | 보수교육 | <NA> | LM028003 | <NA> | LM034006 | <NA> | Y |
2660 | 2661 | 시스템 관리용 코드 | TB_LM1048 | 응시자격코드 | <NA> | 22 | 갱신교육 | <NA> | LM028002 | <NA> | LM034006 | <NA> | Y |