Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 187 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 12.5 KiB |
Average record size in memory | 68.7 B |
Variable types
Categorical | 5 |
---|---|
Numeric | 2 |
Text | 1 |
Dataset
Description | 현재 건설중인 새울원자력3,4호기 건설현장 전문인력(용접사) 양성관련 연도 및 차수별 교육 시행 현황이고, 수행년도, 차수, 교육생번호, 이름, 출생년도, 지역, 성별 등을 포함합니다. |
---|---|
URL | https://www.data.go.kr/data/15115519/fileData.do |
Reproduction
Analysis started | 2023-12-12 10:49:36.542206 |
---|---|
Analysis finished | 2023-12-12 10:49:38.649469 |
Duration | 2.11 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
수행년도
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 2.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
2021 | |
---|---|
2020 | |
2018 | |
2019 | |
2022 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2018 |
---|---|
2nd row | 2018 |
3rd row | 2018 |
4th row | 2018 |
5th row | 2018 |
Common Values
Value | Count | Frequency (%) |
2021 | 42 | |
2020 | 40 | |
2018 | 35 | |
2019 | 35 | |
2022 | 35 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2021 | 42 | |
2020 | 40 | |
2018 | 35 | |
2019 | 35 | |
2022 | 35 |
차수
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
1 | |
---|---|
2 | |
3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 73 | |
2 | 63 | |
3 | 51 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 73 | |
2 | 63 | |
3 | 51 |
번호
Real number (ℝ)
Distinct | 25 |
---|---|
Distinct (%) | 13.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 8.0855615 |
Minimum | 1 |
---|---|
Maximum | 25 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.8 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 4 |
median | 7 |
Q3 | 11 |
95-th percentile | 19.7 |
Maximum | 25 |
Range | 24 |
Interquartile range (IQR) | 7 |
Descriptive statistics
Standard deviation | 5.4539278 |
---|---|
Coefficient of variation (CV) | 0.67452678 |
Kurtosis | 0.57477644 |
Mean | 8.0855615 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.94485752 |
Sum | 1512 |
Variance | 29.745328 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 14 | 7.5% |
3 | 14 | 7.5% |
4 | 14 | 7.5% |
5 | 14 | 7.5% |
6 | 14 | 7.5% |
2 | 14 | 7.5% |
7 | 13 | 7.0% |
8 | 13 | 7.0% |
9 | 13 | 7.0% |
10 | 13 | 7.0% |
Other values (15) | 51 |
Value | Count | Frequency (%) |
1 | 14 | |
2 | 14 | |
3 | 14 | |
4 | 14 | |
5 | 14 | |
6 | 14 | |
7 | 13 | |
8 | 13 | |
9 | 13 | |
10 | 13 |
Value | Count | Frequency (%) |
25 | 1 | 0.5% |
24 | 1 | 0.5% |
23 | 2 | |
22 | 2 | |
21 | 2 | |
20 | 2 | |
19 | 2 | |
18 | 2 | |
17 | 2 | |
16 | 3 |
이름
Text
Distinct | 140 |
---|---|
Distinct (%) | 74.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
Value | Count | Frequency (%) |
김*민 | 6 | 3.2% |
김*훈 | 5 | 2.7% |
정*화 | 3 | 1.6% |
김*규 | 3 | 1.6% |
김*중 | 3 | 1.6% |
김*환 | 3 | 1.6% |
정*우 | 3 | 1.6% |
김*영 | 3 | 1.6% |
이*진 | 3 | 1.6% |
김*원 | 3 | 1.6% |
Other values (130) | 152 |
Most occurring characters
Value | Count | Frequency (%) |
* | 187 | |
김 | 64 | 11.4% |
이 | 25 | 4.5% |
정 | 15 | 2.7% |
민 | 14 | 2.5% |
훈 | 13 | 2.3% |
박 | 9 | 1.6% |
최 | 8 | 1.4% |
호 | 8 | 1.4% |
석 | 7 | 1.2% |
Other values (89) | 211 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 374 | |
Other Punctuation | 187 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 64 | 17.1% |
이 | 25 | 6.7% |
정 | 15 | 4.0% |
민 | 14 | 3.7% |
훈 | 13 | 3.5% |
박 | 9 | 2.4% |
최 | 8 | 2.1% |
호 | 8 | 2.1% |
석 | 7 | 1.9% |
우 | 7 | 1.9% |
Other values (88) | 204 |
Other Punctuation
Value | Count | Frequency (%) |
* | 187 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 374 | |
Common | 187 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 64 | 17.1% |
이 | 25 | 6.7% |
정 | 15 | 4.0% |
민 | 14 | 3.7% |
훈 | 13 | 3.5% |
박 | 9 | 2.4% |
최 | 8 | 2.1% |
호 | 8 | 2.1% |
석 | 7 | 1.9% |
우 | 7 | 1.9% |
Other values (88) | 204 |
Common
Value | Count | Frequency (%) |
* | 187 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 374 | |
ASCII | 187 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 187 |
Hangul
Value | Count | Frequency (%) |
김 | 64 | 17.1% |
이 | 25 | 6.7% |
정 | 15 | 4.0% |
민 | 14 | 3.7% |
훈 | 13 | 3.5% |
박 | 9 | 2.4% |
최 | 8 | 2.1% |
호 | 8 | 2.1% |
석 | 7 | 1.9% |
우 | 7 | 1.9% |
Other values (88) | 204 |
출생년도
Real number (ℝ)
Distinct | 38 |
---|---|
Distinct (%) | 20.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1985.7594 |
Minimum | 1963 |
---|---|
Maximum | 2003 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.8 KiB |
Quantile statistics
Minimum | 1963 |
---|---|
5-th percentile | 1969.3 |
Q1 | 1979 |
median | 1987 |
Q3 | 1994 |
95-th percentile | 1998.7 |
Maximum | 2003 |
Range | 40 |
Interquartile range (IQR) | 15 |
Descriptive statistics
Standard deviation | 9.38661 |
---|---|
Coefficient of variation (CV) | 0.0047269625 |
Kurtosis | -0.84414144 |
Mean | 1985.7594 |
Median Absolute Deviation (MAD) | 7 |
Skewness | -0.32452372 |
Sum | 371337 |
Variance | 88.108447 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1987 | 11 | 5.9% |
1994 | 11 | 5.9% |
1995 | 11 | 5.9% |
1996 | 10 | 5.3% |
1979 | 9 | 4.8% |
1993 | 9 | 4.8% |
1982 | 8 | 4.3% |
1991 | 8 | 4.3% |
1984 | 8 | 4.3% |
1997 | 8 | 4.3% |
Other values (28) | 94 |
Value | Count | Frequency (%) |
1963 | 1 | 0.5% |
1966 | 2 | 1.1% |
1967 | 3 | |
1968 | 3 | |
1969 | 1 | 0.5% |
1970 | 2 | 1.1% |
1971 | 6 | |
1972 | 4 | |
1973 | 1 | 0.5% |
1974 | 3 |
Value | Count | Frequency (%) |
2003 | 2 | 1.1% |
2001 | 1 | 0.5% |
2000 | 3 | 1.6% |
1999 | 4 | 2.1% |
1998 | 4 | 2.1% |
1997 | 8 | |
1996 | 10 | |
1995 | 11 | |
1994 | 11 | |
1993 | 9 |
지역
Categorical
Distinct | 12 |
---|---|
Distinct (%) | 6.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
울산광역시 | |
---|---|
부산광역시 | |
경상남도 | 10 |
경기도 | 4 |
대구광역시 | 4 |
Other values (7) |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.8342246 |
Min length | 3 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 1.6% |
Sample
1st row | 부산광역시 |
---|---|
2nd row | 울산광역시 |
3rd row | 부산광역시 |
4th row | 울산광역시 |
5th row | 울산광역시 |
Common Values
Value | Count | Frequency (%) |
울산광역시 | 101 | |
부산광역시 | 53 | |
경상남도 | 10 | 5.3% |
경기도 | 4 | 2.1% |
대구광역시 | 4 | 2.1% |
전라남도 | 4 | 2.1% |
경상북도 | 3 | 1.6% |
충청남도 | 3 | 1.6% |
서울특별시 | 2 | 1.1% |
광주광역시 | 1 | 0.5% |
Other values (2) | 2 | 1.1% |
Length
Value | Count | Frequency (%) |
울산광역시 | 101 | |
부산광역시 | 53 | |
경상남도 | 10 | 5.3% |
경기도 | 4 | 2.1% |
대구광역시 | 4 | 2.1% |
전라남도 | 4 | 2.1% |
경상북도 | 3 | 1.6% |
충청남도 | 3 | 1.6% |
서울특별시 | 2 | 1.1% |
광주광역시 | 1 | 0.5% |
Other values (2) | 2 | 1.1% |
성별
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
남 | |
---|---|
여 | 6 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 남 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
남 | 181 | |
여 | 6 | 3.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 181 | |
여 | 6 | 3.2% |
비고
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 3.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.6 KiB |
<NA> | |
---|---|
일반 1차 | 13 |
일반 2차 | 11 |
자진 퇴교 | 6 |
전문가 3차 | 5 |
Other values (2) | 6 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 4.2780749 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 146 | |
일반 1차 | 13 | 7.0% |
일반 2차 | 11 | 5.9% |
자진 퇴교 | 6 | 3.2% |
전문가 3차 | 5 | 2.7% |
전문가 1차 | 3 | 1.6% |
전문가 2차 | 3 | 1.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 146 | |
일반 | 24 | 10.5% |
1차 | 16 | 7.0% |
2차 | 14 | 6.1% |
전문가 | 11 | 4.8% |
자진 | 6 | 2.6% |
퇴교 | 6 | 2.6% |
3차 | 5 | 2.2% |
수행년도 | 차수 | 번호 | 출생년도 | 지역 | 성별 | 비고 | |
---|---|---|---|---|---|---|---|
수행년도 | 1.000 | 0.352 | 0.115 | 0.447 | 0.214 | 0.223 | 0.516 |
차수 | 0.352 | 1.000 | 0.000 | 0.250 | 0.249 | 0.000 | 0.996 |
번호 | 0.115 | 0.000 | 1.000 | 0.393 | 0.000 | 0.000 | 0.295 |
출생년도 | 0.447 | 0.250 | 0.393 | 1.000 | 0.379 | 0.196 | 0.412 |
지역 | 0.214 | 0.249 | 0.000 | 0.379 | 1.000 | 0.000 | 0.454 |
성별 | 0.223 | 0.000 | 0.000 | 0.196 | 0.000 | 1.000 | 0.000 |
비고 | 0.516 | 0.996 | 0.295 | 0.412 | 0.454 | 0.000 | 1.000 |
지역 | 수행년도 | 차수 | 성별 | 비고 | |
---|---|---|---|---|---|
지역 | 1.000 | 0.116 | 0.111 | 0.000 | 0.280 |
수행년도 | 0.116 | 1.000 | 0.283 | 0.270 | 0.373 |
차수 | 0.111 | 0.283 | 1.000 | 0.000 | 0.884 |
성별 | 0.000 | 0.270 | 0.000 | 1.000 | 0.000 |
비고 | 0.280 | 0.373 | 0.884 | 0.000 | 1.000 |
번호 | 출생년도 | 수행년도 | 차수 | 지역 | 성별 | 비고 | |
---|---|---|---|---|---|---|---|
번호 | 1.000 | -0.092 | 0.062 | 0.000 | 0.000 | 0.000 | 0.188 |
출생년도 | -0.092 | 1.000 | 0.190 | 0.136 | 0.158 | 0.148 | 0.203 |
수행년도 | 0.062 | 0.190 | 1.000 | 0.283 | 0.116 | 0.270 | 0.373 |
차수 | 0.000 | 0.136 | 0.283 | 1.000 | 0.111 | 0.000 | 0.884 |
지역 | 0.000 | 0.158 | 0.116 | 0.111 | 1.000 | 0.000 | 0.280 |
성별 | 0.000 | 0.148 | 0.270 | 0.000 | 0.000 | 1.000 | 0.000 |
비고 | 0.188 | 0.203 | 0.373 | 0.884 | 0.280 | 0.000 | 1.000 |
수행년도 | 차수 | 번호 | 이름 | 출생년도 | 지역 | 성별 | 비고 | |
---|---|---|---|---|---|---|---|---|
0 | 2018 | 1 | 1 | 구*호 | 1989 | 부산광역시 | 남 | <NA> |
1 | 2018 | 1 | 2 | 오*성 | 1979 | 울산광역시 | 남 | <NA> |
2 | 2018 | 1 | 3 | 이*준 | 1977 | 부산광역시 | 남 | <NA> |
3 | 2018 | 1 | 4 | 최*훈 | 1982 | 울산광역시 | 남 | <NA> |
4 | 2018 | 1 | 5 | 이*영 | 1991 | 울산광역시 | 남 | <NA> |
5 | 2018 | 1 | 6 | 정*우 | 1980 | 울산광역시 | 남 | <NA> |
6 | 2018 | 1 | 7 | 윤*무 | 1983 | 울산광역시 | 남 | <NA> |
7 | 2018 | 1 | 8 | 허*성 | 1971 | 울산광역시 | 남 | <NA> |
8 | 2018 | 1 | 9 | 이*호 | 1985 | 부산광역시 | 남 | <NA> |
9 | 2018 | 1 | 10 | 정*윤 | 1983 | 울산광역시 | 남 | <NA> |
수행년도 | 차수 | 번호 | 이름 | 출생년도 | 지역 | 성별 | 비고 | |
---|---|---|---|---|---|---|---|---|
177 | 2022 | 3 | 2 | 김*훈 | 1998 | 울산광역시 | 남 | 일반 2차 |
178 | 2022 | 3 | 3 | 김*민 | 1994 | 울산광역시 | 남 | 일반 2차 |
179 | 2022 | 3 | 4 | 김*진 | 2001 | 울산광역시 | 남 | 일반 2차 |
180 | 2022 | 3 | 5 | 문*덕 | 1984 | 부산광역시 | 남 | 일반 2차 |
181 | 2022 | 3 | 6 | 박*현 | 2000 | 부산광역시 | 남 | 일반 2차 |
182 | 2022 | 3 | 7 | 심*별 | 1994 | 울산광역시 | 여 | 일반 2차 |
183 | 2022 | 3 | 8 | 심*석 | 1991 | 부산광역시 | 남 | 일반 2차 |
184 | 2022 | 3 | 9 | 이*환 | 1996 | 부산광역시 | 남 | 일반 2차 |
185 | 2022 | 3 | 10 | 정*귀 | 1978 | 울산광역시 | 여 | 일반 2차 |
186 | 2022 | 3 | 11 | 정*우 | 1996 | 울산광역시 | 남 | 일반 2차 |