Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 103 |
Missing cells | 101 |
Missing cells (%) | 9.8% |
Duplicate rows | 3 |
Duplicate rows (%) | 2.9% |
Total size in memory | 8.7 KiB |
Average record size in memory | 86.3 B |
Variable types
Categorical | 8 |
---|---|
Text | 2 |
Dataset
Description | 학점은행제 정보공시 자료의 검증결과 정보이며 공시년도, 공시시기, 공시항목명, 검증결과구분명, 검증지표값1, 검증지표값2, 검증지표값3, 검증지표값4, 생성일시, 수정일시 항목의 정보를 제공합니다. |
---|---|
Author | 국가평생교육진흥원 |
URL | https://www.data.go.kr/data/15088892/fileData.do |
공시년도 has constant value "" | Constant |
Dataset has 3 (2.9%) duplicate rows | Duplicates |
생성일시 is highly overall correlated with 공시시기 and 2 other fields | High correlation |
공시항목명 is highly overall correlated with 공시시기 and 2 other fields | High correlation |
수정일시 is highly overall correlated with 공시시기 and 2 other fields | High correlation |
공시시기 is highly overall correlated with 공시항목명 and 2 other fields | High correlation |
공시시기 is highly imbalanced (92.1%) | Imbalance |
공시항목명 is highly imbalanced (90.1%) | Imbalance |
검증지표값2 is highly imbalanced (92.1%) | Imbalance |
검증지표값3 is highly imbalanced (92.1%) | Imbalance |
검증지표값4 is highly imbalanced (92.1%) | Imbalance |
생성일시 is highly imbalanced (90.1%) | Imbalance |
수정일시 is highly imbalanced (90.1%) | Imbalance |
검증결과구분명 has 101 (98.1%) missing values | Missing |
Reproduction
Analysis started | 2024-04-17 17:30:59.484412 |
---|---|
Analysis finished | 2024-04-17 17:30:59.979349 |
Duration | 0.49 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
공시년도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
2018 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2018 |
---|---|
2nd row | 2018 |
3rd row | 2018 |
4th row | 2018 |
5th row | 2018 |
Common Values
Value | Count | Frequency (%) |
2018 | 103 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2018 | 103 |
공시시기
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
3 | |
---|---|
2 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | 3 |
---|---|
2nd row | 2 |
3rd row | 3 |
4th row | 3 |
5th row | 3 |
Common Values
Value | Count | Frequency (%) |
3 | 102 | |
2 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
3 | 102 | |
2 | 1 | 1.0% |
공시항목명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
교수 또는 강사의 강의 담당 현황 | |
---|---|
교수 또는 강사의 수 | 1 |
교사(校舍) 등 시설 현황 | 1 |
Length
Max length | 18 |
---|---|
Median length | 18 |
Mean length | 17.893204 |
Min length | 11 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 교수 또는 강사의 수 |
---|---|
2nd row | 교사(校舍) 등 시설 현황 |
3rd row | 교수 또는 강사의 강의 담당 현황 |
4th row | 교수 또는 강사의 강의 담당 현황 |
5th row | 교수 또는 강사의 강의 담당 현황 |
Common Values
Value | Count | Frequency (%) |
교수 또는 강사의 강의 담당 현황 | 101 | |
교수 또는 강사의 수 | 1 | 1.0% |
교사(校舍) 등 시설 현황 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
교수 | 102 | |
또는 | 102 | |
강사의 | 102 | |
현황 | 102 | |
강의 | 101 | |
담당 | 101 | |
수 | 1 | 0.2% |
교사(校舍 | 1 | 0.2% |
등 | 1 | 0.2% |
시설 | 1 | 0.2% |
검증결과구분명
Text
MISSING
 
Distinct | 2 |
---|---|
Distinct (%) | 100.0% |
Missing | 101 |
Missing (%) | 98.1% |
Memory size | 956.0 B |
Value | Count | Frequency (%) |
아동미술 | 1 | |
도서실(지도교수실)(2층 | 1 |
Most occurring characters
Value | Count | Frequency (%) |
도 | 2 | |
실 | 2 | |
( | 2 | |
) | 2 | |
아 | 1 | 5.6% |
동 | 1 | 5.6% |
미 | 1 | 5.6% |
술 | 1 | 5.6% |
서 | 1 | 5.6% |
지 | 1 | 5.6% |
Other values (4) | 4 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 13 | |
Open Punctuation | 2 | 11.1% |
Close Punctuation | 2 | 11.1% |
Decimal Number | 1 | 5.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 2 | |
실 | 2 | |
아 | 1 | |
동 | 1 | |
미 | 1 | |
술 | 1 | |
서 | 1 | |
지 | 1 | |
교 | 1 | |
수 | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Decimal Number
Value | Count | Frequency (%) |
2 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 13 | |
Common | 5 | 27.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 2 | |
실 | 2 | |
아 | 1 | |
동 | 1 | |
미 | 1 | |
술 | 1 | |
서 | 1 | |
지 | 1 | |
교 | 1 | |
수 | 1 |
Common
Value | Count | Frequency (%) |
( | 2 | |
) | 2 | |
2 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 13 | |
ASCII | 5 | 27.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
도 | 2 | |
실 | 2 | |
아 | 1 | |
동 | 1 | |
미 | 1 | |
술 | 1 | |
서 | 1 | |
지 | 1 | |
교 | 1 | |
수 | 1 |
ASCII
Value | Count | Frequency (%) |
( | 2 | |
) | 2 | |
2 | 1 |
검증지표값1
Text
Distinct | 100 |
---|---|
Distinct (%) | 97.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
Value | Count | Frequency (%) |
102 | ||
21 | 7 | 2.3% |
81 | 6 | 2.0% |
18 | 5 | 1.6% |
9 | 5 | 1.6% |
33 | 4 | 1.3% |
15 | 4 | 1.3% |
60 | 4 | 1.3% |
42 | 4 | 1.3% |
51 | 4 | 1.3% |
Other values (115) | 162 |
Most occurring characters
Value | Count | Frequency (%) |
204 | ||
! | 101 | |
= | 101 | |
1 | 100 | |
2 | 64 | 6.9% |
3 | 57 | 6.1% |
8 | 52 | 5.6% |
5 | 48 | 5.1% |
6 | 44 | 4.7% |
4 | 43 | 4.6% |
Other values (5) | 119 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 513 | |
Space Separator | 204 | 21.9% |
Other Punctuation | 114 | 12.2% |
Math Symbol | 102 | 10.9% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 100 | |
2 | 64 | |
3 | 57 | |
8 | 52 | |
5 | 48 | |
6 | 44 | |
4 | 43 | |
9 | 39 | 7.6% |
0 | 36 | 7.0% |
7 | 30 | 5.8% |
Other Punctuation
Value | Count | Frequency (%) |
! | 101 | |
, | 13 | 11.4% |
Math Symbol
Value | Count | Frequency (%) |
= | 101 | |
< | 1 | 1.0% |
Space Separator
Value | Count | Frequency (%) |
204 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 933 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
204 | ||
! | 101 | |
= | 101 | |
1 | 100 | |
2 | 64 | 6.9% |
3 | 57 | 6.1% |
8 | 52 | 5.6% |
5 | 48 | 5.1% |
6 | 44 | 4.7% |
4 | 43 | 4.6% |
Other values (5) | 119 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 933 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
204 | ||
! | 101 | |
= | 101 | |
1 | 100 | |
2 | 64 | 6.9% |
3 | 57 | 6.1% |
8 | 52 | 5.6% |
5 | 48 | 5.1% |
6 | 44 | 4.7% |
4 | 43 | 4.6% |
Other values (5) | 119 |
검증지표값2
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
<NA> | |
---|---|
0 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9708738 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | <NA> |
---|---|
2nd row | 0 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 102 | |
0 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 102 | |
0 | 1 | 1.0% |
검증지표값3
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
<NA> | |
---|---|
1 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9708738 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | <NA> |
---|---|
2nd row | 1 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 102 | |
1 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 102 | |
1 | 1 | 1.0% |
검증지표값4
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
<NA> | |
---|---|
21 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9805825 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.0% |
Sample
1st row | <NA> |
---|---|
2nd row | 21 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 102 | |
21 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 102 | |
21 | 1 | 1.0% |
생성일시
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
2018-03-15 14:40:34.0 | |
---|---|
2018-03-13 19:04:23.0 | 1 |
2018-02-21 13:53:12.0 | 1 |
Length
Max length | 21 |
---|---|
Median length | 21 |
Mean length | 21 |
Min length | 21 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 2018-03-13 19:04:23.0 |
---|---|
2nd row | 2018-02-21 13:53:12.0 |
3rd row | 2018-03-15 14:40:34.0 |
4th row | 2018-03-15 14:40:34.0 |
5th row | 2018-03-15 14:40:34.0 |
Common Values
Value | Count | Frequency (%) |
2018-03-15 14:40:34.0 | 101 | |
2018-03-13 19:04:23.0 | 1 | 1.0% |
2018-02-21 13:53:12.0 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2018-03-15 | 101 | |
14:40:34.0 | 101 | |
2018-03-13 | 1 | 0.5% |
19:04:23.0 | 1 | 0.5% |
2018-02-21 | 1 | 0.5% |
13:53:12.0 | 1 | 0.5% |
수정일시
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
2018-03-15 14:40:34.0 | |
---|---|
2018-03-13 19:04:23.0 | 1 |
2018-02-21 13:53:12.0 | 1 |
Length
Max length | 21 |
---|---|
Median length | 21 |
Mean length | 21 |
Min length | 21 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 1.9% |
Sample
1st row | 2018-03-13 19:04:23.0 |
---|---|
2nd row | 2018-02-21 13:53:12.0 |
3rd row | 2018-03-15 14:40:34.0 |
4th row | 2018-03-15 14:40:34.0 |
5th row | 2018-03-15 14:40:34.0 |
Common Values
Value | Count | Frequency (%) |
2018-03-15 14:40:34.0 | 101 | |
2018-03-13 19:04:23.0 | 1 | 1.0% |
2018-02-21 13:53:12.0 | 1 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2018-03-15 | 101 | |
14:40:34.0 | 101 | |
2018-03-13 | 1 | 0.5% |
19:04:23.0 | 1 | 0.5% |
2018-02-21 | 1 | 0.5% |
13:53:12.0 | 1 | 0.5% |
공시시기 | 공시항목명 | 검증결과구분명 | 검증지표값1 | 생성일시 | 수정일시 | |
---|---|---|---|---|---|---|
공시시기 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 |
공시항목명 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 |
검증결과구분명 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
검증지표값1 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 |
생성일시 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 |
수정일시 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 |
생성일시 | 공시항목명 | 검증지표값4 | 검증지표값2 | 검증지표값3 | 수정일시 | 공시시기 | |
---|---|---|---|---|---|---|---|
생성일시 | 1.000 | 1.000 | NaN | NaN | NaN | 1.000 | 0.995 |
공시항목명 | 1.000 | 1.000 | NaN | NaN | NaN | 1.000 | 0.995 |
검증지표값4 | NaN | NaN | 1.000 | NaN | NaN | NaN | NaN |
검증지표값2 | NaN | NaN | NaN | 1.000 | NaN | NaN | NaN |
검증지표값3 | NaN | NaN | NaN | NaN | 1.000 | NaN | NaN |
수정일시 | 1.000 | 1.000 | NaN | NaN | NaN | 1.000 | 0.995 |
공시시기 | 0.995 | 0.995 | NaN | NaN | NaN | 0.995 | 1.000 |
공시시기 | 공시항목명 | 검증지표값2 | 검증지표값3 | 검증지표값4 | 생성일시 | 수정일시 | |
---|---|---|---|---|---|---|---|
공시시기 | 1.000 | 0.995 | NaN | NaN | NaN | 0.995 | 0.995 |
공시항목명 | 0.995 | 1.000 | NaN | NaN | NaN | 1.000 | 1.000 |
검증지표값2 | NaN | NaN | 1.000 | NaN | NaN | NaN | NaN |
검증지표값3 | NaN | NaN | NaN | 1.000 | NaN | NaN | NaN |
검증지표값4 | NaN | NaN | NaN | NaN | 1.000 | NaN | NaN |
생성일시 | 0.995 | 1.000 | NaN | NaN | NaN | 1.000 | 1.000 |
수정일시 | 0.995 | 1.000 | NaN | NaN | NaN | 1.000 | 1.000 |
공시년도 | 공시시기 | 공시항목명 | 검증결과구분명 | 검증지표값1 | 검증지표값2 | 검증지표값3 | 검증지표값4 | 생성일시 | 수정일시 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 2018 | 3 | 교수 또는 강사의 수 | 아동미술 | 2 < 3 | <NA> | <NA> | <NA> | 2018-03-13 19:04:23.0 | 2018-03-13 19:04:23.0 |
1 | 2018 | 2 | 교사(校舍) 등 시설 현황 | 도서실(지도교수실)(2층) | 0 | 0 | 1 | 21 | 2018-02-21 13:53:12.0 | 2018-02-21 13:53:12.0 |
2 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 423 != 414 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
3 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 492 != 798 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
4 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 573 != 438 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
5 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 412 != 144 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
6 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 213 != 231 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
7 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 108 != 99 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
8 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 81 != 51 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
9 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 363 != 312 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
공시년도 | 공시시기 | 공시항목명 | 검증결과구분명 | 검증지표값1 | 검증지표값2 | 검증지표값3 | 검증지표값4 | 생성일시 | 수정일시 | |
---|---|---|---|---|---|---|---|---|---|---|
93 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 102 != 153 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
94 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 867 != 834 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
95 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 33 != 39 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
96 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 294 != 693 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
97 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 18 != 15 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
98 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 66 != 75 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
99 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 156 != 90 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
100 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 708 != 1,032 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
101 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 33 != 9 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
102 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 78 != 75 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 |
Most frequently occurring
공시년도 | 공시시기 | 공시항목명 | 검증결과구분명 | 검증지표값1 | 검증지표값2 | 검증지표값3 | 검증지표값4 | 생성일시 | 수정일시 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 21 != 9 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 | 2 |
1 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 33 != 39 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 | 2 |
2 | 2018 | 3 | 교수 또는 강사의 강의 담당 현황 | <NA> | 45 != 48 | <NA> | <NA> | <NA> | 2018-03-15 14:40:34.0 | 2018-03-15 14:40:34.0 | 2 |