Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 8748 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1520 |
Duplicate rows (%) | 17.4% |
Total size in memory | 213.7 KiB |
Average record size in memory | 25.0 B |
Variable types
Text | 1 |
---|---|
Numeric | 1 |
Categorical | 1 |
Dataset
Description | HRD4U(www.hrd4u.or.kr)에서 제공하는 콘텐츠 강의관련 정보로, 강의명과 시간 등의 정보가 있음 |
---|---|
URL | https://www.data.go.kr/data/15121940/fileData.do |
Dataset has 1520 (17.4%) duplicate rows | Duplicates |
강의시간(분) is highly overall correlated with 업데이트일자 | High correlation |
업데이트일자 is highly overall correlated with 강의시간(분) | High correlation |
업데이트일자 is highly imbalanced (60.8%) | Imbalance |
강의시간(분) is highly skewed (γ1 = 31.0172257) | Skewed |
Reproduction
Analysis started | 2023-12-12 06:05:28.260656 |
---|---|
Analysis finished | 2023-12-12 06:05:29.472868 |
Duration | 1.21 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
콘텐츠명
Text
Distinct | 6418 |
---|---|
Distinct (%) | 73.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
Length
Max length | 86 |
---|---|
Median length | 79 |
Mean length | 16.646662 |
Min length | 2 |
Characters and Unicode
Total characters | 145625 |
---|---|
Distinct characters | 869 |
Distinct categories | 16 ? |
Distinct scripts | 4 ? |
Distinct blocks | 7 ? |
Unique
Unique | 4329 ? |
---|---|
Unique (%) | 49.5% |
Sample
1st row | 13.고객응대 기술 |
---|---|
2nd row | 14.아웃바운드 고객응대 실전 |
3rd row | 15.고객거절, 반론, 불만 극복법 |
4th row | 16.아웃바운드 판매촉진 실무 |
5th row | 17.아웃바운드 콜마케팅 혁신 |
Value | Count | Frequency (%) |
및 | 701 | 2.3% |
2 | 308 | 1.0% |
1 | 306 | 1.0% |
가공 | 255 | 0.8% |
실습 | 249 | 0.8% |
3 | 199 | 0.7% |
대한 | 168 | 0.5% |
작성 | 165 | 0.5% |
이해 | 160 | 0.5% |
이론 | 146 | 0.5% |
Other values (8529) | 27947 |
Most occurring characters
Value | Count | Frequency (%) |
26207 | 18.0% | |
. | 4605 | 3.2% |
0 | 3363 | 2.3% |
1 | 3098 | 2.1% |
기 | 2819 | 1.9% |
2 | 2466 | 1.7% |
이 | 2105 | 1.4% |
의 | 2086 | 1.4% |
_ | 2075 | 1.4% |
자 | 2049 | 1.4% |
Other values (859) | 94752 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 92234 | |
Space Separator | 26207 | 18.0% |
Decimal Number | 13199 | 9.1% |
Other Punctuation | 5833 | 4.0% |
Uppercase Letter | 2950 | 2.0% |
Connector Punctuation | 2075 | 1.4% |
Lowercase Letter | 1458 | 1.0% |
Close Punctuation | 582 | 0.4% |
Open Punctuation | 522 | 0.4% |
Dash Punctuation | 368 | 0.3% |
Other values (6) | 197 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 2819 | 3.1% |
이 | 2105 | 2.3% |
의 | 2086 | 2.3% |
자 | 2049 | 2.2% |
가 | 1875 | 2.0% |
사 | 1566 | 1.7% |
정 | 1490 | 1.6% |
용 | 1301 | 1.4% |
하 | 1224 | 1.3% |
스 | 1094 | 1.2% |
Other values (770) | 74625 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 511 | |
D | 228 | 7.7% |
S | 189 | 6.4% |
O | 183 | 6.2% |
T | 175 | 5.9% |
W | 173 | 5.9% |
A | 167 | 5.7% |
P | 152 | 5.2% |
M | 142 | 4.8% |
N | 139 | 4.7% |
Other values (16) | 891 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 189 | |
t | 178 | |
a | 118 | 8.1% |
i | 117 | 8.0% |
r | 109 | 7.5% |
o | 95 | 6.5% |
n | 85 | 5.8% |
s | 81 | 5.6% |
l | 69 | 4.7% |
p | 63 | 4.3% |
Other values (16) | 354 |
Other Punctuation
Value | Count | Frequency (%) |
. | 4605 | |
, | 692 | 11.9% |
· | 242 | 4.1% |
? | 111 | 1.9% |
! | 73 | 1.3% |
/ | 60 | 1.0% |
: | 24 | 0.4% |
& | 9 | 0.2% |
' | 7 | 0.1% |
" | 5 | 0.1% |
Decimal Number
Value | Count | Frequency (%) |
0 | 3363 | |
1 | 3098 | |
2 | 2466 | |
3 | 1792 | |
4 | 940 | 7.1% |
5 | 451 | 3.4% |
6 | 303 | 2.3% |
7 | 281 | 2.1% |
8 | 264 | 2.0% |
9 | 241 | 1.8% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 9 | |
Ⅱ | 9 | |
Ⅲ | 2 | 10.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 458 | |
] | 124 | 21.3% |
Open Punctuation
Value | Count | Frequency (%) |
( | 398 | |
[ | 124 | 23.8% |
Math Symbol
Value | Count | Frequency (%) |
~ | 27 | |
+ | 3 | 10.0% |
Space Separator
Value | Count | Frequency (%) |
26207 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2075 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 368 |
Control
Value | Count | Frequency (%) |
127 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 9 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 8 |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 92223 | |
Common | 48955 | |
Latin | 4428 | 3.0% |
Han | 19 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 2819 | 3.1% |
이 | 2105 | 2.3% |
의 | 2086 | 2.3% |
자 | 2049 | 2.2% |
가 | 1875 | 2.0% |
사 | 1566 | 1.7% |
정 | 1490 | 1.6% |
용 | 1301 | 1.4% |
하 | 1224 | 1.3% |
스 | 1094 | 1.2% |
Other values (765) | 74614 |
Latin
Value | Count | Frequency (%) |
C | 511 | 11.5% |
D | 228 | 5.1% |
e | 189 | 4.3% |
S | 189 | 4.3% |
O | 183 | 4.1% |
t | 178 | 4.0% |
T | 175 | 4.0% |
W | 173 | 3.9% |
A | 167 | 3.8% |
P | 152 | 3.4% |
Other values (45) | 2283 |
Common
Value | Count | Frequency (%) |
26207 | ||
. | 4605 | 9.4% |
0 | 3363 | 6.9% |
1 | 3098 | 6.3% |
2 | 2466 | 5.0% |
_ | 2075 | 4.2% |
3 | 1792 | 3.7% |
4 | 940 | 1.9% |
, | 692 | 1.4% |
) | 458 | 0.9% |
Other values (23) | 3259 | 6.7% |
Han
Value | Count | Frequency (%) |
字 | 11 | |
仁 | 2 | 10.5% |
敬 | 2 | 10.5% |
性 | 2 | 10.5% |
美 | 1 | 5.3% |
音 | 1 | 5.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 92213 | |
ASCII | 53109 | |
None | 250 | 0.2% |
Number Forms | 20 | < 0.1% |
CJK | 19 | < 0.1% |
Punctuation | 12 | < 0.1% |
Compat Jamo | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
26207 | ||
. | 4605 | 8.7% |
0 | 3363 | 6.3% |
1 | 3098 | 5.8% |
2 | 2466 | 4.6% |
_ | 2075 | 3.9% |
3 | 1792 | 3.4% |
4 | 940 | 1.8% |
, | 692 | 1.3% |
C | 511 | 1.0% |
Other values (72) | 7360 | 13.9% |
Hangul
Value | Count | Frequency (%) |
기 | 2819 | 3.1% |
이 | 2105 | 2.3% |
의 | 2086 | 2.3% |
자 | 2049 | 2.2% |
가 | 1875 | 2.0% |
사 | 1566 | 1.7% |
정 | 1490 | 1.6% |
용 | 1301 | 1.4% |
하 | 1224 | 1.3% |
스 | 1094 | 1.2% |
Other values (763) | 74604 |
None
Value | Count | Frequency (%) |
· | 242 | |
㈜ | 8 | 3.2% |
CJK
Value | Count | Frequency (%) |
字 | 11 | |
仁 | 2 | 10.5% |
敬 | 2 | 10.5% |
性 | 2 | 10.5% |
美 | 1 | 5.3% |
音 | 1 | 5.3% |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 9 | |
Ⅱ | 9 | |
Ⅲ | 2 | 10.0% |
Punctuation
Value | Count | Frequency (%) |
’ | 9 | |
‘ | 3 | 25.0% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 2 |
강의시간(분)
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 66 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 13.074188 |
Minimum | 1 |
---|---|
Maximum | 1024 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 77.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 5 |
median | 9 |
Q3 | 24 |
95-th percentile | 29 |
Maximum | 1024 |
Range | 1023 |
Interquartile range (IQR) | 19 |
Descriptive statistics
Standard deviation | 15.890253 |
---|---|
Coefficient of variation (CV) | 1.2153912 |
Kurtosis | 1886.7094 |
Mean | 13.074188 |
Median Absolute Deviation (MAD) | 6 |
Skewness | 31.017226 |
Sum | 114373 |
Variance | 252.50015 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1172 | 13.4% |
8 | 645 | 7.4% |
9 | 635 | 7.3% |
7 | 580 | 6.6% |
6 | 538 | 6.1% |
27 | 408 | 4.7% |
25 | 406 | 4.6% |
29 | 392 | 4.5% |
5 | 390 | 4.5% |
26 | 343 | 3.9% |
Other values (56) | 3239 |
Value | Count | Frequency (%) |
1 | 1172 | |
2 | 276 | 3.2% |
3 | 208 | 2.4% |
4 | 289 | 3.3% |
5 | 390 | 4.5% |
6 | 538 | |
7 | 580 | |
8 | 645 | |
9 | 635 | |
10 | 336 | 3.8% |
Value | Count | Frequency (%) |
1024 | 1 | < 0.1% |
220 | 1 | < 0.1% |
180 | 8 | |
135 | 1 | < 0.1% |
129 | 1 | < 0.1% |
81 | 1 | < 0.1% |
73 | 1 | < 0.1% |
71 | 1 | < 0.1% |
68 | 1 | < 0.1% |
66 | 1 | < 0.1% |
업데이트일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 40 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
<NA> | |
---|---|
2010/07/30 | 479 |
2012/06/27 | 357 |
2012/05/21 | 314 |
2013/08/22 | 219 |
Other values (35) |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 5.7962963 |
Min length | 4 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 2010/07/30 |
---|---|
2nd row | 2010/07/30 |
3rd row | 2010/07/30 |
4th row | 2010/07/30 |
5th row | 2010/07/30 |
Common Values
Value | Count | Frequency (%) |
<NA> | 6129 | |
2010/07/30 | 479 | 5.5% |
2012/06/27 | 357 | 4.1% |
2012/05/21 | 314 | 3.6% |
2013/08/22 | 219 | 2.5% |
2013/09/27 | 193 | 2.2% |
2013/10/01 | 185 | 2.1% |
2013/07/22 | 80 | 0.9% |
2013/07/23 | 75 | 0.9% |
2013/05/31 | 71 | 0.8% |
Other values (30) | 646 | 7.4% |
Length
Value | Count | Frequency (%) |
na | 6129 | |
2010/07/30 | 479 | 5.5% |
2012/06/27 | 357 | 4.1% |
2012/05/21 | 314 | 3.6% |
2013/08/22 | 219 | 2.5% |
2013/09/27 | 193 | 2.2% |
2013/10/01 | 185 | 2.1% |
2013/07/22 | 80 | 0.9% |
2013/07/23 | 75 | 0.9% |
2013/05/31 | 71 | 0.8% |
Other values (30) | 646 | 7.4% |
강의시간(분) | 업데이트일자 | |
---|---|---|
강의시간(분) | 1.000 | NaN |
업데이트일자 | NaN | 1.000 |
강의시간(분) | 업데이트일자 | |
---|---|---|
강의시간(분) | 1.000 | 1.000 |
업데이트일자 | 1.000 | 1.000 |
콘텐츠명 | 강의시간(분) | 업데이트일자 | |
---|---|---|---|
0 | 13.고객응대 기술 | 7 | 2010/07/30 |
1 | 14.아웃바운드 고객응대 실전 | 2 | 2010/07/30 |
2 | 15.고객거절, 반론, 불만 극복법 | 5 | 2010/07/30 |
3 | 16.아웃바운드 판매촉진 실무 | 5 | 2010/07/30 |
4 | 17.아웃바운드 콜마케팅 혁신 | 3 | 2010/07/30 |
5 | 18.아웃바운드 콜 생산성관리 | 4 | 2010/07/30 |
6 | 19.나의 약점, 갭 테라피 | 5 | 2010/07/30 |
7 | 20.아웃바운드 성과혁신은 이렇게 | 5 | 2010/07/30 |
8 | 1.성과관리의 why와 what | 15 | 2012/05/21 |
9 | 2.목표관리제도(MBO) 바로 알기 | 10 | 2012/05/21 |
콘텐츠명 | 강의시간(분) | 업데이트일자 | |
---|---|---|---|
8738 | 01.용접부 검사 방법 이론 학습 | 6 | <NA> |
8739 | 02.굽힘시험 방법 학습 | 6 | <NA> |
8740 | 부가자료_용접부 검사 방법 | 1 | <NA> |
8741 | 01.가공품 고정 및 모듈러 공구에 대한 이론 | 10 | <NA> |
8742 | 02.밀링에 대한 컴퓨터응용가공산업기사 관련 문제풀이 | 10 | <NA> |
8743 | 03.작업공정계획표 작성 실습 | 3 | <NA> |
8744 | 04.작업공정계획표 점검 | 2 | <NA> |
8745 | 부가자료_가공품 고정, 작업공정계획표 작성, 점검 | 1 | <NA> |
8746 | 01.마스터 캠 프로그램 활용에 대한 이론 | 6 | <NA> |
8747 | 02.밀링에 대한 컴퓨터응용가공산업기사 관련 문제풀이 | 10 | <NA> |
Most frequently occurring
콘텐츠명 | 강의시간(분) | 업데이트일자 | # duplicates | |
---|---|---|---|---|
791 | 03_GTAW 히든카드 | 1 | <NA> | 36 |
1181 | 부가자료_GTAW 용접사용 설명서 | 1 | <NA> | 32 |
786 | 03_3D 비밀노트 | 1 | <NA> | 20 |
1154 | 부가자료_3D U | 1 | <NA> | 20 |
1005 | 04.트루용접스토리 | 6 | <NA> | 16 |
1015 | 04_3D 비밀노트 | 1 | <NA> | 14 |
448 | 02.컴퓨터응용가공산업기사 관련 문제풀이 | 9 | <NA> | 10 |
1004 | 04.트루용접스토리 | 5 | <NA> | 10 |
1017 | 04_GTAW 히든카드 | 1 | <NA> | 10 |
366 | 02.밀링에 대한 컴퓨터응용가공산업기사 관련 문제풀이 | 8 | <NA> | 8 |