Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 400.4 KiB |
Average record size in memory | 41.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 1 |
DateTime | 1 |
Categorical | 1 |
Dataset
Description | 한국기술교육대학교 온라인평생교육원 스마트 직업훈련 플랫폼 (STEP)에 대한 즐겨찾기 과정 관련 내용을 제공합니다. |
---|---|
Author | 한국기술교육대학교 |
URL | https://www.data.go.kr/data/15090900/fileData.do |
사용자 인덱스 is highly overall correlated with 마이그레이션 원천 구분 | High correlation |
마이그레이션 원천 구분 is highly overall correlated with 사용자 인덱스 | High correlation |
등록 일시 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 20:14:55.330473 |
---|---|
Analysis finished | 2023-12-12 20:14:56.157470 |
Duration | 0.83 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
사용자 인덱스
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 5509 |
---|---|
Distinct (%) | 55.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5317560.2 |
Minimum | 470 |
---|---|
Maximum | 14590835 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 470 |
---|---|
5-th percentile | 114756.9 |
Q1 | 588691.25 |
median | 1404968 |
Q3 | 11034808 |
95-th percentile | 14166840 |
Maximum | 14590835 |
Range | 14590365 |
Interquartile range (IQR) | 10446117 |
Descriptive statistics
Standard deviation | 5632955.4 |
---|---|
Coefficient of variation (CV) | 1.059312 |
Kurtosis | -1.6493836 |
Mean | 5317560.2 |
Median Absolute Deviation (MAD) | 1190094 |
Skewness | 0.46916558 |
Sum | 5.3175602 × 1010 |
Variance | 3.1730186 × 1013 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1130510 | 66 | 0.7% |
14208155 | 63 | 0.6% |
103407 | 39 | 0.4% |
889703 | 24 | 0.2% |
59787 | 21 | 0.2% |
1444200 | 21 | 0.2% |
10256256 | 17 | 0.2% |
626086 | 17 | 0.2% |
12515254 | 17 | 0.2% |
261459 | 17 | 0.2% |
Other values (5499) | 9698 |
Value | Count | Frequency (%) |
470 | 1 | < 0.1% |
1476 | 2 | |
1727 | 1 | < 0.1% |
2038 | 2 | |
2275 | 2 | |
2607 | 1 | < 0.1% |
23349 | 1 | < 0.1% |
23457 | 3 | |
24061 | 3 | |
25299 | 1 | < 0.1% |
Value | Count | Frequency (%) |
14590835 | 3 | |
14590576 | 2 | |
14589410 | 2 | |
14588965 | 1 | < 0.1% |
14587836 | 1 | < 0.1% |
14586948 | 1 | < 0.1% |
14578028 | 2 | |
14576621 | 1 | < 0.1% |
14573845 | 1 | < 0.1% |
14573327 | 1 | < 0.1% |
과정 아이디
Text
Distinct | 1404 |
---|---|
Distinct (%) | 14.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 73 |
---|---|
Median length | 38 |
Mean length | 16.419 |
Min length | 3 |
Characters and Unicode
Total characters | 164190 |
---|---|
Distinct characters | 605 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 5 ? |
Unique
Unique | 344 ? |
---|---|
Unique (%) | 3.4% |
Sample
1st row | PLC 기본(XGT/XGK) |
---|---|
2nd row | 실습과 함께하는! 빅데이터 구축과 분석 실무(하둡) |
3rd row | 기획 및 프리젠테이션 전략 |
4th row | 중소기업 기술보호 이해 및 핵심수칙 |
5th row | 빅데이터 수집 part 1 |
Value | Count | Frequency (%) |
part | 1168 | 3.3% |
1 | 643 | 1.8% |
활용한 | 591 | 1.7% |
585 | 1.7% | |
및 | 575 | 1.6% |
위한 | 425 | 1.2% |
2 | 425 | 1.2% |
배우는 | 385 | 1.1% |
분석 | 353 | 1.0% |
설계 | 333 | 0.9% |
Other values (2143) | 29618 |
Most occurring characters
Value | Count | Frequency (%) |
25117 | 15.3% | |
기 | 3646 | 2.2% |
이 | 2742 | 1.7% |
로 | 2494 | 1.5% |
C | 2212 | 1.3% |
1 | 2050 | 1.2% |
t | 2036 | 1.2% |
2 | 1923 | 1.2% |
용 | 1907 | 1.2% |
r | 1888 | 1.1% |
Other values (595) | 118175 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 100686 | |
Space Separator | 25117 | 15.3% |
Lowercase Letter | 12961 | 7.9% |
Uppercase Letter | 11633 | 7.1% |
Decimal Number | 6040 | 3.7% |
Open Punctuation | 2210 | 1.3% |
Close Punctuation | 2210 | 1.3% |
Connector Punctuation | 1296 | 0.8% |
Other Punctuation | 1285 | 0.8% |
Dash Punctuation | 486 | 0.3% |
Other values (2) | 266 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 3646 | 3.6% |
이 | 2742 | 2.7% |
로 | 2494 | 2.5% |
용 | 1907 | 1.9% |
리 | 1733 | 1.7% |
스 | 1651 | 1.6% |
계 | 1637 | 1.6% |
프 | 1587 | 1.6% |
한 | 1585 | 1.6% |
전 | 1483 | 1.5% |
Other values (514) | 80221 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 2212 | |
S | 1027 | 8.8% |
P | 980 | 8.4% |
D | 870 | 7.5% |
L | 867 | 7.5% |
A | 733 | 6.3% |
I | 609 | 5.2% |
T | 573 | 4.9% |
N | 564 | 4.8% |
M | 559 | 4.8% |
Other values (16) | 2639 |
Lowercase Letter
Value | Count | Frequency (%) |
t | 2036 | |
r | 1888 | |
a | 1783 | |
p | 1326 | |
o | 1002 | |
e | 856 | |
i | 525 | 4.1% |
n | 507 | 3.9% |
l | 496 | 3.8% |
c | 407 | 3.1% |
Other values (14) | 2135 |
Decimal Number
Value | Count | Frequency (%) |
1 | 2050 | |
2 | 1923 | |
0 | 715 | 11.8% |
3 | 542 | 9.0% |
4 | 241 | 4.0% |
5 | 185 | 3.1% |
6 | 148 | 2.5% |
9 | 96 | 1.6% |
7 | 89 | 1.5% |
8 | 51 | 0.8% |
Other Punctuation
Value | Count | Frequency (%) |
! | 274 | |
, | 268 | |
. | 253 | |
: | 220 | |
/ | 73 | 5.7% |
# | 66 | 5.1% |
· | 60 | 4.7% |
& | 53 | 4.1% |
' | 18 | 1.4% |
Math Symbol
Value | Count | Frequency (%) |
+ | 142 | |
> | 1 | 0.7% |
< | 1 | 0.7% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1695 | |
[ | 515 | 23.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1695 | |
] | 515 | 23.3% |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 108 | |
Ⅱ | 14 | 11.5% |
Space Separator
Value | Count | Frequency (%) |
25117 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1296 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 486 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 100682 | |
Common | 38788 | 23.6% |
Latin | 24716 | 15.1% |
Han | 4 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 3646 | 3.6% |
이 | 2742 | 2.7% |
로 | 2494 | 2.5% |
용 | 1907 | 1.9% |
리 | 1733 | 1.7% |
스 | 1651 | 1.6% |
계 | 1637 | 1.6% |
프 | 1587 | 1.6% |
한 | 1585 | 1.6% |
전 | 1483 | 1.5% |
Other values (512) | 80217 |
Latin
Value | Count | Frequency (%) |
C | 2212 | 8.9% |
t | 2036 | 8.2% |
r | 1888 | 7.6% |
a | 1783 | 7.2% |
p | 1326 | 5.4% |
S | 1027 | 4.2% |
o | 1002 | 4.1% |
P | 980 | 4.0% |
D | 870 | 3.5% |
L | 867 | 3.5% |
Other values (42) | 10725 |
Common
Value | Count | Frequency (%) |
25117 | ||
1 | 2050 | 5.3% |
2 | 1923 | 5.0% |
( | 1695 | 4.4% |
) | 1695 | 4.4% |
_ | 1296 | 3.3% |
0 | 715 | 1.8% |
3 | 542 | 1.4% |
[ | 515 | 1.3% |
] | 515 | 1.3% |
Other values (19) | 2725 | 7.0% |
Han
Value | Count | Frequency (%) |
玉 | 2 | |
篇 | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 100682 | |
ASCII | 63322 | |
Number Forms | 122 | 0.1% |
None | 60 | < 0.1% |
CJK | 4 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
25117 | ||
C | 2212 | 3.5% |
1 | 2050 | 3.2% |
t | 2036 | 3.2% |
2 | 1923 | 3.0% |
r | 1888 | 3.0% |
a | 1783 | 2.8% |
( | 1695 | 2.7% |
) | 1695 | 2.7% |
p | 1326 | 2.1% |
Other values (68) | 21597 |
Hangul
Value | Count | Frequency (%) |
기 | 3646 | 3.6% |
이 | 2742 | 2.7% |
로 | 2494 | 2.5% |
용 | 1907 | 1.9% |
리 | 1733 | 1.7% |
스 | 1651 | 1.6% |
계 | 1637 | 1.6% |
프 | 1587 | 1.6% |
한 | 1585 | 1.6% |
전 | 1483 | 1.5% |
Other values (512) | 80217 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 108 | |
Ⅱ | 14 | 11.5% |
None
Value | Count | Frequency (%) |
· | 60 |
CJK
Value | Count | Frequency (%) |
玉 | 2 | |
篇 | 2 |
등록 일시
Date
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2016-09-29 08:56:48 |
---|---|
Maximum | 2023-09-25 10:59:17 |
마이그레이션 원천 구분
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
OLEIPORTAL |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 6.4774 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | OLEIPORTAL |
---|---|
2nd row | OLEIPORTAL |
3rd row | OLEIPORTAL |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5871 | |
OLEIPORTAL | 4129 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5871 | |
oleiportal | 4129 |
사용자 인덱스 | |
---|---|
사용자 인덱스 | 1.000 |
사용자 인덱스 | 마이그레이션 원천 구분 | |
---|---|---|
사용자 인덱스 | 1.000 | 1.000 |
마이그레이션 원천 구분 | 1.000 | 1.000 |
사용자 인덱스 | 과정 아이디 | 등록 일시 | 마이그레이션 원천 구분 | |
---|---|---|---|---|
36595 | 894053 | PLC 기본(XGT/XGK) | 2018-01-31 19:42:41 | OLEIPORTAL |
29390 | 698789 | 실습과 함께하는! 빅데이터 구축과 분석 실무(하둡) | 2018-06-12 02:05:05 | OLEIPORTAL |
48476 | 1371790 | 기획 및 프리젠테이션 전략 | 2019-05-19 21:51:48 | OLEIPORTAL |
1218 | 47636 | 중소기업 기술보호 이해 및 핵심수칙 | 2021-05-25 15:30:14 | <NA> |
84086 | 12519196 | 빅데이터 수집 part 1 | 2020-08-02 23:17:54 | <NA> |
51833 | 1444200 | 애플리케이션 요구사항 분석 | 2021-09-01 13:03:17 | <NA> |
62805 | 10270095 | PLC 기본(SIEMENS) | 2020-05-28 12:41:53 | <NA> |
91213 | 13578515 | [기획의 신] 하루 7분, 기획력 | 2020-11-16 11:31:39 | <NA> |
7073 | 161639 | 통계 기반 데이터 분석 | 2019-01-28 16:06:16 | OLEIPORTAL |
80300 | 11916484 | 파이썬 프로그래밍(2019년) | 2020-05-21 14:19:07 | <NA> |
사용자 인덱스 | 과정 아이디 | 등록 일시 | 마이그레이션 원천 구분 | |
---|---|---|---|---|
63932 | 10282456 | IT시스템통합 운영관리 | 2019-08-16 14:09:30 | OLEIPORTAL |
9638 | 197001 | 파이썬 프로그래밍(2019년) | 2021-12-01 17:49:03 | <NA> |
27516 | 648140 | 전기설비 보호계전시스템 설계 | 2022-09-15 07:38:12 | <NA> |
29741 | 703452 | 네트워크 I_1 | 2017-08-09 09:49:58 | OLEIPORTAL |
92701 | 13789966 | 현장에서 배우는 공조냉동시스템 자동제어 | 2020-11-29 12:37:23 | <NA> |
36970 | 900531 | 공정흐름도 작성 | 2018-02-04 20:51:11 | OLEIPORTAL |
94824 | 14119943 | 재미있게 배우는 기초전자회로 | 2021-01-10 19:49:11 | <NA> |
87846 | 13118042 | 논리 데이터베이스 설계 | 2022-02-23 08:44:50 | <NA> |
37318 | 908983 | 모두의 일러스트레이터 CC | 2019-06-04 16:41:15 | OLEIPORTAL |
32191 | 789697 | [NCS]웹 표준에 맞는 HTML5 프로그래밍_1 | 2019-11-11 01:34:00 | <NA> |