Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 365 |
Missing cells (%) | 0.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 576.2 KiB |
Average record size in memory | 59.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 3 |
DateTime | 1 |
Dataset
Description | 한국기술교육대학교 온라인평생교육원 스마트 직업훈련 플랫폼 (STEP)에 대한 메시지 발송 이력 관련 내용을 제공합니다. |
---|---|
Author | 한국기술교육대학교 |
URL | https://www.data.go.kr/data/15090990/fileData.do |
카테고리 코드 is highly overall correlated with 과정 아이디 and 2 other fields | High correlation |
등록 국가 is highly overall correlated with 타입코드 and 1 other fields | High correlation |
아이디 is highly overall correlated with 과정 아이디 | High correlation |
과정 아이디 is highly overall correlated with 아이디 and 1 other fields | High correlation |
타입코드 is highly overall correlated with 카테고리 코드 and 1 other fields | High correlation |
타입코드 is highly imbalanced (75.7%) | Imbalance |
카테고리 코드 is highly imbalanced (87.2%) | Imbalance |
등록 국가 is highly imbalanced (88.0%) | Imbalance |
과정 아이디 has 365 (3.6%) missing values | Missing |
아이디 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 03:40:04.882045 |
---|---|
Analysis finished | 2023-12-12 03:40:06.218177 |
Duration | 1.34 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
아이디
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 71785.09 |
Minimum | 43 |
---|---|
Maximum | 215163 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 43 |
---|---|
5-th percentile | 5452.05 |
Q1 | 25708.75 |
median | 51753 |
Q3 | 80748 |
95-th percentile | 204779.25 |
Maximum | 215163 |
Range | 215120 |
Interquartile range (IQR) | 55039.25 |
Descriptive statistics
Standard deviation | 64545.734 |
---|---|
Coefficient of variation (CV) | 0.89915237 |
Kurtosis | -0.034005661 |
Mean | 71785.09 |
Median Absolute Deviation (MAD) | 26704 |
Skewness | 1.1585621 |
Sum | 7.178509 × 108 |
Variance | 4.1661518 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
77385 | 1 | < 0.1% |
93934 | 1 | < 0.1% |
18935 | 1 | < 0.1% |
49277 | 1 | < 0.1% |
39392 | 1 | < 0.1% |
180752 | 1 | < 0.1% |
35740 | 1 | < 0.1% |
30321 | 1 | < 0.1% |
191754 | 1 | < 0.1% |
193282 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
43 | 1 | |
44 | 1 | |
98 | 1 | |
99 | 1 | |
104 | 1 | |
109 | 1 | |
110 | 1 | |
112 | 1 | |
114 | 1 | |
129 | 1 |
Value | Count | Frequency (%) |
215163 | 1 | |
215153 | 1 | |
215142 | 1 | |
215134 | 1 | |
215120 | 1 | |
215074 | 1 | |
215059 | 1 | |
215052 | 1 | |
215046 | 1 | |
215037 | 1 |
타입코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
단문 | |
---|---|
장문 | 401 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 단문 |
---|---|
2nd row | 단문 |
3rd row | 단문 |
4th row | 단문 |
5th row | 단문 |
Common Values
Value | Count | Frequency (%) |
단문 | 9599 | |
장문 | 401 | 4.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
단문 | 9599 | |
장문 | 401 | 4.0% |
카테고리 코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
1000 | |
---|---|
9001 | 176 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1000 |
---|---|
2nd row | 1000 |
3rd row | 1000 |
4th row | 1000 |
5th row | 1000 |
Common Values
Value | Count | Frequency (%) |
1000 | 9824 | |
9001 | 176 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1000 | 9824 | |
9001 | 176 | 1.8% |
과정 아이디
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 2784 |
---|---|
Distinct (%) | 28.9% |
Missing | 365 |
Missing (%) | 3.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4938.5661 |
Minimum | 32 |
---|---|
Maximum | 12345 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 32 |
---|---|
5-th percentile | 2691 |
Q1 | 3810 |
median | 4646 |
Q3 | 5533 |
95-th percentile | 9052 |
Maximum | 12345 |
Range | 12313 |
Interquartile range (IQR) | 1723 |
Descriptive statistics
Standard deviation | 2001.4632 |
---|---|
Coefficient of variation (CV) | 0.40527214 |
Kurtosis | 0.70811729 |
Mean | 4938.5661 |
Median Absolute Deviation (MAD) | 882 |
Skewness | 0.53707558 |
Sum | 47583084 |
Variance | 4005855.1 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
5620 | 51 | 0.5% |
5204 | 49 | 0.5% |
5442 | 48 | 0.5% |
5087 | 46 | 0.5% |
5440 | 44 | 0.4% |
5640 | 43 | 0.4% |
5536 | 42 | 0.4% |
5496 | 39 | 0.4% |
5528 | 37 | 0.4% |
3831 | 34 | 0.3% |
Other values (2774) | 9202 | |
(Missing) | 365 | 3.6% |
Value | Count | Frequency (%) |
32 | 2 | < 0.1% |
33 | 8 | |
38 | 1 | < 0.1% |
142 | 1 | < 0.1% |
144 | 2 | < 0.1% |
145 | 1 | < 0.1% |
147 | 2 | < 0.1% |
148 | 4 | |
149 | 1 | < 0.1% |
151 | 2 | < 0.1% |
Value | Count | Frequency (%) |
12345 | 1 | |
11040 | 1 | |
11038 | 1 | |
10952 | 1 | |
10943 | 1 | |
10937 | 1 | |
10859 | 1 | |
10811 | 1 | |
10787 | 1 | |
10778 | 1 |
등록 국가
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
KR | |
---|---|
US | 176 |
UNKNOWN | 73 |
Length
Max length | 7 |
---|---|
Median length | 2 |
Mean length | 2.0365 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | KR |
---|---|
2nd row | KR |
3rd row | KR |
4th row | KR |
5th row | KR |
Common Values
Value | Count | Frequency (%) |
KR | 9751 | |
US | 176 | 1.8% |
UNKNOWN | 73 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
kr | 9751 | |
us | 176 | 1.8% |
unknown | 73 | 0.7% |
등록 일시
Date
Distinct | 9992 |
---|---|
Distinct (%) | 99.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2015-03-25 10:02:47 |
---|---|
Maximum | 2016-11-14 10:27:40 |
아이디 | 타입코드 | 카테고리 코드 | 과정 아이디 | 등록 국가 | |
---|---|---|---|---|---|
아이디 | 1.000 | 0.409 | 0.473 | 0.836 | 0.454 |
타입코드 | 0.409 | 1.000 | 0.855 | 0.204 | 0.418 |
카테고리 코드 | 0.473 | 0.855 | 1.000 | NaN | 1.000 |
과정 아이디 | 0.836 | 0.204 | NaN | 1.000 | 0.022 |
등록 국가 | 0.454 | 0.418 | 1.000 | 0.022 | 1.000 |
카테고리 코드 | 타입코드 | 등록 국가 | |
---|---|---|---|
카테고리 코드 | 1.000 | 0.653 | 1.000 |
타입코드 | 0.653 | 1.000 | 0.655 |
등록 국가 | 1.000 | 0.655 | 1.000 |
아이디 | 과정 아이디 | 타입코드 | 카테고리 코드 | 등록 국가 | |
---|---|---|---|---|---|
아이디 | 1.000 | 0.958 | 0.314 | 0.363 | 0.306 |
과정 아이디 | 0.958 | 1.000 | 0.204 | 1.000 | 0.022 |
타입코드 | 0.314 | 0.204 | 1.000 | 0.653 | 0.655 |
카테고리 코드 | 0.363 | 1.000 | 0.653 | 1.000 | 1.000 |
등록 국가 | 0.306 | 0.022 | 0.655 | 1.000 | 1.000 |
아이디 | 타입코드 | 카테고리 코드 | 과정 아이디 | 등록 국가 | 등록 일시 | |
---|---|---|---|---|---|---|
72156 | 77385 | 단문 | 1000 | 5539 | KR | 2015-11-28 14:28:52 |
21056 | 22270 | 단문 | 1000 | 3587 | KR | 2015-08-11 09:45:37 |
78851 | 114260 | 단문 | 1000 | 6037 | KR | 2015-12-30 12:12:46 |
61965 | 65084 | 단문 | 1000 | 4801 | KR | 2015-11-08 14:49:42 |
29809 | 31233 | 단문 | 1000 | 3948 | KR | 2015-08-31 17:06:02 |
83553 | 190888 | 단문 | 1000 | 8620 | KR | 2016-07-21 13:51:36 |
23913 | 25186 | 단문 | 1000 | 4252 | KR | 2015-08-18 12:14:43 |
66601 | 70030 | 단문 | 1000 | 5544 | KR | 2015-11-16 20:06:38 |
36329 | 38045 | 단문 | 1000 | 4483 | KR | 2015-09-16 14:54:48 |
23493 | 24755 | 단문 | 1000 | 3474 | KR | 2015-08-17 15:45:59 |
아이디 | 타입코드 | 카테고리 코드 | 과정 아이디 | 등록 국가 | 등록 일시 | |
---|---|---|---|---|---|---|
58966 | 61808 | 단문 | 1000 | 5087 | KR | 2015-11-02 14:49:38 |
2113 | 2403 | 단문 | 1000 | 408 | KR | 2015-05-06 14:16:28 |
61913 | 65018 | 단문 | 1000 | 4668 | KR | 2015-11-08 11:15:10 |
2523 | 2851 | 단문 | 1000 | 430 | KR | 2015-05-11 16:04:15 |
38187 | 40008 | 단문 | 1000 | 4402 | KR | 2015-09-21 16:49:49 |
52729 | 55324 | 단문 | 1000 | 4629 | KR | 2015-10-22 11:45:40 |
11722 | 12642 | 단문 | 1000 | 2982 | KR | 2015-07-10 14:05:04 |
32585 | 34130 | 단문 | 1000 | 4050 | KR | 2015-09-07 13:32:33 |
94312 | 207950 | 단문 | 1000 | 9345 | KR | 2016-10-25 10:50:23 |
6109 | 6638 | 단문 | 1000 | 444 | KR | 2015-06-05 11:00:53 |