Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 8 |
Duplicate rows (%) | 8.0% |
Total size in memory | 7.5 KiB |
Average record size in memory | 76.3 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 6 |
Dataset
Description | Sample |
---|---|
Author | 국민체육진흥공단 |
URL | https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=c99df919-f2c9-4ceb-999d-82688c028031 |
Dataset has 8 (8.0%) duplicate rows | Duplicates |
test_cnt is highly overall correlated with center_nm | High correlation |
test_age is highly overall correlated with center_nm and 2 other fields | High correlation |
test_ymd is highly overall correlated with center_nm and 2 other fields | High correlation |
center_nm is highly overall correlated with test_cnt and 5 other fields | High correlation |
age_gbn is highly overall correlated with test_age and 2 other fields | High correlation |
test_gbn is highly overall correlated with test_age and 2 other fields | High correlation |
input_gbn is highly overall correlated with center_nm | High correlation |
input_gbn is highly imbalanced (78.9%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 10:12:01.324574 |
---|---|
Analysis finished | 2023-12-10 10:12:04.460354 |
Duration | 3.14 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
test_cnt
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 8.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.86 |
Minimum | 1 |
---|---|
Maximum | 11 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 5 |
Maximum | 11 |
Range | 10 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 1.7057242 |
---|---|
Coefficient of variation (CV) | 0.91705601 |
Kurtosis | 10.296552 |
Mean | 1.86 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 2.9268518 |
Sum | 186 |
Variance | 2.9094949 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 66 | |
2 | 14 | 14.0% |
3 | 8 | 8.0% |
4 | 5 | 5.0% |
5 | 3 | 3.0% |
8 | 2 | 2.0% |
6 | 1 | 1.0% |
11 | 1 | 1.0% |
Value | Count | Frequency (%) |
1 | 66 | |
2 | 14 | 14.0% |
3 | 8 | 8.0% |
4 | 5 | 5.0% |
5 | 3 | 3.0% |
6 | 1 | 1.0% |
8 | 2 | 2.0% |
11 | 1 | 1.0% |
Value | Count | Frequency (%) |
11 | 1 | 1.0% |
8 | 2 | 2.0% |
6 | 1 | 1.0% |
5 | 3 | 3.0% |
4 | 5 | 5.0% |
3 | 8 | 8.0% |
2 | 14 | 14.0% |
1 | 66 |
center_nm
Categorical
HIGH CORRELATION
 
Distinct | 39 |
---|---|
Distinct (%) | 39.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
안동 | |
---|---|
동구(광주) | |
성남 | |
영동 | |
경산 | 4 |
Other values (34) |
Length
Max length | 10 |
---|---|
Median length | 2 |
Mean length | 3 |
Min length | 2 |
Unique
Unique | 21 ? |
---|---|
Unique (%) | 21.0% |
Sample
1st row | 서초 |
---|---|
2nd row | KSPO대구 |
3rd row | 안동 |
4th row | 성남 |
5th row | 영동 |
Common Values
Value | Count | Frequency (%) |
안동 | 12 | 12.0% |
동구(광주) | 12 | 12.0% |
성남 | 12 | 12.0% |
영동 | 7 | 7.0% |
경산 | 4 | 4.0% |
제주 | 4 | 4.0% |
마포 | 3 | 3.0% |
스포원(금정) | 3 | 3.0% |
의정부 | 3 | 3.0% |
구미 | 3 | 3.0% |
Other values (29) | 37 |
Length
Value | Count | Frequency (%) |
안동 | 12 | 12.0% |
성남 | 12 | 12.0% |
동구(광주 | 12 | 12.0% |
영동 | 7 | 7.0% |
경산 | 4 | 4.0% |
제주 | 4 | 4.0% |
마포 | 3 | 3.0% |
스포원(금정 | 3 | 3.0% |
의정부 | 3 | 3.0% |
구미 | 3 | 3.0% |
Other values (29) | 37 |
age_gbn
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
성인 | |
---|---|
청소년 | |
노인 | |
유소년 | 3 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.39 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 성인 |
---|---|
2nd row | 노인 |
3rd row | 청소년 |
4th row | 청소년 |
5th row | 청소년 |
Common Values
Value | Count | Frequency (%) |
성인 | 43 | |
청소년 | 36 | |
노인 | 18 | |
유소년 | 3 | 3.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
성인 | 43 | |
청소년 | 36 | |
노인 | 18 | |
유소년 | 3 | 3.0% |
test_gbn
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
출장 | |
---|---|
일반 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반 |
---|---|
2nd row | 일반 |
3rd row | 출장 |
4th row | 출장 |
5th row | 출장 |
Common Values
Value | Count | Frequency (%) |
출장 | 56 | |
일반 | 44 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
출장 | 56 | |
일반 | 44 |
test_age
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 43 |
---|---|
Distinct (%) | 43.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 32.7 |
Minimum | 11 |
---|---|
Maximum | 77 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 11 |
---|---|
5-th percentile | 13 |
Q1 | 14 |
median | 21.5 |
Q3 | 55.5 |
95-th percentile | 72.05 |
Maximum | 77 |
Range | 66 |
Interquartile range (IQR) | 41.5 |
Descriptive statistics
Standard deviation | 22.369938 |
---|---|
Coefficient of variation (CV) | 0.68409597 |
Kurtosis | -1.0262858 |
Mean | 32.7 |
Median Absolute Deviation (MAD) | 7.5 |
Skewness | 0.81719232 |
Sum | 3270 |
Variance | 500.41414 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
14 | 16 | 16.0% |
13 | 9 | 9.0% |
15 | 8 | 8.0% |
19 | 5 | 5.0% |
67 | 4 | 4.0% |
26 | 4 | 4.0% |
21 | 4 | 4.0% |
72 | 3 | 3.0% |
22 | 3 | 3.0% |
25 | 3 | 3.0% |
Other values (33) | 41 |
Value | Count | Frequency (%) |
11 | 1 | 1.0% |
12 | 2 | 2.0% |
13 | 9 | |
14 | 16 | |
15 | 8 | |
17 | 1 | 1.0% |
18 | 2 | 2.0% |
19 | 5 | 5.0% |
20 | 2 | 2.0% |
21 | 4 | 4.0% |
Value | Count | Frequency (%) |
77 | 1 | 1.0% |
75 | 1 | 1.0% |
74 | 2 | |
73 | 1 | 1.0% |
72 | 3 | |
71 | 1 | 1.0% |
70 | 1 | 1.0% |
69 | 1 | 1.0% |
67 | 4 | |
66 | 2 |
input_gbn
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
관리자 | |
---|---|
<NA> | 3 |
인바디 | 2 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.03 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 관리자 |
---|---|
2nd row | <NA> |
3rd row | 관리자 |
4th row | 관리자 |
5th row | 관리자 |
Common Values
Value | Count | Frequency (%) |
관리자 | 95 | |
<NA> | 3 | 3.0% |
인바디 | 2 | 2.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
관리자 | 95 | |
na | 3 | 3.0% |
인바디 | 2 | 2.0% |
cert_gbn
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
참가증 | |
---|---|
3등급 | |
2등급 | |
1등급 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2등급 |
---|---|
2nd row | 1등급 |
3rd row | 참가증 |
4th row | 3등급 |
5th row | 참가증 |
Common Values
Value | Count | Frequency (%) |
참가증 | 63 | |
3등급 | 15 | 15.0% |
2등급 | 13 | 13.0% |
1등급 | 9 | 9.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
참가증 | 63 | |
3등급 | 15 | 15.0% |
2등급 | 13 | 13.0% |
1등급 | 9 | 9.0% |
test_ymd
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 9.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20211113 |
Minimum | 20211105 |
---|---|
Maximum | 20211125 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 20211105 |
---|---|
5-th percentile | 20211108 |
Q1 | 20211109 |
median | 20211112 |
Q3 | 20211119 |
95-th percentile | 20211119 |
Maximum | 20211125 |
Range | 20 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 4.4404022 |
---|---|
Coefficient of variation (CV) | 2.1970103 × 10-7 |
Kurtosis | -0.57397746 |
Mean | 20211113 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.74859508 |
Sum | 2.0211113 × 109 |
Variance | 19.717172 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20211112 | 26 | |
20211119 | 24 | |
20211110 | 19 | |
20211108 | 13 | |
20211109 | 12 | |
20211116 | 2 | 2.0% |
20211105 | 2 | 2.0% |
20211123 | 1 | 1.0% |
20211125 | 1 | 1.0% |
Value | Count | Frequency (%) |
20211105 | 2 | 2.0% |
20211108 | 13 | |
20211109 | 12 | |
20211110 | 19 | |
20211112 | 26 | |
20211116 | 2 | 2.0% |
20211119 | 24 | |
20211123 | 1 | 1.0% |
20211125 | 1 | 1.0% |
Value | Count | Frequency (%) |
20211125 | 1 | 1.0% |
20211123 | 1 | 1.0% |
20211119 | 24 | |
20211116 | 2 | 2.0% |
20211112 | 26 | |
20211110 | 19 | |
20211109 | 12 | |
20211108 | 13 | |
20211105 | 2 | 2.0% |
test_sex
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
M | |
---|---|
F |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | M |
---|---|
2nd row | M |
3rd row | M |
4th row | F |
5th row | M |
Common Values
Value | Count | Frequency (%) |
M | 57 | |
F | 43 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
m | 57 | |
f | 43 |
test_cnt | center_nm | age_gbn | test_gbn | test_age | input_gbn | cert_gbn | test_ymd | test_sex | |
---|---|---|---|---|---|---|---|---|---|
test_cnt | 1.000 | 0.905 | 0.230 | 0.700 | 0.483 | 0.178 | 0.000 | 0.289 | 0.000 |
center_nm | 0.905 | 1.000 | 0.898 | 0.844 | 0.926 | 0.777 | 0.791 | 0.900 | 0.609 |
age_gbn | 0.230 | 0.898 | 1.000 | 0.651 | 0.887 | 0.000 | 0.000 | 0.638 | 0.000 |
test_gbn | 0.700 | 0.844 | 0.651 | 1.000 | 0.722 | 0.000 | 0.352 | 0.601 | 0.000 |
test_age | 0.483 | 0.926 | 0.887 | 0.722 | 1.000 | 0.348 | 0.250 | 0.469 | 0.000 |
input_gbn | 0.178 | 0.777 | 0.000 | 0.000 | 0.348 | 1.000 | 0.000 | 0.000 | 0.000 |
cert_gbn | 0.000 | 0.791 | 0.000 | 0.352 | 0.250 | 0.000 | 1.000 | 0.330 | 0.000 |
test_ymd | 0.289 | 0.900 | 0.638 | 0.601 | 0.469 | 0.000 | 0.330 | 1.000 | 0.150 |
test_sex | 0.000 | 0.609 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.150 | 1.000 |
age_gbn | cert_gbn | input_gbn | test_sex | test_gbn | center_nm | |
---|---|---|---|---|---|---|
age_gbn | 1.000 | 0.000 | 0.000 | 0.000 | 0.451 | 0.553 |
cert_gbn | 0.000 | 1.000 | 0.000 | 0.000 | 0.232 | 0.424 |
input_gbn | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 | 0.536 |
test_sex | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.405 |
test_gbn | 0.451 | 0.232 | 0.000 | 0.000 | 1.000 | 0.588 |
center_nm | 0.553 | 0.424 | 0.536 | 0.405 | 0.588 | 1.000 |
test_cnt | test_age | test_ymd | center_nm | age_gbn | test_gbn | input_gbn | cert_gbn | test_sex | |
---|---|---|---|---|---|---|---|---|---|
test_cnt | 1.000 | 0.358 | 0.449 | 0.512 | 0.000 | 0.314 | 0.159 | 0.000 | 0.000 |
test_age | 0.358 | 1.000 | 0.378 | 0.534 | 0.735 | 0.541 | 0.254 | 0.144 | 0.000 |
test_ymd | 0.449 | 0.378 | 1.000 | 0.528 | 0.587 | 0.630 | 0.000 | 0.215 | 0.116 |
center_nm | 0.512 | 0.534 | 0.528 | 1.000 | 0.553 | 0.588 | 0.536 | 0.424 | 0.405 |
age_gbn | 0.000 | 0.735 | 0.587 | 0.553 | 1.000 | 0.451 | 0.000 | 0.000 | 0.000 |
test_gbn | 0.314 | 0.541 | 0.630 | 0.588 | 0.451 | 1.000 | 0.000 | 0.232 | 0.000 |
input_gbn | 0.159 | 0.254 | 0.000 | 0.536 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 |
cert_gbn | 0.000 | 0.144 | 0.215 | 0.424 | 0.000 | 0.232 | 0.000 | 1.000 | 0.000 |
test_sex | 0.000 | 0.000 | 0.116 | 0.405 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
test_cnt | center_nm | age_gbn | test_gbn | test_age | input_gbn | cert_gbn | test_ymd | test_sex | |
---|---|---|---|---|---|---|---|---|---|
0 | 3 | 서초 | 성인 | 일반 | 25 | 관리자 | 2등급 | 20211119 | M |
1 | 2 | KSPO대구 | 노인 | 일반 | 71 | <NA> | 1등급 | 20211123 | M |
2 | 1 | 안동 | 청소년 | 출장 | 14 | 관리자 | 참가증 | 20211110 | M |
3 | 1 | 성남 | 청소년 | 출장 | 15 | 관리자 | 3등급 | 20211109 | F |
4 | 1 | 영동 | 청소년 | 출장 | 13 | 관리자 | 참가증 | 20211112 | M |
5 | 1 | 영동 | 청소년 | 출장 | 14 | 관리자 | 참가증 | 20211112 | F |
6 | 1 | 성남 | 청소년 | 출장 | 15 | 관리자 | 참가증 | 20211109 | F |
7 | 2 | 서대문 | 성인 | 일반 | 19 | <NA> | 3등급 | 20211125 | F |
8 | 1 | 영동 | 청소년 | 출장 | 14 | 관리자 | 참가증 | 20211112 | F |
9 | 1 | 성남 | 청소년 | 출장 | 15 | 관리자 | 참가증 | 20211109 | F |
test_cnt | center_nm | age_gbn | test_gbn | test_age | input_gbn | cert_gbn | test_ymd | test_sex | |
---|---|---|---|---|---|---|---|---|---|
90 | 11 | 삼척 | 청소년 | 일반 | 17 | 관리자 | 참가증 | 20211110 | M |
91 | 1 | 동구(광주) | 성인 | 출장 | 63 | 관리자 | 참가증 | 20211109 | F |
92 | 1 | 안동 | 청소년 | 출장 | 14 | 관리자 | 참가증 | 20211108 | M |
93 | 1 | 동구(광주) | 노인 | 출장 | 74 | 관리자 | 참가증 | 20211109 | M |
94 | 1 | 영동 | 청소년 | 출장 | 13 | 관리자 | 참가증 | 20211109 | F |
95 | 1 | 동구(광주) | 노인 | 출장 | 75 | 관리자 | 참가증 | 20211110 | M |
96 | 1 | 영동 | 청소년 | 출장 | 13 | 관리자 | 참가증 | 20211109 | F |
97 | 1 | 동구(광주) | 노인 | 출장 | 69 | 관리자 | 참가증 | 20211110 | F |
98 | 1 | 동구(광주) | 노인 | 출장 | 72 | 관리자 | 참가증 | 20211110 | M |
99 | 1 | 동구(광주) | 노인 | 출장 | 72 | 관리자 | 참가증 | 20211109 | F |
Most frequently occurring
test_cnt | center_nm | age_gbn | test_gbn | test_age | input_gbn | cert_gbn | test_ymd | test_sex | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|
3 | 1 | 안동 | 청소년 | 출장 | 14 | 관리자 | 참가증 | 20211108 | M | 4 |
0 | 1 | 성남 | 청소년 | 출장 | 13 | 관리자 | 참가증 | 20211108 | F | 3 |
2 | 1 | 성남 | 청소년 | 출장 | 15 | 관리자 | 참가증 | 20211109 | F | 3 |
1 | 1 | 성남 | 청소년 | 출장 | 13 | 관리자 | 참가증 | 20211108 | M | 2 |
4 | 1 | 안동 | 청소년 | 출장 | 14 | 관리자 | 참가증 | 20211110 | M | 2 |
5 | 1 | 안동 | 청소년 | 출장 | 14 | 관리자 | 참가증 | 20211112 | M | 2 |
6 | 1 | 영동 | 청소년 | 출장 | 13 | 관리자 | 참가증 | 20211109 | F | 2 |
7 | 1 | 영동 | 청소년 | 출장 | 14 | 관리자 | 참가증 | 20211112 | F | 2 |