Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 75 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.5 KiB |
Average record size in memory | 60.8 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 5 |
Text | 1 |
Dataset
Description | Sample |
---|---|
Author | 데이터마케팅코리아 |
URL | https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=e972fc40-f583-11eb-8e60-2bcdc8456bfb |
UPPER_CTGRY_NM has constant value "" | Constant |
LWPRT_CTGRY_NM is highly overall correlated with SRCHWRD_NM | High correlation |
SRCHWRD_NM is highly overall correlated with SEQ_NO and 1 other fields | High correlation |
SEQ_NO is highly overall correlated with SRCHWRD_NM and 1 other fields | High correlation |
ANALS_YM is highly overall correlated with SEQ_NO | High correlation |
SEQ_NO has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 09:45:22.114430 |
---|---|
Analysis finished | 2023-12-10 09:45:23.427717 |
Duration | 1.31 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
SEQ_NO
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 75 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 343.33333 |
Minimum | 16 |
---|---|
Maximum | 720 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 807.0 B |
Quantile statistics
Minimum | 16 |
---|---|
5-th percentile | 19.7 |
Q1 | 159.5 |
median | 298 |
Q3 | 516.5 |
95-th percentile | 716.3 |
Maximum | 720 |
Range | 704 |
Interquartile range (IQR) | 357 |
Descriptive statistics
Standard deviation | 216.29611 |
---|---|
Coefficient of variation (CV) | 0.62998868 |
Kurtosis | -1.0936019 |
Mean | 343.33333 |
Median Absolute Deviation (MAD) | 200 |
Skewness | 0.055592554 |
Sum | 25750 |
Variance | 46784.009 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
16 | 1 | 1.3% |
479 | 1 | 1.3% |
516 | 1 | 1.3% |
500 | 1 | 1.3% |
499 | 1 | 1.3% |
498 | 1 | 1.3% |
497 | 1 | 1.3% |
496 | 1 | 1.3% |
480 | 1 | 1.3% |
478 | 1 | 1.3% |
Other values (65) | 65 |
Value | Count | Frequency (%) |
16 | 1 | |
17 | 1 | |
18 | 1 | |
19 | 1 | |
20 | 1 | |
36 | 1 | |
37 | 1 | |
38 | 1 | |
39 | 1 | |
40 | 1 |
Value | Count | Frequency (%) |
720 | 1 | |
719 | 1 | |
718 | 1 | |
717 | 1 | |
716 | 1 | |
660 | 1 | |
659 | 1 | |
658 | 1 | |
657 | 1 | |
656 | 1 |
SRCHWRD_NM
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
영어학원 | |
---|---|
수학학원 | |
교육학원 | |
자녀교육 | |
국어학원 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 영어학원 |
---|---|
2nd row | 영어학원 |
3rd row | 영어학원 |
4th row | 영어학원 |
5th row | 영어학원 |
Common Values
Value | Count | Frequency (%) |
영어학원 | 15 | |
수학학원 | 15 | |
교육학원 | 15 | |
자녀교육 | 15 | |
국어학원 | 15 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
영어학원 | 15 | |
수학학원 | 15 | |
교육학원 | 15 | |
자녀교육 | 15 | |
국어학원 | 15 |
UPPER_CTGRY_NM
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
교육 |
---|
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 교육 |
---|---|
2nd row | 교육 |
3rd row | 교육 |
4th row | 교육 |
5th row | 교육 |
Common Values
Value | Count | Frequency (%) |
교육 | 75 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
교육 | 75 |
LWPRT_CTGRY_NM
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
교과 | |
---|---|
공통 | |
외국어 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 외국어 |
---|---|
2nd row | 외국어 |
3rd row | 외국어 |
4th row | 외국어 |
5th row | 외국어 |
Common Values
Value | Count | Frequency (%) |
교과 | 30 | |
공통 | 30 | |
외국어 | 15 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
교과 | 30 | |
공통 | 30 | |
외국어 | 15 |
ALL_KWRD_RANK_CO
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
16 | |
---|---|
17 | |
18 | |
19 | |
20 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 16 |
---|---|
2nd row | 17 |
3rd row | 18 |
4th row | 19 |
5th row | 20 |
Common Values
Value | Count | Frequency (%) |
16 | 15 | |
17 | 15 | |
18 | 15 | |
19 | 15 | |
20 | 15 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
16 | 15 | |
17 | 15 | |
18 | 15 | |
19 | 15 | |
20 | 15 |
ASKWRD_NM
Text
Distinct | 48 |
---|---|
Distinct (%) | 64.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
Value | Count | Frequency (%) |
선생님 | 5 | 6.7% |
학교 | 5 | 6.7% |
고민 | 4 | 5.3% |
시작 | 3 | 4.0% |
엄마 | 3 | 4.0% |
이제 | 3 | 4.0% |
유치원 | 3 | 4.0% |
문제 | 3 | 4.0% |
수업 | 2 | 2.7% |
코로나 | 2 | 2.7% |
Other values (38) | 42 |
Most occurring characters
Value | Count | Frequency (%) |
학 | 12 | 6.9% |
교 | 8 | 4.6% |
님 | 6 | 3.5% |
제 | 6 | 3.5% |
생 | 6 | 3.5% |
선 | 5 | 2.9% |
이 | 5 | 2.9% |
원 | 5 | 2.9% |
정 | 4 | 2.3% |
고 | 4 | 2.3% |
Other values (73) | 112 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 173 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 12 | 6.9% |
교 | 8 | 4.6% |
님 | 6 | 3.5% |
제 | 6 | 3.5% |
생 | 6 | 3.5% |
선 | 5 | 2.9% |
이 | 5 | 2.9% |
원 | 5 | 2.9% |
정 | 4 | 2.3% |
고 | 4 | 2.3% |
Other values (73) | 112 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 173 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 12 | 6.9% |
교 | 8 | 4.6% |
님 | 6 | 3.5% |
제 | 6 | 3.5% |
생 | 6 | 3.5% |
선 | 5 | 2.9% |
이 | 5 | 2.9% |
원 | 5 | 2.9% |
정 | 4 | 2.3% |
고 | 4 | 2.3% |
Other values (73) | 112 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 173 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
학 | 12 | 6.9% |
교 | 8 | 4.6% |
님 | 6 | 3.5% |
제 | 6 | 3.5% |
생 | 6 | 3.5% |
선 | 5 | 2.9% |
이 | 5 | 2.9% |
원 | 5 | 2.9% |
정 | 4 | 2.3% |
고 | 4 | 2.3% |
Other values (73) | 112 |
ANALS_YM
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
202101 | |
---|---|
202102 | |
202103 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 202101 |
---|---|
2nd row | 202101 |
3rd row | 202101 |
4th row | 202101 |
5th row | 202101 |
Common Values
Value | Count | Frequency (%) |
202101 | 25 | |
202102 | 25 | |
202103 | 25 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
202101 | 25 | |
202102 | 25 | |
202103 | 25 |
SEQ_NO | SRCHWRD_NM | LWPRT_CTGRY_NM | ALL_KWRD_RANK_CO | ASKWRD_NM | ANALS_YM | |
---|---|---|---|---|---|---|
SEQ_NO | 1.000 | 0.743 | 0.722 | 0.000 | 0.805 | 0.986 |
SRCHWRD_NM | 0.743 | 1.000 | 1.000 | 0.000 | 0.521 | 0.000 |
LWPRT_CTGRY_NM | 0.722 | 1.000 | 1.000 | 0.000 | 0.166 | 0.000 |
ALL_KWRD_RANK_CO | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 |
ASKWRD_NM | 0.805 | 0.521 | 0.166 | 0.000 | 1.000 | 0.000 |
ANALS_YM | 0.986 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
ANALS_YM | LWPRT_CTGRY_NM | ALL_KWRD_RANK_CO | SRCHWRD_NM | |
---|---|---|---|---|
ANALS_YM | 1.000 | 0.000 | 0.000 | 0.000 |
LWPRT_CTGRY_NM | 0.000 | 1.000 | 0.000 | 0.986 |
ALL_KWRD_RANK_CO | 0.000 | 0.000 | 1.000 | 0.000 |
SRCHWRD_NM | 0.000 | 0.986 | 0.000 | 1.000 |
SEQ_NO | SRCHWRD_NM | LWPRT_CTGRY_NM | ALL_KWRD_RANK_CO | ANALS_YM | |
---|---|---|---|---|---|
SEQ_NO | 1.000 | 0.534 | 0.408 | 0.000 | 0.818 |
SRCHWRD_NM | 0.534 | 1.000 | 0.986 | 0.000 | 0.000 |
LWPRT_CTGRY_NM | 0.408 | 0.986 | 1.000 | 0.000 | 0.000 |
ALL_KWRD_RANK_CO | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
ANALS_YM | 0.818 | 0.000 | 0.000 | 0.000 | 1.000 |
SEQ_NO | SRCHWRD_NM | UPPER_CTGRY_NM | LWPRT_CTGRY_NM | ALL_KWRD_RANK_CO | ASKWRD_NM | ANALS_YM | |
---|---|---|---|---|---|---|---|
0 | 16 | 영어학원 | 교육 | 외국어 | 16 | 코로나 | 202101 |
1 | 17 | 영어학원 | 교육 | 외국어 | 17 | 이제 | 202101 |
2 | 18 | 영어학원 | 교육 | 외국어 | 18 | 엄마 | 202101 |
3 | 19 | 영어학원 | 교육 | 외국어 | 19 | 영어학원 | 202101 |
4 | 20 | 영어학원 | 교육 | 외국어 | 20 | 파닉스 | 202101 |
5 | 36 | 수학학원 | 교육 | 교과 | 16 | 유치원 | 202101 |
6 | 37 | 수학학원 | 교육 | 교과 | 17 | 선생님 | 202101 |
7 | 38 | 수학학원 | 교육 | 교과 | 18 | 고민 | 202101 |
8 | 39 | 수학학원 | 교육 | 교과 | 19 | 한글 | 202101 |
9 | 40 | 수학학원 | 교육 | 교과 | 20 | 그냥 | 202101 |
SEQ_NO | SRCHWRD_NM | UPPER_CTGRY_NM | LWPRT_CTGRY_NM | ALL_KWRD_RANK_CO | ASKWRD_NM | ANALS_YM | |
---|---|---|---|---|---|---|---|
65 | 656 | 자녀교육 | 교육 | 공통 | 16 | 선생님 | 202103 |
66 | 657 | 자녀교육 | 교육 | 공통 | 17 | 가정 | 202103 |
67 | 658 | 자녀교육 | 교육 | 공통 | 18 | 학교 | 202103 |
68 | 659 | 자녀교육 | 교육 | 공통 | 19 | 자녀교육 | 202103 |
69 | 660 | 자녀교육 | 교육 | 공통 | 20 | 이상 | 202103 |
70 | 716 | 국어학원 | 교육 | 교과 | 16 | 코딩 | 202103 |
71 | 717 | 국어학원 | 교육 | 교과 | 17 | 스마트 | 202103 |
72 | 718 | 국어학원 | 교육 | 교과 | 18 | 독서 | 202103 |
73 | 719 | 국어학원 | 교육 | 교과 | 19 | 엄마 | 202103 |
74 | 720 | 국어학원 | 교육 | 교과 | 20 | 태권도 | 202103 |