Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 30 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.9 KiB |
Average record size in memory | 64.4 B |
Variable types
Text | 1 |
---|---|
Categorical | 4 |
Numeric | 1 |
DateTime | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국신용데이터 |
URL | https://bigdata-region.kr/#/dataset/788cf74c-d027-43d4-94b3-72588835c54c |
연월 has constant value "" | Constant |
게시글내키워드평균중요도 is highly overall correlated with 키워드분류 and 2 other fields | High correlation |
게시글내키워드평균빈도 is highly overall correlated with 키워드길이 and 2 other fields | High correlation |
키워드길이 is highly overall correlated with 키워드분류 and 1 other fields | High correlation |
키워드분류 is highly overall correlated with 키워드길이 and 2 other fields | High correlation |
키워드포함게시글작성비율 is highly overall correlated with 키워드분류 and 2 other fields | High correlation |
키워드포함게시글작성비율 is highly imbalanced (64.6%) | Imbalance |
게시글내키워드평균빈도 is highly imbalanced (64.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 13:46:59.423138 |
---|---|
Analysis finished | 2023-12-10 13:47:00.323416 |
Duration | 0.9 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
키워드
Text
Distinct | 29 |
---|---|
Distinct (%) | 96.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
가게 | 2 | 6.7% |
가가 | 1 | 3.3% |
가게안 | 1 | 3.3% |
가게하나를 | 1 | 3.3% |
가게하나가 | 1 | 3.3% |
가게주인 | 1 | 3.3% |
가게있음 | 1 | 3.3% |
가게인데도 | 1 | 3.3% |
가게이전을 | 1 | 3.3% |
가게을 | 1 | 3.3% |
Other values (19) | 19 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 32 | |
게 | 27 | |
세 | 4 | 3.2% |
을 | 3 | 2.4% |
나 | 3 | 2.4% |
하 | 3 | 2.4% |
였 | 3 | 2.4% |
서 | 3 | 2.4% |
에 | 3 | 2.4% |
내 | 3 | 2.4% |
Other values (30) | 41 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 125 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 32 | |
게 | 27 | |
세 | 4 | 3.2% |
을 | 3 | 2.4% |
나 | 3 | 2.4% |
하 | 3 | 2.4% |
였 | 3 | 2.4% |
서 | 3 | 2.4% |
에 | 3 | 2.4% |
내 | 3 | 2.4% |
Other values (30) | 41 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 125 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 32 | |
게 | 27 | |
세 | 4 | 3.2% |
을 | 3 | 2.4% |
나 | 3 | 2.4% |
하 | 3 | 2.4% |
였 | 3 | 2.4% |
서 | 3 | 2.4% |
에 | 3 | 2.4% |
내 | 3 | 2.4% |
Other values (30) | 41 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 125 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 32 | |
게 | 27 | |
세 | 4 | 3.2% |
을 | 3 | 2.4% |
나 | 3 | 2.4% |
하 | 3 | 2.4% |
였 | 3 | 2.4% |
서 | 3 | 2.4% |
에 | 3 | 2.4% |
내 | 3 | 2.4% |
Other values (30) | 41 |
키워드분류
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
동사 | |
---|---|
명사 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 명사 |
---|---|
2nd row | 명사 |
3rd row | 명사 |
4th row | 명사 |
5th row | 동사 |
Common Values
Value | Count | Frequency (%) |
동사 | 26 | |
명사 | 4 | 13.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
동사 | 26 | |
명사 | 4 | 13.3% |
키워드길이
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 20.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.1666667 |
Minimum | 2 |
---|---|
Maximum | 7 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 2 |
Q1 | 3 |
median | 4 |
Q3 | 5 |
95-th percentile | 6 |
Maximum | 7 |
Range | 5 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.3412124 |
---|---|
Coefficient of variation (CV) | 0.32189096 |
Kurtosis | -0.57874575 |
Mean | 4.1666667 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 0.042537317 |
Sum | 125 |
Variance | 1.7988506 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4 | 9 | |
5 | 7 | |
3 | 5 | |
2 | 4 | |
6 | 4 | |
7 | 1 | 3.3% |
Value | Count | Frequency (%) |
2 | 4 | |
3 | 5 | |
4 | 9 | |
5 | 7 | |
6 | 4 | |
7 | 1 | 3.3% |
Value | Count | Frequency (%) |
7 | 1 | 3.3% |
6 | 4 | |
5 | 7 | |
4 | 9 | |
3 | 5 | |
2 | 4 |
키워드포함게시글작성비율
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 10.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
0 | |
---|---|
1 | 2 |
34 | 1 |
Length
Max length | 2 |
---|---|
Median length | 1 |
Mean length | 1.0333333 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 3.3% |
Sample
1st row | 1 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 34 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 27 | |
1 | 2 | 6.7% |
34 | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 27 | |
1 | 2 | 6.7% |
34 | 1 | 3.3% |
게시글내키워드평균빈도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
1 | |
---|---|
2 | 2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 2 |
5th row | 2 |
Common Values
Value | Count | Frequency (%) |
1 | 28 | |
2 | 2 | 6.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 28 | |
2 | 2 | 6.7% |
게시글내키워드평균중요도
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 13.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
8 | |
---|---|
7 | |
5 | 1 |
10 | 1 |
Length
Max length | 2 |
---|---|
Median length | 1 |
Mean length | 1.0333333 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 6.7% |
Sample
1st row | 7 |
---|---|
2nd row | 8 |
3rd row | 7 |
4th row | 5 |
5th row | 10 |
Common Values
Value | Count | Frequency (%) |
8 | 23 | |
7 | 5 | 16.7% |
5 | 1 | 3.3% |
10 | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
8 | 23 | |
7 | 5 | 16.7% |
5 | 1 | 3.3% |
10 | 1 | 3.3% |
연월
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Minimum | 2023-01-01 00:00:00 |
---|---|
Maximum | 2023-01-01 00:00:00 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | |
---|---|---|---|---|---|---|
키워드 | 1.000 | 0.000 | 1.000 | 0.000 | 1.000 | 0.000 |
키워드분류 | 0.000 | 1.000 | 0.871 | 0.325 | 0.000 | 0.764 |
키워드길이 | 1.000 | 0.871 | 1.000 | 0.456 | 0.793 | 0.304 |
키워드포함게시글작성비율 | 0.000 | 0.325 | 0.456 | 1.000 | 0.428 | 0.751 |
게시글내키워드평균빈도 | 1.000 | 0.000 | 0.793 | 0.428 | 1.000 | 1.000 |
게시글내키워드평균중요도 | 0.000 | 0.764 | 0.304 | 0.751 | 1.000 | 1.000 |
키워드분류 | 게시글내키워드평균중요도 | 게시글내키워드평균빈도 | 키워드포함게시글작성비율 | |
---|---|---|---|---|
키워드분류 | 1.000 | 0.533 | 0.000 | 0.512 |
게시글내키워드평균중요도 | 0.533 | 1.000 | 0.964 | 0.785 |
게시글내키워드평균빈도 | 0.000 | 0.964 | 1.000 | 0.656 |
키워드포함게시글작성비율 | 0.512 | 0.785 | 0.656 | 1.000 |
키워드길이 | 키워드분류 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | |
---|---|---|---|---|---|
키워드길이 | 1.000 | 0.628 | 0.185 | 0.550 | 0.176 |
키워드분류 | 0.628 | 1.000 | 0.512 | 0.000 | 0.533 |
키워드포함게시글작성비율 | 0.185 | 0.512 | 1.000 | 0.656 | 0.785 |
게시글내키워드평균빈도 | 0.550 | 0.000 | 0.656 | 1.000 | 0.964 |
게시글내키워드평균중요도 | 0.176 | 0.533 | 0.785 | 0.964 | 1.000 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | 연월 | |
---|---|---|---|---|---|---|---|
0 | 가가 | 명사 | 2 | 1 | 1 | 7 | 2023-01 |
1 | 가감 | 명사 | 2 | 0 | 1 | 8 | 2023-01 |
2 | 가건물 | 명사 | 3 | 0 | 1 | 7 | 2023-01 |
3 | 가게 | 명사 | 2 | 34 | 2 | 5 | 2023-01 |
4 | 가게 | 동사 | 2 | 0 | 2 | 10 | 2023-01 |
5 | 가게내 | 동사 | 3 | 0 | 1 | 8 | 2023-01 |
6 | 가게내놓을까 | 동사 | 6 | 0 | 1 | 8 | 2023-01 |
7 | 가게내놨습니다 | 동사 | 7 | 0 | 1 | 8 | 2023-01 |
8 | 가게라며 | 동사 | 4 | 0 | 1 | 8 | 2023-01 |
9 | 가게서도 | 동사 | 4 | 0 | 1 | 8 | 2023-01 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | 연월 | |
---|---|---|---|---|---|---|---|
20 | 가게였어요 | 동사 | 5 | 0 | 1 | 8 | 2023-01 |
21 | 가게오지 | 동사 | 4 | 0 | 1 | 8 | 2023-01 |
22 | 가게을 | 동사 | 3 | 0 | 1 | 8 | 2023-01 |
23 | 가게이전을 | 동사 | 5 | 0 | 1 | 8 | 2023-01 |
24 | 가게인데도 | 동사 | 5 | 0 | 1 | 8 | 2023-01 |
25 | 가게있음 | 동사 | 4 | 0 | 1 | 8 | 2023-01 |
26 | 가게주인 | 동사 | 4 | 0 | 1 | 8 | 2023-01 |
27 | 가게하나가 | 동사 | 5 | 0 | 1 | 8 | 2023-01 |
28 | 가게하나를 | 동사 | 5 | 0 | 1 | 8 | 2023-01 |
29 | 가게하나에서 | 동사 | 6 | 0 | 1 | 8 | 2023-01 |