Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 30 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.9 KiB |
Average record size in memory | 64.4 B |
Variable types
Text | 1 |
---|---|
Categorical | 4 |
Numeric | 1 |
DateTime | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국신용데이터 |
URL | https://bigdata-region.kr/#/dataset/033a5948-c562-403d-815a-480db6c9a6c4 |
연월 has constant value "" | Constant |
키워드포함게시글작성비율 is highly overall correlated with 키워드분류 and 2 other fields | High correlation |
게시글내키워드평균중요도 is highly overall correlated with 키워드포함게시글작성비율 and 1 other fields | High correlation |
게시글내키워드평균빈도 is highly overall correlated with 키워드포함게시글작성비율 and 1 other fields | High correlation |
키워드길이 is highly overall correlated with 키워드분류 | High correlation |
키워드분류 is highly overall correlated with 키워드길이 and 1 other fields | High correlation |
키워드포함게시글작성비율 is highly imbalanced (68.6%) | Imbalance |
게시글내키워드평균빈도 is highly imbalanced (64.7%) | Imbalance |
게시글내키워드평균중요도 is highly imbalanced (64.1%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 13:45:15.200942 |
---|---|
Analysis finished | 2023-12-10 13:45:16.645022 |
Duration | 1.44 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
키워드
Text
Distinct | 29 |
---|---|
Distinct (%) | 96.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
가게 | 2 | 6.7% |
가가 | 1 | 3.3% |
가게안 | 1 | 3.3% |
가게있 | 1 | 3.3% |
가게인수하실 | 1 | 3.3% |
가게인수하고 | 1 | 3.3% |
가게인수 | 1 | 3.3% |
가게인데요 | 1 | 3.3% |
가게인데도 | 1 | 3.3% |
가게을 | 1 | 3.3% |
Other values (19) | 19 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 32 | |
게 | 25 | |
인 | 6 | 5.0% |
안 | 5 | 4.2% |
고 | 4 | 3.4% |
세 | 4 | 3.4% |
요 | 4 | 3.4% |
데 | 3 | 2.5% |
하 | 3 | 2.5% |
수 | 3 | 2.5% |
Other values (26) | 30 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 119 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 32 | |
게 | 25 | |
인 | 6 | 5.0% |
안 | 5 | 4.2% |
고 | 4 | 3.4% |
세 | 4 | 3.4% |
요 | 4 | 3.4% |
데 | 3 | 2.5% |
하 | 3 | 2.5% |
수 | 3 | 2.5% |
Other values (26) | 30 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 119 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 32 | |
게 | 25 | |
인 | 6 | 5.0% |
안 | 5 | 4.2% |
고 | 4 | 3.4% |
세 | 4 | 3.4% |
요 | 4 | 3.4% |
데 | 3 | 2.5% |
하 | 3 | 2.5% |
수 | 3 | 2.5% |
Other values (26) | 30 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 119 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 32 | |
게 | 25 | |
인 | 6 | 5.0% |
안 | 5 | 4.2% |
고 | 4 | 3.4% |
세 | 4 | 3.4% |
요 | 4 | 3.4% |
데 | 3 | 2.5% |
하 | 3 | 2.5% |
수 | 3 | 2.5% |
Other values (26) | 30 |
키워드분류
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
동사 | |
---|---|
명사 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 명사 |
---|---|
2nd row | 명사 |
3rd row | 동사 |
4th row | 명사 |
5th row | 명사 |
Common Values
Value | Count | Frequency (%) |
동사 | 25 | |
명사 | 5 | 16.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
동사 | 25 | |
명사 | 5 | 16.7% |
키워드길이
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 20.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.9666667 |
Minimum | 2 |
---|---|
Maximum | 8 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 2 |
Q1 | 3 |
median | 4 |
Q3 | 5 |
95-th percentile | 6 |
Maximum | 8 |
Range | 6 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 1.4499306 |
---|---|
Coefficient of variation (CV) | 0.36552873 |
Kurtosis | 0.53709605 |
Mean | 3.9666667 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 0.64357608 |
Sum | 119 |
Variance | 2.1022989 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4 | 8 | |
3 | 7 | |
5 | 6 | |
2 | 5 | |
6 | 3 | 10.0% |
8 | 1 | 3.3% |
Value | Count | Frequency (%) |
2 | 5 | |
3 | 7 | |
4 | 8 | |
5 | 6 | |
6 | 3 | 10.0% |
8 | 1 | 3.3% |
Value | Count | Frequency (%) |
8 | 1 | 3.3% |
6 | 3 | 10.0% |
5 | 6 | |
4 | 8 | |
3 | 7 | |
2 | 5 |
키워드포함게시글작성비율
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 13.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
0 | |
---|---|
2 | 1 |
39 | 1 |
1 | 1 |
Length
Max length | 2 |
---|---|
Median length | 1 |
Mean length | 1.0333333 |
Min length | 1 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 10.0% |
Sample
1st row | 2 |
---|---|
2nd row | 0 |
3rd row | 0 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 27 | |
2 | 1 | 3.3% |
39 | 1 | 3.3% |
1 | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 27 | |
2 | 1 | 3.3% |
39 | 1 | 3.3% |
1 | 1 | 3.3% |
게시글내키워드평균빈도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
1 | |
---|---|
2 | 2 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 28 | |
2 | 2 | 6.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 28 | |
2 | 2 | 6.7% |
게시글내키워드평균중요도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 16.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
7 | |
---|---|
5 | 1 |
15 | 1 |
4 | 1 |
6 | 1 |
Length
Max length | 2 |
---|---|
Median length | 1 |
Mean length | 1.0333333 |
Min length | 1 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 13.3% |
Sample
1st row | 5 |
---|---|
2nd row | 7 |
3rd row | 7 |
4th row | 7 |
5th row | 7 |
Common Values
Value | Count | Frequency (%) |
7 | 26 | |
5 | 1 | 3.3% |
15 | 1 | 3.3% |
4 | 1 | 3.3% |
6 | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
7 | 26 | |
5 | 1 | 3.3% |
15 | 1 | 3.3% |
4 | 1 | 3.3% |
6 | 1 | 3.3% |
연월
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Minimum | 2023-07-01 00:00:00 |
---|---|
Maximum | 2023-07-01 00:00:00 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | |
---|---|---|---|---|---|---|
키워드 | 1.000 | 0.000 | 1.000 | 0.000 | 1.000 | 0.000 |
키워드분류 | 0.000 | 1.000 | 0.903 | 0.745 | 0.000 | 0.423 |
키워드길이 | 1.000 | 0.903 | 1.000 | 0.000 | 0.654 | 0.000 |
키워드포함게시글작성비율 | 0.000 | 0.745 | 0.000 | 1.000 | 0.854 | 1.000 |
게시글내키워드평균빈도 | 1.000 | 0.000 | 0.654 | 0.854 | 1.000 | 1.000 |
게시글내키워드평균중요도 | 0.000 | 0.423 | 0.000 | 1.000 | 1.000 | 1.000 |
키워드포함게시글작성비율 | 키워드분류 | 게시글내키워드평균중요도 | 게시글내키워드평균빈도 | |
---|---|---|---|---|
키워드포함게시글작성비율 | 1.000 | 0.515 | 0.981 | 0.628 |
키워드분류 | 0.515 | 1.000 | 0.483 | 0.000 |
게시글내키워드평균중요도 | 0.981 | 0.483 | 1.000 | 0.945 |
게시글내키워드평균빈도 | 0.628 | 0.000 | 0.945 | 1.000 |
키워드길이 | 키워드분류 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | |
---|---|---|---|---|---|
키워드길이 | 1.000 | 0.667 | 0.000 | 0.437 | 0.000 |
키워드분류 | 0.667 | 1.000 | 0.515 | 0.000 | 0.483 |
키워드포함게시글작성비율 | 0.000 | 0.515 | 1.000 | 0.628 | 0.981 |
게시글내키워드평균빈도 | 0.437 | 0.000 | 0.628 | 1.000 | 0.945 |
게시글내키워드평균중요도 | 0.000 | 0.483 | 0.981 | 0.945 | 1.000 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | 연월 | |
---|---|---|---|---|---|---|---|
0 | 가가 | 명사 | 2 | 2 | 1 | 5 | 2023-07 |
1 | 가감 | 명사 | 2 | 0 | 1 | 7 | 2023-07 |
2 | 가거나 | 동사 | 3 | 0 | 1 | 7 | 2023-07 |
3 | 가걱 | 명사 | 2 | 0 | 1 | 7 | 2023-07 |
4 | 가건물 | 명사 | 3 | 0 | 1 | 7 | 2023-07 |
5 | 가게 | 동사 | 2 | 0 | 2 | 15 | 2023-07 |
6 | 가게 | 명사 | 2 | 39 | 2 | 4 | 2023-07 |
7 | 가게가서 | 동사 | 4 | 0 | 1 | 7 | 2023-07 |
8 | 가게거 | 동사 | 3 | 0 | 1 | 7 | 2023-07 |
9 | 가게내놓고 | 동사 | 5 | 0 | 1 | 7 | 2023-07 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | 연월 | |
---|---|---|---|---|---|---|---|
20 | 가게안하고싶네요 | 동사 | 8 | 0 | 1 | 7 | 2023-07 |
21 | 가게였는데 | 동사 | 5 | 0 | 1 | 7 | 2023-07 |
22 | 가게을 | 동사 | 3 | 0 | 1 | 7 | 2023-07 |
23 | 가게인데도 | 동사 | 5 | 0 | 1 | 7 | 2023-07 |
24 | 가게인데요 | 동사 | 5 | 0 | 1 | 7 | 2023-07 |
25 | 가게인수 | 동사 | 4 | 0 | 1 | 7 | 2023-07 |
26 | 가게인수하고 | 동사 | 6 | 0 | 1 | 7 | 2023-07 |
27 | 가게인수하실 | 동사 | 6 | 0 | 1 | 7 | 2023-07 |
28 | 가게있 | 동사 | 3 | 0 | 1 | 7 | 2023-07 |
29 | 가게주인 | 동사 | 4 | 0 | 1 | 7 | 2023-07 |