Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 30 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.9 KiB |
Average record size in memory | 64.4 B |
Variable types
Text | 1 |
---|---|
Categorical | 5 |
DateTime | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국신용데이터 |
URL | https://bigdata-region.kr/#/dataset/274db76e-3965-4e59-98ef-50e76cb49de3 |
연월 has constant value "" | Constant |
게시글내키워드평균중요도 is highly overall correlated with 키워드포함게시글작성비율 and 1 other fields | High correlation |
키워드포함게시글작성비율 is highly overall correlated with 게시글내키워드평균빈도 and 1 other fields | High correlation |
게시글내키워드평균빈도 is highly overall correlated with 키워드포함게시글작성비율 and 1 other fields | High correlation |
키워드분류 is highly overall correlated with 키워드길이 | High correlation |
키워드길이 is highly overall correlated with 키워드분류 | High correlation |
게시글내키워드평균빈도 is highly imbalanced (78.9%) | Imbalance |
키워드 has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 14:02:18.983953 |
---|---|
Analysis finished | 2023-12-10 14:02:19.700586 |
Duration | 0.72 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
키워드
Text
UNIQUE
 
Distinct | 30 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
가가 | 1 | 3.3% |
가건물 | 1 | 3.3% |
가까이 | 1 | 3.3% |
가까워지고 | 1 | 3.3% |
가기도 | 1 | 3.3% |
가기 | 1 | 3.3% |
가구 | 1 | 3.3% |
가과 | 1 | 3.3% |
가공 | 1 | 3.3% |
가고 | 1 | 3.3% |
Other values (20) | 20 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 31 | |
게 | 10 | 10.5% |
겠 | 5 | 5.3% |
고 | 5 | 5.3% |
다 | 4 | 4.2% |
였 | 3 | 3.2% |
까 | 2 | 2.1% |
세 | 2 | 2.1% |
는 | 2 | 2.1% |
기 | 2 | 2.1% |
Other values (29) | 29 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 95 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 31 | |
게 | 10 | 10.5% |
겠 | 5 | 5.3% |
고 | 5 | 5.3% |
다 | 4 | 4.2% |
였 | 3 | 3.2% |
까 | 2 | 2.1% |
세 | 2 | 2.1% |
는 | 2 | 2.1% |
기 | 2 | 2.1% |
Other values (29) | 29 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 95 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 31 | |
게 | 10 | 10.5% |
겠 | 5 | 5.3% |
고 | 5 | 5.3% |
다 | 4 | 4.2% |
였 | 3 | 3.2% |
까 | 2 | 2.1% |
세 | 2 | 2.1% |
는 | 2 | 2.1% |
기 | 2 | 2.1% |
Other values (29) | 29 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 95 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 31 | |
게 | 10 | 10.5% |
겠 | 5 | 5.3% |
고 | 5 | 5.3% |
다 | 4 | 4.2% |
였 | 3 | 3.2% |
까 | 2 | 2.1% |
세 | 2 | 2.1% |
는 | 2 | 2.1% |
기 | 2 | 2.1% |
Other values (29) | 29 |
키워드분류
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
동사 | |
---|---|
명사 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 명사 |
---|---|
2nd row | 명사 |
3rd row | 명사 |
4th row | 동사 |
5th row | 동사 |
Common Values
Value | Count | Frequency (%) |
동사 | 18 | |
명사 | 12 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
동사 | 18 | |
명사 | 12 |
키워드길이
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 13.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
2 | |
---|---|
3 | |
4 | |
5 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2 |
---|---|
2nd row | 3 |
3rd row | 2 |
4th row | 3 |
5th row | 4 |
Common Values
Value | Count | Frequency (%) |
2 | 11 | |
3 | 8 | |
4 | 6 | |
5 | 5 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2 | 11 | |
3 | 8 | |
4 | 6 | |
5 | 5 |
키워드포함게시글작성비율
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 13.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
0 | |
---|---|
1 | |
2 | 2 |
19 | 1 |
Length
Max length | 2 |
---|---|
Median length | 1 |
Mean length | 1.0333333 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 3.3% |
Sample
1st row | 0 |
---|---|
2nd row | 0 |
3rd row | 19 |
4th row | 0 |
5th row | 0 |
Common Values
Value | Count | Frequency (%) |
0 | 24 | |
1 | 3 | 10.0% |
2 | 2 | 6.7% |
19 | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
0 | 24 | |
1 | 3 | 10.0% |
2 | 2 | 6.7% |
19 | 1 | 3.3% |
게시글내키워드평균빈도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
1 | |
---|---|
2 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 3.3% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 2 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 29 | |
2 | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 29 | |
2 | 1 | 3.3% |
게시글내키워드평균중요도
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 16.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
8 | |
---|---|
7 | |
6 | |
9 | 1 |
4 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 6.7% |
Sample
1st row | 9 |
---|---|
2nd row | 7 |
3rd row | 4 |
4th row | 8 |
5th row | 8 |
Common Values
Value | Count | Frequency (%) |
8 | 19 | |
7 | 5 | 16.7% |
6 | 4 | 13.3% |
9 | 1 | 3.3% |
4 | 1 | 3.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
8 | 19 | |
7 | 5 | 16.7% |
6 | 4 | 13.3% |
9 | 1 | 3.3% |
4 | 1 | 3.3% |
연월
Date
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Minimum | 2023-04-01 00:00:00 |
---|---|
Maximum | 2023-04-01 00:00:00 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | |
---|---|---|---|---|---|---|
키워드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
키워드분류 | 1.000 | 1.000 | 0.947 | 0.533 | 0.000 | 0.255 |
키워드길이 | 1.000 | 0.947 | 1.000 | 0.000 | 0.000 | 0.000 |
키워드포함게시글작성비율 | 1.000 | 0.533 | 0.000 | 1.000 | 1.000 | 0.783 |
게시글내키워드평균빈도 | 1.000 | 0.000 | 0.000 | 1.000 | 1.000 | 1.000 |
게시글내키워드평균중요도 | 1.000 | 0.255 | 0.000 | 0.783 | 1.000 | 1.000 |
게시글내키워드평균중요도 | 키워드포함게시글작성비율 | 키워드분류 | 키워드길이 | 게시글내키워드평균빈도 | |
---|---|---|---|---|---|
게시글내키워드평균중요도 | 1.000 | 0.721 | 0.287 | 0.000 | 0.945 |
키워드포함게시글작성비율 | 0.721 | 1.000 | 0.346 | 0.000 | 0.964 |
키워드분류 | 0.287 | 0.346 | 1.000 | 0.763 | 0.000 |
키워드길이 | 0.000 | 0.000 | 0.763 | 1.000 | 0.000 |
게시글내키워드평균빈도 | 0.945 | 0.964 | 0.000 | 0.000 | 1.000 |
키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | |
---|---|---|---|---|---|
키워드분류 | 1.000 | 0.763 | 0.346 | 0.000 | 0.287 |
키워드길이 | 0.763 | 1.000 | 0.000 | 0.000 | 0.000 |
키워드포함게시글작성비율 | 0.346 | 0.000 | 1.000 | 0.964 | 0.721 |
게시글내키워드평균빈도 | 0.000 | 0.000 | 0.964 | 1.000 | 0.945 |
게시글내키워드평균중요도 | 0.287 | 0.000 | 0.721 | 0.945 | 1.000 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | 연월 | |
---|---|---|---|---|---|---|---|
0 | 가가 | 명사 | 2 | 0 | 1 | 9 | 2023-04 |
1 | 가건물 | 명사 | 3 | 0 | 1 | 7 | 2023-04 |
2 | 가게 | 명사 | 2 | 19 | 2 | 4 | 2023-04 |
3 | 가게내 | 동사 | 3 | 0 | 1 | 8 | 2023-04 |
4 | 가게라며 | 동사 | 4 | 0 | 1 | 8 | 2023-04 |
5 | 가게세 | 동사 | 3 | 0 | 1 | 7 | 2023-04 |
6 | 가게세는 | 동사 | 4 | 0 | 1 | 7 | 2023-04 |
7 | 가게안에서 | 동사 | 5 | 0 | 1 | 8 | 2023-04 |
8 | 가게였고 | 동사 | 4 | 0 | 1 | 8 | 2023-04 |
9 | 가게였는데 | 동사 | 5 | 0 | 1 | 7 | 2023-04 |
키워드 | 키워드분류 | 키워드길이 | 키워드포함게시글작성비율 | 게시글내키워드평균빈도 | 게시글내키워드평균중요도 | 연월 | |
---|---|---|---|---|---|---|---|
20 | 가계 | 명사 | 2 | 1 | 1 | 8 | 2023-04 |
21 | 가고 | 동사 | 2 | 1 | 1 | 6 | 2023-04 |
22 | 가공 | 명사 | 2 | 0 | 1 | 8 | 2023-04 |
23 | 가과 | 명사 | 2 | 0 | 1 | 8 | 2023-04 |
24 | 가구 | 명사 | 2 | 0 | 1 | 8 | 2023-04 |
25 | 가기 | 명사 | 2 | 0 | 1 | 7 | 2023-04 |
26 | 가기도 | 동사 | 3 | 0 | 1 | 8 | 2023-04 |
27 | 가까워지고 | 동사 | 5 | 0 | 1 | 8 | 2023-04 |
28 | 가까이 | 명사 | 3 | 1 | 1 | 6 | 2023-04 |
29 | 가끔 | 명사 | 2 | 2 | 1 | 6 | 2023-04 |