Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 6.7 KiB |
Average record size in memory | 68.3 B |
Variable types
Text | 4 |
---|---|
Categorical | 1 |
Numeric | 3 |
Dataset
Description | Sample |
---|---|
Author | 컨슈머인사이트 |
URL | https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=91835150-8847-11eb-af9a-4b03f0a582d6 |
KWRD_RANK_CO is highly overall correlated with PASSNGR_KWRD_RANK_CO and 1 other fields | High correlation |
PASSNGR_KWRD_RANK_CO is highly overall correlated with KWRD_RANK_CO and 1 other fields | High correlation |
LCLS_KWRD_RANK_CO is highly overall correlated with KWRD_RANK_CO and 1 other fields | High correlation |
ID has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 10:13:14.084239 |
---|---|
Analysis finished | 2023-12-10 10:13:17.632703 |
Duration | 3.55 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
ID
Text
UNIQUE
 
Distinct | 100 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
ttl_01 | 1 | 1.0% |
bsn_03 | 1 | 1.0% |
bsn_14 | 1 | 1.0% |
bsn_13 | 1 | 1.0% |
bsn_12 | 1 | 1.0% |
bsn_11 | 1 | 1.0% |
bsn_10 | 1 | 1.0% |
bsn_09 | 1 | 1.0% |
bsn_08 | 1 | 1.0% |
bsn_07 | 1 | 1.0% |
Other values (90) | 90 |
Most occurring characters
Value | Count | Frequency (%) |
_ | 100 | |
T | 60 | |
S | 60 | |
L | 60 | |
0 | 46 | |
1 | 41 | |
2 | 40 | 7.1% |
N | 30 | 5.4% |
B | 30 | 5.4% |
3 | 13 | 2.3% |
Other values (8) | 80 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 260 | |
Decimal Number | 200 | |
Connector Punctuation | 100 | 17.9% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 46 | |
1 | 41 | |
2 | 40 | |
3 | 13 | 6.5% |
7 | 10 | 5.0% |
9 | 10 | 5.0% |
8 | 10 | 5.0% |
6 | 10 | 5.0% |
5 | 10 | 5.0% |
4 | 10 | 5.0% |
Uppercase Letter
Value | Count | Frequency (%) |
T | 60 | |
S | 60 | |
L | 60 | |
N | 30 | |
B | 30 | |
D | 10 | 3.8% |
G | 10 | 3.8% |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 100 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 300 | |
Latin | 260 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
_ | 100 | |
0 | 46 | |
1 | 41 | |
2 | 40 | 13.3% |
3 | 13 | 4.3% |
7 | 10 | 3.3% |
9 | 10 | 3.3% |
8 | 10 | 3.3% |
6 | 10 | 3.3% |
5 | 10 | 3.3% |
Latin
Value | Count | Frequency (%) |
T | 60 | |
S | 60 | |
L | 60 | |
N | 30 | |
B | 30 | |
D | 10 | 3.8% |
G | 10 | 3.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 560 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
_ | 100 | |
T | 60 | |
S | 60 | |
L | 60 | |
0 | 46 | |
1 | 41 | |
2 | 40 | 7.1% |
N | 30 | 5.4% |
B | 30 | 5.4% |
3 | 13 | 2.3% |
Other values (8) | 80 |
AREA_NM
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 4.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
전국 | |
---|---|
서울특별시 | |
부산광역시 | |
대구광역시 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.1 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전국 |
---|---|
2nd row | 전국 |
3rd row | 전국 |
4th row | 전국 |
5th row | 전국 |
Common Values
Value | Count | Frequency (%) |
전국 | 30 | |
서울특별시 | 30 | |
부산광역시 | 30 | |
대구광역시 | 10 | 10.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
전국 | 30 | |
서울특별시 | 30 | |
부산광역시 | 30 | |
대구광역시 | 10 | 10.0% |
KWRD_RANK_CO
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 30 |
---|---|
Distinct (%) | 30.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.5 |
Minimum | 1 |
---|---|
Maximum | 30 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 7 |
median | 14 |
Q3 | 22 |
95-th percentile | 29 |
Maximum | 30 |
Range | 29 |
Interquartile range (IQR) | 15 |
Descriptive statistics
Standard deviation | 8.8334763 |
---|---|
Coefficient of variation (CV) | 0.60920526 |
Kurtosis | -1.2329291 |
Mean | 14.5 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0.16149815 |
Sum | 1450 |
Variance | 78.030303 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 4 | 4.0% |
3 | 4 | 4.0% |
4 | 4 | 4.0% |
5 | 4 | 4.0% |
6 | 4 | 4.0% |
7 | 4 | 4.0% |
8 | 4 | 4.0% |
9 | 4 | 4.0% |
10 | 4 | 4.0% |
2 | 4 | 4.0% |
Other values (20) | 60 |
Value | Count | Frequency (%) |
1 | 4 | |
2 | 4 | |
3 | 4 | |
4 | 4 | |
5 | 4 | |
6 | 4 | |
7 | 4 | |
8 | 4 | |
9 | 4 | |
10 | 4 |
Value | Count | Frequency (%) |
30 | 3 | |
29 | 3 | |
28 | 3 | |
27 | 3 | |
26 | 3 | |
25 | 3 | |
24 | 3 | |
23 | 3 | |
22 | 3 | |
21 | 3 |
KWRD_NM
Text
Distinct | 70 |
---|---|
Distinct (%) | 70.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
먹거리 | 4 | 4.0% |
공원 | 4 | 4.0% |
축제 | 3 | 3.0% |
호텔 | 3 | 3.0% |
맛집 | 3 | 3.0% |
카페 | 3 | 3.0% |
시장 | 3 | 3.0% |
재래시장 | 3 | 3.0% |
산책 | 2 | 2.0% |
온천 | 2 | 2.0% |
Other values (60) | 70 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 13 | 5.0% |
장 | 11 | 4.2% |
리 | 10 | 3.8% |
시 | 10 | 3.8% |
공 | 8 | 3.1% |
원 | 8 | 3.1% |
거 | 8 | 3.1% |
해 | 7 | 2.7% |
대 | 6 | 2.3% |
먹 | 4 | 1.5% |
Other values (105) | 175 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 260 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 13 | 5.0% |
장 | 11 | 4.2% |
리 | 10 | 3.8% |
시 | 10 | 3.8% |
공 | 8 | 3.1% |
원 | 8 | 3.1% |
거 | 8 | 3.1% |
해 | 7 | 2.7% |
대 | 6 | 2.3% |
먹 | 4 | 1.5% |
Other values (105) | 175 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 260 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 13 | 5.0% |
장 | 11 | 4.2% |
리 | 10 | 3.8% |
시 | 10 | 3.8% |
공 | 8 | 3.1% |
원 | 8 | 3.1% |
거 | 8 | 3.1% |
해 | 7 | 2.7% |
대 | 6 | 2.3% |
먹 | 4 | 1.5% |
Other values (105) | 175 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 260 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 13 | 5.0% |
장 | 11 | 4.2% |
리 | 10 | 3.8% |
시 | 10 | 3.8% |
공 | 8 | 3.1% |
원 | 8 | 3.1% |
거 | 8 | 3.1% |
해 | 7 | 2.7% |
대 | 6 | 2.3% |
먹 | 4 | 1.5% |
Other values (105) | 175 |
PASSNGR_KWRD_RANK_CO
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 30 |
---|---|
Distinct (%) | 30.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.5 |
Minimum | 1 |
---|---|
Maximum | 30 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 7 |
median | 14 |
Q3 | 22 |
95-th percentile | 29 |
Maximum | 30 |
Range | 29 |
Interquartile range (IQR) | 15 |
Descriptive statistics
Standard deviation | 8.8334763 |
---|---|
Coefficient of variation (CV) | 0.60920526 |
Kurtosis | -1.2329291 |
Mean | 14.5 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0.16149815 |
Sum | 1450 |
Variance | 78.030303 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 4 | 4.0% |
3 | 4 | 4.0% |
4 | 4 | 4.0% |
5 | 4 | 4.0% |
6 | 4 | 4.0% |
7 | 4 | 4.0% |
8 | 4 | 4.0% |
9 | 4 | 4.0% |
10 | 4 | 4.0% |
2 | 4 | 4.0% |
Other values (20) | 60 |
Value | Count | Frequency (%) |
1 | 4 | |
2 | 4 | |
3 | 4 | |
4 | 4 | |
5 | 4 | |
6 | 4 | |
7 | 4 | |
8 | 4 | |
9 | 4 | |
10 | 4 |
Value | Count | Frequency (%) |
30 | 3 | |
29 | 3 | |
28 | 3 | |
27 | 3 | |
26 | 3 | |
25 | 3 | |
24 | 3 | |
23 | 3 | |
22 | 3 | |
21 | 3 |
PASSNGR_KWRD_NM
Text
Distinct | 70 |
---|---|
Distinct (%) | 70.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
먹거리 | 4 | 4.0% |
공원 | 4 | 4.0% |
맛집 | 3 | 3.0% |
호텔 | 3 | 3.0% |
시장 | 3 | 3.0% |
카페 | 3 | 3.0% |
볼거리 | 3 | 3.0% |
산책 | 3 | 3.0% |
아이 | 2 | 2.0% |
길거리음식 | 2 | 2.0% |
Other values (60) | 70 |
Most occurring characters
Value | Count | Frequency (%) |
리 | 13 | 5.0% |
장 | 13 | 5.0% |
거 | 11 | 4.2% |
시 | 10 | 3.8% |
산 | 9 | 3.4% |
해 | 7 | 2.7% |
대 | 6 | 2.3% |
공 | 6 | 2.3% |
광 | 4 | 1.5% |
동 | 4 | 1.5% |
Other values (105) | 178 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 261 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
리 | 13 | 5.0% |
장 | 13 | 5.0% |
거 | 11 | 4.2% |
시 | 10 | 3.8% |
산 | 9 | 3.4% |
해 | 7 | 2.7% |
대 | 6 | 2.3% |
공 | 6 | 2.3% |
광 | 4 | 1.5% |
동 | 4 | 1.5% |
Other values (105) | 178 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 261 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
리 | 13 | 5.0% |
장 | 13 | 5.0% |
거 | 11 | 4.2% |
시 | 10 | 3.8% |
산 | 9 | 3.4% |
해 | 7 | 2.7% |
대 | 6 | 2.3% |
공 | 6 | 2.3% |
광 | 4 | 1.5% |
동 | 4 | 1.5% |
Other values (105) | 178 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 261 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
리 | 13 | 5.0% |
장 | 13 | 5.0% |
거 | 11 | 4.2% |
시 | 10 | 3.8% |
산 | 9 | 3.4% |
해 | 7 | 2.7% |
대 | 6 | 2.3% |
공 | 6 | 2.3% |
광 | 4 | 1.5% |
동 | 4 | 1.5% |
Other values (105) | 178 |
LCLS_KWRD_RANK_CO
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 30 |
---|---|
Distinct (%) | 30.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.5 |
Minimum | 1 |
---|---|
Maximum | 30 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 7 |
median | 14 |
Q3 | 22 |
95-th percentile | 29 |
Maximum | 30 |
Range | 29 |
Interquartile range (IQR) | 15 |
Descriptive statistics
Standard deviation | 8.8334763 |
---|---|
Coefficient of variation (CV) | 0.60920526 |
Kurtosis | -1.2329291 |
Mean | 14.5 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0.16149815 |
Sum | 1450 |
Variance | 78.030303 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 4 | 4.0% |
3 | 4 | 4.0% |
4 | 4 | 4.0% |
5 | 4 | 4.0% |
6 | 4 | 4.0% |
7 | 4 | 4.0% |
8 | 4 | 4.0% |
9 | 4 | 4.0% |
10 | 4 | 4.0% |
2 | 4 | 4.0% |
Other values (20) | 60 |
Value | Count | Frequency (%) |
1 | 4 | |
2 | 4 | |
3 | 4 | |
4 | 4 | |
5 | 4 | |
6 | 4 | |
7 | 4 | |
8 | 4 | |
9 | 4 | |
10 | 4 |
Value | Count | Frequency (%) |
30 | 3 | |
29 | 3 | |
28 | 3 | |
27 | 3 | |
26 | 3 | |
25 | 3 | |
24 | 3 | |
23 | 3 | |
22 | 3 | |
21 | 3 |
LCLS_KWRD_NM
Text
Distinct | 70 |
---|---|
Distinct (%) | 70.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
Value | Count | Frequency (%) |
먹거리 | 4 | 4.0% |
공원 | 4 | 4.0% |
시장 | 3 | 3.0% |
맛집 | 3 | 3.0% |
카페 | 3 | 3.0% |
재래시장 | 3 | 3.0% |
축제 | 3 | 3.0% |
호텔 | 3 | 3.0% |
쇼핑 | 2 | 2.0% |
산책 | 2 | 2.0% |
Other values (60) | 70 |
Most occurring characters
Value | Count | Frequency (%) |
산 | 17 | 6.4% |
리 | 10 | 3.8% |
공 | 10 | 3.8% |
원 | 10 | 3.8% |
장 | 10 | 3.8% |
시 | 9 | 3.4% |
거 | 8 | 3.0% |
해 | 7 | 2.6% |
먹 | 5 | 1.9% |
래 | 5 | 1.9% |
Other values (104) | 174 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 265 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 17 | 6.4% |
리 | 10 | 3.8% |
공 | 10 | 3.8% |
원 | 10 | 3.8% |
장 | 10 | 3.8% |
시 | 9 | 3.4% |
거 | 8 | 3.0% |
해 | 7 | 2.6% |
먹 | 5 | 1.9% |
래 | 5 | 1.9% |
Other values (104) | 174 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 265 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 17 | 6.4% |
리 | 10 | 3.8% |
공 | 10 | 3.8% |
원 | 10 | 3.8% |
장 | 10 | 3.8% |
시 | 9 | 3.4% |
거 | 8 | 3.0% |
해 | 7 | 2.6% |
먹 | 5 | 1.9% |
래 | 5 | 1.9% |
Other values (104) | 174 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 265 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
산 | 17 | 6.4% |
리 | 10 | 3.8% |
공 | 10 | 3.8% |
원 | 10 | 3.8% |
장 | 10 | 3.8% |
시 | 9 | 3.4% |
거 | 8 | 3.0% |
해 | 7 | 2.6% |
먹 | 5 | 1.9% |
래 | 5 | 1.9% |
Other values (104) | 174 |
ID | AREA_NM | KWRD_RANK_CO | KWRD_NM | PASSNGR_KWRD_RANK_CO | PASSNGR_KWRD_NM | LCLS_KWRD_RANK_CO | LCLS_KWRD_NM | |
---|---|---|---|---|---|---|---|---|
ID | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
AREA_NM | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 |
KWRD_RANK_CO | 1.000 | 0.000 | 1.000 | 0.798 | 1.000 | 0.861 | 1.000 | 0.705 |
KWRD_NM | 1.000 | 0.000 | 0.798 | 1.000 | 0.798 | 0.945 | 0.798 | 0.990 |
PASSNGR_KWRD_RANK_CO | 1.000 | 0.000 | 1.000 | 0.798 | 1.000 | 0.861 | 1.000 | 0.705 |
PASSNGR_KWRD_NM | 1.000 | 0.000 | 0.861 | 0.945 | 0.861 | 1.000 | 0.861 | 0.964 |
LCLS_KWRD_RANK_CO | 1.000 | 0.000 | 1.000 | 0.798 | 1.000 | 0.861 | 1.000 | 0.705 |
LCLS_KWRD_NM | 1.000 | 0.000 | 0.705 | 0.990 | 0.705 | 0.964 | 0.705 | 1.000 |
KWRD_RANK_CO | PASSNGR_KWRD_RANK_CO | LCLS_KWRD_RANK_CO | AREA_NM | |
---|---|---|---|---|
KWRD_RANK_CO | 1.000 | 1.000 | 1.000 | 0.000 |
PASSNGR_KWRD_RANK_CO | 1.000 | 1.000 | 1.000 | 0.000 |
LCLS_KWRD_RANK_CO | 1.000 | 1.000 | 1.000 | 0.000 |
AREA_NM | 0.000 | 0.000 | 0.000 | 1.000 |
ID | AREA_NM | KWRD_RANK_CO | KWRD_NM | PASSNGR_KWRD_RANK_CO | PASSNGR_KWRD_NM | LCLS_KWRD_RANK_CO | LCLS_KWRD_NM | |
---|---|---|---|---|---|---|---|---|
0 | TTL_01 | 전국 | 1 | 먹거리 | 1 | 바다 | 1 | 먹거리 |
1 | TTL_02 | 전국 | 2 | 바다 | 2 | 먹거리 | 2 | 축제 |
2 | TTL_03 | 전국 | 3 | 계곡 | 3 | 해변 | 3 | 공원 |
3 | TTL_04 | 전국 | 4 | 해변 | 4 | 계곡 | 4 | 계곡 |
4 | TTL_05 | 전국 | 5 | 공원 | 5 | 펜션 | 5 | 바다 |
5 | TTL_06 | 전국 | 6 | 축제 | 6 | 해산물 | 6 | 맛집 |
6 | TTL_07 | 전국 | 7 | 펜션 | 7 | 회 | 7 | 산 |
7 | TTL_08 | 전국 | 8 | 해산물 | 8 | 호텔 | 8 | 펜션 |
8 | TTL_09 | 전국 | 9 | 산 | 9 | 산 | 9 | 해산물 |
9 | TTL_10 | 전국 | 10 | 회 | 10 | 공원 | 10 | 해변 |
ID | AREA_NM | KWRD_RANK_CO | KWRD_NM | PASSNGR_KWRD_RANK_CO | PASSNGR_KWRD_NM | LCLS_KWRD_RANK_CO | LCLS_KWRD_NM | |
---|---|---|---|---|---|---|---|---|
90 | DG_01 | 대구광역시 | 1 | 막창 | 1 | 막창 | 1 | 팔공산 |
91 | DG_02 | 대구광역시 | 2 | 대구 | 2 | 대구 | 2 | 막창 |
92 | DG_03 | 대구광역시 | 3 | 팔공산 | 3 | 먹거리 | 3 | 대구 |
93 | DG_04 | 대구광역시 | 4 | 먹거리 | 4 | 팔공산 | 4 | 먹거리 |
94 | DG_05 | 대구광역시 | 5 | 수성못 | 5 | 수성못 | 5 | 앞산 |
95 | DG_06 | 대구광역시 | 6 | 공원 | 6 | 서문시장 | 6 | 공원 |
96 | DG_07 | 대구광역시 | 7 | 앞산 | 7 | 김광석거리 | 7 | 수성못 |
97 | DG_08 | 대구광역시 | 8 | 서문시장 | 8 | 공원 | 8 | 두류공원 |
98 | DG_09 | 대구광역시 | 9 | 골목 | 9 | 곱창 | 9 | 골목 |
99 | DG_10 | 대구광역시 | 10 | 이월드 | 10 | 동성로 | 10 | 이월드 |