Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 71 |
Missing cells | 8 |
Missing cells (%) | 1.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.7 KiB |
Average record size in memory | 52.9 B |
Variable types
Numeric | 3 |
---|---|
Categorical | 1 |
Text | 1 |
DateTime | 1 |
Dataset
Description | 제주관광정보시스템(VISITJEJU)의 인기검색어 정보로 일련번호, 언어, 정렬순서, 단어, 생성일, 기존순위 등의 정보를 제공합니다. |
---|---|
Author | 제주관광공사 |
URL | https://www.data.go.kr/data/15049993/fileData.do |
일련번호 is highly overall correlated with 언어 | High correlation |
정렬순서 is highly overall correlated with 기존순위 | High correlation |
기존순위 is highly overall correlated with 정렬순서 | High correlation |
언어 is highly overall correlated with 일련번호 | High correlation |
기존순위 has 8 (11.3%) missing values | Missing |
일련번호 has unique values | Unique |
Reproduction
Analysis started | 2024-03-23 06:54:30.650397 |
---|---|
Analysis finished | 2024-03-23 06:54:35.217026 |
Duration | 4.57 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
일련번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 71 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 68476.07 |
Minimum | 101 |
---|---|
Maximum | 112832 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 771.0 B |
Quantile statistics
Minimum | 101 |
---|---|
5-th percentile | 104.5 |
Q1 | 558.5 |
median | 112780 |
Q3 | 112813.5 |
95-th percentile | 112828.5 |
Maximum | 112832 |
Range | 112731 |
Interquartile range (IQR) | 112255 |
Descriptive statistics
Standard deviation | 55327.066 |
---|---|
Coefficient of variation (CV) | 0.80797665 |
Kurtosis | -1.8580404 |
Mean | 68476.07 |
Median Absolute Deviation (MAD) | 44 |
Skewness | -0.44169858 |
Sum | 4861801 |
Variance | 3.0610842 × 109 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
101 | 1 | 1.4% |
102 | 1 | 1.4% |
112813 | 1 | 1.4% |
112812 | 1 | 1.4% |
112811 | 1 | 1.4% |
112810 | 1 | 1.4% |
112809 | 1 | 1.4% |
112808 | 1 | 1.4% |
112807 | 1 | 1.4% |
112806 | 1 | 1.4% |
Other values (61) | 61 |
Value | Count | Frequency (%) |
101 | 1 | |
102 | 1 | |
103 | 1 | |
104 | 1 | |
105 | 1 | |
106 | 1 | |
107 | 1 | |
108 | 1 | |
109 | 1 | |
110 | 1 |
Value | Count | Frequency (%) |
112832 | 1 | |
112831 | 1 | |
112830 | 1 | |
112829 | 1 | |
112828 | 1 | |
112826 | 1 | |
112825 | 1 | |
112824 | 1 | |
112823 | 1 | |
112822 | 1 |
언어
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 8.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
국문 | |
---|---|
일문 | |
중문번체 | |
말레이문 | |
중문간체 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.6478873 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.4% |
Sample
1st row | 국문 |
---|---|
2nd row | 국문 |
3rd row | 국문 |
4th row | 국문 |
5th row | 국문 |
Common Values
Value | Count | Frequency (%) |
국문 | 35 | |
일문 | 12 | 16.9% |
중문번체 | 10 | 14.1% |
말레이문 | 9 | 12.7% |
중문간체 | 4 | 5.6% |
영문 | 1 | 1.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
국문 | 35 | |
일문 | 12 | 16.9% |
중문번체 | 10 | 14.1% |
말레이문 | 9 | 12.7% |
중문간체 | 4 | 5.6% |
영문 | 1 | 1.4% |
정렬순서
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 14.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.3239437 |
Minimum | 1 |
---|---|
Maximum | 10 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 771.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 5 |
Q3 | 8 |
95-th percentile | 10 |
Maximum | 10 |
Range | 9 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 2.9941593 |
---|---|
Coefficient of variation (CV) | 0.562395 |
Kurtosis | -1.3147749 |
Mean | 5.3239437 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.058439987 |
Sum | 378 |
Variance | 8.9649899 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 9 | |
2 | 8 | |
3 | 7 | |
4 | 7 | |
7 | 7 | |
8 | 7 | |
9 | 7 | |
10 | 7 | |
5 | 6 | |
6 | 6 |
Value | Count | Frequency (%) |
1 | 9 | |
2 | 8 | |
3 | 7 | |
4 | 7 | |
5 | 6 | |
6 | 6 | |
7 | 7 | |
8 | 7 | |
9 | 7 | |
10 | 7 |
Value | Count | Frequency (%) |
10 | 7 | |
9 | 7 | |
8 | 7 | |
7 | 7 | |
6 | 6 | |
5 | 6 | |
4 | 7 | |
3 | 7 | |
2 | 8 | |
1 | 9 |
단어
Text
Distinct | 62 |
---|---|
Distinct (%) | 87.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
Value | Count | Frequency (%) |
제주 | 5 | 6.6% |
성산 | 4 | 5.3% |
한라산 | 3 | 3.9% |
아이와바다 | 2 | 2.6% |
사려니 | 2 | 2.6% |
우도 | 2 | 2.6% |
성산일출봉 | 2 | 2.6% |
funinthewater | 1 | 1.3% |
친구 | 1 | 1.3% |
미식 | 1 | 1.3% |
Other values (53) | 53 |
Most occurring characters
Value | Count | Frequency (%) |
제 | 10 | 3.4% |
10 | 3.4% | |
주 | 9 | 3.1% |
산 | 9 | 3.1% |
i | 7 | 2.4% |
l | 7 | 2.4% |
e | 7 | 2.4% |
성 | 6 | 2.0% |
행 | 5 | 1.7% |
지 | 5 | 1.7% |
Other values (139) | 218 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 218 | |
Lowercase Letter | 55 | 18.8% |
Space Separator | 10 | 3.4% |
Uppercase Letter | 5 | 1.7% |
Other Punctuation | 3 | 1.0% |
Decimal Number | 2 | 0.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
제 | 10 | 4.6% |
주 | 9 | 4.1% |
산 | 9 | 4.1% |
성 | 6 | 2.8% |
행 | 5 | 2.3% |
지 | 5 | 2.3% |
리 | 5 | 2.3% |
한 | 5 | 2.3% |
도 | 5 | 2.3% |
바 | 4 | 1.8% |
Other values (112) | 155 |
Lowercase Letter
Value | Count | Frequency (%) |
i | 7 | |
l | 7 | |
e | 7 | |
t | 4 | 7.3% |
o | 4 | 7.3% |
a | 4 | 7.3% |
s | 3 | 5.5% |
w | 3 | 5.5% |
n | 3 | 5.5% |
v | 2 | 3.6% |
Other values (8) | 11 |
Uppercase Letter
Value | Count | Frequency (%) |
M | 1 | |
F | 1 | |
C | 1 | |
S | 1 | |
Y | 1 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 | |
0 | 1 |
Space Separator
Value | Count | Frequency (%) |
10 |
Other Punctuation
Value | Count | Frequency (%) |
? | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 195 | |
Latin | 60 | 20.5% |
Han | 20 | 6.8% |
Common | 15 | 5.1% |
Katakana | 3 | 1.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
제 | 10 | 5.1% |
주 | 9 | 4.6% |
산 | 9 | 4.6% |
성 | 6 | 3.1% |
행 | 5 | 2.6% |
지 | 5 | 2.6% |
리 | 5 | 2.6% |
한 | 5 | 2.6% |
도 | 5 | 2.6% |
바 | 4 | 2.1% |
Other values (89) | 132 |
Latin
Value | Count | Frequency (%) |
i | 7 | |
l | 7 | |
e | 7 | |
t | 4 | 6.7% |
o | 4 | 6.7% |
a | 4 | 6.7% |
s | 3 | 5.0% |
w | 3 | 5.0% |
n | 3 | 5.0% |
v | 2 | 3.3% |
Other values (13) | 16 |
Han
Value | Count | Frequency (%) |
地 | 1 | 5.0% |
選 | 1 | 5.0% |
四 | 1 | 5.0% |
季 | 1 | 5.0% |
取 | 1 | 5.0% |
景 | 1 | 5.0% |
州 | 1 | 5.0% |
島 | 1 | 5.0% |
牛 | 1 | 5.0% |
光 | 1 | 5.0% |
Other values (10) | 10 |
Common
Value | Count | Frequency (%) |
10 | ||
? | 3 | 20.0% |
1 | 1 | 6.7% |
0 | 1 | 6.7% |
Katakana
Value | Count | Frequency (%) |
ム | 1 | |
ル | 1 | |
オ | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 195 | |
ASCII | 75 | 25.6% |
CJK | 20 | 6.8% |
Katakana | 3 | 1.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
제 | 10 | 5.1% |
주 | 9 | 4.6% |
산 | 9 | 4.6% |
성 | 6 | 3.1% |
행 | 5 | 2.6% |
지 | 5 | 2.6% |
리 | 5 | 2.6% |
한 | 5 | 2.6% |
도 | 5 | 2.6% |
바 | 4 | 2.1% |
Other values (89) | 132 |
ASCII
Value | Count | Frequency (%) |
10 | ||
i | 7 | 9.3% |
l | 7 | 9.3% |
e | 7 | 9.3% |
t | 4 | 5.3% |
o | 4 | 5.3% |
a | 4 | 5.3% |
? | 3 | 4.0% |
s | 3 | 4.0% |
w | 3 | 4.0% |
Other values (17) | 23 |
CJK
Value | Count | Frequency (%) |
地 | 1 | 5.0% |
選 | 1 | 5.0% |
四 | 1 | 5.0% |
季 | 1 | 5.0% |
取 | 1 | 5.0% |
景 | 1 | 5.0% |
州 | 1 | 5.0% |
島 | 1 | 5.0% |
牛 | 1 | 5.0% |
光 | 1 | 5.0% |
Other values (10) | 10 |
Katakana
Value | Count | Frequency (%) |
ム | 1 | |
ル | 1 | |
オ | 1 |
등록일시
Date
Distinct | 3 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 700.0 B |
Minimum | 2018-02-09 00:00:00 |
---|---|
Maximum | 2024-03-08 00:00:00 |
기존순위
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 10 |
---|---|
Distinct (%) | 15.9% |
Missing | 8 |
Missing (%) | 11.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5.015873 |
Minimum | 1 |
---|---|
Maximum | 10 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 771.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 5 |
Q3 | 8 |
95-th percentile | 9.9 |
Maximum | 10 |
Range | 9 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 2.9264757 |
---|---|
Coefficient of variation (CV) | 0.58344294 |
Kurtosis | -1.2799562 |
Mean | 5.015873 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.20318924 |
Sum | 316 |
Variance | 8.5642601 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2 | 9 | |
1 | 8 | |
3 | 7 | |
9 | 7 | |
5 | 6 | |
4 | 6 | |
6 | 6 | |
8 | 6 | |
7 | 4 | |
10 | 4 | |
(Missing) | 8 |
Value | Count | Frequency (%) |
1 | 8 | |
2 | 9 | |
3 | 7 | |
4 | 6 | |
5 | 6 | |
6 | 6 | |
7 | 4 | |
8 | 6 | |
9 | 7 | |
10 | 4 |
Value | Count | Frequency (%) |
10 | 4 | |
9 | 7 | |
8 | 6 | |
7 | 4 | |
6 | 6 | |
5 | 6 | |
4 | 6 | |
3 | 7 | |
2 | 9 | |
1 | 8 |
일련번호 | 언어 | 정렬순서 | 단어 | 등록일시 | 기존순위 | |
---|---|---|---|---|---|---|
일련번호 | 1.000 | 0.856 | 0.000 | 0.891 | 1.000 | 0.138 |
언어 | 0.856 | 1.000 | 0.000 | 0.000 | 0.757 | 0.000 |
정렬순서 | 0.000 | 0.000 | 1.000 | 0.801 | 0.000 | 0.952 |
단어 | 0.891 | 0.000 | 0.801 | 1.000 | 0.000 | 0.860 |
등록일시 | 1.000 | 0.757 | 0.000 | 0.000 | 1.000 | 0.000 |
기존순위 | 0.138 | 0.000 | 0.952 | 0.860 | 0.000 | 1.000 |
일련번호 | 정렬순서 | 기존순위 | 언어 | |
---|---|---|---|---|
일련번호 | 1.000 | 0.222 | 0.308 | 0.644 |
정렬순서 | 0.222 | 1.000 | 0.941 | 0.000 |
기존순위 | 0.308 | 0.941 | 1.000 | 0.000 |
언어 | 0.644 | 0.000 | 0.000 | 1.000 |
일련번호 | 언어 | 정렬순서 | 단어 | 등록일시 | 기존순위 | |
---|---|---|---|---|---|---|
0 | 101 | 국문 | 1 | 제주 | 2018-04-05 | 1 |
1 | 102 | 국문 | 2 | 우도 | 2018-04-05 | 2 |
2 | 103 | 국문 | 3 | 한라산 | 2018-04-05 | <NA> |
3 | 104 | 국문 | 4 | 성산 일출봉 | 2018-04-05 | 3 |
4 | 105 | 국문 | 5 | 비자리 | 2018-04-05 | <NA> |
5 | 106 | 국문 | 6 | 이중섭거리 | 2018-04-05 | <NA> |
6 | 107 | 국문 | 7 | 천지연폭포 | 2018-04-05 | 5 |
7 | 108 | 국문 | 8 | 휴애리 | 2018-04-05 | <NA> |
8 | 109 | 국문 | 9 | 마라도 | 2018-04-05 | <NA> |
9 | 110 | 국문 | 10 | 천제연폭포 | 2018-04-05 | 9 |
일련번호 | 언어 | 정렬순서 | 단어 | 등록일시 | 기존순위 | |
---|---|---|---|---|---|---|
61 | 112822 | 중문번체 | 10 | 오감만족제주여행 | 2024-03-08 | 9 |
62 | 112823 | 말레이문 | 1 | Seogwipo Chilsimni Festival | 2024-03-08 | 1 |
63 | 112824 | 말레이문 | 2 | Maple | 2024-03-08 | 2 |
64 | 112825 | 말레이문 | 3 | 봄 | 2024-03-08 | 3 |
65 | 112826 | 말레이문 | 4 | Yellowtail | 2024-03-08 | 4 |
66 | 112828 | 말레이문 | 6 | 가장행복한여행 | 2024-03-08 | 6 |
67 | 112829 | 말레이문 | 7 | love | 2024-03-08 | 9 |
68 | 112830 | 말레이문 | 8 | 신혼여행 | 2024-03-08 | 7 |
69 | 112831 | 말레이문 | 9 | 친구 | 2024-03-08 | 8 |
70 | 112832 | 말레이문 | 10 | 우도해변 | 2024-03-08 | <NA> |