Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 742.2 KiB |
Average record size in memory | 76.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 5 |
DateTime | 1 |
Dataset
Description | 제주 도보여행 탐방객 실측 데이터로서 공공데이터 뉴딜 사업으로 구축된 데이터입니다. |
---|---|
Author | 제주관광공사 |
URL | https://www.data.go.kr/data/15096602/fileData.do |
측정연도 has constant value "" | Constant |
고유번호 is highly overall correlated with 측정월 | High correlation |
측정일 is highly overall correlated with 측정월 | High correlation |
측정월 is highly overall correlated with 고유번호 and 1 other fields | High correlation |
위치정보 is highly imbalanced (68.7%) | Imbalance |
고유번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 05:08:04.466180 |
---|---|
Analysis finished | 2023-12-12 05:08:05.654684 |
Duration | 1.19 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
고유번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 47931.907 |
Minimum | 20 |
---|---|
Maximum | 95271 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 20 |
---|---|
5-th percentile | 4430.95 |
Q1 | 23971.25 |
median | 48320 |
Q3 | 71849.75 |
95-th percentile | 90638.75 |
Maximum | 95271 |
Range | 95251 |
Interquartile range (IQR) | 47878.5 |
Descriptive statistics
Standard deviation | 27600.6 |
---|---|
Coefficient of variation (CV) | 0.57582938 |
Kurtosis | -1.2015474 |
Mean | 47931.907 |
Median Absolute Deviation (MAD) | 23968.5 |
Skewness | -0.023960028 |
Sum | 4.7931907 × 108 |
Variance | 7.6179312 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
17858 | 1 | < 0.1% |
41381 | 1 | < 0.1% |
76054 | 1 | < 0.1% |
77313 | 1 | < 0.1% |
39731 | 1 | < 0.1% |
26716 | 1 | < 0.1% |
71848 | 1 | < 0.1% |
2404 | 1 | < 0.1% |
73851 | 1 | < 0.1% |
32884 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
20 | 1 | |
21 | 1 | |
36 | 1 | |
52 | 1 | |
54 | 1 | |
57 | 1 | |
63 | 1 | |
79 | 1 | |
86 | 1 | |
101 | 1 |
Value | Count | Frequency (%) |
95271 | 1 | |
95257 | 1 | |
95254 | 1 | |
95246 | 1 | |
95242 | 1 | |
95238 | 1 | |
95234 | 1 | |
95216 | 1 | |
95181 | 1 | |
95170 | 1 |
위치정보
Categorical
IMBALANCE
 
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
금오름 | |
---|---|
새별오름 | |
사라봉 | 125 |
산방산 | 64 |
궷물오름 | 56 |
Other values (7) | 89 |
Length
Max length | 6 |
---|---|
Median length | 3 |
Mean length | 3.2865 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 금오름 |
---|---|
2nd row | 금오름 |
3rd row | 금오름 |
4th row | 금오름 |
5th row | 새별오름 |
Common Values
Value | Count | Frequency (%) |
금오름 | 6976 | |
새별오름 | 2690 | 26.9% |
사라봉 | 125 | 1.2% |
산방산 | 64 | 0.6% |
궷물오름 | 56 | 0.6% |
도두봉 | 31 | 0.3% |
물영아리오름 | 24 | 0.2% |
광이오름 | 9 | 0.1% |
바리메오름 | 9 | 0.1% |
민오름 | 6 | 0.1% |
Other values (2) | 10 | 0.1% |
Length
Value | Count | Frequency (%) |
금오름 | 6976 | |
새별오름 | 2690 | 26.9% |
사라봉 | 125 | 1.2% |
산방산 | 64 | 0.6% |
궷물오름 | 56 | 0.6% |
도두봉 | 31 | 0.3% |
물영아리오름 | 24 | 0.2% |
광이오름 | 9 | 0.1% |
바리메오름 | 9 | 0.1% |
민오름 | 6 | 0.1% |
Other values (2) | 10 | 0.1% |
측정연도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2021 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2021 |
---|---|
2nd row | 2021 |
3rd row | 2021 |
4th row | 2021 |
5th row | 2021 |
Common Values
Value | Count | Frequency (%) |
2021 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2021 | 10000 |
측정월
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
10 | |
---|---|
9 | |
11 | |
8 | |
7 | 91 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 1.6064 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 9 |
---|---|
2nd row | 11 |
3rd row | 10 |
4th row | 10 |
5th row | 8 |
Common Values
Value | Count | Frequency (%) |
10 | 4272 | |
9 | 2325 | |
11 | 1792 | |
8 | 1520 | 15.2% |
7 | 91 | 0.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
10 | 4272 | |
9 | 2325 | |
11 | 1792 | |
8 | 1520 | 15.2% |
7 | 91 | 0.9% |
측정일
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 31 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 15.2212 |
Minimum | 1 |
---|---|
Maximum | 31 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 7 |
median | 13 |
Q3 | 25 |
95-th percentile | 29 |
Maximum | 31 |
Range | 30 |
Interquartile range (IQR) | 18 |
Descriptive statistics
Standard deviation | 9.091619 |
---|---|
Coefficient of variation (CV) | 0.59729975 |
Kurtosis | -1.3927108 |
Mean | 15.2212 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 0.12469644 |
Sum | 152212 |
Variance | 82.657536 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
9 | 837 | 8.4% |
26 | 668 | 6.7% |
2 | 663 | 6.6% |
7 | 632 | 6.3% |
25 | 615 | 6.2% |
3 | 594 | 5.9% |
10 | 555 | 5.5% |
28 | 466 | 4.7% |
29 | 461 | 4.6% |
12 | 437 | 4.4% |
Other values (21) | 4072 |
Value | Count | Frequency (%) |
1 | 98 | 1.0% |
2 | 663 | |
3 | 594 | |
4 | 91 | 0.9% |
5 | 163 | 1.6% |
6 | 278 | 2.8% |
7 | 632 | |
8 | 155 | 1.6% |
9 | 837 | |
10 | 555 |
Value | Count | Frequency (%) |
31 | 70 | 0.7% |
30 | 150 | 1.5% |
29 | 461 | |
28 | 466 | |
27 | 166 | 1.7% |
26 | 668 | |
25 | 615 | |
24 | 270 | |
23 | 319 | |
22 | 102 | 1.0% |
측정시간
Date
Distinct | 547 |
---|---|
Distinct (%) | 5.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2023-12-12 08:59:00 |
---|---|
Maximum | 2023-12-12 18:08:00 |
연령대
Categorical
Distinct | 4 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
청년 | |
---|---|
중장년 | |
어르신 | |
아동 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.382 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 청년 |
---|---|
2nd row | 청년 |
3rd row | 청년 |
4th row | 청년 |
5th row | 청년 |
Common Values
Value | Count | Frequency (%) |
청년 | 5387 | |
중장년 | 3025 | |
어르신 | 795 | 8.0% |
아동 | 793 | 7.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
청년 | 5387 | |
중장년 | 3025 | |
어르신 | 795 | 8.0% |
아동 | 793 | 7.9% |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여 | |
---|---|
남 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여 |
---|---|
2nd row | 여 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
여 | 5794 | |
남 | 4206 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 5794 | |
남 | 4206 |
고유번호 | 위치정보 | 측정월 | 측정일 | 연령대 | 성별 | |
---|---|---|---|---|---|---|
고유번호 | 1.000 | 0.679 | 0.966 | 0.917 | 0.235 | 0.047 |
위치정보 | 0.679 | 1.000 | 0.487 | 0.475 | 0.253 | 0.051 |
측정월 | 0.966 | 0.487 | 1.000 | 0.880 | 0.086 | 0.027 |
측정일 | 0.917 | 0.475 | 0.880 | 1.000 | 0.160 | 0.000 |
연령대 | 0.235 | 0.253 | 0.086 | 0.160 | 1.000 | 0.104 |
성별 | 0.047 | 0.051 | 0.027 | 0.000 | 0.104 | 1.000 |
측정월 | 성별 | 위치정보 | 연령대 | |
---|---|---|---|---|
측정월 | 1.000 | 0.033 | 0.295 | 0.070 |
성별 | 0.033 | 1.000 | 0.039 | 0.069 |
위치정보 | 0.295 | 0.039 | 1.000 | 0.120 |
연령대 | 0.070 | 0.069 | 0.120 | 1.000 |
고유번호 | 측정일 | 위치정보 | 측정월 | 연령대 | 성별 | |
---|---|---|---|---|---|---|
고유번호 | 1.000 | -0.266 | 0.367 | 0.745 | 0.142 | 0.036 |
측정일 | -0.266 | 1.000 | 0.235 | 0.535 | 0.103 | 0.000 |
위치정보 | 0.367 | 0.235 | 1.000 | 0.295 | 0.120 | 0.039 |
측정월 | 0.745 | 0.535 | 0.295 | 1.000 | 0.070 | 0.033 |
연령대 | 0.142 | 0.103 | 0.120 | 0.070 | 1.000 | 0.069 |
성별 | 0.036 | 0.000 | 0.039 | 0.033 | 0.069 | 1.000 |
고유번호 | 위치정보 | 측정연도 | 측정월 | 측정일 | 측정시간 | 연령대 | 성별 | |
---|---|---|---|---|---|---|---|---|
17857 | 17858 | 금오름 | 2021 | 9 | 12 | 17:51 | 청년 | 여 |
58078 | 58079 | 금오름 | 2021 | 11 | 13 | 14:38 | 청년 | 여 |
27076 | 27077 | 금오름 | 2021 | 10 | 2 | 16:22 | 청년 | 남 |
31779 | 31780 | 금오름 | 2021 | 10 | 9 | 15:17 | 청년 | 남 |
72727 | 72728 | 새별오름 | 2021 | 8 | 31 | 10:10 | 청년 | 남 |
88904 | 88905 | 새별오름 | 2021 | 10 | 9 | 12:13 | 어르신 | 남 |
37249 | 37250 | 금오름 | 2021 | 10 | 17 | 10:23 | 중장년 | 남 |
86370 | 86371 | 새별오름 | 2021 | 10 | 3 | 17:20 | 청년 | 여 |
84652 | 84653 | 새별오름 | 2021 | 10 | 3 | 12:40 | 중장년 | 여 |
30745 | 30746 | 금오름 | 2021 | 10 | 8 | 09:58 | 청년 | 여 |
고유번호 | 위치정보 | 측정연도 | 측정월 | 측정일 | 측정시간 | 연령대 | 성별 | |
---|---|---|---|---|---|---|---|---|
89963 | 89964 | 새별오름 | 2021 | 10 | 9 | 14:12 | 중장년 | 여 |
34353 | 34354 | 금오름 | 2021 | 10 | 10 | 15:22 | 중장년 | 남 |
10350 | 10351 | 금오름 | 2021 | 9 | 6 | 10:29 | 중장년 | 여 |
4076 | 4077 | 금오름 | 2021 | 8 | 28 | 09:53 | 청년 | 남 |
56460 | 56461 | 금오름 | 2021 | 11 | 9 | 13:14 | 중장년 | 여 |
56089 | 56090 | 금오름 | 2021 | 11 | 7 | 16:51 | 청년 | 여 |
3617 | 3618 | 금오름 | 2021 | 8 | 27 | 11:21 | 중장년 | 남 |
3247 | 3248 | 금오름 | 2021 | 8 | 26 | 13:15 | 아동 | 여 |
67841 | 67842 | 도두봉 | 2021 | 8 | 3 | 16:10 | 어르신 | 여 |
85222 | 85223 | 새별오름 | 2021 | 10 | 3 | 14:31 | 아동 | 여 |