Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 10000 |
Missing cells | 40000 |
Missing cells (%) | 30.8% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.1 MiB |
Average record size in memory | 119.0 B |
Variable types
Text | 1 |
---|---|
Numeric | 7 |
Categorical | 5 |
Dataset
Description | 2020년1월1일이후 당사에 등록된 고객에게 제공된 서비스 내역을 호텔, 운송, 기타로 분류한 통계정보 입니다. 고객번호는 가상번호이며 데이터 추가 개방이 변경될 수 있습니다. |
---|---|
Author | 그랜드코리아레저(주) |
URL | https://www.data.go.kr/data/15116857/fileData.do |
고객여권 발급 국가코드 is highly overall correlated with 고객여권 발급 국가명 | High correlation |
고객여권 발급 국가명 is highly overall correlated with 고객여권 발급 국가코드 | High correlation |
호텔 체류일 수 is highly overall correlated with 평균 숙박제공 금액 | High correlation |
평균 숙박제공 금액 is highly overall correlated with 호텔 체류일 수 | High correlation |
고객여권 발급 국가코드 is highly imbalanced (60.7%) | Imbalance |
고객여권 발급 국가명 is highly imbalanced (60.7%) | Imbalance |
호텔명 is highly imbalanced (55.9%) | Imbalance |
운송 구분명 is highly imbalanced (59.9%) | Imbalance |
호텔 체류일 수 has 6851 (68.5%) missing values | Missing |
평균 숙박제공 금액 has 6851 (68.5%) missing values | Missing |
운송 제공 건수 has 6935 (69.3%) missing values | Missing |
평균 운송 제공금액 has 6935 (69.3%) missing values | Missing |
기타 서비스 제공 건수 has 6214 (62.1%) missing values | Missing |
평균 기타서비스 제공 금액 has 6214 (62.1%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 02:17:21.593810 |
---|---|
Analysis finished | 2023-12-12 02:17:29.355933 |
Duration | 7.76 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
가상고객 번호
Text
Distinct | 5851 |
---|---|
Distinct (%) | 58.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 11 |
---|---|
Median length | 11 |
Mean length | 11 |
Min length | 11 |
Characters and Unicode
Total characters | 110000 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 3442 ? |
---|---|
Unique (%) | 34.4% |
Sample
1st row | V0004643017 |
---|---|
2nd row | V0038913001 |
3rd row | V0029714495 |
4th row | V0064080154 |
5th row | V0011388861 |
Value | Count | Frequency (%) |
v0057811884 | 10 | 0.1% |
v0042706537 | 8 | 0.1% |
v0003185820 | 8 | 0.1% |
v0003185642 | 8 | 0.1% |
v0069811398 | 7 | 0.1% |
v0020256465 | 7 | 0.1% |
v0000923885 | 7 | 0.1% |
v0072773941 | 7 | 0.1% |
v0032637878 | 7 | 0.1% |
v0017778438 | 7 | 0.1% |
Other values (5841) | 9924 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 29192 | |
V | 10000 | 9.1% |
7 | 9350 | 8.5% |
3 | 8459 | 7.7% |
2 | 8337 | 7.6% |
4 | 8271 | 7.5% |
1 | 7955 | 7.2% |
5 | 7436 | 6.8% |
6 | 7408 | 6.7% |
8 | 6897 | 6.3% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 100000 | |
Uppercase Letter | 10000 | 9.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 29192 | |
7 | 9350 | 9.3% |
3 | 8459 | 8.5% |
2 | 8337 | 8.3% |
4 | 8271 | 8.3% |
1 | 7955 | 8.0% |
5 | 7436 | 7.4% |
6 | 7408 | 7.4% |
8 | 6897 | 6.9% |
9 | 6695 | 6.7% |
Uppercase Letter
Value | Count | Frequency (%) |
V | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 100000 | |
Latin | 10000 | 9.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 29192 | |
7 | 9350 | 9.3% |
3 | 8459 | 8.5% |
2 | 8337 | 8.3% |
4 | 8271 | 8.3% |
1 | 7955 | 8.0% |
5 | 7436 | 7.4% |
6 | 7408 | 7.4% |
8 | 6897 | 6.9% |
9 | 6695 | 6.7% |
Latin
Value | Count | Frequency (%) |
V | 10000 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 110000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 29192 | |
V | 10000 | 9.1% |
7 | 9350 | 8.5% |
3 | 8459 | 7.7% |
2 | 8337 | 7.6% |
4 | 8271 | 7.5% |
1 | 7955 | 7.2% |
5 | 7436 | 6.8% |
6 | 7408 | 6.7% |
8 | 6897 | 6.3% |
출생연도
Real number (ℝ)
Distinct | 97 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1974.5699 |
Minimum | 1911 |
---|---|
Maximum | 2022 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1911 |
---|---|
5-th percentile | 1950 |
Q1 | 1966 |
median | 1975 |
Q3 | 1984 |
95-th percentile | 1997 |
Maximum | 2022 |
Range | 111 |
Interquartile range (IQR) | 18 |
Descriptive statistics
Standard deviation | 14.15997 |
---|---|
Coefficient of variation (CV) | 0.007171167 |
Kurtosis | 0.2595016 |
Mean | 1974.5699 |
Median Absolute Deviation (MAD) | 9 |
Skewness | 0.0036275678 |
Sum | 19745699 |
Variance | 200.50476 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1972 | 346 | 3.5% |
1973 | 317 | 3.2% |
1982 | 308 | 3.1% |
1968 | 296 | 3.0% |
1976 | 295 | 2.9% |
1969 | 294 | 2.9% |
1975 | 287 | 2.9% |
1981 | 285 | 2.9% |
1974 | 275 | 2.8% |
1971 | 275 | 2.8% |
Other values (87) | 7022 |
Value | Count | Frequency (%) |
1911 | 1 | < 0.1% |
1916 | 1 | < 0.1% |
1917 | 1 | < 0.1% |
1921 | 1 | < 0.1% |
1922 | 1 | < 0.1% |
1930 | 3 | |
1931 | 1 | < 0.1% |
1932 | 1 | < 0.1% |
1934 | 2 | |
1935 | 3 |
Value | Count | Frequency (%) |
2022 | 7 | |
2021 | 7 | |
2020 | 2 | < 0.1% |
2019 | 7 | |
2018 | 10 | |
2017 | 9 | |
2016 | 10 | |
2015 | 10 | |
2014 | 10 | |
2013 | 15 |
고객여권 발급 국가코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 36 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
JPN | |
---|---|
CHN | |
KOR | |
USA | 373 |
TWN | 357 |
Other values (31) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | USA |
---|---|
2nd row | JPN |
3rd row | JPN |
4th row | CHN |
5th row | JPN |
Common Values
Value | Count | Frequency (%) |
JPN | 6203 | |
CHN | 1640 | 16.4% |
KOR | 624 | 6.2% |
USA | 373 | 3.7% |
TWN | 357 | 3.6% |
THA | 175 | 1.8% |
MNG | 153 | 1.5% |
HKG | 80 | 0.8% |
MYS | 70 | 0.7% |
SGP | 70 | 0.7% |
Other values (26) | 255 | 2.5% |
Length
Value | Count | Frequency (%) |
jpn | 6203 | |
chn | 1640 | 16.4% |
kor | 624 | 6.2% |
usa | 373 | 3.7% |
twn | 357 | 3.6% |
tha | 175 | 1.8% |
mng | 153 | 1.5% |
hkg | 80 | 0.8% |
sgp | 70 | 0.7% |
mys | 70 | 0.7% |
Other values (26) | 255 | 2.5% |
고객여권 발급 국가명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 36 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
일본 | |
---|---|
중국 | |
대한민국(영주권자) | |
미국 | 373 |
대만 | 357 |
Other values (31) |
Length
Max length | 10 |
---|---|
Median length | 2 |
Mean length | 2.5582 |
Min length | 2 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 미국 |
---|---|
2nd row | 일본 |
3rd row | 일본 |
4th row | 중국 |
5th row | 일본 |
Common Values
Value | Count | Frequency (%) |
일본 | 6203 | |
중국 | 1640 | 16.4% |
대한민국(영주권자) | 624 | 6.2% |
미국 | 373 | 3.7% |
대만 | 357 | 3.6% |
태국 | 175 | 1.8% |
몽골 | 153 | 1.5% |
홍콩 | 80 | 0.8% |
말레이시아 | 70 | 0.7% |
싱가폴 | 70 | 0.7% |
Other values (26) | 255 | 2.5% |
Length
Value | Count | Frequency (%) |
일본 | 6203 | |
중국 | 1640 | 16.4% |
대한민국(영주권자 | 624 | 6.2% |
미국 | 373 | 3.7% |
대만 | 357 | 3.6% |
태국 | 175 | 1.8% |
몽골 | 153 | 1.5% |
홍콩 | 80 | 0.8% |
싱가폴 | 70 | 0.7% |
말레이시아 | 70 | 0.7% |
Other values (26) | 255 | 2.5% |
호텔명
Categorical
IMBALANCE
 
Distinct | 17 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
Coex Inter | 683 |
Lotte Busan | 622 |
Oakwood | 585 |
M. Hilton | 433 |
Other values (12) |
Length
Max length | 13 |
---|---|
Median length | 4 |
Mean length | 5.6066 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | <NA> |
---|---|
2nd row | Coex Inter |
3rd row | <NA> |
4th row | <NA> |
5th row | M. Hilton |
Common Values
Value | Count | Frequency (%) |
<NA> | 6851 | |
Coex Inter | 683 | 6.8% |
Lotte Busan | 622 | 6.2% |
Oakwood | 585 | 5.9% |
M. Hilton | 433 | 4.3% |
Novotel | 381 | 3.8% |
Novotel Suite | 201 | 2.0% |
부산비즈니스 | 112 | 1.1% |
Grand Inter | 44 | 0.4% |
기타(서울) | 31 | 0.3% |
Other values (7) | 57 | 0.6% |
Length
Value | Count | Frequency (%) |
na | 6851 | |
inter | 727 | 6.1% |
coex | 683 | 5.7% |
lotte | 624 | 5.2% |
busan | 622 | 5.2% |
oakwood | 585 | 4.9% |
novotel | 582 | 4.9% |
m | 433 | 3.6% |
hilton | 433 | 3.6% |
suite | 201 | 1.7% |
Other values (10) | 247 | 2.1% |
호텔 체류일 수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 61 |
---|---|
Distinct (%) | 1.9% |
Missing | 6851 |
Missing (%) | 68.5% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.8135916 |
Minimum | 0 |
---|---|
Maximum | 366 |
Zeros | 25 |
Zeros (%) | 0.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 2 |
Q3 | 5 |
95-th percentile | 16 |
Maximum | 366 |
Range | 366 |
Interquartile range (IQR) | 3 |
Descriptive statistics
Standard deviation | 9.8503346 |
---|---|
Coefficient of variation (CV) | 2.0463586 |
Kurtosis | 589.53398 |
Mean | 4.8135916 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 18.123322 |
Sum | 15158 |
Variance | 97.029091 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2 | 944 | 9.4% |
1 | 735 | 7.3% |
3 | 380 | 3.8% |
4 | 265 | 2.6% |
5 | 131 | 1.3% |
6 | 120 | 1.2% |
7 | 84 | 0.8% |
8 | 69 | 0.7% |
10 | 49 | 0.5% |
9 | 43 | 0.4% |
Other values (51) | 329 | 3.3% |
(Missing) | 6851 |
Value | Count | Frequency (%) |
0 | 25 | 0.2% |
1 | 735 | |
2 | 944 | |
3 | 380 | |
4 | 265 | 2.6% |
5 | 131 | 1.3% |
6 | 120 | 1.2% |
7 | 84 | 0.8% |
8 | 69 | 0.7% |
9 | 43 | 0.4% |
Value | Count | Frequency (%) |
366 | 1 | |
123 | 1 | |
90 | 1 | |
87 | 1 | |
76 | 1 | |
71 | 1 | |
69 | 2 | |
67 | 2 | |
60 | 1 | |
57 | 1 |
평균 숙박제공 금액
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 1010 |
---|---|
Distinct (%) | 32.1% |
Missing | 6851 |
Missing (%) | 68.5% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 765545.5 |
Minimum | 1134 |
---|---|
Maximum | 7949700 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1134 |
---|---|
5-th percentile | 286000 |
Q1 | 381150 |
median | 650375 |
Q3 | 871200 |
95-th percentile | 1834360 |
Maximum | 7949700 |
Range | 7948566 |
Interquartile range (IQR) | 490050 |
Descriptive statistics
Standard deviation | 607302.35 |
---|---|
Coefficient of variation (CV) | 0.79329362 |
Kurtosis | 18.730441 |
Mean | 765545.5 |
Median Absolute Deviation (MAD) | 265595 |
Skewness | 3.3427729 |
Sum | 2.4107028 × 109 |
Variance | 3.6881615 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
713900 | 132 | 1.3% |
572000 | 126 | 1.3% |
286000 | 119 | 1.2% |
356950 | 87 | 0.9% |
381150 | 72 | 0.7% |
363000 | 72 | 0.7% |
648560 | 69 | 0.7% |
762300 | 59 | 0.6% |
726000 | 56 | 0.6% |
1070850 | 56 | 0.6% |
Other values (1000) | 2301 | 23.0% |
(Missing) | 6851 |
Value | Count | Frequency (%) |
1134 | 1 | < 0.1% |
26000 | 1 | < 0.1% |
51000 | 1 | < 0.1% |
56666 | 1 | < 0.1% |
59500 | 23 | |
60000 | 3 | < 0.1% |
61500 | 1 | < 0.1% |
63600 | 1 | < 0.1% |
66130 | 1 | < 0.1% |
67000 | 1 | < 0.1% |
Value | Count | Frequency (%) |
7949700 | 1 | |
6177792 | 1 | |
5818890 | 1 | |
5084823 | 1 | |
5082000 | 1 | |
4993800 | 1 | |
4864200 | 1 | |
4796300 | 1 | |
4586505 | 1 | |
4440700 | 1 |
운송 구분명
Categorical
IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
항공 | |
택시 | 303 |
열차 | 136 |
렌트카 | 5 |
Other values (2) | 9 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.3885 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 항공 |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 6935 | |
항공 | 2612 | 26.1% |
택시 | 303 | 3.0% |
열차 | 136 | 1.4% |
렌트카 | 5 | 0.1% |
수시차량 | 5 | 0.1% |
선박 | 4 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 6935 | |
항공 | 2612 | 26.1% |
택시 | 303 | 3.0% |
열차 | 136 | 1.4% |
렌트카 | 5 | < 0.1% |
수시차량 | 5 | < 0.1% |
선박 | 4 | < 0.1% |
운송 제공 건수
Real number (ℝ)
MISSING
 
Distinct | 94 |
---|---|
Distinct (%) | 3.1% |
Missing | 6935 |
Missing (%) | 69.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 8.2763458 |
Minimum | 1 |
---|---|
Maximum | 288 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 4 |
Q3 | 8 |
95-th percentile | 27 |
Maximum | 288 |
Range | 287 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 15.699081 |
---|---|
Coefficient of variation (CV) | 1.8968614 |
Kurtosis | 72.900741 |
Mean | 8.2763458 |
Median Absolute Deviation (MAD) | 2 |
Skewness | 6.9269049 |
Sum | 25367 |
Variance | 246.46114 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
4 | 677 | 6.8% |
1 | 496 | 5.0% |
2 | 422 | 4.2% |
5 | 214 | 2.1% |
3 | 189 | 1.9% |
6 | 187 | 1.9% |
8 | 116 | 1.2% |
7 | 78 | 0.8% |
10 | 69 | 0.7% |
9 | 62 | 0.6% |
Other values (84) | 555 | 5.5% |
(Missing) | 6935 |
Value | Count | Frequency (%) |
1 | 496 | |
2 | 422 | |
3 | 189 | 1.9% |
4 | 677 | |
5 | 214 | 2.1% |
6 | 187 | 1.9% |
7 | 78 | 0.8% |
8 | 116 | 1.2% |
9 | 62 | 0.6% |
10 | 69 | 0.7% |
Value | Count | Frequency (%) |
288 | 1 | |
237 | 1 | |
169 | 1 | |
164 | 1 | |
155 | 1 | |
145 | 1 | |
142 | 1 | |
136 | 1 | |
132 | 1 | |
125 | 1 |
평균 운송 제공금액
Real number (ℝ)
MISSING
 
Distinct | 2670 |
---|---|
Distinct (%) | 87.1% |
Missing | 6935 |
Missing (%) | 69.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 400955.87 |
Minimum | 400 |
---|---|
Maximum | 3785750 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 400 |
---|---|
5-th percentile | 18240 |
Q1 | 161238 |
median | 351729 |
Q3 | 556385 |
95-th percentile | 952362 |
Maximum | 3785750 |
Range | 3785350 |
Interquartile range (IQR) | 395147 |
Descriptive statistics
Standard deviation | 326236.72 |
---|---|
Coefficient of variation (CV) | 0.81364745 |
Kurtosis | 16.173008 |
Mean | 400955.87 |
Median Absolute Deviation (MAD) | 196823 |
Skewness | 2.5368344 |
Sum | 1.2289297 × 109 |
Variance | 1.064304 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20000 | 16 | 0.2% |
83700 | 9 | 0.1% |
30000 | 8 | 0.1% |
15000 | 7 | 0.1% |
360000 | 6 | 0.1% |
504200 | 6 | 0.1% |
10000 | 6 | 0.1% |
100000 | 5 | 0.1% |
287700 | 5 | 0.1% |
390450 | 5 | 0.1% |
Other values (2660) | 2992 | |
(Missing) | 6935 |
Value | Count | Frequency (%) |
400 | 1 | < 0.1% |
3000 | 1 | < 0.1% |
3400 | 1 | < 0.1% |
3800 | 1 | < 0.1% |
3900 | 1 | < 0.1% |
4200 | 4 | |
4400 | 2 | |
4700 | 2 | |
4800 | 2 | |
5000 | 1 | < 0.1% |
Value | Count | Frequency (%) |
3785750 | 1 | |
3509000 | 1 | |
3374233 | 1 | |
3302363 | 1 | |
3153300 | 1 | |
3018402 | 1 | |
2810409 | 1 | |
2490000 | 1 | |
2327000 | 1 | |
2312100 | 1 |
기타 서비스명
Categorical
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
일반음식점 | |
기타(10만원미만) | |
선물대 | |
기타(10만원이상) | 477 |
Other values (2) | 271 |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 4.8854 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반음식점 |
---|---|
2nd row | <NA> |
3rd row | 선물대 |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 6214 | |
일반음식점 | 1498 | 15.0% |
기타(10만원미만) | 905 | 9.0% |
선물대 | 635 | 6.3% |
기타(10만원이상) | 477 | 4.8% |
경조사 | 241 | 2.4% |
골프 | 30 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 6214 | |
일반음식점 | 1498 | 15.0% |
기타(10만원미만 | 905 | 9.0% |
선물대 | 635 | 6.3% |
기타(10만원이상 | 477 | 4.8% |
경조사 | 241 | 2.4% |
골프 | 30 | 0.3% |
기타 서비스 제공 건수
Real number (ℝ)
MISSING
 
Distinct | 64 |
---|---|
Distinct (%) | 1.7% |
Missing | 6214 |
Missing (%) | 62.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.9403064 |
Minimum | 1 |
---|---|
Maximum | 236 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 2 |
Q3 | 3 |
95-th percentile | 14 |
Maximum | 236 |
Range | 235 |
Interquartile range (IQR) | 2 |
Descriptive statistics
Standard deviation | 8.4935364 |
---|---|
Coefficient of variation (CV) | 2.1555523 |
Kurtosis | 192.20584 |
Mean | 3.9403064 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 10.285768 |
Sum | 14918 |
Variance | 72.140161 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1845 | 18.4% |
2 | 703 | 7.0% |
3 | 339 | 3.4% |
4 | 185 | 1.8% |
5 | 129 | 1.3% |
6 | 85 | 0.9% |
7 | 71 | 0.7% |
8 | 58 | 0.6% |
9 | 50 | 0.5% |
10 | 39 | 0.4% |
Other values (54) | 282 | 2.8% |
(Missing) | 6214 |
Value | Count | Frequency (%) |
1 | 1845 | |
2 | 703 | 7.0% |
3 | 339 | 3.4% |
4 | 185 | 1.8% |
5 | 129 | 1.3% |
6 | 85 | 0.9% |
7 | 71 | 0.7% |
8 | 58 | 0.6% |
9 | 50 | 0.5% |
10 | 39 | 0.4% |
Value | Count | Frequency (%) |
236 | 1 | < 0.1% |
144 | 1 | < 0.1% |
106 | 1 | < 0.1% |
99 | 1 | < 0.1% |
90 | 1 | < 0.1% |
83 | 1 | < 0.1% |
81 | 1 | < 0.1% |
79 | 1 | < 0.1% |
67 | 1 | < 0.1% |
64 | 3 |
평균 기타서비스 제공 금액
Real number (ℝ)
MISSING
 
Distinct | 2509 |
---|---|
Distinct (%) | 66.3% |
Missing | 6214 |
Missing (%) | 62.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 248177.43 |
Minimum | 2000 |
---|---|
Maximum | 15550388 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2000 |
---|---|
5-th percentile | 36557.75 |
Q1 | 81000 |
median | 156913 |
Q3 | 309652.25 |
95-th percentile | 701365 |
Maximum | 15550388 |
Range | 15548388 |
Interquartile range (IQR) | 228652.25 |
Descriptive statistics
Standard deviation | 373488.55 |
---|---|
Coefficient of variation (CV) | 1.5049255 |
Kurtosis | 750.06692 |
Mean | 248177.43 |
Median Absolute Deviation (MAD) | 91913 |
Skewness | 19.694321 |
Sum | 9.3959975 × 108 |
Variance | 1.394937 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
65000 | 303 | 3.0% |
89000 | 166 | 1.7% |
104000 | 59 | 0.6% |
110000 | 53 | 0.5% |
120000 | 34 | 0.3% |
90590 | 33 | 0.3% |
73557 | 24 | 0.2% |
240000 | 18 | 0.2% |
77000 | 18 | 0.2% |
63559 | 16 | 0.2% |
Other values (2499) | 3062 | |
(Missing) | 6214 |
Value | Count | Frequency (%) |
2000 | 1 | |
2500 | 1 | |
2600 | 1 | |
3000 | 2 | |
3200 | 1 | |
3500 | 1 | |
3600 | 1 | |
3700 | 1 | |
4000 | 1 | |
4500 | 1 |
Value | Count | Frequency (%) |
15550388 | 1 | |
3513700 | 1 | |
2863500 | 1 | |
2710000 | 1 | |
2525000 | 1 | |
2430143 | 1 | |
2423333 | 1 | |
2415000 | 1 | |
2209758 | 1 | |
2197600 | 2 |
출생연도 | 고객여권 발급 국가코드 | 고객여권 발급 국가명 | 호텔명 | 호텔 체류일 수 | 평균 숙박제공 금액 | 운송 구분명 | 운송 제공 건수 | 평균 운송 제공금액 | 기타 서비스명 | 기타 서비스 제공 건수 | 평균 기타서비스 제공 금액 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
출생연도 | 1.000 | 0.246 | 0.246 | 0.030 | 0.000 | 0.079 | 0.116 | 0.129 | 0.134 | 0.283 | 0.000 | 0.000 |
고객여권 발급 국가코드 | 0.246 | 1.000 | 1.000 | 0.480 | 0.165 | 0.478 | 0.491 | 0.000 | 0.350 | 0.257 | 0.290 | 0.661 |
고객여권 발급 국가명 | 0.246 | 1.000 | 1.000 | 0.480 | 0.165 | 0.478 | 0.491 | 0.000 | 0.350 | 0.257 | 0.290 | 0.661 |
호텔명 | 0.030 | 0.480 | 0.480 | 1.000 | 0.000 | 0.340 | NaN | NaN | NaN | NaN | NaN | NaN |
호텔 체류일 수 | 0.000 | 0.165 | 0.165 | 0.000 | 1.000 | 0.254 | NaN | NaN | NaN | NaN | NaN | NaN |
평균 숙박제공 금액 | 0.079 | 0.478 | 0.478 | 0.340 | 0.254 | 1.000 | NaN | NaN | NaN | NaN | NaN | NaN |
운송 구분명 | 0.116 | 0.491 | 0.491 | NaN | NaN | NaN | 1.000 | 0.000 | 0.410 | NaN | NaN | NaN |
운송 제공 건수 | 0.129 | 0.000 | 0.000 | NaN | NaN | NaN | 0.000 | 1.000 | 0.000 | NaN | NaN | NaN |
평균 운송 제공금액 | 0.134 | 0.350 | 0.350 | NaN | NaN | NaN | 0.410 | 0.000 | 1.000 | NaN | NaN | NaN |
기타 서비스명 | 0.283 | 0.257 | 0.257 | NaN | NaN | NaN | NaN | NaN | NaN | 1.000 | 0.073 | 0.121 |
기타 서비스 제공 건수 | 0.000 | 0.290 | 0.290 | NaN | NaN | NaN | NaN | NaN | NaN | 0.073 | 1.000 | 0.012 |
평균 기타서비스 제공 금액 | 0.000 | 0.661 | 0.661 | NaN | NaN | NaN | NaN | NaN | NaN | 0.121 | 0.012 | 1.000 |
고객여권 발급 국가코드 | 고객여권 발급 국가명 | 호텔명 | 운송 구분명 | 기타 서비스명 | |
---|---|---|---|---|---|
고객여권 발급 국가코드 | 1.000 | 1.000 | 0.155 | 0.241 | 0.116 |
고객여권 발급 국가명 | 1.000 | 1.000 | 0.155 | 0.241 | 0.116 |
호텔명 | 0.155 | 0.155 | 1.000 | NaN | NaN |
운송 구분명 | 0.241 | 0.241 | NaN | 1.000 | NaN |
기타 서비스명 | 0.116 | 0.116 | NaN | NaN | 1.000 |
출생연도 | 호텔 체류일 수 | 평균 숙박제공 금액 | 운송 제공 건수 | 평균 운송 제공금액 | 기타 서비스 제공 건수 | 평균 기타서비스 제공 금액 | 고객여권 발급 국가코드 | 고객여권 발급 국가명 | 호텔명 | 운송 구분명 | 기타 서비스명 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
출생연도 | 1.000 | -0.171 | -0.132 | -0.075 | 0.011 | -0.130 | -0.108 | 0.088 | 0.088 | 0.010 | 0.061 | 0.152 |
호텔 체류일 수 | -0.171 | 1.000 | 0.562 | NaN | NaN | NaN | NaN | 0.078 | 0.078 | 0.000 | 0.000 | 0.000 |
평균 숙박제공 금액 | -0.132 | 0.562 | 1.000 | NaN | NaN | NaN | NaN | 0.198 | 0.198 | 0.147 | 0.000 | 0.000 |
운송 제공 건수 | -0.075 | NaN | NaN | 1.000 | 0.034 | NaN | NaN | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 |
평균 운송 제공금액 | 0.011 | NaN | NaN | 0.034 | 1.000 | NaN | NaN | 0.131 | 0.131 | 0.000 | 0.230 | 0.000 |
기타 서비스 제공 건수 | -0.130 | NaN | NaN | NaN | NaN | 1.000 | 0.246 | 0.123 | 0.123 | 0.000 | 0.000 | 0.043 |
평균 기타서비스 제공 금액 | -0.108 | NaN | NaN | NaN | NaN | 0.246 | 1.000 | 0.407 | 0.407 | 0.000 | 0.000 | 0.078 |
고객여권 발급 국가코드 | 0.088 | 0.078 | 0.198 | 0.000 | 0.131 | 0.123 | 0.407 | 1.000 | 1.000 | 0.155 | 0.241 | 0.116 |
고객여권 발급 국가명 | 0.088 | 0.078 | 0.198 | 0.000 | 0.131 | 0.123 | 0.407 | 1.000 | 1.000 | 0.155 | 0.241 | 0.116 |
호텔명 | 0.010 | 0.000 | 0.147 | 0.000 | 0.000 | 0.000 | 0.000 | 0.155 | 0.155 | 1.000 | 0.000 | 0.000 |
운송 구분명 | 0.061 | 0.000 | 0.000 | 0.000 | 0.230 | 0.000 | 0.000 | 0.241 | 0.241 | 0.000 | 1.000 | 0.000 |
기타 서비스명 | 0.152 | 0.000 | 0.000 | 0.000 | 0.000 | 0.043 | 0.078 | 0.116 | 0.116 | 0.000 | 0.000 | 1.000 |
가상고객 번호 | 출생연도 | 고객여권 발급 국가코드 | 고객여권 발급 국가명 | 호텔명 | 호텔 체류일 수 | 평균 숙박제공 금액 | 운송 구분명 | 운송 제공 건수 | 평균 운송 제공금액 | 기타 서비스명 | 기타 서비스 제공 건수 | 평균 기타서비스 제공 금액 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2956 | V0004643017 | 1974 | USA | 미국 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 일반음식점 | 6 | 275333 |
10994 | V0038913001 | 1973 | JPN | 일본 | Coex Inter | 3 | 535425 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8825 | V0029714495 | 1974 | JPN | 일본 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 선물대 | 1 | 130531 |
15764 | V0064080154 | 1985 | CHN | 중국 | <NA> | <NA> | <NA> | 항공 | 2 | 505700 | <NA> | <NA> | <NA> |
4978 | V0011388861 | 1973 | JPN | 일본 | M. Hilton | 7 | 668827 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
524 | V0000400209 | 1950 | USA | 미국 | Oakwood | 38 | 5084823 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
10493 | V0037133090 | 1963 | JPN | 일본 | Coex Inter | 5 | 892375 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
21770 | V0074882529 | 1999 | JPN | 일본 | <NA> | <NA> | <NA> | 항공 | 4 | 320451 | <NA> | <NA> | <NA> |
26 | V0000051329 | 1944 | KOR | 대한민국(영주권자) | <NA> | <NA> | <NA> | 항공 | 1 | 251500 | <NA> | <NA> | <NA> |
10051 | V0034917880 | 1987 | CHN | 중국 | Coex Inter | 3 | 556600 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
가상고객 번호 | 출생연도 | 고객여권 발급 국가코드 | 고객여권 발급 국가명 | 호텔명 | 호텔 체류일 수 | 평균 숙박제공 금액 | 운송 구분명 | 운송 제공 건수 | 평균 운송 제공금액 | 기타 서비스명 | 기타 서비스 제공 건수 | 평균 기타서비스 제공 금액 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
22504 | V0076158077 | 1964 | CHN | 중국 | <NA> | <NA> | <NA> | 항공 | 4 | 306163 | <NA> | <NA> | <NA> |
2395 | V0003185820 | 1954 | JPN | 일본 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 선물대 | 2 | 349671 |
13584 | V0050845587 | 1983 | JPN | 일본 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 기타(10만원미만) | 1 | 65000 |
2926 | V0004484864 | 1974 | JPN | 일본 | M. Hilton | 3 | 599555 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8541 | V0028422393 | 1965 | KOR | 대한민국(영주권자) | <NA> | <NA> | <NA> | 항공 | 23 | 65031 | <NA> | <NA> | <NA> |
9971 | V0034640022 | 1976 | CHN | 중국 | Coex Inter | 3 | 1070850 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9381 | V0032188873 | 1977 | JPN | 일본 | Coex Inter | 2 | 363000 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
14613 | V0057251095 | 1977 | JPN | 일본 | <NA> | <NA> | <NA> | 항공 | 2 | 736400 | <NA> | <NA> | <NA> |
6607 | V0018576857 | 1957 | TWN | 대만 | <NA> | <NA> | <NA> | 택시 | 25 | 59637 | <NA> | <NA> | <NA> |
12720 | V0046584089 | 1975 | CHN | 중국 | <NA> | <NA> | <NA> | 항공 | 3 | 513200 | <NA> | <NA> | <NA> |