Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 8736 |
Missing cells | 7932 |
Missing cells (%) | 10.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 622.9 KiB |
Average record size in memory | 73.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 7 |
Text | 1 |
Dataset
Description | 사행산업 또는 불법 사행산업으로 인한 중독 및 도박문제로 예방치유원과 접촉한 내담자들의 인구통계학적 데이터(성별, 지역, 연령대, 도박유형 등) |
---|---|
Author | 한국도박문제관리센터 |
URL | https://www.data.go.kr/data/15107961/fileData.do |
도박자와의 관계 is highly overall correlated with 성별 and 3 other fields | High correlation |
합불법 여부 is highly overall correlated with 도박자와의 관계 and 1 other fields | High correlation |
온오프라인 여부 is highly overall correlated with 도박자와의 관계 | High correlation |
1차 도박 유형 is highly overall correlated with 도박자와의 관계 and 1 other fields | High correlation |
성별 is highly overall correlated with 도박자와의 관계 | High correlation |
성별 is highly imbalanced (52.6%) | Imbalance |
도박자와의 관계 is highly imbalanced (65.0%) | Imbalance |
기타 has 7931 (90.8%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 15:38:21.636151 |
---|---|
Analysis finished | 2023-12-12 15:38:23.485222 |
Duration | 1.85 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
Distinct | 8735 |
---|---|
Distinct (%) | 100.0% |
Missing | 1 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4368 |
Minimum | 1 |
---|---|
Maximum | 8735 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 76.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 437.7 |
Q1 | 2184.5 |
median | 4368 |
Q3 | 6551.5 |
95-th percentile | 8298.3 |
Maximum | 8735 |
Range | 8734 |
Interquartile range (IQR) | 4367 |
Descriptive statistics
Standard deviation | 2521.7216 |
---|---|
Coefficient of variation (CV) | 0.57731722 |
Kurtosis | -1.2 |
Mean | 4368 |
Median Absolute Deviation (MAD) | 2184 |
Skewness | 0 |
Sum | 38154480 |
Variance | 6359080 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
5827 | 1 | < 0.1% |
5821 | 1 | < 0.1% |
5822 | 1 | < 0.1% |
5823 | 1 | < 0.1% |
5824 | 1 | < 0.1% |
5825 | 1 | < 0.1% |
5826 | 1 | < 0.1% |
5828 | 1 | < 0.1% |
5870 | 1 | < 0.1% |
Other values (8725) | 8725 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
8735 | 1 | |
8734 | 1 | |
8733 | 1 | |
8732 | 1 | |
8731 | 1 | |
8730 | 1 | |
8729 | 1 | |
8728 | 1 | |
8727 | 1 | |
8726 | 1 |
성별
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.4 KiB |
남 | |
---|---|
여 | |
<NA> | 1 |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.0003434 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 남 |
---|---|
2nd row | 여 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
남 | 6866 | |
여 | 1869 | 21.4% |
<NA> | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 6866 | |
여 | 1869 | 21.4% |
na | 1 | < 0.1% |
연령대
Categorical
Distinct | 9 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.4 KiB |
30대 | |
---|---|
20대 | |
40대 | |
50대 | |
60대 | |
Other values (4) |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0001145 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 60대 |
---|---|
2nd row | 40대 |
3rd row | 60대 |
4th row | 30대 |
5th row | 40대 |
Common Values
Value | Count | Frequency (%) |
30대 | 2811 | |
20대 | 2229 | |
40대 | 1692 | |
50대 | 1099 | 12.6% |
60대 | 475 | 5.4% |
10대 | 352 | 4.0% |
70대 | 74 | 0.8% |
80대 | 3 | < 0.1% |
<NA> | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
30대 | 2811 | |
20대 | 2229 | |
40대 | 1692 | |
50대 | 1099 | 12.6% |
60대 | 475 | 5.4% |
10대 | 352 | 4.0% |
70대 | 74 | 0.8% |
80대 | 3 | < 0.1% |
na | 1 | < 0.1% |
지역
Categorical
Distinct | 19 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.4 KiB |
경기 | |
---|---|
서울 | |
부산 | |
인천 | |
경남 | |
Other values (14) |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0002289 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 제주 |
---|---|
2nd row | 경기 |
3rd row | 광주 |
4th row | 광주 |
5th row | 경북 |
Common Values
Value | Count | Frequency (%) |
경기 | 2032 | |
서울 | 1305 | |
부산 | 696 | 8.0% |
인천 | 641 | 7.3% |
경남 | 479 | 5.5% |
충남 | 398 | 4.6% |
대구 | 396 | 4.5% |
대전 | 374 | 4.3% |
강원 | 367 | 4.2% |
광주 | 343 | 3.9% |
Other values (9) | 1705 |
Length
Value | Count | Frequency (%) |
경기 | 2032 | |
서울 | 1305 | |
부산 | 696 | 8.0% |
인천 | 641 | 7.3% |
경남 | 479 | 5.5% |
충남 | 398 | 4.6% |
대구 | 396 | 4.5% |
대전 | 374 | 4.3% |
강원 | 367 | 4.2% |
광주 | 343 | 3.9% |
Other values (9) | 1705 |
도박자와의 관계
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 9 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.4 KiB |
본인 | |
---|---|
부모 | |
배우자 | 525 |
형제자매 | 142 |
자녀 | 49 |
Other values (4) | 57 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0943223 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 부모 |
---|---|
2nd row | 배우자 |
3rd row | 부모 |
4th row | 본인 |
5th row | 본인 |
Common Values
Value | Count | Frequency (%) |
본인 | 6783 | |
부모 | 1180 | 13.5% |
배우자 | 525 | 6.0% |
형제자매 | 142 | 1.6% |
자녀 | 49 | 0.6% |
지인 | 41 | 0.5% |
친인척 | 13 | 0.1% |
기관 | 2 | < 0.1% |
<NA> | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
본인 | 6783 | |
부모 | 1180 | 13.5% |
배우자 | 525 | 6.0% |
형제자매 | 142 | 1.6% |
자녀 | 49 | 0.6% |
지인 | 41 | 0.5% |
친인척 | 13 | 0.1% |
기관 | 2 | < 0.1% |
na | 1 | < 0.1% |
1차 도박 유형
Categorical
HIGH CORRELATION
 
Distinct | 15 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.4 KiB |
스포츠도박 | |
---|---|
<NA> | |
미니게임/사다리게임 | |
카지노 | |
주식 | |
Other values (10) |
Length
Max length | 10 |
---|---|
Median length | 5 |
Mean length | 4.3173077 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 복권 |
5th row | 카지노 |
Common Values
Value | Count | Frequency (%) |
스포츠도박 | 2929 | |
<NA> | 1953 | |
미니게임/사다리게임 | 823 | 9.4% |
카지노 | 773 | 8.8% |
주식 | 700 | 8.0% |
기타 | 680 | 7.8% |
카드 | 543 | 6.2% |
복권 | 155 | 1.8% |
성인오락 | 91 | 1.0% |
화투 | 38 | 0.4% |
Other values (5) | 51 | 0.6% |
Length
Value | Count | Frequency (%) |
스포츠도박 | 2929 | |
na | 1953 | |
미니게임/사다리게임 | 823 | 9.4% |
카지노 | 773 | 8.8% |
주식 | 700 | 8.0% |
기타 | 680 | 7.8% |
카드 | 543 | 6.2% |
복권 | 155 | 1.8% |
성인오락 | 91 | 1.0% |
화투 | 38 | 0.4% |
Other values (5) | 51 | 0.6% |
기타
Text
MISSING
 
Distinct | 70 |
---|---|
Distinct (%) | 8.7% |
Missing | 7931 |
Missing (%) | 90.8% |
Memory size | 68.4 KiB |
Value | Count | Frequency (%) |
가상화폐 | 232 | |
파워볼 | 118 | |
비트코인 | 65 | 7.9% |
fx마진거래 | 48 | 5.8% |
바카라 | 47 | 5.7% |
게임 | 40 | 4.8% |
게임(리니지 | 28 | 3.4% |
미니게임 | 27 | 3.3% |
선물옵션 | 26 | 3.1% |
암호화폐 | 21 | 2.5% |
Other values (63) | 176 |
Most occurring characters
Value | Count | Frequency (%) |
화 | 273 | 7.4% |
폐 | 272 | 7.4% |
가 | 260 | 7.1% |
상 | 259 | 7.0% |
임 | 170 | 4.6% |
게 | 170 | 4.6% |
파 | 122 | 3.3% |
볼 | 119 | 3.2% |
워 | 118 | 3.2% |
) | 109 | 3.0% |
Other values (126) | 1803 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3295 | |
Uppercase Letter | 131 | 3.6% |
Close Punctuation | 109 | 3.0% |
Open Punctuation | 109 | 3.0% |
Space Separator | 28 | 0.8% |
Lowercase Letter | 3 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
화 | 273 | 8.3% |
폐 | 272 | 8.3% |
가 | 260 | 7.9% |
상 | 259 | 7.9% |
임 | 170 | 5.2% |
게 | 170 | 5.2% |
파 | 122 | 3.7% |
볼 | 119 | 3.6% |
워 | 118 | 3.6% |
트 | 78 | 2.4% |
Other values (114) | 1454 |
Uppercase Letter
Value | Count | Frequency (%) |
F | 61 | |
X | 61 | |
G | 3 | 2.3% |
P | 2 | 1.5% |
M | 2 | 1.5% |
R | 2 | 1.5% |
Lowercase Letter
Value | Count | Frequency (%) |
m | 1 | |
j | 1 | |
w | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 109 |
Open Punctuation
Value | Count | Frequency (%) |
( | 109 |
Space Separator
Value | Count | Frequency (%) |
28 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3295 | |
Common | 246 | 6.7% |
Latin | 134 | 3.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
화 | 273 | 8.3% |
폐 | 272 | 8.3% |
가 | 260 | 7.9% |
상 | 259 | 7.9% |
임 | 170 | 5.2% |
게 | 170 | 5.2% |
파 | 122 | 3.7% |
볼 | 119 | 3.6% |
워 | 118 | 3.6% |
트 | 78 | 2.4% |
Other values (114) | 1454 |
Latin
Value | Count | Frequency (%) |
F | 61 | |
X | 61 | |
G | 3 | 2.2% |
P | 2 | 1.5% |
M | 2 | 1.5% |
R | 2 | 1.5% |
m | 1 | 0.7% |
j | 1 | 0.7% |
w | 1 | 0.7% |
Common
Value | Count | Frequency (%) |
) | 109 | |
( | 109 | |
28 | 11.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3295 | |
ASCII | 380 | 10.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
화 | 273 | 8.3% |
폐 | 272 | 8.3% |
가 | 260 | 7.9% |
상 | 259 | 7.9% |
임 | 170 | 5.2% |
게 | 170 | 5.2% |
파 | 122 | 3.7% |
볼 | 119 | 3.6% |
워 | 118 | 3.6% |
트 | 78 | 2.4% |
Other values (114) | 1454 |
ASCII
Value | Count | Frequency (%) |
) | 109 | |
( | 109 | |
F | 61 | |
X | 61 | |
28 | 7.4% | |
G | 3 | 0.8% |
P | 2 | 0.5% |
M | 2 | 0.5% |
R | 2 | 0.5% |
m | 1 | 0.3% |
Other values (2) | 2 | 0.5% |
온오프라인 여부
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.4 KiB |
온라인 | |
---|---|
<NA> | |
오프라인 | 492 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.2810211 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 온라인 |
5th row | 온라인 |
Common Values
Value | Count | Frequency (%) |
온라인 | 6281 | |
<NA> | 1963 | 22.5% |
오프라인 | 492 | 5.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
온라인 | 6281 | |
na | 1963 | 22.5% |
오프라인 | 492 | 5.6% |
합불법 여부
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.4 KiB |
불법 | |
---|---|
<NA> | |
합법 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.4494048 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 불법 |
5th row | 불법 |
Common Values
Value | Count | Frequency (%) |
불법 | 5564 | |
<NA> | 1963 | 22.5% |
합법 | 1209 | 13.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
불법 | 5564 | |
na | 1963 | 22.5% |
합법 | 1209 | 13.8% |
순번 | 성별 | 연령대 | 지역 | 도박자와의 관계 | 1차 도박 유형 | 기타 | 온오프라인 여부 | 합불법 여부 | |
---|---|---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.049 | 0.039 | 0.139 | 0.000 | 0.112 | 0.405 | 0.064 | 0.089 |
성별 | 0.049 | 1.000 | 0.579 | 0.144 | 0.938 | 0.275 | 0.275 | 0.191 | 0.164 |
연령대 | 0.039 | 0.579 | 1.000 | 0.157 | 0.635 | 0.380 | 0.608 | 0.579 | 0.415 |
지역 | 0.139 | 0.144 | 0.157 | 1.000 | 0.136 | 0.138 | 0.357 | 0.196 | 0.180 |
도박자와의 관계 | 0.000 | 0.938 | 0.635 | 0.136 | 1.000 | NaN | NaN | NaN | NaN |
1차 도박 유형 | 0.112 | 0.275 | 0.380 | 0.138 | NaN | 1.000 | 1.000 | 0.559 | 0.822 |
기타 | 0.405 | 0.275 | 0.608 | 0.357 | NaN | 1.000 | 1.000 | 0.943 | 0.746 |
온오프라인 여부 | 0.064 | 0.191 | 0.579 | 0.196 | NaN | 0.559 | 0.943 | 1.000 | 0.419 |
합불법 여부 | 0.089 | 0.164 | 0.415 | 0.180 | NaN | 0.822 | 0.746 | 0.419 | 1.000 |
도박자와의 관계 | 합불법 여부 | 성별 | 온오프라인 여부 | 지역 | 1차 도박 유형 | 연령대 | |
---|---|---|---|---|---|---|---|
도박자와의 관계 | 1.000 | 1.000 | 0.783 | 1.000 | 0.057 | 1.000 | 0.258 |
합불법 여부 | 1.000 | 1.000 | 0.105 | 0.276 | 0.141 | 0.669 | 0.312 |
성별 | 0.783 | 0.105 | 1.000 | 0.122 | 0.113 | 0.215 | 0.437 |
온오프라인 여부 | 1.000 | 0.276 | 0.122 | 1.000 | 0.154 | 0.440 | 0.438 |
지역 | 0.057 | 0.141 | 0.113 | 0.154 | 1.000 | 0.047 | 0.066 |
1차 도박 유형 | 1.000 | 0.669 | 0.215 | 0.440 | 0.047 | 1.000 | 0.178 |
연령대 | 0.258 | 0.312 | 0.437 | 0.438 | 0.066 | 0.178 | 1.000 |
순번 | 성별 | 연령대 | 지역 | 도박자와의 관계 | 1차 도박 유형 | 온오프라인 여부 | 합불법 여부 | |
---|---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.038 | 0.019 | 0.053 | 0.000 | 0.045 | 0.049 | 0.068 |
성별 | 0.038 | 1.000 | 0.437 | 0.113 | 0.783 | 0.215 | 0.122 | 0.105 |
연령대 | 0.019 | 0.437 | 1.000 | 0.066 | 0.258 | 0.178 | 0.438 | 0.312 |
지역 | 0.053 | 0.113 | 0.066 | 1.000 | 0.057 | 0.047 | 0.154 | 0.141 |
도박자와의 관계 | 0.000 | 0.783 | 0.258 | 0.057 | 1.000 | 1.000 | 1.000 | 1.000 |
1차 도박 유형 | 0.045 | 0.215 | 0.178 | 0.047 | 1.000 | 1.000 | 0.440 | 0.669 |
온오프라인 여부 | 0.049 | 0.122 | 0.438 | 0.154 | 1.000 | 0.440 | 1.000 | 0.276 |
합불법 여부 | 0.068 | 0.105 | 0.312 | 0.141 | 1.000 | 0.669 | 0.276 | 1.000 |
순번 | 성별 | 연령대 | 지역 | 도박자와의 관계 | 1차 도박 유형 | 기타 | 온오프라인 여부 | 합불법 여부 | |
---|---|---|---|---|---|---|---|---|---|
0 | 1 | 남 | 60대 | 제주 | 부모 | <NA> | <NA> | <NA> | <NA> |
1 | 2 | 여 | 40대 | 경기 | 배우자 | <NA> | <NA> | <NA> | <NA> |
2 | 3 | 남 | 60대 | 광주 | 부모 | <NA> | <NA> | <NA> | <NA> |
3 | 4 | 남 | 30대 | 광주 | 본인 | 복권 | 파워볼 | 온라인 | 불법 |
4 | 5 | 남 | 40대 | 경북 | 본인 | 카지노 | <NA> | 온라인 | 불법 |
5 | 6 | 남 | 20대 | 경기 | 본인 | 미니게임/사다리게임 | <NA> | 온라인 | 불법 |
6 | 7 | 남 | 20대 | 경북 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
7 | 8 | 남 | 30대 | 경기 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8 | 9 | 남 | 30대 | 경기 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
9 | 10 | 여 | 20대 | 경남 | 지인 | <NA> | <NA> | <NA> | <NA> |
순번 | 성별 | 연령대 | 지역 | 도박자와의 관계 | 1차 도박 유형 | 기타 | 온오프라인 여부 | 합불법 여부 | |
---|---|---|---|---|---|---|---|---|---|
8726 | 8727 | 남 | 70대 | 강원 | 본인 | 화투 | <NA> | 오프라인 | 불법 |
8727 | 8728 | 남 | 20대 | 서울 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8728 | 8729 | 남 | 30대 | 서울 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8729 | 8730 | 남 | 30대 | 서울 | 본인 | 미니게임/사다리게임 | <NA> | 온라인 | 불법 |
8730 | 8731 | 남 | 40대 | 서울 | 본인 | 기타 | <NA> | 온라인 | 불법 |
8731 | 8732 | 여 | 30대 | 서울 | 배우자 | <NA> | <NA> | <NA> | <NA> |
8732 | 8733 | 남 | 30대 | 경기 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8733 | 8734 | 남 | 30대 | 경기 | 본인 | 카드 | <NA> | 온라인 | 불법 |
8734 | 8735 | 남 | 20대 | 경기 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8735 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |