Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 8751 |
Missing cells | 7698 |
Missing cells (%) | 9.8% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 624.0 KiB |
Average record size in memory | 73.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 7 |
Text | 1 |
Dataset
Description | 2022년도 사행산업 또는 불법 사행산업으로 인한 중독 및 도박문제로 예방치유원과 접촉한 내담자들의 인구통계학적 데이터(성별, 지역, 연령대, 도박유형 등) |
---|---|
URL | https://www.data.go.kr/data/15116633/fileData.do |
성별 is highly overall correlated with 도박자와의 관계 | High correlation |
도박자와의 관계 is highly overall correlated with 성별 | High correlation |
1차 도박 유형 is highly overall correlated with 합불법 여부 | High correlation |
합불법 여부 is highly overall correlated with 1차 도박 유형 | High correlation |
도박자와의 관계 is highly imbalanced (61.3%) | Imbalance |
온오프라인 여부 is highly imbalanced (69.8%) | Imbalance |
기타 has 7698 (88.0%) missing values | Missing |
순번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 12:43:16.539215 |
---|---|
Analysis finished | 2023-12-12 12:43:17.939779 |
Duration | 1.4 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
UNIQUE
 
Distinct | 8751 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4376 |
Minimum | 1 |
---|---|
Maximum | 8751 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 77.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 438.5 |
Q1 | 2188.5 |
median | 4376 |
Q3 | 6563.5 |
95-th percentile | 8313.5 |
Maximum | 8751 |
Range | 8750 |
Interquartile range (IQR) | 4375 |
Descriptive statistics
Standard deviation | 2526.3404 |
---|---|
Coefficient of variation (CV) | 0.57731728 |
Kurtosis | -1.2 |
Mean | 4376 |
Median Absolute Deviation (MAD) | 2188 |
Skewness | 0 |
Sum | 38294376 |
Variance | 6382396 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | < 0.1% |
5838 | 1 | < 0.1% |
5832 | 1 | < 0.1% |
5833 | 1 | < 0.1% |
5834 | 1 | < 0.1% |
5835 | 1 | < 0.1% |
5836 | 1 | < 0.1% |
5837 | 1 | < 0.1% |
5839 | 1 | < 0.1% |
5881 | 1 | < 0.1% |
Other values (8741) | 8741 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
8751 | 1 | |
8750 | 1 | |
8749 | 1 | |
8748 | 1 | |
8747 | 1 | |
8746 | 1 | |
8745 | 1 | |
8744 | 1 | |
8743 | 1 | |
8742 | 1 |
성별
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
남 | |
---|---|
여 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 여 |
---|---|
2nd row | 남 |
3rd row | 남 |
4th row | 남 |
5th row | 여 |
Common Values
Value | Count | Frequency (%) |
남 | 6889 | |
여 | 1862 | 21.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 6889 | |
여 | 1862 | 21.3% |
연령대
Categorical
Distinct | 8 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
30대 | |
---|---|
20대 | |
40대 | |
50대 | |
60대 | |
Other values (3) |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 50대 |
---|---|
2nd row | 20대 |
3rd row | 20대 |
4th row | 20대 |
5th row | 30대 |
Common Values
Value | Count | Frequency (%) |
30대 | 2742 | |
20대 | 2164 | |
40대 | 1685 | |
50대 | 1170 | |
60대 | 526 | 6.0% |
10대 | 391 | 4.5% |
70대 | 70 | 0.8% |
80대 | 3 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
30대 | 2742 | |
20대 | 2164 | |
40대 | 1685 | |
50대 | 1170 | |
60대 | 526 | 6.0% |
10대 | 391 | 4.5% |
70대 | 70 | 0.8% |
80대 | 3 | < 0.1% |
지역
Categorical
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
경기 | |
---|---|
서울 | |
부산 | |
인천 | |
충남 | |
Other values (13) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전북 |
---|---|
2nd row | 경남 |
3rd row | 인천 |
4th row | 전남 |
5th row | 전북 |
Common Values
Value | Count | Frequency (%) |
경기 | 2209 | |
서울 | 1086 | |
부산 | 670 | 7.7% |
인천 | 638 | 7.3% |
충남 | 430 | 4.9% |
경북 | 424 | 4.8% |
경남 | 421 | 4.8% |
충북 | 389 | 4.4% |
대구 | 389 | 4.4% |
대전 | 385 | 4.4% |
Other values (8) | 1710 |
Length
Value | Count | Frequency (%) |
경기 | 2209 | |
서울 | 1086 | |
부산 | 670 | 7.7% |
인천 | 638 | 7.3% |
충남 | 430 | 4.9% |
경북 | 424 | 4.8% |
경남 | 421 | 4.8% |
충북 | 389 | 4.4% |
대구 | 389 | 4.4% |
대전 | 385 | 4.4% |
Other values (8) | 1710 |
도박자와의 관계
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
본인 | |
---|---|
부모 | |
배우자 | 529 |
형제자매 | 120 |
자녀 | 54 |
Other values (2) | 40 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0887899 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부모 |
---|---|
2nd row | 본인 |
3rd row | 본인 |
4th row | 본인 |
5th row | 배우자 |
Common Values
Value | Count | Frequency (%) |
본인 | 6815 | |
부모 | 1193 | 13.6% |
배우자 | 529 | 6.0% |
형제자매 | 120 | 1.4% |
자녀 | 54 | 0.6% |
지인 | 32 | 0.4% |
친인척 | 8 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
본인 | 6815 | |
부모 | 1193 | 13.6% |
배우자 | 529 | 6.0% |
형제자매 | 120 | 1.4% |
자녀 | 54 | 0.6% |
지인 | 32 | 0.4% |
친인척 | 8 | 0.1% |
1차 도박 유형
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
스포츠도박 | |
---|---|
기타 | |
카드 | |
주식 | |
미니게임/사다리게임 | |
Other values (9) |
Length
Max length | 10 |
---|---|
Median length | 5 |
Mean length | 4.0417095 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 스포츠도박 |
---|---|
2nd row | 스포츠도박 |
3rd row | 미니게임/사다리게임 |
4th row | 미니게임/사다리게임 |
5th row | 스포츠도박 |
Common Values
Value | Count | Frequency (%) |
스포츠도박 | 3448 | |
기타 | 1232 | 14.1% |
카드 | 1144 | 13.1% |
주식 | 835 | 9.5% |
미니게임/사다리게임 | 823 | 9.4% |
카지노 | 688 | 7.9% |
모름 | 309 | 3.5% |
성인오락 | 124 | 1.4% |
경마 | 58 | 0.7% |
화투 | 37 | 0.4% |
Other values (4) | 53 | 0.6% |
Length
Value | Count | Frequency (%) |
스포츠도박 | 3448 | |
기타 | 1232 | 14.1% |
카드 | 1144 | 13.1% |
주식 | 835 | 9.5% |
미니게임/사다리게임 | 823 | 9.4% |
카지노 | 688 | 7.9% |
모름 | 309 | 3.5% |
성인오락 | 124 | 1.4% |
경마 | 58 | 0.7% |
화투 | 37 | 0.4% |
Other values (4) | 53 | 0.6% |
기타
Text
MISSING
 
Distinct | 168 |
---|---|
Distinct (%) | 16.0% |
Missing | 7698 |
Missing (%) | 88.0% |
Memory size | 68.5 KiB |
Value | Count | Frequency (%) |
가상화폐 | 490 | |
비트코인 | 82 | 7.3% |
파워볼 | 70 | 6.3% |
코인 | 51 | 4.6% |
바카라 | 28 | 2.5% |
해외선물 | 22 | 2.0% |
선물 | 15 | 1.3% |
가상화폐-선물거래 | 13 | 1.2% |
게임 | 13 | 1.2% |
선물옵션 | 13 | 1.2% |
Other values (141) | 321 |
Most occurring characters
Value | Count | Frequency (%) |
가 | 546 | 12.1% |
상 | 546 | 12.1% |
화 | 541 | 12.0% |
폐 | 537 | 11.9% |
인 | 181 | 4.0% |
코 | 157 | 3.5% |
물 | 105 | 2.3% |
선 | 105 | 2.3% |
트 | 86 | 1.9% |
비 | 84 | 1.9% |
Other values (164) | 1626 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4329 | |
Space Separator | 79 | 1.8% |
Dash Punctuation | 27 | 0.6% |
Uppercase Letter | 20 | 0.4% |
Close Punctuation | 19 | 0.4% |
Open Punctuation | 19 | 0.4% |
Lowercase Letter | 10 | 0.2% |
Other Punctuation | 9 | 0.2% |
Decimal Number | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
가 | 546 | 12.6% |
상 | 546 | 12.6% |
화 | 541 | 12.5% |
폐 | 537 | 12.4% |
인 | 181 | 4.2% |
코 | 157 | 3.6% |
물 | 105 | 2.4% |
선 | 105 | 2.4% |
트 | 86 | 2.0% |
비 | 84 | 1.9% |
Other values (144) | 1441 |
Lowercase Letter
Value | Count | Frequency (%) |
x | 3 | |
f | 2 | |
g | 1 | 10.0% |
r | 1 | 10.0% |
a | 1 | 10.0% |
p | 1 | 10.0% |
h | 1 | 10.0% |
Uppercase Letter
Value | Count | Frequency (%) |
F | 8 | |
X | 7 | |
M | 2 | 10.0% |
R | 1 | 5.0% |
P | 1 | 5.0% |
G | 1 | 5.0% |
Other Punctuation
Value | Count | Frequency (%) |
, | 7 | |
' | 2 | 22.2% |
Space Separator
Value | Count | Frequency (%) |
79 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 27 |
Close Punctuation
Value | Count | Frequency (%) |
) | 19 |
Open Punctuation
Value | Count | Frequency (%) |
( | 19 |
Decimal Number
Value | Count | Frequency (%) |
2 | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4329 | |
Common | 155 | 3.4% |
Latin | 30 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
가 | 546 | 12.6% |
상 | 546 | 12.6% |
화 | 541 | 12.5% |
폐 | 537 | 12.4% |
인 | 181 | 4.2% |
코 | 157 | 3.6% |
물 | 105 | 2.4% |
선 | 105 | 2.4% |
트 | 86 | 2.0% |
비 | 84 | 1.9% |
Other values (144) | 1441 |
Latin
Value | Count | Frequency (%) |
F | 8 | |
X | 7 | |
x | 3 | 10.0% |
M | 2 | 6.7% |
f | 2 | 6.7% |
R | 1 | 3.3% |
P | 1 | 3.3% |
G | 1 | 3.3% |
g | 1 | 3.3% |
r | 1 | 3.3% |
Other values (3) | 3 | 10.0% |
Common
Value | Count | Frequency (%) |
79 | ||
- | 27 | 17.4% |
) | 19 | 12.3% |
( | 19 | 12.3% |
, | 7 | 4.5% |
' | 2 | 1.3% |
2 | 2 | 1.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4329 | |
ASCII | 185 | 4.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
가 | 546 | 12.6% |
상 | 546 | 12.6% |
화 | 541 | 12.5% |
폐 | 537 | 12.4% |
인 | 181 | 4.2% |
코 | 157 | 3.6% |
물 | 105 | 2.4% |
선 | 105 | 2.4% |
트 | 86 | 2.0% |
비 | 84 | 1.9% |
Other values (144) | 1441 |
ASCII
Value | Count | Frequency (%) |
79 | ||
- | 27 | 14.6% |
) | 19 | 10.3% |
( | 19 | 10.3% |
F | 8 | 4.3% |
, | 7 | 3.8% |
X | 7 | 3.8% |
x | 3 | 1.6% |
' | 2 | 1.1% |
M | 2 | 1.1% |
Other values (10) | 12 | 6.5% |
온오프라인 여부
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
온라인 | |
---|---|
오프라인 | 585 |
<NA> | 153 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0843332 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 온라인 |
---|---|
2nd row | 온라인 |
3rd row | 온라인 |
4th row | 온라인 |
5th row | 온라인 |
Common Values
Value | Count | Frequency (%) |
온라인 | 8013 | |
오프라인 | 585 | 6.7% |
<NA> | 153 | 1.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
온라인 | 8013 | |
오프라인 | 585 | 6.7% |
na | 153 | 1.7% |
합불법 여부
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 68.5 KiB |
불법 | |
---|---|
합법 | |
<NA> | 156 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.0356531 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 불법 |
---|---|
2nd row | 불법 |
3rd row | 불법 |
4th row | 불법 |
5th row | 불법 |
Common Values
Value | Count | Frequency (%) |
불법 | 7034 | |
합법 | 1561 | 17.8% |
<NA> | 156 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
불법 | 7034 | |
합법 | 1561 | 17.8% |
na | 156 | 1.8% |
순번 | 성별 | 연령대 | 지역 | 도박자와의 관계 | 1차 도박 유형 | 온오프라인 여부 | 합불법 여부 | |
---|---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.051 | 0.074 | 0.092 | 0.050 | 0.059 | 0.033 | 0.050 |
성별 | 0.051 | 1.000 | 0.558 | 0.150 | 0.719 | 0.334 | 0.049 | 0.024 |
연령대 | 0.074 | 0.558 | 1.000 | 0.156 | 0.476 | 0.344 | 0.336 | 0.279 |
지역 | 0.092 | 0.150 | 0.156 | 1.000 | 0.159 | 0.132 | 0.112 | 0.099 |
도박자와의 관계 | 0.050 | 0.719 | 0.476 | 0.159 | 1.000 | 0.439 | 0.129 | 0.105 |
1차 도박 유형 | 0.059 | 0.334 | 0.344 | 0.132 | 0.439 | 1.000 | 0.612 | 0.821 |
온오프라인 여부 | 0.033 | 0.049 | 0.336 | 0.112 | 0.129 | 0.612 | 1.000 | 0.352 |
합불법 여부 | 0.050 | 0.024 | 0.279 | 0.099 | 0.105 | 0.821 | 0.352 | 1.000 |
성별 | 지역 | 연령대 | 합불법 여부 | 1차 도박 유형 | 온오프라인 여부 | 도박자와의 관계 | |
---|---|---|---|---|---|---|---|
성별 | 1.000 | 0.118 | 0.421 | 0.015 | 0.261 | 0.031 | 0.778 |
지역 | 0.118 | 1.000 | 0.066 | 0.078 | 0.045 | 0.088 | 0.071 |
연령대 | 0.421 | 0.066 | 1.000 | 0.209 | 0.159 | 0.252 | 0.279 |
합불법 여부 | 0.015 | 0.078 | 0.209 | 1.000 | 0.668 | 0.229 | 0.112 |
1차 도박 유형 | 0.261 | 0.045 | 0.159 | 0.668 | 1.000 | 0.483 | 0.177 |
온오프라인 여부 | 0.031 | 0.088 | 0.252 | 0.229 | 0.483 | 1.000 | 0.138 |
도박자와의 관계 | 0.778 | 0.071 | 0.279 | 0.112 | 0.177 | 0.138 | 1.000 |
순번 | 성별 | 연령대 | 지역 | 도박자와의 관계 | 1차 도박 유형 | 온오프라인 여부 | 합불법 여부 | |
---|---|---|---|---|---|---|---|---|
순번 | 1.000 | 0.039 | 0.035 | 0.035 | 0.025 | 0.024 | 0.026 | 0.039 |
성별 | 0.039 | 1.000 | 0.421 | 0.118 | 0.778 | 0.261 | 0.031 | 0.015 |
연령대 | 0.035 | 0.421 | 1.000 | 0.066 | 0.279 | 0.159 | 0.252 | 0.209 |
지역 | 0.035 | 0.118 | 0.066 | 1.000 | 0.071 | 0.045 | 0.088 | 0.078 |
도박자와의 관계 | 0.025 | 0.778 | 0.279 | 0.071 | 1.000 | 0.177 | 0.138 | 0.112 |
1차 도박 유형 | 0.024 | 0.261 | 0.159 | 0.045 | 0.177 | 1.000 | 0.483 | 0.668 |
온오프라인 여부 | 0.026 | 0.031 | 0.252 | 0.088 | 0.138 | 0.483 | 1.000 | 0.229 |
합불법 여부 | 0.039 | 0.015 | 0.209 | 0.078 | 0.112 | 0.668 | 0.229 | 1.000 |
순번 | 성별 | 연령대 | 지역 | 도박자와의 관계 | 1차 도박 유형 | 기타 | 온오프라인 여부 | 합불법 여부 | |
---|---|---|---|---|---|---|---|---|---|
0 | 1 | 여 | 50대 | 전북 | 부모 | 스포츠도박 | <NA> | 온라인 | 불법 |
1 | 2 | 남 | 20대 | 경남 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
2 | 3 | 남 | 20대 | 인천 | 본인 | 미니게임/사다리게임 | <NA> | 온라인 | 불법 |
3 | 4 | 남 | 20대 | 전남 | 본인 | 미니게임/사다리게임 | <NA> | 온라인 | 불법 |
4 | 5 | 여 | 30대 | 전북 | 배우자 | 스포츠도박 | <NA> | 온라인 | 불법 |
5 | 6 | 여 | 40대 | 경북 | 배우자 | 기타 | 가상화폐 | 온라인 | 불법 |
6 | 7 | 남 | 10대 | 경남 | 본인 | 미니게임/사다리게임 | <NA> | 온라인 | 불법 |
7 | 8 | 남 | 20대 | 전남 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8 | 9 | 남 | 20대 | 충북 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
9 | 10 | 남 | 50대 | 전북 | 본인 | 카드 | <NA> | 오프라인 | 불법 |
순번 | 성별 | 연령대 | 지역 | 도박자와의 관계 | 1차 도박 유형 | 기타 | 온오프라인 여부 | 합불법 여부 | |
---|---|---|---|---|---|---|---|---|---|
8741 | 8742 | 남 | 50대 | 대구 | 본인 | 성인오락 | <NA> | 온라인 | 불법 |
8742 | 8743 | 남 | 30대 | 서울 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8743 | 8744 | 여 | 50대 | 강원 | 본인 | 기타 | 해외선물 | 온라인 | 불법 |
8744 | 8745 | 남 | 20대 | 경기 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8745 | 8746 | 남 | 20대 | 서울 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8746 | 8747 | 여 | 20대 | 인천 | 자녀 | 스포츠도박 | <NA> | 오프라인 | 합법 |
8747 | 8748 | 남 | 20대 | 전남 | 본인 | 스포츠도박 | <NA> | 온라인 | 불법 |
8748 | 8749 | 남 | 30대 | 부산 | 본인 | 스포츠도박 | <NA> | 오프라인 | 불법 |
8749 | 8750 | 여 | 60대 | 인천 | 본인 | 카지노 | <NA> | 오프라인 | 합법 |
8750 | 8751 | 남 | 40대 | 전북 | 부모 | 카드 | <NA> | 온라인 | 불법 |