Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 330 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 11.1 KiB |
Average record size in memory | 34.4 B |
Variable types
Numeric | 1 |
---|---|
Text | 2 |
Categorical | 1 |
Dataset
Description | 온라인복권 1등(자동선택) 당첨 판매점 현황으로 859~911회차(19.5.18.~20.5.16.) 정보를 제공합니다. 순번, 상호, 지역, 1등 자동 당첨 건수 항목을 제공합니다. |
---|---|
Author | 기획재정부 |
URL | https://www.data.go.kr/data/15059963/fileData.do |
1등 자동 당첨 건수 is highly imbalanced (81.8%) | Imbalance |
순번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 12:30:16.697931 |
---|---|
Analysis finished | 2023-12-12 12:30:17.337137 |
Duration | 0.64 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순번
Real number (ℝ)
UNIQUE
 
Distinct | 330 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 165.5 |
Minimum | 1 |
---|---|
Maximum | 330 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 17.45 |
Q1 | 83.25 |
median | 165.5 |
Q3 | 247.75 |
95-th percentile | 313.55 |
Maximum | 330 |
Range | 329 |
Interquartile range (IQR) | 164.5 |
Descriptive statistics
Standard deviation | 95.407023 |
---|---|
Coefficient of variation (CV) | 0.57647748 |
Kurtosis | -1.2 |
Mean | 165.5 |
Median Absolute Deviation (MAD) | 82.5 |
Skewness | 0 |
Sum | 54615 |
Variance | 9102.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.3% |
228 | 1 | 0.3% |
226 | 1 | 0.3% |
225 | 1 | 0.3% |
224 | 1 | 0.3% |
223 | 1 | 0.3% |
222 | 1 | 0.3% |
221 | 1 | 0.3% |
220 | 1 | 0.3% |
219 | 1 | 0.3% |
Other values (320) | 320 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
330 | 1 | |
329 | 1 | |
328 | 1 | |
327 | 1 | |
326 | 1 | |
325 | 1 | |
324 | 1 | |
323 | 1 | |
322 | 1 | |
321 | 1 |
상호
Text
Distinct | 299 |
---|---|
Distinct (%) | 90.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
Value | Count | Frequency (%) |
행운복권방 | 6 | 1.7% |
로또복권 | 5 | 1.4% |
노다지복권방 | 5 | 1.4% |
복권명당 | 3 | 0.8% |
가판점 | 3 | 0.8% |
복권방 | 3 | 0.8% |
가로판매점 | 2 | 0.6% |
복권판매점 | 2 | 0.6% |
픽미 | 2 | 0.6% |
복권 | 2 | 0.6% |
Other values (307) | 321 |
Most occurring characters
Value | Count | Frequency (%) |
복 | 128 | 6.4% |
권 | 119 | 6.0% |
점 | 88 | 4.4% |
로 | 68 | 3.4% |
또 | 62 | 3.1% |
방 | 59 | 3.0% |
대 | 38 | 1.9% |
판 | 32 | 1.6% |
) | 30 | 1.5% |
( | 30 | 1.5% |
Other values (304) | 1343 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1792 | |
Decimal Number | 59 | 3.0% |
Uppercase Letter | 47 | 2.4% |
Close Punctuation | 30 | 1.5% |
Open Punctuation | 30 | 1.5% |
Space Separator | 24 | 1.2% |
Lowercase Letter | 10 | 0.5% |
Dash Punctuation | 2 | 0.1% |
Other Symbol | 1 | 0.1% |
Math Symbol | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
복 | 128 | 7.1% |
권 | 119 | 6.6% |
점 | 88 | 4.9% |
로 | 68 | 3.8% |
또 | 62 | 3.5% |
방 | 59 | 3.3% |
대 | 38 | 2.1% |
판 | 32 | 1.8% |
스 | 29 | 1.6% |
당 | 26 | 1.5% |
Other values (272) | 1143 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 13 | |
G | 12 | |
C | 5 | 10.6% |
U | 5 | 10.6% |
A | 4 | 8.5% |
L | 3 | 6.4% |
W | 1 | 2.1% |
Y | 1 | 2.1% |
M | 1 | 2.1% |
R | 1 | 2.1% |
Decimal Number
Value | Count | Frequency (%) |
2 | 25 | |
5 | 14 | |
4 | 11 | |
1 | 4 | 6.8% |
7 | 2 | 3.4% |
0 | 1 | 1.7% |
9 | 1 | 1.7% |
6 | 1 | 1.7% |
Lowercase Letter
Value | Count | Frequency (%) |
o | 3 | |
t | 3 | |
l | 1 | 10.0% |
g | 1 | 10.0% |
s | 1 | 10.0% |
e | 1 | 10.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 30 |
Open Punctuation
Value | Count | Frequency (%) |
( | 30 |
Space Separator
Value | Count | Frequency (%) |
24 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1793 | |
Common | 147 | 7.4% |
Latin | 57 | 2.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
복 | 128 | 7.1% |
권 | 119 | 6.6% |
점 | 88 | 4.9% |
로 | 68 | 3.8% |
또 | 62 | 3.5% |
방 | 59 | 3.3% |
대 | 38 | 2.1% |
판 | 32 | 1.8% |
스 | 29 | 1.6% |
당 | 26 | 1.5% |
Other values (273) | 1144 |
Latin
Value | Count | Frequency (%) |
S | 13 | |
G | 12 | |
C | 5 | 8.8% |
U | 5 | 8.8% |
A | 4 | 7.0% |
o | 3 | 5.3% |
t | 3 | 5.3% |
L | 3 | 5.3% |
l | 1 | 1.8% |
W | 1 | 1.8% |
Other values (7) | 7 |
Common
Value | Count | Frequency (%) |
) | 30 | |
( | 30 | |
2 | 25 | |
24 | ||
5 | 14 | |
4 | 11 | 7.5% |
1 | 4 | 2.7% |
- | 2 | 1.4% |
7 | 2 | 1.4% |
+ | 1 | 0.7% |
Other values (4) | 4 | 2.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1792 | |
ASCII | 204 | 10.2% |
None | 1 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
복 | 128 | 7.1% |
권 | 119 | 6.6% |
점 | 88 | 4.9% |
로 | 68 | 3.8% |
또 | 62 | 3.5% |
방 | 59 | 3.3% |
대 | 38 | 2.1% |
판 | 32 | 1.8% |
스 | 29 | 1.6% |
당 | 26 | 1.5% |
Other values (272) | 1143 |
ASCII
Value | Count | Frequency (%) |
) | 30 | |
( | 30 | |
2 | 25 | |
24 | ||
5 | 14 | 6.9% |
S | 13 | 6.4% |
G | 12 | 5.9% |
4 | 11 | 5.4% |
C | 5 | 2.5% |
U | 5 | 2.5% |
Other values (21) | 35 |
None
Value | Count | Frequency (%) |
㈜ | 1 |
지역
Text
Distinct | 139 |
---|---|
Distinct (%) | 42.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
Value | Count | Frequency (%) |
경기 | 83 | 12.7% |
서울 | 62 | 9.5% |
부산 | 22 | 3.4% |
경남 | 21 | 3.2% |
인천 | 19 | 2.9% |
충남 | 14 | 2.1% |
광주 | 13 | 2.0% |
전남 | 13 | 2.0% |
충북 | 13 | 2.0% |
강원 | 13 | 2.0% |
Other values (130) | 383 |
Most occurring characters
Value | Count | Frequency (%) |
326 | ||
구 | 164 | 8.4% |
시 | 163 | 8.4% |
경 | 116 | 6.0% |
서 | 91 | 4.7% |
기 | 83 | 4.3% |
울 | 70 | 3.6% |
남 | 60 | 3.1% |
산 | 50 | 2.6% |
천 | 49 | 2.5% |
Other values (97) | 776 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1622 | |
Space Separator | 326 | 16.7% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 164 | 10.1% |
시 | 163 | 10.0% |
경 | 116 | 7.2% |
서 | 91 | 5.6% |
기 | 83 | 5.1% |
울 | 70 | 4.3% |
남 | 60 | 3.7% |
산 | 50 | 3.1% |
천 | 49 | 3.0% |
북 | 45 | 2.8% |
Other values (96) | 731 |
Space Separator
Value | Count | Frequency (%) |
326 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1622 | |
Common | 326 | 16.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 164 | 10.1% |
시 | 163 | 10.0% |
경 | 116 | 7.2% |
서 | 91 | 5.6% |
기 | 83 | 5.1% |
울 | 70 | 4.3% |
남 | 60 | 3.7% |
산 | 50 | 3.1% |
천 | 49 | 3.0% |
북 | 45 | 2.8% |
Other values (96) | 731 |
Common
Value | Count | Frequency (%) |
326 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1622 | |
ASCII | 326 | 16.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
326 |
Hangul
Value | Count | Frequency (%) |
구 | 164 | 10.1% |
시 | 163 | 10.0% |
경 | 116 | 7.2% |
서 | 91 | 5.6% |
기 | 83 | 5.1% |
울 | 70 | 4.3% |
남 | 60 | 3.7% |
산 | 50 | 3.1% |
천 | 49 | 3.0% |
북 | 45 | 2.8% |
Other values (96) | 731 |
1등 자동 당첨 건수
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
1 | |
---|---|
2 | 18 |
5 | 1 |
3 | 1 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | 5 |
---|---|
2nd row | 3 |
3rd row | 2 |
4th row | 2 |
5th row | 2 |
Common Values
Value | Count | Frequency (%) |
1 | 310 | |
2 | 18 | 5.5% |
5 | 1 | 0.3% |
3 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 310 | |
2 | 18 | 5.5% |
5 | 1 | 0.3% |
3 | 1 | 0.3% |
순번 | 1등 자동 당첨 건수 | |
---|---|---|
순번 | 1.000 | 0.610 |
1등 자동 당첨 건수 | 0.610 | 1.000 |
순번 | 1등 자동 당첨 건수 | |
---|---|---|
순번 | 1.000 | 0.410 |
1등 자동 당첨 건수 | 0.410 | 1.000 |
순번 | 상호 | 지역 | 1등 자동 당첨 건수 | |
---|---|---|---|---|
0 | 1 | 일등복권편의점 | 대구 달서구 | 5 |
1 | 2 | 오케이상사 | 서울 서초구 | 3 |
2 | 3 | 세진전자통신 | 대구 서구 | 2 |
3 | 4 | 라이프마트 | 인천 중구 | 2 |
4 | 5 | 스파 | 서울 노원구 | 2 |
5 | 6 | 노다지복권방 | 인천 미추홀구 | 2 |
6 | 7 | 흥부네박터졌네 | 인천 계양구 | 2 |
7 | 8 | 오천억복권방 | 광주 서구 | 2 |
8 | 9 | 해피+24시편의점 | 광주 북구 | 2 |
9 | 10 | 토큰박스 | 경기 남양주시 | 2 |
순번 | 상호 | 지역 | 1등 자동 당첨 건수 | |
---|---|---|---|---|
320 | 321 | GS25(수영광안점) | 부산 수영구 | 1 |
321 | 322 | CU(입석강변점) | 대구 동구 | 1 |
322 | 323 | 씨스페이스(주안1-2) | 인천 미추홀구 | 1 |
323 | 324 | GS25(계산동경점) | 인천 계양구 | 1 |
324 | 325 | GS25(인천관교점) | 인천 미추홀구 | 1 |
325 | 326 | GS25(수원행복점) | 경기 수원시 | 1 |
326 | 327 | CU(강릉내곡점) | 강원 강릉시 | 1 |
327 | 328 | GS25(청주수곡점) | 충북 청주시 | 1 |
328 | 329 | GS25(천안시민점) | 충남 천안시 | 1 |
329 | 330 | GS25(양산혜인점) | 경남 양산시 | 1 |