Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 669 |
Missing cells | 1338 |
Missing cells (%) | 28.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 39.3 KiB |
Average record size in memory | 60.2 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 3 |
Unsupported | 2 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15241/S/1/datasetView.do |
구분 has constant value "" | Constant |
Unnamed: 5 has 669 (100.0%) missing values | Missing |
성별미수집기간 '19년 말부터 시스템 개편 후 성별 데이터 수집 has 669 (100.0%) missing values | Missing |
Unnamed: 5 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
성별미수집기간 '19년 말부터 시스템 개편 후 성별 데이터 수집 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-05-11 08:55:07.712099 |
---|---|
Analysis finished | 2024-05-11 08:55:10.765765 |
Duration | 3.05 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
가입월
Real number (ℝ)
Distinct | 48 |
---|---|
Distinct (%) | 7.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 202035.88 |
Minimum | 201807 |
---|---|
Maximum | 202206 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.0 KiB |
Quantile statistics
Minimum | 201807 |
---|---|
5-th percentile | 201811 |
Q1 | 202002 |
median | 202010 |
Q3 | 202108 |
95-th percentile | 202204 |
Maximum | 202206 |
Range | 399 |
Interquartile range (IQR) | 106 |
Descriptive statistics
Standard deviation | 107.54739 |
---|---|
Coefficient of variation (CV) | 0.00053231828 |
Kurtosis | -0.53593381 |
Mean | 202035.88 |
Median Absolute Deviation (MAD) | 97 |
Skewness | -0.23161712 |
Sum | 1.35162 × 108 |
Variance | 11566.441 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
202006 | 24 | 3.6% |
202003 | 24 | 3.6% |
202004 | 24 | 3.6% |
202002 | 23 | 3.4% |
202005 | 21 | 3.1% |
202007 | 17 | 2.5% |
202106 | 17 | 2.5% |
202008 | 17 | 2.5% |
202009 | 17 | 2.5% |
202010 | 17 | 2.5% |
Other values (38) | 468 |
Value | Count | Frequency (%) |
201807 | 7 | |
201808 | 7 | |
201809 | 7 | |
201810 | 7 | |
201811 | 7 | |
201812 | 7 | |
201901 | 7 | |
201902 | 7 | |
201903 | 7 | |
201904 | 7 |
Value | Count | Frequency (%) |
202206 | 16 | |
202205 | 16 | |
202204 | 16 | |
202203 | 16 | |
202202 | 16 | |
202201 | 16 | |
202112 | 16 | |
202111 | 16 | |
202110 | 16 | |
202109 | 16 |
구분
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
회원-내국인 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 회원-내국인 |
---|---|
2nd row | 회원-내국인 |
3rd row | 회원-내국인 |
4th row | 회원-내국인 |
5th row | 회원-내국인 |
Common Values
Value | Count | Frequency (%) |
회원-내국인 | 669 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
회원-내국인 | 669 |
연령
Categorical
Distinct | 8 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
~10대 | |
---|---|
20대 | |
30대 | |
40대 | |
50대 | |
Other values (3) |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.2615845 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | ~10대 |
---|---|
2nd row | 20대 |
3rd row | 30대 |
4th row | 40대 |
5th row | 50대 |
Common Values
Value | Count | Frequency (%) |
~10대 | 85 | |
20대 | 85 | |
30대 | 85 | |
40대 | 85 | |
50대 | 85 | |
60대 | 85 | |
70대이상 | 83 | |
기타 | 76 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
10대 | 85 | |
20대 | 85 | |
30대 | 85 | |
40대 | 85 | |
50대 | 85 | |
60대 | 85 | |
70대이상 | 83 | |
기타 | 76 |
성별
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.4 KiB |
F | |
---|---|
M | |
<NA> |
Length
Max length | 4 |
---|---|
Median length | 1 |
Mean length | 1.7219731 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
F | 254 | |
M | 254 | |
<NA> | 161 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
f | 254 | |
m | 254 | |
na | 161 |
신규가입자수
Real number (ℝ)
Distinct | 588 |
---|---|
Distinct (%) | 87.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 5010.9028 |
Minimum | 1 |
---|---|
Maximum | 105677 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 13.4 |
Q1 | 208 |
median | 1444 |
Q3 | 5012 |
95-th percentile | 21673.2 |
Maximum | 105677 |
Range | 105676 |
Interquartile range (IQR) | 4804 |
Descriptive statistics
Standard deviation | 10210.503 |
---|---|
Coefficient of variation (CV) | 2.0376573 |
Kurtosis | 26.873958 |
Mean | 5010.9028 |
Median Absolute Deviation (MAD) | 1407 |
Skewness | 4.4995508 |
Sum | 3352294 |
Variance | 1.0425437 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
23 | 6 | 0.9% |
12 | 6 | 0.9% |
30 | 5 | 0.7% |
6 | 5 | 0.7% |
3 | 4 | 0.6% |
51 | 3 | 0.4% |
131 | 3 | 0.4% |
147 | 3 | 0.4% |
10 | 3 | 0.4% |
27 | 3 | 0.4% |
Other values (578) | 628 |
Value | Count | Frequency (%) |
1 | 2 | 0.3% |
3 | 4 | |
4 | 3 | |
5 | 3 | |
6 | 5 | |
7 | 2 | 0.3% |
8 | 2 | 0.3% |
9 | 1 | 0.1% |
10 | 3 | |
12 | 6 |
Value | Count | Frequency (%) |
105677 | 1 | |
75728 | 1 | |
69038 | 1 | |
66246 | 1 | |
59964 | 1 | |
58945 | 1 | |
58491 | 1 | |
55120 | 1 | |
50779 | 1 | |
42153 | 1 |
Unnamed: 5
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 669 |
---|---|
Missing (%) | 100.0% |
Memory size | 6.0 KiB |
성별미수집기간 '19년 말부터 시스템 개편 후 성별 데이터 수집
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 669 |
---|---|
Missing (%) | 100.0% |
Memory size | 6.0 KiB |
가입월 | 연령 | 성별 | 신규가입자수 | |
---|---|---|---|---|
가입월 | 1.000 | 0.000 | 0.000 | 0.145 |
연령 | 0.000 | 1.000 | 0.000 | 0.322 |
성별 | 0.000 | 0.000 | 1.000 | 0.000 |
신규가입자수 | 0.145 | 0.322 | 0.000 | 1.000 |
성별 | 연령 | |
---|---|---|
성별 | 1.000 | 0.000 |
연령 | 0.000 | 1.000 |
가입월 | 신규가입자수 | 연령 | 성별 | |
---|---|---|---|---|
가입월 | 1.000 | -0.060 | 0.000 | 0.000 |
신규가입자수 | -0.060 | 1.000 | 0.164 | 0.000 |
연령 | 0.000 | 0.164 | 1.000 | 0.000 |
성별 | 0.000 | 0.000 | 0.000 | 1.000 |
가입월 | 구분 | 연령 | 성별 | 신규가입자수 | Unnamed: 5 | 성별미수집기간 '19년 말부터 시스템 개편 후 성별 데이터 수집 | |
---|---|---|---|---|---|---|---|
0 | 201807 | 회원-내국인 | ~10대 | <NA> | 6662 | <NA> | <NA> |
1 | 201807 | 회원-내국인 | 20대 | <NA> | 38729 | <NA> | <NA> |
2 | 201807 | 회원-내국인 | 30대 | <NA> | 11245 | <NA> | <NA> |
3 | 201807 | 회원-내국인 | 40대 | <NA> | 5877 | <NA> | <NA> |
4 | 201807 | 회원-내국인 | 50대 | <NA> | 2332 | <NA> | <NA> |
5 | 201807 | 회원-내국인 | 60대 | <NA> | 456 | <NA> | <NA> |
6 | 201807 | 회원-내국인 | 70대이상 | <NA> | 111 | <NA> | <NA> |
7 | 201808 | 회원-내국인 | ~10대 | <NA> | 6085 | <NA> | <NA> |
8 | 201808 | 회원-내국인 | 20대 | <NA> | 34541 | <NA> | <NA> |
9 | 201808 | 회원-내국인 | 30대 | <NA> | 9206 | <NA> | <NA> |
가입월 | 구분 | 연령 | 성별 | 신규가입자수 | Unnamed: 5 | 성별미수집기간 '19년 말부터 시스템 개편 후 성별 데이터 수집 | |
---|---|---|---|---|---|---|---|
659 | 202206 | 회원-내국인 | 70대이상 | F | 99 | <NA> | <NA> |
660 | 202206 | 회원-내국인 | 기타 | F | 332 | <NA> | <NA> |
661 | 202206 | 회원-내국인 | ~10대 | M | 5012 | <NA> | <NA> |
662 | 202206 | 회원-내국인 | 20대 | M | 13317 | <NA> | <NA> |
663 | 202206 | 회원-내국인 | 30대 | M | 9049 | <NA> | <NA> |
664 | 202206 | 회원-내국인 | 40대 | M | 5856 | <NA> | <NA> |
665 | 202206 | 회원-내국인 | 50대 | M | 3272 | <NA> | <NA> |
666 | 202206 | 회원-내국인 | 60대 | M | 1088 | <NA> | <NA> |
667 | 202206 | 회원-내국인 | 70대이상 | M | 183 | <NA> | <NA> |
668 | 202206 | 회원-내국인 | 기타 | M | 90 | <NA> | <NA> |