Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 6.8 KiB |
Average record size in memory | 69.3 B |
Variable types
Numeric | 4 |
---|---|
Categorical | 4 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 데이터웨이 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=1a23a620-2f04-11ea-bccd-b704c648ae09 |
시도명 has constant value "" | Constant |
행정동명 is highly overall correlated with 행정동코드 and 1 other fields | High correlation |
시군구명 is highly overall correlated with 행정동코드 and 1 other fields | High correlation |
행정동코드 is highly overall correlated with 시군구명 and 1 other fields | High correlation |
시군구명 is highly imbalanced (56.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-10 13:45:08.084475 |
---|---|
Analysis finished | 2023-12-10 13:45:12.705144 |
Duration | 4.62 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
행정동코드
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 12.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.1116291 × 109 |
Minimum | 1.111053 × 109 |
---|---|
Maximum | 1.117063 × 109 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 1.111053 × 109 |
---|---|
5-th percentile | 1.111053 × 109 |
Q1 | 1.111057 × 109 |
median | 1.1110615 × 109 |
Q3 | 1.1110615 × 109 |
95-th percentile | 1.1170511 × 109 |
Maximum | 1.117063 × 109 |
Range | 6010000 |
Interquartile range (IQR) | 4500 |
Descriptive statistics
Standard deviation | 1578553.2 |
---|---|
Coefficient of variation (CV) | 0.0014200358 |
Kurtosis | 6.3600086 |
Mean | 1.1116291 × 109 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 2.738921 |
Sum | 1.1116291 × 1011 |
Variance | 2.4918301 × 1012 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
1111061500 | 52 | |
1111053000 | 22 | |
1111057000 | 9 | 9.0% |
1114064500 | 7 | 7.0% |
1117063000 | 3 | 3.0% |
1111055000 | 1 | 1.0% |
1111056000 | 1 | 1.0% |
1111058000 | 1 | 1.0% |
1111065000 | 1 | 1.0% |
1117051000 | 1 | 1.0% |
Other values (2) | 2 | 2.0% |
Value | Count | Frequency (%) |
1111053000 | 22 | |
1111055000 | 1 | 1.0% |
1111056000 | 1 | 1.0% |
1111057000 | 9 | 9.0% |
1111058000 | 1 | 1.0% |
1111061500 | 52 | |
1111065000 | 1 | 1.0% |
1114064500 | 7 | 7.0% |
1117051000 | 1 | 1.0% |
1117053000 | 1 | 1.0% |
Value | Count | Frequency (%) |
1117063000 | 3 | 3.0% |
1117058000 | 1 | 1.0% |
1117053000 | 1 | 1.0% |
1117051000 | 1 | 1.0% |
1114064500 | 7 | 7.0% |
1111065000 | 1 | 1.0% |
1111061500 | 52 | |
1111058000 | 1 | 1.0% |
1111057000 | 9 | 9.0% |
1111056000 | 1 | 1.0% |
시도명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
서울특별시 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 서울특별시 |
3rd row | 서울특별시 |
4th row | 서울특별시 |
5th row | 서울특별시 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 100 |
시군구명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
종로구 | |
---|---|
중구 | 7 |
용산구 | 6 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.93 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 종로구 |
---|---|
2nd row | 종로구 |
3rd row | 종로구 |
4th row | 종로구 |
5th row | 종로구 |
Common Values
Value | Count | Frequency (%) |
종로구 | 87 | |
중구 | 7 | 7.0% |
용산구 | 6 | 6.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
종로구 | 87 | |
중구 | 7 | 7.0% |
용산구 | 6 | 6.0% |
행정동명
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 12.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
종로1.2.3.4가동 | |
---|---|
사직동 | |
무악동 | |
청구동 | |
이촌1동 | 3 |
Other values (7) |
Length
Max length | 11 |
---|---|
Median length | 11 |
Mean length | 7.19 |
Min length | 3 |
Unique
Unique | 7 ? |
---|---|
Unique (%) | 7.0% |
Sample
1st row | 사직동 |
---|---|
2nd row | 사직동 |
3rd row | 사직동 |
4th row | 사직동 |
5th row | 사직동 |
Common Values
Value | Count | Frequency (%) |
종로1.2.3.4가동 | 52 | |
사직동 | 22 | |
무악동 | 9 | 9.0% |
청구동 | 7 | 7.0% |
이촌1동 | 3 | 3.0% |
부암동 | 1 | 1.0% |
평창동 | 1 | 1.0% |
교남동 | 1 | 1.0% |
혜화동 | 1 | 1.0% |
후암동 | 1 | 1.0% |
Other values (2) | 2 | 2.0% |
Length
Value | Count | Frequency (%) |
종로1.2.3.4가동 | 52 | |
사직동 | 22 | |
무악동 | 9 | 9.0% |
청구동 | 7 | 7.0% |
이촌1동 | 3 | 3.0% |
부암동 | 1 | 1.0% |
평창동 | 1 | 1.0% |
교남동 | 1 | 1.0% |
혜화동 | 1 | 1.0% |
후암동 | 1 | 1.0% |
Other values (2) | 2 | 2.0% |
기준일자
Real number (ℝ)
Distinct | 53 |
---|---|
Distinct (%) | 53.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20190918 |
Minimum | 20190801 |
---|---|
Maximum | 20191031 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 20190801 |
---|---|
5-th percentile | 20190809 |
Q1 | 20190823 |
median | 20190921 |
Q3 | 20191011 |
95-th percentile | 20191024 |
Maximum | 20191031 |
Range | 230 |
Interquartile range (IQR) | 188.5 |
Descriptive statistics
Standard deviation | 83.121576 |
---|---|
Coefficient of variation (CV) | 4.1167803 × 10-6 |
Kurtosis | -1.5386196 |
Mean | 20190918 |
Median Absolute Deviation (MAD) | 92.5 |
Skewness | -0.064344993 |
Sum | 2.0190918 × 109 |
Variance | 6909.1964 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20191014 | 8 | 8.0% |
20190814 | 7 | 7.0% |
20190902 | 5 | 5.0% |
20191001 | 4 | 4.0% |
20190925 | 4 | 4.0% |
20190908 | 3 | 3.0% |
20190831 | 3 | 3.0% |
20191013 | 3 | 3.0% |
20191024 | 3 | 3.0% |
20190927 | 3 | 3.0% |
Other values (43) | 57 |
Value | Count | Frequency (%) |
20190801 | 1 | 1.0% |
20190805 | 1 | 1.0% |
20190806 | 2 | 2.0% |
20190807 | 1 | 1.0% |
20190809 | 1 | 1.0% |
20190810 | 2 | 2.0% |
20190811 | 2 | 2.0% |
20190812 | 1 | 1.0% |
20190814 | 7 | |
20190815 | 2 | 2.0% |
Value | Count | Frequency (%) |
20191031 | 1 | 1.0% |
20191029 | 2 | 2.0% |
20191028 | 1 | 1.0% |
20191024 | 3 | 3.0% |
20191022 | 1 | 1.0% |
20191020 | 1 | 1.0% |
20191016 | 2 | 2.0% |
20191015 | 2 | 2.0% |
20191014 | 8 | |
20191013 | 3 | 3.0% |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
F | |
---|---|
M |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | M |
---|---|
2nd row | F |
3rd row | M |
4th row | F |
5th row | M |
Common Values
Value | Count | Frequency (%) |
F | 57 | |
M | 43 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
f | 57 | |
m | 43 |
연령대
Real number (ℝ)
Distinct | 7 |
---|---|
Distinct (%) | 7.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 41.5 |
Minimum | 20 |
---|---|
Maximum | 55 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 20 |
---|---|
5-th percentile | 20 |
Q1 | 40 |
median | 45 |
Q3 | 50 |
95-th percentile | 50 |
Maximum | 55 |
Range | 35 |
Interquartile range (IQR) | 10 |
Descriptive statistics
Standard deviation | 10.624443 |
---|---|
Coefficient of variation (CV) | 0.25601067 |
Kurtosis | 0.25828861 |
Mean | 41.5 |
Median Absolute Deviation (MAD) | 5 |
Skewness | -1.2859509 |
Sum | 4150 |
Variance | 112.87879 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
45 | 47 | |
50 | 22 | |
20 | 17 | 17.0% |
40 | 8 | 8.0% |
55 | 4 | 4.0% |
30 | 1 | 1.0% |
25 | 1 | 1.0% |
Value | Count | Frequency (%) |
20 | 17 | 17.0% |
25 | 1 | 1.0% |
30 | 1 | 1.0% |
40 | 8 | 8.0% |
45 | 47 | |
50 | 22 | |
55 | 4 | 4.0% |
Value | Count | Frequency (%) |
55 | 4 | 4.0% |
50 | 22 | |
45 | 47 | |
40 | 8 | 8.0% |
30 | 1 | 1.0% |
25 | 1 | 1.0% |
20 | 17 | 17.0% |
소비인구(명)
Real number (ℝ)
Distinct | 7 |
---|---|
Distinct (%) | 7.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 28.7 |
Minimum | 22 |
---|---|
Maximum | 66 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 22 |
---|---|
5-th percentile | 22 |
Q1 | 22 |
median | 22 |
Q3 | 30 |
95-th percentile | 52.35 |
Maximum | 66 |
Range | 44 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 9.9650906 |
---|---|
Coefficient of variation (CV) | 0.3472157 |
Kurtosis | 3.6610641 |
Mean | 28.7 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 1.957229 |
Sum | 2870 |
Variance | 99.30303 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
22 | 53 | |
30 | 29 | |
37 | 8 | 8.0% |
59 | 4 | 4.0% |
44 | 3 | 3.0% |
52 | 2 | 2.0% |
66 | 1 | 1.0% |
Value | Count | Frequency (%) |
22 | 53 | |
30 | 29 | |
37 | 8 | 8.0% |
44 | 3 | 3.0% |
52 | 2 | 2.0% |
59 | 4 | 4.0% |
66 | 1 | 1.0% |
Value | Count | Frequency (%) |
66 | 1 | 1.0% |
59 | 4 | 4.0% |
52 | 2 | 2.0% |
44 | 3 | 3.0% |
37 | 8 | 8.0% |
30 | 29 | |
22 | 53 |
행정동코드 | 시군구명 | 행정동명 | 기준일자 | 성별 | 연령대 | 소비인구(명) | |
---|---|---|---|---|---|---|---|
행정동코드 | 1.000 | 1.000 | 1.000 | 0.000 | 0.177 | 0.455 | 0.000 |
시군구명 | 1.000 | 1.000 | 1.000 | 0.000 | 0.148 | 0.415 | 0.000 |
행정동명 | 1.000 | 1.000 | 1.000 | 0.227 | 0.233 | 0.453 | 0.000 |
기준일자 | 0.000 | 0.000 | 0.227 | 1.000 | 0.000 | 0.000 | 0.000 |
성별 | 0.177 | 0.148 | 0.233 | 0.000 | 1.000 | 0.421 | 0.244 |
연령대 | 0.455 | 0.415 | 0.453 | 0.000 | 0.421 | 1.000 | 0.000 |
소비인구(명) | 0.000 | 0.000 | 0.000 | 0.000 | 0.244 | 0.000 | 1.000 |
행정동명 | 시군구명 | 성별 | |
---|---|---|---|
행정동명 | 1.000 | 0.952 | 0.168 |
시군구명 | 0.952 | 1.000 | 0.243 |
성별 | 0.168 | 0.243 | 1.000 |
행정동코드 | 기준일자 | 연령대 | 소비인구(명) | 시군구명 | 행정동명 | 성별 | |
---|---|---|---|---|---|---|---|
행정동코드 | 1.000 | 0.080 | -0.144 | -0.051 | 1.000 | 0.952 | 0.243 |
기준일자 | 0.080 | 1.000 | -0.134 | 0.001 | 0.000 | 0.083 | 0.000 |
연령대 | -0.144 | -0.134 | 1.000 | -0.097 | 0.300 | 0.231 | 0.439 |
소비인구(명) | -0.051 | 0.001 | -0.097 | 1.000 | 0.000 | 0.000 | 0.253 |
시군구명 | 1.000 | 0.000 | 0.300 | 0.000 | 1.000 | 0.952 | 0.243 |
행정동명 | 0.952 | 0.083 | 0.231 | 0.000 | 0.952 | 1.000 | 0.168 |
성별 | 0.243 | 0.000 | 0.439 | 0.253 | 0.243 | 0.168 | 1.000 |
행정동코드 | 시도명 | 시군구명 | 행정동명 | 기준일자 | 성별 | 연령대 | 소비인구(명) | |
---|---|---|---|---|---|---|---|---|
0 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20190908 | M | 50 | 30 |
1 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20190914 | F | 45 | 30 |
2 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20191013 | M | 45 | 30 |
3 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20190811 | F | 45 | 37 |
4 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20191020 | M | 45 | 22 |
5 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20190922 | M | 50 | 22 |
6 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20191012 | F | 45 | 44 |
7 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20190901 | F | 40 | 22 |
8 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20190908 | F | 45 | 52 |
9 | 1111053000 | 서울특별시 | 종로구 | 사직동 | 20190927 | F | 45 | 30 |
행정동코드 | 시도명 | 시군구명 | 행정동명 | 기준일자 | 성별 | 연령대 | 소비인구(명) | |
---|---|---|---|---|---|---|---|---|
90 | 1114064500 | 서울특별시 | 중구 | 청구동 | 20190827 | F | 40 | 30 |
91 | 1114064500 | 서울특별시 | 중구 | 청구동 | 20190812 | F | 45 | 30 |
92 | 1114064500 | 서울특별시 | 중구 | 청구동 | 20190805 | F | 45 | 22 |
93 | 1114064500 | 서울특별시 | 중구 | 청구동 | 20191031 | F | 40 | 37 |
94 | 1117051000 | 서울특별시 | 용산구 | 후암동 | 20191007 | F | 45 | 30 |
95 | 1117053000 | 서울특별시 | 용산구 | 남영동 | 20190809 | F | 50 | 22 |
96 | 1117058000 | 서울특별시 | 용산구 | 효창동 | 20191022 | F | 40 | 22 |
97 | 1117063000 | 서울특별시 | 용산구 | 이촌1동 | 20191029 | F | 45 | 22 |
98 | 1117063000 | 서울특별시 | 용산구 | 이촌1동 | 20190826 | F | 45 | 30 |
99 | 1117063000 | 서울특별시 | 용산구 | 이촌1동 | 20190806 | F | 45 | 22 |