Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 30 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.4 KiB |
Average record size in memory | 82.4 B |
Variable types
Numeric | 4 |
---|---|
Categorical | 4 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 경기도경제과학진흥원 |
URL | https://bigdata-region.kr/#/dataset/6b2fa631-41dd-4320-afa2-fe012e0bea1a |
법정동코드 has constant value "" | Constant |
우편번호 has constant value "" | Constant |
용도지역명 has constant value "" | Constant |
분석인덱스 is highly overall correlated with 주용도명 | High correlation |
지역별업종수 is highly overall correlated with 일반결제금액 and 1 other fields | High correlation |
일반결제금액 is highly overall correlated with 지역별업종수 and 1 other fields | High correlation |
정책결제금액 is highly overall correlated with 지역별업종수 and 1 other fields | High correlation |
주용도명 is highly overall correlated with 분석인덱스 | High correlation |
주용도명 is highly imbalanced (53.1%) | Imbalance |
분석인덱스 has unique values | Unique |
분석인덱스 has 1 (3.3%) zeros | Zeros |
일반결제금액 has 13 (43.3%) zeros | Zeros |
정책결제금액 has 9 (30.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 14:18:03.416586 |
---|---|
Analysis finished | 2023-12-10 14:18:06.093842 |
Duration | 2.68 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
분석인덱스
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
  ZEROS
 
Distinct | 30 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 14.5 |
Minimum | 0 |
---|---|
Maximum | 29 |
Zeros | 1 |
Zeros (%) | 3.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 1.45 |
Q1 | 7.25 |
median | 14.5 |
Q3 | 21.75 |
95-th percentile | 27.55 |
Maximum | 29 |
Range | 29 |
Interquartile range (IQR) | 14.5 |
Descriptive statistics
Standard deviation | 8.8034084 |
---|---|
Coefficient of variation (CV) | 0.60713162 |
Kurtosis | -1.2 |
Mean | 14.5 |
Median Absolute Deviation (MAD) | 7.5 |
Skewness | 0 |
Sum | 435 |
Variance | 77.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
0 | 1 | 3.3% |
16 | 1 | 3.3% |
29 | 1 | 3.3% |
28 | 1 | 3.3% |
27 | 1 | 3.3% |
26 | 1 | 3.3% |
25 | 1 | 3.3% |
24 | 1 | 3.3% |
23 | 1 | 3.3% |
22 | 1 | 3.3% |
Other values (20) | 20 |
Value | Count | Frequency (%) |
0 | 1 | |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 |
Value | Count | Frequency (%) |
29 | 1 | |
28 | 1 | |
27 | 1 | |
26 | 1 | |
25 | 1 | |
24 | 1 | |
23 | 1 | |
22 | 1 | |
21 | 1 | |
20 | 1 |
법정동코드
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
4182025021 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 4182025021 |
---|---|
2nd row | 4182025021 |
3rd row | 4182025021 |
4th row | 4182025021 |
5th row | 4182025021 |
Common Values
Value | Count | Frequency (%) |
4182025021 | 30 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
4182025021 | 30 |
우편번호
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
12413 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 12413 |
---|---|
2nd row | 12413 |
3rd row | 12413 |
4th row | 12413 |
5th row | 12413 |
Common Values
Value | Count | Frequency (%) |
12413 | 30 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
12413 | 30 |
용도지역명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
일반상업지역 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 일반상업지역 |
---|---|
2nd row | 일반상업지역 |
3rd row | 일반상업지역 |
4th row | 일반상업지역 |
5th row | 일반상업지역 |
Common Values
Value | Count | Frequency (%) |
일반상업지역 | 30 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반상업지역 | 30 |
주용도명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 6.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
제1종근린생활시설 | |
---|---|
제2종근린생활시설 |
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 제1종근린생활시설 |
---|---|
2nd row | 제1종근린생활시설 |
3rd row | 제1종근린생활시설 |
4th row | 제1종근린생활시설 |
5th row | 제1종근린생활시설 |
Common Values
Value | Count | Frequency (%) |
제1종근린생활시설 | 27 | |
제2종근린생활시설 | 3 | 10.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
제1종근린생활시설 | 27 | |
제2종근린생활시설 | 3 | 10.0% |
가맹점업종명
Text
Distinct | 27 |
---|---|
Distinct (%) | 90.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 372.0 B |
Value | Count | Frequency (%) |
건강식품 | 2 | 6.1% |
기타 | 2 | 6.1% |
건축자재 | 2 | 6.1% |
연료판매점 | 1 | 3.0% |
영리 | 1 | 3.0% |
유통업 | 1 | 3.0% |
학원 | 1 | 3.0% |
직물 | 1 | 3.0% |
주방용구 | 1 | 3.0% |
전기제품 | 1 | 3.0% |
Other values (20) | 20 |
Most occurring characters
Value | Count | Frequency (%) |
건 | 5 | 4.2% |
기 | 5 | 4.2% |
식 | 4 | 3.3% |
품 | 4 | 3.3% |
자 | 4 | 3.3% |
비 | 3 | 2.5% |
업 | 3 | 2.5% |
료 | 3 | 2.5% |
의 | 3 | 2.5% |
3 | 2.5% | |
Other values (62) | 83 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 116 | |
Space Separator | 3 | 2.5% |
Other Punctuation | 1 | 0.8% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
건 | 5 | 4.3% |
기 | 5 | 4.3% |
식 | 4 | 3.4% |
품 | 4 | 3.4% |
자 | 4 | 3.4% |
비 | 3 | 2.6% |
업 | 3 | 2.6% |
료 | 3 | 2.6% |
의 | 3 | 2.6% |
타 | 3 | 2.6% |
Other values (60) | 79 |
Space Separator
Value | Count | Frequency (%) |
3 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 116 | |
Common | 4 | 3.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
건 | 5 | 4.3% |
기 | 5 | 4.3% |
식 | 4 | 3.4% |
품 | 4 | 3.4% |
자 | 4 | 3.4% |
비 | 3 | 2.6% |
업 | 3 | 2.6% |
료 | 3 | 2.6% |
의 | 3 | 2.6% |
타 | 3 | 2.6% |
Other values (60) | 79 |
Common
Value | Count | Frequency (%) |
3 | ||
. | 1 | 25.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 116 | |
ASCII | 4 | 3.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
건 | 5 | 4.3% |
기 | 5 | 4.3% |
식 | 4 | 3.4% |
품 | 4 | 3.4% |
자 | 4 | 3.4% |
비 | 3 | 2.6% |
업 | 3 | 2.6% |
료 | 3 | 2.6% |
의 | 3 | 2.6% |
타 | 3 | 2.6% |
Other values (60) | 79 |
ASCII
Value | Count | Frequency (%) |
3 | ||
. | 1 | 25.0% |
지역별업종수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 19 |
---|---|
Distinct (%) | 63.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2221.6 |
Minimum | 90 |
---|---|
Maximum | 24079 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 90 |
---|---|
5-th percentile | 338 |
Q1 | 601 |
median | 1014 |
Q3 | 1698 |
95-th percentile | 7180.1 |
Maximum | 24079 |
Range | 23989 |
Interquartile range (IQR) | 1097 |
Descriptive statistics
Standard deviation | 4492.5703 |
---|---|
Coefficient of variation (CV) | 2.0222229 |
Kurtosis | 20.687961 |
Mean | 2221.6 |
Median Absolute Deviation (MAD) | 646 |
Skewness | 4.3640754 |
Sum | 66648 |
Variance | 20183188 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
676 | 6 | |
338 | 5 | |
1352 | 2 | 6.7% |
1014 | 2 | 6.7% |
2090 | 1 | 3.3% |
1074 | 1 | 3.3% |
1412 | 1 | 3.3% |
90 | 1 | 3.3% |
1692 | 1 | 3.3% |
24079 | 1 | 3.3% |
Other values (9) | 9 |
Value | Count | Frequency (%) |
90 | 1 | 3.3% |
338 | 5 | |
398 | 1 | 3.3% |
576 | 1 | 3.3% |
676 | 6 | |
1014 | 2 | 6.7% |
1074 | 1 | 3.3% |
1352 | 2 | 6.7% |
1412 | 1 | 3.3% |
1463 | 1 | 3.3% |
Value | Count | Frequency (%) |
24079 | 1 | |
9134 | 1 | |
4792 | 1 | |
3872 | 1 | |
2090 | 1 | |
2056 | 1 | |
1742 | 1 | |
1700 | 1 | |
1692 | 1 | |
1463 | 1 |
일반결제금액
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 15 |
---|---|
Distinct (%) | 50.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1364006.3 |
Minimum | 0 |
---|---|
Maximum | 23013700 |
Zeros | 13 |
Zeros (%) | 43.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 25000 |
Q3 | 472000 |
95-th percentile | 4207197 |
Maximum | 23013700 |
Range | 23013700 |
Interquartile range (IQR) | 472000 |
Descriptive statistics
Standard deviation | 4264918.2 |
---|---|
Coefficient of variation (CV) | 3.1267584 |
Kurtosis | 24.855274 |
Mean | 1364006.3 |
Median Absolute Deviation (MAD) | 25000 |
Skewness | 4.8326798 |
Sum | 40920190 |
Variance | 1.8189527 × 1013 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 13 | |
280000 | 2 | 6.7% |
30000 | 2 | 6.7% |
20000 | 2 | 6.7% |
69030 | 1 | 3.3% |
937200 | 1 | 3.3% |
1577000 | 1 | 3.3% |
2987200 | 1 | 3.3% |
4203710 | 1 | 3.3% |
4210050 | 1 | 3.3% |
Other values (5) | 5 | 16.7% |
Value | Count | Frequency (%) |
0 | 13 | |
20000 | 2 | 6.7% |
30000 | 2 | 6.7% |
69030 | 1 | 3.3% |
158000 | 1 | 3.3% |
230000 | 1 | 3.3% |
280000 | 2 | 6.7% |
536000 | 1 | 3.3% |
937200 | 1 | 3.3% |
1577000 | 1 | 3.3% |
Value | Count | Frequency (%) |
23013700 | 1 | |
4210050 | 1 | |
4203710 | 1 | |
2987200 | 1 | |
2338300 | 1 | |
1577000 | 1 | |
937200 | 1 | |
536000 | 1 | |
280000 | 2 | |
230000 | 1 |
정책결제금액
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 19 |
---|---|
Distinct (%) | 63.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4507860.7 |
Minimum | 0 |
---|---|
Maximum | 68985530 |
Zeros | 9 |
Zeros (%) | 30.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 402.0 B |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 80400 |
Q3 | 1806000 |
95-th percentile | 16903600 |
Maximum | 68985530 |
Range | 68985530 |
Interquartile range (IQR) | 1806000 |
Descriptive statistics
Standard deviation | 13028324 |
---|---|
Coefficient of variation (CV) | 2.8901347 |
Kurtosis | 22.19194 |
Mean | 4507860.7 |
Median Absolute Deviation (MAD) | 80400 |
Skewness | 4.5129892 |
Sum | 1.3523582 × 108 |
Variance | 1.6973724 × 1014 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 9 | |
40000 | 2 | 6.7% |
108400 | 2 | 6.7% |
75800 | 2 | 6.7% |
16519090 | 1 | 3.3% |
470000 | 1 | 3.3% |
144600 | 1 | 3.3% |
1811000 | 1 | 3.3% |
68985530 | 1 | 3.3% |
6902800 | 1 | 3.3% |
Other values (9) | 9 |
Value | Count | Frequency (%) |
0 | 9 | |
10000 | 1 | 3.3% |
19210 | 1 | 3.3% |
40000 | 2 | 6.7% |
75800 | 2 | 6.7% |
85000 | 1 | 3.3% |
108400 | 2 | 6.7% |
144600 | 1 | 3.3% |
470000 | 1 | 3.3% |
1161700 | 1 | 3.3% |
Value | Count | Frequency (%) |
68985530 | 1 | |
17218200 | 1 | |
16519090 | 1 | |
8451450 | 1 | |
8210240 | 1 | |
6902800 | 1 | |
3007600 | 1 | |
1811000 | 1 | |
1791000 | 1 | |
1161700 | 1 |
분석인덱스 | 주용도명 | 가맹점업종명 | 지역별업종수 | 일반결제금액 | 정책결제금액 | |
---|---|---|---|---|---|---|
분석인덱스 | 1.000 | 1.000 | 0.771 | 0.000 | 0.482 | 0.586 |
주용도명 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
가맹점업종명 | 0.771 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 |
지역별업종수 | 0.000 | 0.000 | 1.000 | 1.000 | 0.672 | 0.940 |
일반결제금액 | 0.482 | 0.000 | 1.000 | 0.672 | 1.000 | 0.871 |
정책결제금액 | 0.586 | 0.000 | 1.000 | 0.940 | 0.871 | 1.000 |
분석인덱스 | 지역별업종수 | 일반결제금액 | 정책결제금액 | 주용도명 | |
---|---|---|---|---|---|
분석인덱스 | 1.000 | 0.001 | -0.028 | -0.000 | 0.845 |
지역별업종수 | 0.001 | 1.000 | 0.666 | 0.755 | 0.000 |
일반결제금액 | -0.028 | 0.666 | 1.000 | 0.831 | 0.000 |
정책결제금액 | -0.000 | 0.755 | 0.831 | 1.000 | 0.000 |
주용도명 | 0.845 | 0.000 | 0.000 | 0.000 | 1.000 |
분석인덱스 | 법정동코드 | 우편번호 | 용도지역명 | 주용도명 | 가맹점업종명 | 지역별업종수 | 일반결제금액 | 정책결제금액 | |
---|---|---|---|---|---|---|---|---|---|
0 | 0 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 건강식품 | 1352 | 280000 | 40000 |
1 | 1 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 건축자재 | 676 | 30000 | 75800 |
2 | 2 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 기타 | 676 | 20000 | 108400 |
3 | 3 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 기타의료기관 | 338 | 69030 | 19210 |
4 | 4 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 레저업소 | 1700 | 937200 | 3007600 |
5 | 5 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 문화.취미 | 1014 | 0 | 0 |
6 | 6 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 보건위생 | 9134 | 1577000 | 8451450 |
7 | 7 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 사무통신 | 576 | 0 | 1161700 |
8 | 8 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 수리서비스 | 676 | 0 | 10000 |
9 | 9 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 숙박업 | 338 | 0 | 0 |
분석인덱스 | 법정동코드 | 우편번호 | 용도지역명 | 주용도명 | 가맹점업종명 | 지역별업종수 | 일반결제금액 | 정책결제금액 | |
---|---|---|---|---|---|---|---|---|---|
20 | 20 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 자동차정비 유지 | 1692 | 536000 | 1811000 |
21 | 21 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 자동차판매 | 338 | 0 | 0 |
22 | 22 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 전기제품 | 90 | 0 | 0 |
23 | 23 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 주방용구 | 338 | 0 | 0 |
24 | 24 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 직물 | 1412 | 0 | 144600 |
25 | 25 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 학원 | 1074 | 0 | 0 |
26 | 26 | 4182025021 | 12413 | 일반상업지역 | 제1종근린생활시설 | 회원제형태 | 676 | 230000 | 470000 |
27 | 27 | 4182025021 | 12413 | 일반상업지역 | 제2종근린생활시설 | 건강식품 | 1352 | 280000 | 40000 |
28 | 28 | 4182025021 | 12413 | 일반상업지역 | 제2종근린생활시설 | 건축자재 | 676 | 30000 | 75800 |
29 | 29 | 4182025021 | 12413 | 일반상업지역 | 제2종근린생활시설 | 기타 | 676 | 20000 | 108400 |