Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 500 |
Missing cells | 58 |
Missing cells (%) | 1.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 29.4 KiB |
Average record size in memory | 60.3 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Numeric | 4 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 신한카드 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=318 |
가맹점주소광역시도(SIDO) is highly imbalanced (60.1%) | Imbalance |
가맹점주소시군구(SGG) has 58 (11.6%) missing values | Missing |
Reproduction
Analysis started | 2023-12-10 14:58:52.954675 |
---|---|
Analysis finished | 2023-12-10 14:58:57.193635 |
Duration | 4.24 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
가맹점주소광역시도(SIDO)
Categorical
IMBALANCE
 
Distinct | 16 |
---|---|
Distinct (%) | 3.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
서울 | |
---|---|
경기 | |
강원 | 10 |
인천 | 9 |
부산 | 7 |
Other values (11) |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 서울 |
---|---|
2nd row | 서울 |
3rd row | 서울 |
4th row | 서울 |
5th row | 서울 |
Common Values
Value | Count | Frequency (%) |
서울 | 362 | |
경기 | 72 | 14.4% |
강원 | 10 | 2.0% |
인천 | 9 | 1.8% |
부산 | 7 | 1.4% |
경북 | 6 | 1.2% |
대구 | 6 | 1.2% |
제주 | 5 | 1.0% |
경남 | 5 | 1.0% |
충남 | 5 | 1.0% |
Other values (6) | 13 | 2.6% |
Length
Value | Count | Frequency (%) |
서울 | 362 | |
경기 | 72 | 14.4% |
강원 | 10 | 2.0% |
인천 | 9 | 1.8% |
부산 | 7 | 1.4% |
경북 | 6 | 1.2% |
대구 | 6 | 1.2% |
제주 | 5 | 1.0% |
경남 | 5 | 1.0% |
충남 | 5 | 1.0% |
Other values (6) | 13 | 2.6% |
가맹점주소시군구(SGG)
Text
MISSING
 
Distinct | 53 |
---|---|
Distinct (%) | 12.0% |
Missing | 58 |
Missing (%) | 11.6% |
Memory size | 4.0 KiB |
Value | Count | Frequency (%) |
중구 | 39 | 8.8% |
마포구 | 38 | 8.6% |
강남구 | 29 | 6.6% |
송파구 | 26 | 5.9% |
용산구 | 23 | 5.2% |
서초구 | 18 | 4.1% |
성남시 | 18 | 4.1% |
영등포구 | 17 | 3.8% |
서대문구 | 16 | 3.6% |
동작구 | 14 | 3.2% |
Other values (43) | 204 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 361 | |
시 | 96 | 7.2% |
포 | 57 | 4.3% |
남 | 54 | 4.1% |
중 | 49 | 3.7% |
강 | 49 | 3.7% |
성 | 47 | 3.5% |
서 | 45 | 3.4% |
마 | 38 | 2.9% |
파 | 35 | 2.6% |
Other values (48) | 500 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1331 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 361 | |
시 | 96 | 7.2% |
포 | 57 | 4.3% |
남 | 54 | 4.1% |
중 | 49 | 3.7% |
강 | 49 | 3.7% |
성 | 47 | 3.5% |
서 | 45 | 3.4% |
마 | 38 | 2.9% |
파 | 35 | 2.6% |
Other values (48) | 500 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1331 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 361 | |
시 | 96 | 7.2% |
포 | 57 | 4.3% |
남 | 54 | 4.1% |
중 | 49 | 3.7% |
강 | 49 | 3.7% |
성 | 47 | 3.5% |
서 | 45 | 3.4% |
마 | 38 | 2.9% |
파 | 35 | 2.6% |
Other values (48) | 500 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1331 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 361 | |
시 | 96 | 7.2% |
포 | 57 | 4.3% |
남 | 54 | 4.1% |
중 | 49 | 3.7% |
강 | 49 | 3.7% |
성 | 47 | 3.5% |
서 | 45 | 3.4% |
마 | 38 | 2.9% |
파 | 35 | 2.6% |
Other values (48) | 500 |
업종대분류(UPJONG_CLASS1)
Categorical
Distinct | 14 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.0 KiB |
요식/유흥 | |
---|---|
유통 | |
전자상거래 | |
음/식료품 | |
의료 | |
Other values (9) |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 4.208 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전자상거래 |
---|---|
2nd row | 요식/유흥 |
3rd row | 주유 |
4th row | 의료 |
5th row | 가정생활/서비스 |
Common Values
Value | Count | Frequency (%) |
요식/유흥 | 127 | |
유통 | 116 | |
전자상거래 | 71 | |
음/식료품 | 32 | 6.4% |
의료 | 31 | 6.2% |
주유 | 26 | 5.2% |
가정생활/서비스 | 25 | 5.0% |
스포츠/문화/레저 | 23 | 4.6% |
여행/교통 | 12 | 2.4% |
미용 | 10 | 2.0% |
Other values (4) | 27 | 5.4% |
Length
Value | Count | Frequency (%) |
요식/유흥 | 127 | |
유통 | 116 | |
전자상거래 | 71 | |
음/식료품 | 32 | 6.4% |
의료 | 31 | 6.2% |
주유 | 26 | 5.2% |
가정생활/서비스 | 25 | 5.0% |
스포츠/문화/레저 | 23 | 4.6% |
여행/교통 | 12 | 2.4% |
미용 | 10 | 2.0% |
Other values (4) | 27 | 5.4% |
기준일자(YMD)
Real number (ℝ)
Distinct | 440 |
---|---|
Distinct (%) | 88.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20183077 |
Minimum | 20160101 |
---|---|
Maximum | 20210729 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 20160101 |
---|---|
5-th percentile | 20160321 |
Q1 | 20170324 |
median | 20180762 |
Q3 | 20200310 |
95-th percentile | 20210504 |
Maximum | 20210729 |
Range | 50628 |
Interquartile range (IQR) | 29986 |
Descriptive statistics
Standard deviation | 16729.635 |
---|---|
Coefficient of variation (CV) | 0.00082889419 |
Kurtosis | -1.2265561 |
Mean | 20183077 |
Median Absolute Deviation (MAD) | 10596 |
Skewness | 0.14832841 |
Sum | 1.0091538 × 1010 |
Variance | 2.7988069 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
20160715 | 3 | 0.6% |
20171027 | 3 | 0.6% |
20180901 | 3 | 0.6% |
20170116 | 3 | 0.6% |
20200727 | 3 | 0.6% |
20201021 | 2 | 0.4% |
20190327 | 2 | 0.4% |
20180428 | 2 | 0.4% |
20160705 | 2 | 0.4% |
20180707 | 2 | 0.4% |
Other values (430) | 475 |
Value | Count | Frequency (%) |
20160101 | 1 | |
20160104 | 1 | |
20160109 | 2 | |
20160112 | 1 | |
20160113 | 1 | |
20160131 | 2 | |
20160204 | 2 | |
20160206 | 1 | |
20160208 | 1 | |
20160217 | 1 |
Value | Count | Frequency (%) |
20210729 | 2 | |
20210715 | 1 | |
20210714 | 2 | |
20210710 | 1 | |
20210709 | 1 | |
20210706 | 1 | |
20210705 | 1 | |
20210630 | 1 | |
20210628 | 1 | |
20210621 | 2 |
고객주소집계구별(TOT_REG_CD)
Real number (ℝ)
Distinct | 492 |
---|---|
Distinct (%) | 98.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.1148495 × 1012 |
Minimum | 1.101055 × 1012 |
---|---|
Maximum | 1.125074 × 1012 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 1.101055 × 1012 |
---|---|
5-th percentile | 1.104055 × 1012 |
Q1 | 1.1100538 × 1012 |
median | 1.115059 × 1012 |
Q3 | 1.1210645 × 1012 |
95-th percentile | 1.12408 × 1012 |
Maximum | 1.125074 × 1012 |
Range | 2.4019 × 1010 |
Interquartile range (IQR) | 1.1010763 × 1010 |
Descriptive statistics
Standard deviation | 6.6449191 × 109 |
---|---|
Coefficient of variation (CV) | 0.0059603734 |
Kurtosis | -1.0952925 |
Mean | 1.1148495 × 1012 |
Median Absolute Deviation (MAD) | 5.9950152 × 109 |
Skewness | -0.14973229 |
Sum | 5.5742473 × 1014 |
Variance | 4.415495 × 1019 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1114075010206 | 2 | 0.4% |
1117061010005 | 2 | 0.4% |
1121062020001 | 2 | 0.4% |
1105059010004 | 2 | 0.4% |
1107068020011 | 2 | 0.4% |
1124081022104 | 2 | 0.4% |
1121054010205 | 2 | 0.4% |
1123058010501 | 2 | 0.4% |
1103073030002 | 1 | 0.2% |
1107062080101 | 1 | 0.2% |
Other values (482) | 482 |
Value | Count | Frequency (%) |
1101055020004 | 1 | |
1101056010003 | 1 | |
1101069010001 | 1 | |
1101072010002 | 1 | |
1102060070001 | 1 | |
1102068020005 | 1 | |
1102069030008 | 1 | |
1102070010006 | 1 | |
1102070020003 | 1 | |
1102071020002 | 1 |
Value | Count | Frequency (%) |
1125074020031 | 1 | |
1125073020006 | 1 | |
1125073010801 | 1 | |
1125073010003 | 1 | |
1125067020020 | 1 | |
1125067020001 | 1 | |
1125066020801 | 1 | |
1125065020012 | 1 | |
1125063010004 | 1 | |
1125059010220 | 1 |
카드이용금액계(AMT_CORR)
Real number (ℝ)
Distinct | 349 |
---|---|
Distinct (%) | 69.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 321541.93 |
Minimum | 2515 |
---|---|
Maximum | 6850860 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 2515 |
---|---|
5-th percentile | 14561.85 |
Q1 | 37712.5 |
median | 112295 |
Q3 | 274147.5 |
95-th percentile | 1200892.4 |
Maximum | 6850860 |
Range | 6848345 |
Interquartile range (IQR) | 236435 |
Descriptive statistics
Standard deviation | 707236.83 |
---|---|
Coefficient of variation (CV) | 2.1995167 |
Kurtosis | 38.225801 |
Mean | 321541.93 |
Median Absolute Deviation (MAD) | 88905 |
Skewness | 5.528861 |
Sum | 1.6077096 × 108 |
Variance | 5.0018393 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
22635 | 17 | 3.4% |
45270 | 10 | 2.0% |
251500 | 8 | 1.6% |
40240 | 8 | 1.6% |
50300 | 7 | 1.4% |
15090 | 7 | 1.4% |
30180 | 6 | 1.2% |
75450 | 6 | 1.2% |
25150 | 6 | 1.2% |
12575 | 5 | 1.0% |
Other values (339) | 420 |
Value | Count | Frequency (%) |
2515 | 1 | 0.2% |
5030 | 1 | 0.2% |
5533 | 1 | 0.2% |
5785 | 1 | 0.2% |
6036 | 1 | 0.2% |
6539 | 1 | 0.2% |
7042 | 1 | 0.2% |
8048 | 2 | |
9557 | 1 | 0.2% |
10060 | 4 |
Value | Count | Frequency (%) |
6850860 | 1 | |
6614450 | 1 | |
5149865 | 1 | |
5099414 | 1 | |
4200503 | 1 | |
3311299 | 1 | |
3281673 | 1 | |
3219200 | 1 | |
2863780 | 1 | |
2615600 | 1 |
카드이용건수계(USECT_CORR)
Real number (ℝ)
Distinct | 24 |
---|---|
Distinct (%) | 4.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 13.648 |
Minimum | 5 |
---|---|
Maximum | 186 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.5 KiB |
Quantile statistics
Minimum | 5 |
---|---|
5-th percentile | 5 |
Q1 | 5 |
median | 5 |
Q3 | 10 |
95-th percentile | 50 |
Maximum | 186 |
Range | 181 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 21.971016 |
---|---|
Coefficient of variation (CV) | 1.6098341 |
Kurtosis | 23.863151 |
Mean | 13.648 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 4.5162268 |
Sum | 6824 |
Variance | 482.72555 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
5 | 297 | |
10 | 84 | 16.8% |
15 | 37 | 7.4% |
20 | 22 | 4.4% |
30 | 11 | 2.2% |
25 | 10 | 2.0% |
35 | 7 | 1.4% |
45 | 4 | 0.8% |
50 | 4 | 0.8% |
121 | 3 | 0.6% |
Other values (14) | 21 | 4.2% |
Value | Count | Frequency (%) |
5 | 297 | |
10 | 84 | 16.8% |
15 | 37 | 7.4% |
20 | 22 | 4.4% |
25 | 10 | 2.0% |
30 | 11 | 2.2% |
35 | 7 | 1.4% |
40 | 2 | 0.4% |
45 | 4 | 0.8% |
50 | 4 | 0.8% |
Value | Count | Frequency (%) |
186 | 1 | 0.2% |
171 | 1 | 0.2% |
161 | 1 | 0.2% |
136 | 1 | 0.2% |
121 | 3 | |
116 | 2 | |
101 | 1 | 0.2% |
96 | 2 | |
86 | 2 | |
80 | 1 | 0.2% |
가맹점주소광역시도(SIDO) | 가맹점주소시군구(SGG) | 업종대분류(UPJONG_CLASS1) | 기준일자(YMD) | 고객주소집계구별(TOT_REG_CD) | 카드이용금액계(AMT_CORR) | 카드이용건수계(USECT_CORR) | |
---|---|---|---|---|---|---|---|
가맹점주소광역시도(SIDO) | 1.000 | 0.000 | 0.000 | 0.130 | 0.189 | 0.000 | 0.000 |
가맹점주소시군구(SGG) | 0.000 | 1.000 | 0.000 | 0.000 | 0.194 | 0.000 | 0.000 |
업종대분류(UPJONG_CLASS1) | 0.000 | 0.000 | 1.000 | 0.000 | 0.048 | 0.000 | 0.147 |
기준일자(YMD) | 0.130 | 0.000 | 0.000 | 1.000 | 0.115 | 0.115 | 0.000 |
고객주소집계구별(TOT_REG_CD) | 0.189 | 0.194 | 0.048 | 0.115 | 1.000 | 0.120 | 0.162 |
카드이용금액계(AMT_CORR) | 0.000 | 0.000 | 0.000 | 0.115 | 0.120 | 1.000 | 0.179 |
카드이용건수계(USECT_CORR) | 0.000 | 0.000 | 0.147 | 0.000 | 0.162 | 0.179 | 1.000 |
업종대분류(UPJONG_CLASS1) | 가맹점주소광역시도(SIDO) | |
---|---|---|
업종대분류(UPJONG_CLASS1) | 1.000 | 0.000 |
가맹점주소광역시도(SIDO) | 0.000 | 1.000 |
기준일자(YMD) | 고객주소집계구별(TOT_REG_CD) | 카드이용금액계(AMT_CORR) | 카드이용건수계(USECT_CORR) | 가맹점주소광역시도(SIDO) | 업종대분류(UPJONG_CLASS1) | |
---|---|---|---|---|---|---|
기준일자(YMD) | 1.000 | -0.025 | -0.020 | -0.073 | 0.051 | 0.000 |
고객주소집계구별(TOT_REG_CD) | -0.025 | 1.000 | 0.070 | 0.077 | 0.072 | 0.021 |
카드이용금액계(AMT_CORR) | -0.020 | 0.070 | 1.000 | -0.017 | 0.000 | 0.000 |
카드이용건수계(USECT_CORR) | -0.073 | 0.077 | -0.017 | 1.000 | 0.000 | 0.059 |
가맹점주소광역시도(SIDO) | 0.051 | 0.072 | 0.000 | 0.000 | 1.000 | 0.000 |
업종대분류(UPJONG_CLASS1) | 0.000 | 0.021 | 0.000 | 0.059 | 0.000 | 1.000 |
가맹점주소광역시도(SIDO) | 가맹점주소시군구(SGG) | 업종대분류(UPJONG_CLASS1) | 기준일자(YMD) | 고객주소집계구별(TOT_REG_CD) | 카드이용금액계(AMT_CORR) | 카드이용건수계(USECT_CORR) | |
---|---|---|---|---|---|---|---|
0 | 서울 | 강남구 | 전자상거래 | 20201021 | 1123077020119 | 251500 | 25 |
1 | 서울 | 관악구 | 요식/유흥 | 20170312 | 1112052010107 | 158445 | 20 |
2 | 서울 | 마포구 | 주유 | 20161205 | 1113068050004 | 8048 | 15 |
3 | 서울 | 동작구 | 의료 | 20201210 | 1105066020601 | 22635 | 5 |
4 | 서울 | <NA> | 가정생활/서비스 | 20210216 | 1117052020001 | 65390 | 10 |
5 | 경기 | 마포구 | 유통 | 20200319 | 1108060020010 | 20120 | 25 |
6 | 인천 | 종로구 | 요식/유흥 | 20181123 | 1108058020503 | 110409 | 5 |
7 | 경기 | 송파구 | 요식/유흥 | 20160418 | 1112058010033 | 160457 | 50 |
8 | 경기 | 용인시 | 미용 | 20201002 | 1113074020002 | 804800 | 5 |
9 | 서울 | 중구 | 유통 | 20170405 | 1119076020602 | 182710 | 15 |
가맹점주소광역시도(SIDO) | 가맹점주소시군구(SGG) | 업종대분류(UPJONG_CLASS1) | 기준일자(YMD) | 고객주소집계구별(TOT_REG_CD) | 카드이용금액계(AMT_CORR) | 카드이용건수계(USECT_CORR) | |
---|---|---|---|---|---|---|---|
490 | 서울 | 영등포구 | 자동차 | 20190729 | 1121068020022 | 1060324 | 5 |
491 | 경기 | 구리시 | 의료 | 20161123 | 1121083010007 | 814357 | 5 |
492 | 서울 | 중구 | 의료 | 20160223 | 1111073040109 | 201200 | 5 |
493 | 서울 | 구로구 | 미용 | 20210428 | 1124059020102 | 16599 | 5 |
494 | 서울 | 중구 | 주유 | 20210309 | 1110054010002 | 79474 | 5 |
495 | 서울 | 종로구 | 가전/가구 | 20201108 | 1120055030005 | 55330 | 10 |
496 | 부산 | 부평구 | 의료 | 20180901 | 1122058020102 | 853591 | 5 |
497 | 서울 | 강남구 | 유통 | 20160326 | 1123064020008 | 2052240 | 5 |
498 | 서울 | 서초구 | 스포츠/문화/레저 | 20160804 | 1124061010014 | 22635 | 5 |
499 | 인천 | 마포구 | 음/식료품 | 20210628 | 1122052030002 | 667481 | 116 |