Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 29 |
Missing cells | 4 |
Missing cells (%) | 2.0% |
Duplicate rows | 1 |
Duplicate rows (%) | 3.4% |
Total size in memory | 1.8 KiB |
Average record size in memory | 62.6 B |
Variable types
Categorical | 5 |
---|---|
Numeric | 1 |
DateTime | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 한국신용데이터 |
URL | https://bigdata-region.kr/#/dataset/39239ed9-0f2a-4425-b818-f2b1a2a0c683 |
2022-09 has constant value "" | Constant |
Dataset has 1 (3.4%) duplicate rows | Duplicates |
전국 is highly overall correlated with 통합 and 1 other fields | High correlation |
50만원 미만 is highly overall correlated with 270000 and 1 other fields | High correlation |
통합 is highly overall correlated with 전체 and 2 other fields | High correlation |
16.6667 is highly overall correlated with 270000 and 4 other fields | High correlation |
전체 is highly overall correlated with 통합 and 1 other fields | High correlation |
270000 is highly overall correlated with 50만원 미만 and 1 other fields | High correlation |
16.6667 is highly imbalanced (63.8%) | Imbalance |
270000 has 2 (6.9%) missing values | Missing |
2022-09 has 2 (6.9%) missing values | Missing |
Reproduction
Analysis started | 2024-02-10 11:27:12.751414 |
---|---|
Analysis finished | 2024-02-10 11:27:18.952226 |
Duration | 6.2 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
통합
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 17.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 364.0 B |
업종 | |
---|---|
지역 | |
지역X업종 | |
통합 | |
<NA> |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.862069 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 통합 |
---|---|
2nd row | 통합 |
3rd row | 통합 |
4th row | 통합 |
5th row | 통합 |
Common Values
Value | Count | Frequency (%) |
업종 | 7 | |
지역 | 7 | |
지역X업종 | 7 | |
통합 | 6 | |
<NA> | 2 | 6.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
업종 | 7 | |
지역 | 7 | |
지역x업종 | 7 | |
통합 | 6 | |
na | 2 | 6.9% |
전체
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 10.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 364.0 B |
유통업 | |
---|---|
전체 | |
<NA> |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 2.6206897 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전체 |
---|---|
2nd row | 전체 |
3rd row | 전체 |
4th row | 전체 |
5th row | 전체 |
Common Values
Value | Count | Frequency (%) |
유통업 | 14 | |
전체 | 13 | |
<NA> | 2 | 6.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
유통업 | 14 | |
전체 | 13 | |
na | 2 | 6.9% |
전국
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 10.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 364.0 B |
서울특별시 | |
---|---|
전국 | |
<NA> |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.5862069 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전국 |
---|---|
2nd row | 전국 |
3rd row | 전국 |
4th row | 전국 |
5th row | 전국 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 14 | |
전국 | 13 | |
<NA> | 2 | 6.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 14 | |
전국 | 13 | |
na | 2 | 6.9% |
50만원 미만
Categorical
HIGH CORRELATION
 
Distinct | 8 |
---|---|
Distinct (%) | 27.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 364.0 B |
50만원 이상 - 70만원 미만 | |
---|---|
70만원 이상 - 100만원 미만 | |
100만원 이상 - 150만원 미만 | |
150만원 이상 - 200만원 미만 | |
200만원 이상 - 300만원 미만 | |
Other values (3) |
Length
Max length | 19 |
---|---|
Median length | 18 |
Mean length | 14.793103 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 50만원 이상 - 70만원 미만 |
---|---|
2nd row | 70만원 이상 - 100만원 미만 |
3rd row | 100만원 이상 - 150만원 미만 |
4th row | 150만원 이상 - 200만원 미만 |
5th row | 200만원 이상 - 300만원 미만 |
Common Values
Value | Count | Frequency (%) |
50만원 이상 - 70만원 미만 | 4 | |
70만원 이상 - 100만원 미만 | 4 | |
100만원 이상 - 150만원 미만 | 4 | |
150만원 이상 - 200만원 미만 | 4 | |
200만원 이상 - 300만원 미만 | 4 | |
300만원 이상 | 4 | |
50만원 미만 | 3 | |
<NA> | 2 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
이상 | 24 | |
미만 | 23 | |
20 | ||
70만원 | 8 | 6.9% |
100만원 | 8 | 6.9% |
150만원 | 8 | 6.9% |
200만원 | 8 | 6.9% |
300만원 | 8 | 6.9% |
50만원 | 7 | 6.0% |
na | 2 | 1.7% |
16.6667
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 6.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 364.0 B |
16.6667 | |
---|---|
<NA> | 2 |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 6.7931034 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 16.6667 |
---|---|
2nd row | 16.6667 |
3rd row | 16.6667 |
4th row | 16.6667 |
5th row | 16.6667 |
Common Values
Value | Count | Frequency (%) |
16.6667 | 27 | |
<NA> | 2 | 6.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
16.6667 | 27 | |
na | 2 | 6.9% |
270000
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 7 |
---|---|
Distinct (%) | 25.9% |
Missing | 2 |
Missing (%) | 6.9% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1710000 |
Minimum | 270000 |
---|---|
Maximum | 5100000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 393.0 B |
Quantile statistics
Minimum | 270000 |
---|---|
5-th percentile | 270000 |
Q1 | 670000 |
median | 1100000 |
Q3 | 2200000 |
95-th percentile | 5100000 |
Maximum | 5100000 |
Range | 4830000 |
Interquartile range (IQR) | 1530000 |
Descriptive statistics
Standard deviation | 1562227.2 |
---|---|
Coefficient of variation (CV) | 0.91358316 |
Kurtosis | 1.1117072 |
Mean | 1710000 |
Median Absolute Deviation (MAD) | 550000 |
Skewness | 1.4933881 |
Sum | 46170000 |
Variance | 2.4405538 × 1012 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
550000 | 4 | |
790000 | 4 | |
1100000 | 4 | |
1600000 | 4 | |
2200000 | 4 | |
5100000 | 4 | |
270000 | 3 | |
(Missing) | 2 |
Value | Count | Frequency (%) |
270000 | 3 | |
550000 | 4 | |
790000 | 4 | |
1100000 | 4 | |
1600000 | 4 | |
2200000 | 4 | |
5100000 | 4 |
Value | Count | Frequency (%) |
5100000 | 4 | |
2200000 | 4 | |
1600000 | 4 | |
1100000 | 4 | |
790000 | 4 | |
550000 | 4 | |
270000 | 3 |
2022-09
Date
CONSTANT
  MISSING
 
Distinct | 1 |
---|---|
Distinct (%) | 3.7% |
Missing | 2 |
Missing (%) | 6.9% |
Memory size | 364.0 B |
Minimum | 2022-09-01 00:00:00 |
---|---|
Maximum | 2022-09-01 00:00:00 |
통합 | 전체 | 전국 | 50만원 미만 | 270000 | |
---|---|---|---|---|---|
통합 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 |
전체 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
전국 | 1.000 | 0.000 | 1.000 | 0.000 | 0.000 |
50만원 미만 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 |
270000 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 |
전국 | 50만원 미만 | 통합 | 16.6667 | 전체 | |
---|---|---|---|---|---|
전국 | 1.000 | 0.000 | 0.959 | 1.000 | 0.000 |
50만원 미만 | 0.000 | 1.000 | 0.000 | 1.000 | 0.000 |
통합 | 0.959 | 0.000 | 1.000 | 1.000 | 0.959 |
16.6667 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
전체 | 0.000 | 0.000 | 0.959 | 1.000 | 1.000 |
270000 | 통합 | 전체 | 전국 | 50만원 미만 | 16.6667 | |
---|---|---|---|---|---|---|
270000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.953 | 1.000 |
통합 | 0.000 | 1.000 | 0.959 | 0.959 | 0.000 | 1.000 |
전체 | 0.000 | 0.959 | 1.000 | 0.000 | 0.000 | 1.000 |
전국 | 0.000 | 0.959 | 0.000 | 1.000 | 0.000 | 1.000 |
50만원 미만 | 0.953 | 0.000 | 0.000 | 0.000 | 1.000 | 1.000 |
16.6667 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
통합 | 전체 | 전국 | 50만원 미만 | 16.6667 | 270000 | 2022-09 | |
---|---|---|---|---|---|---|---|
0 | 통합 | 전체 | 전국 | 50만원 이상 - 70만원 미만 | 16.6667 | 550000 | 2022-09 |
1 | 통합 | 전체 | 전국 | 70만원 이상 - 100만원 미만 | 16.6667 | 790000 | 2022-09 |
2 | 통합 | 전체 | 전국 | 100만원 이상 - 150만원 미만 | 16.6667 | 1100000 | 2022-09 |
3 | 통합 | 전체 | 전국 | 150만원 이상 - 200만원 미만 | 16.6667 | 1600000 | 2022-09 |
4 | 통합 | 전체 | 전국 | 200만원 이상 - 300만원 미만 | 16.6667 | 2200000 | 2022-09 |
5 | 통합 | 전체 | 전국 | 300만원 이상 | 16.6667 | 5100000 | 2022-09 |
6 | 업종 | 유통업 | 전국 | 50만원 미만 | 16.6667 | 270000 | 2022-09 |
7 | 업종 | 유통업 | 전국 | 50만원 이상 - 70만원 미만 | 16.6667 | 550000 | 2022-09 |
8 | 업종 | 유통업 | 전국 | 70만원 이상 - 100만원 미만 | 16.6667 | 790000 | 2022-09 |
9 | 업종 | 유통업 | 전국 | 100만원 이상 - 150만원 미만 | 16.6667 | 1100000 | 2022-09 |
통합 | 전체 | 전국 | 50만원 미만 | 16.6667 | 270000 | 2022-09 | |
---|---|---|---|---|---|---|---|
19 | 지역 | 전체 | 서울특별시 | 300만원 이상 | 16.6667 | 5100000 | 2022-09 |
20 | 지역X업종 | 유통업 | 서울특별시 | 50만원 미만 | 16.6667 | 270000 | 2022-09 |
21 | 지역X업종 | 유통업 | 서울특별시 | 50만원 이상 - 70만원 미만 | 16.6667 | 550000 | 2022-09 |
22 | 지역X업종 | 유통업 | 서울특별시 | 70만원 이상 - 100만원 미만 | 16.6667 | 790000 | 2022-09 |
23 | 지역X업종 | 유통업 | 서울특별시 | 100만원 이상 - 150만원 미만 | 16.6667 | 1100000 | 2022-09 |
24 | 지역X업종 | 유통업 | 서울특별시 | 150만원 이상 - 200만원 미만 | 16.6667 | 1600000 | 2022-09 |
25 | 지역X업종 | 유통업 | 서울특별시 | 200만원 이상 - 300만원 미만 | 16.6667 | 2200000 | 2022-09 |
26 | 지역X업종 | 유통업 | 서울특별시 | 300만원 이상 | 16.6667 | 5100000 | 2022-09 |
27 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
28 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
통합 | 전체 | 전국 | 50만원 미만 | 16.6667 | 270000 | 2022-09 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |