Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 25 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 982.0 B |
Average record size in memory | 39.3 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 1 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 신한카드 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=50 |
대분류코드(UPJONG_L) is highly overall correlated with 중분류코드(UPJONG_M) and 1 other fields | High correlation |
중분류코드(UPJONG_M) is highly overall correlated with 대분류코드(UPJONG_L) and 1 other fields | High correlation |
대분류코드명(UPJONG_L_NM) is highly overall correlated with 대분류코드(UPJONG_L) and 1 other fields | High correlation |
중분류코드(UPJONG_M) has unique values | Unique |
중분류코드명(UPJONG_M_NM) has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 14:52:57.561446 |
---|---|
Analysis finished | 2023-12-10 14:52:58.207654 |
Duration | 0.65 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
대분류코드(UPJONG_L)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 44.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.8 |
Minimum | 1 |
---|---|
Maximum | 11 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 357.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 5 |
Q3 | 7 |
95-th percentile | 9.8 |
Maximum | 11 |
Range | 10 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 3.1358146 |
---|---|
Coefficient of variation (CV) | 0.65329471 |
Kurtosis | -1.0971428 |
Mean | 4.8 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.30667635 |
Sum | 120 |
Variance | 9.8333333 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
1 | 5 | |
2 | 4 | |
6 | 3 | |
8 | 3 | |
4 | 2 | 8.0% |
5 | 2 | 8.0% |
7 | 2 | 8.0% |
3 | 1 | 4.0% |
9 | 1 | 4.0% |
10 | 1 | 4.0% |
Value | Count | Frequency (%) |
1 | 5 | |
2 | 4 | |
3 | 1 | 4.0% |
4 | 2 | 8.0% |
5 | 2 | 8.0% |
6 | 3 | |
7 | 2 | 8.0% |
8 | 3 | |
9 | 1 | 4.0% |
10 | 1 | 4.0% |
Value | Count | Frequency (%) |
11 | 1 | 4.0% |
10 | 1 | 4.0% |
9 | 1 | 4.0% |
8 | 3 | |
7 | 2 | |
6 | 3 | |
5 | 2 | |
4 | 2 | |
3 | 1 | 4.0% |
2 | 4 |
대분류코드명(UPJONG_L_NM)
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 44.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
요식/유흥 | |
---|---|
유통 | |
여행/교통 | |
의료 | |
의류/잡화 | |
Other values (6) |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 4.04 |
Min length | 2 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 16.0% |
Sample
1st row | 요식/유흥 |
---|---|
2nd row | 요식/유흥 |
3rd row | 요식/유흥 |
4th row | 요식/유흥 |
5th row | 요식/유흥 |
Common Values
Value | Count | Frequency (%) |
요식/유흥 | 5 | |
유통 | 4 | |
여행/교통 | 3 | |
의료 | 3 | |
의류/잡화 | 2 | 8.0% |
스포츠/문화/레저 | 2 | 8.0% |
미용 | 2 | 8.0% |
음/식료품 | 1 | 4.0% |
가전/가구 | 1 | 4.0% |
자동차 | 1 | 4.0% |
Length
Value | Count | Frequency (%) |
요식/유흥 | 5 | |
유통 | 4 | |
여행/교통 | 3 | |
의료 | 3 | |
의류/잡화 | 2 | 8.0% |
스포츠/문화/레저 | 2 | 8.0% |
미용 | 2 | 8.0% |
음/식료품 | 1 | 4.0% |
가전/가구 | 1 | 4.0% |
자동차 | 1 | 4.0% |
중분류코드(UPJONG_M)
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 25 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 493 |
Minimum | 101 |
---|---|
Maximum | 1125 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 357.0 B |
Quantile statistics
Minimum | 101 |
---|---|
5-th percentile | 102.2 |
Q1 | 207 |
median | 513 |
Q3 | 719 |
95-th percentile | 1003.8 |
Maximum | 1125 |
Range | 1024 |
Interquartile range (IQR) | 512 |
Descriptive statistics
Standard deviation | 320.82576 |
---|---|
Coefficient of variation (CV) | 0.65076219 |
Kurtosis | -1.1047722 |
Mean | 493 |
Median Absolute Deviation (MAD) | 306 |
Skewness | 0.30057109 |
Sum | 12325 |
Variance | 102929.17 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
101 | 1 | 4.0% |
102 | 1 | 4.0% |
1125 | 1 | 4.0% |
1024 | 1 | 4.0% |
923 | 1 | 4.0% |
822 | 1 | 4.0% |
821 | 1 | 4.0% |
820 | 1 | 4.0% |
719 | 1 | 4.0% |
718 | 1 | 4.0% |
Other values (15) | 15 |
Value | Count | Frequency (%) |
101 | 1 | |
102 | 1 | |
103 | 1 | |
104 | 1 | |
105 | 1 | |
206 | 1 | |
207 | 1 | |
208 | 1 | |
209 | 1 | |
310 | 1 |
Value | Count | Frequency (%) |
1125 | 1 | |
1024 | 1 | |
923 | 1 | |
822 | 1 | |
821 | 1 | |
820 | 1 | |
719 | 1 | |
718 | 1 | |
617 | 1 | |
616 | 1 |
UNIQUE
 
Distinct | 25 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 332.0 B |
Value | Count | Frequency (%) |
한식 | 1 | 4.0% |
스포츠/문화/레저용품 | 1 | 4.0% |
자동차서비스/용품 | 1 | 4.0% |
가전/가구 | 1 | 4.0% |
기타의료 | 1 | 4.0% |
약국 | 1 | 4.0% |
병원 | 1 | 4.0% |
화장품 | 1 | 4.0% |
미용서비스 | 1 | 4.0% |
교통 | 1 | 4.0% |
Other values (15) | 15 |
Most occurring characters
Value | Count | Frequency (%) |
/ | 14 | 11.9% |
식 | 6 | 5.1% |
화 | 5 | 4.2% |
스 | 5 | 4.2% |
품 | 4 | 3.4% |
의 | 4 | 3.4% |
유 | 3 | 2.5% |
용 | 3 | 2.5% |
타 | 3 | 2.5% |
기 | 3 | 2.5% |
Other values (55) | 68 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 104 | |
Other Punctuation | 14 | 11.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
식 | 6 | 5.8% |
화 | 5 | 4.8% |
스 | 5 | 4.8% |
품 | 4 | 3.8% |
의 | 4 | 3.8% |
유 | 3 | 2.9% |
용 | 3 | 2.9% |
타 | 3 | 2.9% |
기 | 3 | 2.9% |
점 | 3 | 2.9% |
Other values (54) | 65 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 14 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 104 | |
Common | 14 | 11.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
식 | 6 | 5.8% |
화 | 5 | 4.8% |
스 | 5 | 4.8% |
품 | 4 | 3.8% |
의 | 4 | 3.8% |
유 | 3 | 2.9% |
용 | 3 | 2.9% |
타 | 3 | 2.9% |
기 | 3 | 2.9% |
점 | 3 | 2.9% |
Other values (54) | 65 |
Common
Value | Count | Frequency (%) |
/ | 14 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 104 | |
ASCII | 14 | 11.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
/ | 14 |
Hangul
Value | Count | Frequency (%) |
식 | 6 | 5.8% |
화 | 5 | 4.8% |
스 | 5 | 4.8% |
품 | 4 | 3.8% |
의 | 4 | 3.8% |
유 | 3 | 2.9% |
용 | 3 | 2.9% |
타 | 3 | 2.9% |
기 | 3 | 2.9% |
점 | 3 | 2.9% |
Other values (54) | 65 |
대분류코드(UPJONG_L) | 대분류코드명(UPJONG_L_NM) | 중분류코드(UPJONG_M) | 중분류코드명(UPJONG_M_NM) | |
---|---|---|---|---|
대분류코드(UPJONG_L) | 1.000 | 1.000 | 0.999 | 1.000 |
대분류코드명(UPJONG_L_NM) | 1.000 | 1.000 | 1.000 | 1.000 |
중분류코드(UPJONG_M) | 0.999 | 1.000 | 1.000 | 1.000 |
중분류코드명(UPJONG_M_NM) | 1.000 | 1.000 | 1.000 | 1.000 |
대분류코드(UPJONG_L) | 중분류코드(UPJONG_M) | 대분류코드명(UPJONG_L_NM) | |
---|---|---|---|
대분류코드(UPJONG_L) | 1.000 | 0.992 | 0.966 |
중분류코드(UPJONG_M) | 0.992 | 1.000 | 0.966 |
대분류코드명(UPJONG_L_NM) | 0.966 | 0.966 | 1.000 |
대분류코드(UPJONG_L) | 대분류코드명(UPJONG_L_NM) | 중분류코드(UPJONG_M) | 중분류코드명(UPJONG_M_NM) | |
---|---|---|---|---|
0 | 1 | 요식/유흥 | 101 | 한식 |
1 | 1 | 요식/유흥 | 102 | 일식/중식/양식 |
2 | 1 | 요식/유흥 | 103 | 제과/커피/패스트푸드 |
3 | 1 | 요식/유흥 | 104 | 기타요식 |
4 | 1 | 요식/유흥 | 105 | 유흥 |
5 | 2 | 유통 | 206 | 백화점 |
6 | 2 | 유통 | 207 | 할인점/슈퍼마켓 |
7 | 2 | 유통 | 208 | 편의점 |
8 | 2 | 유통 | 209 | 기타유통 |
9 | 3 | 음/식료품 | 310 | 음/식료품 |
대분류코드(UPJONG_L) | 대분류코드명(UPJONG_L_NM) | 중분류코드(UPJONG_M) | 중분류코드명(UPJONG_M_NM) | |
---|---|---|---|---|
15 | 6 | 여행/교통 | 616 | 여행 |
16 | 6 | 여행/교통 | 617 | 교통 |
17 | 7 | 미용 | 718 | 미용서비스 |
18 | 7 | 미용 | 719 | 화장품 |
19 | 8 | 의료 | 820 | 병원 |
20 | 8 | 의료 | 821 | 약국 |
21 | 8 | 의료 | 822 | 기타의료 |
22 | 9 | 가전/가구 | 923 | 가전/가구 |
23 | 10 | 자동차 | 1024 | 자동차서비스/용품 |
24 | 11 | 주유 | 1125 | 주유 |