Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 56 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.9 KiB |
Average record size in memory | 52.4 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 2 |
Text | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 신한카드 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=51 |
대분류코드(SF_L_UPJONG_CD) is highly overall correlated with 중분류코드(SF_M_UPJONG_CD) and 2 other fields | High correlation |
중분류코드(SF_M_UPJONG_CD) is highly overall correlated with 대분류코드(SF_L_UPJONG_CD) and 2 other fields | High correlation |
대분류코드(SF_L_UPJONG_NM) is highly overall correlated with 대분류코드(SF_L_UPJONG_CD) and 2 other fields | High correlation |
중분류코드(SF_M_UPJONG_NM) is highly overall correlated with 대분류코드(SF_L_UPJONG_CD) and 2 other fields | High correlation |
외국인관광업종코드(SF_UPJONG_CD) has unique values | Unique |
외국인관광업종분류(SF_UPJONG_NM) has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 14:54:30.914793 |
---|---|
Analysis finished | 2023-12-10 14:54:32.012333 |
Duration | 1.1 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
대분류코드(SF_L_UPJONG_CD)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 19.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4.8571429 |
Minimum | 1 |
---|---|
Maximum | 11 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 636.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2 |
median | 5 |
Q3 | 7 |
95-th percentile | 10 |
Maximum | 11 |
Range | 10 |
Interquartile range (IQR) | 5 |
Descriptive statistics
Standard deviation | 2.9752224 |
---|---|
Coefficient of variation (CV) | 0.61254578 |
Kurtosis | -0.92920044 |
Mean | 4.8571429 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 0.27263955 |
Sum | 272 |
Variance | 8.8519481 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
1 | 11 | |
5 | 10 | |
2 | 6 | |
6 | 6 | |
8 | 6 | |
4 | 4 | 7.1% |
3 | 3 | 5.4% |
7 | 3 | 5.4% |
9 | 3 | 5.4% |
10 | 2 | 3.6% |
Value | Count | Frequency (%) |
1 | 11 | |
2 | 6 | |
3 | 3 | 5.4% |
4 | 4 | 7.1% |
5 | 10 | |
6 | 6 | |
7 | 3 | 5.4% |
8 | 6 | |
9 | 3 | 5.4% |
10 | 2 | 3.6% |
Value | Count | Frequency (%) |
11 | 2 | 3.6% |
10 | 2 | 3.6% |
9 | 3 | 5.4% |
8 | 6 | |
7 | 3 | 5.4% |
6 | 6 | |
5 | 10 | |
4 | 4 | 7.1% |
3 | 3 | 5.4% |
2 | 6 |
대분류코드(SF_L_UPJONG_NM)
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 19.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
요식/유흥 | |
---|---|
스포츠/문화/레저 | |
유통 | |
여행/교통 | |
의료 | |
Other values (6) |
Length
Max length | 9 |
---|---|
Median length | 5 |
Mean length | 4.7321429 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 요식/유흥 |
---|---|
2nd row | 요식/유흥 |
3rd row | 요식/유흥 |
4th row | 요식/유흥 |
5th row | 요식/유흥 |
Common Values
Value | Count | Frequency (%) |
요식/유흥 | 11 | |
스포츠/문화/레저 | 10 | |
유통 | 6 | |
여행/교통 | 6 | |
의료 | 6 | |
의류/잡화 | 4 | 7.1% |
음/식료품 | 3 | 5.4% |
미용 | 3 | 5.4% |
가전/가구 | 3 | 5.4% |
자동차 | 2 | 3.6% |
Length
Value | Count | Frequency (%) |
요식/유흥 | 11 | |
스포츠/문화/레저 | 10 | |
유통 | 6 | |
여행/교통 | 6 | |
의료 | 6 | |
의류/잡화 | 4 | 7.1% |
음/식료품 | 3 | 5.4% |
미용 | 3 | 5.4% |
가전/가구 | 3 | 5.4% |
자동차 | 2 | 3.6% |
중분류코드(SF_M_UPJONG_CD)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 44.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 498.73214 |
Minimum | 101 |
---|---|
Maximum | 1125 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 636.0 B |
Quantile statistics
Minimum | 101 |
---|---|
5-th percentile | 102 |
Q1 | 207 |
median | 513 |
Q3 | 718.25 |
95-th percentile | 1024 |
Maximum | 1125 |
Range | 1024 |
Interquartile range (IQR) | 511.25 |
Descriptive statistics
Standard deviation | 304.33901 |
---|---|
Coefficient of variation (CV) | 0.61022539 |
Kurtosis | -0.93444884 |
Mean | 498.73214 |
Median Absolute Deviation (MAD) | 305.5 |
Skewness | 0.2672149 |
Sum | 27929 |
Variance | 92622.236 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
513 | 7 | 12.5% |
820 | 4 | 7.1% |
514 | 3 | 5.4% |
923 | 3 | 5.4% |
616 | 3 | 5.4% |
102 | 3 | 5.4% |
412 | 3 | 5.4% |
310 | 3 | 5.4% |
207 | 3 | 5.4% |
105 | 3 | 5.4% |
Other values (15) | 21 |
Value | Count | Frequency (%) |
101 | 1 | 1.8% |
102 | 3 | |
103 | 3 | |
104 | 1 | 1.8% |
105 | 3 | |
206 | 1 | 1.8% |
207 | 3 | |
208 | 1 | 1.8% |
209 | 1 | 1.8% |
310 | 3 |
Value | Count | Frequency (%) |
1125 | 2 | |
1024 | 2 | |
923 | 3 | |
822 | 1 | 1.8% |
821 | 1 | 1.8% |
820 | 4 | |
719 | 1 | 1.8% |
718 | 2 | |
617 | 1 | 1.8% |
616 | 3 |
중분류코드(SF_M_UPJONG_NM)
Categorical
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 44.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
스포츠/문화/레저 | |
---|---|
병원 | |
제과/커피/패스트푸드 | 3 |
유흥 | 3 |
가전/가구 | 3 |
Other values (20) |
Length
Max length | 11 |
---|---|
Median length | 9 |
Mean length | 5.5357143 |
Min length | 2 |
Unique
Unique | 10 ? |
---|---|
Unique (%) | 17.9% |
Sample
1st row | 한식 |
---|---|
2nd row | 일식/중식/양식 |
3rd row | 일식/중식/양식 |
4th row | 일식/중식/양식 |
5th row | 제과/커피/패스트푸드 |
Common Values
Value | Count | Frequency (%) |
스포츠/문화/레저 | 7 | 12.5% |
병원 | 4 | 7.1% |
제과/커피/패스트푸드 | 3 | 5.4% |
유흥 | 3 | 5.4% |
가전/가구 | 3 | 5.4% |
할인점/슈퍼마켓 | 3 | 5.4% |
음/식료품 | 3 | 5.4% |
여행 | 3 | 5.4% |
패션/잡화 | 3 | 5.4% |
일식/중식/양식 | 3 | 5.4% |
Other values (15) | 21 |
Length
Value | Count | Frequency (%) |
스포츠/문화/레저 | 7 | 12.5% |
병원 | 4 | 7.1% |
제과/커피/패스트푸드 | 3 | 5.4% |
유흥 | 3 | 5.4% |
가전/가구 | 3 | 5.4% |
할인점/슈퍼마켓 | 3 | 5.4% |
음/식료품 | 3 | 5.4% |
여행 | 3 | 5.4% |
패션/잡화 | 3 | 5.4% |
일식/중식/양식 | 3 | 5.4% |
Other values (15) | 21 |
UNIQUE
 
Distinct | 56 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
Value | Count | Frequency (%) |
sf010101 | 1 | 1.8% |
sf010202 | 1 | 1.8% |
sf071842 | 1 | 1.8% |
sf051331 | 1 | 1.8% |
sf051432 | 1 | 1.8% |
sf051433 | 1 | 1.8% |
sf051434 | 1 | 1.8% |
sf061535 | 1 | 1.8% |
sf061536 | 1 | 1.8% |
sf061637 | 1 | 1.8% |
Other values (46) | 46 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 92 | |
1 | 62 | |
s | 56 | |
f | 56 | |
2 | 42 | |
3 | 32 | 7.1% |
5 | 30 | 6.7% |
4 | 26 | 5.8% |
6 | 16 | 3.6% |
8 | 14 | 3.1% |
Other values (2) | 22 | 4.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 336 | |
Lowercase Letter | 112 | 25.0% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 92 | |
1 | 62 | |
2 | 42 | |
3 | 32 | 9.5% |
5 | 30 | 8.9% |
4 | 26 | 7.7% |
6 | 16 | 4.8% |
8 | 14 | 4.2% |
7 | 12 | 3.6% |
9 | 10 | 3.0% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 56 | |
f | 56 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 336 | |
Latin | 112 | 25.0% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 92 | |
1 | 62 | |
2 | 42 | |
3 | 32 | 9.5% |
5 | 30 | 8.9% |
4 | 26 | 7.7% |
6 | 16 | 4.8% |
8 | 14 | 4.2% |
7 | 12 | 3.6% |
9 | 10 | 3.0% |
Latin
Value | Count | Frequency (%) |
s | 56 | |
f | 56 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 448 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 92 | |
1 | 62 | |
s | 56 | |
f | 56 | |
2 | 42 | |
3 | 32 | 7.1% |
5 | 30 | 6.7% |
4 | 26 | 5.8% |
6 | 16 | 3.6% |
8 | 14 | 3.1% |
Other values (2) | 22 | 4.9% |
UNIQUE
 
Distinct | 56 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 580.0 B |
Value | Count | Frequency (%) |
한식 | 1 | 1.8% |
일식 | 1 | 1.8% |
미용서비스 | 1 | 1.8% |
서점 | 1 | 1.8% |
스포츠/레저용품 | 1 | 1.8% |
문화용품 | 1 | 1.8% |
화원 | 1 | 1.8% |
호텔/콘도 | 1 | 1.8% |
모텔/여관/기타숙박 | 1 | 1.8% |
여행사 | 1 | 1.8% |
Other values (46) | 46 |
Most occurring characters
Value | Count | Frequency (%) |
/ | 14 | 6.0% |
점 | 9 | 3.9% |
스 | 7 | 3.0% |
화 | 7 | 3.0% |
타 | 7 | 3.0% |
기 | 7 | 3.0% |
식 | 6 | 2.6% |
품 | 5 | 2.2% |
원 | 5 | 2.2% |
의 | 5 | 2.2% |
Other values (106) | 160 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 215 | |
Other Punctuation | 14 | 6.0% |
Uppercase Letter | 3 | 1.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
점 | 9 | 4.2% |
스 | 7 | 3.3% |
화 | 7 | 3.3% |
타 | 7 | 3.3% |
기 | 7 | 3.3% |
식 | 6 | 2.8% |
품 | 5 | 2.3% |
원 | 5 | 2.3% |
의 | 5 | 2.3% |
용 | 5 | 2.3% |
Other values (102) | 152 |
Uppercase Letter
Value | Count | Frequency (%) |
P | 1 | |
L | 1 | |
G | 1 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 14 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 215 | |
Common | 14 | 6.0% |
Latin | 3 | 1.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
점 | 9 | 4.2% |
스 | 7 | 3.3% |
화 | 7 | 3.3% |
타 | 7 | 3.3% |
기 | 7 | 3.3% |
식 | 6 | 2.8% |
품 | 5 | 2.3% |
원 | 5 | 2.3% |
의 | 5 | 2.3% |
용 | 5 | 2.3% |
Other values (102) | 152 |
Latin
Value | Count | Frequency (%) |
P | 1 | |
L | 1 | |
G | 1 |
Common
Value | Count | Frequency (%) |
/ | 14 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 215 | |
ASCII | 17 | 7.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
/ | 14 | |
P | 1 | 5.9% |
L | 1 | 5.9% |
G | 1 | 5.9% |
Hangul
Value | Count | Frequency (%) |
점 | 9 | 4.2% |
스 | 7 | 3.3% |
화 | 7 | 3.3% |
타 | 7 | 3.3% |
기 | 7 | 3.3% |
식 | 6 | 2.8% |
품 | 5 | 2.3% |
원 | 5 | 2.3% |
의 | 5 | 2.3% |
용 | 5 | 2.3% |
Other values (102) | 152 |
대분류코드(SF_L_UPJONG_CD) | 대분류코드(SF_L_UPJONG_NM) | 중분류코드(SF_M_UPJONG_CD) | 중분류코드(SF_M_UPJONG_NM) | 외국인관광업종코드(SF_UPJONG_CD) | 외국인관광업종분류(SF_UPJONG_NM) | |
---|---|---|---|---|---|---|
대분류코드(SF_L_UPJONG_CD) | 1.000 | 1.000 | 0.999 | 1.000 | 1.000 | 1.000 |
대분류코드(SF_L_UPJONG_NM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
중분류코드(SF_M_UPJONG_CD) | 0.999 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
중분류코드(SF_M_UPJONG_NM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
외국인관광업종코드(SF_UPJONG_CD) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
외국인관광업종분류(SF_UPJONG_NM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
대분류코드(SF_L_UPJONG_NM) | 중분류코드(SF_M_UPJONG_NM) | |
---|---|---|
대분류코드(SF_L_UPJONG_NM) | 1.000 | 0.830 |
중분류코드(SF_M_UPJONG_NM) | 0.830 | 1.000 |
대분류코드(SF_L_UPJONG_CD) | 중분류코드(SF_M_UPJONG_CD) | 대분류코드(SF_L_UPJONG_NM) | 중분류코드(SF_M_UPJONG_NM) | |
---|---|---|---|---|
대분류코드(SF_L_UPJONG_CD) | 1.000 | 0.993 | 0.989 | 0.821 |
중분류코드(SF_M_UPJONG_CD) | 0.993 | 1.000 | 0.989 | 0.821 |
대분류코드(SF_L_UPJONG_NM) | 0.989 | 0.989 | 1.000 | 0.830 |
중분류코드(SF_M_UPJONG_NM) | 0.821 | 0.821 | 0.830 | 1.000 |
대분류코드(SF_L_UPJONG_CD) | 대분류코드(SF_L_UPJONG_NM) | 중분류코드(SF_M_UPJONG_CD) | 중분류코드(SF_M_UPJONG_NM) | 외국인관광업종코드(SF_UPJONG_CD) | 외국인관광업종분류(SF_UPJONG_NM) | |
---|---|---|---|---|---|---|
0 | 1 | 요식/유흥 | 101 | 한식 | sf010101 | 한식 |
1 | 1 | 요식/유흥 | 102 | 일식/중식/양식 | sf010202 | 일식 |
2 | 1 | 요식/유흥 | 102 | 일식/중식/양식 | sf010203 | 양식 |
3 | 1 | 요식/유흥 | 102 | 일식/중식/양식 | sf010204 | 중식 |
4 | 1 | 요식/유흥 | 103 | 제과/커피/패스트푸드 | sf010305 | 제과점 |
5 | 1 | 요식/유흥 | 103 | 제과/커피/패스트푸드 | sf010306 | 커피전문점 |
6 | 1 | 요식/유흥 | 103 | 제과/커피/패스트푸드 | sf010307 | 패스트푸드 |
7 | 1 | 요식/유흥 | 104 | 기타요식 | sf010408 | 기타요식 |
8 | 1 | 요식/유흥 | 105 | 유흥 | sf010509 | 노래방 |
9 | 1 | 요식/유흥 | 105 | 유흥 | sf010510 | 기타유흥업소 |
대분류코드(SF_L_UPJONG_CD) | 대분류코드(SF_L_UPJONG_NM) | 중분류코드(SF_M_UPJONG_CD) | 중분류코드(SF_M_UPJONG_NM) | 외국인관광업종코드(SF_UPJONG_CD) | 외국인관광업종분류(SF_UPJONG_NM) | |
---|---|---|---|---|---|---|
46 | 8 | 의료 | 820 | 병원 | sf082047 | 한의원 |
47 | 8 | 의료 | 821 | 약국 | sf082148 | 약국 |
48 | 8 | 의료 | 822 | 기타의료 | sf082249 | 기타의료 |
49 | 9 | 가전/가구 | 923 | 가전/가구 | sf092350 | 가전 |
50 | 9 | 가전/가구 | 923 | 가전/가구 | sf092351 | 가구 |
51 | 9 | 가전/가구 | 923 | 가전/가구 | sf092352 | 기타가전/가구 |
52 | 10 | 자동차 | 1024 | 자동차서비스/용품 | sf102453 | 자동차서비스 |
53 | 10 | 자동차 | 1024 | 자동차서비스/용품 | sf102454 | 자동차용품 |
54 | 11 | 주유 | 1125 | 주유 | sf112555 | 주유소 |
55 | 11 | 주유 | 1125 | 주유 | sf112556 | LPG |