Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 75 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.5 KiB |
Average record size in memory | 33.8 B |
Variable types
Text | 2 |
---|---|
Categorical | 2 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 신한카드 |
URL | https://bigdata.seoul.go.kr/data/selectSampleData.do?sample_data_seq=318 |
대분류(CLASS1) is highly overall correlated with 중분류(CLASS2) | High correlation |
중분류(CLASS2) is highly overall correlated with 대분류(CLASS1) | High correlation |
업종코드(UPJONG_CD) has unique values | Unique |
소분류(CLASS3) has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 14:58:47.893814 |
---|---|
Analysis finished | 2023-12-10 14:58:48.601318 |
Duration | 0.71 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업종코드(UPJONG_CD)
Text
UNIQUE
 
Distinct | 75 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
Value | Count | Frequency (%) |
ss001 | 1 | 1.3% |
ss041 | 1 | 1.3% |
ss058 | 1 | 1.3% |
ss057 | 1 | 1.3% |
ss056 | 1 | 1.3% |
ss055 | 1 | 1.3% |
ss054 | 1 | 1.3% |
ss053 | 1 | 1.3% |
ss052 | 1 | 1.3% |
ss050 | 1 | 1.3% |
Other values (65) | 65 |
Most occurring characters
Value | Count | Frequency (%) |
s | 150 | |
0 | 92 | |
3 | 19 | 5.1% |
1 | 18 | 4.8% |
4 | 18 | 4.8% |
2 | 17 | 4.5% |
6 | 16 | 4.3% |
5 | 15 | 4.0% |
8 | 11 | 2.9% |
9 | 11 | 2.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 225 | |
Lowercase Letter | 150 |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 92 | |
3 | 19 | 8.4% |
1 | 18 | 8.0% |
4 | 18 | 8.0% |
2 | 17 | 7.6% |
6 | 16 | 7.1% |
5 | 15 | 6.7% |
8 | 11 | 4.9% |
9 | 11 | 4.9% |
7 | 8 | 3.6% |
Lowercase Letter
Value | Count | Frequency (%) |
s | 150 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 225 | |
Latin | 150 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 92 | |
3 | 19 | 8.4% |
1 | 18 | 8.0% |
4 | 18 | 8.0% |
2 | 17 | 7.6% |
6 | 16 | 7.1% |
5 | 15 | 6.7% |
8 | 11 | 4.9% |
9 | 11 | 4.9% |
7 | 8 | 3.6% |
Latin
Value | Count | Frequency (%) |
s | 150 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 375 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
s | 150 | |
0 | 92 | |
3 | 19 | 5.1% |
1 | 18 | 4.8% |
4 | 18 | 4.8% |
2 | 17 | 4.5% |
6 | 16 | 4.3% |
5 | 15 | 4.0% |
8 | 11 | 2.9% |
9 | 11 | 2.9% |
대분류(CLASS1)
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 18.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
스포츠/문화/레저 | |
---|---|
요식/유흥 | |
교육/학원 | |
유통 | |
여행/교통 | |
Other values (9) |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 5.12 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 요식/유흥 |
---|---|
2nd row | 요식/유흥 |
3rd row | 요식/유흥 |
4th row | 요식/유흥 |
5th row | 요식/유흥 |
Common Values
Value | Count | Frequency (%) |
스포츠/문화/레저 | 12 | |
요식/유흥 | 11 | |
교육/학원 | 7 | |
유통 | 6 | |
여행/교통 | 6 | |
가정생활/서비스 | 6 | |
의료 | 6 | |
의류/잡화 | 4 | 5.3% |
음/식료품 | 3 | 4.0% |
미용 | 3 | 4.0% |
Other values (4) | 11 |
Length
Value | Count | Frequency (%) |
스포츠/문화/레저 | 12 | |
요식/유흥 | 11 | |
교육/학원 | 7 | |
유통 | 6 | |
여행/교통 | 6 | |
가정생활/서비스 | 6 | |
의료 | 6 | |
의류/잡화 | 4 | 5.3% |
음/식료품 | 3 | 4.0% |
미용 | 3 | 4.0% |
Other values (4) | 11 |
중분류(CLASS2)
Categorical
HIGH CORRELATION
 
Distinct | 33 |
---|---|
Distinct (%) | 44.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
스포츠/문화/레저 | |
---|---|
학원 | 5 |
병원 | 4 |
음/식료품 | 3 |
서비스 | 3 |
Other values (28) |
Length
Max length | 11 |
---|---|
Median length | 9 |
Mean length | 5.16 |
Min length | 2 |
Unique
Unique | 14 ? |
---|---|
Unique (%) | 18.7% |
Sample
1st row | 한식 |
---|---|
2nd row | 일식/중식/양식 |
3rd row | 일식/중식/양식 |
4th row | 일식/중식/양식 |
5th row | 제과/커피/패스트푸드 |
Common Values
Value | Count | Frequency (%) |
스포츠/문화/레저 | 9 | 12.0% |
학원 | 5 | 6.7% |
병원 | 4 | 5.3% |
음/식료품 | 3 | 4.0% |
서비스 | 3 | 4.0% |
일식/중식/양식 | 3 | 4.0% |
여행 | 3 | 4.0% |
스포츠/문화/레저용품 | 3 | 4.0% |
전자상거래 | 3 | 4.0% |
가전/가구 | 3 | 4.0% |
Other values (23) | 36 |
Length
Value | Count | Frequency (%) |
스포츠/문화/레저 | 9 | 12.0% |
학원 | 5 | 6.7% |
병원 | 4 | 5.3% |
음/식료품 | 3 | 4.0% |
서비스 | 3 | 4.0% |
일식/중식/양식 | 3 | 4.0% |
여행 | 3 | 4.0% |
스포츠/문화/레저용품 | 3 | 4.0% |
전자상거래 | 3 | 4.0% |
가전/가구 | 3 | 4.0% |
Other values (23) | 36 |
소분류(CLASS3)
Text
UNIQUE
 
Distinct | 75 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 732.0 B |
Value | Count | Frequency (%) |
한식 | 1 | 1.3% |
미용실 | 1 | 1.3% |
약국 | 1 | 1.3% |
한의원 | 1 | 1.3% |
치과병원 | 1 | 1.3% |
일반병원 | 1 | 1.3% |
종합병원 | 1 | 1.3% |
교육용품 | 1 | 1.3% |
유아교육 | 1 | 1.3% |
독서실 | 1 | 1.3% |
Other values (65) | 65 |
Most occurring characters
Value | Count | Frequency (%) |
/ | 13 | 4.2% |
원 | 9 | 2.9% |
점 | 9 | 2.9% |
스 | 9 | 2.9% |
타 | 7 | 2.3% |
화 | 7 | 2.3% |
기 | 7 | 2.3% |
품 | 6 | 2.0% |
식 | 6 | 2.0% |
서 | 6 | 2.0% |
Other values (134) | 227 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 286 | |
Other Punctuation | 13 | 4.2% |
Uppercase Letter | 5 | 1.6% |
Open Punctuation | 1 | 0.3% |
Close Punctuation | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
원 | 9 | 3.1% |
점 | 9 | 3.1% |
스 | 9 | 3.1% |
타 | 7 | 2.4% |
화 | 7 | 2.4% |
기 | 7 | 2.4% |
품 | 6 | 2.1% |
식 | 6 | 2.1% |
서 | 6 | 2.1% |
용 | 6 | 2.1% |
Other values (128) | 214 |
Uppercase Letter
Value | Count | Frequency (%) |
P | 2 | |
G | 2 | |
L | 1 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 13 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 286 | |
Common | 15 | 4.9% |
Latin | 5 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
원 | 9 | 3.1% |
점 | 9 | 3.1% |
스 | 9 | 3.1% |
타 | 7 | 2.4% |
화 | 7 | 2.4% |
기 | 7 | 2.4% |
품 | 6 | 2.1% |
식 | 6 | 2.1% |
서 | 6 | 2.1% |
용 | 6 | 2.1% |
Other values (128) | 214 |
Common
Value | Count | Frequency (%) |
/ | 13 | |
( | 1 | 6.7% |
) | 1 | 6.7% |
Latin
Value | Count | Frequency (%) |
P | 2 | |
G | 2 | |
L | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 286 | |
ASCII | 20 | 6.5% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
/ | 13 | |
P | 2 | 10.0% |
G | 2 | 10.0% |
( | 1 | 5.0% |
L | 1 | 5.0% |
) | 1 | 5.0% |
Hangul
Value | Count | Frequency (%) |
원 | 9 | 3.1% |
점 | 9 | 3.1% |
스 | 9 | 3.1% |
타 | 7 | 2.4% |
화 | 7 | 2.4% |
기 | 7 | 2.4% |
품 | 6 | 2.1% |
식 | 6 | 2.1% |
서 | 6 | 2.1% |
용 | 6 | 2.1% |
Other values (128) | 214 |
업종코드(UPJONG_CD) | 대분류(CLASS1) | 중분류(CLASS2) | 소분류(CLASS3) | |
---|---|---|---|---|
업종코드(UPJONG_CD) | 1.000 | 1.000 | 1.000 | 1.000 |
대분류(CLASS1) | 1.000 | 1.000 | 1.000 | 1.000 |
중분류(CLASS2) | 1.000 | 1.000 | 1.000 | 1.000 |
소분류(CLASS3) | 1.000 | 1.000 | 1.000 | 1.000 |
중분류(CLASS2) | 대분류(CLASS1) | |
---|---|---|
중분류(CLASS2) | 1.000 | 0.830 |
대분류(CLASS1) | 0.830 | 1.000 |
대분류(CLASS1) | 중분류(CLASS2) | |
---|---|---|
대분류(CLASS1) | 1.000 | 0.830 |
중분류(CLASS2) | 0.830 | 1.000 |
업종코드(UPJONG_CD) | 대분류(CLASS1) | 중분류(CLASS2) | 소분류(CLASS3) | |
---|---|---|---|---|
0 | ss001 | 요식/유흥 | 한식 | 한식 |
1 | ss002 | 요식/유흥 | 일식/중식/양식 | 일식 |
2 | ss003 | 요식/유흥 | 일식/중식/양식 | 양식 |
3 | ss004 | 요식/유흥 | 일식/중식/양식 | 중식 |
4 | ss005 | 요식/유흥 | 제과/커피/패스트푸드 | 제과점 |
5 | ss006 | 요식/유흥 | 제과/커피/패스트푸드 | 커피전문점 |
6 | ss007 | 요식/유흥 | 제과/커피/패스트푸드 | 패스트푸드 |
7 | ss008 | 요식/유흥 | 기타요식 | 기타요식 |
8 | ss009 | 요식/유흥 | 유흥 | 노래방 |
9 | ss010 | 요식/유흥 | 유흥 | 기타유흥업소 |
업종코드(UPJONG_CD) | 대분류(CLASS1) | 중분류(CLASS2) | 소분류(CLASS3) | |
---|---|---|---|---|
65 | ss069 | 전자상거래 | 전자상거래 | 결제대행(PG) |
66 | ss070 | 전자상거래 | 전자상거래 | 홈쇼핑 |
67 | ss081 | 스포츠/문화/레저 | 스포츠/문화/레저 | 실내골프 |
68 | ss082 | 스포츠/문화/레저 | 스포츠/문화/레저 | 헬스 |
69 | ss083 | 스포츠/문화/레저 | 스포츠/문화/레저 | 실외골프 |
70 | ss084 | 스포츠/문화/레저 | 스포츠/문화/레저 | 스키 |
71 | ss090 | 교육/학원 | 학원 | 입시보습학원 |
72 | ss091 | 교육/학원 | 학원 | 외국어학원 |
73 | ss092 | 교육/학원 | 학원 | 예체능학원 |
74 | ss093 | 교육/학원 | 학원 | 취미/전문학원 |