Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 355 |
Missing cells | 184 |
Missing cells (%) | 8.6% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 16.8 KiB |
Average record size in memory | 48.4 B |
Variable types
Categorical | 3 |
---|---|
Text | 3 |
Dataset
Description | 제주특별자치도에 소재하고 있는 일반여행업(종합여행업)과 관련한 데이터로 상호명, 소재지, 연락처 등의 정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15056289/fileData.do |
데이터기준일자 is highly overall correlated with 구분 and 1 other fields | High correlation |
구분 is highly overall correlated with 비고 and 1 other fields | High correlation |
비고 is highly overall correlated with 구분 and 1 other fields | High correlation |
구분 is highly imbalanced (97.2%) | Imbalance |
비고 is highly imbalanced (92.6%) | Imbalance |
데이터기준일자 is highly imbalanced (97.2%) | Imbalance |
연락처 has 182 (51.3%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 05:07:48.476698 |
---|---|
Analysis finished | 2023-12-12 05:07:49.366455 |
Duration | 0.89 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
종합여행업 | |
---|---|
<NA> | 1 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9971831 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 종합여행업 |
---|---|
2nd row | 종합여행업 |
3rd row | 종합여행업 |
4th row | 종합여행업 |
5th row | 종합여행업 |
Common Values
Value | Count | Frequency (%) |
종합여행업 | 354 | |
<NA> | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
종합여행업 | 354 | |
na | 1 | 0.3% |
상호명
Text
Distinct | 354 |
---|---|
Distinct (%) | 100.0% |
Missing | 1 |
Missing (%) | 0.3% |
Memory size | 2.9 KiB |
Length
Max length | 19 |
---|---|
Median length | 15 |
Mean length | 8.9971751 |
Min length | 3 |
Characters and Unicode
Total characters | 3185 |
---|---|
Distinct characters | 336 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 354 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 주식회사 카카오 |
---|---|
2nd row | (주)해여여행사 |
3rd row | (주)제주몬 |
4th row | 주식회사 제주오라투어 |
5th row | 주식회사 헤이스타즈 |
Value | Count | Frequency (%) |
주식회사 | 143 | 27.3% |
투어 | 6 | 1.1% |
유한회사 | 3 | 0.6% |
주 | 3 | 0.6% |
여행사 | 2 | 0.4% |
제주 | 2 | 0.4% |
주)리앤최투어 | 1 | 0.2% |
신화한국여행사 | 1 | 0.2% |
골프부킹황제 | 1 | 0.2% |
주)투어웨이 | 1 | 0.2% |
Other values (360) | 360 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 358 | 11.2% |
사 | 242 | 7.6% |
170 | 5.3% | |
회 | 150 | 4.7% |
( | 149 | 4.7% |
) | 149 | 4.7% |
식 | 146 | 4.6% |
제 | 126 | 4.0% |
여 | 112 | 3.5% |
행 | 110 | 3.5% |
Other values (326) | 1473 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2682 | |
Space Separator | 170 | 5.3% |
Open Punctuation | 149 | 4.7% |
Close Punctuation | 149 | 4.7% |
Lowercase Letter | 14 | 0.4% |
Other Symbol | 10 | 0.3% |
Uppercase Letter | 6 | 0.2% |
Decimal Number | 4 | 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 358 | 13.3% |
사 | 242 | 9.0% |
회 | 150 | 5.6% |
식 | 146 | 5.4% |
제 | 126 | 4.7% |
여 | 112 | 4.2% |
행 | 110 | 4.1% |
투 | 109 | 4.1% |
어 | 109 | 4.1% |
이 | 64 | 2.4% |
Other values (302) | 1156 |
Lowercase Letter
Value | Count | Frequency (%) |
r | 3 | |
o | 3 | |
e | 2 | |
v | 1 | 7.1% |
a | 1 | 7.1% |
u | 1 | 7.1% |
c | 1 | 7.1% |
s | 1 | 7.1% |
i | 1 | 7.1% |
Uppercase Letter
Value | Count | Frequency (%) |
K | 1 | |
G | 1 | |
A | 1 | |
O | 1 | |
T | 1 | |
D | 1 |
Decimal Number
Value | Count | Frequency (%) |
3 | 1 | |
2 | 1 | |
4 | 1 | |
8 | 1 |
Space Separator
Value | Count | Frequency (%) |
170 |
Open Punctuation
Value | Count | Frequency (%) |
( | 149 |
Close Punctuation
Value | Count | Frequency (%) |
) | 149 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 10 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2692 | |
Common | 473 | 14.9% |
Latin | 20 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 358 | 13.3% |
사 | 242 | 9.0% |
회 | 150 | 5.6% |
식 | 146 | 5.4% |
제 | 126 | 4.7% |
여 | 112 | 4.2% |
행 | 110 | 4.1% |
투 | 109 | 4.0% |
어 | 109 | 4.0% |
이 | 64 | 2.4% |
Other values (303) | 1166 |
Latin
Value | Count | Frequency (%) |
r | 3 | |
o | 3 | |
e | 2 | 10.0% |
v | 1 | 5.0% |
K | 1 | 5.0% |
a | 1 | 5.0% |
G | 1 | 5.0% |
A | 1 | 5.0% |
O | 1 | 5.0% |
T | 1 | 5.0% |
Other values (5) | 5 |
Common
Value | Count | Frequency (%) |
170 | ||
( | 149 | |
) | 149 | |
- | 1 | 0.2% |
3 | 1 | 0.2% |
2 | 1 | 0.2% |
4 | 1 | 0.2% |
8 | 1 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2682 | |
ASCII | 493 | 15.5% |
None | 10 | 0.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 358 | 13.3% |
사 | 242 | 9.0% |
회 | 150 | 5.6% |
식 | 146 | 5.4% |
제 | 126 | 4.7% |
여 | 112 | 4.2% |
행 | 110 | 4.1% |
투 | 109 | 4.1% |
어 | 109 | 4.1% |
이 | 64 | 2.4% |
Other values (302) | 1156 |
ASCII
Value | Count | Frequency (%) |
170 | ||
( | 149 | |
) | 149 | |
r | 3 | 0.6% |
o | 3 | 0.6% |
e | 2 | 0.4% |
- | 1 | 0.2% |
3 | 1 | 0.2% |
2 | 1 | 0.2% |
4 | 1 | 0.2% |
Other values (13) | 13 | 2.6% |
None
Value | Count | Frequency (%) |
㈜ | 10 |
소재지
Text
Distinct | 294 |
---|---|
Distinct (%) | 83.1% |
Missing | 1 |
Missing (%) | 0.3% |
Memory size | 2.9 KiB |
Length
Max length | 37 |
---|---|
Median length | 31 |
Mean length | 23.596045 |
Min length | 18 |
Characters and Unicode
Total characters | 8353 |
---|---|
Distinct characters | 208 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 264 ? |
---|---|
Unique (%) | 74.6% |
Sample
1st row | 제주특별자치도 제주시 첨단로 242 |
---|---|
2nd row | 제주특별자치도 제주시 신대로 70 4층 |
3rd row | 제주특별자치도 제주시 월성로4길 76-2 비동 |
4th row | 제주특별자치도 제주시 연동13길 5 도호빌딩 2층 |
5th row | 제주특별자치도 제주시 중앙로 217 제주벤처마루 3층 |
Value | Count | Frequency (%) |
제주특별자치도 | 354 | |
제주시 | 334 | |
2층 | 73 | 4.2% |
1층 | 39 | 2.3% |
3층 | 34 | 2.0% |
연북로 | 29 | 1.7% |
도령로 | 28 | 1.6% |
92 | 22 | 1.3% |
진현빌딩 | 22 | 1.3% |
서귀포시 | 20 | 1.2% |
Other values (423) | 767 |
Most occurring characters
Value | Count | Frequency (%) |
1543 | ||
주 | 707 | 8.5% |
제 | 696 | 8.3% |
도 | 390 | 4.7% |
시 | 355 | 4.2% |
특 | 354 | 4.2% |
별 | 354 | 4.2% |
자 | 354 | 4.2% |
치 | 354 | 4.2% |
로 | 284 | 3.4% |
Other values (198) | 2962 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5513 | |
Space Separator | 1543 | 18.5% |
Decimal Number | 1228 | 14.7% |
Dash Punctuation | 56 | 0.7% |
Uppercase Letter | 13 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 707 | |
제 | 696 | |
도 | 390 | 7.1% |
시 | 355 | 6.4% |
특 | 354 | 6.4% |
별 | 354 | 6.4% |
자 | 354 | 6.4% |
치 | 354 | 6.4% |
로 | 284 | 5.2% |
층 | 172 | 3.1% |
Other values (181) | 1493 |
Decimal Number
Value | Count | Frequency (%) |
1 | 267 | |
2 | 257 | |
3 | 133 | |
5 | 103 | 8.4% |
4 | 101 | 8.2% |
6 | 87 | 7.1% |
7 | 84 | 6.8% |
9 | 77 | 6.3% |
0 | 68 | 5.5% |
8 | 51 | 4.2% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 4 | |
B | 4 | |
C | 3 | |
J | 1 | 7.7% |
I | 1 | 7.7% |
Space Separator
Value | Count | Frequency (%) |
1543 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 56 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5513 | |
Common | 2827 | |
Latin | 13 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 707 | |
제 | 696 | |
도 | 390 | 7.1% |
시 | 355 | 6.4% |
특 | 354 | 6.4% |
별 | 354 | 6.4% |
자 | 354 | 6.4% |
치 | 354 | 6.4% |
로 | 284 | 5.2% |
층 | 172 | 3.1% |
Other values (181) | 1493 |
Common
Value | Count | Frequency (%) |
1543 | ||
1 | 267 | 9.4% |
2 | 257 | 9.1% |
3 | 133 | 4.7% |
5 | 103 | 3.6% |
4 | 101 | 3.6% |
6 | 87 | 3.1% |
7 | 84 | 3.0% |
9 | 77 | 2.7% |
0 | 68 | 2.4% |
Other values (2) | 107 | 3.8% |
Latin
Value | Count | Frequency (%) |
S | 4 | |
B | 4 | |
C | 3 | |
J | 1 | 7.7% |
I | 1 | 7.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5513 | |
ASCII | 2840 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1543 | ||
1 | 267 | 9.4% |
2 | 257 | 9.0% |
3 | 133 | 4.7% |
5 | 103 | 3.6% |
4 | 101 | 3.6% |
6 | 87 | 3.1% |
7 | 84 | 3.0% |
9 | 77 | 2.7% |
0 | 68 | 2.4% |
Other values (7) | 120 | 4.2% |
Hangul
Value | Count | Frequency (%) |
주 | 707 | |
제 | 696 | |
도 | 390 | 7.1% |
시 | 355 | 6.4% |
특 | 354 | 6.4% |
별 | 354 | 6.4% |
자 | 354 | 6.4% |
치 | 354 | 6.4% |
로 | 284 | 5.2% |
층 | 172 | 3.1% |
Other values (181) | 1493 |
연락처
Text
MISSING
 
Distinct | 172 |
---|---|
Distinct (%) | 99.4% |
Missing | 182 |
Missing (%) | 51.3% |
Memory size | 2.9 KiB |
Length
Max length | 13 |
---|---|
Median length | 12 |
Mean length | 11.99422 |
Min length | 9 |
Characters and Unicode
Total characters | 2075 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 171 ? |
---|---|
Unique (%) | 98.8% |
Sample
1st row | 1899-1326 |
---|---|
2nd row | 1800-7584 |
3rd row | 1544-5899 |
4th row | 070-7780-2300 |
5th row | 070-7773-9902 |
Value | Count | Frequency (%) |
064-742-8889 | 2 | 1.2% |
064-729-8251 | 1 | 0.6% |
064-725-0108 | 1 | 0.6% |
064-740-7800 | 1 | 0.6% |
064-738-2888 | 1 | 0.6% |
064-735-5511 | 1 | 0.6% |
064-733-4271 | 1 | 0.6% |
064-731-7900 | 1 | 0.6% |
064-731-4112 | 1 | 0.6% |
064-730-1100 | 1 | 0.6% |
Other values (162) | 162 |
Most occurring characters
Value | Count | Frequency (%) |
- | 343 | |
0 | 313 | |
4 | 289 | |
7 | 245 | |
6 | 230 | |
1 | 138 | |
8 | 126 | 6.1% |
2 | 122 | 5.9% |
5 | 95 | 4.6% |
9 | 87 | 4.2% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1732 | |
Dash Punctuation | 343 | 16.5% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 313 | |
4 | 289 | |
7 | 245 | |
6 | 230 | |
1 | 138 | |
8 | 126 | |
2 | 122 | 7.0% |
5 | 95 | 5.5% |
9 | 87 | 5.0% |
3 | 87 | 5.0% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 343 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 2075 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 343 | |
0 | 313 | |
4 | 289 | |
7 | 245 | |
6 | 230 | |
1 | 138 | |
8 | 126 | 6.1% |
2 | 122 | 5.9% |
5 | 95 | 4.6% |
9 | 87 | 4.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2075 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 343 | |
0 | 313 | |
4 | 289 | |
7 | 245 | |
6 | 230 | |
1 | 138 | |
8 | 126 | 6.1% |
2 | 122 | 5.9% |
5 | 95 | 4.6% |
9 | 87 | 4.2% |
비고
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
<NA> | |
---|---|
휴업중 | 4 |
전입 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.9830986 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 350 | |
휴업중 | 4 | 1.1% |
전입 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 350 | |
휴업중 | 4 | 1.1% |
전입 | 1 | 0.3% |
데이터기준일자
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.9 KiB |
2023-03-31 | |
---|---|
<NA> | 1 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.9830986 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 2023-03-31 |
---|---|
2nd row | 2023-03-31 |
3rd row | 2023-03-31 |
4th row | 2023-03-31 |
5th row | 2023-03-31 |
Common Values
Value | Count | Frequency (%) |
2023-03-31 | 354 | |
<NA> | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-03-31 | 354 | |
na | 1 | 0.3% |
비고 | |
---|---|
비고 | 1.000 |
데이터기준일자 | 구분 | 비고 | |
---|---|---|---|
데이터기준일자 | 1.000 | 1.000 | 1.000 |
구분 | 1.000 | 1.000 | 1.000 |
비고 | 1.000 | 1.000 | 1.000 |
구분 | 비고 | 데이터기준일자 | |
---|---|---|---|
구분 | 1.000 | 1.000 | 1.000 |
비고 | 1.000 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 |
구분 | 상호명 | 소재지 | 연락처 | 비고 | 데이터기준일자 | |
---|---|---|---|---|---|---|
0 | 종합여행업 | 주식회사 카카오 | 제주특별자치도 제주시 첨단로 242 | 1899-1326 | <NA> | 2023-03-31 |
1 | 종합여행업 | (주)해여여행사 | 제주특별자치도 제주시 신대로 70 4층 | 1800-7584 | <NA> | 2023-03-31 |
2 | 종합여행업 | (주)제주몬 | 제주특별자치도 제주시 월성로4길 76-2 비동 | 1544-5899 | <NA> | 2023-03-31 |
3 | 종합여행업 | 주식회사 제주오라투어 | 제주특별자치도 제주시 연동13길 5 도호빌딩 2층 | 070-7780-2300 | <NA> | 2023-03-31 |
4 | 종합여행업 | 주식회사 헤이스타즈 | 제주특별자치도 제주시 중앙로 217 제주벤처마루 3층 | 070-7773-9902 | <NA> | 2023-03-31 |
5 | 종합여행업 | 주식회사 로드투어 | 제주특별자치도 제주시 서광로27길 2 | 070-7723-2684 | <NA> | 2023-03-31 |
6 | 종합여행업 | (주)신정중한국제여행사 | 제주특별자치도 제주시 신대로 70 4층 | 070-4523-8779 | <NA> | 2023-03-31 |
7 | 종합여행업 | (주)대경미디어 | 제주특별자치도 제주시 도령로 128 삼무파크빌 | 070-4333-1613 | <NA> | 2023-03-31 |
8 | 종합여행업 | 주식회사 엘에스컴퍼니 | 제주특별자치도 제주시 청사로 11 4층 | 070-4263-1069 | <NA> | 2023-03-31 |
9 | 종합여행업 | 인제주여행사 | 제주특별자치도 제주시 용담로 17 1층 | 070-4105-3580 | <NA> | 2023-03-31 |
구분 | 상호명 | 소재지 | 연락처 | 비고 | 데이터기준일자 | |
---|---|---|---|---|---|---|
345 | 종합여행업 | 주식회사 더제인투어 | 제주특별자치도 제주시 광양6길 2 모던테라스 | <NA> | <NA> | 2023-03-31 |
346 | 종합여행업 | (주)더존관광개발 | 제주특별자치도 제주시 고마로9길 15 2층 | <NA> | <NA> | 2023-03-31 |
347 | 종합여행업 | (유)아주관광 | 제주특별자치도 제주시 고마로 21 | <NA> | <NA> | 2023-03-31 |
348 | 종합여행업 | 루카스 트레블 | 제주특별자치도 제주시 고마로 115 3층 | <NA> | <NA> | 2023-03-31 |
349 | 종합여행업 | 한국해양방송 주식회사 | 제주특별자치도 서귀포시 표선면 번영로 2524 | <NA> | <NA> | 2023-03-31 |
350 | 종합여행업 | 쿰다투어 | 제주특별자치도 서귀포시 표선면 번영로 2454 | <NA> | <NA> | 2023-03-31 |
351 | 종합여행업 | 화웨이㈜ | 제주특별자치도 서귀포시 이어도로 67 | <NA> | <NA> | 2023-03-31 |
352 | 종합여행업 | 주식회사 여행원 | 제주특별자치도 서귀포시 안덕면 화순로142번길 23 | <NA> | 전입 | 2023-03-31 |
353 | 종합여행업 | ㈜지유투어 | 제주특별자치도 서귀포시 신서귀로 97번길 51 | <NA> | <NA> | 2023-03-31 |
354 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |