Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 179 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 5.7 KiB |
Average record size in memory | 32.7 B |
Variable types
Text | 2 |
---|---|
Categorical | 2 |
Dataset
Description | 국내 유선 및 도선의 사업장 현황 정보 - 유선사업은 유선 및 유선장을 갖추고 수상에서 고기잡이, 관광, 그 밖의 유락을 위하여 선박을 대여하거나 유락하는 사람을 승선시키는 것 - 도선사업은 도선 및 도선장을 갖추고 내수면 또는 대통령령으로 정하는 바다목에서 사람을 운송하거나 사람과 물건을 운송하는 것 |
---|---|
URL | https://www.data.go.kr/data/15070406/fileData.do |
사무실_전화번호 is highly imbalanced (64.8%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 22:45:13.907924 |
---|---|
Analysis finished | 2023-12-12 22:45:14.329318 |
Duration | 0.42 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
사업장_상호명
Text
Distinct | 176 |
---|---|
Distinct (%) | 98.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Value | Count | Frequency (%) |
인천배낚시 | 3 | 1.5% |
해진유선 | 2 | 1.0% |
광복낚시 | 2 | 1.0% |
태원유선 | 2 | 1.0% |
도선 | 2 | 1.0% |
장승포유람선협회 | 1 | 0.5% |
노도도선운영위원회 | 1 | 0.5% |
㈜지세포관광 | 1 | 0.5% |
유람선협회 | 1 | 0.5% |
와현유람선협회 | 1 | 0.5% |
Other values (182) | 182 |
Most occurring characters
Value | Count | Frequency (%) |
도 | 71 | 5.1% |
선 | 66 | 4.8% |
호 | 58 | 4.2% |
유 | 51 | 3.7% |
) | 49 | 3.5% |
( | 49 | 3.5% |
회 | 43 | 3.1% |
해 | 36 | 2.6% |
람 | 27 | 2.0% |
운 | 27 | 2.0% |
Other values (220) | 905 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1231 | |
Close Punctuation | 49 | 3.5% |
Open Punctuation | 49 | 3.5% |
Space Separator | 19 | 1.4% |
Other Symbol | 18 | 1.3% |
Decimal Number | 16 | 1.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 71 | 5.8% |
선 | 66 | 5.4% |
호 | 58 | 4.7% |
유 | 51 | 4.1% |
회 | 43 | 3.5% |
해 | 36 | 2.9% |
람 | 27 | 2.2% |
운 | 27 | 2.2% |
주 | 22 | 1.8% |
영 | 22 | 1.8% |
Other values (210) | 808 |
Decimal Number
Value | Count | Frequency (%) |
2 | 6 | |
0 | 3 | |
1 | 3 | |
3 | 2 | 12.5% |
5 | 1 | 6.2% |
4 | 1 | 6.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 49 |
Open Punctuation
Value | Count | Frequency (%) |
( | 49 |
Space Separator
Value | Count | Frequency (%) |
19 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 18 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1249 | |
Common | 133 | 9.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 71 | 5.7% |
선 | 66 | 5.3% |
호 | 58 | 4.6% |
유 | 51 | 4.1% |
회 | 43 | 3.4% |
해 | 36 | 2.9% |
람 | 27 | 2.2% |
운 | 27 | 2.2% |
주 | 22 | 1.8% |
영 | 22 | 1.8% |
Other values (211) | 826 |
Common
Value | Count | Frequency (%) |
) | 49 | |
( | 49 | |
19 | 14.3% | |
2 | 6 | 4.5% |
0 | 3 | 2.3% |
1 | 3 | 2.3% |
3 | 2 | 1.5% |
5 | 1 | 0.8% |
4 | 1 | 0.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1231 | |
ASCII | 133 | 9.6% |
None | 18 | 1.3% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
도 | 71 | 5.8% |
선 | 66 | 5.4% |
호 | 58 | 4.7% |
유 | 51 | 4.1% |
회 | 43 | 3.5% |
해 | 36 | 2.9% |
람 | 27 | 2.2% |
운 | 27 | 2.2% |
주 | 22 | 1.8% |
영 | 22 | 1.8% |
Other values (210) | 808 |
ASCII
Value | Count | Frequency (%) |
) | 49 | |
( | 49 | |
19 | 14.3% | |
2 | 6 | 4.5% |
0 | 3 | 2.3% |
1 | 3 | 2.3% |
3 | 2 | 1.5% |
5 | 1 | 0.8% |
4 | 1 | 0.8% |
None
Value | Count | Frequency (%) |
㈜ | 18 |
업종
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 2.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
유선/면허 | |
---|---|
도선/면허 | |
유선/신고 | 4 |
도선/신고 | 2 |
유선/면하 | 1 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | 유선/면허 |
---|---|
2nd row | 유선/면허 |
3rd row | 유선/면허 |
4th row | 유선/면허 |
5th row | 유선/면허 |
Common Values
Value | Count | Frequency (%) |
유선/면허 | 106 | |
도선/면허 | 66 | |
유선/신고 | 4 | 2.2% |
도선/신고 | 2 | 1.1% |
유선/면하 | 1 | 0.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
유선/면허 | 106 | |
도선/면허 | 66 | |
유선/신고 | 4 | 2.2% |
도선/신고 | 2 | 1.1% |
유선/면하 | 1 | 0.6% |
사업장_소재지
Text
Distinct | 141 |
---|---|
Distinct (%) | 78.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
Length
Max length | 99 |
---|---|
Median length | 48 |
Mean length | 20.128492 |
Min length | 12 |
Characters and Unicode
Total characters | 3603 |
---|---|
Distinct characters | 190 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 124 ? |
---|---|
Unique (%) | 69.3% |
Sample
1st row | 인천광역시 중구 항동7가60번지 |
---|---|
2nd row | 인천광역시 중구 항동7가60번지 |
3rd row | 인천광역시 중구 항동7가60번지 |
4th row | 인천광역시 중구 항동7가60번지 |
5th row | 인천광역시 중구 항동7가60번지 |
Value | Count | Frequency (%) |
경남 | 45 | 6.5% |
전남 | 38 | 5.5% |
인천광역시 | 35 | 5.1% |
여수시 | 21 | 3.0% |
중구 | 21 | 3.0% |
거제시 | 16 | 2.3% |
항동7가100번지 | 11 | 1.6% |
옹진군 | 10 | 1.4% |
통영시 | 9 | 1.3% |
서귀포시 | 8 | 1.2% |
Other values (281) | 478 |
Most occurring characters
Value | Count | Frequency (%) |
514 | 14.3% | |
시 | 143 | 4.0% |
남 | 124 | 3.4% |
1 | 117 | 3.2% |
동 | 95 | 2.6% |
2 | 91 | 2.5% |
- | 83 | 2.3% |
면 | 80 | 2.2% |
3 | 76 | 2.1% |
도 | 74 | 2.1% |
Other values (180) | 2206 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2303 | |
Decimal Number | 621 | 17.2% |
Space Separator | 514 | 14.3% |
Dash Punctuation | 83 | 2.3% |
Open Punctuation | 35 | 1.0% |
Close Punctuation | 34 | 0.9% |
Other Punctuation | 13 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 143 | 6.2% |
남 | 124 | 5.4% |
동 | 95 | 4.1% |
면 | 80 | 3.5% |
도 | 74 | 3.2% |
지 | 69 | 3.0% |
군 | 69 | 3.0% |
번 | 68 | 3.0% |
리 | 66 | 2.9% |
산 | 60 | 2.6% |
Other values (165) | 1455 |
Decimal Number
Value | Count | Frequency (%) |
1 | 117 | |
2 | 91 | |
3 | 76 | |
0 | 65 | |
5 | 56 | |
7 | 52 | |
6 | 46 | 7.4% |
4 | 45 | 7.2% |
9 | 37 | 6.0% |
8 | 36 | 5.8% |
Space Separator
Value | Count | Frequency (%) |
514 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 83 |
Open Punctuation
Value | Count | Frequency (%) |
( | 35 |
Close Punctuation
Value | Count | Frequency (%) |
) | 34 |
Other Punctuation
Value | Count | Frequency (%) |
, | 13 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2303 | |
Common | 1300 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 143 | 6.2% |
남 | 124 | 5.4% |
동 | 95 | 4.1% |
면 | 80 | 3.5% |
도 | 74 | 3.2% |
지 | 69 | 3.0% |
군 | 69 | 3.0% |
번 | 68 | 3.0% |
리 | 66 | 2.9% |
산 | 60 | 2.6% |
Other values (165) | 1455 |
Common
Value | Count | Frequency (%) |
514 | ||
1 | 117 | 9.0% |
2 | 91 | 7.0% |
- | 83 | 6.4% |
3 | 76 | 5.8% |
0 | 65 | 5.0% |
5 | 56 | 4.3% |
7 | 52 | 4.0% |
6 | 46 | 3.5% |
4 | 45 | 3.5% |
Other values (5) | 155 | 11.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2303 | |
ASCII | 1300 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
514 | ||
1 | 117 | 9.0% |
2 | 91 | 7.0% |
- | 83 | 6.4% |
3 | 76 | 5.8% |
0 | 65 | 5.0% |
5 | 56 | 4.3% |
7 | 52 | 4.0% |
6 | 46 | 3.5% |
4 | 45 | 3.5% |
Other values (5) | 155 | 11.9% |
Hangul
Value | Count | Frequency (%) |
시 | 143 | 6.2% |
남 | 124 | 5.4% |
동 | 95 | 4.1% |
면 | 80 | 3.5% |
도 | 74 | 3.2% |
지 | 69 | 3.0% |
군 | 69 | 3.0% |
번 | 68 | 3.0% |
리 | 66 | 2.9% |
산 | 60 | 2.6% |
Other values (165) | 1455 |
사무실_전화번호
Categorical
IMBALANCE
 
Distinct | 37 |
---|---|
Distinct (%) | 20.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.5 KiB |
개인번호 | |
---|---|
061-749-4382 | 3 |
051-403-9098 | 1 |
063-461-1116 | 1 |
032-202-8965 | 1 |
Other values (32) |
Length
Max length | 12 |
---|---|
Median length | 4 |
Mean length | 5.698324 |
Min length | 4 |
Unique
Unique | 35 ? |
---|---|
Unique (%) | 19.6% |
Sample
1st row | 개인번호 |
---|---|
2nd row | 개인번호 |
3rd row | 개인번호 |
4th row | 개인번호 |
5th row | 개인번호 |
Common Values
Value | Count | Frequency (%) |
개인번호 | 141 | |
061-749-4382 | 3 | 1.7% |
051-403-9098 | 1 | 0.6% |
063-461-1116 | 1 | 0.6% |
032-202-8965 | 1 | 0.6% |
061-245-3222 | 1 | 0.6% |
041-934-6896 | 1 | 0.6% |
041-935-8959 | 1 | 0.6% |
041-631-0103 | 1 | 0.6% |
063-464-1919 | 1 | 0.6% |
Other values (27) | 27 | 15.1% |
Length
Value | Count | Frequency (%) |
개인번호 | 141 | |
061-749-4382 | 3 | 1.7% |
064-792-1188 | 1 | 0.6% |
064-738-5355 | 1 | 0.6% |
064-784-6163 | 1 | 0.6% |
064-796-3515 | 1 | 0.6% |
064-784-2335 | 1 | 0.6% |
064-733-1874 | 1 | 0.6% |
064-782-5271 | 1 | 0.6% |
064-783-0000 | 1 | 0.6% |
Other values (27) | 27 | 15.1% |
업종 | 사무실_전화번호 | |
---|---|---|
업종 | 1.000 | 0.794 |
사무실_전화번호 | 0.794 | 1.000 |
사무실_전화번호 | 업종 | |
---|---|---|
사무실_전화번호 | 1.000 | 0.469 |
업종 | 0.469 | 1.000 |
업종 | 사무실_전화번호 | |
---|---|---|
업종 | 1.000 | 0.469 |
사무실_전화번호 | 0.469 | 1.000 |
사업장_상호명 | 업종 | 사업장_소재지 | 사무실_전화번호 | |
---|---|---|---|---|
0 | 인천배낚시 | 유선/면허 | 인천광역시 중구 항동7가60번지 | 개인번호 |
1 | 금강스타유선 | 유선/면허 | 인천광역시 중구 항동7가60번지 | 개인번호 |
2 | 현주바다낚시 | 유선/면허 | 인천광역시 중구 항동7가60번지 | 개인번호 |
3 | (주)푸른 | 유선/면허 | 인천광역시 중구 항동7가60번지 | 개인번호 |
4 | 현대마린개발 | 유선/면허 | 인천광역시 중구 항동7가60번지 | 개인번호 |
5 | 국제유선 | 유선/면허 | 인천광역시 중구 항동7가100번지 | 개인번호 |
6 | 신나라유선 | 유선/면허 | 인천광역시 중구 항동7가100번지 | 개인번호 |
7 | 연안유선 | 유선/면허 | 인천광역시 중구 항동7가100번지 | 개인번호 |
8 | 킹콩낚시 | 유선/면허 | 인천광역시 중구 항동7가100번지 | 032-202-8965 |
9 | 하나유선 | 유선/면허 | 인천광역시 중구 항동7가100번지 | 개인번호 |
사업장_상호명 | 업종 | 사업장_소재지 | 사무실_전화번호 | |
---|---|---|---|---|
169 | 제이에스에이 | 유선/면허 | 서귀포시 서홍동707-5번지(서귀항) | 064-733-1874 |
170 | 파라다이스 | 유선/면허 | 서귀포시 서홍동707-5번지(서귀항) | 064-732-1717 |
171 | 호반호텔앤리조트 | 유선/면허 | 서귀포시 색달동 2950-5(성천포구) | 064-738-2111 |
172 | 제이엠 | 유선/면허 | 서귀포시 대포동 2184-1 | 064-739-7776 |
173 | 그린크루즈 | 유선/면허 | 서귀포시 안덕면 화순리636-15 | 064-792-1188 |
174 | 제주씨월드 | 유선/면하 | 서귀포시 성산읍 성산리347-5번지 | 064-784-2337 |
175 | 제주해양관광 | 유선/면허 | 서귀포시 성산읍 성산리347-5번지 | 064-784-6163 |
176 | 우도해운 | 도선/면허 | 제주시 우도면 서광리1401-3 | 064-782-5671 |
177 | 우림해운 | 도선/면허 | 제주시 우도면 서광리2395-5 | 064-784-2335 |
178 | 우도랜드 | 도선/면허 | 제주시 우도면 연평리1734-14 | 064-782-4210 |