Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 1576 |
Missing cells | 716 |
Missing cells (%) | 7.6% |
Duplicate rows | 2 |
Duplicate rows (%) | 0.1% |
Total size in memory | 74.0 KiB |
Average record size in memory | 48.1 B |
Variable types
Categorical | 3 |
---|---|
Text | 3 |
Dataset
Description | 청코드, 시설제원코드, 시설제원명 등으로 해운항만물류정보시스템(PORT-MIS)에서 사용하는 항만 시설 제원코드 정보를 조회 하여, 항구청코드, 시설코드, 시설서브코드, 시설한글명, 시설영문명에 대한 정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15119666/fileData.do |
Dataset has 2 (0.1%) duplicate rows | Duplicates |
시설이용구분 is highly overall correlated with 시설구분 | High correlation |
시설구분 is highly overall correlated with 시설이용구분 | High correlation |
시설이용구분 is highly imbalanced (53.7%) | Imbalance |
선석 구분 has 713 (45.2%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 03:58:47.210643 |
---|---|
Analysis finished | 2023-12-12 03:58:48.070516 |
Duration | 0.86 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
항만
Categorical
Distinct | 32 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 12.4 KiB |
부산항 | |
---|---|
인천항 | |
울산항 | |
광양여천항 | |
여수항 | |
Other values (27) |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.268401 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산항 |
---|---|
2nd row | 부산항 |
3rd row | 부산항 |
4th row | 부산항 |
5th row | 부산항 |
Common Values
Value | Count | Frequency (%) |
부산항 | 305 | |
인천항 | 172 | 10.9% |
울산항 | 135 | 8.6% |
광양여천항 | 102 | 6.5% |
여수항 | 79 | 5.0% |
포항신항 | 75 | 4.8% |
목포항 | 71 | 4.5% |
군산항 | 67 | 4.3% |
평택당진 | 60 | 3.8% |
대산항 | 57 | 3.6% |
Other values (22) | 453 |
Length
Value | Count | Frequency (%) |
부산항 | 305 | |
인천항 | 172 | 10.9% |
울산항 | 135 | 8.6% |
광양여천항 | 102 | 6.5% |
여수항 | 79 | 5.0% |
포항신항 | 75 | 4.8% |
목포항 | 71 | 4.5% |
군산항 | 67 | 4.3% |
평택당진 | 60 | 3.8% |
대산항 | 57 | 3.6% |
Other values (22) | 453 |
시설이용구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 12.4 KiB |
계류시설 M | |
---|---|
수역 W | |
기타 | 59 |
박지 A | 2 |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.4746193 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 계류시설 M |
---|---|
2nd row | 계류시설 M |
3rd row | 계류시설 M |
4th row | 계류시설 M |
5th row | 계류시설 M |
Common Values
Value | Count | Frequency (%) |
계류시설 M | 1221 | |
수역 W | 294 | 18.7% |
기타 | 59 | 3.7% |
박지 A | 2 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
계류시설 | 1221 | |
m | 1221 | |
수역 | 294 | 9.5% |
w | 294 | 9.5% |
기타 | 59 | 1.9% |
박지 | 2 | 0.1% |
a | 2 | 0.1% |
시설구분
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 12.4 KiB |
선석 B | |
---|---|
박지 A | |
돌핀 D | |
소형선부두 W | |
기타 | 79 |
Other values (9) |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 4.1110406 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 선석 B |
---|---|
2nd row | 선석 B |
3rd row | 선석 B |
4th row | 선석 B |
5th row | 선석 B |
Common Values
Value | Count | Frequency (%) |
선석 B | 814 | |
박지 A | 284 | 18.0% |
돌핀 D | 105 | 6.7% |
소형선부두 W | 93 | 5.9% |
기타 | 79 | 5.0% |
잔교 F | 43 | 2.7% |
안벽 Q | 41 | 2.6% |
선석 K | 40 | 2.5% |
선석 S | 31 | 2.0% |
조선소 Y | 27 | 1.7% |
Other values (4) | 19 | 1.2% |
Length
Value | Count | Frequency (%) |
선석 | 885 | |
b | 814 | |
박지 | 284 | 9.3% |
a | 284 | 9.3% |
돌핀 | 105 | 3.4% |
d | 105 | 3.4% |
w | 94 | 3.1% |
소형선부두 | 93 | 3.0% |
기타 | 79 | 2.6% |
잔교 | 43 | 1.4% |
Other values (12) | 271 | 8.9% |
시설명
Text
Distinct | 833 |
---|---|
Distinct (%) | 53.0% |
Missing | 3 |
Missing (%) | 0.2% |
Memory size | 12.4 KiB |
Value | Count | Frequency (%) |
부두 | 104 | 4.1% |
정박지 | 76 | 3.0% |
내항 | 47 | 1.9% |
제 | 43 | 1.7% |
박지 | 42 | 1.7% |
5부두 | 40 | 1.6% |
감천 | 38 | 1.5% |
북항 | 38 | 1.5% |
4부두 | 34 | 1.3% |
7부두 | 31 | 1.2% |
Other values (802) | 2044 |
Most occurring characters
Value | Count | Frequency (%) |
1023 | 10.2% | |
부 | 922 | 9.2% |
두 | 902 | 9.0% |
선 | 275 | 2.7% |
지 | 267 | 2.7% |
항 | 258 | 2.6% |
박 | 245 | 2.4% |
1 | 245 | 2.4% |
제 | 169 | 1.7% |
2 | 166 | 1.7% |
Other values (296) | 5536 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 7479 | |
Space Separator | 1023 | 10.2% |
Decimal Number | 839 | 8.4% |
Uppercase Letter | 449 | 4.5% |
Close Punctuation | 74 | 0.7% |
Open Punctuation | 74 | 0.7% |
Dash Punctuation | 49 | 0.5% |
Other Punctuation | 14 | 0.1% |
Lowercase Letter | 5 | < 0.1% |
Connector Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
부 | 922 | 12.3% |
두 | 902 | 12.1% |
선 | 275 | 3.7% |
지 | 267 | 3.6% |
항 | 258 | 3.4% |
박 | 245 | 3.3% |
제 | 169 | 2.3% |
신 | 138 | 1.8% |
정 | 136 | 1.8% |
석 | 127 | 1.7% |
Other values (251) | 4040 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 80 | |
A | 79 | |
W | 32 | 7.1% |
G | 29 | 6.5% |
K | 29 | 6.5% |
L | 27 | 6.0% |
O | 25 | 5.6% |
C | 22 | 4.9% |
E | 18 | 4.0% |
B | 13 | 2.9% |
Other values (13) | 95 |
Decimal Number
Value | Count | Frequency (%) |
1 | 245 | |
2 | 166 | |
3 | 91 | 10.8% |
5 | 69 | 8.2% |
4 | 68 | 8.1% |
0 | 51 | 6.1% |
6 | 48 | 5.7% |
7 | 47 | 5.6% |
8 | 43 | 5.1% |
9 | 11 | 1.3% |
Other Punctuation
Value | Count | Frequency (%) |
/ | 7 | |
, | 5 | |
· | 1 | 7.1% |
: | 1 | 7.1% |
Lowercase Letter
Value | Count | Frequency (%) |
i | 2 | |
l | 2 | |
c | 1 |
Space Separator
Value | Count | Frequency (%) |
1023 |
Close Punctuation
Value | Count | Frequency (%) |
) | 74 |
Open Punctuation
Value | Count | Frequency (%) |
( | 74 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 49 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 7479 | |
Common | 2075 | 20.7% |
Latin | 454 | 4.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
부 | 922 | 12.3% |
두 | 902 | 12.1% |
선 | 275 | 3.7% |
지 | 267 | 3.6% |
항 | 258 | 3.4% |
박 | 245 | 3.3% |
제 | 169 | 2.3% |
신 | 138 | 1.8% |
정 | 136 | 1.8% |
석 | 127 | 1.7% |
Other values (251) | 4040 |
Latin
Value | Count | Frequency (%) |
S | 80 | |
A | 79 | |
W | 32 | 7.0% |
G | 29 | 6.4% |
K | 29 | 6.4% |
L | 27 | 5.9% |
O | 25 | 5.5% |
C | 22 | 4.8% |
E | 18 | 4.0% |
B | 13 | 2.9% |
Other values (16) | 100 |
Common
Value | Count | Frequency (%) |
1023 | ||
1 | 245 | 11.8% |
2 | 166 | 8.0% |
3 | 91 | 4.4% |
) | 74 | 3.6% |
( | 74 | 3.6% |
5 | 69 | 3.3% |
4 | 68 | 3.3% |
0 | 51 | 2.5% |
- | 49 | 2.4% |
Other values (9) | 165 | 8.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 7479 | |
ASCII | 2528 | 25.3% |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1023 | ||
1 | 245 | 9.7% |
2 | 166 | 6.6% |
3 | 91 | 3.6% |
S | 80 | 3.2% |
A | 79 | 3.1% |
) | 74 | 2.9% |
( | 74 | 2.9% |
5 | 69 | 2.7% |
4 | 68 | 2.7% |
Other values (34) | 559 |
Hangul
Value | Count | Frequency (%) |
부 | 922 | 12.3% |
두 | 902 | 12.1% |
선 | 275 | 3.7% |
지 | 267 | 3.6% |
항 | 258 | 3.4% |
박 | 245 | 3.3% |
제 | 169 | 2.3% |
신 | 138 | 1.8% |
정 | 136 | 1.8% |
석 | 127 | 1.7% |
Other values (251) | 4040 |
None
Value | Count | Frequency (%) |
· | 1 |
선석 구분
Text
MISSING
 
Distinct | 442 |
---|---|
Distinct (%) | 51.2% |
Missing | 713 |
Missing (%) | 45.2% |
Memory size | 12.4 KiB |
Value | Count | Frequency (%) |
선석 | 99 | 9.1% |
1선석 | 36 | 3.3% |
2선석 | 34 | 3.1% |
1 | 32 | 2.9% |
2 | 31 | 2.9% |
a | 26 | 2.4% |
3선석 | 26 | 2.4% |
3 | 25 | 2.3% |
b | 25 | 2.3% |
4선석 | 16 | 1.5% |
Other values (330) | 737 |
Most occurring characters
Value | Count | Frequency (%) |
선 | 589 | |
석 | 589 | |
1 | 300 | 9.0% |
2 | 262 | 7.9% |
225 | 6.8% | |
3 | 185 | 5.6% |
4 | 150 | 4.5% |
5 | 111 | 3.3% |
6 | 82 | 2.5% |
7 | 68 | 2.0% |
Other values (50) | 758 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1543 | |
Decimal Number | 1270 | |
Uppercase Letter | 246 | 7.4% |
Space Separator | 225 | 6.8% |
Dash Punctuation | 19 | 0.6% |
Open Punctuation | 8 | 0.2% |
Close Punctuation | 8 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
선 | 589 | |
석 | 589 | |
번 | 66 | 4.3% |
부 | 59 | 3.8% |
두 | 59 | 3.8% |
지 | 52 | 3.4% |
박 | 40 | 2.6% |
묘 | 12 | 0.8% |
돌 | 9 | 0.6% |
핀 | 9 | 0.6% |
Other values (18) | 59 | 3.8% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 56 | |
B | 36 | |
W | 33 | |
E | 19 | 7.7% |
P | 13 | 5.3% |
K | 13 | 5.3% |
T | 13 | 5.3% |
S | 12 | 4.9% |
N | 10 | 4.1% |
M | 10 | 4.1% |
Other values (8) | 31 |
Decimal Number
Value | Count | Frequency (%) |
1 | 300 | |
2 | 262 | |
3 | 185 | |
4 | 150 | |
5 | 111 | 8.7% |
6 | 82 | 6.5% |
7 | 68 | 5.4% |
0 | 48 | 3.8% |
8 | 43 | 3.4% |
9 | 21 | 1.7% |
Space Separator
Value | Count | Frequency (%) |
225 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 19 |
Open Punctuation
Value | Count | Frequency (%) |
( | 8 |
Close Punctuation
Value | Count | Frequency (%) |
) | 8 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1543 | |
Common | 1530 | |
Latin | 246 | 7.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
선 | 589 | |
석 | 589 | |
번 | 66 | 4.3% |
부 | 59 | 3.8% |
두 | 59 | 3.8% |
지 | 52 | 3.4% |
박 | 40 | 2.6% |
묘 | 12 | 0.8% |
돌 | 9 | 0.6% |
핀 | 9 | 0.6% |
Other values (18) | 59 | 3.8% |
Latin
Value | Count | Frequency (%) |
A | 56 | |
B | 36 | |
W | 33 | |
E | 19 | 7.7% |
P | 13 | 5.3% |
K | 13 | 5.3% |
T | 13 | 5.3% |
S | 12 | 4.9% |
N | 10 | 4.1% |
M | 10 | 4.1% |
Other values (8) | 31 |
Common
Value | Count | Frequency (%) |
1 | 300 | |
2 | 262 | |
225 | ||
3 | 185 | |
4 | 150 | |
5 | 111 | 7.3% |
6 | 82 | 5.4% |
7 | 68 | 4.4% |
0 | 48 | 3.1% |
8 | 43 | 2.8% |
Other values (4) | 56 | 3.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1776 | |
Hangul | 1543 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
선 | 589 | |
석 | 589 | |
번 | 66 | 4.3% |
부 | 59 | 3.8% |
두 | 59 | 3.8% |
지 | 52 | 3.4% |
박 | 40 | 2.6% |
묘 | 12 | 0.8% |
돌 | 9 | 0.6% |
핀 | 9 | 0.6% |
Other values (18) | 59 | 3.8% |
ASCII
Value | Count | Frequency (%) |
1 | 300 | |
2 | 262 | |
225 | ||
3 | 185 | |
4 | 150 | |
5 | 111 | 6.2% |
6 | 82 | 4.6% |
7 | 68 | 3.8% |
A | 56 | 3.2% |
0 | 48 | 2.7% |
Other values (22) | 289 |
코드
Text
Distinct | 846 |
---|---|
Distinct (%) | 53.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 12.4 KiB |
Value | Count | Frequency (%) |
waq-01 | 16 | 1.0% |
mb1-01 | 15 | 1.0% |
waa-01 | 13 | 0.8% |
waa-02 | 13 | 0.8% |
mb3-01 | 12 | 0.8% |
waa-04 | 12 | 0.8% |
waa-03 | 12 | 0.8% |
mb2-01 | 12 | 0.8% |
mb6-01 | 11 | 0.7% |
mb5-01 | 11 | 0.7% |
Other values (836) | 1449 |
Most occurring characters
Value | Count | Frequency (%) |
- | 1576 | |
0 | 1377 | |
M | 1264 | |
B | 889 | |
1 | 810 | |
W | 466 | 4.9% |
A | 421 | 4.5% |
2 | 391 | 4.1% |
3 | 260 | 2.7% |
4 | 200 | 2.1% |
Other values (28) | 1802 |
Most occurring categories
Value | Count | Frequency (%) |
Uppercase Letter | 4321 | |
Decimal Number | 3513 | |
Dash Punctuation | 1576 | 16.7% |
Other Punctuation | 46 | 0.5% |
Most frequent character per category
Uppercase Letter
Value | Count | Frequency (%) |
M | 1264 | |
B | 889 | |
W | 466 | 10.8% |
A | 421 | 9.7% |
D | 163 | 3.8% |
S | 135 | 3.1% |
K | 133 | 3.1% |
F | 89 | 2.1% |
Y | 78 | 1.8% |
Q | 75 | 1.7% |
Other values (16) | 608 |
Decimal Number
Value | Count | Frequency (%) |
0 | 1377 | |
1 | 810 | |
2 | 391 | 11.1% |
3 | 260 | 7.4% |
4 | 200 | 5.7% |
5 | 160 | 4.6% |
6 | 113 | 3.2% |
7 | 97 | 2.8% |
8 | 64 | 1.8% |
9 | 41 | 1.2% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1576 |
Other Punctuation
Value | Count | Frequency (%) |
* | 46 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 5135 | |
Latin | 4321 |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
M | 1264 | |
B | 889 | |
W | 466 | 10.8% |
A | 421 | 9.7% |
D | 163 | 3.8% |
S | 135 | 3.1% |
K | 133 | 3.1% |
F | 89 | 2.1% |
Y | 78 | 1.8% |
Q | 75 | 1.7% |
Other values (16) | 608 |
Common
Value | Count | Frequency (%) |
- | 1576 | |
0 | 1377 | |
1 | 810 | |
2 | 391 | 7.6% |
3 | 260 | 5.1% |
4 | 200 | 3.9% |
5 | 160 | 3.1% |
6 | 113 | 2.2% |
7 | 97 | 1.9% |
8 | 64 | 1.2% |
Other values (2) | 87 | 1.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 9456 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 1576 | |
0 | 1377 | |
M | 1264 | |
B | 889 | |
1 | 810 | |
W | 466 | 4.9% |
A | 421 | 4.5% |
2 | 391 | 4.1% |
3 | 260 | 2.7% |
4 | 200 | 2.1% |
Other values (28) | 1802 |
항만 | 시설이용구분 | 시설구분 | |
---|---|---|---|
항만 | 1.000 | 0.418 | 0.652 |
시설이용구분 | 0.418 | 1.000 | 0.900 |
시설구분 | 0.652 | 0.900 | 1.000 |
항만 | 시설이용구분 | 시설구분 | |
---|---|---|---|
항만 | 1.000 | 0.208 | 0.255 |
시설이용구분 | 0.208 | 1.000 | 0.756 |
시설구분 | 0.255 | 0.756 | 1.000 |
항만 | 시설이용구분 | 시설구분 | |
---|---|---|---|
항만 | 1.000 | 0.208 | 0.255 |
시설이용구분 | 0.208 | 1.000 | 0.756 |
시설구분 | 0.255 | 0.756 | 1.000 |
항만 | 시설이용구분 | 시설구분 | 시설명 | 선석 구분 | 코드 | |
---|---|---|---|---|---|---|
0 | 부산항 | 계류시설 M | 선석 B | 1부두 | 10선석 | MB1-00 |
1 | 부산항 | 계류시설 M | 선석 B | 1부두 | 11선석 | MB1-01 |
2 | 부산항 | 계류시설 M | 선석 B | 1부두 | 12선석 | MB1-02 |
3 | 부산항 | 계류시설 M | 선석 B | 1부두 | 13선석 | MB1-03 |
4 | 부산항 | 계류시설 M | 선석 B | 1부두 | 14선석 | MB1-04 |
5 | 부산항 | 계류시설 M | 선석 B | 1부두 | 15선석 | MB1-05 |
6 | 부산항 | 계류시설 M | 선석 B | 양곡부두(구 5부두) | 51선석 | MB5-01 |
7 | 부산항 | 계류시설 M | 선석 B | 양곡부두(구 5부두) | 52선석 | MB5-02 |
8 | 부산항 | 계류시설 M | 선석 B | 자성대부두(구6부두) | 61선석 | MB6-01 |
9 | 부산항 | 계류시설 M | 선석 B | 자성대부두(구6부두) | 62선석 | MB6-02 |
항만 | 시설이용구분 | 시설구분 | 시설명 | 선석 구분 | 코드 | |
---|---|---|---|---|---|---|
1566 | 서귀포항 | 계류시설 M | 선석 B | 제 7부두 71선석 | <NA> | MB7-01 |
1567 | 서귀포항 | 계류시설 M | 선석 B | 제8부두 | 81선석 | MB8-01 |
1568 | 서귀포항 | 계류시설 M | 선석 B | 제8부두 | 82선석 | MB8-02 |
1569 | 서귀포항 | 계류시설 M | 선석 B | 제8부두 | 83선석 | MB8-03 |
1570 | 서귀포항 | 계류시설 M | 선석 B | 어선부두 | <NA> | MBB-01 |
1571 | 서귀포항 | 계류시설 M | 선석 B | 유람선부두 | <NA> | MBC-01 |
1572 | 서귀포항 | 계류시설 M | 선석 B | 강정지구 제1부두 | 11선석 | MBG-01 |
1573 | 서귀포항 | 계류시설 M | 선석 B | 강정지구 제1부두 | 12선석 | MBG-02 |
1574 | 서귀포항 | 계류시설 M | 선석 B | 강정지구 제2부두 | 21선석 | MBH-01 |
1575 | 서귀포항 | 계류시설 M | 선석 B | 강정지구 제2부두 | 22선석 | MBH-02 |
Most frequently occurring
항만 | 시설이용구분 | 시설구분 | 시설명 | 선석 구분 | 코드 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | 대산항 | 수역 W | 박지 A | 장안서 대기정박지 | <NA> | WAJ-01 | 2 |
1 | 부산항 | 계류시설 M | 선석 B | 감만 부두 | 2선석 | MBR-02 | 2 |