Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 738 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 41.9 KiB |
Average record size in memory | 58.2 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 4 |
Text | 1 |
Dataset
Description | 2021년 기준으로 유선 및 도선 선박 현황을 관리기관, 선박명, 사업구분(유선/도선), 톤수 등에 대한 항목을 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15061883/fileData.do |
번호 is highly overall correlated with 관리기관 and 2 other fields | High correlation |
관리기관 is highly overall correlated with 번호 and 2 other fields | High correlation |
선박종류 is highly overall correlated with 번호 and 2 other fields | High correlation |
사업구분 is highly overall correlated with 번호 and 2 other fields | High correlation |
사업구분 is highly imbalanced (69.6%) | Imbalance |
등록구분 is highly imbalanced (86.0%) | Imbalance |
번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-11 23:15:01.750162 |
---|---|
Analysis finished | 2023-12-11 23:15:02.815772 |
Duration | 1.07 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 738 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 369.5 |
Minimum | 1 |
---|---|
Maximum | 738 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.6 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 37.85 |
Q1 | 185.25 |
median | 369.5 |
Q3 | 553.75 |
95-th percentile | 701.15 |
Maximum | 738 |
Range | 737 |
Interquartile range (IQR) | 368.5 |
Descriptive statistics
Standard deviation | 213.18654 |
---|---|
Coefficient of variation (CV) | 0.57695951 |
Kurtosis | -1.2 |
Mean | 369.5 |
Median Absolute Deviation (MAD) | 184.5 |
Skewness | 0 |
Sum | 272691 |
Variance | 45448.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
497 | 1 | 0.1% |
488 | 1 | 0.1% |
489 | 1 | 0.1% |
490 | 1 | 0.1% |
491 | 1 | 0.1% |
492 | 1 | 0.1% |
493 | 1 | 0.1% |
494 | 1 | 0.1% |
495 | 1 | 0.1% |
Other values (728) | 728 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
738 | 1 | |
737 | 1 | |
736 | 1 | |
735 | 1 | |
734 | 1 | |
733 | 1 | |
732 | 1 | |
731 | 1 | |
730 | 1 | |
729 | 1 |
관리기관
Categorical
HIGH CORRELATION
 
Distinct | 35 |
---|---|
Distinct (%) | 4.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
강원도 춘천시 | |
---|---|
서울특별시 한강사업본부 | |
대구광역시 동구 | |
대구광역시 수성구 | |
경기도 의왕시 | |
Other values (30) |
Length
Max length | 12 |
---|---|
Median length | 9 |
Mean length | 8.3536585 |
Min length | 5 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 0.8% |
Sample
1st row | 서울특별시 한강사업본부 |
---|---|
2nd row | 서울특별시 한강사업본부 |
3rd row | 서울특별시 한강사업본부 |
4th row | 서울특별시 한강사업본부 |
5th row | 서울특별시 한강사업본부 |
Common Values
Value | Count | Frequency (%) |
강원도 춘천시 | 152 | |
서울특별시 한강사업본부 | 121 | |
대구광역시 동구 | 103 | |
대구광역시 수성구 | 74 | |
경기도 의왕시 | 39 | 5.3% |
경기도 가평군 | 33 | 4.5% |
경상북도 구미시 | 30 | 4.1% |
경기도 평택시 | 29 | 3.9% |
충청북도 제천시 | 20 | 2.7% |
경상북도 청도군 | 14 | 1.9% |
Other values (25) | 123 |
Length
Value | Count | Frequency (%) |
대구광역시 | 178 | |
강원도 | 175 | |
춘천시 | 152 | |
서울특별시 | 131 | |
경기도 | 124 | 8.4% |
한강사업본부 | 121 | 8.2% |
동구 | 103 | 7.0% |
수성구 | 74 | 5.0% |
경상북도 | 52 | 3.5% |
의왕시 | 39 | 2.6% |
Other values (35) | 324 |
선박명
Text
Distinct | 680 |
---|---|
Distinct (%) | 92.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
Value | Count | Frequency (%) |
로멘스보트 | 30 | 3.6% |
오리보트 | 27 | 3.2% |
청평 | 15 | 1.8% |
현대 | 14 | 1.7% |
오리배 | 14 | 1.7% |
로멘스 | 13 | 1.5% |
오리 | 8 | 0.9% |
보트 | 8 | 0.9% |
5호 | 6 | 0.7% |
9호 | 6 | 0.7% |
Other values (625) | 702 |
Most occurring characters
Value | Count | Frequency (%) |
호 | 612 | 15.3% |
1 | 251 | 6.3% |
2 | 188 | 4.7% |
리 | 150 | 3.7% |
트 | 136 | 3.4% |
오 | 136 | 3.4% |
보 | 135 | 3.4% |
3 | 124 | 3.1% |
105 | 2.6% | |
로 | 93 | 2.3% |
Other values (163) | 2079 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2830 | |
Decimal Number | 1042 | 26.0% |
Space Separator | 105 | 2.6% |
Dash Punctuation | 18 | 0.4% |
Uppercase Letter | 12 | 0.3% |
Open Punctuation | 1 | < 0.1% |
Close Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
호 | 612 | |
리 | 150 | 5.3% |
트 | 136 | 4.8% |
오 | 136 | 4.8% |
보 | 135 | 4.8% |
로 | 93 | 3.3% |
스 | 82 | 2.9% |
아 | 71 | 2.5% |
동 | 63 | 2.2% |
백 | 57 | 2.0% |
Other values (146) | 1295 |
Decimal Number
Value | Count | Frequency (%) |
1 | 251 | |
2 | 188 | |
3 | 124 | |
5 | 83 | 8.0% |
4 | 71 | 6.8% |
7 | 69 | 6.6% |
8 | 67 | 6.4% |
6 | 64 | 6.1% |
9 | 63 | 6.0% |
0 | 62 | 6.0% |
Uppercase Letter
Value | Count | Frequency (%) |
U | 4 | |
F | 4 | |
O | 4 |
Space Separator
Value | Count | Frequency (%) |
105 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 18 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2830 | |
Common | 1167 | |
Latin | 12 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
호 | 612 | |
리 | 150 | 5.3% |
트 | 136 | 4.8% |
오 | 136 | 4.8% |
보 | 135 | 4.8% |
로 | 93 | 3.3% |
스 | 82 | 2.9% |
아 | 71 | 2.5% |
동 | 63 | 2.2% |
백 | 57 | 2.0% |
Other values (146) | 1295 |
Common
Value | Count | Frequency (%) |
1 | 251 | |
2 | 188 | |
3 | 124 | |
105 | ||
5 | 83 | 7.1% |
4 | 71 | 6.1% |
7 | 69 | 5.9% |
8 | 67 | 5.7% |
6 | 64 | 5.5% |
9 | 63 | 5.4% |
Other values (4) | 82 | 7.0% |
Latin
Value | Count | Frequency (%) |
U | 4 | |
F | 4 | |
O | 4 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2830 | |
ASCII | 1179 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
호 | 612 | |
리 | 150 | 5.3% |
트 | 136 | 4.8% |
오 | 136 | 4.8% |
보 | 135 | 4.8% |
로 | 93 | 3.3% |
스 | 82 | 2.9% |
아 | 71 | 2.5% |
동 | 63 | 2.2% |
백 | 57 | 2.0% |
Other values (146) | 1295 |
ASCII
Value | Count | Frequency (%) |
1 | 251 | |
2 | 188 | |
3 | 124 | |
105 | ||
5 | 83 | 7.0% |
4 | 71 | 6.0% |
7 | 69 | 5.9% |
8 | 67 | 5.7% |
6 | 64 | 5.4% |
9 | 63 | 5.3% |
Other values (7) | 94 | 8.0% |
선박종류
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
무동력선 | |
---|---|
동력선 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8387534 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 동력선 |
---|---|
2nd row | 동력선 |
3rd row | 동력선 |
4th row | 동력선 |
5th row | 동력선 |
Common Values
Value | Count | Frequency (%) |
무동력선 | 619 | |
동력선 | 119 | 16.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
무동력선 | 619 | |
동력선 | 119 | 16.1% |
사업구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
유선 | |
---|---|
도선 | 40 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 유선 |
---|---|
2nd row | 유선 |
3rd row | 유선 |
4th row | 유선 |
5th row | 유선 |
Common Values
Value | Count | Frequency (%) |
유선 | 698 | |
도선 | 40 | 5.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
유선 | 698 | |
도선 | 40 | 5.4% |
등록구분
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.9 KiB |
갱신 | |
---|---|
폐업 | 24 |
휴업 | 5 |
신규 | 1 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 갱신 |
---|---|
2nd row | 갱신 |
3rd row | 갱신 |
4th row | 갱신 |
5th row | 갱신 |
Common Values
Value | Count | Frequency (%) |
갱신 | 708 | |
폐업 | 24 | 3.3% |
휴업 | 5 | 0.7% |
신규 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
갱신 | 708 | |
폐업 | 24 | 3.3% |
휴업 | 5 | 0.7% |
신규 | 1 | 0.1% |
톤수
Real number (ℝ)
Distinct | 94 |
---|---|
Distinct (%) | 12.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.8388062 |
Minimum | 0.023 |
---|---|
Maximum | 999 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.6 KiB |
Quantile statistics
Minimum | 0.023 |
---|---|
5-th percentile | 0.075 |
Q1 | 0.1 |
median | 0.29 |
Q3 | 0.4 |
95-th percentile | 17.15 |
Maximum | 999 |
Range | 998.977 |
Interquartile range (IQR) | 0.3 |
Descriptive statistics
Standard deviation | 51.92345 |
---|---|
Coefficient of variation (CV) | 7.5924728 |
Kurtosis | 229.14867 |
Mean | 6.8388062 |
Median Absolute Deviation (MAD) | 0.19 |
Skewness | 13.980737 |
Sum | 5047.039 |
Variance | 2696.0447 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.075 | 176 | |
0.29 | 108 | |
0.3 | 91 | |
0.2 | 49 | 6.6% |
0.16 | 44 | 6.0% |
0.65 | 30 | 4.1% |
0.4 | 24 | 3.3% |
0.1 | 21 | 2.8% |
0.5 | 20 | 2.7% |
0.15 | 12 | 1.6% |
Other values (84) | 163 |
Value | Count | Frequency (%) |
0.023 | 3 | 0.4% |
0.075 | 176 | |
0.1 | 21 | 2.8% |
0.12 | 4 | 0.5% |
0.15 | 12 | 1.6% |
0.16 | 44 | 6.0% |
0.17 | 7 | 0.9% |
0.18 | 2 | 0.3% |
0.2 | 49 | 6.6% |
0.25 | 6 | 0.8% |
Value | Count | Frequency (%) |
999.0 | 1 | |
688.0 | 1 | |
430.0 | 1 | |
299.0 | 1 | |
277.0 | 1 | |
247.0 | 1 | |
138.0 | 1 | |
136.0 | 1 | |
135.0 | 1 | |
117.0 | 1 |
번호 | 관리기관 | 선박종류 | 사업구분 | 등록구분 | 톤수 | |
---|---|---|---|---|---|---|
번호 | 1.000 | 0.965 | 0.651 | 0.879 | 0.506 | 0.161 |
관리기관 | 0.965 | 1.000 | 0.796 | 0.669 | 0.717 | 0.728 |
선박종류 | 0.651 | 0.796 | 1.000 | 0.747 | 0.000 | 0.374 |
사업구분 | 0.879 | 0.669 | 0.747 | 1.000 | 0.000 | 0.254 |
등록구분 | 0.506 | 0.717 | 0.000 | 0.000 | 1.000 | 0.000 |
톤수 | 0.161 | 0.728 | 0.374 | 0.254 | 0.000 | 1.000 |
등록구분 | 사업구분 | 관리기관 | 선박종류 | |
---|---|---|---|---|
등록구분 | 1.000 | 0.000 | 0.446 | 0.000 |
사업구분 | 0.000 | 1.000 | 0.562 | 0.537 |
관리기관 | 0.446 | 0.562 | 1.000 | 0.683 |
선박종류 | 0.000 | 0.537 | 0.683 | 1.000 |
번호 | 톤수 | 관리기관 | 선박종류 | 사업구분 | 등록구분 | |
---|---|---|---|---|---|---|
번호 | 1.000 | 0.475 | 0.760 | 0.503 | 0.709 | 0.325 |
톤수 | 0.475 | 1.000 | 0.412 | 0.268 | 0.183 | 0.000 |
관리기관 | 0.760 | 0.412 | 1.000 | 0.683 | 0.562 | 0.446 |
선박종류 | 0.503 | 0.268 | 0.683 | 1.000 | 0.537 | 0.000 |
사업구분 | 0.709 | 0.183 | 0.562 | 0.537 | 1.000 | 0.000 |
등록구분 | 0.325 | 0.000 | 0.446 | 0.000 | 0.000 | 1.000 |
번호 | 관리기관 | 선박명 | 선박종류 | 사업구분 | 등록구분 | 톤수 | |
---|---|---|---|---|---|---|---|
0 | 1 | 서울특별시 한강사업본부 | 한강아라호 | 동력선 | 유선 | 갱신 | 277.0 |
1 | 2 | 서울특별시 한강사업본부 | 카약1호 | 동력선 | 유선 | 갱신 | 247.0 |
2 | 3 | 서울특별시 한강사업본부 | 카약2호 | 동력선 | 유선 | 갱신 | 430.0 |
3 | 4 | 서울특별시 한강사업본부 | 카약3호 | 동력선 | 유선 | 갱신 | 299.0 |
4 | 5 | 서울특별시 한강사업본부 | 파라다이스1호(유) | 동력선 | 유선 | 갱신 | 135.0 |
5 | 6 | 서울특별시 한강사업본부 | 오리보트21 | 동력선 | 유선 | 갱신 | 688.0 |
6 | 7 | 서울특별시 한강사업본부 | 오리보트22 | 무동력선 | 유선 | 갱신 | 0.023 |
7 | 8 | 서울특별시 한강사업본부 | 오리보트28 | 무동력선 | 유선 | 갱신 | 0.023 |
8 | 9 | 서울특별시 한강사업본부 | 오리보트18 | 무동력선 | 유선 | 갱신 | 0.023 |
9 | 10 | 서울특별시 한강사업본부 | 오리보트19 | 동력선 | 유선 | 갱신 | 0.77 |
번호 | 관리기관 | 선박명 | 선박종류 | 사업구분 | 등록구분 | 톤수 | |
---|---|---|---|---|---|---|---|
728 | 729 | 충청북도 괴산군 | 산막이1호 | 동력선 | 도선 | 갱신 | 1.66 |
729 | 730 | 충청북도 괴산군 | 산막이호 | 동력선 | 도선 | 갱신 | 1.66 |
730 | 731 | 충청북도 괴산군 | 산막이3호 | 동력선 | 도선 | 갱신 | 22.0 |
731 | 732 | 충청북도 괴산군 | 산막이5호 | 동력선 | 도선 | 갱신 | 15.0 |
732 | 733 | 충청북도 옥천군 | 오대호 | 동력선 | 도선 | 갱신 | 1.5 |
733 | 734 | 충청북도 옥천군 | 막지1호 | 동력선 | 도선 | 갱신 | 1.0 |
734 | 735 | 충청북도 단양군 | 황포돛배 | 동력선 | 도선 | 갱신 | 3.63 |
735 | 736 | 경상북도 안동시 | 경북 제703호 | 동력선 | 도선 | 갱신 | 6.18 |
736 | 737 | 경상북도 안동시 | 경북 제704호 | 동력선 | 도선 | 갱신 | 4.8 |
737 | 738 | 경상북도 안동시 | 경북 제705호 | 동력선 | 도선 | 갱신 | 36.0 |