Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 87 |
Missing cells | 16 |
Missing cells (%) | 3.1% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.1% |
Total size in memory | 4.3 KiB |
Average record size in memory | 50.5 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 2 |
Text | 3 |
Dataset
Description | 2022년도 기준으로 유선 및 도선 사업자 현황에 대한 데이터로 관할기관, 상호명, 대표자명, 주소 등에 대한 항목을 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15061882/fileData.do |
Dataset has 1 (1.1%) duplicate rows | Duplicates |
구분 is highly overall correlated with 번호 and 1 other fields | High correlation |
면허_신고기관 is highly overall correlated with 번호 and 1 other fields | High correlation |
번호 is highly overall correlated with 면허_신고기관 and 1 other fields | High correlation |
구분 is highly imbalanced (73.1%) | Imbalance |
번호 has 4 (4.6%) missing values | Missing |
상호 has 4 (4.6%) missing values | Missing |
성명(대표자) has 4 (4.6%) missing values | Missing |
주소 has 4 (4.6%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 22:33:17.252290 |
---|---|
Analysis finished | 2023-12-12 22:33:18.484303 |
Duration | 1.23 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 83 |
---|---|
Distinct (%) | 100.0% |
Missing | 4 |
Missing (%) | 4.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 42 |
Minimum | 1 |
---|---|
Maximum | 83 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 915.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 5.1 |
Q1 | 21.5 |
median | 42 |
Q3 | 62.5 |
95-th percentile | 78.9 |
Maximum | 83 |
Range | 82 |
Interquartile range (IQR) | 41 |
Descriptive statistics
Standard deviation | 24.103942 |
---|---|
Coefficient of variation (CV) | 0.57390337 |
Kurtosis | -1.2 |
Mean | 42 |
Median Absolute Deviation (MAD) | 21 |
Skewness | 0 |
Sum | 3486 |
Variance | 581 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
54 | 1 | 1.1% |
62 | 1 | 1.1% |
61 | 1 | 1.1% |
60 | 1 | 1.1% |
59 | 1 | 1.1% |
58 | 1 | 1.1% |
57 | 1 | 1.1% |
56 | 1 | 1.1% |
55 | 1 | 1.1% |
53 | 1 | 1.1% |
Other values (73) | 73 | |
(Missing) | 4 | 4.6% |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
83 | 1 | |
82 | 1 | |
81 | 1 | |
80 | 1 | |
79 | 1 | |
78 | 1 | |
77 | 1 | |
76 | 1 | |
75 | 1 | |
74 | 1 |
면허_신고기관
Categorical
HIGH CORRELATION
 
Distinct | 35 |
---|---|
Distinct (%) | 40.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 828.0 B |
강원도 춘천시 | |
---|---|
서울특별시 한강사업본부 | |
경기도 가평군 | 4 |
충청북도 단양군 | 4 |
<NA> | 4 |
Other values (30) |
Length
Max length | 12 |
---|---|
Median length | 10 |
Mean length | 8.091954 |
Min length | 4 |
Unique
Unique | 19 ? |
---|---|
Unique (%) | 21.8% |
Sample
1st row | 서울특별시 한강사업본부 |
---|---|
2nd row | 서울특별시 한강사업본부 |
3rd row | 서울특별시 한강사업본부 |
4th row | 서울특별시 한강사업본부 |
5th row | 서울특별시 한강사업본부 |
Common Values
Value | Count | Frequency (%) |
강원도 춘천시 | 16 | |
서울특별시 한강사업본부 | 14 | |
경기도 가평군 | 4 | 4.6% |
충청북도 단양군 | 4 | 4.6% |
<NA> | 4 | 4.6% |
대구광역시 동구 | 4 | 4.6% |
경상북도 안동시 | 3 | 3.4% |
충청남도 부여군 | 3 | 3.4% |
충청북도 충주시 | 2 | 2.3% |
경기도 여주시 | 2 | 2.3% |
Other values (25) | 31 |
Length
Value | Count | Frequency (%) |
강원도 | 23 | |
춘천시 | 16 | 9.5% |
서울특별시 | 15 | 8.9% |
한강사업본부 | 14 | 8.3% |
충청북도 | 12 | 7.1% |
경기도 | 11 | 6.5% |
경상북도 | 6 | 3.6% |
대구광역시 | 6 | 3.6% |
na | 4 | 2.4% |
동구 | 4 | 2.4% |
Other values (36) | 57 |
상호
Text
MISSING
 
Distinct | 80 |
---|---|
Distinct (%) | 96.4% |
Missing | 4 |
Missing (%) | 4.6% |
Memory size | 828.0 B |
Value | Count | Frequency (%) |
㈜남이섬 | 3 | 3.5% |
㈜충주호관광선 | 2 | 2.3% |
수상레저&바이크 | 1 | 1.2% |
㈜남숭 | 1 | 1.2% |
이디오피아보트장 | 1 | 1.2% |
코리아크루즈㈜ | 1 | 1.2% |
별장1호 | 1 | 1.2% |
월명호 | 1 | 1.2% |
진유선 | 1 | 1.2% |
파로호 | 1 | 1.2% |
Other values (73) | 73 |
Most occurring characters
Value | Count | Frequency (%) |
㈜ | 28 | 5.2% |
선 | 17 | 3.1% |
유 | 14 | 2.6% |
장 | 13 | 2.4% |
이 | 13 | 2.4% |
트 | 13 | 2.4% |
) | 13 | 2.4% |
( | 13 | 2.4% |
호 | 12 | 2.2% |
주 | 10 | 1.8% |
Other values (168) | 395 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 479 | |
Other Symbol | 28 | 5.2% |
Close Punctuation | 13 | 2.4% |
Open Punctuation | 13 | 2.4% |
Space Separator | 4 | 0.7% |
Uppercase Letter | 2 | 0.4% |
Other Punctuation | 1 | 0.2% |
Decimal Number | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
선 | 17 | 3.5% |
유 | 14 | 2.9% |
장 | 13 | 2.7% |
이 | 13 | 2.7% |
트 | 13 | 2.7% |
호 | 12 | 2.5% |
주 | 10 | 2.1% |
리 | 10 | 2.1% |
관 | 9 | 1.9% |
광 | 9 | 1.9% |
Other values (160) | 359 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 1 | |
O | 1 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 28 |
Close Punctuation
Value | Count | Frequency (%) |
) | 13 |
Open Punctuation
Value | Count | Frequency (%) |
( | 13 |
Space Separator
Value | Count | Frequency (%) |
4 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 507 | |
Common | 32 | 5.9% |
Latin | 2 | 0.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
㈜ | 28 | 5.5% |
선 | 17 | 3.4% |
유 | 14 | 2.8% |
장 | 13 | 2.6% |
이 | 13 | 2.6% |
트 | 13 | 2.6% |
호 | 12 | 2.4% |
주 | 10 | 2.0% |
리 | 10 | 2.0% |
관 | 9 | 1.8% |
Other values (161) | 368 |
Common
Value | Count | Frequency (%) |
) | 13 | |
( | 13 | |
4 | 12.5% | |
& | 1 | 3.1% |
1 | 1 | 3.1% |
Latin
Value | Count | Frequency (%) |
N | 1 | |
O | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 479 | |
ASCII | 34 | 6.3% |
None | 28 | 5.2% |
Most frequent character per block
None
Value | Count | Frequency (%) |
㈜ | 28 |
Hangul
Value | Count | Frequency (%) |
선 | 17 | 3.5% |
유 | 14 | 2.9% |
장 | 13 | 2.7% |
이 | 13 | 2.7% |
트 | 13 | 2.7% |
호 | 12 | 2.5% |
주 | 10 | 2.1% |
리 | 10 | 2.1% |
관 | 9 | 1.9% |
광 | 9 | 1.9% |
Other values (160) | 359 |
ASCII
Value | Count | Frequency (%) |
) | 13 | |
( | 13 | |
4 | 11.8% | |
& | 1 | 2.9% |
1 | 1 | 2.9% |
N | 1 | 2.9% |
O | 1 | 2.9% |
구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 828.0 B |
갱신 | |
---|---|
<NA> | 4 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.091954 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 갱신 |
---|---|
2nd row | 갱신 |
3rd row | 갱신 |
4th row | 갱신 |
5th row | 갱신 |
Common Values
Value | Count | Frequency (%) |
갱신 | 83 | |
<NA> | 4 | 4.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
갱신 | 83 | |
na | 4 | 4.6% |
성명(대표자)
Text
MISSING
 
Distinct | 81 |
---|---|
Distinct (%) | 97.6% |
Missing | 4 |
Missing (%) | 4.6% |
Memory size | 828.0 B |
Value | Count | Frequency (%) |
민경혁 | 2 | 2.4% |
김철석 | 2 | 2.4% |
이덕기 | 1 | 1.2% |
노창영 | 1 | 1.2% |
평창군수 | 1 | 1.2% |
김정욱 | 1 | 1.2% |
여석민 | 1 | 1.2% |
김상덕 | 1 | 1.2% |
홍성진 | 1 | 1.2% |
화천군수 | 1 | 1.2% |
Other values (72) | 72 |
Most occurring characters
Value | Count | Frequency (%) |
이 | 18 | 6.8% |
김 | 11 | 4.2% |
박 | 8 | 3.0% |
정 | 8 | 3.0% |
석 | 7 | 2.6% |
진 | 7 | 2.6% |
민 | 6 | 2.3% |
덕 | 6 | 2.3% |
희 | 5 | 1.9% |
철 | 5 | 1.9% |
Other values (108) | 184 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 257 | |
Other Symbol | 3 | 1.1% |
Decimal Number | 2 | 0.8% |
Space Separator | 1 | 0.4% |
Open Punctuation | 1 | 0.4% |
Close Punctuation | 1 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 18 | 7.0% |
김 | 11 | 4.3% |
박 | 8 | 3.1% |
정 | 8 | 3.1% |
석 | 7 | 2.7% |
진 | 7 | 2.7% |
민 | 6 | 2.3% |
덕 | 6 | 2.3% |
희 | 5 | 1.9% |
철 | 5 | 1.9% |
Other values (103) | 176 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 3 |
Decimal Number
Value | Count | Frequency (%) |
0 | 2 |
Space Separator
Value | Count | Frequency (%) |
1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 260 | |
Common | 5 | 1.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 18 | 6.9% |
김 | 11 | 4.2% |
박 | 8 | 3.1% |
정 | 8 | 3.1% |
석 | 7 | 2.7% |
진 | 7 | 2.7% |
민 | 6 | 2.3% |
덕 | 6 | 2.3% |
희 | 5 | 1.9% |
철 | 5 | 1.9% |
Other values (104) | 179 |
Common
Value | Count | Frequency (%) |
0 | 2 | |
1 | ||
( | 1 | |
) | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 257 | |
ASCII | 5 | 1.9% |
None | 3 | 1.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
이 | 18 | 7.0% |
김 | 11 | 4.3% |
박 | 8 | 3.1% |
정 | 8 | 3.1% |
석 | 7 | 2.7% |
진 | 7 | 2.7% |
민 | 6 | 2.3% |
덕 | 6 | 2.3% |
희 | 5 | 1.9% |
철 | 5 | 1.9% |
Other values (103) | 176 |
None
Value | Count | Frequency (%) |
㈜ | 3 |
ASCII
Value | Count | Frequency (%) |
0 | 2 | |
1 | ||
( | 1 | |
) | 1 |
주소
Text
MISSING
 
Distinct | 76 |
---|---|
Distinct (%) | 91.6% |
Missing | 4 |
Missing (%) | 4.6% |
Memory size | 828.0 B |
Length
Max length | 30 |
---|---|
Median length | 23 |
Mean length | 19.975904 |
Min length | 13 |
Characters and Unicode
Total characters | 1658 |
---|---|
Distinct characters | 174 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 73 ? |
---|---|
Unique (%) | 88.0% |
Sample
1st row | 서울특별시 서초구 동작대로350 (반포한강공원) |
---|---|
2nd row | 서울특별시 용산구 이촌동 361 |
3rd row | 서울특별시 마포구 마포나루길 435 |
4th row | 서울특별시 강남구 압구정로 11길 37-53 |
5th row | 서울특별시 영등포구 여의도동 81 |
Value | Count | Frequency (%) |
강원도 | 23 | 6.2% |
춘천시 | 16 | 4.3% |
서울특별시 | 15 | 4.0% |
충청북도 | 12 | 3.2% |
경기도 | 11 | 3.0% |
북산면 | 8 | 2.2% |
청평리 | 7 | 1.9% |
대구광역시 | 6 | 1.6% |
산205-3번지 | 6 | 1.6% |
경상북도 | 6 | 1.6% |
Other values (213) | 261 |
Most occurring characters
Value | Count | Frequency (%) |
289 | 17.4% | |
도 | 64 | 3.9% |
시 | 61 | 3.7% |
1 | 42 | 2.5% |
구 | 38 | 2.3% |
2 | 38 | 2.3% |
3 | 34 | 2.1% |
동 | 33 | 2.0% |
0 | 32 | 1.9% |
북 | 31 | 1.9% |
Other values (164) | 996 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1054 | |
Space Separator | 289 | 17.4% |
Decimal Number | 279 | 16.8% |
Dash Punctuation | 29 | 1.7% |
Open Punctuation | 3 | 0.2% |
Close Punctuation | 3 | 0.2% |
Other Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 64 | 6.1% |
시 | 61 | 5.8% |
구 | 38 | 3.6% |
동 | 33 | 3.1% |
북 | 31 | 2.9% |
강 | 29 | 2.8% |
원 | 29 | 2.8% |
로 | 29 | 2.8% |
산 | 29 | 2.8% |
청 | 27 | 2.6% |
Other values (149) | 684 |
Decimal Number
Value | Count | Frequency (%) |
1 | 42 | |
2 | 38 | |
3 | 34 | |
0 | 32 | |
5 | 29 | |
8 | 28 | |
4 | 27 | |
6 | 20 | |
9 | 17 | |
7 | 12 | 4.3% |
Space Separator
Value | Count | Frequency (%) |
289 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 29 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1054 | |
Common | 604 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 64 | 6.1% |
시 | 61 | 5.8% |
구 | 38 | 3.6% |
동 | 33 | 3.1% |
북 | 31 | 2.9% |
강 | 29 | 2.8% |
원 | 29 | 2.8% |
로 | 29 | 2.8% |
산 | 29 | 2.8% |
청 | 27 | 2.6% |
Other values (149) | 684 |
Common
Value | Count | Frequency (%) |
289 | ||
1 | 42 | 7.0% |
2 | 38 | 6.3% |
3 | 34 | 5.6% |
0 | 32 | 5.3% |
- | 29 | 4.8% |
5 | 29 | 4.8% |
8 | 28 | 4.6% |
4 | 27 | 4.5% |
6 | 20 | 3.3% |
Other values (5) | 36 | 6.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1054 | |
ASCII | 604 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
289 | ||
1 | 42 | 7.0% |
2 | 38 | 6.3% |
3 | 34 | 5.6% |
0 | 32 | 5.3% |
- | 29 | 4.8% |
5 | 29 | 4.8% |
8 | 28 | 4.6% |
4 | 27 | 4.5% |
6 | 20 | 3.3% |
Other values (5) | 36 | 6.0% |
Hangul
Value | Count | Frequency (%) |
도 | 64 | 6.1% |
시 | 61 | 5.8% |
구 | 38 | 3.6% |
동 | 33 | 3.1% |
북 | 31 | 2.9% |
강 | 29 | 2.8% |
원 | 29 | 2.8% |
로 | 29 | 2.8% |
산 | 29 | 2.8% |
청 | 27 | 2.6% |
Other values (149) | 684 |
번호 | 면허_신고기관 | 상호 | 성명(대표자) | 주소 | |
---|---|---|---|---|---|
번호 | 1.000 | 0.952 | 0.911 | 0.971 | 0.988 |
면허_신고기관 | 0.952 | 1.000 | 0.994 | 0.995 | 1.000 |
상호 | 0.911 | 0.994 | 1.000 | 1.000 | 0.995 |
성명(대표자) | 0.971 | 0.995 | 1.000 | 1.000 | 0.998 |
주소 | 0.988 | 1.000 | 0.995 | 0.998 | 1.000 |
구분 | 면허_신고기관 | |
---|---|---|
구분 | 1.000 | 1.000 |
면허_신고기관 | 1.000 | 1.000 |
번호 | 면허_신고기관 | 구분 | |
---|---|---|---|
번호 | 1.000 | 0.605 | 1.000 |
면허_신고기관 | 0.605 | 1.000 | 1.000 |
구분 | 1.000 | 1.000 | 1.000 |
번호 | 면허_신고기관 | 상호 | 구분 | 성명(대표자) | 주소 | |
---|---|---|---|---|---|---|
0 | 1 | 서울특별시 한강사업본부 | 현대요트(주)서울지점 | 갱신 | 이철웅 | 서울특별시 서초구 동작대로350 (반포한강공원) |
1 | 2 | 서울특별시 한강사업본부 | ㈜세븐마린레저 | 갱신 | 박명철 | 서울특별시 용산구 이촌동 361 |
2 | 3 | 서울특별시 한강사업본부 | ㈜리우엠앤씨 | 갱신 | 문덕범 | 서울특별시 마포구 마포나루길 435 |
3 | 4 | 서울특별시 한강사업본부 | ㈜선스톤쉬핑 | 갱신 | 신용석 | 서울특별시 강남구 압구정로 11길 37-53 |
4 | 5 | 서울특별시 한강사업본부 | ㈜서울마리나 | 갱신 | 임탁기 | 서울특별시 영등포구 여의도동 81 |
5 | 6 | 서울특별시 한강사업본부 | 오엔(ON) | 갱신 | 소문섭 | 서울특별시 강남구 압구정동 380-2 |
6 | 7 | 서울특별시 한강사업본부 | ㈜이크루즈 | 갱신 | 박동진 | 서울특별시 영등포구 여의도동 290 |
7 | 8 | 서울특별시 한강사업본부 | ㈜서울메리모나크 | 갱신 | 구길용 | 서울특별시 서초구 잠원동 121-9 |
8 | 9 | 서울특별시 한강사업본부 | ㈜에프앤에이치인베스트먼트 | 갱신 | 이국보 | 서울특별시 서초구 잠원동149-2 |
9 | 10 | 서울특별시 한강사업본부 | 아리랑하우스 | 갱신 | 홍정희 | 서울특별시 광진구 강변북로96 |
번호 | 면허_신고기관 | 상호 | 구분 | 성명(대표자) | 주소 | |
---|---|---|---|---|---|---|
77 | 78 | 경상북도 포항시 | ㈜포항크루즈 | 갱신 | 최만달 | 경상북도 포항시 남구 희망대로 1040 (송도동222) |
78 | 79 | 경상북도 안동시 | ㈜글로벌코리아 | 갱신 | 송진호 | 경상북도 안동시 민속촌길 26 |
79 | 80 | 경상북도 안동시 | ㈜안동수상레져 | 갱신 | 백민규 | 경상북도 안동시 석주로 383 (글로리호) |
80 | 81 | 경상북도 안동시 | 안동시청 | 갱신 | 안동시장 | 경상북도 안동시 퇴계로 115 |
81 | 82 | 경상북도 구미시 | ㈜남숭 | 갱신 | 김경조 | 경상북도 구미시 금오산로 336-44 |
82 | 83 | 경상북도 청도군 | 수상레저&바이크 | 갱신 | 박정민 | 경상북도 청도군 청도읍 하지길 46-40 |
83 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
84 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
85 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
86 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
번호 | 면허_신고기관 | 상호 | 구분 | 성명(대표자) | 주소 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 4 |