Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 196 |
Missing cells | 310 |
Missing cells (%) | 31.6% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.5% |
Total size in memory | 7.8 KiB |
Average record size in memory | 40.7 B |
Variable types
Categorical | 1 |
---|---|
Text | 3 |
DateTime | 1 |
Dataset
Description | 부산광역시 사하구 관내 인쇄사 및 출판사의 업종, 사업체명칭, 주소, 전화번호 등 사업체 정보를 붙임과 같이 제공합니다. |
---|---|
Author | 부산광역시 사하구 |
URL | https://www.data.go.kr/data/3045772/fileData.do |
Reproduction
Analysis started | 2023-12-12 04:18:06.344282 |
---|---|
Analysis finished | 2023-12-12 04:18:06.989272 |
Duration | 0.64 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업종
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
출판사 | |
---|---|
<NA> | |
인쇄사 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.2806122 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 출판사 |
---|---|
2nd row | 출판사 |
3rd row | 출판사 |
4th row | 출판사 |
5th row | 출판사 |
Common Values
Value | Count | Frequency (%) |
출판사 | 118 | |
<NA> | 55 | |
인쇄사 | 23 | 11.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
출판사 | 118 | |
na | 55 | |
인쇄사 | 23 | 11.7% |
사업체명칭
Text
MISSING
 
Distinct | 136 |
---|---|
Distinct (%) | 96.5% |
Missing | 55 |
Missing (%) | 28.1% |
Memory size | 1.7 KiB |
Value | Count | Frequency (%) |
도서출판 | 10 | 4.8% |
주식회사 | 6 | 2.9% |
출판사 | 4 | 1.9% |
대원애드콤 | 2 | 1.0% |
인쇄사 | 2 | 1.0% |
동아기획 | 2 | 1.0% |
연화경 | 2 | 1.0% |
예스패키지 | 2 | 1.0% |
글꽃 | 2 | 1.0% |
디자인 | 2 | 1.0% |
Other values (171) | 173 |
Most occurring characters
Value | Count | Frequency (%) |
66 | 6.9% | |
사 | 27 | 2.8% |
판 | 26 | 2.7% |
출 | 25 | 2.6% |
인 | 22 | 2.3% |
스 | 20 | 2.1% |
이 | 17 | 1.8% |
동 | 15 | 1.6% |
) | 14 | 1.5% |
( | 14 | 1.5% |
Other values (280) | 709 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 699 | |
Uppercase Letter | 81 | 8.5% |
Lowercase Letter | 73 | 7.6% |
Space Separator | 66 | 6.9% |
Close Punctuation | 14 | 1.5% |
Open Punctuation | 14 | 1.5% |
Decimal Number | 5 | 0.5% |
Other Punctuation | 3 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 27 | 3.9% |
판 | 26 | 3.7% |
출 | 25 | 3.6% |
인 | 22 | 3.1% |
스 | 20 | 2.9% |
이 | 17 | 2.4% |
동 | 15 | 2.1% |
서 | 14 | 2.0% |
주 | 14 | 2.0% |
도 | 14 | 2.0% |
Other values (231) | 505 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 10 | 12.3% |
D | 7 | 8.6% |
O | 6 | 7.4% |
N | 6 | 7.4% |
A | 5 | 6.2% |
E | 5 | 6.2% |
T | 5 | 6.2% |
I | 4 | 4.9% |
C | 4 | 4.9% |
U | 3 | 3.7% |
Other values (12) | 26 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 11 | |
e | 9 | |
n | 6 | |
i | 6 | |
s | 6 | |
r | 6 | |
l | 6 | |
o | 6 | |
g | 4 | 5.5% |
h | 3 | 4.1% |
Other values (8) | 10 |
Decimal Number
Value | Count | Frequency (%) |
1 | 2 | |
5 | 1 | |
4 | 1 | |
3 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 | |
' | 1 |
Space Separator
Value | Count | Frequency (%) |
66 |
Close Punctuation
Value | Count | Frequency (%) |
) | 14 |
Open Punctuation
Value | Count | Frequency (%) |
( | 14 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 697 | |
Latin | 154 | 16.1% |
Common | 102 | 10.7% |
Han | 2 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 27 | 3.9% |
판 | 26 | 3.7% |
출 | 25 | 3.6% |
인 | 22 | 3.2% |
스 | 20 | 2.9% |
이 | 17 | 2.4% |
동 | 15 | 2.2% |
서 | 14 | 2.0% |
주 | 14 | 2.0% |
도 | 14 | 2.0% |
Other values (229) | 503 |
Latin
Value | Count | Frequency (%) |
a | 11 | 7.1% |
S | 10 | 6.5% |
e | 9 | 5.8% |
D | 7 | 4.5% |
n | 6 | 3.9% |
i | 6 | 3.9% |
s | 6 | 3.9% |
r | 6 | 3.9% |
l | 6 | 3.9% |
O | 6 | 3.9% |
Other values (30) | 81 |
Common
Value | Count | Frequency (%) |
66 | ||
) | 14 | 13.7% |
( | 14 | 13.7% |
1 | 2 | 2.0% |
. | 2 | 2.0% |
5 | 1 | 1.0% |
4 | 1 | 1.0% |
3 | 1 | 1.0% |
' | 1 | 1.0% |
Han
Value | Count | Frequency (%) |
正 | 1 | |
言 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 697 | |
ASCII | 256 | 26.8% |
CJK | 2 | 0.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
66 | ||
) | 14 | 5.5% |
( | 14 | 5.5% |
a | 11 | 4.3% |
S | 10 | 3.9% |
e | 9 | 3.5% |
D | 7 | 2.7% |
n | 6 | 2.3% |
i | 6 | 2.3% |
s | 6 | 2.3% |
Other values (39) | 107 |
Hangul
Value | Count | Frequency (%) |
사 | 27 | 3.9% |
판 | 26 | 3.7% |
출 | 25 | 3.6% |
인 | 22 | 3.2% |
스 | 20 | 2.9% |
이 | 17 | 2.4% |
동 | 15 | 2.2% |
서 | 14 | 2.0% |
주 | 14 | 2.0% |
도 | 14 | 2.0% |
Other values (229) | 503 |
CJK
Value | Count | Frequency (%) |
正 | 1 | |
言 | 1 |
도로명주소
Text
MISSING
 
Distinct | 133 |
---|---|
Distinct (%) | 94.3% |
Missing | 55 |
Missing (%) | 28.1% |
Memory size | 1.7 KiB |
Length
Max length | 58 |
---|---|
Median length | 48 |
Mean length | 36.51773 |
Min length | 21 |
Characters and Unicode
Total characters | 5149 |
---|---|
Distinct characters | 167 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 127 ? |
---|---|
Unique (%) | 90.1% |
Sample
1st row | 부산광역시 사하구 감천로142번길 25-4 (감천동) |
---|---|
2nd row | 부산광역시 사하구 낙동대로520번길 1 (하단동) |
3rd row | 부산광역시 사하구 낙동대로 542, 213호 (하단동, 대우에덴프라자) |
4th row | 부산광역시 사하구 다대로170번길 13 (신평동) |
5th row | 부산광역시 사하구 낙동대로550번길 37 (하단동) |
Value | Count | Frequency (%) |
부산광역시 | 141 | 14.8% |
사하구 | 141 | 14.8% |
다대동 | 29 | 3.0% |
하단동 | 25 | 2.6% |
괴정동 | 22 | 2.3% |
당리동 | 21 | 2.2% |
장림동 | 20 | 2.1% |
신평동 | 16 | 1.7% |
낙동대로 | 13 | 1.4% |
2층 | 10 | 1.1% |
Other values (322) | 513 |
Most occurring characters
Value | Count | Frequency (%) |
810 | 15.7% | |
1 | 245 | 4.8% |
동 | 235 | 4.6% |
하 | 193 | 3.7% |
0 | 170 | 3.3% |
, | 163 | 3.2% |
사 | 155 | 3.0% |
산 | 148 | 2.9% |
구 | 147 | 2.9% |
시 | 144 | 2.8% |
Other values (157) | 2739 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2909 | |
Decimal Number | 965 | 18.7% |
Space Separator | 810 | 15.7% |
Other Punctuation | 163 | 3.2% |
Open Punctuation | 141 | 2.7% |
Close Punctuation | 141 | 2.7% |
Dash Punctuation | 13 | 0.3% |
Uppercase Letter | 5 | 0.1% |
Lowercase Letter | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 235 | 8.1% |
하 | 193 | 6.6% |
사 | 155 | 5.3% |
산 | 148 | 5.1% |
구 | 147 | 5.1% |
시 | 144 | 5.0% |
역 | 143 | 4.9% |
부 | 142 | 4.9% |
광 | 141 | 4.8% |
로 | 127 | 4.4% |
Other values (139) | 1334 |
Decimal Number
Value | Count | Frequency (%) |
1 | 245 | |
0 | 170 | |
2 | 132 | |
3 | 114 | |
4 | 78 | 8.1% |
5 | 67 | 6.9% |
7 | 52 | 5.4% |
6 | 50 | 5.2% |
8 | 29 | 3.0% |
9 | 28 | 2.9% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 3 | |
W | 2 |
Space Separator
Value | Count | Frequency (%) |
810 |
Other Punctuation
Value | Count | Frequency (%) |
, | 163 |
Open Punctuation
Value | Count | Frequency (%) |
( | 141 |
Close Punctuation
Value | Count | Frequency (%) |
) | 141 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 13 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2909 | |
Common | 2233 | |
Latin | 7 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 235 | 8.1% |
하 | 193 | 6.6% |
사 | 155 | 5.3% |
산 | 148 | 5.1% |
구 | 147 | 5.1% |
시 | 144 | 5.0% |
역 | 143 | 4.9% |
부 | 142 | 4.9% |
광 | 141 | 4.8% |
로 | 127 | 4.4% |
Other values (139) | 1334 |
Common
Value | Count | Frequency (%) |
810 | ||
1 | 245 | 11.0% |
0 | 170 | 7.6% |
, | 163 | 7.3% |
( | 141 | 6.3% |
) | 141 | 6.3% |
2 | 132 | 5.9% |
3 | 114 | 5.1% |
4 | 78 | 3.5% |
5 | 67 | 3.0% |
Other values (5) | 172 | 7.7% |
Latin
Value | Count | Frequency (%) |
A | 3 | |
W | 2 | |
e | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2909 | |
ASCII | 2240 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
810 | ||
1 | 245 | 10.9% |
0 | 170 | 7.6% |
, | 163 | 7.3% |
( | 141 | 6.3% |
) | 141 | 6.3% |
2 | 132 | 5.9% |
3 | 114 | 5.1% |
4 | 78 | 3.5% |
5 | 67 | 3.0% |
Other values (8) | 179 | 8.0% |
Hangul
Value | Count | Frequency (%) |
동 | 235 | 8.1% |
하 | 193 | 6.6% |
사 | 155 | 5.3% |
산 | 148 | 5.1% |
구 | 147 | 5.1% |
시 | 144 | 5.0% |
역 | 143 | 4.9% |
부 | 142 | 4.9% |
광 | 141 | 4.8% |
로 | 127 | 4.4% |
Other values (139) | 1334 |
전화번호
Text
MISSING
 
Distinct | 49 |
---|---|
Distinct (%) | 96.1% |
Missing | 145 |
Missing (%) | 74.0% |
Memory size | 1.7 KiB |
Length
Max length | 14 |
---|---|
Median length | 12 |
Mean length | 12.137255 |
Min length | 12 |
Characters and Unicode
Total characters | 619 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 47 ? |
---|---|
Unique (%) | 92.2% |
Sample
1st row | 051-292-0571 |
---|---|
2nd row | 051-206-9785 |
3rd row | 051-292-1177 |
4th row | 051-200-6391-2 |
5th row | 051-207-2530 |
Value | Count | Frequency (%) |
051-292-1177 | 2 | 3.9% |
051-206-9785 | 2 | 3.9% |
051-291-0911 | 1 | 2.0% |
051-715-1079 | 1 | 2.0% |
051-631-3032 | 1 | 2.0% |
051-204-3036 | 1 | 2.0% |
051-261-4114 | 1 | 2.0% |
070-4197-6693 | 1 | 2.0% |
051-714-3935 | 1 | 2.0% |
051-206-1891 | 1 | 2.0% |
Other values (39) | 39 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 106 | |
- | 104 | |
1 | 94 | |
5 | 75 | |
2 | 64 | |
9 | 36 | 5.8% |
7 | 35 | 5.7% |
3 | 30 | 4.8% |
4 | 28 | 4.5% |
6 | 24 | 3.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 515 | |
Dash Punctuation | 104 | 16.8% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 106 | |
1 | 94 | |
5 | 75 | |
2 | 64 | |
9 | 36 | 7.0% |
7 | 35 | 6.8% |
3 | 30 | 5.8% |
4 | 28 | 5.4% |
6 | 24 | 4.7% |
8 | 23 | 4.5% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 104 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 619 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 106 | |
- | 104 | |
1 | 94 | |
5 | 75 | |
2 | 64 | |
9 | 36 | 5.8% |
7 | 35 | 5.7% |
3 | 30 | 4.8% |
4 | 28 | 4.5% |
6 | 24 | 3.9% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 619 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 106 | |
- | 104 | |
1 | 94 | |
5 | 75 | |
2 | 64 | |
9 | 36 | 5.8% |
7 | 35 | 5.7% |
3 | 30 | 4.8% |
4 | 28 | 4.5% |
6 | 24 | 3.9% |
데이터기준일자
Date
CONSTANT
  MISSING
 
Distinct | 1 |
---|---|
Distinct (%) | 0.7% |
Missing | 55 |
Missing (%) | 28.1% |
Memory size | 1.7 KiB |
Minimum | 2023-11-20 00:00:00 |
---|---|
Maximum | 2023-11-20 00:00:00 |
업종 | 전화번호 | |
---|---|---|
업종 | 1.000 | 0.000 |
전화번호 | 0.000 | 1.000 |
업종 | 사업체명칭 | 도로명주소 | 전화번호 | 데이터기준일자 | |
---|---|---|---|---|---|
0 | 출판사 | 태극도 출판부 | 부산광역시 사하구 감천로142번길 25-4 (감천동) | 051-292-0571 | 2023-11-20 |
1 | 출판사 | 동문출판기획 | 부산광역시 사하구 낙동대로520번길 1 (하단동) | 051-206-9785 | 2023-11-20 |
2 | 출판사 | 도서출판 동아기획 | 부산광역시 사하구 낙동대로 542, 213호 (하단동, 대우에덴프라자) | <NA> | 2023-11-20 |
3 | 출판사 | (주)도시인쇄문화사 | 부산광역시 사하구 다대로170번길 13 (신평동) | 051-292-1177 | 2023-11-20 |
4 | 출판사 | 동아대학교출판사 | 부산광역시 사하구 낙동대로550번길 37 (하단동) | 051-200-6391-2 | 2023-11-20 |
5 | 출판사 | 힌트출판사 | 부산광역시 사하구 사리로 47 (괴정동) | 051-207-2530 | 2023-11-20 |
6 | 출판사 | (주)켑스 | 부산광역시 사하구 낙동대로550번길 37 (하단동) | 051-203-5490-1 | 2023-11-20 |
7 | 출판사 | 한국인간재활공학연구소 | 부산광역시 사하구 승학로3번길 87 (하단동) | 051-204-5085 | 2023-11-20 |
8 | 출판사 | 국민전화번호부 출판 | 부산광역시 사하구 회화나무길 67 (괴정동) | 051-204-7114 | 2023-11-20 |
9 | 출판사 | 선원문 | 부산광역시 사하구 사하로141번길 29 (괴정동) | 051-207-7953 | 2023-11-20 |
업종 | 사업체명칭 | 도로명주소 | 전화번호 | 데이터기준일자 | |
---|---|---|---|---|---|
186 | <NA> | <NA> | <NA> | <NA> | <NA> |
187 | <NA> | <NA> | <NA> | <NA> | <NA> |
188 | <NA> | <NA> | <NA> | <NA> | <NA> |
189 | <NA> | <NA> | <NA> | <NA> | <NA> |
190 | <NA> | <NA> | <NA> | <NA> | <NA> |
191 | <NA> | <NA> | <NA> | <NA> | <NA> |
192 | <NA> | <NA> | <NA> | <NA> | <NA> |
193 | <NA> | <NA> | <NA> | <NA> | <NA> |
194 | <NA> | <NA> | <NA> | <NA> | <NA> |
195 | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
업종 | 사업체명칭 | 도로명주소 | 전화번호 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | 55 |