Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 196 |
Missing cells | 3 |
Missing cells (%) | 0.5% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.7 KiB |
Average record size in memory | 24.7 B |
Variable types
Text | 2 |
---|---|
Categorical | 1 |
Dataset
Description | 부산광역시금정구_출판업등록현황_20210326 |
---|---|
Author | 부산광역시 금정구 |
URL | http://data.busan.go.kr/dataSet/detail.nm?contentId=10&publicdatapk=3055406 |
업종 is highly imbalanced (95.4%) | Imbalance |
사업체소재지(도로명) has 2 (1.0%) missing values | Missing |
Reproduction
Analysis started | 2023-12-10 17:21:59.849725 |
---|---|
Analysis finished | 2023-12-10 17:22:01.237871 |
Duration | 1.39 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
사업체명칭
Text
Distinct | 195 |
---|---|
Distinct (%) | 100.0% |
Missing | 1 |
Missing (%) | 0.5% |
Memory size | 1.7 KiB |
Length
Max length | 20 |
---|---|
Median length | 15 |
Mean length | 6.3692308 |
Min length | 2 |
Characters and Unicode
Total characters | 1242 |
---|---|
Distinct characters | 344 |
Distinct categories | 9 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 195 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 사단법인 부산대학교 출판문화원 |
---|---|
2nd row | 제일출판인쇄 |
3rd row | 만수출판사 |
4th row | 도서출판 늘함께 |
5th row | 월간불교세계출판부 |
Value | Count | Frequency (%) |
도서출판 | 19 | 7.5% |
주식회사 | 8 | 3.2% |
사단법인 | 2 | 0.8% |
가을 | 2 | 0.8% |
출판부 | 2 | 0.8% |
아슬란 | 1 | 0.4% |
부산산악포럼 | 1 | 0.4% |
사운드퍼즐 | 1 | 0.4% |
쉼표 | 1 | 0.4% |
ciznet | 1 | 0.4% |
Other values (214) | 214 |
Most occurring characters
Value | Count | Frequency (%) |
57 | 4.6% | |
출 | 47 | 3.8% |
판 | 46 | 3.7% |
사 | 39 | 3.1% |
스 | 29 | 2.3% |
서 | 29 | 2.3% |
도 | 28 | 2.3% |
이 | 23 | 1.9% |
인 | 20 | 1.6% |
아 | 19 | 1.5% |
Other values (334) | 905 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1033 | |
Lowercase Letter | 61 | 4.9% |
Space Separator | 57 | 4.6% |
Uppercase Letter | 46 | 3.7% |
Close Punctuation | 15 | 1.2% |
Open Punctuation | 15 | 1.2% |
Decimal Number | 8 | 0.6% |
Other Punctuation | 6 | 0.5% |
Dash Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
출 | 47 | 4.5% |
판 | 46 | 4.5% |
사 | 39 | 3.8% |
스 | 29 | 2.8% |
서 | 29 | 2.8% |
도 | 28 | 2.7% |
이 | 23 | 2.2% |
인 | 20 | 1.9% |
아 | 19 | 1.8% |
문 | 17 | 1.6% |
Other values (284) | 736 |
Lowercase Letter
Value | Count | Frequency (%) |
t | 7 | |
a | 6 | |
r | 6 | |
e | 5 | 8.2% |
s | 5 | 8.2% |
n | 5 | 8.2% |
i | 4 | 6.6% |
o | 3 | 4.9% |
l | 3 | 4.9% |
f | 3 | 4.9% |
Other values (10) | 14 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 5 | |
O | 5 | |
A | 4 | 8.7% |
M | 4 | 8.7% |
R | 3 | 6.5% |
H | 3 | 6.5% |
C | 3 | 6.5% |
E | 3 | 6.5% |
T | 3 | 6.5% |
B | 2 | 4.3% |
Other values (8) | 11 |
Decimal Number
Value | Count | Frequency (%) |
5 | 2 | |
2 | 2 | |
3 | 2 | |
0 | 1 | |
1 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
& | 3 | |
. | 2 | |
% | 1 | 16.7% |
Space Separator
Value | Count | Frequency (%) |
57 |
Close Punctuation
Value | Count | Frequency (%) |
) | 15 |
Open Punctuation
Value | Count | Frequency (%) |
( | 15 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1024 | |
Latin | 107 | 8.6% |
Common | 102 | 8.2% |
Han | 9 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
출 | 47 | 4.6% |
판 | 46 | 4.5% |
사 | 39 | 3.8% |
스 | 29 | 2.8% |
서 | 29 | 2.8% |
도 | 28 | 2.7% |
이 | 23 | 2.2% |
인 | 20 | 2.0% |
아 | 19 | 1.9% |
문 | 17 | 1.7% |
Other values (275) | 727 |
Latin
Value | Count | Frequency (%) |
t | 7 | 6.5% |
a | 6 | 5.6% |
r | 6 | 5.6% |
S | 5 | 4.7% |
e | 5 | 4.7% |
s | 5 | 4.7% |
n | 5 | 4.7% |
O | 5 | 4.7% |
i | 4 | 3.7% |
A | 4 | 3.7% |
Other values (28) | 55 |
Common
Value | Count | Frequency (%) |
57 | ||
) | 15 | 14.7% |
( | 15 | 14.7% |
& | 3 | 2.9% |
5 | 2 | 2.0% |
2 | 2 | 2.0% |
3 | 2 | 2.0% |
. | 2 | 2.0% |
0 | 1 | 1.0% |
1 | 1 | 1.0% |
Other values (2) | 2 | 2.0% |
Han
Value | Count | Frequency (%) |
性 | 1 | |
感 | 1 | |
時 | 1 | |
代 | 1 | |
志 | 1 | |
享 | 1 | |
出 | 1 | |
版 | 1 | |
社 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1024 | |
ASCII | 209 | 16.8% |
CJK | 9 | 0.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
57 | ||
) | 15 | 7.2% |
( | 15 | 7.2% |
t | 7 | 3.3% |
a | 6 | 2.9% |
r | 6 | 2.9% |
S | 5 | 2.4% |
e | 5 | 2.4% |
s | 5 | 2.4% |
n | 5 | 2.4% |
Other values (40) | 83 |
Hangul
Value | Count | Frequency (%) |
출 | 47 | 4.6% |
판 | 46 | 4.5% |
사 | 39 | 3.8% |
스 | 29 | 2.8% |
서 | 29 | 2.8% |
도 | 28 | 2.7% |
이 | 23 | 2.2% |
인 | 20 | 2.0% |
아 | 19 | 1.9% |
문 | 17 | 1.7% |
Other values (275) | 727 |
CJK
Value | Count | Frequency (%) |
性 | 1 | |
感 | 1 | |
時 | 1 | |
代 | 1 | |
志 | 1 | |
享 | 1 | |
出 | 1 | |
版 | 1 | |
社 | 1 |
사업체소재지(도로명)
Text
MISSING
 
Distinct | 190 |
---|---|
Distinct (%) | 97.9% |
Missing | 2 |
Missing (%) | 1.0% |
Memory size | 1.7 KiB |
Length
Max length | 54 |
---|---|
Median length | 45 |
Mean length | 33.458763 |
Min length | 21 |
Characters and Unicode
Total characters | 6491 |
---|---|
Distinct characters | 187 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 186 ? |
---|---|
Unique (%) | 95.9% |
Sample
1st row | 부산광역시 금정구 부산대학로63번길 2 (장전동) |
---|---|
2nd row | 부산광역시 금정구 부산대학로 10, 103동 23층 2301호 (부곡동, 대우아파트) |
3rd row | 부산광역시 금정구 부산대학로64번길 14-7 (장전동) |
4th row | 부산광역시 금정구 두실로 16 (남산동) |
5th row | 부산광역시 금정구 수림로 132 (장전동) |
Value | Count | Frequency (%) |
부산광역시 | 194 | 16.2% |
금정구 | 194 | 16.2% |
장전동 | 63 | 5.3% |
구서동 | 39 | 3.3% |
부곡동 | 32 | 2.7% |
남산동 | 26 | 2.2% |
금강로 | 19 | 1.6% |
부산대학로63번길 | 11 | 0.9% |
금정로 | 11 | 0.9% |
중앙대로 | 11 | 0.9% |
Other values (390) | 598 |
Most occurring characters
Value | Count | Frequency (%) |
1071 | 16.5% | |
부 | 278 | 4.3% |
산 | 266 | 4.1% |
금 | 258 | 4.0% |
동 | 257 | 4.0% |
구 | 248 | 3.8% |
1 | 243 | 3.7% |
정 | 212 | 3.3% |
시 | 197 | 3.0% |
( | 196 | 3.0% |
Other values (177) | 3265 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3688 | |
Decimal Number | 1113 | 17.1% |
Space Separator | 1071 | 16.5% |
Open Punctuation | 196 | 3.0% |
Close Punctuation | 196 | 3.0% |
Other Punctuation | 174 | 2.7% |
Dash Punctuation | 41 | 0.6% |
Uppercase Letter | 12 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
부 | 278 | 7.5% |
산 | 266 | 7.2% |
금 | 258 | 7.0% |
동 | 257 | 7.0% |
구 | 248 | 6.7% |
정 | 212 | 5.7% |
시 | 197 | 5.3% |
역 | 196 | 5.3% |
로 | 195 | 5.3% |
광 | 194 | 5.3% |
Other values (154) | 1387 |
Decimal Number
Value | Count | Frequency (%) |
1 | 243 | |
2 | 163 | |
0 | 135 | |
3 | 114 | |
5 | 103 | |
4 | 89 | 8.0% |
7 | 80 | 7.2% |
6 | 70 | 6.3% |
9 | 68 | 6.1% |
8 | 48 | 4.3% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 4 | |
B | 3 | |
P | 1 | 8.3% |
D | 1 | 8.3% |
T | 1 | 8.3% |
F | 1 | 8.3% |
L | 1 | 8.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 173 | |
/ | 1 | 0.6% |
Space Separator
Value | Count | Frequency (%) |
1071 |
Open Punctuation
Value | Count | Frequency (%) |
( | 196 |
Close Punctuation
Value | Count | Frequency (%) |
) | 196 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 41 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3688 | |
Common | 2791 | |
Latin | 12 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
부 | 278 | 7.5% |
산 | 266 | 7.2% |
금 | 258 | 7.0% |
동 | 257 | 7.0% |
구 | 248 | 6.7% |
정 | 212 | 5.7% |
시 | 197 | 5.3% |
역 | 196 | 5.3% |
로 | 195 | 5.3% |
광 | 194 | 5.3% |
Other values (154) | 1387 |
Common
Value | Count | Frequency (%) |
1071 | ||
1 | 243 | 8.7% |
( | 196 | 7.0% |
) | 196 | 7.0% |
, | 173 | 6.2% |
2 | 163 | 5.8% |
0 | 135 | 4.8% |
3 | 114 | 4.1% |
5 | 103 | 3.7% |
4 | 89 | 3.2% |
Other values (6) | 308 | 11.0% |
Latin
Value | Count | Frequency (%) |
A | 4 | |
B | 3 | |
P | 1 | 8.3% |
D | 1 | 8.3% |
T | 1 | 8.3% |
F | 1 | 8.3% |
L | 1 | 8.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3688 | |
ASCII | 2803 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1071 | ||
1 | 243 | 8.7% |
( | 196 | 7.0% |
) | 196 | 7.0% |
, | 173 | 6.2% |
2 | 163 | 5.8% |
0 | 135 | 4.8% |
3 | 114 | 4.1% |
5 | 103 | 3.7% |
4 | 89 | 3.2% |
Other values (13) | 320 | 11.4% |
Hangul
Value | Count | Frequency (%) |
부 | 278 | 7.5% |
산 | 266 | 7.2% |
금 | 258 | 7.0% |
동 | 257 | 7.0% |
구 | 248 | 6.7% |
정 | 212 | 5.7% |
시 | 197 | 5.3% |
역 | 196 | 5.3% |
로 | 195 | 5.3% |
광 | 194 | 5.3% |
Other values (154) | 1387 |
업종
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
출판사 | |
---|---|
<NA> | 1 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.005102 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | 출판사 |
---|---|
2nd row | 출판사 |
3rd row | 출판사 |
4th row | 출판사 |
5th row | 출판사 |
Common Values
Value | Count | Frequency (%) |
출판사 | 195 | |
<NA> | 1 | 0.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
출판사 | 195 | |
na | 1 | 0.5% |
사업체명칭 | 사업체소재지(도로명) | 업종 | |
---|---|---|---|
0 | 사단법인 부산대학교 출판문화원 | 부산광역시 금정구 부산대학로63번길 2 (장전동) | 출판사 |
1 | 제일출판인쇄 | 부산광역시 금정구 부산대학로 10, 103동 23층 2301호 (부곡동, 대우아파트) | 출판사 |
2 | 만수출판사 | 부산광역시 금정구 부산대학로64번길 14-7 (장전동) | 출판사 |
3 | 도서출판 늘함께 | 부산광역시 금정구 두실로 16 (남산동) | 출판사 |
4 | 월간불교세계출판부 | 부산광역시 금정구 수림로 132 (장전동) | 출판사 |
5 | 도서출판미래원 | 부산광역시 금정구 중앙대로1841번길 65, 1층 103호 (구서동, 구서골드1상가) | 출판사 |
6 | 동성출판사 | 부산광역시 금정구 서부로 74-6 (서동) | 출판사 |
7 | 광진출판사 | 부산광역시 금정구 부산대학로 60-1 (장전동) | 출판사 |
8 | 한둘학력개발연구소 | 부산광역시 금정구 중앙대로1959번길 11 (구서동) | 출판사 |
9 | 시공연출 | 부산광역시 금정구 부곡로 1 (부곡동) | 출판사 |
사업체명칭 | 사업체소재지(도로명) | 업종 | |
---|---|---|---|
186 | 주식회사 글로벌탑넷 | 부산광역시 금정구 시실로 11-3, 순흥빌딩 3층 (부곡동) | 출판사 |
187 | 도서출판3 | 부산광역시 금정구 중앙대로1929번길 48, 101동 808호 (구서동, 부영벽산아파트) | 출판사 |
188 | 데이북 | 부산광역시 금정구 금강로279번길 61, 110호 (장전동, 현대2차아파트) | 출판사 |
189 | 도서출판 꿈 키움 | 부산광역시 금정구 금샘로485번길 65, 부산외국어대학교 A동 130호 (남산동) | 출판사 |
190 | 디자인 달라 | 부산광역시 금정구 금강로 690-3, 304호 (남산동, 스튜디오690) | 출판사 |
191 | 소하북스 | 부산광역시 금정구 장전온천천로89번길 10-1 (장전동) | 출판사 |
192 | 가인의 집밥 | 부산광역시 금정구 서동로149번길 19 (서동) | 출판사 |
193 | 빅터디자인스튜디오 | 부산광역시 금정구 금강로578번길 32, 2층 (구서동) | 출판사 |
194 | 더알미디어 | 부산광역시 금정구 금정로 63-1, 4층 LAB 5호 (장전동) | 출판사 |
195 | <NA> | <NA> | <NA> |