Overview

Dataset statistics

Number of variables4
Number of observations209
Missing cells0
Missing cells (%)0.0%
Duplicate rows1
Duplicate rows (%)0.5%
Total size in memory6.7 KiB
Average record size in memory32.6 B

Variable types

DateTime1
Text1
Categorical2

Dataset

Description부산광역시 사상구 관내에 소재한 출판업, 인쇄업의 현황에 관한 데이터로 업종명, 소재지, 사업체명칭 등의 항목에 대해 정보를 제공합니다.
URLhttps://www.data.go.kr/data/15025660/fileData.do

Alerts

Dataset has 1 (0.5%) duplicate rowsDuplicates

Reproduction

Analysis started2023-12-12 19:03:58.320230
Analysis finished2023-12-12 19:03:58.766945
Duration0.45 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct180
Distinct (%)86.1%
Missing0
Missing (%)0.0%
Memory size1.8 KiB
Minimum1978-05-26 00:00:00
Maximum2023-08-14 00:00:00
2023-12-13T04:03:58.879072image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T04:03:59.087549image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
Distinct172
Distinct (%)82.3%
Missing0
Missing (%)0.0%
Memory size1.8 KiB
2023-12-13T04:03:59.454727image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length15
Median length12
Mean length6.3923445
Min length2

Characters and Unicode

Total characters1336
Distinct characters241
Distinct categories7 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique135 ?
Unique (%)64.6%

Sample

1st row학교법인 동서학원 민석문화사
2nd row성심출판사
3rd row도서출판대우
4th row도서출판좋은친구
5th row신라대학교출판부
ValueCountFrequency (%)
주식회사 9
 
3.7%
도서출판 7
 
2.8%
디자인 4
 
1.6%
혜성인쇄 2
 
0.8%
국제컴 2
 
0.8%
주)대일프린텍 2
 
0.8%
주)연합커뮤니케이션 2
 
0.8%
주)신진사진인쇄 2
 
0.8%
중앙광고인쇄문화 2
 
0.8%
지성문화산업사 2
 
0.8%
Other values (179) 212
86.2%
2023-12-13T04:03:59.983011image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
75
 
5.6%
73
 
5.5%
55
 
4.1%
( 46
 
3.4%
) 46
 
3.4%
44
 
3.3%
37
 
2.8%
32
 
2.4%
29
 
2.2%
26
 
1.9%
Other values (231) 873
65.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1199
89.7%
Open Punctuation 46
 
3.4%
Close Punctuation 46
 
3.4%
Space Separator 37
 
2.8%
Uppercase Letter 6
 
0.4%
Other Punctuation 1
 
0.1%
Decimal Number 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
75
 
6.3%
73
 
6.1%
55
 
4.6%
44
 
3.7%
32
 
2.7%
29
 
2.4%
26
 
2.2%
24
 
2.0%
24
 
2.0%
21
 
1.8%
Other values (221) 796
66.4%
Uppercase Letter
ValueCountFrequency (%)
D 2
33.3%
M 1
16.7%
I 1
16.7%
E 1
16.7%
B 1
16.7%
Open Punctuation
ValueCountFrequency (%)
( 46
100.0%
Close Punctuation
ValueCountFrequency (%)
) 46
100.0%
Space Separator
ValueCountFrequency (%)
37
100.0%
Other Punctuation
ValueCountFrequency (%)
1
100.0%
Decimal Number
ValueCountFrequency (%)
2 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1199
89.7%
Common 131
 
9.8%
Latin 6
 
0.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
75
 
6.3%
73
 
6.1%
55
 
4.6%
44
 
3.7%
32
 
2.7%
29
 
2.4%
26
 
2.2%
24
 
2.0%
24
 
2.0%
21
 
1.8%
Other values (221) 796
66.4%
Common
ValueCountFrequency (%)
( 46
35.1%
) 46
35.1%
37
28.2%
1
 
0.8%
2 1
 
0.8%
Latin
ValueCountFrequency (%)
D 2
33.3%
M 1
16.7%
I 1
16.7%
E 1
16.7%
B 1
16.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1199
89.7%
ASCII 136
 
10.2%
None 1
 
0.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
75
 
6.3%
73
 
6.1%
55
 
4.6%
44
 
3.7%
32
 
2.7%
29
 
2.4%
26
 
2.2%
24
 
2.0%
24
 
2.0%
21
 
1.8%
Other values (221) 796
66.4%
ASCII
ValueCountFrequency (%)
( 46
33.8%
) 46
33.8%
37
27.2%
D 2
 
1.5%
M 1
 
0.7%
I 1
 
0.7%
E 1
 
0.7%
B 1
 
0.7%
2 1
 
0.7%
None
ValueCountFrequency (%)
1
100.0%
Distinct8
Distinct (%)3.8%
Missing0
Missing (%)0.0%
Memory size1.8 KiB
부산광역시 사상구 감전동
40 
부산광역시 사상구 삼락동
39 
부산광역시 사상구 주례동
32 
부산광역시 사상구 학장동
29 
부산광역시 사상구 덕포동
19 
Other values (3)
50 

Length

Max length14
Median length14
Mean length14
Min length14

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row부산광역시 사상구 주례동
2nd row부산광역시 사상구 감전동
3rd row부산광역시 사상구 주례동
4th row부산광역시 사상구 덕포동
5th row부산광역시 사상구 괘법동

Common Values

ValueCountFrequency (%)
부산광역시 사상구 감전동 40
19.1%
부산광역시 사상구 삼락동 39
18.7%
부산광역시 사상구 주례동 32
15.3%
부산광역시 사상구 학장동 29
13.9%
부산광역시 사상구 덕포동 19
9.1%
부산광역시 사상구 괘법동 18
8.6%
부산광역시 사상구 모라동 18
8.6%
부산광역시 사상구 엄궁동 14
 
6.7%

Length

2023-12-13T04:04:00.209301image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T04:04:00.717067image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
부산광역시 209
33.3%
사상구 209
33.3%
감전동 40
 
6.4%
삼락동 39
 
6.2%
주례동 32
 
5.1%
학장동 29
 
4.6%
덕포동 19
 
3.0%
괘법동 18
 
2.9%
모라동 18
 
2.9%
엄궁동 14
 
2.2%

업종
Categorical

Distinct2
Distinct (%)1.0%
Missing0
Missing (%)0.0%
Memory size1.8 KiB
출판사
125 
인쇄사
84 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row출판사
2nd row출판사
3rd row출판사
4th row출판사
5th row출판사

Common Values

ValueCountFrequency (%)
출판사 125
59.8%
인쇄사 84
40.2%

Length

2023-12-13T04:04:00.955605image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T04:04:01.114049image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
출판사 125
59.8%
인쇄사 84
40.2%

Correlations

2023-12-13T04:04:01.207192image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
사업체소재지업종
사업체소재지1.0000.396
업종0.3961.000
2023-12-13T04:04:01.327673image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
업종사업체소재지
업종1.0000.293
사업체소재지0.2931.000
2023-12-13T04:04:01.430914image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
사업체소재지업종
사업체소재지1.0000.293
업종0.2931.000

Missing values

2023-12-13T04:03:58.595819image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T04:03:58.717140image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

신고일자사업체명칭사업체소재지업종
01978-05-26학교법인 동서학원 민석문화사부산광역시 사상구 주례동출판사
11985-09-05성심출판사부산광역시 사상구 감전동출판사
21989-10-13도서출판대우부산광역시 사상구 주례동출판사
31993-10-13도서출판좋은친구부산광역시 사상구 덕포동출판사
41994-04-29신라대학교출판부부산광역시 사상구 괘법동출판사
51997-08-05유신인쇄출판사부산광역시 사상구 삼락동출판사
61998-02-19백영희성경연구소부산광역시 사상구 엄궁동출판사
71999-05-27도서출판 유니콘부산광역시 사상구 삼락동출판사
81999-07-22연지기획부산광역시 사상구 삼락동출판사
92000-04-26청하연마부산광역시 사상구 덕포동출판사
신고일자사업체명칭사업체소재지업종
1992021-11-10주식회사 일구인쇄출판부산광역시 사상구 감전동인쇄사
2002015-10-13(주)금영인쇄출판부산광역시 사상구 감전동인쇄사
2012021-11-10주식회사 금동몰부산광역시 사상구 감전동인쇄사
2022022-04-05(주)성도피앤피부산광역시 사상구 모라동인쇄사
2032021-04-06도담기획부산광역시 사상구 삼락동인쇄사
2042014-05-27디자인 다온부산광역시 사상구 삼락동인쇄사
2052003-10-22세광스크린 명판부산광역시 사상구 주례동인쇄사
2062016-10-19에스엠테크부산광역시 사상구 감전동인쇄사
2072022-11-10스퀘어월드부산광역시 사상구 모라동인쇄사
2082023-01-05도미노디자인부산광역시 사상구 감전동인쇄사

Duplicate rows

Most frequently occurring

신고일자사업체명칭사업체소재지업종# duplicates
02022-02-28(주) 금영인쇄출판부산광역시 사상구 감전동출판사2