Overview

Dataset statistics

Number of variables3
Number of observations424
Missing cells0
Missing cells (%)0.0%
Duplicate rows7
Duplicate rows (%)1.7%
Total size in memory10.1 KiB
Average record size in memory24.3 B

Variable types

Text1
Categorical2

Dataset

Description인천광역시 연수구 출판사 및 인쇄소에 대한 데이터로 출판사 및 인쇄소의 사업체명, 주소, 업종 등의 항목을 제공합니다.
Author인천광역시 연수구
URLhttps://data.incheon.go.kr/findData/publicDataDetail?dataId=3081075&srcSe=7661IVAWM27C61E190

Alerts

Dataset has 7 (1.7%) duplicate rowsDuplicates

Reproduction

Analysis started2024-03-18 04:14:22.510705
Analysis finished2024-03-18 04:14:23.950307
Duration1.44 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct395
Distinct (%)93.2%
Missing0
Missing (%)0.0%
Memory size3.4 KiB
2024-03-18T13:14:24.132004image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length41
Median length26
Mean length7.3066038
Min length2

Characters and Unicode

Total characters3098
Distinct characters450
Distinct categories9 ?
Distinct scripts4 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique369 ?
Unique (%)87.0%

Sample

1st row예수전도협회출판사
2nd row도서출판 우향
3rd row인천21기획
4th row사회복지정책개발연구소
5th row글이야기
ValueCountFrequency (%)
주식회사 45
 
7.2%
도서출판 37
 
5.9%
출판사 6
 
1.0%
스튜디오 6
 
1.0%
4
 
0.6%
디자인 4
 
0.6%
the 3
 
0.5%
studio 3
 
0.5%
페이지스 3
 
0.5%
선우기획 3
 
0.5%
Other values (477) 514
81.8%
2024-03-18T13:14:24.498035image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
204
 
6.6%
93
 
3.0%
89
 
2.9%
75
 
2.4%
70
 
2.3%
) 64
 
2.1%
( 63
 
2.0%
62
 
2.0%
61
 
2.0%
53
 
1.7%
Other values (440) 2264
73.1%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2379
76.8%
Lowercase Letter 222
 
7.2%
Space Separator 204
 
6.6%
Uppercase Letter 143
 
4.6%
Close Punctuation 65
 
2.1%
Open Punctuation 64
 
2.1%
Other Punctuation 10
 
0.3%
Decimal Number 10
 
0.3%
Dash Punctuation 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
93
 
3.9%
89
 
3.7%
75
 
3.2%
70
 
2.9%
62
 
2.6%
61
 
2.6%
53
 
2.2%
51
 
2.1%
50
 
2.1%
46
 
1.9%
Other values (375) 1729
72.7%
Lowercase Letter
ValueCountFrequency (%)
o 28
12.6%
n 21
 
9.5%
e 21
 
9.5%
t 20
 
9.0%
i 19
 
8.6%
a 17
 
7.7%
s 13
 
5.9%
r 12
 
5.4%
h 8
 
3.6%
d 8
 
3.6%
Other values (13) 55
24.8%
Uppercase Letter
ValueCountFrequency (%)
S 17
 
11.9%
A 12
 
8.4%
I 11
 
7.7%
C 10
 
7.0%
O 9
 
6.3%
B 9
 
6.3%
T 8
 
5.6%
N 7
 
4.9%
D 7
 
4.9%
M 7
 
4.9%
Other values (13) 46
32.2%
Decimal Number
ValueCountFrequency (%)
3 3
30.0%
9 2
20.0%
8 1
 
10.0%
6 1
 
10.0%
0 1
 
10.0%
2 1
 
10.0%
1 1
 
10.0%
Other Punctuation
ValueCountFrequency (%)
. 3
30.0%
& 3
30.0%
, 1
 
10.0%
! 1
 
10.0%
· 1
 
10.0%
' 1
 
10.0%
Close Punctuation
ValueCountFrequency (%)
) 64
98.5%
] 1
 
1.5%
Open Punctuation
ValueCountFrequency (%)
( 63
98.4%
[ 1
 
1.6%
Space Separator
ValueCountFrequency (%)
204
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2376
76.7%
Latin 365
 
11.8%
Common 354
 
11.4%
Han 3
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
93
 
3.9%
89
 
3.7%
75
 
3.2%
70
 
2.9%
62
 
2.6%
61
 
2.6%
53
 
2.2%
51
 
2.1%
50
 
2.1%
46
 
1.9%
Other values (372) 1726
72.6%
Latin
ValueCountFrequency (%)
o 28
 
7.7%
n 21
 
5.8%
e 21
 
5.8%
t 20
 
5.5%
i 19
 
5.2%
S 17
 
4.7%
a 17
 
4.7%
s 13
 
3.6%
A 12
 
3.3%
r 12
 
3.3%
Other values (36) 185
50.7%
Common
ValueCountFrequency (%)
204
57.6%
) 64
 
18.1%
( 63
 
17.8%
. 3
 
0.8%
3 3
 
0.8%
& 3
 
0.8%
9 2
 
0.6%
8 1
 
0.3%
, 1
 
0.3%
! 1
 
0.3%
Other values (9) 9
 
2.5%
Han
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2376
76.7%
ASCII 718
 
23.2%
CJK 3
 
0.1%
None 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
204
28.4%
) 64
 
8.9%
( 63
 
8.8%
o 28
 
3.9%
n 21
 
2.9%
e 21
 
2.9%
t 20
 
2.8%
i 19
 
2.6%
S 17
 
2.4%
a 17
 
2.4%
Other values (54) 244
34.0%
Hangul
ValueCountFrequency (%)
93
 
3.9%
89
 
3.7%
75
 
3.2%
70
 
2.9%
62
 
2.6%
61
 
2.6%
53
 
2.2%
51
 
2.1%
50
 
2.1%
46
 
1.9%
Other values (372) 1726
72.6%
CJK
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%
None
ValueCountFrequency (%)
· 1
100.0%
Distinct6
Distinct (%)1.4%
Missing0
Missing (%)0.0%
Memory size3.4 KiB
인천광역시 연수구 송도동
260 
인천광역시 연수구 연수동
62 
인천광역시 연수구 동춘동
37 
인천광역시 연수구 청학동
 
25
인천광역시 연수구 옥련동
 
23

Length

Max length13
Median length13
Mean length13
Min length13

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row인천광역시 연수구 연수동
2nd row인천광역시 연수구 연수동
3rd row인천광역시 연수구 선학동
4th row인천광역시 연수구 연수동
5th row인천광역시 연수구 동춘동

Common Values

ValueCountFrequency (%)
인천광역시 연수구 송도동 260
61.3%
인천광역시 연수구 연수동 62
 
14.6%
인천광역시 연수구 동춘동 37
 
8.7%
인천광역시 연수구 청학동 25
 
5.9%
인천광역시 연수구 옥련동 23
 
5.4%
인천광역시 연수구 선학동 17
 
4.0%

Length

2024-03-18T13:14:24.607295image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-18T13:14:24.713809image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
인천광역시 424
33.3%
연수구 424
33.3%
송도동 260
20.4%
연수동 62
 
4.9%
동춘동 37
 
2.9%
청학동 25
 
2.0%
옥련동 23
 
1.8%
선학동 17
 
1.3%

업종
Categorical

Distinct2
Distinct (%)0.5%
Missing0
Missing (%)0.0%
Memory size3.4 KiB
출판사
377 
인쇄사
47 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row출판사
2nd row출판사
3rd row출판사
4th row출판사
5th row출판사

Common Values

ValueCountFrequency (%)
출판사 377
88.9%
인쇄사 47
 
11.1%

Length

2024-03-18T13:14:24.831857image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-18T13:14:24.972938image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
출판사 377
88.9%
인쇄사 47
 
11.1%

Correlations

2024-03-18T13:14:25.030085image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
사업체소재지(도로명)업종
사업체소재지(도로명)1.0000.154
업종0.1541.000
2024-03-18T13:14:25.098170image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
사업체소재지(도로명)업종
사업체소재지(도로명)1.0000.110
업종0.1101.000
2024-03-18T13:14:25.165333image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
사업체소재지(도로명)업종
사업체소재지(도로명)1.0000.110
업종0.1101.000

Missing values

2024-03-18T13:14:23.815556image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-18T13:14:23.918041image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

사업체명칭사업체소재지(도로명)업종
0예수전도협회출판사인천광역시 연수구 연수동출판사
1도서출판 우향인천광역시 연수구 연수동출판사
2인천21기획인천광역시 연수구 선학동출판사
3사회복지정책개발연구소인천광역시 연수구 연수동출판사
4글이야기인천광역시 연수구 동춘동출판사
5아진전산인천광역시 연수구 청학동출판사
6사설마당인천광역시 연수구 청학동출판사
7밝은신문출판국인천광역시 연수구 선학동출판사
8가람기획인천광역시 연수구 청학동출판사
9다보출판인천광역시 연수구 옥련동출판사
사업체명칭사업체소재지(도로명)업종
414원스 디앤피인천광역시 연수구 송도동인쇄사
415은정기획인천광역시 연수구 송도동인쇄사
416주식회사 이음디앤피인천광역시 연수구 송도동인쇄사
417유주메이드인천광역시 연수구 송도동인쇄사
418주식회사 인천경기오피스디포 트리플스트리트인천광역시 연수구 송도동인쇄사
419주식회사 북스포어인천광역시 연수구 송도동인쇄사
420아이티디 그래픽인천광역시 연수구 송도동인쇄사
421주식회사 공간환경디자인인천광역시 연수구 송도동인쇄사
422광창문화사인천광역시 연수구 동춘동인쇄사
423페이지스인천광역시 연수구 청학동인쇄사

Duplicate rows

Most frequently occurring

사업체명칭사업체소재지(도로명)업종# duplicates
0고잉스튜디오인천광역시 연수구 연수동출판사2
1네오다큐인천광역시 연수구 선학동인쇄사2
2도서출판 미주인천광역시 연수구 선학동출판사2
3드림기획인천광역시 연수구 송도동인쇄사2
4선우기획인천광역시 연수구 송도동인쇄사2
5주식회사 북스포어인천광역시 연수구 송도동인쇄사2
6페이지스인천광역시 연수구 청학동인쇄사2