Overview

Dataset statistics

Number of variables5
Number of observations23
Missing cells2
Missing cells (%)1.7%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory1.0 KiB
Average record size in memory45.7 B

Variable types

Text3
Categorical2

Dataset

Description경기도 구리시 지역내에 위치한 환경오염배출시설(소음진동배출업소)에 대한 현황정보를 제공합니다. (업소명, 소재지, 소음진동구분 )
URLhttps://www.data.go.kr/data/15051002/fileData.do

Alerts

관리기관명 has constant value ""Constant
데이터기준일자 has constant value ""Constant
소음진동구분 has 2 (8.7%) missing valuesMissing
소재지 has unique valuesUnique

Reproduction

Analysis started2023-12-12 01:44:19.799932
Analysis finished2023-12-12 01:44:20.243073
Duration0.44 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct22
Distinct (%)95.7%
Missing0
Missing (%)0.0%
Memory size316.0 B
2023-12-12T10:44:20.399202image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length15
Median length10
Mean length6.5217391
Min length4

Characters and Unicode

Total characters150
Distinct characters81
Distinct categories5 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique21 ?
Unique (%)91.3%

Sample

1st row(주)동양고무
2nd row이화염직
3rd row영신프라스틱
4th row(주)금화염직
5th row성용프라스틱
ValueCountFrequency (%)
대림산업(주 2
 
8.3%
이성정밀 1
 
4.2%
명신테크 1
 
4.2%
조광파이프 1
 
4.2%
종점 1
 
4.2%
해창개발(주)-용마터널 1
 
4.2%
주)현대아이엔에스 1
 
4.2%
오토테크 1
 
4.2%
청송무늬목재 1
 
4.2%
현대산업안전 1
 
4.2%
Other values (13) 13
54.2%
2023-12-12T10:44:20.756120image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
( 8
 
5.3%
8
 
5.3%
) 8
 
5.3%
5
 
3.3%
5
 
3.3%
5
 
3.3%
4
 
2.7%
4
 
2.7%
3
 
2.0%
3
 
2.0%
Other values (71) 97
64.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 132
88.0%
Open Punctuation 8
 
5.3%
Close Punctuation 8
 
5.3%
Dash Punctuation 1
 
0.7%
Space Separator 1
 
0.7%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
8
 
6.1%
5
 
3.8%
5
 
3.8%
5
 
3.8%
4
 
3.0%
4
 
3.0%
3
 
2.3%
3
 
2.3%
3
 
2.3%
3
 
2.3%
Other values (67) 89
67.4%
Open Punctuation
ValueCountFrequency (%)
( 8
100.0%
Close Punctuation
ValueCountFrequency (%)
) 8
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%
Space Separator
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 132
88.0%
Common 18
 
12.0%

Most frequent character per script

Hangul
ValueCountFrequency (%)
8
 
6.1%
5
 
3.8%
5
 
3.8%
5
 
3.8%
4
 
3.0%
4
 
3.0%
3
 
2.3%
3
 
2.3%
3
 
2.3%
3
 
2.3%
Other values (67) 89
67.4%
Common
ValueCountFrequency (%)
( 8
44.4%
) 8
44.4%
- 1
 
5.6%
1
 
5.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 132
88.0%
ASCII 18
 
12.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
( 8
44.4%
) 8
44.4%
- 1
 
5.6%
1
 
5.6%
Hangul
ValueCountFrequency (%)
8
 
6.1%
5
 
3.8%
5
 
3.8%
5
 
3.8%
4
 
3.0%
4
 
3.0%
3
 
2.3%
3
 
2.3%
3
 
2.3%
3
 
2.3%
Other values (67) 89
67.4%

소재지
Text

UNIQUE 

Distinct23
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size316.0 B
2023-12-12T10:44:20.979146image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length29
Median length23
Mean length18.782609
Min length16

Characters and Unicode

Total characters432
Distinct characters42
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique23 ?
Unique (%)100.0%

Sample

1st row경기도 구리시 갈매동 137-1
2nd row경기도 구리시 갈매동 181
3rd row경기도 구리시 사노동 446-1
4th row경기도 구리시 갈매동 137-16
5th row경기도 구리시 사노동 444-2
ValueCountFrequency (%)
경기도 23
24.2%
구리시 23
24.2%
인창동 8
 
8.4%
갈매동 7
 
7.4%
사노동 2
 
2.1%
교문동 2
 
2.1%
토평동 2
 
2.1%
76-3 1
 
1.1%
465-162 1
 
1.1%
458-69 1
 
1.1%
Other values (25) 25
26.3%
2023-12-12T10:44:21.348544image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
95
22.0%
25
 
5.8%
24
 
5.6%
23
 
5.3%
23
 
5.3%
23
 
5.3%
23
 
5.3%
23
 
5.3%
1 22
 
5.1%
- 21
 
4.9%
Other values (32) 130
30.1%

Most occurring categories

ValueCountFrequency (%)
Other Letter 221
51.2%
Space Separator 95
22.0%
Decimal Number 95
22.0%
Dash Punctuation 21
 
4.9%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
25
11.3%
24
10.9%
23
10.4%
23
10.4%
23
10.4%
23
10.4%
23
10.4%
8
 
3.6%
8
 
3.6%
7
 
3.2%
Other values (20) 34
15.4%
Decimal Number
ValueCountFrequency (%)
1 22
23.2%
4 15
15.8%
2 13
13.7%
3 12
12.6%
5 10
10.5%
6 10
10.5%
7 6
 
6.3%
9 3
 
3.2%
8 3
 
3.2%
0 1
 
1.1%
Space Separator
ValueCountFrequency (%)
95
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 21
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 221
51.2%
Common 211
48.8%

Most frequent character per script

Hangul
ValueCountFrequency (%)
25
11.3%
24
10.9%
23
10.4%
23
10.4%
23
10.4%
23
10.4%
23
10.4%
8
 
3.6%
8
 
3.6%
7
 
3.2%
Other values (20) 34
15.4%
Common
ValueCountFrequency (%)
95
45.0%
1 22
 
10.4%
- 21
 
10.0%
4 15
 
7.1%
2 13
 
6.2%
3 12
 
5.7%
5 10
 
4.7%
6 10
 
4.7%
7 6
 
2.8%
9 3
 
1.4%
Other values (2) 4
 
1.9%

Most occurring blocks

ValueCountFrequency (%)
Hangul 221
51.2%
ASCII 211
48.8%

Most frequent character per block

ASCII
ValueCountFrequency (%)
95
45.0%
1 22
 
10.4%
- 21
 
10.0%
4 15
 
7.1%
2 13
 
6.2%
3 12
 
5.7%
5 10
 
4.7%
6 10
 
4.7%
7 6
 
2.8%
9 3
 
1.4%
Other values (2) 4
 
1.9%
Hangul
ValueCountFrequency (%)
25
11.3%
24
10.9%
23
10.4%
23
10.4%
23
10.4%
23
10.4%
23
10.4%
8
 
3.6%
8
 
3.6%
7
 
3.2%
Other values (20) 34
15.4%

소음진동구분
Text

MISSING 

Distinct18
Distinct (%)85.7%
Missing2
Missing (%)8.7%
Memory size316.0 B
2023-12-12T10:44:21.582265image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length146
Median length45
Mean length40.047619
Min length16

Characters and Unicode

Total characters841
Distinct characters68
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique15 ?
Unique (%)71.4%

Sample

1st row10마력이상의 압축기: 소음(1) , 10마력이상의 송풍기: 소음(1)
2nd row마력기준시설 및 기계ㆍ기구: 소음(1)
3rd row10마력이상의 분쇄기(파쇄기포함): 소음(1) , 50마력이상의 성형기: 소음(1) , 50마력이상의 성형기: 진동(1)
4th row10마력이상의 송풍기: 소음(2) , 기타: 소음(1)
5th row10마력이상의 압축기: 소음(1) , 10마력이상의 분쇄기(파쇄기포함): 소음(1) , 동력 50마력이상인 경우: 소음(2) , 기타: 소음(1) , 30마력이상의 분쇄기(파쇄기 포함): 소음(1)
ValueCountFrequency (%)
소음(1 28
19.0%
21
14.3%
10마력이상의 17
 
11.6%
기타 6
 
4.1%
압축기 6
 
4.1%
송풍기 5
 
3.4%
50마력이상의 5
 
3.4%
30마력이상의 4
 
2.7%
소음(2 4
 
2.7%
혼합기 3
 
2.0%
Other values (29) 48
32.7%
2023-12-12T10:44:22.012148image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
126
 
15.0%
1 50
 
5.9%
) 49
 
5.8%
( 49
 
5.8%
46
 
5.5%
42
 
5.0%
42
 
5.0%
: 42
 
5.0%
37
 
4.4%
34
 
4.0%
Other values (58) 324
38.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 442
52.6%
Space Separator 126
 
15.0%
Decimal Number 110
 
13.1%
Other Punctuation 65
 
7.7%
Close Punctuation 49
 
5.8%
Open Punctuation 49
 
5.8%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
46
 
10.4%
42
 
9.5%
42
 
9.5%
37
 
8.4%
34
 
7.7%
33
 
7.5%
33
 
7.5%
28
 
6.3%
10
 
2.3%
6
 
1.4%
Other values (43) 131
29.6%
Decimal Number
ValueCountFrequency (%)
1 50
45.5%
0 33
30.0%
5 9
 
8.2%
2 8
 
7.3%
3 5
 
4.5%
4 2
 
1.8%
9 1
 
0.9%
8 1
 
0.9%
6 1
 
0.9%
Other Punctuation
ValueCountFrequency (%)
: 42
64.6%
, 21
32.3%
· 2
 
3.1%
Space Separator
ValueCountFrequency (%)
126
100.0%
Close Punctuation
ValueCountFrequency (%)
) 49
100.0%
Open Punctuation
ValueCountFrequency (%)
( 49
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 442
52.6%
Common 399
47.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
46
 
10.4%
42
 
9.5%
42
 
9.5%
37
 
8.4%
34
 
7.7%
33
 
7.5%
33
 
7.5%
28
 
6.3%
10
 
2.3%
6
 
1.4%
Other values (43) 131
29.6%
Common
ValueCountFrequency (%)
126
31.6%
1 50
 
12.5%
) 49
 
12.3%
( 49
 
12.3%
: 42
 
10.5%
0 33
 
8.3%
, 21
 
5.3%
5 9
 
2.3%
2 8
 
2.0%
3 5
 
1.3%
Other values (5) 7
 
1.8%

Most occurring blocks

ValueCountFrequency (%)
Hangul 441
52.4%
ASCII 397
47.2%
None 2
 
0.2%
Compat Jamo 1
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
126
31.7%
1 50
 
12.6%
) 49
 
12.3%
( 49
 
12.3%
: 42
 
10.6%
0 33
 
8.3%
, 21
 
5.3%
5 9
 
2.3%
2 8
 
2.0%
3 5
 
1.3%
Other values (4) 5
 
1.3%
Hangul
ValueCountFrequency (%)
46
 
10.4%
42
 
9.5%
42
 
9.5%
37
 
8.4%
34
 
7.7%
33
 
7.5%
33
 
7.5%
28
 
6.3%
10
 
2.3%
6
 
1.4%
Other values (42) 130
29.5%
None
ValueCountFrequency (%)
· 2
100.0%
Compat Jamo
ValueCountFrequency (%)
1
100.0%

관리기관명
Categorical

CONSTANT 

Distinct1
Distinct (%)4.3%
Missing0
Missing (%)0.0%
Memory size316.0 B
경기도 구리시청
23 

Length

Max length8
Median length8
Mean length8
Min length8

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경기도 구리시청
2nd row경기도 구리시청
3rd row경기도 구리시청
4th row경기도 구리시청
5th row경기도 구리시청

Common Values

ValueCountFrequency (%)
경기도 구리시청 23
100.0%

Length

2023-12-12T10:44:22.197543image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:44:22.321971image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
경기도 23
50.0%
구리시청 23
50.0%

데이터기준일자
Categorical

CONSTANT 

Distinct1
Distinct (%)4.3%
Missing0
Missing (%)0.0%
Memory size316.0 B
2023-06-01
23 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2023-06-01
2nd row2023-06-01
3rd row2023-06-01
4th row2023-06-01
5th row2023-06-01

Common Values

ValueCountFrequency (%)
2023-06-01 23
100.0%

Length

2023-12-12T10:44:22.437502image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:44:22.552316image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2023-06-01 23
100.0%

Correlations

2023-12-12T10:44:22.635089image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
업소명소재지소음진동구분
업소명1.0001.0000.932
소재지1.0001.0001.000
소음진동구분0.9321.0001.000

Missing values

2023-12-12T10:44:20.067689image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T10:44:20.200489image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

업소명소재지소음진동구분관리기관명데이터기준일자
0(주)동양고무경기도 구리시 갈매동 137-110마력이상의 압축기: 소음(1) , 10마력이상의 송풍기: 소음(1)경기도 구리시청2023-06-01
1이화염직경기도 구리시 갈매동 181마력기준시설 및 기계ㆍ기구: 소음(1)경기도 구리시청2023-06-01
2영신프라스틱경기도 구리시 사노동 446-110마력이상의 분쇄기(파쇄기포함): 소음(1) , 50마력이상의 성형기: 소음(1) , 50마력이상의 성형기: 진동(1)경기도 구리시청2023-06-01
3(주)금화염직경기도 구리시 갈매동 137-1610마력이상의 송풍기: 소음(2) , 기타: 소음(1)경기도 구리시청2023-06-01
4성용프라스틱경기도 구리시 사노동 444-210마력이상의 압축기: 소음(1) , 10마력이상의 분쇄기(파쇄기포함): 소음(1) , 동력 50마력이상인 경우: 소음(2) , 기타: 소음(1) , 30마력이상의 분쇄기(파쇄기 포함): 소음(1)경기도 구리시청2023-06-01
5신원금속경기도 구리시 인창동 541-2310마력이상의 송풍기: 소음(1)경기도 구리시청2023-06-01
6유남석재경기도 구리시 인창동 543-2기타: 소음(1) , 석재절단기: 소음(1)경기도 구리시청2023-06-01
7성신레미컨(주)경기도 구리시 인창동 22-1110마력이상의 압축기: 소음(5) , 10마력이상의 송풍기: 소음(16) , 30마력이상의 변속기: 소음(14) , 10마력이상의 원심분리기: 소음(1) , 50마력이상의 혼합기(콘크리트프랜트 혼합기 20마력이상): 소음(8) , 20마력이상의 펌프: 소음(9)경기도 구리시청2023-06-01
8우신석물공업사경기도 구리시 인창동 527-16기타: 소음(1) , 석재절단기: 소음(1)경기도 구리시청2023-06-01
9대한석재경기도 구리시 인창동 134-110마력이상의 압축기: 소음(2) , 기타: 소음(1) , 석재절단기: 소음(4)경기도 구리시청2023-06-01
업소명소재지소음진동구분관리기관명데이터기준일자
13이성정밀경기도 구리시 갈매동 137-3동력 50마력이상인 경우: 소음(1)경기도 구리시청2023-06-01
14동구공업사경기도 구리시 인창동 56-310마력이상의 송풍기: 소음(1)경기도 구리시청2023-06-01
15현대산업안전경기도 구리시 갈매동 291-110마력이상의 금속절단기: 소음(1)경기도 구리시청2023-06-01
16대림산업(주)경기도 구리시 토평동 465-16230마력이상의 분쇄기(파쇄기 포함): 소음(1)경기도 구리시청2023-06-01
17청송무늬목재경기도 구리시 갈매동 458-6920마력이상의 제재기: 소음(1)경기도 구리시청2023-06-01
18오토테크경기도 구리시 수택동 521-45<NA>경기도 구리시청2023-06-01
19(주)현대아이엔에스경기도 구리시 인창동 76-310마력이상의 금속절단기: 소음(1)경기도 구리시청2023-06-01
20해창개발(주)-용마터널 종점경기도 구리시 아천동 2-13 폐수처리장50마력이상의 혼합기(콘크리트프랜트 혼합기 20마력이상): 소음·진동(1)경기도 구리시청2023-06-01
21조광파이프경기도 구리시 교문동 340-6<NA>경기도 구리시청2023-06-01
22한불에너지관리(주)경기도 구리시 교문동 249-1 한양대학교 구리병원소음배출시설: 소음·진동(1)경기도 구리시청2023-06-01