Overview

Dataset statistics

Number of variables5
Number of observations166
Missing cells0
Missing cells (%)0.0%
Duplicate rows10
Duplicate rows (%)6.0%
Total size in memory6.6 KiB
Average record size in memory40.8 B

Variable types

Text2
Categorical2
DateTime1

Dataset

Description전라북도 부안군의 대기 배출 시설 설치 현황에 대하여 사업장명, 주소, 대표 업종, 종, 데이터 기준일자 항목을 제공합니다.
URLhttps://www.data.go.kr/data/15084742/fileData.do

Alerts

데이터기준일 has constant value ""Constant
Dataset has 10 (6.0%) duplicate rowsDuplicates
대표업종 is highly imbalanced (53.9%)Imbalance

Reproduction

Analysis started2023-12-12 10:21:23.709711
Analysis finished2023-12-12 10:21:24.185645
Duration0.48 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct136
Distinct (%)81.9%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
2023-12-12T19:21:24.446426image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length16
Median length13
Mean length7.9216867
Min length4

Characters and Unicode

Total characters1315
Distinct characters205
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique117 ?
Unique (%)70.5%

Sample

1st row화성목욕탕
2nd row(주)동진
3rd row내쇼날씨엔디(주)
4th row계화농협미곡종합처리장
5th row서안전분(주)
ValueCountFrequency (%)
농업회사법인 8
 
4.3%
유)삼성환경건설 8
 
4.3%
주)서안 7
 
3.7%
영농조합법인 3
 
1.6%
참두리식품 3
 
1.6%
유)삼성산업환경 3
 
1.6%
유)쌍용레미콘 3
 
1.6%
유한회사 2
 
1.1%
주식회사 2
 
1.1%
화성목욕탕 2
 
1.1%
Other values (135) 147
78.2%
2023-12-12T19:21:24.912448image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
) 72
 
5.5%
( 63
 
4.8%
42
 
3.2%
38
 
2.9%
37
 
2.8%
37
 
2.8%
36
 
2.7%
25
 
1.9%
24
 
1.8%
23
 
1.7%
Other values (195) 918
69.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1155
87.8%
Close Punctuation 72
 
5.5%
Open Punctuation 63
 
4.8%
Space Separator 22
 
1.7%
Uppercase Letter 2
 
0.2%
Decimal Number 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
42
 
3.6%
38
 
3.3%
37
 
3.2%
37
 
3.2%
36
 
3.1%
25
 
2.2%
24
 
2.1%
23
 
2.0%
23
 
2.0%
23
 
2.0%
Other values (189) 847
73.3%
Uppercase Letter
ValueCountFrequency (%)
D 1
50.0%
S 1
50.0%
Close Punctuation
ValueCountFrequency (%)
) 72
100.0%
Open Punctuation
ValueCountFrequency (%)
( 63
100.0%
Space Separator
ValueCountFrequency (%)
22
100.0%
Decimal Number
ValueCountFrequency (%)
1 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1155
87.8%
Common 158
 
12.0%
Latin 2
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
42
 
3.6%
38
 
3.3%
37
 
3.2%
37
 
3.2%
36
 
3.1%
25
 
2.2%
24
 
2.1%
23
 
2.0%
23
 
2.0%
23
 
2.0%
Other values (189) 847
73.3%
Common
ValueCountFrequency (%)
) 72
45.6%
( 63
39.9%
22
 
13.9%
1 1
 
0.6%
Latin
ValueCountFrequency (%)
D 1
50.0%
S 1
50.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1155
87.8%
ASCII 160
 
12.2%

Most frequent character per block

ASCII
ValueCountFrequency (%)
) 72
45.0%
( 63
39.4%
22
 
13.8%
D 1
 
0.6%
S 1
 
0.6%
1 1
 
0.6%
Hangul
ValueCountFrequency (%)
42
 
3.6%
38
 
3.3%
37
 
3.2%
37
 
3.2%
36
 
3.1%
25
 
2.2%
24
 
2.1%
23
 
2.0%
23
 
2.0%
23
 
2.0%
Other values (189) 847
73.3%

주소
Text

Distinct124
Distinct (%)74.7%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
2023-12-12T19:21:25.265571image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length43
Median length41
Mean length23.722892
Min length17

Characters and Unicode

Total characters3938
Distinct characters124
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique105 ?
Unique (%)63.3%

Sample

1st row전라북도 부안군 부안읍 동중리 189-2
2nd row전라북도 부안군 동진면 하장리 396
3rd row전라북도 부안군 동진면 하장리 396
4th row전라북도 부안군 계화면 궁안리 1464
5th row전라북도 부안군 보안면 우동리 138-4 131-12 130-2
ValueCountFrequency (%)
전라북도 166
19.2%
부안군 166
19.2%
행안면 28
 
3.2%
진서면 25
 
2.9%
주산면 23
 
2.7%
동진면 22
 
2.5%
보안면 19
 
2.2%
사산리 17
 
2.0%
역리 17
 
2.0%
진서리 15
 
1.7%
Other values (194) 366
42.4%
2023-12-12T19:21:25.721965image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
878
22.3%
228
 
5.8%
1 192
 
4.9%
178
 
4.5%
174
 
4.4%
169
 
4.3%
169
 
4.3%
168
 
4.3%
167
 
4.2%
166
 
4.2%
Other values (114) 1449
36.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2254
57.2%
Space Separator 878
 
22.3%
Decimal Number 683
 
17.3%
Dash Punctuation 115
 
2.9%
Close Punctuation 4
 
0.1%
Open Punctuation 4
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
228
 
10.1%
178
 
7.9%
174
 
7.7%
169
 
7.5%
169
 
7.5%
168
 
7.5%
167
 
7.4%
166
 
7.4%
155
 
6.9%
64
 
2.8%
Other values (100) 616
27.3%
Decimal Number
ValueCountFrequency (%)
1 192
28.1%
2 82
12.0%
4 64
 
9.4%
7 56
 
8.2%
6 55
 
8.1%
3 53
 
7.8%
9 53
 
7.8%
8 47
 
6.9%
5 46
 
6.7%
0 35
 
5.1%
Space Separator
ValueCountFrequency (%)
878
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 115
100.0%
Close Punctuation
ValueCountFrequency (%)
) 4
100.0%
Open Punctuation
ValueCountFrequency (%)
( 4
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2254
57.2%
Common 1684
42.8%

Most frequent character per script

Hangul
ValueCountFrequency (%)
228
 
10.1%
178
 
7.9%
174
 
7.7%
169
 
7.5%
169
 
7.5%
168
 
7.5%
167
 
7.4%
166
 
7.4%
155
 
6.9%
64
 
2.8%
Other values (100) 616
27.3%
Common
ValueCountFrequency (%)
878
52.1%
1 192
 
11.4%
- 115
 
6.8%
2 82
 
4.9%
4 64
 
3.8%
7 56
 
3.3%
6 55
 
3.3%
3 53
 
3.1%
9 53
 
3.1%
8 47
 
2.8%
Other values (4) 89
 
5.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2254
57.2%
ASCII 1684
42.8%

Most frequent character per block

ASCII
ValueCountFrequency (%)
878
52.1%
1 192
 
11.4%
- 115
 
6.8%
2 82
 
4.9%
4 64
 
3.8%
7 56
 
3.3%
6 55
 
3.3%
3 53
 
3.1%
9 53
 
3.1%
8 47
 
2.8%
Other values (4) 89
 
5.3%
Hangul
ValueCountFrequency (%)
228
 
10.1%
178
 
7.9%
174
 
7.7%
169
 
7.5%
169
 
7.5%
168
 
7.5%
167
 
7.4%
166
 
7.4%
155
 
6.9%
64
 
2.8%
Other values (100) 616
27.3%

대표업종
Categorical

IMBALANCE 

Distinct35
Distinct (%)21.1%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
미입력
114 
곡물 도정업
 
10
레미콘 제조업
 
3
폐기물 처리업
 
3
비금속광물제품 제조업
 
2
Other values (30)
34 

Length

Max length24
Median length3
Mean length5.2289157
Min length3

Unique

Unique26 ?
Unique (%)15.7%

Sample

1st row미입력
2nd row미입력
3rd row미입력
4th row곡물 도정업
5th row음·식료품 제조업

Common Values

ValueCountFrequency (%)
미입력 114
68.7%
곡물 도정업 10
 
6.0%
레미콘 제조업 3
 
1.8%
폐기물 처리업 3
 
1.8%
비금속광물제품 제조업 2
 
1.2%
비금속원료 재생업 2
 
1.2%
자동차 종합 수리업 2
 
1.2%
도축 고기 가공 및 저장처리업 2
 
1.2%
음·식료품 제조업 2
 
1.2%
아스콘 제조업 1
 
0.6%
Other values (25) 25
 
15.1%

Length

2023-12-12T19:21:26.170879image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
미입력 114
43.7%
제조업 21
 
8.0%
11
 
4.2%
도정업 10
 
3.8%
곡물 10
 
3.8%
기타 8
 
3.1%
저장처리업 4
 
1.5%
가공 4
 
1.5%
처리업 4
 
1.5%
폐기물 4
 
1.5%
Other values (54) 71
27.2%


Categorical

Distinct5
Distinct (%)3.0%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
미입력
61 
5종
47 
4종
45 
2종
3종
 
6

Length

Max length3
Median length2
Mean length2.3674699
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row5종
2nd row미입력
3rd row미입력
4th row4종
5th row4종

Common Values

ValueCountFrequency (%)
미입력 61
36.7%
5종 47
28.3%
4종 45
27.1%
2종 7
 
4.2%
3종 6
 
3.6%

Length

2023-12-12T19:21:26.310363image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T19:21:26.432916image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
미입력 61
36.7%
5종 47
28.3%
4종 45
27.1%
2종 7
 
4.2%
3종 6
 
3.6%

데이터기준일
Date

CONSTANT 

Distinct1
Distinct (%)0.6%
Missing0
Missing (%)0.0%
Memory size1.4 KiB
Minimum2023-07-31 00:00:00
Maximum2023-07-31 00:00:00
2023-12-12T19:21:26.522946image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-12T19:21:26.609957image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=1)

Correlations

2023-12-12T19:21:26.672084image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
대표업종
대표업종1.0000.742
0.7421.000
2023-12-12T19:21:26.739447image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
대표업종
1.0000.382
대표업종0.3821.000
2023-12-12T19:21:26.805718image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
대표업종
대표업종1.0000.382
0.3821.000

Missing values

2023-12-12T19:21:24.031140image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T19:21:24.131952image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

사업장명주소대표업종데이터기준일
0화성목욕탕전라북도 부안군 부안읍 동중리 189-2미입력5종2023-07-31
1(주)동진전라북도 부안군 동진면 하장리 396미입력미입력2023-07-31
2내쇼날씨엔디(주)전라북도 부안군 동진면 하장리 396미입력미입력2023-07-31
3계화농협미곡종합처리장전라북도 부안군 계화면 궁안리 1464곡물 도정업4종2023-07-31
4서안전분(주)전라북도 부안군 보안면 우동리 138-4 131-12 130-2음·식료품 제조업4종2023-07-31
5(유)서부전라북도 부안군 동진면 내기리 497-2레미콘 제조업5종2023-07-31
6부안수산업협동조합전라북도 부안군 진서면 곰소리 110미입력미입력2023-07-31
7줄포농업협동조합전라북도 부안군 줄포면 파산리 1-10미입력미입력2023-07-31
8(주)개암죽염식품전라북도 부안군 상서면 감교리 660-9가공 및 정제염 제조업5종2023-07-31
9개암식품전라북도 부안군 상서면 감교리 600-9미입력4종2023-07-31
사업장명주소대표업종데이터기준일
156(주)성우푸드전라북도 부안군 행안면 역리 1135 (주)성우푸드도축 고기 가공 및 저장처리업5종2023-07-31
157농업회사법인 (유)농수야전라북도 부안군 주산면 사산리 80-1과실 채소가공 및 저장처리업5종2023-07-31
158(주)서안전라북도 부안군 보안면 우동리 138 131-11 140-8 141-23음·식료품 제조업5종2023-07-31
159강산자동차공업사전라북도 부안군 동진면 봉황리 493-2미입력5종2023-07-31
160줄포자동차공업고등학교전라북도 부안군 줄포면 우포리 138 줄포자동차공업고등학교공업고등학교5종2023-07-31
161금판영농조합법인전라북도 부안군 동진면 하장리 1625-10곡물 도정업4종2023-07-31
162농업회사법인 (유)부령산업전라북도 부안군 백산면 하청리 415-6폐기물 처리업4종2023-07-31
163부안군청전라북도 부안군 부안읍 동중리 222-1 부안군청기타 서비스업5종2023-07-31
164(주)에스첨단소재전라북도 부안군 행안면 역리 1173설치용 금속탱크 및 저장용기 제조업5종2023-07-31
165(주)콩고미전라북도 부안군 행안면 역리 1200기타 식품 첨가물 제조업5종2023-07-31

Duplicate rows

Most frequently occurring

사업장명주소대표업종데이터기준일# duplicates
8유)삼성산업환경전라북도 부안군 주산면 사산리 771-6미입력미입력2023-07-313
0(유)삼성환경건설전라북도 부안군 주산면 사산리 771-6미입력2종2023-07-312
1(유)삼성환경건설전라북도 부안군 주산면 사산리 771-6미입력미입력2023-07-312
2(유)쌍용레미콘전라북도 부안군 동진면 봉황리 489미입력4종2023-07-312
3(주)서안전라북도 부안군 보안면 우동리 138미입력5종2023-07-312
4(주)서안전라북도 부안군 보안면 우동리 138미입력미입력2023-07-312
5내쇼날씨엔디(주)전라북도 부안군 동진면 하장리 396미입력미입력2023-07-312
6대중양만장전라북도 부안군 백산면 대죽리 365미입력미입력2023-07-312
7새마을젓집전라북도 부안군 진서면 곰소리 556미입력미입력2023-07-312
9화성목욕탕전라북도 부안군 부안읍 동중리 189-2미입력5종2023-07-312