Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 203 |
Missing cells | 356 |
Missing cells (%) | 35.1% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.5% |
Total size in memory | 8.3 KiB |
Average record size in memory | 41.7 B |
Variable types
Numeric | 1 |
---|---|
Text | 3 |
Categorical | 1 |
Dataset
Description | 인천광역시 중구 관내에 위치한 대기오염물질 배출시설 현황에 대한 데이터 입니다.파일명 인천광역시_중구_대기오염물질 배출시설 현황파일내용 업소명, 구분, 도로명 주소 등 |
---|---|
Author | 인천광역시 중구 |
URL | https://www.data.go.kr/data/15087839/fileData.do |
Dataset has 1 (0.5%) duplicate rows | Duplicates |
연번 is highly overall correlated with 데이터 기준일자 | High correlation |
데이터 기준일자 is highly overall correlated with 연번 | High correlation |
연번 has 89 (43.8%) missing values | Missing |
업소명 has 89 (43.8%) missing values | Missing |
구분 has 89 (43.8%) missing values | Missing |
도로명 주소 has 89 (43.8%) missing values | Missing |
Reproduction
Analysis started | 2024-04-17 17:31:23.358773 |
---|---|
Analysis finished | 2024-04-17 17:31:23.890574 |
Duration | 0.53 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 114 |
---|---|
Distinct (%) | 100.0% |
Missing | 89 |
Missing (%) | 43.8% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 63.745614 |
Minimum | 1 |
---|---|
Maximum | 203 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 6.65 |
Q1 | 29.25 |
median | 57.5 |
Q3 | 85.75 |
95-th percentile | 197.35 |
Maximum | 203 |
Range | 202 |
Interquartile range (IQR) | 56.5 |
Descriptive statistics
Standard deviation | 47.768396 |
---|---|
Coefficient of variation (CV) | 0.74935973 |
Kurtosis | 2.2108269 |
Mean | 63.745614 |
Median Absolute Deviation (MAD) | 28.5 |
Skewness | 1.393919 |
Sum | 7267 |
Variance | 2281.8197 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
87 | 1 | 0.5% |
85 | 1 | 0.5% |
84 | 1 | 0.5% |
83 | 1 | 0.5% |
82 | 1 | 0.5% |
81 | 1 | 0.5% |
80 | 1 | 0.5% |
79 | 1 | 0.5% |
78 | 1 | 0.5% |
77 | 1 | 0.5% |
Other values (104) | 104 | |
(Missing) | 89 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
203 | 1 | |
202 | 1 | |
201 | 1 | |
200 | 1 | |
199 | 1 | |
198 | 1 | |
197 | 1 | |
196 | 1 | |
106 | 1 | |
105 | 1 |
업소명
Text
MISSING
 
Distinct | 107 |
---|---|
Distinct (%) | 93.9% |
Missing | 89 |
Missing (%) | 43.8% |
Memory size | 1.7 KiB |
Length
Max length | 25 |
---|---|
Median length | 14 |
Mean length | 8.0526316 |
Min length | 3 |
Characters and Unicode
Total characters | 918 |
---|---|
Distinct characters | 208 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 106 ? |
---|---|
Unique (%) | 93.0% |
Sample
1st row | 씨제이제일제당㈜인천3공장 |
---|---|
2nd row | ㈜삼양사 인천2공장 |
3rd row | 씨제이제일제당㈜인천냉동식품공장 |
4th row | 대한제당㈜ |
5th row | 씨제이제일제당㈜ 인천1공장 |
Value | Count | Frequency (%) |
보일러 | 8 | 6.1% |
㈜한진 | 2 | 1.5% |
씨제이제일제당㈜ | 2 | 1.5% |
인천2공장 | 2 | 1.5% |
사단법인 | 1 | 0.8% |
전 | 1 | 0.8% |
케이준오토 | 1 | 0.8% |
정석기업㈜인천관리사무소-신관 | 1 | 0.8% |
쌍용레미콘㈜인천파쇄장 | 1 | 0.8% |
인천관광공사 | 1 | 0.8% |
Other values (111) | 111 |
Most occurring characters
Value | Count | Frequency (%) |
㈜ | 78 | 8.5% |
인 | 41 | 4.5% |
천 | 34 | 3.7% |
28 | 3.1% | |
스 | 27 | 2.9% |
공 | 27 | 2.9% |
제 | 24 | 2.6% |
업 | 23 | 2.5% |
터 | 22 | 2.4% |
이 | 22 | 2.4% |
Other values (198) | 592 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 785 | |
Other Symbol | 78 | 8.5% |
Space Separator | 28 | 3.1% |
Uppercase Letter | 10 | 1.1% |
Decimal Number | 6 | 0.7% |
Close Punctuation | 4 | 0.4% |
Open Punctuation | 4 | 0.4% |
Dash Punctuation | 2 | 0.2% |
Other Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
인 | 41 | 5.2% |
천 | 34 | 4.3% |
스 | 27 | 3.4% |
공 | 27 | 3.4% |
제 | 24 | 3.1% |
업 | 23 | 2.9% |
터 | 22 | 2.8% |
이 | 22 | 2.8% |
일 | 19 | 2.4% |
사 | 18 | 2.3% |
Other values (183) | 528 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 4 | |
G | 2 | |
L | 1 | 10.0% |
N | 1 | 10.0% |
U | 1 | 10.0% |
J | 1 | 10.0% |
Decimal Number
Value | Count | Frequency (%) |
2 | 3 | |
1 | 2 | |
3 | 1 | 16.7% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 78 |
Space Separator
Value | Count | Frequency (%) |
28 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 863 | |
Common | 45 | 4.9% |
Latin | 10 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
㈜ | 78 | 9.0% |
인 | 41 | 4.8% |
천 | 34 | 3.9% |
스 | 27 | 3.1% |
공 | 27 | 3.1% |
제 | 24 | 2.8% |
업 | 23 | 2.7% |
터 | 22 | 2.5% |
이 | 22 | 2.5% |
일 | 19 | 2.2% |
Other values (184) | 546 |
Common
Value | Count | Frequency (%) |
28 | ||
) | 4 | 8.9% |
( | 4 | 8.9% |
2 | 3 | 6.7% |
- | 2 | 4.4% |
1 | 2 | 4.4% |
& | 1 | 2.2% |
3 | 1 | 2.2% |
Latin
Value | Count | Frequency (%) |
S | 4 | |
G | 2 | |
L | 1 | 10.0% |
N | 1 | 10.0% |
U | 1 | 10.0% |
J | 1 | 10.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 785 | |
None | 78 | 8.5% |
ASCII | 55 | 6.0% |
Most frequent character per block
None
Value | Count | Frequency (%) |
㈜ | 78 |
Hangul
Value | Count | Frequency (%) |
인 | 41 | 5.2% |
천 | 34 | 4.3% |
스 | 27 | 3.4% |
공 | 27 | 3.4% |
제 | 24 | 3.1% |
업 | 23 | 2.9% |
터 | 22 | 2.8% |
이 | 22 | 2.8% |
일 | 19 | 2.4% |
사 | 18 | 2.3% |
Other values (183) | 528 |
ASCII
Value | Count | Frequency (%) |
28 | ||
) | 4 | 7.3% |
S | 4 | 7.3% |
( | 4 | 7.3% |
2 | 3 | 5.5% |
- | 2 | 3.6% |
G | 2 | 3.6% |
1 | 2 | 3.6% |
L | 1 | 1.8% |
& | 1 | 1.8% |
Other values (4) | 4 | 7.3% |
구분
Text
MISSING
 
Distinct | 61 |
---|---|
Distinct (%) | 53.5% |
Missing | 89 |
Missing (%) | 43.8% |
Memory size | 1.7 KiB |
Value | Count | Frequency (%) |
자동차정비업 | 21 | 12.8% |
자동차종합수리업 | 13 | 7.9% |
및 | 9 | 5.5% |
식료품제조 | 8 | 4.9% |
모래 | 7 | 4.3% |
자갈채취업 | 7 | 4.3% |
사료제조업 | 5 | 3.0% |
세차시설 | 5 | 3.0% |
제조업 | 4 | 2.4% |
자동차정비 | 3 | 1.8% |
Other values (73) | 82 |
Most occurring characters
Value | Count | Frequency (%) |
업 | 81 | 9.2% |
67 | 7.6% | |
자 | 52 | 5.9% |
차 | 51 | 5.8% |
동 | 48 | 5.5% |
비 | 35 | 4.0% |
정 | 28 | 3.2% |
제 | 27 | 3.1% |
조 | 25 | 2.8% |
수 | 20 | 2.3% |
Other values (143) | 446 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 804 | |
Space Separator | 67 | 7.6% |
Other Symbol | 4 | 0.5% |
Close Punctuation | 2 | 0.2% |
Open Punctuation | 2 | 0.2% |
Other Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 81 | 10.1% |
자 | 52 | 6.5% |
차 | 51 | 6.3% |
동 | 48 | 6.0% |
비 | 35 | 4.4% |
정 | 28 | 3.5% |
제 | 27 | 3.4% |
조 | 25 | 3.1% |
수 | 20 | 2.5% |
리 | 20 | 2.5% |
Other values (138) | 417 |
Space Separator
Value | Count | Frequency (%) |
67 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 4 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 808 | |
Common | 72 | 8.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 81 | 10.0% |
자 | 52 | 6.4% |
차 | 51 | 6.3% |
동 | 48 | 5.9% |
비 | 35 | 4.3% |
정 | 28 | 3.5% |
제 | 27 | 3.3% |
조 | 25 | 3.1% |
수 | 20 | 2.5% |
리 | 20 | 2.5% |
Other values (139) | 421 |
Common
Value | Count | Frequency (%) |
67 | ||
) | 2 | 2.8% |
( | 2 | 2.8% |
, | 1 | 1.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 804 | |
ASCII | 72 | 8.2% |
None | 4 | 0.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
업 | 81 | 10.1% |
자 | 52 | 6.5% |
차 | 51 | 6.3% |
동 | 48 | 6.0% |
비 | 35 | 4.4% |
정 | 28 | 3.5% |
제 | 27 | 3.4% |
조 | 25 | 3.1% |
수 | 20 | 2.5% |
리 | 20 | 2.5% |
Other values (138) | 417 |
ASCII
Value | Count | Frequency (%) |
67 | ||
) | 2 | 2.8% |
( | 2 | 2.8% |
, | 1 | 1.4% |
None
Value | Count | Frequency (%) |
㈜ | 4 |
도로명 주소
Text
MISSING
 
Distinct | 107 |
---|---|
Distinct (%) | 93.9% |
Missing | 89 |
Missing (%) | 43.8% |
Memory size | 1.7 KiB |
Length
Max length | 29 |
---|---|
Median length | 27 |
Mean length | 19.368421 |
Min length | 7 |
Characters and Unicode
Total characters | 2208 |
---|---|
Distinct characters | 75 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 101 ? |
---|---|
Unique (%) | 88.6% |
Sample
1st row | 인천광역시 중구 축항대로87번길 30 |
---|---|
2nd row | 인천광역시 중구 축항대로290번길 121 |
3rd row | 인천광역시 중구 서해대로 168 |
4th row | 인천광역시 중구 월미로 116 |
5th row | 인천광역시 중구 아암대로 20 |
Value | Count | Frequency (%) |
중구 | 110 | |
인천광역시 | 106 | |
서해대로 | 21 | 4.7% |
축항대로296번길 | 9 | 2.0% |
월미로 | 9 | 2.0% |
서해대로94번길 | 6 | 1.3% |
축항대로290번길 | 6 | 1.3% |
서해대로180번길 | 5 | 1.1% |
10 | 4 | 0.9% |
서해대로179번길 | 3 | 0.7% |
Other values (137) | 172 |
Most occurring characters
Value | Count | Frequency (%) |
337 | 15.3% | |
중 | 113 | 5.1% |
인 | 110 | 5.0% |
구 | 110 | 5.0% |
로 | 110 | 5.0% |
시 | 110 | 5.0% |
광 | 106 | 4.8% |
천 | 106 | 4.8% |
역 | 106 | 4.8% |
1 | 102 | 4.6% |
Other values (65) | 898 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1373 | |
Decimal Number | 464 | 21.0% |
Space Separator | 337 | 15.3% |
Dash Punctuation | 12 | 0.5% |
Close Punctuation | 10 | 0.5% |
Open Punctuation | 10 | 0.5% |
Other Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
중 | 113 | 8.2% |
인 | 110 | 8.0% |
구 | 110 | 8.0% |
로 | 110 | 8.0% |
시 | 110 | 8.0% |
광 | 106 | 7.7% |
천 | 106 | 7.7% |
역 | 106 | 7.7% |
대 | 79 | 5.8% |
길 | 65 | 4.7% |
Other values (50) | 358 |
Decimal Number
Value | Count | Frequency (%) |
1 | 102 | |
2 | 60 | |
6 | 51 | |
9 | 50 | |
3 | 47 | |
0 | 45 | |
4 | 36 | 7.8% |
8 | 32 | 6.9% |
7 | 21 | 4.5% |
5 | 20 | 4.3% |
Space Separator
Value | Count | Frequency (%) |
337 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 12 |
Close Punctuation
Value | Count | Frequency (%) |
) | 10 |
Open Punctuation
Value | Count | Frequency (%) |
( | 10 |
Other Punctuation
Value | Count | Frequency (%) |
, | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1373 | |
Common | 835 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
중 | 113 | 8.2% |
인 | 110 | 8.0% |
구 | 110 | 8.0% |
로 | 110 | 8.0% |
시 | 110 | 8.0% |
광 | 106 | 7.7% |
천 | 106 | 7.7% |
역 | 106 | 7.7% |
대 | 79 | 5.8% |
길 | 65 | 4.7% |
Other values (50) | 358 |
Common
Value | Count | Frequency (%) |
337 | ||
1 | 102 | 12.2% |
2 | 60 | 7.2% |
6 | 51 | 6.1% |
9 | 50 | 6.0% |
3 | 47 | 5.6% |
0 | 45 | 5.4% |
4 | 36 | 4.3% |
8 | 32 | 3.8% |
7 | 21 | 2.5% |
Other values (5) | 54 | 6.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1373 | |
ASCII | 835 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
337 | ||
1 | 102 | 12.2% |
2 | 60 | 7.2% |
6 | 51 | 6.1% |
9 | 50 | 6.0% |
3 | 47 | 5.6% |
0 | 45 | 5.4% |
4 | 36 | 4.3% |
8 | 32 | 3.8% |
7 | 21 | 2.5% |
Other values (5) | 54 | 6.5% |
Hangul
Value | Count | Frequency (%) |
중 | 113 | 8.2% |
인 | 110 | 8.0% |
구 | 110 | 8.0% |
로 | 110 | 8.0% |
시 | 110 | 8.0% |
광 | 106 | 7.7% |
천 | 106 | 7.7% |
역 | 106 | 7.7% |
대 | 79 | 5.8% |
길 | 65 | 4.7% |
Other values (50) | 358 |
데이터 기준일자
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.7 KiB |
2023-09-11 | |
---|---|
<NA> |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 7.1330049 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-09-11 |
---|---|
2nd row | 2023-09-11 |
3rd row | 2023-09-11 |
4th row | 2023-09-11 |
5th row | 2023-09-11 |
Common Values
Value | Count | Frequency (%) |
2023-09-11 | 106 | |
<NA> | 97 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-09-11 | 106 | |
na | 97 |
연번 | 구분 | |
---|---|---|
연번 | 1.000 | 0.898 |
구분 | 0.898 | 1.000 |
연번 | 데이터 기준일자 | |
---|---|---|
연번 | 1.000 | 1.000 |
데이터 기준일자 | 1.000 | 1.000 |
연번 | 업소명 | 구분 | 도로명 주소 | 데이터 기준일자 | |
---|---|---|---|---|---|
0 | 1 | 씨제이제일제당㈜인천3공장 | 식료품제조 | 인천광역시 중구 축항대로87번길 30 | 2023-09-11 |
1 | 2 | ㈜삼양사 인천2공장 | 식료품제조 | 인천광역시 중구 축항대로290번길 121 | 2023-09-11 |
2 | 3 | 씨제이제일제당㈜인천냉동식품공장 | 식료품제조 | 인천광역시 중구 서해대로 168 | 2023-09-11 |
3 | 4 | 대한제당㈜ | 식료품제조 | 인천광역시 중구 월미로 116 | 2023-09-11 |
4 | 5 | 씨제이제일제당㈜ 인천1공장 | 식료품제조 | 인천광역시 중구 아암대로 20 | 2023-09-11 |
5 | 6 | 씨제이제일제당㈜ 인천2공장 | 식료품제조 | 인천광역시 중구 서해대로140번길 49 | 2023-09-11 |
6 | 7 | 제일사료㈜인천공장 | 사료제조업 | 인천광역시 중구 서해대로209번길 69 | 2023-09-11 |
7 | 8 | 티에스사료㈜ | 사료제조업 | 인천광역시 중구 월미로 181 | 2023-09-11 |
8 | 9 | GS칼텍스㈜인천물류센터 | 저유업 | 인천광역시 중구 월미로 182 | 2023-09-11 |
9 | 10 | 인천기독병원 | 병원 | 인천광역시 중구 답동로30번길 10 | 2023-09-11 |
연번 | 업소명 | 구분 | 도로명 주소 | 데이터 기준일자 | |
---|---|---|---|---|---|
193 | <NA> | <NA> | <NA> | <NA> | <NA> |
194 | <NA> | <NA> | <NA> | <NA> | <NA> |
195 | 196 | 보일러 | 지투호텔 | 서울특별시 중구 수표로 24(저동2가) | <NA> |
196 | 197 | 보일러 | 케이비부동산신탁㈜ | 서울특별시 중구 퇴계로 65(회현동1가) 외 32필지 | <NA> |
197 | 198 | 보일러 | (주)하나은행 | 서울특별시 중구 을지로 35(을지로1가) | <NA> |
198 | 199 | 보일러 | 재단법인 천주교쌘볼수도원유지재단(샽트르 성 바오로 수녀회 서울관구) | 서읕특별시 중구 명동길 74-2(명동2가) | <NA> |
199 | 200 | 보일러 | 더유니스타 주식회사 | 을지로4가 261-4 | <NA> |
200 | 201 | 보일러 | 해성산업㈜ | 남대문로4가 17-19 | <NA> |
201 | 202 | 보일러 | ㈜케이티에스테이트 | 을지로 238 | <NA> |
202 | 203 | 보일러 | 씨제이㈜ | 소월로2길 12 | <NA> |
Most frequently occurring
연번 | 업소명 | 구분 | 도로명 주소 | 데이터 기준일자 | # duplicates | |
---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | 89 |