Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 32 |
Missing cells | 54 |
Missing cells (%) | 21.1% |
Duplicate rows | 1 |
Duplicate rows (%) | 3.1% |
Total size in memory | 2.3 KiB |
Average record size in memory | 72.1 B |
Variable types
Text | 2 |
---|---|
Categorical | 6 |
Dataset
Description | 공단에서 운영하는 시설물 중 매년 정기 검사를 통해 측정하는 실내공기질 관리 결과 미세먼지, 일산화탄소, 이산화탄소 등 항목을 제공합니다. |
---|---|
Author | 인천광역시계양구시설관리공단 |
URL | https://www.data.go.kr/data/15042967/fileData.do |
Dataset has 1 (3.1%) duplicate rows | Duplicates |
포름알데히드(㎍/㎥) is highly overall correlated with 미세먼지(㎍/㎥) and 4 other fields | High correlation |
미세먼지(㎍/㎥) is highly overall correlated with 이산화탄소(PPM) and 4 other fields | High correlation |
이산화탄소(PPM) is highly overall correlated with 미세먼지(㎍/㎥) and 4 other fields | High correlation |
데이터기준일자 is highly overall correlated with 미세먼지(㎍/㎥) and 4 other fields | High correlation |
측정결과 is highly overall correlated with 미세먼지(㎍/㎥) and 4 other fields | High correlation |
일산화탄소(PPM) is highly overall correlated with 미세먼지(㎍/㎥) and 4 other fields | High correlation |
미세먼지(㎍/㎥) is highly imbalanced (61.8%) | Imbalance |
이산화탄소(PPM) is highly imbalanced (61.8%) | Imbalance |
포름알데히드(㎍/㎥) is highly imbalanced (61.8%) | Imbalance |
일산화탄소(PPM) is highly imbalanced (61.8%) | Imbalance |
시설명 has 27 (84.4%) missing values | Missing |
도로명주소 has 27 (84.4%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 16:11:41.070967 |
---|---|
Analysis finished | 2023-12-12 16:11:42.165901 |
Duration | 1.09 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시설명
Text
MISSING
 
Distinct | 5 |
---|---|
Distinct (%) | 100.0% |
Missing | 27 |
Missing (%) | 84.4% |
Memory size | 388.0 B |
Length
Max length | 15 |
---|---|
Median length | 11 |
Mean length | 11.4 |
Min length | 8 |
Characters and Unicode
Total characters | 57 |
---|---|
Distinct characters | 25 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 계양구청사 사무실 |
---|---|
2nd row | 계양구청사 주차장(아-5) |
3rd row | 계양구청사 주차장(사-11) |
4th row | 계산체육공원지하주차장 |
5th row | 계양산공영주차장 |
Value | Count | Frequency (%) |
계양구청사 | 3 | |
사무실 | 1 | 12.5% |
주차장(아-5 | 1 | 12.5% |
주차장(사-11 | 1 | 12.5% |
계산체육공원지하주차장 | 1 | 12.5% |
계양산공영주차장 | 1 | 12.5% |
Most occurring characters
Value | Count | Frequency (%) |
계 | 5 | 8.8% |
사 | 5 | 8.8% |
주 | 4 | 7.0% |
양 | 4 | 7.0% |
장 | 4 | 7.0% |
차 | 4 | 7.0% |
3 | 5.3% | |
청 | 3 | 5.3% |
구 | 3 | 5.3% |
( | 2 | 3.5% |
Other values (15) | 20 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 45 | |
Space Separator | 3 | 5.3% |
Decimal Number | 3 | 5.3% |
Open Punctuation | 2 | 3.5% |
Dash Punctuation | 2 | 3.5% |
Close Punctuation | 2 | 3.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
계 | 5 | |
사 | 5 | |
주 | 4 | |
양 | 4 | |
장 | 4 | |
차 | 4 | |
청 | 3 | 6.7% |
구 | 3 | 6.7% |
산 | 2 | 4.4% |
공 | 2 | 4.4% |
Other values (9) | 9 |
Decimal Number
Value | Count | Frequency (%) |
1 | 2 | |
5 | 1 |
Space Separator
Value | Count | Frequency (%) |
3 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 45 | |
Common | 12 | 21.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
계 | 5 | |
사 | 5 | |
주 | 4 | |
양 | 4 | |
장 | 4 | |
차 | 4 | |
청 | 3 | 6.7% |
구 | 3 | 6.7% |
산 | 2 | 4.4% |
공 | 2 | 4.4% |
Other values (9) | 9 |
Common
Value | Count | Frequency (%) |
3 | ||
( | 2 | |
- | 2 | |
) | 2 | |
1 | 2 | |
5 | 1 | 8.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 45 | |
ASCII | 12 | 21.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
계 | 5 | |
사 | 5 | |
주 | 4 | |
양 | 4 | |
장 | 4 | |
차 | 4 | |
청 | 3 | 6.7% |
구 | 3 | 6.7% |
산 | 2 | 4.4% |
공 | 2 | 4.4% |
Other values (9) | 9 |
ASCII
Value | Count | Frequency (%) |
3 | ||
( | 2 | |
- | 2 | |
) | 2 | |
1 | 2 | |
5 | 1 | 8.3% |
도로명주소
Text
MISSING
 
Distinct | 3 |
---|---|
Distinct (%) | 60.0% |
Missing | 27 |
Missing (%) | 84.4% |
Memory size | 388.0 B |
Length
Max length | 20 |
---|---|
Median length | 15 |
Mean length | 16.2 |
Min length | 15 |
Characters and Unicode
Total characters | 81 |
---|---|
Distinct characters | 22 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 40.0% |
Sample
1st row | 인천시 계양구 계산새로 88 |
---|---|
2nd row | 인천시 계양구 계산새로 88 |
3rd row | 인천시 계양구 계산새로 88 |
4th row | 인천시 계양구 주부토로 570 |
5th row | 인천시 계양구 계양산로 102번길 4 |
Value | Count | Frequency (%) |
인천시 | 5 | |
계양구 | 5 | |
계산새로 | 3 | |
88 | 3 | |
주부토로 | 1 | 4.8% |
570 | 1 | 4.8% |
계양산로 | 1 | 4.8% |
102번길 | 1 | 4.8% |
4 | 1 | 4.8% |
Most occurring characters
Value | Count | Frequency (%) |
16 | ||
계 | 9 | |
양 | 6 | 7.4% |
8 | 6 | 7.4% |
인 | 5 | 6.2% |
시 | 5 | 6.2% |
구 | 5 | 6.2% |
로 | 5 | 6.2% |
천 | 5 | 6.2% |
산 | 4 | 4.9% |
Other values (12) | 15 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 52 | |
Space Separator | 16 | 19.8% |
Decimal Number | 13 | 16.0% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
계 | 9 | |
양 | 6 | |
인 | 5 | |
시 | 5 | |
구 | 5 | |
로 | 5 | |
천 | 5 | |
산 | 4 | |
새 | 3 | 5.8% |
길 | 1 | 1.9% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
8 | 6 | |
0 | 2 | 15.4% |
2 | 1 | 7.7% |
1 | 1 | 7.7% |
7 | 1 | 7.7% |
5 | 1 | 7.7% |
4 | 1 | 7.7% |
Space Separator
Value | Count | Frequency (%) |
16 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 52 | |
Common | 29 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
계 | 9 | |
양 | 6 | |
인 | 5 | |
시 | 5 | |
구 | 5 | |
로 | 5 | |
천 | 5 | |
산 | 4 | |
새 | 3 | 5.8% |
길 | 1 | 1.9% |
Other values (4) | 4 |
Common
Value | Count | Frequency (%) |
16 | ||
8 | 6 | 20.7% |
0 | 2 | 6.9% |
2 | 1 | 3.4% |
1 | 1 | 3.4% |
7 | 1 | 3.4% |
5 | 1 | 3.4% |
4 | 1 | 3.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 52 | |
ASCII | 29 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
16 | ||
8 | 6 | 20.7% |
0 | 2 | 6.9% |
2 | 1 | 3.4% |
1 | 1 | 3.4% |
7 | 1 | 3.4% |
5 | 1 | 3.4% |
4 | 1 | 3.4% |
Hangul
Value | Count | Frequency (%) |
계 | 9 | |
양 | 6 | |
인 | 5 | |
시 | 5 | |
구 | 5 | |
로 | 5 | |
천 | 5 | |
산 | 4 | |
새 | 3 | 5.8% |
길 | 1 | 1.9% |
Other values (4) | 4 |
미세먼지(㎍/㎥)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 18.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 388.0 B |
<NA> | |
---|---|
10.9 | 1 |
23.1 | 1 |
28.7 | 1 |
40.35 | 1 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.03125 |
Min length | 4 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 15.6% |
Sample
1st row | 10.9 |
---|---|
2nd row | 23.1 |
3rd row | 28.7 |
4th row | 40.35 |
5th row | 54.0 |
Common Values
Value | Count | Frequency (%) |
<NA> | 27 | |
10.9 | 1 | 3.1% |
23.1 | 1 | 3.1% |
28.7 | 1 | 3.1% |
40.35 | 1 | 3.1% |
54.0 | 1 | 3.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 27 | |
10.9 | 1 | 3.1% |
23.1 | 1 | 3.1% |
28.7 | 1 | 3.1% |
40.35 | 1 | 3.1% |
54.0 | 1 | 3.1% |
이산화탄소(PPM)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 18.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 388.0 B |
<NA> | |
---|---|
708.0 | 1 |
513.0 | 1 |
474.0 | 1 |
525.0 | 1 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.15625 |
Min length | 4 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 15.6% |
Sample
1st row | 708.0 |
---|---|
2nd row | 513.0 |
3rd row | 474.0 |
4th row | 525.0 |
5th row | 414.5 |
Common Values
Value | Count | Frequency (%) |
<NA> | 27 | |
708.0 | 1 | 3.1% |
513.0 | 1 | 3.1% |
474.0 | 1 | 3.1% |
525.0 | 1 | 3.1% |
414.5 | 1 | 3.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 27 | |
708.0 | 1 | 3.1% |
513.0 | 1 | 3.1% |
474.0 | 1 | 3.1% |
525.0 | 1 | 3.1% |
414.5 | 1 | 3.1% |
포름알데히드(㎍/㎥)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 18.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 388.0 B |
<NA> | |
---|---|
7.0 | 1 |
9.1 | 1 |
8.1 | 1 |
9.85 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.875 |
Min length | 3 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 15.6% |
Sample
1st row | 7.0 |
---|---|
2nd row | 9.1 |
3rd row | 8.1 |
4th row | 9.85 |
5th row | 5.6 |
Common Values
Value | Count | Frequency (%) |
<NA> | 27 | |
7.0 | 1 | 3.1% |
9.1 | 1 | 3.1% |
8.1 | 1 | 3.1% |
9.85 | 1 | 3.1% |
5.6 | 1 | 3.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 27 | |
7.0 | 1 | 3.1% |
9.1 | 1 | 3.1% |
8.1 | 1 | 3.1% |
9.85 | 1 | 3.1% |
5.6 | 1 | 3.1% |
일산화탄소(PPM)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 18.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 388.0 B |
<NA> | |
---|---|
0.4 | 1 |
1.5 | 1 |
1.0 | 1 |
2.3 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.875 |
Min length | 3 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 15.6% |
Sample
1st row | 0.4 |
---|---|
2nd row | 1.5 |
3rd row | 1.0 |
4th row | 2.3 |
5th row | 1.55 |
Common Values
Value | Count | Frequency (%) |
<NA> | 27 | |
0.4 | 1 | 3.1% |
1.5 | 1 | 3.1% |
1.0 | 1 | 3.1% |
2.3 | 1 | 3.1% |
1.55 | 1 | 3.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 27 | |
0.4 | 1 | 3.1% |
1.5 | 1 | 3.1% |
1.0 | 1 | 3.1% |
2.3 | 1 | 3.1% |
1.55 | 1 | 3.1% |
측정결과
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 6.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 388.0 B |
<NA> | |
---|---|
적합 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.6875 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 적합 |
---|---|
2nd row | 적합 |
3rd row | 적합 |
4th row | 적합 |
5th row | 적합 |
Common Values
Value | Count | Frequency (%) |
<NA> | 27 | |
적합 | 5 | 15.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 27 | |
적합 | 5 | 15.6% |
데이터기준일자
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 6.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 388.0 B |
<NA> | |
---|---|
2021-03-01 |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 4.9375 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2021-03-01 |
---|---|
2nd row | 2021-03-01 |
3rd row | 2021-03-01 |
4th row | 2021-03-01 |
5th row | 2021-03-01 |
Common Values
Value | Count | Frequency (%) |
<NA> | 27 | |
2021-03-01 | 5 | 15.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 27 | |
2021-03-01 | 5 | 15.6% |
시설명 | 도로명주소 | 미세먼지(㎍/㎥) | 이산화탄소(PPM) | 포름알데히드(㎍/㎥) | 일산화탄소(PPM) | |
---|---|---|---|---|---|---|
시설명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
도로명주소 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
미세먼지(㎍/㎥) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
이산화탄소(PPM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
포름알데히드(㎍/㎥) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
일산화탄소(PPM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
포름알데히드(㎍/㎥) | 미세먼지(㎍/㎥) | 이산화탄소(PPM) | 데이터기준일자 | 측정결과 | 일산화탄소(PPM) | |
---|---|---|---|---|---|---|
포름알데히드(㎍/㎥) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
미세먼지(㎍/㎥) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
이산화탄소(PPM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
측정결과 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
일산화탄소(PPM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
미세먼지(㎍/㎥) | 이산화탄소(PPM) | 포름알데히드(㎍/㎥) | 일산화탄소(PPM) | 측정결과 | 데이터기준일자 | |
---|---|---|---|---|---|---|
미세먼지(㎍/㎥) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
이산화탄소(PPM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
포름알데히드(㎍/㎥) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
일산화탄소(PPM) | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
측정결과 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
데이터기준일자 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시설명 | 도로명주소 | 미세먼지(㎍/㎥) | 이산화탄소(PPM) | 포름알데히드(㎍/㎥) | 일산화탄소(PPM) | 측정결과 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|
0 | 계양구청사 사무실 | 인천시 계양구 계산새로 88 | 10.9 | 708.0 | 7.0 | 0.4 | 적합 | 2021-03-01 |
1 | 계양구청사 주차장(아-5) | 인천시 계양구 계산새로 88 | 23.1 | 513.0 | 9.1 | 1.5 | 적합 | 2021-03-01 |
2 | 계양구청사 주차장(사-11) | 인천시 계양구 계산새로 88 | 28.7 | 474.0 | 8.1 | 1.0 | 적합 | 2021-03-01 |
3 | 계산체육공원지하주차장 | 인천시 계양구 주부토로 570 | 40.35 | 525.0 | 9.85 | 2.3 | 적합 | 2021-03-01 |
4 | 계양산공영주차장 | 인천시 계양구 계양산로 102번길 4 | 54.0 | 414.5 | 5.6 | 1.55 | 적합 | 2021-03-01 |
5 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
6 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
7 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
8 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
9 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
시설명 | 도로명주소 | 미세먼지(㎍/㎥) | 이산화탄소(PPM) | 포름알데히드(㎍/㎥) | 일산화탄소(PPM) | 측정결과 | 데이터기준일자 | |
---|---|---|---|---|---|---|---|---|
22 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
23 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
24 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
25 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
26 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
27 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
28 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
29 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
30 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
31 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
시설명 | 도로명주소 | 미세먼지(㎍/㎥) | 이산화탄소(PPM) | 포름알데히드(㎍/㎥) | 일산화탄소(PPM) | 측정결과 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 27 |