Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 24 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.6 KiB |
Average record size in memory | 69.5 B |
Variable types
Categorical | 6 |
---|---|
Text | 2 |
Dataset
Description | 광주환경공단 평동폐수처리장의 폐수처리수질 현황에 대한 데이터로 측정항목, 측정지점에 따른 월별 측정항목별 측정 수치를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15104635/fileData.do |
처리장명 has constant value "" | Constant |
측정지점 is highly overall correlated with 시료채취일1(2022-09-22) and 3 other fields | High correlation |
시료채취일3(2023-03-28) is highly overall correlated with 측정지점 and 3 other fields | High correlation |
시료채취일4(2023-05-19) is highly overall correlated with 측정지점 and 3 other fields | High correlation |
시료채취일2(2022-12-08) is highly overall correlated with 측정지점 and 3 other fields | High correlation |
시료채취일1(2022-09-22) is highly overall correlated with 측정지점 and 3 other fields | High correlation |
측정지점 is highly imbalanced (75.0%) | Imbalance |
시료채취일1(2022-09-22) is highly imbalanced (68.6%) | Imbalance |
시료채취일2(2022-12-08) is highly imbalanced (55.0%) | Imbalance |
시료채취일3(2023-03-28) is highly imbalanced (68.6%) | Imbalance |
시료채취일4(2023-05-19) is highly imbalanced (62.9%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 11:27:59.228618 |
---|---|
Analysis finished | 2023-12-12 11:28:00.144632 |
Duration | 0.92 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
처리장명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 4.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
평동폐수처리장 |
---|
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 평동폐수처리장 |
---|---|
2nd row | 평동폐수처리장 |
3rd row | 평동폐수처리장 |
4th row | 평동폐수처리장 |
5th row | 평동폐수처리장 |
Common Values
Value | Count | Frequency (%) |
평동폐수처리장 | 24 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
평동폐수처리장 | 24 |
측정항목
Text
Distinct | 23 |
---|---|
Distinct (%) | 95.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
Value | Count | Frequency (%) |
복합악취 | 2 | 8.3% |
스타이렌 | 1 | 4.2% |
i-발레르산 | 1 | 4.2% |
n-뷰틸산 | 1 | 4.2% |
프로피온산 | 1 | 4.2% |
i-뷰틸알코올 | 1 | 4.2% |
뷰틸아세테이트 | 1 | 4.2% |
메틸아이소뷰틸케톤 | 1 | 4.2% |
메틸에틸케톤 | 1 | 4.2% |
자일렌 | 1 | 4.2% |
Other values (13) | 13 |
Most occurring characters
Value | Count | Frequency (%) |
이 | 14 | 9.2% |
틸 | 12 | 7.9% |
드 | 7 | 4.6% |
메 | 7 | 4.6% |
- | 6 | 3.9% |
알 | 6 | 3.9% |
데 | 5 | 3.3% |
뷰 | 5 | 3.3% |
하 | 5 | 3.3% |
아 | 5 | 3.3% |
Other values (44) | 80 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 140 | |
Dash Punctuation | 6 | 3.9% |
Lowercase Letter | 6 | 3.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 14 | 10.0% |
틸 | 12 | 8.6% |
드 | 7 | 5.0% |
메 | 7 | 5.0% |
알 | 6 | 4.3% |
데 | 5 | 3.6% |
뷰 | 5 | 3.6% |
하 | 5 | 3.6% |
아 | 5 | 3.6% |
르 | 5 | 3.6% |
Other values (41) | 69 |
Lowercase Letter
Value | Count | Frequency (%) |
i | 3 | |
n | 3 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 140 | |
Common | 6 | 3.9% |
Latin | 6 | 3.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 14 | 10.0% |
틸 | 12 | 8.6% |
드 | 7 | 5.0% |
메 | 7 | 5.0% |
알 | 6 | 4.3% |
데 | 5 | 3.6% |
뷰 | 5 | 3.6% |
하 | 5 | 3.6% |
아 | 5 | 3.6% |
르 | 5 | 3.6% |
Other values (41) | 69 |
Latin
Value | Count | Frequency (%) |
i | 3 | |
n | 3 |
Common
Value | Count | Frequency (%) |
- | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 140 | |
ASCII | 12 | 7.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
이 | 14 | 10.0% |
틸 | 12 | 8.6% |
드 | 7 | 5.0% |
메 | 7 | 5.0% |
알 | 6 | 4.3% |
데 | 5 | 3.6% |
뷰 | 5 | 3.6% |
하 | 5 | 3.6% |
아 | 5 | 3.6% |
르 | 5 | 3.6% |
Other values (41) | 69 |
ASCII
Value | Count | Frequency (%) |
- | 6 | |
i | 3 | |
n | 3 |
측정지점
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 8.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
부지경계 | |
---|---|
약액세정탑 | 1 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 4.0416667 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 4.2% |
Sample
1st row | 부지경계 |
---|---|
2nd row | 약액세정탑 |
3rd row | 부지경계 |
4th row | 부지경계 |
5th row | 부지경계 |
Common Values
Value | Count | Frequency (%) |
부지경계 | 23 | |
약액세정탑 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부지경계 | 23 | |
약액세정탑 | 1 | 4.2% |
악취기준
Text
Distinct | 18 |
---|---|
Distinct (%) | 75.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
Value | Count | Frequency (%) |
1이하 | 4 | |
0.05이하 | 2 | 8.3% |
0.01이하 | 2 | 8.3% |
0.009이하 | 2 | 8.3% |
10이하 | 1 | 4.2% |
15이하 | 1 | 4.2% |
0.4이하 | 1 | 4.2% |
0.001이하 | 1 | 4.2% |
0.03이하 | 1 | 4.2% |
0.9이하 | 1 | 4.2% |
Other values (8) | 8 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 41 | |
이 | 24 | |
하 | 24 | |
. | 16 | 12.1% |
1 | 10 | 7.6% |
9 | 5 | 3.8% |
5 | 5 | 3.8% |
2 | 3 | 2.3% |
3 | 3 | 2.3% |
4 | 1 | 0.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 68 | |
Other Letter | 48 | |
Other Punctuation | 16 | 12.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 41 | |
1 | 10 | 14.7% |
9 | 5 | 7.4% |
5 | 5 | 7.4% |
2 | 3 | 4.4% |
3 | 3 | 4.4% |
4 | 1 | 1.5% |
Other Letter
Value | Count | Frequency (%) |
이 | 24 | |
하 | 24 |
Other Punctuation
Value | Count | Frequency (%) |
. | 16 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 84 | |
Hangul | 48 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 41 | |
. | 16 | 19.0% |
1 | 10 | 11.9% |
9 | 5 | 6.0% |
5 | 5 | 6.0% |
2 | 3 | 3.6% |
3 | 3 | 3.6% |
4 | 1 | 1.2% |
Hangul
Value | Count | Frequency (%) |
이 | 24 | |
하 | 24 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 84 | |
Hangul | 48 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 41 | |
. | 16 | 19.0% |
1 | 10 | 11.9% |
9 | 5 | 6.0% |
5 | 5 | 6.0% |
2 | 3 | 3.6% |
3 | 3 | 3.6% |
4 | 1 | 1.2% |
Hangul
Value | Count | Frequency (%) |
이 | 24 | |
하 | 24 |
시료채취일1(2022-09-22)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 12.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
해당없음 | |
---|---|
3 | 1 |
300 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8333333 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 8.3% |
Sample
1st row | 3 |
---|---|
2nd row | 300 |
3rd row | 해당없음 |
4th row | 해당없음 |
5th row | 해당없음 |
Common Values
Value | Count | Frequency (%) |
해당없음 | 22 | |
3 | 1 | 4.2% |
300 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
해당없음 | 22 | |
3 | 1 | 4.2% |
300 | 1 | 4.2% |
시료채취일2(2022-12-08)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 16.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
불검출 | |
---|---|
0 | 2 |
3 | 1 |
448 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.75 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 8.3% |
Sample
1st row | 3 |
---|---|
2nd row | 448 |
3rd row | 0 |
4th row | 0 |
5th row | 불검출 |
Common Values
Value | Count | Frequency (%) |
불검출 | 20 | |
0 | 2 | 8.3% |
3 | 1 | 4.2% |
448 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
불검출 | 20 | |
0 | 2 | 8.3% |
3 | 1 | 4.2% |
448 | 1 | 4.2% |
시료채취일3(2023-03-28)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 12.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
해당없음 | |
---|---|
3 | 1 |
173 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8333333 |
Min length | 1 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 8.3% |
Sample
1st row | 3 |
---|---|
2nd row | 173 |
3rd row | 해당없음 |
4th row | 해당없음 |
5th row | 해당없음 |
Common Values
Value | Count | Frequency (%) |
해당없음 | 22 | |
3 | 1 | 4.2% |
173 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
해당없음 | 22 | |
3 | 1 | 4.2% |
173 | 1 | 4.2% |
시료채취일4(2023-05-19)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 16.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
불검출 | |
---|---|
3 | 1 |
373 | 1 |
0.1 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.9166667 |
Min length | 1 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 12.5% |
Sample
1st row | 3 |
---|---|
2nd row | 373 |
3rd row | 0.1 |
4th row | 불검출 |
5th row | 불검출 |
Common Values
Value | Count | Frequency (%) |
불검출 | 21 | |
3 | 1 | 4.2% |
373 | 1 | 4.2% |
0.1 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
불검출 | 21 | |
3 | 1 | 4.2% |
373 | 1 | 4.2% |
0.1 | 1 | 4.2% |
측정항목 | 측정지점 | 악취기준 | 시료채취일1(2022-09-22) | 시료채취일2(2022-12-08) | 시료채취일3(2023-03-28) | 시료채취일4(2023-05-19) | |
---|---|---|---|---|---|---|---|
측정항목 | 1.000 | 0.000 | 0.909 | 0.000 | 0.000 | 0.000 | 0.000 |
측정지점 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
악취기준 | 0.909 | 1.000 | 1.000 | 1.000 | 0.893 | 1.000 | 0.533 |
시료채취일1(2022-09-22) | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시료채취일2(2022-12-08) | 0.000 | 1.000 | 0.893 | 1.000 | 1.000 | 1.000 | 0.994 |
시료채취일3(2023-03-28) | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시료채취일4(2023-05-19) | 0.000 | 1.000 | 0.533 | 1.000 | 0.994 | 1.000 | 1.000 |
측정지점 | 시료채취일3(2023-03-28) | 시료채취일4(2023-05-19) | 시료채취일2(2022-12-08) | 시료채취일1(2022-09-22) | |
---|---|---|---|---|---|
측정지점 | 1.000 | 0.977 | 0.953 | 0.953 | 0.977 |
시료채취일3(2023-03-28) | 0.977 | 1.000 | 0.976 | 0.976 | 1.000 |
시료채취일4(2023-05-19) | 0.953 | 0.976 | 1.000 | 0.894 | 0.976 |
시료채취일2(2022-12-08) | 0.953 | 0.976 | 0.894 | 1.000 | 0.976 |
시료채취일1(2022-09-22) | 0.977 | 1.000 | 0.976 | 0.976 | 1.000 |
측정지점 | 시료채취일1(2022-09-22) | 시료채취일2(2022-12-08) | 시료채취일3(2023-03-28) | 시료채취일4(2023-05-19) | |
---|---|---|---|---|---|
측정지점 | 1.000 | 0.977 | 0.953 | 0.977 | 0.953 |
시료채취일1(2022-09-22) | 0.977 | 1.000 | 0.976 | 1.000 | 0.976 |
시료채취일2(2022-12-08) | 0.953 | 0.976 | 1.000 | 0.976 | 0.894 |
시료채취일3(2023-03-28) | 0.977 | 1.000 | 0.976 | 1.000 | 0.976 |
시료채취일4(2023-05-19) | 0.953 | 0.976 | 0.894 | 0.976 | 1.000 |
처리장명 | 측정항목 | 측정지점 | 악취기준 | 시료채취일1(2022-09-22) | 시료채취일2(2022-12-08) | 시료채취일3(2023-03-28) | 시료채취일4(2023-05-19) | |
---|---|---|---|---|---|---|---|---|
0 | 평동폐수처리장 | 복합악취 | 부지경계 | 15이하 | 3 | 3 | 3 | 3 |
1 | 평동폐수처리장 | 복합악취 | 약액세정탑 | 500이하 | 300 | 448 | 173 | 373 |
2 | 평동폐수처리장 | 암모니아 | 부지경계 | 1이하 | 해당없음 | 0 | 해당없음 | 0.1 |
3 | 평동폐수처리장 | 황화수소 | 부지경계 | 0.02이하 | 해당없음 | 0 | 해당없음 | 불검출 |
4 | 평동폐수처리장 | 메틸메르캅탄 | 부지경계 | 0.002이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
5 | 평동폐수처리장 | 다이메틸설파이드 | 부지경계 | 0.01이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
6 | 평동폐수처리장 | 다이메틸다이설파이드 | 부지경계 | 0.009이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
7 | 평동폐수처리장 | 트라이메틸아민 | 부지경계 | 0.005이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
8 | 평동폐수처리장 | 아세트알데하이드 | 부지경계 | 0.05이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
9 | 평동폐수처리장 | 프로피온알데하이드 | 부지경계 | 0.05이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
처리장명 | 측정항목 | 측정지점 | 악취기준 | 시료채취일1(2022-09-22) | 시료채취일2(2022-12-08) | 시료채취일3(2023-03-28) | 시료채취일4(2023-05-19) | |
---|---|---|---|---|---|---|---|---|
14 | 평동폐수처리장 | 톨루엔 | 부지경계 | 10이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
15 | 평동폐수처리장 | 자일렌 | 부지경계 | 1이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
16 | 평동폐수처리장 | 메틸에틸케톤 | 부지경계 | 13이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
17 | 평동폐수처리장 | 메틸아이소뷰틸케톤 | 부지경계 | 1이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
18 | 평동폐수처리장 | 뷰틸아세테이트 | 부지경계 | 1이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
19 | 평동폐수처리장 | i-뷰틸알코올 | 부지경계 | 0.9이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
20 | 평동폐수처리장 | 프로피온산 | 부지경계 | 0.03이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
21 | 평동폐수처리장 | n-뷰틸산 | 부지경계 | 0.001이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
22 | 평동폐수처리장 | i-발레르산 | 부지경계 | 0.01이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |
23 | 평동폐수처리장 | n-발레르산 | 부지경계 | 0.0009이하 | 해당없음 | 불검출 | 해당없음 | 불검출 |