Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 38 |
Missing cells | 18 |
Missing cells (%) | 7.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.9 KiB |
Average record size in memory | 52.5 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Numeric | 1 |
Dataset
Description | 전라남도 보건연구원홈페이지에 게시된 수질(지하수, 상수도 등) 관련 검사항목 및 수수료에 대한 사항을 정리한 파일입니다. |
---|---|
Author | 전라남도 |
URL | https://www.data.go.kr/data/15041955/fileData.do |
Reproduction
Analysis started | 2023-12-12 01:52:24.676684 |
---|---|
Analysis finished | 2023-12-12 01:52:25.356051 |
Duration | 0.68 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
검체명
Categorical
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 26.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
상수도 | |
---|---|
지하수 | |
먹는샘물 | |
목욕장 | |
온천수 | |
Other values (5) |
Length
Max length | 12 |
---|---|
Median length | 3 |
Mean length | 3.4473684 |
Min length | 3 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 13.2% |
Sample
1st row | 지하수 |
---|---|
2nd row | 지하수 |
3rd row | 지하수 |
4th row | 지하수 |
5th row | 지하수 |
Common Values
Value | Count | Frequency (%) |
상수도 | 16 | |
지하수 | 10 | |
먹는샘물 | 3 | 7.9% |
목욕장 | 2 | 5.3% |
온천수 | 2 | 5.3% |
수영장수 | 1 | 2.6% |
수경시설 용수 | 1 | 2.6% |
물놀이형 유기시설(수) | 1 | 2.6% |
저수조 | 1 | 2.6% |
급수관 | 1 | 2.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
상수도 | 16 | |
지하수 | 10 | |
먹는샘물 | 3 | 7.5% |
목욕장 | 2 | 5.0% |
온천수 | 2 | 5.0% |
수영장수 | 1 | 2.5% |
수경시설 | 1 | 2.5% |
용수 | 1 | 2.5% |
물놀이형 | 1 | 2.5% |
유기시설(수 | 1 | 2.5% |
Other values (2) | 2 | 5.0% |
구분1
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 36.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
지방 상수도 | |
---|---|
소규모급수시설 | |
<NA> | |
학교먹는물 | |
원수 | |
Other values (9) |
Length
Max length | 7 |
---|---|
Median length | 5.5 |
Mean length | 5.0526316 |
Min length | 2 |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 15.8% |
Sample
1st row | 음용수 |
---|---|
2nd row | 음용수 |
3rd row | 생활 용수 |
4th row | 농업 용수 |
5th row | 매립장 검사정 |
Common Values
Value | Count | Frequency (%) |
지방 상수도 | 9 | |
소규모급수시설 | 6 | |
<NA> | 5 | |
학교먹는물 | 3 | 7.9% |
원수 | 3 | 7.9% |
음용수 | 2 | 5.3% |
먹는물공동시설 | 2 | 5.3% |
욕조수 | 2 | 5.3% |
생활 용수 | 1 | 2.6% |
농업 용수 | 1 | 2.6% |
Other values (4) | 4 |
Length
Value | Count | Frequency (%) |
지방 | 9 | |
상수도 | 9 | |
소규모급수시설 | 6 | |
na | 5 | |
학교먹는물 | 3 | 5.9% |
원수 | 3 | 5.9% |
음용수 | 2 | 3.9% |
먹는물공동시설 | 2 | 3.9% |
욕조수 | 2 | 3.9% |
용수 | 2 | 3.9% |
Other values (8) | 8 |
구분2
Categorical
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 23.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
<NA> | |
---|---|
원수(하천수) | |
원수(호소수) | |
정수 | |
지하수 | |
Other values (4) |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 4.7894737 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 5.3% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 19 | |
원수(하천수) | 4 | 10.5% |
원수(호소수) | 4 | 10.5% |
정수 | 3 | 7.9% |
지하수 | 2 | 5.3% |
수도꼭지 | 2 | 5.3% |
원수(지하수) | 2 | 5.3% |
정수기 및 냉온수기 | 1 | 2.6% |
급수 과정별 | 1 | 2.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 19 | |
원수(하천수 | 4 | 9.8% |
원수(호소수 | 4 | 9.8% |
정수 | 3 | 7.3% |
지하수 | 2 | 4.9% |
수도꼭지 | 2 | 4.9% |
원수(지하수 | 2 | 4.9% |
정수기 | 1 | 2.4% |
및 | 1 | 2.4% |
냉온수기 | 1 | 2.4% |
Other values (2) | 2 | 4.9% |
검사항목
Text
Distinct | 23 |
---|---|
Distinct (%) | 60.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
Value | Count | Frequency (%) |
6항목 | 7 | |
15항목 | 3 | 7.9% |
46항목 | 2 | 5.3% |
1항목 | 2 | 5.3% |
31항목 | 2 | 5.3% |
11항목 | 2 | 5.3% |
59항목 | 2 | 5.3% |
4항목 | 2 | 5.3% |
5항목 | 2 | 5.3% |
2항목 | 1 | 2.6% |
Other values (13) | 13 |
Most occurring characters
Value | Count | Frequency (%) |
항 | 38 | |
목 | 38 | |
1 | 15 | 11.1% |
5 | 10 | 7.4% |
6 | 9 | 6.7% |
4 | 6 | 4.4% |
2 | 5 | 3.7% |
3 | 4 | 3.0% |
9 | 4 | 3.0% |
0 | 3 | 2.2% |
Other values (2) | 3 | 2.2% |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 76 | |
Decimal Number | 59 |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 15 | |
5 | 10 | |
6 | 9 | |
4 | 6 | 10.2% |
2 | 5 | 8.5% |
3 | 4 | 6.8% |
9 | 4 | 6.8% |
0 | 3 | 5.1% |
7 | 2 | 3.4% |
8 | 1 | 1.7% |
Other Letter
Value | Count | Frequency (%) |
항 | 38 | |
목 | 38 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 76 | |
Common | 59 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 15 | |
5 | 10 | |
6 | 9 | |
4 | 6 | 10.2% |
2 | 5 | 8.5% |
3 | 4 | 6.8% |
9 | 4 | 6.8% |
0 | 3 | 5.1% |
7 | 2 | 3.4% |
8 | 1 | 1.7% |
Hangul
Value | Count | Frequency (%) |
항 | 38 | |
목 | 38 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 76 | |
ASCII | 59 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
항 | 38 | |
목 | 38 |
ASCII
Value | Count | Frequency (%) |
1 | 15 | |
5 | 10 | |
6 | 9 | |
4 | 6 | 10.2% |
2 | 5 | 8.5% |
3 | 4 | 6.8% |
9 | 4 | 6.8% |
0 | 3 | 5.1% |
7 | 2 | 3.4% |
8 | 1 | 1.7% |
수수료
Real number (ℝ)
Distinct | 33 |
---|---|
Distinct (%) | 86.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 132163.16 |
Minimum | 6200 |
---|---|
Maximum | 360000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 474.0 B |
Quantile statistics
Minimum | 6200 |
---|---|
5-th percentile | 9140 |
Q1 | 30325 |
median | 59500 |
Q3 | 263075 |
95-th percentile | 347535 |
Maximum | 360000 |
Range | 353800 |
Interquartile range (IQR) | 232750 |
Descriptive statistics
Standard deviation | 129174.44 |
---|---|
Coefficient of variation (CV) | 0.97738618 |
Kurtosis | -1.2332428 |
Mean | 132163.16 |
Median Absolute Deviation (MAD) | 50000 |
Skewness | 0.70445359 |
Sum | 5022200 |
Variance | 1.6686037 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
267700 | 2 | 5.3% |
326400 | 2 | 5.3% |
30200 | 2 | 5.3% |
30700 | 2 | 5.3% |
32200 | 2 | 5.3% |
358500 | 1 | 2.6% |
21600 | 1 | 2.6% |
52200 | 1 | 2.6% |
62500 | 1 | 2.6% |
360000 | 1 | 2.6% |
Other values (23) | 23 |
Value | Count | Frequency (%) |
6200 | 1 | |
8800 | 1 | |
9200 | 1 | |
9400 | 1 | |
14900 | 1 | |
16000 | 1 | |
17000 | 1 | |
21600 | 1 | |
30200 | 2 | |
30700 | 2 |
Value | Count | Frequency (%) |
360000 | 1 | |
358500 | 1 | |
345600 | 1 | |
334200 | 1 | |
326400 | 2 | |
323800 | 1 | |
306100 | 1 | |
267700 | 2 | |
249200 | 1 | |
247700 | 1 |
비고
Text
MISSING
 
Distinct | 18 |
---|---|
Distinct (%) | 90.0% |
Missing | 18 |
Missing (%) | 47.4% |
Memory size | 436.0 B |
Length
Max length | 53 |
---|---|
Median length | 23.5 |
Mean length | 21.35 |
Min length | 3 |
Characters and Unicode
Total characters | 427 |
---|---|
Distinct characters | 86 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 85.0% |
Sample
1st row | 비음용 |
---|---|
2nd row | 공업어업용수 동일 |
3rd row | 생활용수20항목+5항목(BOD,COD,아질산성질소,암모니아성질소,전기전도도) |
4th row | 약수터 45항목+여시니아균+우라늄 |
5th row | 일반세균 등 6개 항목 |
Value | Count | Frequency (%) |
탁도 | 5 | 8.8% |
분원성대장균군 | 5 | 8.8% |
ph | 4 | 7.0% |
총대장균군 | 4 | 7.0% |
ph,bod,ss,do,총대장균군 | 3 | 5.3% |
잔류염소 | 2 | 3.5% |
대장균 | 2 | 3.5% |
유리잔류염소 | 2 | 3.5% |
대장균군 | 2 | 3.5% |
과망간산칼륨소비량 | 2 | 3.5% |
Other values (25) | 26 |
Most occurring characters
Value | Count | Frequency (%) |
, | 57 | 13.3% |
37 | 8.7% | |
균 | 23 | 5.4% |
대 | 19 | 4.4% |
장 | 19 | 4.4% |
군 | 17 | 4.0% |
소 | 13 | 3.0% |
도 | 12 | 2.8% |
O | 10 | 2.3% |
D | 10 | 2.3% |
Other values (76) | 210 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 266 | |
Other Punctuation | 57 | 13.3% |
Uppercase Letter | 45 | 10.5% |
Space Separator | 37 | 8.7% |
Lowercase Letter | 9 | 2.1% |
Decimal Number | 7 | 1.6% |
Math Symbol | 4 | 0.9% |
Open Punctuation | 1 | 0.2% |
Close Punctuation | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
균 | 23 | 8.6% |
대 | 19 | 7.1% |
장 | 19 | 7.1% |
군 | 17 | 6.4% |
소 | 13 | 4.9% |
도 | 12 | 4.5% |
총 | 9 | 3.4% |
탁 | 8 | 3.0% |
성 | 7 | 2.6% |
비 | 6 | 2.3% |
Other values (57) | 133 |
Uppercase Letter
Value | Count | Frequency (%) |
O | 10 | |
D | 10 | |
H | 10 | |
S | 8 | |
B | 4 | 8.9% |
C | 2 | 4.4% |
P | 1 | 2.2% |
Decimal Number
Value | Count | Frequency (%) |
5 | 2 | |
2 | 1 | |
0 | 1 | |
6 | 1 | |
4 | 1 | |
3 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 57 |
Space Separator
Value | Count | Frequency (%) |
37 |
Lowercase Letter
Value | Count | Frequency (%) |
p | 9 |
Math Symbol
Value | Count | Frequency (%) |
+ | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 266 | |
Common | 107 | |
Latin | 54 | 12.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
균 | 23 | 8.6% |
대 | 19 | 7.1% |
장 | 19 | 7.1% |
군 | 17 | 6.4% |
소 | 13 | 4.9% |
도 | 12 | 4.5% |
총 | 9 | 3.4% |
탁 | 8 | 3.0% |
성 | 7 | 2.6% |
비 | 6 | 2.3% |
Other values (57) | 133 |
Common
Value | Count | Frequency (%) |
, | 57 | |
37 | ||
+ | 4 | 3.7% |
5 | 2 | 1.9% |
2 | 1 | 0.9% |
0 | 1 | 0.9% |
( | 1 | 0.9% |
6 | 1 | 0.9% |
) | 1 | 0.9% |
4 | 1 | 0.9% |
Latin
Value | Count | Frequency (%) |
O | 10 | |
D | 10 | |
H | 10 | |
p | 9 | |
S | 8 | |
B | 4 | 7.4% |
C | 2 | 3.7% |
P | 1 | 1.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 266 | |
ASCII | 161 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
, | 57 | |
37 | ||
O | 10 | 6.2% |
D | 10 | 6.2% |
H | 10 | 6.2% |
p | 9 | 5.6% |
S | 8 | 5.0% |
+ | 4 | 2.5% |
B | 4 | 2.5% |
5 | 2 | 1.2% |
Other values (9) | 10 | 6.2% |
Hangul
Value | Count | Frequency (%) |
균 | 23 | 8.6% |
대 | 19 | 7.1% |
장 | 19 | 7.1% |
군 | 17 | 6.4% |
소 | 13 | 4.9% |
도 | 12 | 4.5% |
총 | 9 | 3.4% |
탁 | 8 | 3.0% |
성 | 7 | 2.6% |
비 | 6 | 2.3% |
Other values (57) | 133 |
검체명 | 구분1 | 구분2 | 검사항목 | 수수료 | 비고 | |
---|---|---|---|---|---|---|
검체명 | 1.000 | 0.849 | 1.000 | 0.883 | 0.000 | 1.000 |
구분1 | 0.849 | 1.000 | 0.762 | 0.912 | 0.787 | 0.946 |
구분2 | 1.000 | 0.762 | 1.000 | 0.814 | 0.146 | 0.964 |
검사항목 | 0.883 | 0.912 | 0.814 | 1.000 | 0.957 | 1.000 |
수수료 | 0.000 | 0.787 | 0.146 | 0.957 | 1.000 | 1.000 |
비고 | 1.000 | 0.946 | 0.964 | 1.000 | 1.000 | 1.000 |
구분2 | 구분1 | 검체명 | |
---|---|---|---|
구분2 | 1.000 | 0.339 | 0.804 |
구분1 | 0.339 | 1.000 | 0.563 |
검체명 | 0.804 | 0.563 | 1.000 |
수수료 | 검체명 | 구분1 | 구분2 | |
---|---|---|---|---|
수수료 | 1.000 | 0.000 | 0.455 | 0.000 |
검체명 | 0.000 | 1.000 | 0.563 | 0.804 |
구분1 | 0.455 | 0.563 | 1.000 | 0.339 |
구분2 | 0.000 | 0.804 | 0.339 | 1.000 |
검체명 | 구분1 | 구분2 | 검사항목 | 수수료 | 비고 | |
---|---|---|---|---|---|---|
0 | 지하수 | 음용수 | <NA> | 46항목 | 267700 | <NA> |
1 | 지하수 | 음용수 | <NA> | 12항목 | 52800 | <NA> |
2 | 지하수 | 생활 용수 | <NA> | 20항목 | 137800 | 비음용 |
3 | 지하수 | 농업 용수 | <NA> | 15항목 | 109400 | 공업어업용수 동일 |
4 | 지하수 | 매립장 검사정 | <NA> | 25항목 | 167500 | 생활용수20항목+5항목(BOD,COD,아질산성질소,암모니아성질소,전기전도도) |
5 | 지하수 | 먹는물공동시설 | <NA> | 47항목 | 306100 | 약수터 45항목+여시니아균+우라늄 |
6 | 지하수 | 먹는물공동시설 | <NA> | 6항목 | 30200 | 일반세균 등 6개 항목 |
7 | 지하수 | 학교먹는물 | 정수기 및 냉온수기 | 2항목 | 9200 | 탁도, 총대장균군 |
8 | 지하수 | 학교먹는물 | 지하수 | 6항목 | 30200 | <NA> |
9 | 지하수 | 학교먹는물 | 지하수 | 46항목 | 267700 | <NA> |
검체명 | 구분1 | 구분2 | 검사항목 | 수수료 | 비고 | |
---|---|---|---|---|---|---|
28 | 상수도 | 지방 상수도 | 원수(하천수) | 31항목 | 358500 | <NA> |
29 | 상수도 | 지방 상수도 | 원수(호소수) | 31항목 | 360000 | <NA> |
30 | 상수도 | 지방 상수도 | 원수(지하수) | 19항목 | 136500 | <NA> |
31 | 상수도 | 소규모급 시설 | 정수 | 13항목 | 56500 | <NA> |
32 | 상수도 | 소규모급수시설 | 정수 | 59항목 | 326400 | <NA> |
33 | 상수도 | 소규모급수시설 | 원수(하천수) | 6항목 | 30700 | pH,BOD,SS,DO,총대장균군, 분원성대장균군 |
34 | 상수도 | 소규모급수시설 | 원수(호소수) | 6항목 | 32200 | pH,COD,SS,DO,총대장균군, 분원성대장균군 |
35 | 상수도 | 소규모급수시설 | 원수(하천수) | 15항목 | 247700 | <NA> |
36 | 상수도 | 소규모급수시설 | 원수(호소수) | 15항목 | 249200 | <NA> |
37 | 상수도 | 소규모급수시설 | 원수(지하수) | 11항목 | 75800 | <NA> |