Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 57 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 2.4 KiB |
Average record size in memory | 43.3 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 부산광역시 남구 지하수수질검사결과(검사일자, 검사종류, 검사결과, 검사기관명, 지하수관정위치 등) 파일 제공 |
---|---|
URL | https://www.data.go.kr/data/15022534/fileData.do |
검사결과 is highly imbalanced (70.3%) | Imbalance |
Reproduction
Analysis started | 2023-12-11 23:06:51.472913 |
---|---|
Analysis finished | 2023-12-11 23:06:51.992985 |
Duration | 0.52 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
검사일자
Real number (ℝ)
Distinct | 37 |
---|---|
Distinct (%) | 64.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20225813 |
Minimum | 20220707 |
---|---|
Maximum | 20230628 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 645.0 B |
Quantile statistics
Minimum | 20220707 |
---|---|
5-th percentile | 20220721 |
Q1 | 20221024 |
median | 20230103 |
Q3 | 20230502 |
95-th percentile | 20230517 |
Maximum | 20230628 |
Range | 9921 |
Interquartile range (IQR) | 9478 |
Descriptive statistics
Standard deviation | 4755.4906 |
---|---|
Coefficient of variation (CV) | 0.00023511987 |
Kurtosis | -2.0678711 |
Mean | 20225813 |
Median Absolute Deviation (MAD) | 525 |
Skewness | -0.037561578 |
Sum | 1.1528713 × 109 |
Variance | 22614690 |
Monotonicity | Increasing |
Value | Count | Frequency (%) |
20230502 | 11 | |
20221228 | 4 | 7.0% |
20230302 | 3 | 5.3% |
20221213 | 3 | 5.3% |
20230508 | 2 | 3.5% |
20220928 | 2 | 3.5% |
20221012 | 2 | 3.5% |
20230515 | 1 | 1.8% |
20230425 | 1 | 1.8% |
20230523 | 1 | 1.8% |
Other values (27) | 27 |
Value | Count | Frequency (%) |
20220707 | 1 | |
20220711 | 1 | |
20220718 | 1 | |
20220722 | 1 | |
20220812 | 1 | |
20220818 | 1 | |
20220823 | 1 | |
20220825 | 1 | |
20220916 | 1 | |
20220928 | 2 |
Value | Count | Frequency (%) |
20230628 | 1 | 1.8% |
20230620 | 1 | 1.8% |
20230523 | 1 | 1.8% |
20230515 | 1 | 1.8% |
20230508 | 2 | 3.5% |
20230502 | 11 | |
20230425 | 1 | 1.8% |
20230420 | 1 | 1.8% |
20230414 | 1 | 1.8% |
20230406 | 1 | 1.8% |
검사종류
Categorical
Distinct | 4 |
---|---|
Distinct (%) | 7.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
생활용수 | |
---|---|
음용수(기타 먹는물) | |
음용수(먹는물공동시설의 물) | 3 |
공업용수 | 3 |
Length
Max length | 15 |
---|---|
Median length | 4 |
Mean length | 5.6842105 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 음용수(먹는물공동시설의 물) |
---|---|
2nd row | 생활용수 |
3rd row | 음용수(먹는물공동시설의 물) |
4th row | 생활용수 |
5th row | 생활용수 |
Common Values
Value | Count | Frequency (%) |
생활용수 | 42 | |
음용수(기타 먹는물) | 9 | 15.8% |
음용수(먹는물공동시설의 물) | 3 | 5.3% |
공업용수 | 3 | 5.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
생활용수 | 42 | |
음용수(기타 | 9 | 13.0% |
먹는물 | 9 | 13.0% |
음용수(먹는물공동시설의 | 3 | 4.3% |
물 | 3 | 4.3% |
공업용수 | 3 | 4.3% |
검사결과
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
합격 | |
---|---|
불합격 | 3 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.0526316 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 합격 |
---|---|
2nd row | 합격 |
3rd row | 합격 |
4th row | 합격 |
5th row | 합격 |
Common Values
Value | Count | Frequency (%) |
합격 | 54 | |
불합격 | 3 | 5.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
합격 | 54 | |
불합격 | 3 | 5.3% |
검사기관명
Categorical
Distinct | 10 |
---|---|
Distinct (%) | 17.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
동의과학대학교 산학협력단 동의분석센터 | |
---|---|
(주)그린환경연구원 | |
누리생명과학원(주) | |
동의분석센터 | |
아이센 주식회사 | |
Other values (5) |
Length
Max length | 21 |
---|---|
Median length | 20 |
Mean length | 13.631579 |
Min length | 6 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 3.5% |
Sample
1st row | 동의과학대학교 산하협력단 동의분석센터 |
---|---|
2nd row | (주)동진생명연구원 |
3rd row | 동의분석센터 |
4th row | 누리생명과학원(주) |
5th row | (주)동진생명연구원 |
Common Values
Value | Count | Frequency (%) |
동의과학대학교 산학협력단 동의분석센터 | 19 | |
(주)그린환경연구원 | 16 | |
누리생명과학원(주) | 8 | |
동의분석센터 | 3 | 5.3% |
아이센 주식회사 | 3 | 5.3% |
(주)동진생명연구원 | 2 | 3.5% |
동의과학대학교 산학협력단 동의분석센터장 | 2 | 3.5% |
아이센주식회사 | 2 | 3.5% |
동의과학대학교 산하협력단 동의분석센터 | 1 | 1.8% |
동의대학교 산학협력단 동의분석센터장 | 1 | 1.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
동의분석센터 | 23 | |
동의과학대학교 | 22 | |
산학협력단 | 22 | |
주)그린환경연구원 | 16 | |
누리생명과학원(주 | 8 | 7.5% |
아이센 | 3 | 2.8% |
주식회사 | 3 | 2.8% |
동의분석센터장 | 3 | 2.8% |
주)동진생명연구원 | 2 | 1.9% |
아이센주식회사 | 2 | 1.9% |
Other values (2) | 2 | 1.9% |
관정위치
Text
Distinct | 52 |
---|---|
Distinct (%) | 91.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 588.0 B |
Length
Max length | 39 |
---|---|
Median length | 34 |
Mean length | 24.192982 |
Min length | 18 |
Characters and Unicode
Total characters | 1379 |
---|---|
Distinct characters | 100 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 50 ? |
---|---|
Unique (%) | 87.7% |
Sample
1st row | 부산광역시 남구 용당동 206번지 47호 |
---|---|
2nd row | 부산광역시 남구 대연동 239번지 4호 |
3rd row | 부산광역시 남구 용당동 24번지 2호 |
4th row | 부산광역시 남구 용호동 894번지 9호 한성터미널 |
5th row | 부산광역시 남구 용호동 529번지 17호 선미횟집 |
Value | Count | Frequency (%) |
부산광역시 | 57 | |
남구 | 57 | |
대연동 | 21 | 7.1% |
용호동 | 13 | 4.4% |
용당동 | 12 | 4.1% |
2호 | 5 | 1.7% |
문현동 | 5 | 1.7% |
1호 | 5 | 1.7% |
24번지 | 4 | 1.4% |
우암동 | 4 | 1.4% |
Other values (100) | 113 |
Most occurring characters
Value | Count | Frequency (%) |
296 | ||
부 | 60 | 4.4% |
지 | 58 | 4.2% |
산 | 58 | 4.2% |
동 | 58 | 4.2% |
시 | 57 | 4.1% |
남 | 57 | 4.1% |
구 | 57 | 4.1% |
역 | 57 | 4.1% |
번 | 57 | 4.1% |
Other values (90) | 564 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 832 | |
Space Separator | 296 | 21.5% |
Decimal Number | 246 | 17.8% |
Open Punctuation | 2 | 0.1% |
Close Punctuation | 2 | 0.1% |
Other Punctuation | 1 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
부 | 60 | 7.2% |
지 | 58 | 7.0% |
산 | 58 | 7.0% |
동 | 58 | 7.0% |
시 | 57 | 6.9% |
남 | 57 | 6.9% |
구 | 57 | 6.9% |
역 | 57 | 6.9% |
번 | 57 | 6.9% |
광 | 57 | 6.9% |
Other values (76) | 256 |
Decimal Number
Value | Count | Frequency (%) |
1 | 50 | |
2 | 33 | |
4 | 32 | |
5 | 24 | |
7 | 24 | |
3 | 23 | |
9 | 20 | 8.1% |
6 | 15 | 6.1% |
8 | 13 | 5.3% |
0 | 12 | 4.9% |
Space Separator
Value | Count | Frequency (%) |
296 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 832 | |
Common | 547 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
부 | 60 | 7.2% |
지 | 58 | 7.0% |
산 | 58 | 7.0% |
동 | 58 | 7.0% |
시 | 57 | 6.9% |
남 | 57 | 6.9% |
구 | 57 | 6.9% |
역 | 57 | 6.9% |
번 | 57 | 6.9% |
광 | 57 | 6.9% |
Other values (76) | 256 |
Common
Value | Count | Frequency (%) |
296 | ||
1 | 50 | 9.1% |
2 | 33 | 6.0% |
4 | 32 | 5.9% |
5 | 24 | 4.4% |
7 | 24 | 4.4% |
3 | 23 | 4.2% |
9 | 20 | 3.7% |
6 | 15 | 2.7% |
8 | 13 | 2.4% |
Other values (4) | 17 | 3.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 832 | |
ASCII | 547 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
296 | ||
1 | 50 | 9.1% |
2 | 33 | 6.0% |
4 | 32 | 5.9% |
5 | 24 | 4.4% |
7 | 24 | 4.4% |
3 | 23 | 4.2% |
9 | 20 | 3.7% |
6 | 15 | 2.7% |
8 | 13 | 2.4% |
Other values (4) | 17 | 3.1% |
Hangul
Value | Count | Frequency (%) |
부 | 60 | 7.2% |
지 | 58 | 7.0% |
산 | 58 | 7.0% |
동 | 58 | 7.0% |
시 | 57 | 6.9% |
남 | 57 | 6.9% |
구 | 57 | 6.9% |
역 | 57 | 6.9% |
번 | 57 | 6.9% |
광 | 57 | 6.9% |
Other values (76) | 256 |
검사일자 | 검사종류 | 검사결과 | 검사기관명 | 관정위치 | |
---|---|---|---|---|---|
검사일자 | 1.000 | 0.295 | 0.000 | 0.398 | 0.281 |
검사종류 | 0.295 | 1.000 | 0.000 | 0.679 | 0.000 |
검사결과 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 |
검사기관명 | 0.398 | 0.679 | 0.000 | 1.000 | 0.000 |
관정위치 | 0.281 | 0.000 | 0.000 | 0.000 | 1.000 |
검사기관명 | 검사결과 | 검사종류 | |
---|---|---|---|
검사기관명 | 1.000 | 0.000 | 0.449 |
검사결과 | 0.000 | 1.000 | 0.000 |
검사종류 | 0.449 | 0.000 | 1.000 |
검사일자 | 검사종류 | 검사결과 | 검사기관명 | |
---|---|---|---|---|
검사일자 | 1.000 | 0.233 | 0.000 | 0.365 |
검사종류 | 0.233 | 1.000 | 0.000 | 0.449 |
검사결과 | 0.000 | 0.000 | 1.000 | 0.000 |
검사기관명 | 0.365 | 0.449 | 0.000 | 1.000 |
검사일자 | 검사종류 | 검사결과 | 검사기관명 | 관정위치 | |
---|---|---|---|---|---|
0 | 20220707 | 음용수(먹는물공동시설의 물) | 합격 | 동의과학대학교 산하협력단 동의분석센터 | 부산광역시 남구 용당동 206번지 47호 |
1 | 20220711 | 생활용수 | 합격 | (주)동진생명연구원 | 부산광역시 남구 대연동 239번지 4호 |
2 | 20220718 | 음용수(먹는물공동시설의 물) | 합격 | 동의분석센터 | 부산광역시 남구 용당동 24번지 2호 |
3 | 20220722 | 생활용수 | 합격 | 누리생명과학원(주) | 부산광역시 남구 용호동 894번지 9호 한성터미널 |
4 | 20220812 | 생활용수 | 합격 | (주)동진생명연구원 | 부산광역시 남구 용호동 529번지 17호 선미횟집 |
5 | 20220818 | 생활용수 | 합격 | 누리생명과학원(주) | 부산광역시 남구 용호동 655번지 성우주택 |
6 | 20220823 | 생활용수 | 합격 | (주)그린환경연구원 | 부산광역시 남구 대연동 243번지 1호 |
7 | 20220825 | 생활용수 | 합격 | 동의과학대학교 산학협력단 동의분석센터 | 부산광역시 남구 대연동 56번지 4호 스카이타워원룸 10층 |
8 | 20220916 | 생활용수 | 합격 | 누리생명과학원(주) | 부산광역시 남구 대연동 561번지 17호 부경해수탕 |
9 | 20220928 | 생활용수 | 합격 | 동의과학대학교 산학협력단 동의분석센터 | 부산광역시 남구 대연동 599번지 1호 부경대학교 |
검사일자 | 검사종류 | 검사결과 | 검사기관명 | 관정위치 | |
---|---|---|---|---|---|
47 | 20230502 | 생활용수 | 합격 | (주)그린환경연구원 | 부산광역시 남구 감만동 34번지 125호 선녀탕 |
48 | 20230502 | 생활용수 | 합격 | (주)그린환경연구원 | 부산광역시 남구 대연동 243번지 약수탕 |
49 | 20230502 | 생활용수 | 합격 | (주)그린환경연구원 | 부산광역시 남구 문현동 99번지 0018호 |
50 | 20230502 | 생활용수 | 합격 | (주)그린환경연구원 | 부산광역시 남구 대연동 1797번지 6호 |
51 | 20230508 | 음용수(기타 먹는물) | 합격 | 동의과학대학교 산학협력단 동의분석센터 | 부산광역시 남구 용당동 485번지 동명대학교(본관 분수대 옆) |
52 | 20230508 | 음용수(기타 먹는물) | 합격 | 동의과학대학교 산학협력단 동의분석센터장 | 부산광역시 남구 용당동 485번지 부산항만물류고등학교(지게차 실습장) |
53 | 20230515 | 음용수(기타 먹는물) | 합격 | 동의과학대학교 산학협력단 동의분석센터 | 부산광역시 남구 용당동 554번지 |
54 | 20230523 | 생활용수 | 불합격 | 동의과학대학교 산학협력단 동의분석센터 | 부산광역시 남구 용호동 322번지 1호 |
55 | 20230620 | 생활용수 | 합격 | 동의과학대학교 산학협력단 동의분석센터 | 부산광역시 남구 대연동 1767번지 4호 리안오모텔 |
56 | 20230628 | 생활용수 | 합격 | 동의과학대학교 산학협력단 동의분석센터 | 부산광역시 남구 대연동 1164번지 7호 |