Overview

Dataset statistics

Number of variables5
Number of observations57
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.4 KiB
Average record size in memory43.3 B

Variable types

Numeric1
Categorical3
Text1

Dataset

Description부산광역시 남구 지하수수질검사결과(검사일자, 검사종류, 검사결과, 검사기관명, 지하수관정위치 등) 파일 제공
URLhttps://www.data.go.kr/data/15022534/fileData.do

Alerts

검사결과 is highly imbalanced (70.3%)Imbalance

Reproduction

Analysis started2023-12-11 23:06:51.472913
Analysis finished2023-12-11 23:06:51.992985
Duration0.52 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

검사일자
Real number (ℝ)

Distinct37
Distinct (%)64.9%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean20225813
Minimum20220707
Maximum20230628
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size645.0 B
2023-12-12T08:06:52.057115image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum20220707
5-th percentile20220721
Q120221024
median20230103
Q320230502
95-th percentile20230517
Maximum20230628
Range9921
Interquartile range (IQR)9478

Descriptive statistics

Standard deviation4755.4906
Coefficient of variation (CV)0.00023511987
Kurtosis-2.0678711
Mean20225813
Median Absolute Deviation (MAD)525
Skewness-0.037561578
Sum1.1528713 × 109
Variance22614690
MonotonicityIncreasing
2023-12-12T08:06:52.209862image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=37)
ValueCountFrequency (%)
20230502 11
19.3%
20221228 4
 
7.0%
20230302 3
 
5.3%
20221213 3
 
5.3%
20230508 2
 
3.5%
20220928 2
 
3.5%
20221012 2
 
3.5%
20230515 1
 
1.8%
20230425 1
 
1.8%
20230523 1
 
1.8%
Other values (27) 27
47.4%
ValueCountFrequency (%)
20220707 1
1.8%
20220711 1
1.8%
20220718 1
1.8%
20220722 1
1.8%
20220812 1
1.8%
20220818 1
1.8%
20220823 1
1.8%
20220825 1
1.8%
20220916 1
1.8%
20220928 2
3.5%
ValueCountFrequency (%)
20230628 1
 
1.8%
20230620 1
 
1.8%
20230523 1
 
1.8%
20230515 1
 
1.8%
20230508 2
 
3.5%
20230502 11
19.3%
20230425 1
 
1.8%
20230420 1
 
1.8%
20230414 1
 
1.8%
20230406 1
 
1.8%

검사종류
Categorical

Distinct4
Distinct (%)7.0%
Missing0
Missing (%)0.0%
Memory size588.0 B
생활용수
42 
음용수(기타 먹는물)
음용수(먹는물공동시설의 물)
 
3
공업용수
 
3

Length

Max length15
Median length4
Mean length5.6842105
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row음용수(먹는물공동시설의 물)
2nd row생활용수
3rd row음용수(먹는물공동시설의 물)
4th row생활용수
5th row생활용수

Common Values

ValueCountFrequency (%)
생활용수 42
73.7%
음용수(기타 먹는물) 9
 
15.8%
음용수(먹는물공동시설의 물) 3
 
5.3%
공업용수 3
 
5.3%

Length

2023-12-12T08:06:52.354886image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T08:06:52.462220image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
생활용수 42
60.9%
음용수(기타 9
 
13.0%
먹는물 9
 
13.0%
음용수(먹는물공동시설의 3
 
4.3%
3
 
4.3%
공업용수 3
 
4.3%

검사결과
Categorical

IMBALANCE 

Distinct2
Distinct (%)3.5%
Missing0
Missing (%)0.0%
Memory size588.0 B
합격
54 
불합격
 
3

Length

Max length3
Median length2
Mean length2.0526316
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row합격
2nd row합격
3rd row합격
4th row합격
5th row합격

Common Values

ValueCountFrequency (%)
합격 54
94.7%
불합격 3
 
5.3%

Length

2023-12-12T08:06:52.577330image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T08:06:52.679596image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
합격 54
94.7%
불합격 3
 
5.3%

검사기관명
Categorical

Distinct10
Distinct (%)17.5%
Missing0
Missing (%)0.0%
Memory size588.0 B
동의과학대학교 산학협력단 동의분석센터
19 
(주)그린환경연구원
16 
누리생명과학원(주)
동의분석센터
아이센 주식회사
Other values (5)

Length

Max length21
Median length20
Mean length13.631579
Min length6

Unique

Unique2 ?
Unique (%)3.5%

Sample

1st row동의과학대학교 산하협력단 동의분석센터
2nd row(주)동진생명연구원
3rd row동의분석센터
4th row누리생명과학원(주)
5th row(주)동진생명연구원

Common Values

ValueCountFrequency (%)
동의과학대학교 산학협력단 동의분석센터 19
33.3%
(주)그린환경연구원 16
28.1%
누리생명과학원(주) 8
14.0%
동의분석센터 3
 
5.3%
아이센 주식회사 3
 
5.3%
(주)동진생명연구원 2
 
3.5%
동의과학대학교 산학협력단 동의분석센터장 2
 
3.5%
아이센주식회사 2
 
3.5%
동의과학대학교 산하협력단 동의분석센터 1
 
1.8%
동의대학교 산학협력단 동의분석센터장 1
 
1.8%

Length

2023-12-12T08:06:52.783614image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T08:06:52.913869image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
동의분석센터 23
21.7%
동의과학대학교 22
20.8%
산학협력단 22
20.8%
주)그린환경연구원 16
15.1%
누리생명과학원(주 8
 
7.5%
아이센 3
 
2.8%
주식회사 3
 
2.8%
동의분석센터장 3
 
2.8%
주)동진생명연구원 2
 
1.9%
아이센주식회사 2
 
1.9%
Other values (2) 2
 
1.9%
Distinct52
Distinct (%)91.2%
Missing0
Missing (%)0.0%
Memory size588.0 B
2023-12-12T08:06:53.200185image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length39
Median length34
Mean length24.192982
Min length18

Characters and Unicode

Total characters1379
Distinct characters100
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique50 ?
Unique (%)87.7%

Sample

1st row부산광역시 남구 용당동 206번지 47호
2nd row부산광역시 남구 대연동 239번지 4호
3rd row부산광역시 남구 용당동 24번지 2호
4th row부산광역시 남구 용호동 894번지 9호 한성터미널
5th row부산광역시 남구 용호동 529번지 17호 선미횟집
ValueCountFrequency (%)
부산광역시 57
19.3%
남구 57
19.3%
대연동 21
 
7.1%
용호동 13
 
4.4%
용당동 12
 
4.1%
2호 5
 
1.7%
문현동 5
 
1.7%
1호 5
 
1.7%
24번지 4
 
1.4%
우암동 4
 
1.4%
Other values (100) 113
38.2%
2023-12-12T08:06:53.621169image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
296
21.5%
60
 
4.4%
58
 
4.2%
58
 
4.2%
58
 
4.2%
57
 
4.1%
57
 
4.1%
57
 
4.1%
57
 
4.1%
57
 
4.1%
Other values (90) 564
40.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 832
60.3%
Space Separator 296
 
21.5%
Decimal Number 246
 
17.8%
Open Punctuation 2
 
0.1%
Close Punctuation 2
 
0.1%
Other Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
60
 
7.2%
58
 
7.0%
58
 
7.0%
58
 
7.0%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
Other values (76) 256
30.8%
Decimal Number
ValueCountFrequency (%)
1 50
20.3%
2 33
13.4%
4 32
13.0%
5 24
9.8%
7 24
9.8%
3 23
9.3%
9 20
 
8.1%
6 15
 
6.1%
8 13
 
5.3%
0 12
 
4.9%
Space Separator
ValueCountFrequency (%)
296
100.0%
Open Punctuation
ValueCountFrequency (%)
( 2
100.0%
Close Punctuation
ValueCountFrequency (%)
) 2
100.0%
Other Punctuation
ValueCountFrequency (%)
, 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 832
60.3%
Common 547
39.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
60
 
7.2%
58
 
7.0%
58
 
7.0%
58
 
7.0%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
Other values (76) 256
30.8%
Common
ValueCountFrequency (%)
296
54.1%
1 50
 
9.1%
2 33
 
6.0%
4 32
 
5.9%
5 24
 
4.4%
7 24
 
4.4%
3 23
 
4.2%
9 20
 
3.7%
6 15
 
2.7%
8 13
 
2.4%
Other values (4) 17
 
3.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 832
60.3%
ASCII 547
39.7%

Most frequent character per block

ASCII
ValueCountFrequency (%)
296
54.1%
1 50
 
9.1%
2 33
 
6.0%
4 32
 
5.9%
5 24
 
4.4%
7 24
 
4.4%
3 23
 
4.2%
9 20
 
3.7%
6 15
 
2.7%
8 13
 
2.4%
Other values (4) 17
 
3.1%
Hangul
ValueCountFrequency (%)
60
 
7.2%
58
 
7.0%
58
 
7.0%
58
 
7.0%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
57
 
6.9%
Other values (76) 256
30.8%

Interactions

2023-12-12T08:06:51.752573image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T08:06:53.706778image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
검사일자검사종류검사결과검사기관명관정위치
검사일자1.0000.2950.0000.3980.281
검사종류0.2951.0000.0000.6790.000
검사결과0.0000.0001.0000.0000.000
검사기관명0.3980.6790.0001.0000.000
관정위치0.2810.0000.0000.0001.000
2023-12-12T08:06:53.795995image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
검사기관명검사결과검사종류
검사기관명1.0000.0000.449
검사결과0.0001.0000.000
검사종류0.4490.0001.000
2023-12-12T08:06:53.891393image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
검사일자검사종류검사결과검사기관명
검사일자1.0000.2330.0000.365
검사종류0.2331.0000.0000.449
검사결과0.0000.0001.0000.000
검사기관명0.3650.4490.0001.000

Missing values

2023-12-12T08:06:51.860313image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T08:06:51.955075image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

검사일자검사종류검사결과검사기관명관정위치
020220707음용수(먹는물공동시설의 물)합격동의과학대학교 산하협력단 동의분석센터부산광역시 남구 용당동 206번지 47호
120220711생활용수합격(주)동진생명연구원부산광역시 남구 대연동 239번지 4호
220220718음용수(먹는물공동시설의 물)합격동의분석센터부산광역시 남구 용당동 24번지 2호
320220722생활용수합격누리생명과학원(주)부산광역시 남구 용호동 894번지 9호 한성터미널
420220812생활용수합격(주)동진생명연구원부산광역시 남구 용호동 529번지 17호 선미횟집
520220818생활용수합격누리생명과학원(주)부산광역시 남구 용호동 655번지 성우주택
620220823생활용수합격(주)그린환경연구원부산광역시 남구 대연동 243번지 1호
720220825생활용수합격동의과학대학교 산학협력단 동의분석센터부산광역시 남구 대연동 56번지 4호 스카이타워원룸 10층
820220916생활용수합격누리생명과학원(주)부산광역시 남구 대연동 561번지 17호 부경해수탕
920220928생활용수합격동의과학대학교 산학협력단 동의분석센터부산광역시 남구 대연동 599번지 1호 부경대학교
검사일자검사종류검사결과검사기관명관정위치
4720230502생활용수합격(주)그린환경연구원부산광역시 남구 감만동 34번지 125호 선녀탕
4820230502생활용수합격(주)그린환경연구원부산광역시 남구 대연동 243번지 약수탕
4920230502생활용수합격(주)그린환경연구원부산광역시 남구 문현동 99번지 0018호
5020230502생활용수합격(주)그린환경연구원부산광역시 남구 대연동 1797번지 6호
5120230508음용수(기타 먹는물)합격동의과학대학교 산학협력단 동의분석센터부산광역시 남구 용당동 485번지 동명대학교(본관 분수대 옆)
5220230508음용수(기타 먹는물)합격동의과학대학교 산학협력단 동의분석센터장부산광역시 남구 용당동 485번지 부산항만물류고등학교(지게차 실습장)
5320230515음용수(기타 먹는물)합격동의과학대학교 산학협력단 동의분석센터부산광역시 남구 용당동 554번지
5420230523생활용수불합격동의과학대학교 산학협력단 동의분석센터부산광역시 남구 용호동 322번지 1호
5520230620생활용수합격동의과학대학교 산학협력단 동의분석센터부산광역시 남구 대연동 1767번지 4호 리안오모텔
5620230628생활용수합격동의과학대학교 산학협력단 동의분석센터부산광역시 남구 대연동 1164번지 7호