Overview

Dataset statistics

Number of variables7
Number of observations3409
Missing cells0
Missing cells (%)0.0%
Duplicate rows19
Duplicate rows (%)0.6%
Total size in memory189.9 KiB
Average record size in memory57.0 B

Variable types

Categorical5
Numeric1
Text1

Dataset

Description창원시설공단의 시설별 수질검사 결과
Author창원시설공단
URLhttps://www.data.go.kr/data/15074867/fileData.do

Alerts

Dataset has 19 (0.6%) duplicate rowsDuplicates
시설명 is highly overall correlated with 소재지High correlation
단위 is highly overall correlated with 검사항목 and 1 other fieldsHigh correlation
기준 is highly overall correlated with 검사항목 and 1 other fieldsHigh correlation
소재지 is highly overall correlated with 시설명High correlation
검사항목 is highly overall correlated with 기준 and 1 other fieldsHigh correlation

Reproduction

Analysis started2023-12-12 20:20:49.813827
Analysis finished2023-12-12 20:20:50.878032
Duration1.06 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

시설명
Categorical

HIGH CORRELATION 

Distinct14
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size26.8 KiB
성산스포츠센터
373 
우리누리수영장
329 
올림픽수영장
322 
마산체육관수영장
322 
늘푸른전당
309 
Other values (9)
1754 

Length

Max length10
Median length7
Mean length7.1701379
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row내서스포츠센터
2nd row내서스포츠센터
3rd row내서스포츠센터
4th row내서스포츠센터
5th row내서스포츠센터

Common Values

ValueCountFrequency (%)
성산스포츠센터 373
10.9%
우리누리수영장 329
9.7%
올림픽수영장 322
9.4%
마산체육관수영장 322
9.4%
늘푸른전당 309
9.1%
창원실내수영장 308
9.0%
진해용원국민체육센터 307
9.0%
진해국민체육센터 305
8.9%
진동종합복지관 304
8.9%
의창스포츠센터 251
7.4%
Other values (4) 279
8.2%

Length

2023-12-13T05:20:50.997352image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
성산스포츠센터 373
10.9%
우리누리수영장 329
9.7%
올림픽수영장 322
9.4%
마산체육관수영장 322
9.4%
늘푸른전당 309
9.1%
창원실내수영장 308
9.0%
진해용원국민체육센터 307
9.0%
진해국민체육센터 305
8.9%
진동종합복지관 304
8.9%
의창스포츠센터 251
7.4%
Other values (4) 279
8.2%

소재지
Categorical

HIGH CORRELATION 

Distinct20
Distinct (%)0.6%
Missing0
Missing (%)0.0%
Memory size26.8 KiB
경상남도 창원시 마산회원구 삼호로 63 (양덕동)
644 
경상남도 창원시 성산구 창이대로 888 (남양동 37-1)
373 
경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)
329 
경상남도 창원시 의창구 원이대로 450 (두대동 145)
317 
경상남도 창원시 의창구 두대로 97 (삼동동 293)
309 
Other values (15)
1437 

Length

Max length36
Median length34
Mean length30.816662
Min length27

Unique

Unique6 ?
Unique (%)0.2%

Sample

1st row경상남도 창원시 마산회원구 내서읍 중리 391-3
2nd row경상남도 창원시 마산회원구 내서읍 중리 391-3
3rd row경상남도 창원시 마산회원구 내서읍 중리 391-3
4th row경상남도 창원시 마산회원구 내서읍 중리 391-3
5th row경상남도 창원시 마산회원구 내서읍 중리 391-3

Common Values

ValueCountFrequency (%)
경상남도 창원시 마산회원구 삼호로 63 (양덕동) 644
18.9%
경상남도 창원시 성산구 창이대로 888 (남양동 37-1) 373
10.9%
경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3) 329
9.7%
경상남도 창원시 의창구 원이대로 450 (두대동 145) 317
9.3%
경상남도 창원시 의창구 두대로 97 (삼동동 293) 309
9.1%
경상남도 창원시 진해구 안청로 95 (청안동 319-5) 307
9.0%
경상남도 창원시 진해구 석동로 66 (석동 657) 305
8.9%
경상남도 창원시 마산합포구 진동면 신서촌로 15 (진동리 872) 304
8.9%
경상남도 창원시 의창구 원이대로56번길 11 (도계동 467) 251
 
7.4%
경상남도 창원시 성산구 원이대로 692 (상남동 43-2) 212
 
6.2%
Other values (10) 58
 
1.7%

Length

2023-12-13T05:20:51.155409image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
경상남도 3409
 
14.5%
창원시 3409
 
14.5%
마산회원구 991
 
4.2%
의창구 910
 
3.9%
63 644
 
2.7%
삼호로 644
 
2.7%
양덕동 644
 
2.7%
진해구 612
 
2.6%
성산구 585
 
2.5%
원이대로 529
 
2.3%
Other values (53) 11128
47.3%

년월
Real number (ℝ)

Distinct47
Distinct (%)1.4%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean201849.01
Minimum201701
Maximum202011
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size30.1 KiB
2023-12-13T05:20:51.339998image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum201701
5-th percentile201703
Q1201801
median201812
Q3201910
95-th percentile202009
Maximum202011
Range310
Interquartile range (IQR)109

Descriptive statistics

Standard deviation104.81754
Coefficient of variation (CV)0.00051928687
Kurtosis-1.1927234
Mean201849.01
Median Absolute Deviation (MAD)97
Skewness0.050934044
Sum6.8810327 × 108
Variance10986.717
MonotonicityNot monotonic
2023-12-13T05:20:51.546862image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=47)
ValueCountFrequency (%)
201907 96
 
2.8%
202010 90
 
2.6%
201808 88
 
2.6%
202005 88
 
2.6%
201804 88
 
2.6%
201901 88
 
2.6%
201910 88
 
2.6%
201902 88
 
2.6%
201903 88
 
2.6%
201906 88
 
2.6%
Other values (37) 2519
73.9%
ValueCountFrequency (%)
201701 64
1.9%
201702 64
1.9%
201703 64
1.9%
201704 72
2.1%
201705 72
2.1%
201706 72
2.1%
201707 72
2.1%
201708 72
2.1%
201709 64
1.9%
201710 72
2.1%
ValueCountFrequency (%)
202011 63
1.8%
202010 90
2.6%
202009 27
 
0.8%
202008 54
1.6%
202007 72
2.1%
202006 72
2.1%
202005 88
2.6%
202004 8
 
0.2%
202003 24
 
0.7%
202002 72
2.1%

검사항목
Categorical

HIGH CORRELATION 

Distinct12
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size26.8 KiB
유리잔류염소
422 
수소이온농도
422 
탁도
422 
과망간산칼륨소비량
421 
비소
421 
Other values (7)
1301 

Length

Max length9
Median length7
Mean length4.4021707
Min length2

Unique

Unique2 ?
Unique (%)0.1%

Sample

1st row총대장균군
2nd row과망간산칼륨소비량
3rd row유리잔류염소
4th row수소이온농도
5th row탁도

Common Values

ValueCountFrequency (%)
유리잔류염소 422
12.4%
수소이온농도 422
12.4%
탁도 422
12.4%
과망간산칼륨소비량 421
12.3%
비소 421
12.3%
수은 421
12.3%
알루미늄 421
12.3%
대장균군 388
11.4%
총대장균군 35
 
1.0%
결합잔류염소 34
 
1.0%
Other values (2) 2
 
0.1%

Length

2023-12-13T05:20:51.774426image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
유리잔류염소 422
12.4%
수소이온농도 422
12.4%
탁도 422
12.4%
과망간산칼륨소비량 421
12.3%
비소 421
12.3%
수은 421
12.3%
알루미늄 421
12.3%
대장균군 388
11.4%
총대장균군 35
 
1.0%
결합잔류염소 34
 
1.0%
Other values (2) 2
 
0.1%

기준
Categorical

HIGH CORRELATION 

Distinct13
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size26.8 KiB
0.5 mg/L이하
455 
양성2개 이하 / 시험대상욕수5개
421 
12 mg/L이하
421 
0.4~1.0 mg/L이하
421 
5.8~8.6
421 
Other values (8)
1270 

Length

Max length18
Median length12
Mean length11.2335
Min length7

Unique

Unique4 ?
Unique (%)0.1%

Sample

1st row양성2개 이하 / 시험대상욕수5개
2nd row12 mg/L이하
3rd row0.4~1.0 mg/L이하
4th row5.8~8.6
5th row1.5 NTU이하

Common Values

ValueCountFrequency (%)
0.5 mg/L이하 455
13.3%
양성2개 이하 / 시험대상욕수5개 421
12.3%
12 mg/L이하 421
12.3%
0.4~1.0 mg/L이하 421
12.3%
5.8~8.6 421
12.3%
1.5 NTU이하 421
12.3%
0.05 mg/L이하 421
12.3%
0.007 mg/L이하 421
12.3%
불검출/100mL 3
 
0.1%
100 CFU/mL이하 1
 
< 0.1%
Other values (3) 3
 
0.1%

Length

2023-12-13T05:20:51.964711image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
mg/l이하 2140
29.6%
0.5 456
 
6.3%
ntu이하 422
 
5.8%
0.4~1.0 421
 
5.8%
0.007 421
 
5.8%
0.05 421
 
5.8%
5.8~8.6 421
 
5.8%
1.5 421
 
5.8%
12 421
 
5.8%
시험대상욕수5개 421
 
5.8%
Other values (8) 1270
17.6%

단위
Categorical

HIGH CORRELATION 

Distinct5
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size26.8 KiB
mg/L
2140 
-
843 
NTU
422 
/100mL
 
3
CFU/mL
 
1

Length

Max length6
Median length4
Mean length3.136697
Min length1

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row-
2nd rowmg/L
3rd rowmg/L
4th row-
5th rowNTU

Common Values

ValueCountFrequency (%)
mg/L 2140
62.8%
- 843
 
24.7%
NTU 422
 
12.4%
/100mL 3
 
0.1%
CFU/mL 1
 
< 0.1%

Length

2023-12-13T05:20:52.100421image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T05:20:52.237001image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
mg/l 2140
62.8%
843
 
24.7%
ntu 422
 
12.4%
100ml 3
 
0.1%
cfu/ml 1
 
< 0.1%
Distinct157
Distinct (%)4.6%
Missing0
Missing (%)0.0%
Memory size26.8 KiB
2023-12-13T05:20:52.592568image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length5
Median length3
Mean length3.0437078
Min length1

Characters and Unicode

Total characters10376
Distinct characters14
Distinct categories3 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique18 ?
Unique (%)0.5%

Sample

1st row0
2nd row2.7
3rd row0.62
4th row7.2
5th row0.1
ValueCountFrequency (%)
불검출 899
26.4%
0 422
 
12.4%
7.5 52
 
1.5%
0.13 50
 
1.5%
7.6 50
 
1.5%
0.45 44
 
1.3%
0.09 39
 
1.1%
0.15 38
 
1.1%
0.04 38
 
1.1%
0.07 37
 
1.1%
Other values (147) 1740
51.0%
2023-12-13T05:20:53.202017image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
. 2006
19.3%
0 1972
19.0%
899
8.7%
899
8.7%
899
8.7%
1 653
 
6.3%
7 545
 
5.3%
4 470
 
4.5%
2 464
 
4.5%
5 426
 
4.1%
Other values (4) 1143
11.0%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 5673
54.7%
Other Letter 2697
26.0%
Other Punctuation 2006
 
19.3%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
0 1972
34.8%
1 653
 
11.5%
7 545
 
9.6%
4 470
 
8.3%
2 464
 
8.2%
5 426
 
7.5%
3 379
 
6.7%
6 361
 
6.4%
8 234
 
4.1%
9 169
 
3.0%
Other Letter
ValueCountFrequency (%)
899
33.3%
899
33.3%
899
33.3%
Other Punctuation
ValueCountFrequency (%)
. 2006
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 7679
74.0%
Hangul 2697
 
26.0%

Most frequent character per script

Common
ValueCountFrequency (%)
. 2006
26.1%
0 1972
25.7%
1 653
 
8.5%
7 545
 
7.1%
4 470
 
6.1%
2 464
 
6.0%
5 426
 
5.5%
3 379
 
4.9%
6 361
 
4.7%
8 234
 
3.0%
Hangul
ValueCountFrequency (%)
899
33.3%
899
33.3%
899
33.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 7679
74.0%
Hangul 2697
 
26.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
. 2006
26.1%
0 1972
25.7%
1 653
 
8.5%
7 545
 
7.1%
4 470
 
6.1%
2 464
 
6.0%
5 426
 
5.5%
3 379
 
4.9%
6 361
 
4.7%
8 234
 
3.0%
Hangul
ValueCountFrequency (%)
899
33.3%
899
33.3%
899
33.3%

Interactions

2023-12-13T05:20:50.459524image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T05:20:53.346242image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
시설명소재지년월검사항목기준단위
시설명1.0000.9940.3640.3880.6260.609
소재지0.9941.0000.4040.4150.6510.690
년월0.3640.4041.0000.3450.0000.000
검사항목0.3880.4150.3451.0000.9760.959
기준0.6260.6510.0000.9761.0001.000
단위0.6090.6900.0000.9591.0001.000
2023-12-13T05:20:53.534291image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
시설명단위기준소재지검사항목
시설명1.0000.3730.2830.9500.157
단위0.3731.0000.9990.3710.913
기준0.2830.9991.0000.2810.870
소재지0.9500.3710.2811.0000.154
검사항목0.1570.9130.8700.1541.000
2023-12-13T05:20:53.685700image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
년월시설명소재지검사항목기준단위
년월1.0000.2150.2030.1660.0000.000
시설명0.2151.0000.9500.1570.2830.373
소재지0.2030.9501.0000.1540.2810.371
검사항목0.1660.1570.1541.0000.8700.913
기준0.0000.2830.2810.8701.0000.999
단위0.0000.3730.3710.9130.9991.000

Missing values

2023-12-13T05:20:50.646591image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T05:20:50.811797image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

시설명소재지년월검사항목기준단위검사결과
0내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009총대장균군양성2개 이하 / 시험대상욕수5개-0
1내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009과망간산칼륨소비량12 mg/L이하mg/L2.7
2내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009유리잔류염소0.4~1.0 mg/L이하mg/L0.62
3내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009수소이온농도5.8~8.6-7.2
4내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009탁도1.5 NTU이하NTU0.1
5내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009비소0.05 mg/L이하mg/L불검출
6내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009수은0.007 mg/L이하mg/L불검출
7내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009알루미늄0.5 mg/L이하mg/L0.08
8내서스포츠센터경상남도 창원시 마산회원구 내서읍 중리 391-3202009결합잔류염소0.5 mg/L이하mg/L0.26
9성산스포츠센터경상남도 창원시 성산구 창이대로 888 (남양동 37-1)202009총대장균군양성2개 이하 / 시험대상욕수5개-0
시설명소재지년월검사항목기준단위검사결과
3399창원실내수영장경상남도 창원시 의창구 원이대로 450 (두대동 145)202011결합잔류염소0.5 mg/L이하mg/L0.09
3400마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011총대장균군양성2개 이하 / 시험대상욕수5개-0
3401마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011과망간산칼륨소비량12 mg/L이하mg/L1.6
3402마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011유리잔류염소0.4~1.0 mg/L이하mg/L0.67
3403마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011수소이온농도5.8~8.6-7.4
3404마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011탁도1.5 NTU이하NTU0.11
3405마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011비소0.05 mg/L이하mg/L불검출
3406마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011수은0.007 mg/L이하mg/L불검출
3407마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011알루미늄0.5 mg/L이하mg/L0.05
3408마산체육관수영장경상남도 창원시 마산회원구 삼호로 63 (양덕동)202011결합잔류염소0.5 mg/L이하mg/L0.21

Duplicate rows

Most frequently occurring

시설명소재지년월검사항목기준단위검사결과# duplicates
9우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)202005대장균군양성2개 이하 / 시험대상욕수5개-03
10우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)202005비소0.05 mg/L이하mg/L불검출3
12우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)202005수은0.007 mg/L이하mg/L불검출3
0우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)201907대장균군양성2개 이하 / 시험대상욕수5개-02
1우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)201907비소0.05 mg/L이하mg/L불검출2
2우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)201907수은0.007 mg/L이하mg/L불검출2
3우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)201910대장균군양성2개 이하 / 시험대상욕수5개-02
4우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)201910비소0.05 mg/L이하mg/L불검출2
5우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)201910수은0.007 mg/L이하mg/L불검출2
6우리누리수영장경상남도 창원시 마산회원구 팔용로 128 (합성동 91-3)201910알루미늄0.5 mg/L이하mg/L0.132