Overview

Dataset statistics

Number of variables5
Number of observations2344
Missing cells0
Missing cells (%)0.0%
Duplicate rows478
Duplicate rows (%)20.4%
Total size in memory91.7 KiB
Average record size in memory40.1 B

Variable types

Categorical2
Text3

Dataset

Description지하수 측정망 제원에 대한 내용 입니다. - 구분, 관측소명, 주소, 원시자료명, 원시자료기관명 등을 제공하고 있습니다.
URLhttps://www.data.go.kr/data/15118946/fileData.do

Alerts

Dataset has 478 (20.4%) duplicate rowsDuplicates
구분 is highly overall correlated with 원시자료기관명High correlation
원시자료기관명 is highly overall correlated with 구분High correlation

Reproduction

Analysis started2023-12-12 20:36:44.849960
Analysis finished2023-12-12 20:36:45.614925
Duration0.76 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

구분
Categorical

HIGH CORRELATION 

Distinct4
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size18.4 KiB
국가지하수관리측정망
1116 
농촌지하수관측망
714 
해수침투망
343 
국가지하수오염측정망
171 

Length

Max length10
Median length10
Mean length8.6591297
Min length5

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row국가지하수관리측정망
2nd row국가지하수관리측정망
3rd row국가지하수관리측정망
4th row국가지하수관리측정망
5th row국가지하수관리측정망

Common Values

ValueCountFrequency (%)
국가지하수관리측정망 1116
47.6%
농촌지하수관측망 714
30.5%
해수침투망 343
 
14.6%
국가지하수오염측정망 171
 
7.3%

Length

2023-12-13T05:36:45.689714image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T05:36:45.807102image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
국가지하수관리측정망 1116
47.6%
농촌지하수관측망 714
30.5%
해수침투망 343
 
14.6%
국가지하수오염측정망 171
 
7.3%
Distinct1720
Distinct (%)73.4%
Missing0
Missing (%)0.0%
Memory size18.4 KiB
2023-12-13T05:36:46.219644image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length16
Median length15
Mean length4.5213311
Min length2

Characters and Unicode

Total characters10598
Distinct characters275
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1106 ?
Unique (%)47.2%

Sample

1st row고창성내
2nd row고창성내
3rd row김제용지
4th row무안해제
5th row김천부항
ValueCountFrequency (%)
구미 10
 
0.4%
의정부신곡 4
 
0.2%
북구2 2
 
0.1%
포두2 2
 
0.1%
고창성내 2
 
0.1%
창녕3 2
 
0.1%
함평5 2
 
0.1%
영광4 2
 
0.1%
영광5 2
 
0.1%
북구1 2
 
0.1%
Other values (1711) 2316
98.7%
2023-12-13T05:36:46.876313image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
676
 
6.4%
629
 
5.9%
_ 620
 
5.9%
2 598
 
5.6%
1 503
 
4.7%
307
 
2.9%
303
 
2.9%
296
 
2.8%
250
 
2.4%
194
 
1.8%
Other values (265) 6222
58.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 8514
80.3%
Decimal Number 1458
 
13.8%
Connector Punctuation 620
 
5.9%
Close Punctuation 2
 
< 0.1%
Open Punctuation 2
 
< 0.1%
Space Separator 2
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
676
 
7.9%
629
 
7.4%
307
 
3.6%
303
 
3.6%
296
 
3.5%
250
 
2.9%
194
 
2.3%
176
 
2.1%
149
 
1.8%
149
 
1.8%
Other values (252) 5385
63.2%
Decimal Number
ValueCountFrequency (%)
2 598
41.0%
1 503
34.5%
3 150
 
10.3%
4 102
 
7.0%
5 59
 
4.0%
6 30
 
2.1%
7 11
 
0.8%
8 4
 
0.3%
9 1
 
0.1%
Connector Punctuation
ValueCountFrequency (%)
_ 620
100.0%
Close Punctuation
ValueCountFrequency (%)
) 2
100.0%
Open Punctuation
ValueCountFrequency (%)
( 2
100.0%
Space Separator
ValueCountFrequency (%)
2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 8514
80.3%
Common 2084
 
19.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
676
 
7.9%
629
 
7.4%
307
 
3.6%
303
 
3.6%
296
 
3.5%
250
 
2.9%
194
 
2.3%
176
 
2.1%
149
 
1.8%
149
 
1.8%
Other values (252) 5385
63.2%
Common
ValueCountFrequency (%)
_ 620
29.8%
2 598
28.7%
1 503
24.1%
3 150
 
7.2%
4 102
 
4.9%
5 59
 
2.8%
6 30
 
1.4%
7 11
 
0.5%
8 4
 
0.2%
) 2
 
0.1%
Other values (3) 5
 
0.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 8514
80.3%
ASCII 2084
 
19.7%

Most frequent character per block

Hangul
ValueCountFrequency (%)
676
 
7.9%
629
 
7.4%
307
 
3.6%
303
 
3.6%
296
 
3.5%
250
 
2.9%
194
 
2.3%
176
 
2.1%
149
 
1.8%
149
 
1.8%
Other values (252) 5385
63.2%
ASCII
ValueCountFrequency (%)
_ 620
29.8%
2 598
28.7%
1 503
24.1%
3 150
 
7.2%
4 102
 
4.9%
5 59
 
2.8%
6 30
 
1.4%
7 11
 
0.5%
8 4
 
0.2%
) 2
 
0.1%
Other values (3) 5
 
0.2%

주소
Text

Distinct1546
Distinct (%)66.0%
Missing0
Missing (%)0.0%
Memory size18.4 KiB
2023-12-13T05:36:47.328198image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length35
Median length32
Mean length21.460751
Min length14

Characters and Unicode

Total characters50304
Distinct characters341
Distinct categories6 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique759 ?
Unique (%)32.4%

Sample

1st row전라북도 고창군 성내면 덕산리 397-11
2nd row전라북도 고창군 성내면 덕산리 397-11
3rd row전라북도 김제시 용지면 장신리 994-8
4th row전라남도 무안군 해제면 광산리 152-10
5th row경상북도 김천시 부항면 사등리 515-1
ValueCountFrequency (%)
전라남도 423
 
3.6%
경상북도 380
 
3.3%
경상남도 291
 
2.5%
강원도 283
 
2.4%
경기도 267
 
2.3%
충청남도 237
 
2.0%
전라북도 207
 
1.8%
충청북도 145
 
1.2%
구미시 46
 
0.4%
경주시 34
 
0.3%
Other values (3533) 9312
80.1%
2023-12-13T05:36:47.912892image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
9633
 
19.1%
2435
 
4.8%
2062
 
4.1%
1 1821
 
3.6%
1590
 
3.2%
- 1444
 
2.9%
1324
 
2.6%
1225
 
2.4%
1154
 
2.3%
2 1089
 
2.2%
Other values (331) 26527
52.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 30400
60.4%
Space Separator 9633
 
19.1%
Decimal Number 8821
 
17.5%
Dash Punctuation 1444
 
2.9%
Open Punctuation 3
 
< 0.1%
Close Punctuation 3
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2435
 
8.0%
2062
 
6.8%
1590
 
5.2%
1324
 
4.4%
1225
 
4.0%
1154
 
3.8%
1008
 
3.3%
864
 
2.8%
809
 
2.7%
773
 
2.5%
Other values (317) 17156
56.4%
Decimal Number
ValueCountFrequency (%)
1 1821
20.6%
2 1089
12.3%
3 921
10.4%
4 876
9.9%
5 778
8.8%
6 736
8.3%
7 701
 
7.9%
8 655
 
7.4%
0 634
 
7.2%
9 610
 
6.9%
Space Separator
ValueCountFrequency (%)
9633
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1444
100.0%
Open Punctuation
ValueCountFrequency (%)
( 3
100.0%
Close Punctuation
ValueCountFrequency (%)
) 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 30400
60.4%
Common 19904
39.6%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2435
 
8.0%
2062
 
6.8%
1590
 
5.2%
1324
 
4.4%
1225
 
4.0%
1154
 
3.8%
1008
 
3.3%
864
 
2.8%
809
 
2.7%
773
 
2.5%
Other values (317) 17156
56.4%
Common
ValueCountFrequency (%)
9633
48.4%
1 1821
 
9.1%
- 1444
 
7.3%
2 1089
 
5.5%
3 921
 
4.6%
4 876
 
4.4%
5 778
 
3.9%
6 736
 
3.7%
7 701
 
3.5%
8 655
 
3.3%
Other values (4) 1250
 
6.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 30400
60.4%
ASCII 19904
39.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
9633
48.4%
1 1821
 
9.1%
- 1444
 
7.3%
2 1089
 
5.5%
3 921
 
4.6%
4 876
 
4.4%
5 778
 
3.9%
6 736
 
3.7%
7 701
 
3.5%
8 655
 
3.3%
Other values (4) 1250
 
6.3%
Hangul
ValueCountFrequency (%)
2435
 
8.0%
2062
 
6.8%
1590
 
5.2%
1324
 
4.4%
1225
 
4.0%
1154
 
3.8%
1008
 
3.3%
864
 
2.8%
809
 
2.7%
773
 
2.5%
Other values (317) 17156
56.4%
Distinct56
Distinct (%)2.4%
Missing0
Missing (%)0.0%
Memory size18.4 KiB
2023-12-13T05:36:48.206081image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length31
Median length28
Mean length14.791809
Min length7

Characters and Unicode

Total characters34672
Distinct characters66
Distinct categories5 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique6 ?
Unique (%)0.3%

Sample

1st row2003지하수 관측망 설치공사 준공보고서
2nd row2003지하수 관측망 설치공사 준공보고서
3rd row2003지하수 관측망 설치공사 준공보고서
4th row2003지하수 관측망 설치공사 준공보고서
5th row2003지하수 관측망 설치공사 준공보고서
ValueCountFrequency (%)
농촌지하수관측망 714
18.0%
준공보고서 542
13.6%
설치공사 432
 
10.9%
관측망 416
 
10.5%
해수침투관측망 343
 
8.6%
지하수 99
 
2.5%
2017국가지하수수질전용측정망설치보고서 78
 
2.0%
2011국가지하수수질전용측정망설치보고서 70
 
1.8%
2014국가지하수수질전용측정망설치보고서 70
 
1.8%
97지하수 68
 
1.7%
Other values (64) 1139
28.7%
2023-12-13T05:36:48.610913image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
2913
 
8.4%
2312
 
6.7%
2306
 
6.7%
1993
 
5.7%
1977
 
5.7%
1692
 
4.9%
1627
 
4.7%
0 1426
 
4.1%
1287
 
3.7%
1287
 
3.7%
Other values (56) 15852
45.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 28443
82.0%
Decimal Number 4588
 
13.2%
Space Separator 1627
 
4.7%
Open Punctuation 7
 
< 0.1%
Close Punctuation 7
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
2913
 
10.2%
2312
 
8.1%
2306
 
8.1%
1993
 
7.0%
1977
 
7.0%
1692
 
5.9%
1287
 
4.5%
1287
 
4.5%
1287
 
4.5%
1273
 
4.5%
Other values (43) 10116
35.6%
Decimal Number
ValueCountFrequency (%)
0 1426
31.1%
2 1161
25.3%
1 820
17.9%
9 325
 
7.1%
7 191
 
4.2%
8 151
 
3.3%
6 143
 
3.1%
5 133
 
2.9%
4 120
 
2.6%
3 118
 
2.6%
Space Separator
ValueCountFrequency (%)
1627
100.0%
Open Punctuation
ValueCountFrequency (%)
( 7
100.0%
Close Punctuation
ValueCountFrequency (%)
) 7
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 28443
82.0%
Common 6229
 
18.0%

Most frequent character per script

Hangul
ValueCountFrequency (%)
2913
 
10.2%
2312
 
8.1%
2306
 
8.1%
1993
 
7.0%
1977
 
7.0%
1692
 
5.9%
1287
 
4.5%
1287
 
4.5%
1287
 
4.5%
1273
 
4.5%
Other values (43) 10116
35.6%
Common
ValueCountFrequency (%)
1627
26.1%
0 1426
22.9%
2 1161
18.6%
1 820
13.2%
9 325
 
5.2%
7 191
 
3.1%
8 151
 
2.4%
6 143
 
2.3%
5 133
 
2.1%
4 120
 
1.9%
Other values (3) 132
 
2.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 28443
82.0%
ASCII 6229
 
18.0%

Most frequent character per block

Hangul
ValueCountFrequency (%)
2913
 
10.2%
2312
 
8.1%
2306
 
8.1%
1993
 
7.0%
1977
 
7.0%
1692
 
5.9%
1287
 
4.5%
1287
 
4.5%
1287
 
4.5%
1273
 
4.5%
Other values (43) 10116
35.6%
ASCII
ValueCountFrequency (%)
1627
26.1%
0 1426
22.9%
2 1161
18.6%
1 820
13.2%
9 325
 
5.2%
7 191
 
3.1%
8 151
 
2.4%
6 143
 
2.3%
5 133
 
2.1%
4 120
 
1.9%
Other values (3) 132
 
2.1%

원시자료기관명
Categorical

HIGH CORRELATION 

Distinct9
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size18.4 KiB
한국농어촌공사
1047 
환경부, 한국수자원공사
677 
환경부, 한국환경공단
610 
개인
 
3
거제시
 
3
Other values (4)
 
4

Length

Max length12
Median length11
Mean length9.4667235
Min length2

Unique

Unique4 ?
Unique (%)0.2%

Sample

1st row환경부, 한국수자원공사
2nd row환경부, 한국수자원공사
3rd row환경부, 한국수자원공사
4th row환경부, 한국수자원공사
5th row환경부, 한국수자원공사

Common Values

ValueCountFrequency (%)
한국농어촌공사 1047
44.7%
환경부, 한국수자원공사 677
28.9%
환경부, 한국환경공단 610
26.0%
개인 3
 
0.1%
거제시 3
 
0.1%
신안군 1
 
< 0.1%
완도군 1
 
< 0.1%
남해군 1
 
< 0.1%
강화군 1
 
< 0.1%

Length

2023-12-13T05:36:48.791317image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T05:36:48.914060image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
환경부 1287
35.4%
한국농어촌공사 1047
28.8%
한국수자원공사 677
18.6%
한국환경공단 610
16.8%
개인 3
 
0.1%
거제시 3
 
0.1%
신안군 1
 
< 0.1%
완도군 1
 
< 0.1%
남해군 1
 
< 0.1%
강화군 1
 
< 0.1%

Correlations

2023-12-13T05:36:49.043869image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분원시자료명원시자료기관명
구분1.0000.9920.762
원시자료명0.9921.0000.836
원시자료기관명0.7620.8361.000
2023-12-13T05:36:49.141174image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분원시자료기관명
구분1.0000.609
원시자료기관명0.6091.000
2023-12-13T05:36:49.220551image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분원시자료기관명
구분1.0000.609
원시자료기관명0.6091.000

Missing values

2023-12-13T05:36:45.434257image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T05:36:45.563992image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

구분관측소명주소원시자료명원시자료기관명
0국가지하수관리측정망고창성내전라북도 고창군 성내면 덕산리 397-112003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
1국가지하수관리측정망고창성내전라북도 고창군 성내면 덕산리 397-112003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
2국가지하수관리측정망김제용지전라북도 김제시 용지면 장신리 994-82003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
3국가지하수관리측정망무안해제전라남도 무안군 해제면 광산리 152-102003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
4국가지하수관리측정망김천부항경상북도 김천시 부항면 사등리 515-12003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
5국가지하수관리측정망청송부남경상북도 청송군 부남면 감연리 산992003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
6국가지하수관리측정망영천금노경상북도 영천시 금노동 398-12003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
7국가지하수관리측정망창원합성경상남도 창원시 마산회원구 합성동 45-102003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
8국가지하수관리측정망파주맥금경기도 파주시 맥금동 9092003지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
9국가지하수관리측정망파주맥금경기도 파주시 맥금동 9092015지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사
구분관측소명주소원시자료명원시자료기관명
2334해수침투망안면1충청남도 태안군 안면읍 창기리 1995해수침투관측망한국농어촌공사
2335해수침투망안면2충청남도 태안군 안면읍 창기리 2303해수침투관측망한국농어촌공사
2336해수침투망하서1경상북도 경주시 양남면 하서리 461-3해수침투관측망한국농어촌공사
2337해수침투망하서2경상북도 경주시 양남면 하서리 1470-1해수침투관측망한국농어촌공사
2338해수침투망감포1경상북도 경주시 감포읍 전촌리 1226-11해수침투관측망한국농어촌공사
2339해수침투망감포2경상북도 경주시 감포읍 팔조리 24-3해수침투관측망한국농어촌공사
2340해수침투망곡강1경상북도 포항시북구 흥해읍 곡강리 431-1해수침투관측망한국농어촌공사
2341해수침투망곡강2경상북도 포항시북구 흥해읍 남송리 산5-1해수침투관측망한국농어촌공사
2342해수침투망연일1경상북도 포항시남구 연일읍 생지리 411-2해수침투관측망한국농어촌공사
2343해수침투망연일2경상북도 포항시남구 연일읍 중단리 489-1해수침투관측망한국농어촌공사

Duplicate rows

Most frequently occurring

구분관측소명주소원시자료명원시자료기관명# duplicates
0국가지하수관리측정망가평가평경기도 가평군 가평읍 읍내리 624-195지하수관측망설치공사 준공보고서환경부, 한국수자원공사2
1국가지하수관리측정망강릉홍제강원도 강릉시 홍제동 96-5497지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사2
2국가지하수관리측정망강진성전전라남도 강진군 성전면 월평리 66-198지하수관측망설치공사 준공보고서환경부, 한국수자원공사2
3국가지하수관리측정망강진칠량전라남도 강진군 칠량면 영동리 1137-8098지하수관측망설치공사 준공보고서환경부, 한국수자원공사2
4국가지하수관리측정망거제신현경상남도 거제시 삼거동 529-496지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사2
5국가지하수관리측정망거창거창경상남도 거창군 거창읍 학리 1047-6297지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사2
6국가지하수관리측정망경산남산경상북도 경산시 남산면 산양리 5796지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사2
7국가지하수관리측정망경주건천경상북도 경주시 건천읍 방내리 1299-12001지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사2
8국가지하수관리측정망경주산내경상북도 경주시 산내면 의곡리 92-1096지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사2
9국가지하수관리측정망경주양북경상북도 경주시 양북면 용동리 산323-22005 지하수 관측망 설치공사 준공보고서환경부, 한국수자원공사2