Overview

Dataset statistics

Number of variables6
Number of observations37
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory1.9 KiB
Average record size in memory51.6 B

Variable types

Categorical3
Text3

Dataset

Description경기도 시흥시 하천현황자료입니다(경기도 시흥시 하천현황자료에는 구분, 하천명, 시점위치, 종점위치, 관리기관, 데이터기준일자가 있습니다.)
URLhttps://www.data.go.kr/data/3076111/fileData.do

Alerts

관리기관 has constant value ""Constant
데이터기준일자 has constant value ""Constant
구분 is highly imbalanced (53.0%)Imbalance
하천명 has unique valuesUnique
종점위치 has unique valuesUnique

Reproduction

Analysis started2023-12-12 01:54:23.700174
Analysis finished2023-12-12 01:54:24.072523
Duration0.37 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

구분
Categorical

IMBALANCE 

Distinct3
Distinct (%)8.1%
Missing0
Missing (%)0.0%
Memory size428.0 B
소하천
31 
지방하천
국가하천
 
1

Length

Max length4
Median length3
Mean length3.1621622
Min length3

Unique

Unique1 ?
Unique (%)2.7%

Sample

1st row국가하천
2nd row지방하천
3rd row지방하천
4th row지방하천
5th row지방하천

Common Values

ValueCountFrequency (%)
소하천 31
83.8%
지방하천 5
 
13.5%
국가하천 1
 
2.7%

Length

2023-12-12T10:54:24.137214image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:54:24.246253image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
소하천 31
83.8%
지방하천 5
 
13.5%
국가하천 1
 
2.7%

하천명
Text

UNIQUE 

Distinct37
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size428.0 B
2023-12-12T10:54:24.454329image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length5
Median length3
Mean length3.1891892
Min length2

Characters and Unicode

Total characters118
Distinct characters64
Distinct categories1 ?
Distinct scripts1 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique37 ?
Unique (%)100.0%

Sample

1st row목감천
2nd row신천
3rd row은행천
4th row보통천
5th row장현천
ValueCountFrequency (%)
목감천 1
 
2.7%
안현천 1
 
2.7%
양지천 1
 
2.7%
산현천 1
 
2.7%
금호천 1
 
2.7%
새뚝천 1
 
2.7%
제기천 1
 
2.7%
방화천 1
 
2.7%
왜무골천 1
 
2.7%
양달천 1
 
2.7%
Other values (27) 27
73.0%
2023-12-12T10:54:24.819926image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
37
31.4%
3
 
2.5%
3
 
2.5%
3
 
2.5%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
Other values (54) 60
50.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 118
100.0%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
37
31.4%
3
 
2.5%
3
 
2.5%
3
 
2.5%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
Other values (54) 60
50.8%

Most occurring scripts

ValueCountFrequency (%)
Hangul 118
100.0%

Most frequent character per script

Hangul
ValueCountFrequency (%)
37
31.4%
3
 
2.5%
3
 
2.5%
3
 
2.5%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
Other values (54) 60
50.8%

Most occurring blocks

ValueCountFrequency (%)
Hangul 118
100.0%

Most frequent character per block

Hangul
ValueCountFrequency (%)
37
31.4%
3
 
2.5%
3
 
2.5%
3
 
2.5%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
2
 
1.7%
Other values (54) 60
50.8%
Distinct36
Distinct (%)97.3%
Missing0
Missing (%)0.0%
Memory size428.0 B
2023-12-12T10:54:25.029881image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length19
Median length17
Mean length15.189189
Min length11

Characters and Unicode

Total characters562
Distinct characters51
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique35 ?
Unique (%)94.6%

Sample

1st row경기도 시흥시 과림동
2nd row경기도 시흥시 대야동
3rd row경기도 시흥시 계수동
4th row경기도 시흥시 목감동
5th row경기도 시흥시 연성동
ValueCountFrequency (%)
경기도 37
26.1%
시흥시 37
26.1%
과림동 6
 
4.2%
계수동 4
 
2.8%
정왕동 4
 
2.8%
무지내동 2
 
1.4%
산현동 2
 
1.4%
대야동 2
 
1.4%
매화동 2
 
1.4%
군자동 2
 
1.4%
Other values (41) 44
31.0%
2023-12-12T10:54:25.430613image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
105
18.7%
74
13.2%
37
 
6.6%
37
 
6.6%
37
 
6.6%
37
 
6.6%
37
 
6.6%
1 24
 
4.3%
4 17
 
3.0%
- 16
 
2.8%
Other values (41) 141
25.1%

Most occurring categories

ValueCountFrequency (%)
Other Letter 337
60.0%
Space Separator 105
 
18.7%
Decimal Number 104
 
18.5%
Dash Punctuation 16
 
2.8%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
74
22.0%
37
11.0%
37
11.0%
37
11.0%
37
11.0%
37
11.0%
7
 
2.1%
6
 
1.8%
6
 
1.8%
4
 
1.2%
Other values (29) 55
16.3%
Decimal Number
ValueCountFrequency (%)
1 24
23.1%
4 17
16.3%
7 10
9.6%
8 10
9.6%
9 8
 
7.7%
2 8
 
7.7%
5 8
 
7.7%
3 7
 
6.7%
0 7
 
6.7%
6 5
 
4.8%
Space Separator
ValueCountFrequency (%)
105
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 16
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 337
60.0%
Common 225
40.0%

Most frequent character per script

Hangul
ValueCountFrequency (%)
74
22.0%
37
11.0%
37
11.0%
37
11.0%
37
11.0%
37
11.0%
7
 
2.1%
6
 
1.8%
6
 
1.8%
4
 
1.2%
Other values (29) 55
16.3%
Common
ValueCountFrequency (%)
105
46.7%
1 24
 
10.7%
4 17
 
7.6%
- 16
 
7.1%
7 10
 
4.4%
8 10
 
4.4%
9 8
 
3.6%
2 8
 
3.6%
5 8
 
3.6%
3 7
 
3.1%
Other values (2) 12
 
5.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 337
60.0%
ASCII 225
40.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
105
46.7%
1 24
 
10.7%
4 17
 
7.6%
- 16
 
7.1%
7 10
 
4.4%
8 10
 
4.4%
9 8
 
3.6%
2 8
 
3.6%
5 8
 
3.6%
3 7
 
3.1%
Other values (2) 12
 
5.3%
Hangul
ValueCountFrequency (%)
74
22.0%
37
11.0%
37
11.0%
37
11.0%
37
11.0%
37
11.0%
7
 
2.1%
6
 
1.8%
6
 
1.8%
4
 
1.2%
Other values (29) 55
16.3%

종점위치
Text

UNIQUE 

Distinct37
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size428.0 B
2023-12-12T10:54:25.725607image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length21
Median length19
Mean length15.810811
Min length10

Characters and Unicode

Total characters585
Distinct characters54
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique37 ?
Unique (%)100.0%

Sample

1st row경기도 시흥시 논곡동
2nd row경기도 시흥시 방산동
3rd row경기도 시흥시 포동
4th row경기도 시흥시 산현동
5th row경기도 시흥시 장곡동
ValueCountFrequency (%)
경기도 37
26.1%
시흥시 37
26.1%
정왕동 4
 
2.8%
산현동 4
 
2.8%
과림동 4
 
2.8%
계수동 3
 
2.1%
방산동 3
 
2.1%
능곡동 2
 
1.4%
안현동 2
 
1.4%
포동 2
 
1.4%
Other values (43) 44
31.0%
2023-12-12T10:54:26.151778image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
105
17.9%
75
12.8%
37
 
6.3%
37
 
6.3%
37
 
6.3%
37
 
6.3%
37
 
6.3%
1 25
 
4.3%
- 22
 
3.8%
2 17
 
2.9%
Other values (44) 156
26.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 338
57.8%
Decimal Number 120
 
20.5%
Space Separator 105
 
17.9%
Dash Punctuation 22
 
3.8%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
75
22.2%
37
10.9%
37
10.9%
37
10.9%
37
10.9%
37
10.9%
9
 
2.7%
7
 
2.1%
4
 
1.2%
4
 
1.2%
Other values (32) 54
16.0%
Decimal Number
ValueCountFrequency (%)
1 25
20.8%
2 17
14.2%
7 15
12.5%
0 14
11.7%
9 12
10.0%
5 10
 
8.3%
4 8
 
6.7%
6 7
 
5.8%
8 6
 
5.0%
3 6
 
5.0%
Space Separator
ValueCountFrequency (%)
105
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 22
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 338
57.8%
Common 247
42.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
75
22.2%
37
10.9%
37
10.9%
37
10.9%
37
10.9%
37
10.9%
9
 
2.7%
7
 
2.1%
4
 
1.2%
4
 
1.2%
Other values (32) 54
16.0%
Common
ValueCountFrequency (%)
105
42.5%
1 25
 
10.1%
- 22
 
8.9%
2 17
 
6.9%
7 15
 
6.1%
0 14
 
5.7%
9 12
 
4.9%
5 10
 
4.0%
4 8
 
3.2%
6 7
 
2.8%
Other values (2) 12
 
4.9%

Most occurring blocks

ValueCountFrequency (%)
Hangul 338
57.8%
ASCII 247
42.2%

Most frequent character per block

ASCII
ValueCountFrequency (%)
105
42.5%
1 25
 
10.1%
- 22
 
8.9%
2 17
 
6.9%
7 15
 
6.1%
0 14
 
5.7%
9 12
 
4.9%
5 10
 
4.0%
4 8
 
3.2%
6 7
 
2.8%
Other values (2) 12
 
4.9%
Hangul
ValueCountFrequency (%)
75
22.2%
37
10.9%
37
10.9%
37
10.9%
37
10.9%
37
10.9%
9
 
2.7%
7
 
2.1%
4
 
1.2%
4
 
1.2%
Other values (32) 54
16.0%

관리기관
Categorical

CONSTANT 

Distinct1
Distinct (%)2.7%
Missing0
Missing (%)0.0%
Memory size428.0 B
경기도 시흥시 생태하천과
37 

Length

Max length13
Median length13
Mean length13
Min length13

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row경기도 시흥시 생태하천과
2nd row경기도 시흥시 생태하천과
3rd row경기도 시흥시 생태하천과
4th row경기도 시흥시 생태하천과
5th row경기도 시흥시 생태하천과

Common Values

ValueCountFrequency (%)
경기도 시흥시 생태하천과 37
100.0%

Length

2023-12-12T10:54:26.691348image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:54:26.817212image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
경기도 37
33.3%
시흥시 37
33.3%
생태하천과 37
33.3%

데이터기준일자
Categorical

CONSTANT 

Distinct1
Distinct (%)2.7%
Missing0
Missing (%)0.0%
Memory size428.0 B
2023-08-18
37 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row2023-08-18
2nd row2023-08-18
3rd row2023-08-18
4th row2023-08-18
5th row2023-08-18

Common Values

ValueCountFrequency (%)
2023-08-18 37
100.0%

Length

2023-12-12T10:54:26.955091image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T10:54:27.089253image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2023-08-18 37
100.0%

Correlations

2023-12-12T10:54:27.207633image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분하천명시점위치종점위치
구분1.0001.0000.0001.000
하천명1.0001.0001.0001.000
시점위치0.0001.0001.0001.000
종점위치1.0001.0001.0001.000

Missing values

2023-12-12T10:54:23.928557image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T10:54:24.032977image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

구분하천명시점위치종점위치관리기관데이터기준일자
0국가하천목감천경기도 시흥시 과림동경기도 시흥시 논곡동경기도 시흥시 생태하천과2023-08-18
1지방하천신천경기도 시흥시 대야동경기도 시흥시 방산동경기도 시흥시 생태하천과2023-08-18
2지방하천은행천경기도 시흥시 계수동경기도 시흥시 포동경기도 시흥시 생태하천과2023-08-18
3지방하천보통천경기도 시흥시 목감동경기도 시흥시 산현동경기도 시흥시 생태하천과2023-08-18
4지방하천장현천경기도 시흥시 연성동경기도 시흥시 장곡동경기도 시흥시 생태하천과2023-08-18
5지방하천계수천경기도 시흥시 과림동경기도 시흥시 과림동경기도 시흥시 생태하천과2023-08-18
6소하천신흥천경기도 시흥시 무지내동 204-1경기도 시흥시 무지내동 119-1경기도 시흥시 생태하천과2023-08-18
7소하천능안천경기도 시흥시 무지내동 149-1경기도 시흥시 무지내동 81경기도 시흥시 생태하천과2023-08-18
8소하천능래천경기도 시흥시 과림동 784경기도 시흥시 과림동 717-5경기도 시흥시 생태하천과2023-08-18
9소하천과림천경기도 시흥시 과림동 485-7경기도 시흥시 과림동 790-105경기도 시흥시 생태하천과2023-08-18
구분하천명시점위치종점위치관리기관데이터기준일자
27소하천왜무골천경기도 시흥시 산현동 27경기도 시흥시 산현동 459경기도 시흥시 생태하천과2023-08-18
28소하천양달천경기도 시흥시 조남동 44-6경기도 시흥시 조남동 378경기도 시흥시 생태하천과2023-08-18
29소하천장곡천경기도 시흥시 장현동 407-2경기도 시흥시 장현동 110-6경기도 시흥시 생태하천과2023-08-18
30소하천두일천경기도 시흥시 군자동 산44-1경기도 시흥시 능곡동 111경기도 시흥시 생태하천과2023-08-18
31소하천광석천경기도 시흥시 광석동 214경기도 시흥시 능곡동 25경기도 시흥시 생태하천과2023-08-18
32소하천옥구천경기도 시흥시 정왕동 1901경기도 시흥시 정왕동 2207-8경기도 시흥시 생태하천과2023-08-18
33소하천군자천경기도 시흥시 정왕동 1918경기도 시흥시 정왕동 2207-16경기도 시흥시 생태하천과2023-08-18
34소하천정왕천경기도 시흥시 정왕동 1498경기도 시흥시 정왕동 2207-24경기도 시흥시 생태하천과2023-08-18
35소하천시흥천경기도 시흥시 정왕동 876-131경기도 시흥시 정왕동 1296경기도 시흥시 생태하천과2023-08-18
36소하천계란마을천경기도 시흥시 신천동 산9경기도 시흥시 신천동 709-6경기도 시흥시 생태하천과2023-08-18