Overview

Dataset statistics

Number of variables7
Number of observations73
Missing cells68
Missing cells (%)13.3%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory4.1 KiB
Average record size in memory57.8 B

Variable types

Categorical5
Text2

Dataset

Description성남시 보유 문화재에 대한 데이터이며, 구분,지정번호,명칭,소유자,소재지,관리단체의 항목으로 구성되어 있습니다.
URLhttps://www.data.go.kr/data/15000684/fileData.do

Alerts

소유자 (보유자) is highly overall correlated with 구분 and 3 other fieldsHigh correlation
구분 is highly overall correlated with 소유자 (보유자) and 2 other fieldsHigh correlation
데이터기준일자 is highly overall correlated with 구분 and 3 other fieldsHigh correlation
소재지(도로명) is highly overall correlated with 구분 and 3 other fieldsHigh correlation
관리자(관리단체) is highly overall correlated with 소유자 (보유자) and 2 other fieldsHigh correlation
데이터기준일자 is highly imbalanced (89.6%)Imbalance
소재지 has 68 (93.2%) missing valuesMissing
명 칭 has unique valuesUnique

Reproduction

Analysis started2023-12-12 03:56:53.667572
Analysis finished2023-12-12 03:56:54.393052
Duration0.73 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

구분
Categorical

HIGH CORRELATION 

Distinct10
Distinct (%)13.7%
Missing0
Missing (%)0.0%
Memory size716.0 B
보물
36 
경기도유형문화재
11 
국보
경기도기념물
국가등록문화재
Other values (5)
12 

Length

Max length8
Median length2
Mean length4.3150685
Min length2

Unique

Unique1 ?
Unique (%)1.4%

Sample

1st row국보
2nd row국보
3rd row국보
4th row국보
5th row국보

Common Values

ValueCountFrequency (%)
보물 36
49.3%
경기도유형문화재 11
 
15.1%
국보 5
 
6.8%
경기도기념물 5
 
6.8%
국가등록문화재 4
 
5.5%
국가무형문화재 3
 
4.1%
경기도무형문화재 3
 
4.1%
경기도문화재자료 3
 
4.1%
경기도등록문화재 2
 
2.7%
사적 1
 
1.4%

Length

2023-12-12T12:56:54.480770image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T12:56:54.660042image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
보물 36
49.3%
경기도유형문화재 11
 
15.1%
국보 5
 
6.8%
경기도기념물 5
 
6.8%
국가등록문화재 4
 
5.5%
국가무형문화재 3
 
4.1%
경기도무형문화재 3
 
4.1%
경기도문화재자료 3
 
4.1%
경기도등록문화재 2
 
2.7%
사적 1
 
1.4%

명 칭
Text

UNIQUE 

Distinct73
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size716.0 B
2023-12-12T12:56:54.959083image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length27
Median length16
Mean length9.8630137
Min length3

Characters and Unicode

Total characters720
Distinct characters208
Distinct categories8 ?
Distinct scripts2 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique73 ?
Unique (%)100.0%

Sample

1st row조선왕조실록 봉모당본
2nd row통감속편
3rd row동의보감
4th row월인천강지곡 권상
5th row이십공신회맹축-보사공신녹훈후
ValueCountFrequency (%)
성남 6
 
4.2%
4
 
2.8%
태봉도 3
 
2.1%
초상 3
 
2.1%
3
 
2.1%
봉국사 3
 
2.1%
호성공신교서 3
 
2.1%
2
 
1.4%
손소 2
 
1.4%
법륜사 2
 
1.4%
Other values (111) 112
78.3%
2023-12-12T12:56:55.443991image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
70
 
9.7%
18
 
2.5%
16
 
2.2%
14
 
1.9%
11
 
1.5%
11
 
1.5%
11
 
1.5%
10
 
1.4%
10
 
1.4%
1 10
 
1.4%
Other values (198) 539
74.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 609
84.6%
Space Separator 70
 
9.7%
Decimal Number 24
 
3.3%
Dash Punctuation 8
 
1.1%
Other Punctuation 3
 
0.4%
Math Symbol 2
 
0.3%
Close Punctuation 2
 
0.3%
Open Punctuation 2
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
18
 
3.0%
16
 
2.6%
14
 
2.3%
11
 
1.8%
11
 
1.8%
11
 
1.8%
10
 
1.6%
10
 
1.6%
10
 
1.6%
10
 
1.6%
Other values (186) 488
80.1%
Decimal Number
ValueCountFrequency (%)
1 10
41.7%
2 7
29.2%
3 2
 
8.3%
4 2
 
8.3%
0 2
 
8.3%
6 1
 
4.2%
Space Separator
ValueCountFrequency (%)
70
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 8
100.0%
Other Punctuation
ValueCountFrequency (%)
, 3
100.0%
Math Symbol
ValueCountFrequency (%)
2
100.0%
Close Punctuation
ValueCountFrequency (%)
2
100.0%
Open Punctuation
ValueCountFrequency (%)
2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 609
84.6%
Common 111
 
15.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
18
 
3.0%
16
 
2.6%
14
 
2.3%
11
 
1.8%
11
 
1.8%
11
 
1.8%
10
 
1.6%
10
 
1.6%
10
 
1.6%
10
 
1.6%
Other values (186) 488
80.1%
Common
ValueCountFrequency (%)
70
63.1%
1 10
 
9.0%
- 8
 
7.2%
2 7
 
6.3%
, 3
 
2.7%
3 2
 
1.8%
2
 
1.8%
4 2
 
1.8%
2
 
1.8%
2
 
1.8%
Other values (2) 3
 
2.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 609
84.6%
ASCII 105
 
14.6%
None 4
 
0.6%
Math Operators 2
 
0.3%

Most frequent character per block

ASCII
ValueCountFrequency (%)
70
66.7%
1 10
 
9.5%
- 8
 
7.6%
2 7
 
6.7%
, 3
 
2.9%
3 2
 
1.9%
4 2
 
1.9%
0 2
 
1.9%
6 1
 
1.0%
Hangul
ValueCountFrequency (%)
18
 
3.0%
16
 
2.6%
14
 
2.3%
11
 
1.8%
11
 
1.8%
11
 
1.8%
10
 
1.6%
10
 
1.6%
10
 
1.6%
10
 
1.6%
Other values (186) 488
80.1%
Math Operators
ValueCountFrequency (%)
2
100.0%
None
ValueCountFrequency (%)
2
50.0%
2
50.0%

소유자 (보유자)
Categorical

HIGH CORRELATION 

Distinct23
Distinct (%)31.5%
Missing0
Missing (%)0.0%
Memory size716.0 B
국유
26 
개인
14 
성남시
한국학중앙연구원
대한불교조계종 봉국사
Other values (18)
22 

Length

Max length15
Median length2
Mean length4.6849315
Min length2

Unique

Unique15 ?
Unique (%)20.5%

Sample

1st row국유
2nd row개인
3rd row국유
4th row(주)미래엔
5th row국유

Common Values

ValueCountFrequency (%)
국유 26
35.6%
개인 14
19.2%
성남시 4
 
5.5%
한국학중앙연구원 4
 
5.5%
대한불교조계종 봉국사 3
 
4.1%
대한불교천태종 분당대광사 3
 
4.1%
순흥안씨종중 2
 
2.7%
전주이씨 덕양군파종회 2
 
2.7%
배금용 1
 
1.4%
(주)미래엔 1
 
1.4%
Other values (13) 13
17.8%

Length

2023-12-12T12:56:55.636477image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
국유 26
29.5%
개인 14
15.9%
전주이씨 4
 
4.5%
성남시 4
 
4.5%
한국학중앙연구원 4
 
4.5%
대한불교조계종 4
 
4.5%
봉국사 3
 
3.4%
대한불교천태종 3
 
3.4%
분당대광사 3
 
3.4%
덕양군파종회 2
 
2.3%
Other values (20) 21
23.9%

관리자(관리단체)
Categorical

HIGH CORRELATION 

Distinct15
Distinct (%)20.5%
Missing0
Missing (%)0.0%
Memory size716.0 B
한국학중앙연구원
46 
<NA>
성남시
 
4
대한불교조계종 봉국사
 
3
천태박물관
 
3
Other values (10)
11 

Length

Max length11
Median length8
Mean length7.5616438
Min length2

Unique

Unique9 ?
Unique (%)12.3%

Sample

1st row한국학중앙연구원
2nd row한국학중앙연구원
3rd row한국학중앙연구원
4th row한국학중앙연구원
5th row한국학중앙연구원

Common Values

ValueCountFrequency (%)
한국학중앙연구원 46
63.0%
<NA> 6
 
8.2%
성남시 4
 
5.5%
대한불교조계종 봉국사 3
 
4.1%
천태박물관 3
 
4.1%
전주이씨 덕양군파종회 2
 
2.7%
개인 1
 
1.4%
정토사 1
 
1.4%
대한불교조계종 망경암 1
 
1.4%
한국불교여래종 약사사 1
 
1.4%
Other values (5) 5
 
6.8%

Length

2023-12-12T12:56:55.803069image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
한국학중앙연구원 46
54.8%
na 6
 
7.1%
성남시 4
 
4.8%
대한불교조계종 4
 
4.8%
전주이씨 4
 
4.8%
봉국사 3
 
3.6%
천태박물관 3
 
3.6%
덕양군파종회 2
 
2.4%
한산이씨 1
 
1.2%
청주한씨 1
 
1.2%
Other values (10) 10
 
11.9%

소재지
Text

MISSING 

Distinct5
Distinct (%)100.0%
Missing68
Missing (%)93.2%
Memory size716.0 B
2023-12-12T12:56:56.009456image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length22
Median length21
Mean length20.8
Min length20

Characters and Unicode

Total characters104
Distinct characters30
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique5 ?
Unique (%)100.0%

Sample

1st row경기도 성남시 수정구 금토동 산35-5
2nd row경기도 성남시 분당구 석운동 50-7
3rd row경기도 성남시 분당구 정자동 산33-1
4th row경기도 성남시 분당구 율동 산2-11
5th row경기도 성남시 분당구 하산운동 264-5
ValueCountFrequency (%)
경기도 5
20.0%
성남시 5
20.0%
분당구 4
16.0%
수정구 1
 
4.0%
금토동 1
 
4.0%
산35-5 1
 
4.0%
석운동 1
 
4.0%
50-7 1
 
4.0%
정자동 1
 
4.0%
산33-1 1
 
4.0%
Other values (4) 4
16.0%
2023-12-12T12:56:56.792310image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
20
19.2%
5
 
4.8%
5
 
4.8%
5
 
4.8%
5
 
4.8%
5
 
4.8%
5
 
4.8%
- 5
 
4.8%
5
 
4.8%
5
 
4.8%
Other values (20) 39
37.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 63
60.6%
Space Separator 20
 
19.2%
Decimal Number 16
 
15.4%
Dash Punctuation 5
 
4.8%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
4
 
6.3%
4
 
6.3%
Other values (10) 15
23.8%
Decimal Number
ValueCountFrequency (%)
5 4
25.0%
3 3
18.8%
1 3
18.8%
2 2
12.5%
0 1
 
6.2%
7 1
 
6.2%
6 1
 
6.2%
4 1
 
6.2%
Space Separator
ValueCountFrequency (%)
20
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 5
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 63
60.6%
Common 41
39.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
4
 
6.3%
4
 
6.3%
Other values (10) 15
23.8%
Common
ValueCountFrequency (%)
20
48.8%
- 5
 
12.2%
5 4
 
9.8%
3 3
 
7.3%
1 3
 
7.3%
2 2
 
4.9%
0 1
 
2.4%
7 1
 
2.4%
6 1
 
2.4%
4 1
 
2.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 63
60.6%
ASCII 41
39.4%

Most frequent character per block

ASCII
ValueCountFrequency (%)
20
48.8%
- 5
 
12.2%
5 4
 
9.8%
3 3
 
7.3%
1 3
 
7.3%
2 2
 
4.9%
0 1
 
2.4%
7 1
 
2.4%
6 1
 
2.4%
4 1
 
2.4%
Hangul
ValueCountFrequency (%)
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
5
 
7.9%
4
 
6.3%
4
 
6.3%
Other values (10) 15
23.8%

소재지(도로명)
Categorical

HIGH CORRELATION 

Distinct12
Distinct (%)16.4%
Missing0
Missing (%)0.0%
Memory size716.0 B
경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)
44 
<NA>
11 
경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)
 
4
경기도 성남시 수정구 태평로 79 (태평동)
 
3
충청북도 단양군 백자길 9 (영춘면, 천태박물관)
 
3
Other values (7)

Length

Max length37
Median length36
Mean length29.356164
Min length4

Unique

Unique6 ?
Unique (%)8.2%

Sample

1st row경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)
2nd row경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)
3rd row경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)
4th row경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)
5th row경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)

Common Values

ValueCountFrequency (%)
경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원) 44
60.3%
<NA> 11
 
15.1%
경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원) 4
 
5.5%
경기도 성남시 수정구 태평로 79 (태평동) 3
 
4.1%
충청북도 단양군 백자길 9 (영춘면, 천태박물관) 3
 
4.1%
경기도 성남시 분당구 성남대로 550(수내동) 2
 
2.7%
경기도 성남시 분당구 중앙공원로 20(서현동) 1
 
1.4%
경기도 성남시 수정구 옛골로42번길 3 (상적동) 1
 
1.4%
경기도 성남시 수정구 태평로55번길 72 (복정동) 1
 
1.4%
경기도 성남시 중원구 산성대로625번길 22 (은행동) 1
 
1.4%
Other values (2) 2
 
2.7%

Length

2023-12-12T12:56:57.015324image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
경기도 59
13.8%
성남시 59
13.8%
분당구 52
12.2%
323 48
11.2%
운중동 48
11.2%
한국학중앙연구원 48
11.2%
하오개로 48
11.2%
na 11
 
2.6%
수정구 5
 
1.2%
백자길 3
 
0.7%
Other values (27) 46
10.8%

데이터기준일자
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)2.7%
Missing0
Missing (%)0.0%
Memory size716.0 B
2023-05-31
72 
<NA>
 
1

Length

Max length10
Median length10
Mean length9.9178082
Min length4

Unique

Unique1 ?
Unique (%)1.4%

Sample

1st row2023-05-31
2nd row2023-05-31
3rd row2023-05-31
4th row2023-05-31
5th row2023-05-31

Common Values

ValueCountFrequency (%)
2023-05-31 72
98.6%
<NA> 1
 
1.4%

Length

2023-12-12T12:56:57.184939image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T12:56:57.335983image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
2023-05-31 72
98.6%
na 1
 
1.4%

Correlations

2023-12-12T12:56:57.443661image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분명 칭소유자 (보유자)관리자(관리단체)소재지소재지(도로명)
구분1.0001.0000.9210.7961.0000.784
명 칭1.0001.0001.0001.0001.0001.000
소유자 (보유자)0.9211.0001.0000.9921.0000.966
관리자(관리단체)0.7961.0000.9921.0001.0000.998
소재지1.0001.0001.0001.0001.000NaN
소재지(도로명)0.7841.0000.9660.998NaN1.000
2023-12-12T12:56:57.617952image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
소유자 (보유자)구분데이터기준일자소재지(도로명)관리자(관리단체)
소유자 (보유자)1.0000.5971.0000.8240.923
구분0.5971.0001.0000.5200.482
데이터기준일자1.0001.0001.0001.0001.000
소재지(도로명)0.8240.5201.0001.0000.916
관리자(관리단체)0.9230.4821.0000.9161.000
2023-12-12T12:56:57.773563image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
구분소유자 (보유자)관리자(관리단체)소재지(도로명)데이터기준일자
구분1.0000.5970.4820.5201.000
소유자 (보유자)0.5971.0000.9230.8241.000
관리자(관리단체)0.4820.9231.0000.9161.000
소재지(도로명)0.5200.8240.9161.0001.000
데이터기준일자1.0001.0001.0001.0001.000

Missing values

2023-12-12T12:56:54.154503image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T12:56:54.322814image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

구분명 칭소유자 (보유자)관리자(관리단체)소재지소재지(도로명)데이터기준일자
0국보조선왕조실록 봉모당본국유한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
1국보통감속편개인한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
2국보동의보감국유한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
3국보월인천강지곡 권상(주)미래엔한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
4국보이십공신회맹축-보사공신녹훈후국유한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
5보물안중근의사 유묵-일통청화공개인한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
6보물이충원 호성공신교서개인한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
7보물대방광불화엄경소 권21, 24국유한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
8보물대불정다라니국유한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
9보물약사유리광여래본원공덕경국유한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
구분명 칭소유자 (보유자)관리자(관리단체)소재지소재지(도로명)데이터기준일자
63경기도기념물이수선생묘전주이씨 덕양군파종회전주이씨 덕양군파종회<NA>경기도 성남시 분당구 궁내로 52 (궁내동)2023-05-31
64경기도기념물이경석선생묘전주이씨 백헌공파종중전주이씨 백헌공파종중경기도 성남시 분당구 석운동 50-7<NA>2023-05-31
65경기도기념물한산이씨묘역한산이씨 한평군파종회한산이씨 한평군파종회<NA>경기도 성남시 분당구 성남대로 550(수내동)2023-05-31
66경기도기념물전주이씨태안군파묘역전주이씨 태안군파종회전주이씨 태안군파종회경기도 성남시 분당구 정자동 산33-1<NA>2023-05-31
67경기도기념물둔촌이집묘역광주이씨대종회광주이씨대종회<NA>경기도 성남시 중원구 둔촌대로 320(하대원동)2023-05-31
68경기도문화재자료수내동가옥성남시성남시<NA>경기도 성남시 분당구 성남대로 550(수내동)2023-05-31
69경기도문화재자료청주한씨문정공파묘역신도비청주한씨 문정공파종중청주한씨 문정공파종중경기도 성남시 분당구 율동 산2-11<NA>2023-05-31
70경기도문화재자료풍산군이종린묘역전주이씨 덕양군파종회전주이씨 덕양군파종회경기도 성남시 분당구 하산운동 264-5<NA>2023-05-31
71경기도등록문화재이해조 「구마검」한국학중앙연구원한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31
72경기도등록문화재오천석 「금방울」한국학중앙연구원한국학중앙연구원<NA>경기도 성남시 분당구 하오개로 323 (운중동, 한국학중앙연구원)2023-05-31