Overview

Dataset statistics

Number of variables5
Number of observations10000
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory478.5 KiB
Average record size in memory49.0 B

Variable types

Categorical3
Text1
Numeric1

Dataset

Description경상북도 공유재산과 관련한 정보를 제공합니다.(경상북도 공유재산의 재산 종류, 소재지, 공부지목, 재산관리관 현황입니다.)
Author경상북도
URLhttps://www.data.go.kr/data/15004860/fileData.do

Alerts

재산종류 has constant value ""Constant
재산관리관 is highly imbalanced (81.8%)Imbalance
공부면적 is highly skewed (γ1 = 61.37038998)Skewed
소재지 has unique valuesUnique

Reproduction

Analysis started2023-12-12 05:36:34.737003
Analysis finished2023-12-12 05:36:35.648873
Duration0.91 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

재산종류
Categorical

CONSTANT 

Distinct1
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
토지
10000 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row토지
2nd row토지
3rd row토지
4th row토지
5th row토지

Common Values

ValueCountFrequency (%)
토지 10000
100.0%

Length

2023-12-12T14:36:35.728671image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T14:36:35.834404image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
토지 10000
100.0%

소재지
Text

UNIQUE 

Distinct10000
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-12T14:36:36.268610image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length39
Median length30
Mean length22.2924
Min length16

Characters and Unicode

Total characters222924
Distinct characters277
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique10000 ?
Unique (%)100.0%

Sample

1st row경상북도 경주시 외동읍 개곡리 196-64
2nd row경상북도 김천시 대덕면 가례리 6-3
3rd row경상북도 안동시 길안면 현하리 153-1
4th row경상북도 의성군 옥산면 신계리 산 118-3
5th row경상북도 고령군 개진면 직리 663-4
ValueCountFrequency (%)
경상북도 9982
 
19.5%
의성군 1085
 
2.1%
상주시 859
 
1.7%
854
 
1.7%
포항시 848
 
1.7%
영천시 813
 
1.6%
경주시 666
 
1.3%
안동시 658
 
1.3%
김천시 626
 
1.2%
칠곡군 533
 
1.0%
Other values (8386) 34339
67.0%
2023-12-12T14:36:36.888547image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
41712
18.7%
11603
 
5.2%
11216
 
5.0%
10737
 
4.8%
10730
 
4.8%
9691
 
4.3%
- 9413
 
4.2%
7944
 
3.6%
1 7487
 
3.4%
6026
 
2.7%
Other values (267) 96365
43.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 131410
58.9%
Space Separator 41712
 
18.7%
Decimal Number 40389
 
18.1%
Dash Punctuation 9413
 
4.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
11603
 
8.8%
11216
 
8.5%
10737
 
8.2%
10730
 
8.2%
9691
 
7.4%
7944
 
6.0%
6026
 
4.6%
3989
 
3.0%
3116
 
2.4%
2874
 
2.2%
Other values (255) 53484
40.7%
Decimal Number
ValueCountFrequency (%)
1 7487
18.5%
2 5056
12.5%
3 4726
11.7%
4 4381
10.8%
5 3857
9.5%
6 3507
8.7%
7 3249
8.0%
8 2867
 
7.1%
9 2696
 
6.7%
0 2563
 
6.3%
Space Separator
ValueCountFrequency (%)
41712
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 9413
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 131410
58.9%
Common 91514
41.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
11603
 
8.8%
11216
 
8.5%
10737
 
8.2%
10730
 
8.2%
9691
 
7.4%
7944
 
6.0%
6026
 
4.6%
3989
 
3.0%
3116
 
2.4%
2874
 
2.2%
Other values (255) 53484
40.7%
Common
ValueCountFrequency (%)
41712
45.6%
- 9413
 
10.3%
1 7487
 
8.2%
2 5056
 
5.5%
3 4726
 
5.2%
4 4381
 
4.8%
5 3857
 
4.2%
6 3507
 
3.8%
7 3249
 
3.6%
8 2867
 
3.1%
Other values (2) 5259
 
5.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 131410
58.9%
ASCII 91514
41.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
41712
45.6%
- 9413
 
10.3%
1 7487
 
8.2%
2 5056
 
5.5%
3 4726
 
5.2%
4 4381
 
4.8%
5 3857
 
4.2%
6 3507
 
3.8%
7 3249
 
3.6%
8 2867
 
3.1%
Other values (2) 5259
 
5.7%
Hangul
ValueCountFrequency (%)
11603
 
8.8%
11216
 
8.5%
10737
 
8.2%
10730
 
8.2%
9691
 
7.4%
7944
 
6.0%
6026
 
4.6%
3989
 
3.0%
3116
 
2.4%
2874
 
2.2%
Other values (255) 53484
40.7%

공부지목
Categorical

Distinct22
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
도로
4123 
2398 
1216 
임야
655 
하천
615 
Other values (17)
993 

Length

Max length5
Median length2
Mean length1.6393
Min length1

Unique

Unique2 ?
Unique (%)< 0.1%

Sample

1st row잡종지
2nd row
3rd row
4th row임야
5th row

Common Values

ValueCountFrequency (%)
도로 4123
41.2%
2398
24.0%
1216
 
12.2%
임야 655
 
6.6%
하천 615
 
6.2%
363
 
3.6%
과수원 193
 
1.9%
제방 172
 
1.7%
구거 92
 
0.9%
잡종지 44
 
0.4%
Other values (12) 129
 
1.3%

Length

2023-12-12T14:36:37.102198image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
도로 4123
41.2%
2398
24.0%
1216
 
12.2%
임야 655
 
6.6%
하천 615
 
6.2%
363
 
3.6%
과수원 193
 
1.9%
제방 172
 
1.7%
구거 92
 
0.9%
잡종지 44
 
0.4%
Other values (12) 129
 
1.3%

공부면적
Real number (ℝ)

SKEWED 

Distinct1904
Distinct (%)19.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2189.908
Minimum0
Maximum6228905
Zeros2
Zeros (%)< 0.1%
Negative0
Negative (%)0.0%
Memory size166.0 KiB
2023-12-12T14:36:37.262399image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile10
Q153
median165
Q3451
95-th percentile1890.05
Maximum6228905
Range6228905
Interquartile range (IQR)398

Descriptive statistics

Standard deviation83971.583
Coefficient of variation (CV)38.3448
Kurtosis4059.3877
Mean2189.908
Median Absolute Deviation (MAD)135
Skewness61.37039
Sum21899080
Variance7.0512268 × 109
MonotonicityNot monotonic
2023-12-12T14:36:37.419921image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
10.0 87
 
0.9%
7.0 82
 
0.8%
20.0 79
 
0.8%
23.0 79
 
0.8%
13.0 77
 
0.8%
26.0 75
 
0.8%
17.0 72
 
0.7%
36.0 65
 
0.7%
46.0 64
 
0.6%
43.0 58
 
0.6%
Other values (1894) 9262
92.6%
ValueCountFrequency (%)
0.0 2
 
< 0.1%
0.3 1
 
< 0.1%
1.0 35
0.4%
2.0 40
0.4%
3.0 58
0.6%
3.5 1
 
< 0.1%
4.0 51
0.5%
5.0 50
0.5%
6.0 56
0.6%
7.0 82
0.8%
ValueCountFrequency (%)
6228905.0 1
< 0.1%
4655112.0 1
< 0.1%
2373668.0 1
< 0.1%
1958083.0 1
< 0.1%
609322.0 1
< 0.1%
388760.0 1
< 0.1%
191381.0 1
< 0.1%
120198.0 1
< 0.1%
64388.0 1
< 0.1%
63620.0 1
< 0.1%

재산관리관
Categorical

IMBALANCE 

Distinct38
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
경상북도 건설도시국 도로철도과
8043 
경상북도 건설도시국 하천과
1651 
경상북도 농축산유통국 축산정책과
 
66
경상북도 자치행정국 회계과
 
44
경상북도 농업기술원
 
44
Other values (33)
 
152

Length

Max length30
Median length16
Mean length15.612
Min length10

Unique

Unique14 ?
Unique (%)0.1%

Sample

1st row경상북도 자치행정국 회계과
2nd row경상북도 건설도시국 도로철도과
3rd row경상북도 건설도시국 도로철도과
4th row경상북도 건설도시국 도로철도과
5th row경상북도 건설도시국 하천과

Common Values

ValueCountFrequency (%)
경상북도 건설도시국 도로철도과 8043
80.4%
경상북도 건설도시국 하천과 1651
 
16.5%
경상북도 농축산유통국 축산정책과 66
 
0.7%
경상북도 자치행정국 회계과 44
 
0.4%
경상북도 농업기술원 44
 
0.4%
경상북도 산림자원개발원 27
 
0.3%
경상북도 환경산림자원국 산림자원과 18
 
0.2%
경상북도 농업자원관리원 18
 
0.2%
경상북도 축산기술연구소 13
 
0.1%
경상북도 건설도시국 도시재생과 11
 
0.1%
Other values (28) 65
 
0.7%

Length

2023-12-12T14:36:37.562652image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
경상북도 10000
33.5%
건설도시국 9705
32.5%
도로철도과 8043
26.9%
하천과 1651
 
5.5%
농축산유통국 66
 
0.2%
축산정책과 66
 
0.2%
농업기술원 47
 
0.2%
자치행정국 46
 
0.2%
회계과 44
 
0.1%
산림자원개발원 27
 
0.1%
Other values (42) 175
 
0.6%

Interactions

2023-12-12T14:36:35.315140image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T14:36:37.648870image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
공부지목공부면적재산관리관
공부지목1.0000.0000.611
공부면적0.0001.0000.483
재산관리관0.6110.4831.000
2023-12-12T14:36:38.020591image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
재산관리관공부지목
재산관리관1.0000.188
공부지목0.1881.000
2023-12-12T14:36:38.100293image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
공부면적공부지목재산관리관
공부면적1.0000.0000.265
공부지목0.0001.0000.188
재산관리관0.2650.1881.000

Missing values

2023-12-12T14:36:35.471818image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T14:36:35.589764image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

재산종류소재지공부지목공부면적재산관리관
11215토지경상북도 경주시 외동읍 개곡리 196-64잡종지330.6경상북도 자치행정국 회계과
21016토지경상북도 김천시 대덕면 가례리 6-3317.0경상북도 건설도시국 도로철도과
25455토지경상북도 안동시 길안면 현하리 153-1158.0경상북도 건설도시국 도로철도과
62148토지경상북도 의성군 옥산면 신계리 산 118-3임야245.0경상북도 건설도시국 도로철도과
86294토지경상북도 고령군 개진면 직리 663-4582.0경상북도 건설도시국 하천과
16178토지경상북도 김천시 아포읍 대신리 1595-5과수원40.0경상북도 건설도시국 도로철도과
58941토지경상북도 경산시 용성면 고은리 545-3도로149.0경상북도 건설도시국 도로철도과
64547토지경상북도 의성군 가음면 양지리 381-7도로61.0경상북도 건설도시국 도로철도과
58687토지경상북도 경산시 용성면 곡란리 66-1129.0경상북도 건설도시국 도로철도과
28301토지경상북도 구미시 선기동 212-4도로424.0경상북도 건설도시국 도로철도과
재산종류소재지공부지목공부면적재산관리관
34193토지경상북도 영주시 단산면 단곡리 354-1094.0경상북도 건설도시국 도로철도과
38912토지경상북도 영천시 신녕면 부산리 934-1323.0경상북도 건설도시국 도로철도과
6969토지경상북도 포항시 북구 청하면 명안리 산 203-3임야1041.0경상북도 환경산림자원국 산림자원과
32649토지경상북도 영주시 평은면 지곡리 430-7143.0경상북도 건설도시국 도로철도과
45155토지경상북도 상주시 사벌국면 묵하리 417-66.0경상북도 건설도시국 도로철도과
6565토지경상북도 포항시 북구 청하면 이가리 40-1제방782.0경상북도 건설도시국 도로철도과
18014토지경상북도 김천시 봉산면 덕천리 645-8도로40.0경상북도 건설도시국 도로철도과
15664토지경상북도 김천시 아포읍 인리 239-538.0경상북도 건설도시국 도로철도과
26048토지경상북도 안동시 예안면 삼계리 332-1327.0경상북도 건설도시국 도로철도과
63514토지경상북도 의성군 춘산면 옥정리 169-327.0경상북도 건설도시국 도로철도과