Overview

Dataset statistics

Number of variables8
Number of observations26
Missing cells1
Missing cells (%)0.5%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory1.8 KiB
Average record size in memory70.1 B

Variable types

Categorical4
Text3
Numeric1

Dataset

Description경상남도 전문 및 대학교 현황에 대한 데이터로 시군명, 학교구분명, 공사립구분명, 시설명, 시설구분명, 소재지주소, 우편번호 등의 항목을 제공합니다.
Author경상남도
URLhttps://bigdata.gyeongnam.go.kr/index.gn?menuCd=DOM_000000114002001000&publicdatapk=15089465

Alerts

소재지우편번호 is highly overall correlated with 시군명High correlation
시군명 is highly overall correlated with 소재지우편번호 and 1 other fieldsHigh correlation
시설구분명 is highly overall correlated with 시군명High correlation
시설구분명 is highly imbalanced (60.9%)Imbalance
소재지우편번호 has 1 (3.8%) missing valuesMissing
시설명 has unique valuesUnique
소재지도로명주소 has unique valuesUnique
소재지지번주소 has unique valuesUnique

Reproduction

Analysis started2023-12-10 23:35:06.433926
Analysis finished2023-12-10 23:35:07.131554
Duration0.7 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

시군명
Categorical

HIGH CORRELATION 

Distinct9
Distinct (%)34.6%
Missing0
Missing (%)0.0%
Memory size340.0 B
진주시
창원시
김해시
양산시
거창군
Other values (4)

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique4 ?
Unique (%)15.4%

Sample

1st row거제시
2nd row거창군
3rd row거창군
4th row김해시
5th row김해시

Common Values

ValueCountFrequency (%)
진주시 7
26.9%
창원시 6
23.1%
김해시 4
15.4%
양산시 3
11.5%
거창군 2
 
7.7%
거제시 1
 
3.8%
남해군 1
 
3.8%
밀양시 1
 
3.8%
사천시 1
 
3.8%

Length

2023-12-11T08:35:07.191642image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T08:35:07.323660image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
진주시 7
26.9%
창원시 6
23.1%
김해시 4
15.4%
양산시 3
11.5%
거창군 2
 
7.7%
거제시 1
 
3.8%
남해군 1
 
3.8%
밀양시 1
 
3.8%
사천시 1
 
3.8%

학교구분명
Categorical

Distinct4
Distinct (%)15.4%
Missing0
Missing (%)0.0%
Memory size340.0 B
대학교
12 
전문대학
10 
기능대학
원격대학
 
1

Length

Max length4
Median length4
Mean length3.5384615
Min length3

Unique

Unique1 ?
Unique (%)3.8%

Sample

1st row전문대학
2nd row전문대학
3rd row전문대학
4th row대학교
5th row대학교

Common Values

ValueCountFrequency (%)
대학교 12
46.2%
전문대학 10
38.5%
기능대학 3
 
11.5%
원격대학 1
 
3.8%

Length

2023-12-11T08:35:07.458210image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T08:35:07.557496image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
대학교 12
46.2%
전문대학 10
38.5%
기능대학 3
 
11.5%
원격대학 1
 
3.8%
Distinct3
Distinct (%)11.5%
Missing0
Missing (%)0.0%
Memory size340.0 B
사립
15 
국립
공립

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row사립
2nd row공립
3rd row사립
4th row사립
5th row사립

Common Values

ValueCountFrequency (%)
사립 15
57.7%
국립 9
34.6%
공립 2
 
7.7%

Length

2023-12-11T08:35:07.695762image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T08:35:07.807506image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
사립 15
57.7%
국립 9
34.6%
공립 2
 
7.7%

시설명
Text

UNIQUE 

Distinct26
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size340.0 B
2023-12-11T08:35:07.987289image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length16
Median length14
Mean length7.8846154
Min length5

Characters and Unicode

Total characters205
Distinct characters57
Distinct categories3 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique26 ?
Unique (%)100.0%

Sample

1st row거제대학교
2nd row경남도립거창대학
3rd row한국승강기대학교
4th row인제대학교
5th row가야대학교
ValueCountFrequency (%)
부산대학교 2
 
6.2%
한국폴리텍대학 2
 
6.2%
거제대학교 1
 
3.1%
진주교육대학교 1
 
3.1%
한국폴리텍대학ⅶ 1
 
3.1%
창원문성대학교 1
 
3.1%
마산대학교 1
 
3.1%
창신대학교 1
 
3.1%
경남대학교 1
 
3.1%
창원대학교 1
 
3.1%
Other values (20) 20
62.5%
2023-12-11T08:35:08.369025image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
28
 
13.7%
27
 
13.2%
22
 
10.7%
8
 
3.9%
6
 
2.9%
6
 
2.9%
6
 
2.9%
5
 
2.4%
5
 
2.4%
5
 
2.4%
Other values (47) 87
42.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 198
96.6%
Space Separator 6
 
2.9%
Letter Number 1
 
0.5%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
28
 
14.1%
27
 
13.6%
22
 
11.1%
8
 
4.0%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
5
 
2.5%
5
 
2.5%
Other values (45) 81
40.9%
Space Separator
ValueCountFrequency (%)
6
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 198
96.6%
Common 6
 
2.9%
Latin 1
 
0.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
28
 
14.1%
27
 
13.6%
22
 
11.1%
8
 
4.0%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
5
 
2.5%
5
 
2.5%
Other values (45) 81
40.9%
Common
ValueCountFrequency (%)
6
100.0%
Latin
ValueCountFrequency (%)
1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 198
96.6%
ASCII 6
 
2.9%
Number Forms 1
 
0.5%

Most frequent character per block

Hangul
ValueCountFrequency (%)
28
 
14.1%
27
 
13.6%
22
 
11.1%
8
 
4.0%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
5
 
2.5%
5
 
2.5%
Other values (45) 81
40.9%
ASCII
ValueCountFrequency (%)
6
100.0%
Number Forms
ValueCountFrequency (%)
1
100.0%

시설구분명
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)7.7%
Missing0
Missing (%)0.0%
Memory size340.0 B
본교
24 
캠퍼스
 
2

Length

Max length3
Median length2
Mean length2.0769231
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row본교
2nd row본교
3rd row본교
4th row본교
5th row본교

Common Values

ValueCountFrequency (%)
본교 24
92.3%
캠퍼스 2
 
7.7%

Length

2023-12-11T08:35:08.510840image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-11T08:35:08.604088image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
본교 24
92.3%
캠퍼스 2
 
7.7%
Distinct26
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size340.0 B
2023-12-11T08:35:08.793172image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length28
Median length25
Mean length19.730769
Min length15

Characters and Unicode

Total characters513
Distinct characters74
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique26 ?
Unique (%)100.0%

Sample

1st row경상남도 거제시 마전1길 91
2nd row경상남도 거창군 거창읍 거창대학로 72
3rd row경상남도 거창군 거창읍 운정1길 120
4th row경상남도 김해시 인제로 197
5th row경상남도 김해시 삼계로 208
ValueCountFrequency (%)
경상남도 26
22.0%
진주시 7
 
5.9%
창원시 6
 
5.1%
김해시 4
 
3.4%
양산시 3
 
2.5%
91 2
 
1.7%
마산회원구 2
 
1.7%
의창구 2
 
1.7%
진주대로 2
 
1.7%
거창읍 2
 
1.7%
Other values (61) 62
52.5%
2023-12-11T08:35:09.160519image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
93
18.1%
30
 
5.8%
27
 
5.3%
26
 
5.1%
26
 
5.1%
23
 
4.5%
23
 
4.5%
1 15
 
2.9%
14
 
2.7%
2 14
 
2.7%
Other values (64) 222
43.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 331
64.5%
Space Separator 93
 
18.1%
Decimal Number 86
 
16.8%
Dash Punctuation 3
 
0.6%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
30
 
9.1%
27
 
8.2%
26
 
7.9%
26
 
7.9%
23
 
6.9%
23
 
6.9%
14
 
4.2%
13
 
3.9%
11
 
3.3%
10
 
3.0%
Other values (52) 128
38.7%
Decimal Number
ValueCountFrequency (%)
1 15
17.4%
2 14
16.3%
8 11
12.8%
9 11
12.8%
6 8
9.3%
0 7
8.1%
5 6
 
7.0%
4 5
 
5.8%
3 5
 
5.8%
7 4
 
4.7%
Space Separator
ValueCountFrequency (%)
93
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 331
64.5%
Common 182
35.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
30
 
9.1%
27
 
8.2%
26
 
7.9%
26
 
7.9%
23
 
6.9%
23
 
6.9%
14
 
4.2%
13
 
3.9%
11
 
3.3%
10
 
3.0%
Other values (52) 128
38.7%
Common
ValueCountFrequency (%)
93
51.1%
1 15
 
8.2%
2 14
 
7.7%
8 11
 
6.0%
9 11
 
6.0%
6 8
 
4.4%
0 7
 
3.8%
5 6
 
3.3%
4 5
 
2.7%
3 5
 
2.7%
Other values (2) 7
 
3.8%

Most occurring blocks

ValueCountFrequency (%)
Hangul 331
64.5%
ASCII 182
35.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
93
51.1%
1 15
 
8.2%
2 14
 
7.7%
8 11
 
6.0%
9 11
 
6.0%
6 8
 
4.4%
0 7
 
3.8%
5 6
 
3.3%
4 5
 
2.7%
3 5
 
2.7%
Other values (2) 7
 
3.8%
Hangul
ValueCountFrequency (%)
30
 
9.1%
27
 
8.2%
26
 
7.9%
26
 
7.9%
23
 
6.9%
23
 
6.9%
14
 
4.2%
13
 
3.9%
11
 
3.3%
10
 
3.0%
Other values (52) 128
38.7%
Distinct26
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size340.0 B
2023-12-11T08:35:09.445937image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length28
Median length23
Mean length19.153846
Min length15

Characters and Unicode

Total characters498
Distinct characters78
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique26 ?
Unique (%)100.0%

Sample

1st row경상남도 거제시 장승포동 654-1
2nd row경상남도 거창군 거창읍 김천리 164
3rd row경상남도 거창군 거창읍 송정리 700
4th row경상남도 김해시 어방동 607
5th row경상남도 김해시 삼계동 60
ValueCountFrequency (%)
경상남도 26
22.2%
진주시 7
 
6.0%
창원시 6
 
5.1%
김해시 4
 
3.4%
양산시 3
 
2.6%
의창구 2
 
1.7%
마산회원구 2
 
1.7%
가좌동 2
 
1.7%
거창읍 2
 
1.7%
거창군 2
 
1.7%
Other values (61) 61
52.1%
2023-12-11T08:35:10.116798image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
91
18.3%
30
 
6.0%
28
 
5.6%
26
 
5.2%
26
 
5.2%
23
 
4.6%
19
 
3.8%
1 18
 
3.6%
13
 
2.6%
0 12
 
2.4%
Other values (68) 212
42.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 311
62.4%
Space Separator 91
 
18.3%
Decimal Number 86
 
17.3%
Dash Punctuation 10
 
2.0%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
30
 
9.6%
28
 
9.0%
26
 
8.4%
26
 
8.4%
23
 
7.4%
19
 
6.1%
13
 
4.2%
12
 
3.9%
9
 
2.9%
9
 
2.9%
Other values (56) 116
37.3%
Decimal Number
ValueCountFrequency (%)
1 18
20.9%
0 12
14.0%
2 11
12.8%
7 9
10.5%
8 8
9.3%
6 7
 
8.1%
9 7
 
8.1%
4 6
 
7.0%
5 6
 
7.0%
3 2
 
2.3%
Space Separator
ValueCountFrequency (%)
91
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 10
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 311
62.4%
Common 187
37.6%

Most frequent character per script

Hangul
ValueCountFrequency (%)
30
 
9.6%
28
 
9.0%
26
 
8.4%
26
 
8.4%
23
 
7.4%
19
 
6.1%
13
 
4.2%
12
 
3.9%
9
 
2.9%
9
 
2.9%
Other values (56) 116
37.3%
Common
ValueCountFrequency (%)
91
48.7%
1 18
 
9.6%
0 12
 
6.4%
2 11
 
5.9%
- 10
 
5.3%
7 9
 
4.8%
8 8
 
4.3%
6 7
 
3.7%
9 7
 
3.7%
4 6
 
3.2%
Other values (2) 8
 
4.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 311
62.4%
ASCII 187
37.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
91
48.7%
1 18
 
9.6%
0 12
 
6.4%
2 11
 
5.9%
- 10
 
5.3%
7 9
 
4.8%
8 8
 
4.3%
6 7
 
3.7%
9 7
 
3.7%
4 6
 
3.2%
Other values (2) 8
 
4.3%
Hangul
ValueCountFrequency (%)
30
 
9.6%
28
 
9.0%
26
 
8.4%
26
 
8.4%
23
 
7.4%
19
 
6.1%
13
 
4.2%
12
 
3.9%
9
 
2.9%
9
 
2.9%
Other values (56) 116
37.3%

소재지우편번호
Real number (ℝ)

HIGH CORRELATION  MISSING 

Distinct25
Distinct (%)100.0%
Missing1
Missing (%)3.8%
Infinite0
Infinite (%)0.0%
Mean51637.36
Minimum50141
Maximum53325
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size366.0 B
2023-12-11T08:35:10.300439image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum50141
5-th percentile50210.2
Q150811
median51410
Q352673
95-th percentile52832
Maximum53325
Range3184
Interquartile range (IQR)1862

Descriptive statistics

Standard deviation1019.6683
Coefficient of variation (CV)0.019746717
Kurtosis-1.5502008
Mean51637.36
Median Absolute Deviation (MAD)947
Skewness0.093846535
Sum1290934
Variance1039723.5
MonotonicityNot monotonic
2023-12-11T08:35:10.413841image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=25)
ValueCountFrequency (%)
53325 1
 
3.8%
50147 1
 
3.8%
51518 1
 
3.8%
51410 1
 
3.8%
51217 1
 
3.8%
51352 1
 
3.8%
51767 1
 
3.8%
51140 1
 
3.8%
52727 1
 
3.8%
52766 1
 
3.8%
Other values (15) 15
57.7%
ValueCountFrequency (%)
50141 1
3.8%
50147 1
3.8%
50463 1
3.8%
50515 1
3.8%
50578 1
3.8%
50612 1
3.8%
50811 1
3.8%
50830 1
3.8%
50834 1
3.8%
51140 1
3.8%
ValueCountFrequency (%)
53325 1
3.8%
52833 1
3.8%
52828 1
3.8%
52821 1
3.8%
52766 1
3.8%
52727 1
3.8%
52673 1
3.8%
52655 1
3.8%
52549 1
3.8%
52422 1
3.8%

Interactions

2023-12-11T08:35:06.850163image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-11T08:35:10.504773image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
시군명학교구분명공사립구분명시설명시설구분명소재지도로명주소소재지지번주소소재지우편번호
시군명1.0000.0000.8491.0000.6821.0001.0000.970
학교구분명0.0001.0000.4471.0000.0001.0001.0000.000
공사립구분명0.8490.4471.0001.0000.1801.0001.0000.713
시설명1.0001.0001.0001.0001.0001.0001.0001.000
시설구분명0.6820.0000.1801.0001.0001.0001.0000.426
소재지도로명주소1.0001.0001.0001.0001.0001.0001.0001.000
소재지지번주소1.0001.0001.0001.0001.0001.0001.0001.000
소재지우편번호0.9700.0000.7131.0000.4261.0001.0001.000
2023-12-11T08:35:10.621187image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
공사립구분명학교구분명시군명시설구분명
공사립구분명1.0000.4270.4760.284
학교구분명0.4271.0000.0000.000
시군명0.4760.0001.0000.576
시설구분명0.2840.0000.5761.000
2023-12-11T08:35:10.712304image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
소재지우편번호시군명학교구분명공사립구분명시설구분명
소재지우편번호1.0000.7100.0000.0000.359
시군명0.7101.0000.0000.4760.576
학교구분명0.0000.0001.0000.4270.000
공사립구분명0.0000.4760.4271.0000.284
시설구분명0.3590.5760.0000.2841.000

Missing values

2023-12-11T08:35:06.958547image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-11T08:35:07.084012image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

시군명학교구분명공사립구분명시설명시설구분명소재지도로명주소소재지지번주소소재지우편번호
0거제시전문대학사립거제대학교본교경상남도 거제시 마전1길 91경상남도 거제시 장승포동 654-153325
1거창군전문대학공립경남도립거창대학본교경상남도 거창군 거창읍 거창대학로 72경상남도 거창군 거창읍 김천리 16450147
2거창군전문대학사립한국승강기대학교본교경상남도 거창군 거창읍 운정1길 120경상남도 거창군 거창읍 송정리 70050141
3김해시대학교사립인제대학교본교경상남도 김해시 인제로 197경상남도 김해시 어방동 60750834
4김해시대학교사립가야대학교본교경상남도 김해시 삼계로 208경상남도 김해시 삼계동 6050830
5김해시대학교사립부산장신대학교본교경상남도 김해시 김해대로 1894-68경상남도 김해시 구산동 764<NA>
6김해시전문대학사립김해대학교본교경상남도 김해시 삼안로 112번길 198경상남도 김해시 삼방동 산77-950811
7남해군전문대학공립경남도립남해대학본교경상남도 남해군 남해읍 화전로78번길 30경상남도 남해군 남해읍 남변리 19552422
8밀양시대학교국립부산대학교 밀양캠퍼스캠퍼스경상남도 밀양시 삼랑진읍 삼랑진로 1268-50경상남도 밀양시 삼랑진읍 숭진리 산18150463
9사천시기능대학국립한국폴리텍대학 항공캠퍼스본교경상남도 사천시 대학길 46경상남도 사천시 이금동 43852549
시군명학교구분명공사립구분명시설명시설구분명소재지도로명주소소재지지번주소소재지우편번호
16진주시전문대학사립연암공과대학교본교경상남도 진주시 진주대로629번길 35경상남도 진주시 가좌동 78052821
17진주시전문대학사립진주보건대학교본교경상남도 진주시 의병로 51경상남도 진주시 상봉동 114252655
18진주시기능대학국립한국폴리텍대학 진주캠퍼스본교경상남도 진주시 모덕로 299경상남도 진주시 하대동 10552766
19진주시원격대학국립한국방송통신대학교 경남지역대학본교경상남도 진주시 진주대로 824경상남도 진주시 주약동 8552727
20창원시대학교국립창원대학교본교경상남도 창원시 의창구 창원대학로 20경상남도 창원시 의창구 퇴촌동 998-251140
21창원시대학교사립경남대학교본교경상남도 창원시 마산합포구 경남대학로 7경상남도 창원시 마산합포구 월영동 500-251767
22창원시대학교사립창신대학교본교경상남도 창원시 마산회원구 팔용로 262경상남도 창원시 마산회원구 합성2동 151352
23창원시전문대학사립마산대학교본교경상남도 창원시 마산회원구 내서읍 함마대로 2640경상남도 창원시 마산회원구 내서읍 용담리 181-151217
24창원시전문대학사립창원문성대학교본교경상남도 창원시 의창구 충혼로 91경상남도 창원시 의창구 두대동 196-251410
25창원시기능대학국립한국폴리텍대학Ⅶ 창원캠퍼스본교경상남도 창원시 성산구 외동반림로 51-88경상남도 창원시 성산구 중앙동 110-151518