Overview

Dataset statistics

Number of variables8
Number of observations26
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory1.8 KiB
Average record size in memory69.9 B

Variable types

Categorical4
Text3
Numeric1

Dataset

Description경상남도 전문 및 대학교 현황에 대한 데이터로 시군명, 학교구분명, 공사립구분명, 시설명, 시설구분명, 소재지주소, 우편번호 등의 항목을 제공합니다.
Author경상남도
URLhttps://www.data.go.kr/data/15089465/fileData.do

Alerts

소재지우편번호 is highly overall correlated with 시군명High correlation
시군명 is highly overall correlated with 소재지우편번호 and 1 other fieldsHigh correlation
시설구분명 is highly overall correlated with 시군명High correlation
시설구분명 is highly imbalanced (60.9%)Imbalance
시설명 has unique valuesUnique
소재지도로명주소 has unique valuesUnique
소재지지번주소 has unique valuesUnique
소재지우편번호 has unique valuesUnique

Reproduction

Analysis started2024-03-14 09:49:52.664381
Analysis finished2024-03-14 09:49:54.042219
Duration1.38 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

시군명
Categorical

HIGH CORRELATION 

Distinct9
Distinct (%)34.6%
Missing0
Missing (%)0.0%
Memory size336.0 B
진주시
창원시
김해시
양산시
거창군
Other values (4)

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique4 ?
Unique (%)15.4%

Sample

1st row거제시
2nd row거창군
3rd row거창군
4th row김해시
5th row김해시

Common Values

ValueCountFrequency (%)
진주시 7
26.9%
창원시 6
23.1%
김해시 4
15.4%
양산시 3
11.5%
거창군 2
 
7.7%
거제시 1
 
3.8%
남해군 1
 
3.8%
밀양시 1
 
3.8%
사천시 1
 
3.8%

Length

2024-03-14T18:49:54.153766image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-14T18:49:54.356324image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
진주시 7
26.9%
창원시 6
23.1%
김해시 4
15.4%
양산시 3
11.5%
거창군 2
 
7.7%
거제시 1
 
3.8%
남해군 1
 
3.8%
밀양시 1
 
3.8%
사천시 1
 
3.8%

학교구분명
Categorical

Distinct4
Distinct (%)15.4%
Missing0
Missing (%)0.0%
Memory size336.0 B
대학교
12 
전문대학
10 
기능대학
원격대학
 
1

Length

Max length4
Median length4
Mean length3.5384615
Min length3

Unique

Unique1 ?
Unique (%)3.8%

Sample

1st row전문대학
2nd row전문대학
3rd row전문대학
4th row대학교
5th row대학교

Common Values

ValueCountFrequency (%)
대학교 12
46.2%
전문대학 10
38.5%
기능대학 3
 
11.5%
원격대학 1
 
3.8%

Length

2024-03-14T18:49:54.601802image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-14T18:49:54.784606image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
대학교 12
46.2%
전문대학 10
38.5%
기능대학 3
 
11.5%
원격대학 1
 
3.8%
Distinct3
Distinct (%)11.5%
Missing0
Missing (%)0.0%
Memory size336.0 B
사립
15 
국립
공립

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row사립
2nd row공립
3rd row사립
4th row사립
5th row사립

Common Values

ValueCountFrequency (%)
사립 15
57.7%
국립 9
34.6%
공립 2
 
7.7%

Length

2024-03-14T18:49:54.974349image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-14T18:49:55.227002image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
사립 15
57.7%
국립 9
34.6%
공립 2
 
7.7%

시설명
Text

UNIQUE 

Distinct26
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size336.0 B
2024-03-14T18:49:55.900733image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length16
Median length14
Mean length7.8846154
Min length5

Characters and Unicode

Total characters205
Distinct characters57
Distinct categories3 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique26 ?
Unique (%)100.0%

Sample

1st row거제대학교
2nd row경남도립거창대학
3rd row한국승강기대학교
4th row인제대학교
5th row가야대학교
ValueCountFrequency (%)
부산대학교 2
 
6.2%
한국폴리텍대학 2
 
6.2%
거제대학교 1
 
3.1%
진주교육대학교 1
 
3.1%
한국폴리텍대학ⅶ 1
 
3.1%
창원문성대학교 1
 
3.1%
마산대학교 1
 
3.1%
창신대학교 1
 
3.1%
경남대학교 1
 
3.1%
창원대학교 1
 
3.1%
Other values (20) 20
62.5%
2024-03-14T18:49:56.902035image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
28
 
13.7%
27
 
13.2%
22
 
10.7%
8
 
3.9%
6
 
2.9%
6
 
2.9%
6
 
2.9%
5
 
2.4%
5
 
2.4%
5
 
2.4%
Other values (47) 87
42.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 198
96.6%
Space Separator 6
 
2.9%
Letter Number 1
 
0.5%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
28
 
14.1%
27
 
13.6%
22
 
11.1%
8
 
4.0%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
5
 
2.5%
5
 
2.5%
Other values (45) 81
40.9%
Space Separator
ValueCountFrequency (%)
6
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 198
96.6%
Common 6
 
2.9%
Latin 1
 
0.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
28
 
14.1%
27
 
13.6%
22
 
11.1%
8
 
4.0%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
5
 
2.5%
5
 
2.5%
Other values (45) 81
40.9%
Common
ValueCountFrequency (%)
6
100.0%
Latin
ValueCountFrequency (%)
1
100.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 198
96.6%
ASCII 6
 
2.9%
Number Forms 1
 
0.5%

Most frequent character per block

Hangul
ValueCountFrequency (%)
28
 
14.1%
27
 
13.6%
22
 
11.1%
8
 
4.0%
6
 
3.0%
6
 
3.0%
5
 
2.5%
5
 
2.5%
5
 
2.5%
5
 
2.5%
Other values (45) 81
40.9%
ASCII
ValueCountFrequency (%)
6
100.0%
Number Forms
ValueCountFrequency (%)
1
100.0%

시설구분명
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)7.7%
Missing0
Missing (%)0.0%
Memory size336.0 B
본교
24 
캠퍼스
 
2

Length

Max length3
Median length2
Mean length2.0769231
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row본교
2nd row본교
3rd row본교
4th row본교
5th row본교

Common Values

ValueCountFrequency (%)
본교 24
92.3%
캠퍼스 2
 
7.7%

Length

2024-03-14T18:49:57.126277image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-14T18:49:57.293222image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
본교 24
92.3%
캠퍼스 2
 
7.7%
Distinct26
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size336.0 B
2024-03-14T18:49:58.090358image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length28
Median length25
Mean length19.730769
Min length15

Characters and Unicode

Total characters513
Distinct characters74
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique26 ?
Unique (%)100.0%

Sample

1st row경상남도 거제시 마전1길 91
2nd row경상남도 거창군 거창읍 거창대학로 72
3rd row경상남도 거창군 거창읍 운정1길 120
4th row경상남도 김해시 인제로 197
5th row경상남도 김해시 삼계로 208
ValueCountFrequency (%)
경상남도 26
22.0%
진주시 7
 
5.9%
창원시 6
 
5.1%
김해시 4
 
3.4%
양산시 3
 
2.5%
거창군 2
 
1.7%
거창읍 2
 
1.7%
진주대로 2
 
1.7%
성산구 2
 
1.7%
91 2
 
1.7%
Other values (61) 62
52.5%
2024-03-14T18:49:59.164682image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
93
18.1%
30
 
5.8%
27
 
5.3%
26
 
5.1%
26
 
5.1%
23
 
4.5%
23
 
4.5%
1 15
 
2.9%
2 14
 
2.7%
13
 
2.5%
Other values (64) 223
43.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 331
64.5%
Space Separator 93
 
18.1%
Decimal Number 86
 
16.8%
Dash Punctuation 3
 
0.6%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
30
 
9.1%
27
 
8.2%
26
 
7.9%
26
 
7.9%
23
 
6.9%
23
 
6.9%
13
 
3.9%
13
 
3.9%
11
 
3.3%
10
 
3.0%
Other values (52) 129
39.0%
Decimal Number
ValueCountFrequency (%)
1 15
17.4%
2 14
16.3%
8 11
12.8%
9 11
12.8%
6 8
9.3%
0 7
8.1%
5 6
 
7.0%
4 5
 
5.8%
3 5
 
5.8%
7 4
 
4.7%
Space Separator
ValueCountFrequency (%)
93
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 331
64.5%
Common 182
35.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
30
 
9.1%
27
 
8.2%
26
 
7.9%
26
 
7.9%
23
 
6.9%
23
 
6.9%
13
 
3.9%
13
 
3.9%
11
 
3.3%
10
 
3.0%
Other values (52) 129
39.0%
Common
ValueCountFrequency (%)
93
51.1%
1 15
 
8.2%
2 14
 
7.7%
8 11
 
6.0%
9 11
 
6.0%
6 8
 
4.4%
0 7
 
3.8%
5 6
 
3.3%
4 5
 
2.7%
3 5
 
2.7%
Other values (2) 7
 
3.8%

Most occurring blocks

ValueCountFrequency (%)
Hangul 331
64.5%
ASCII 182
35.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
93
51.1%
1 15
 
8.2%
2 14
 
7.7%
8 11
 
6.0%
9 11
 
6.0%
6 8
 
4.4%
0 7
 
3.8%
5 6
 
3.3%
4 5
 
2.7%
3 5
 
2.7%
Other values (2) 7
 
3.8%
Hangul
ValueCountFrequency (%)
30
 
9.1%
27
 
8.2%
26
 
7.9%
26
 
7.9%
23
 
6.9%
23
 
6.9%
13
 
3.9%
13
 
3.9%
11
 
3.3%
10
 
3.0%
Other values (52) 129
39.0%
Distinct26
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size336.0 B
2024-03-14T18:50:00.019015image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length28
Median length23
Mean length19.115385
Min length15

Characters and Unicode

Total characters497
Distinct characters78
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique26 ?
Unique (%)100.0%

Sample

1st row경상남도 거제시 장승포동 654-1
2nd row경상남도 거창군 거창읍 김천리 164
3rd row경상남도 거창군 거창읍 송정리 700
4th row경상남도 김해시 어방동 607
5th row경상남도 김해시 삼계동 60
ValueCountFrequency (%)
경상남도 26
22.2%
진주시 7
 
6.0%
창원시 6
 
5.1%
김해시 4
 
3.4%
양산시 3
 
2.6%
의창구 2
 
1.7%
마산회원구 2
 
1.7%
가좌동 2
 
1.7%
거창읍 2
 
1.7%
거창군 2
 
1.7%
Other values (61) 61
52.1%
2024-03-14T18:50:01.400779image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
91
18.3%
30
 
6.0%
28
 
5.6%
26
 
5.2%
26
 
5.2%
23
 
4.6%
19
 
3.8%
1 18
 
3.6%
0 15
 
3.0%
13
 
2.6%
Other values (68) 208
41.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 311
62.6%
Space Separator 91
 
18.3%
Decimal Number 85
 
17.1%
Dash Punctuation 10
 
2.0%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
30
 
9.6%
28
 
9.0%
26
 
8.4%
26
 
8.4%
23
 
7.4%
19
 
6.1%
13
 
4.2%
12
 
3.9%
9
 
2.9%
9
 
2.9%
Other values (56) 116
37.3%
Decimal Number
ValueCountFrequency (%)
1 18
21.2%
0 15
17.6%
2 10
11.8%
7 8
9.4%
4 7
 
8.2%
8 7
 
8.2%
9 6
 
7.1%
5 6
 
7.1%
6 6
 
7.1%
3 2
 
2.4%
Space Separator
ValueCountFrequency (%)
91
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 10
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 311
62.6%
Common 186
37.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
30
 
9.6%
28
 
9.0%
26
 
8.4%
26
 
8.4%
23
 
7.4%
19
 
6.1%
13
 
4.2%
12
 
3.9%
9
 
2.9%
9
 
2.9%
Other values (56) 116
37.3%
Common
ValueCountFrequency (%)
91
48.9%
1 18
 
9.7%
0 15
 
8.1%
- 10
 
5.4%
2 10
 
5.4%
7 8
 
4.3%
4 7
 
3.8%
8 7
 
3.8%
9 6
 
3.2%
5 6
 
3.2%
Other values (2) 8
 
4.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 311
62.6%
ASCII 186
37.4%

Most frequent character per block

ASCII
ValueCountFrequency (%)
91
48.9%
1 18
 
9.7%
0 15
 
8.1%
- 10
 
5.4%
2 10
 
5.4%
7 8
 
4.3%
4 7
 
3.8%
8 7
 
3.8%
9 6
 
3.2%
5 6
 
3.2%
Other values (2) 8
 
4.3%
Hangul
ValueCountFrequency (%)
30
 
9.6%
28
 
9.0%
26
 
8.4%
26
 
8.4%
23
 
7.4%
19
 
6.1%
13
 
4.2%
12
 
3.9%
9
 
2.9%
9
 
2.9%
Other values (56) 116
37.3%

소재지우편번호
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct26
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean51608.154
Minimum50141
Maximum53325
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size362.0 B
2024-03-14T18:50:01.793759image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum50141
5-th percentile50226
Q150815.75
median51381
Q352668.5
95-th percentile52831.75
Maximum53325
Range3184
Interquartile range (IQR)1852.75

Descriptive statistics

Standard deviation1010.1781
Coefficient of variation (CV)0.019574001
Kurtosis-1.5232998
Mean51608.154
Median Absolute Deviation (MAD)894.5
Skewness0.16749462
Sum1341812
Variance1020459.7
MonotonicityNot monotonic
2024-03-14T18:50:02.173955image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=26)
ValueCountFrequency (%)
53325 1
 
3.8%
52673 1
 
3.8%
51518 1
 
3.8%
51410 1
 
3.8%
51217 1
 
3.8%
51352 1
 
3.8%
51767 1
 
3.8%
51140 1
 
3.8%
52727 1
 
3.8%
52766 1
 
3.8%
Other values (16) 16
61.5%
ValueCountFrequency (%)
50141 1
3.8%
50147 1
3.8%
50463 1
3.8%
50510 1
3.8%
50578 1
3.8%
50612 1
3.8%
50811 1
3.8%
50830 1
3.8%
50834 1
3.8%
50883 1
3.8%
ValueCountFrequency (%)
53325 1
3.8%
52833 1
3.8%
52828 1
3.8%
52821 1
3.8%
52766 1
3.8%
52727 1
3.8%
52673 1
3.8%
52655 1
3.8%
52549 1
3.8%
52422 1
3.8%

Interactions

2024-03-14T18:49:53.188861image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-03-14T18:50:02.435491image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
시군명학교구분명공사립구분명시설명시설구분명소재지도로명주소소재지지번주소소재지우편번호
시군명1.0000.0000.8491.0000.6821.0001.0000.971
학교구분명0.0001.0000.4471.0000.0001.0001.0000.000
공사립구분명0.8490.4471.0001.0000.1801.0001.0000.750
시설명1.0001.0001.0001.0001.0001.0001.0001.000
시설구분명0.6820.0000.1801.0001.0001.0001.0000.447
소재지도로명주소1.0001.0001.0001.0001.0001.0001.0001.000
소재지지번주소1.0001.0001.0001.0001.0001.0001.0001.000
소재지우편번호0.9710.0000.7501.0000.4471.0001.0001.000
2024-03-14T18:50:02.733638image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
공사립구분명시군명학교구분명시설구분명
공사립구분명1.0000.4760.4270.284
시군명0.4761.0000.0000.576
학교구분명0.4270.0001.0000.000
시설구분명0.2840.5760.0001.000
2024-03-14T18:50:02.995205image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
소재지우편번호시군명학교구분명공사립구분명시설구분명
소재지우편번호1.0000.7170.0000.0940.380
시군명0.7171.0000.0000.4760.576
학교구분명0.0000.0001.0000.4270.000
공사립구분명0.0940.4760.4271.0000.284
시설구분명0.3800.5760.0000.2841.000

Missing values

2024-03-14T18:49:53.538768image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-14T18:49:53.944416image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

시군명학교구분명공사립구분명시설명시설구분명소재지도로명주소소재지지번주소소재지우편번호
0거제시전문대학사립거제대학교본교경상남도 거제시 마전1길 91경상남도 거제시 장승포동 654-153325
1거창군전문대학공립경남도립거창대학본교경상남도 거창군 거창읍 거창대학로 72경상남도 거창군 거창읍 김천리 16450147
2거창군전문대학사립한국승강기대학교본교경상남도 거창군 거창읍 운정1길 120경상남도 거창군 거창읍 송정리 70050141
3김해시대학교사립인제대학교본교경상남도 김해시 인제로 197경상남도 김해시 어방동 60750834
4김해시대학교사립가야대학교본교경상남도 김해시 삼계로 208경상남도 김해시 삼계동 6050830
5김해시대학교사립부산장신대학교본교경상남도 김해시 김해대로 1894-68경상남도 김해시 구산동 76450883
6김해시전문대학사립김해대학교본교경상남도 김해시 삼안로 112번길 198경상남도 김해시 삼방동 산77-950811
7남해군전문대학공립경남도립남해대학본교경상남도 남해군 남해읍 화전로78번길 30경상남도 남해군 남해읍 남변리 19552422
8밀양시대학교국립부산대학교 밀양캠퍼스캠퍼스경상남도 밀양시 삼랑진읍 삼랑진로 1268-50경상남도 밀양시 삼랑진읍 숭진리 산18150463
9사천시기능대학국립한국폴리텍대학 항공캠퍼스본교경상남도 사천시 대학길 46경상남도 사천시 이금동 43852549
시군명학교구분명공사립구분명시설명시설구분명소재지도로명주소소재지지번주소소재지우편번호
16진주시전문대학사립연암공과대학교본교경상남도 진주시 진주대로629번길 35경상남도 진주시 가좌동 78052821
17진주시전문대학사립진주보건대학교본교경상남도 진주시 의병로 51경상남도 진주시 상봉동 114252655
18진주시기능대학국립한국폴리텍대학 진주캠퍼스본교경상남도 진주시 모덕로 299경상남도 진주시 하대동 10552766
19진주시원격대학국립한국방송통신대학교 경남지역대학본교경상남도 진주시 진주대로 824경상남도 진주시 주약동 8552727
20창원시대학교국립창원대학교본교경상남도 창원시 의창구 창원대학로 20경상남도 창원시 의창구 퇴촌동 998-251140
21창원시대학교사립경남대학교본교경상남도 창원시 마산합포구 경남대학로 7경상남도 창원시 마산합포구 월영동 500-251767
22창원시대학교사립창신대학교본교경상남도 창원시 마산회원구 팔용로 262경상남도 창원시 마산회원구 합성동 151352
23창원시전문대학사립마산대학교본교경상남도 창원시 마산회원구 내서읍 함마대로 2640경상남도 창원시 마산회원구 내서읍 용담리 181-151217
24창원시전문대학사립창원문성대학교본교경상남도 창원시 성산구 충혼로 91경상남도 창원시 의창구 두대동 210-451410
25창원시기능대학국립한국폴리텍대학Ⅶ 창원캠퍼스본교경상남도 창원시 성산구 외동반림로 51-88경상남도 창원시 성산구 중앙동 110-151518