Overview

Dataset statistics

Number of variables5
Number of observations64
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory2.7 KiB
Average record size in memory43.1 B

Variable types

Numeric1
Categorical3
Text1

Dataset

Description전국의 사립의과대학 부속병원 현황 데이터. 연번(NO),학교명,학교소재지,부속병원명,부속병원소재지 항목 데이터.
Author교육부
URLhttps://www.data.go.kr/data/15098238/fileData.do

Alerts

연번(NO) is highly overall correlated with 학교명High correlation
학교명 is highly overall correlated with 연번(NO) and 2 other fieldsHigh correlation
학교소재지 is highly overall correlated with 학교명 and 1 other fieldsHigh correlation
부속병원소재지 is highly overall correlated with 학교명 and 1 other fieldsHigh correlation
연번(NO) has unique valuesUnique
부속병원명 has unique valuesUnique

Reproduction

Analysis started2023-12-12 06:04:30.943612
Analysis finished2023-12-12 06:04:31.472204
Duration0.53 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

연번(NO)
Real number (ℝ)

HIGH CORRELATION  UNIQUE 

Distinct64
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean32.5
Minimum1
Maximum64
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size708.0 B
2023-12-12T15:04:31.540304image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile4.15
Q116.75
median32.5
Q348.25
95-th percentile60.85
Maximum64
Range63
Interquartile range (IQR)31.5

Descriptive statistics

Standard deviation18.618987
Coefficient of variation (CV)0.5728919
Kurtosis-1.2
Mean32.5
Median Absolute Deviation (MAD)16
Skewness0
Sum2080
Variance346.66667
MonotonicityStrictly increasing
2023-12-12T15:04:31.683830image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
1.6%
34 1
 
1.6%
36 1
 
1.6%
37 1
 
1.6%
38 1
 
1.6%
39 1
 
1.6%
40 1
 
1.6%
41 1
 
1.6%
42 1
 
1.6%
43 1
 
1.6%
Other values (54) 54
84.4%
ValueCountFrequency (%)
1 1
1.6%
2 1
1.6%
3 1
1.6%
4 1
1.6%
5 1
1.6%
6 1
1.6%
7 1
1.6%
8 1
1.6%
9 1
1.6%
10 1
1.6%
ValueCountFrequency (%)
64 1
1.6%
63 1
1.6%
62 1
1.6%
61 1
1.6%
60 1
1.6%
59 1
1.6%
58 1
1.6%
57 1
1.6%
56 1
1.6%
55 1
1.6%

학교명
Categorical

HIGH CORRELATION 

Distinct30
Distinct (%)46.9%
Missing0
Missing (%)0.0%
Memory size644.0 B
가톨릭대학교
인제대학교
한림대학교
연세대학교
순천향대학교
Other values (25)
39 

Length

Max length15
Median length5
Mean length5.828125
Min length5

Unique

Unique14 ?
Unique (%)21.9%

Sample

1st row가천대학교
2nd row가톨릭관동대학교
3rd row가톨릭대학교
4th row가톨릭대학교
5th row가톨릭대학교

Common Values

ValueCountFrequency (%)
가톨릭대학교 8
 
12.5%
인제대학교 5
 
7.8%
한림대학교 4
 
6.2%
연세대학교 4
 
6.2%
순천향대학교 4
 
6.2%
한양대학교 3
 
4.7%
계명대학교 3
 
4.7%
고려대학교 3
 
4.7%
원광대학교 2
 
3.1%
건국대학교(의전원) 2
 
3.1%
Other values (20) 26
40.6%

Length

2023-12-12T15:04:31.858016image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
가톨릭대학교 8
 
12.3%
연세대학교 5
 
7.7%
인제대학교 5
 
7.7%
한림대학교 4
 
6.2%
순천향대학교 4
 
6.2%
한양대학교 3
 
4.6%
계명대학교 3
 
4.6%
고려대학교 3
 
4.6%
대구가톨릭대학교 2
 
3.1%
동국대학교 2
 
3.1%
Other values (20) 26
40.0%

학교소재지
Categorical

HIGH CORRELATION 

Distinct16
Distinct (%)25.0%
Missing0
Missing (%)0.0%
Memory size644.0 B
서울
23 
대구
부산
천안
춘천
Other values (11)
18 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique6 ?
Unique (%)9.4%

Sample

1st row경기
2nd row강원
3rd row서울
4th row서울
5th row서울

Common Values

ValueCountFrequency (%)
서울 23
35.9%
대구 7
 
10.9%
부산 7
 
10.9%
천안 5
 
7.8%
춘천 4
 
6.2%
경기 3
 
4.7%
대전 3
 
4.7%
충북 2
 
3.1%
경주 2
 
3.1%
익산 2
 
3.1%
Other values (6) 6
 
9.4%

Length

2023-12-12T15:04:31.981256image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
서울 23
35.9%
대구 7
 
10.9%
부산 7
 
10.9%
천안 5
 
7.8%
춘천 4
 
6.2%
경기 3
 
4.7%
대전 3
 
4.7%
충북 2
 
3.1%
경주 2
 
3.1%
익산 2
 
3.1%
Other values (6) 6
 
9.4%

부속병원명
Text

UNIQUE 

Distinct64
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Memory size644.0 B
2023-12-12T15:04:32.212122image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length33
Median length17
Mean length13.3125
Min length6

Characters and Unicode

Total characters852
Distinct characters107
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique64 ?
Unique (%)100.0%

Sample

1st row가천대부속 동인천길병원
2nd row가톨릭관동대학교 국제성모병원
3rd row가톨릭대학교 성빈센트병원
4th row가톨릭대학교 여의도성모병원
5th row가톨릭대학교 은평성모병원
ValueCountFrequency (%)
의과대학 14
 
9.2%
부속 11
 
7.2%
가톨릭대학교 8
 
5.3%
병원 8
 
5.3%
인제대학교 5
 
3.3%
연세대학교 4
 
2.6%
순천향대학교 4
 
2.6%
학교법인 4
 
2.6%
한양대학교 3
 
2.0%
계명대학교 3
 
2.0%
Other values (81) 88
57.9%
2023-12-12T15:04:32.574959image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
88
 
10.3%
84
 
9.9%
83
 
9.7%
73
 
8.6%
65
 
7.6%
65
 
7.6%
21
 
2.5%
20
 
2.3%
17
 
2.0%
15
 
1.8%
Other values (97) 321
37.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 762
89.4%
Space Separator 88
 
10.3%
Open Punctuation 1
 
0.1%
Close Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
84
 
11.0%
83
 
10.9%
73
 
9.6%
65
 
8.5%
65
 
8.5%
21
 
2.8%
20
 
2.6%
17
 
2.2%
15
 
2.0%
15
 
2.0%
Other values (94) 304
39.9%
Space Separator
ValueCountFrequency (%)
88
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 762
89.4%
Common 90
 
10.6%

Most frequent character per script

Hangul
ValueCountFrequency (%)
84
 
11.0%
83
 
10.9%
73
 
9.6%
65
 
8.5%
65
 
8.5%
21
 
2.8%
20
 
2.6%
17
 
2.2%
15
 
2.0%
15
 
2.0%
Other values (94) 304
39.9%
Common
ValueCountFrequency (%)
88
97.8%
( 1
 
1.1%
) 1
 
1.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 762
89.4%
ASCII 90
 
10.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
88
97.8%
( 1
 
1.1%
) 1
 
1.1%
Hangul
ValueCountFrequency (%)
84
 
11.0%
83
 
10.9%
73
 
9.6%
65
 
8.5%
65
 
8.5%
21
 
2.8%
20
 
2.6%
17
 
2.2%
15
 
2.0%
15
 
2.0%
Other values (94) 304
39.9%

부속병원소재지
Categorical

HIGH CORRELATION 

Distinct14
Distinct (%)21.9%
Missing0
Missing (%)0.0%
Memory size644.0 B
서울
21 
경기
14 
대구
경북
인천
Other values (9)
15 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique6 ?
Unique (%)9.4%

Sample

1st row인천
2nd row인천
3rd row경기
4th row서울
5th row서울

Common Values

ValueCountFrequency (%)
서울 21
32.8%
경기 14
21.9%
대구 5
 
7.8%
경북 5
 
7.8%
인천 4
 
6.2%
부산 4
 
6.2%
대전 3
 
4.7%
충남 2
 
3.1%
충북 1
 
1.6%
경남 1
 
1.6%
Other values (4) 4
 
6.2%

Length

2023-12-12T15:04:32.708687image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
서울 21
32.8%
경기 14
21.9%
대구 5
 
7.8%
경북 5
 
7.8%
인천 4
 
6.2%
부산 4
 
6.2%
대전 3
 
4.7%
충남 2
 
3.1%
충북 1
 
1.6%
경남 1
 
1.6%
Other values (4) 4
 
6.2%

Interactions

2023-12-12T15:04:31.217309image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T15:04:32.773183image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연번(NO)학교명학교소재지부속병원명부속병원소재지
연번(NO)1.0000.9840.7361.0000.344
학교명0.9841.0001.0001.0000.943
학교소재지0.7361.0001.0001.0000.927
부속병원명1.0001.0001.0001.0001.000
부속병원소재지0.3440.9430.9271.0001.000
2023-12-12T15:04:32.856275image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
부속병원소재지학교소재지학교명
부속병원소재지1.0000.6480.541
학교소재지0.6481.0000.842
학교명0.5410.8421.000
2023-12-12T15:04:32.934269image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
연번(NO)학교명학교소재지부속병원소재지
연번(NO)1.0000.6350.3710.127
학교명0.6351.0000.8420.541
학교소재지0.3710.8421.0000.648
부속병원소재지0.1270.5410.6481.000

Missing values

2023-12-12T15:04:31.344078image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T15:04:31.434980image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

연번(NO)학교명학교소재지부속병원명부속병원소재지
01가천대학교경기가천대부속 동인천길병원인천
12가톨릭관동대학교강원가톨릭관동대학교 국제성모병원인천
23가톨릭대학교서울가톨릭대학교 성빈센트병원경기
34가톨릭대학교서울가톨릭대학교 여의도성모병원서울
45가톨릭대학교서울가톨릭대학교 은평성모병원서울
56가톨릭대학교서울가톨릭대학교 부천성모병원경기
67가톨릭대학교서울가톨릭대학교 의정부성모병원경기
78가톨릭대학교서울가톨릭대학교 인천성모병원인천
89가톨릭대학교서울학교법인가톨릭학원 가톨릭대학교 대전성모병원대전
910가톨릭대학교서울가톨릭대학교 서울성모병원서울
연번(NO)학교명학교소재지부속병원명부속병원소재지
5455조선대학교광주조선대학교 병원광주
5556중앙대학교서울중앙대학교 병원서울
5657차의과학대학교(의전원)포천차의과학대학교 부속 구미차병원경북
5758한림대학교춘천강남성심병원서울
5859한림대학교춘천한강성심병원서울
5960한림대학교춘천동탄성심병원경기
6061한림대학교춘천한림대학교 성심병원경기
6162한양대학교서울한양대학교 구리병원경기
6263한양대학교서울한양대학교 병원서울
6364한양대학교서울한양대학교 류마티스병원서울