Overview

Dataset statistics

Number of variables5
Number of observations43
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory1.9 KiB
Average record size in memory45.1 B

Variable types

Categorical1
Numeric2
Boolean1
Text1

Dataset

Description한국사학진흥재단 고등교육재정지원 게시판 정보(게시판명, 게시글 번호, 패스워드 사용여부, 제목, 조회수)의 정보를 제공
URLhttps://www.data.go.kr/data/15120371/fileData.do

Alerts

패스워드 사용여부 has constant value ""Constant
게시글 번호 is highly overall correlated with 조회수 and 1 other fieldsHigh correlation
조회수 is highly overall correlated with 게시글 번호High correlation
게시판명 is highly overall correlated with 게시글 번호High correlation

Reproduction

Analysis started2023-12-12 16:29:27.525057
Analysis finished2023-12-12 16:29:28.235522
Duration0.71 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

게시판명
Categorical

HIGH CORRELATION 

Distinct8
Distinct (%)18.6%
Missing0
Missing (%)0.0%
Memory size476.0 B
자료실
15 
공지사항
10 
FAQ
10 
QnA
고등교육 재정지원의 확보
 
1
Other values (3)

Length

Max length18
Median length3
Mean length4.0697674
Min length3

Unique

Unique4 ?
Unique (%)9.3%

Sample

1st row공지사항
2nd row공지사항
3rd row공지사항
4th row자료실
5th row자료실

Common Values

ValueCountFrequency (%)
자료실 15
34.9%
공지사항 10
23.3%
FAQ 10
23.3%
QnA 4
 
9.3%
고등교육 재정지원의 확보 1
 
2.3%
고등교육 재정지원의 배분 및 지출 1
 
2.3%
고등교육 재정지원의 성과 1
 
2.3%
이슈분석 1
 
2.3%

Length

2023-12-13T01:29:28.328800image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:29:28.488562image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
자료실 15
29.4%
공지사항 10
19.6%
faq 10
19.6%
qna 4
 
7.8%
고등교육 3
 
5.9%
재정지원의 3
 
5.9%
확보 1
 
2.0%
배분 1
 
2.0%
1
 
2.0%
지출 1
 
2.0%
Other values (2) 2
 
3.9%

게시글 번호
Real number (ℝ)

HIGH CORRELATION 

Distinct10
Distinct (%)23.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean5.6744186
Minimum3
Maximum13
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size519.0 B
2023-12-13T01:29:28.644630image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum3
5-th percentile3
Q14
median4
Q37
95-th percentile10.9
Maximum13
Range10
Interquartile range (IQR)3

Descriptive statistics

Standard deviation2.7405329
Coefficient of variation (CV)0.48296276
Kurtosis0.11704182
Mean5.6744186
Median Absolute Deviation (MAD)1
Skewness1.021012
Sum244
Variance7.5105205
MonotonicityNot monotonic
2023-12-13T01:29:28.778148image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=10)
ValueCountFrequency (%)
4 15
34.9%
3 9
20.9%
6 5
 
11.6%
9 5
 
11.6%
7 4
 
9.3%
8 1
 
2.3%
10 1
 
2.3%
11 1
 
2.3%
12 1
 
2.3%
13 1
 
2.3%
ValueCountFrequency (%)
3 9
20.9%
4 15
34.9%
6 5
 
11.6%
7 4
 
9.3%
8 1
 
2.3%
9 5
 
11.6%
10 1
 
2.3%
11 1
 
2.3%
12 1
 
2.3%
13 1
 
2.3%
ValueCountFrequency (%)
13 1
 
2.3%
12 1
 
2.3%
11 1
 
2.3%
10 1
 
2.3%
9 5
 
11.6%
8 1
 
2.3%
7 4
 
9.3%
6 5
 
11.6%
4 15
34.9%
3 9
20.9%

패스워드 사용여부
Boolean

CONSTANT 

Distinct1
Distinct (%)2.3%
Missing0
Missing (%)0.0%
Memory size175.0 B
False
43 
ValueCountFrequency (%)
False 43
100.0%
2023-12-13T01:29:28.888638image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

제목
Text

Distinct39
Distinct (%)90.7%
Missing0
Missing (%)0.0%
Memory size476.0 B
2023-12-13T01:29:29.192052image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length49
Median length37
Mean length25.627907
Min length4

Characters and Unicode

Total characters1102
Distinct characters168
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique37 ?
Unique (%)86.0%

Sample

1st row고등교육 재정지원 정보시스템이 오픈
2nd row고등교육 재정지원 정보시스템 자료요청시 참고사항(자료요청서 첨부)
3rd row고등교육 재정지원 정보시스템 새이름 공모 당선자 발표
4th row2012. 10. 19 고등교육 재정지원 정보시스템 사업설명회 자료
5th row2016년 지자체 조사양식 및 지침서
ValueCountFrequency (%)
고등교육 20
 
8.3%
재정지원 18
 
7.5%
6
 
2.5%
2014년 5
 
2.1%
어떻게 5
 
2.1%
사업 5
 
2.1%
2010 5
 
2.1%
정보시스템 5
 
2.1%
통계 3
 
1.2%
설명서 3
 
1.2%
Other values (139) 165
68.8%
2023-12-13T01:29:29.766722image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
198
 
18.0%
40
 
3.6%
37
 
3.4%
0 29
 
2.6%
2 26
 
2.4%
1 26
 
2.4%
22
 
2.0%
22
 
2.0%
22
 
2.0%
21
 
1.9%
Other values (158) 659
59.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 758
68.8%
Space Separator 198
 
18.0%
Decimal Number 97
 
8.8%
Other Punctuation 26
 
2.4%
Open Punctuation 9
 
0.8%
Close Punctuation 9
 
0.8%
Uppercase Letter 3
 
0.3%
Dash Punctuation 2
 
0.2%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
40
 
5.3%
37
 
4.9%
22
 
2.9%
22
 
2.9%
22
 
2.9%
21
 
2.8%
21
 
2.8%
20
 
2.6%
20
 
2.6%
20
 
2.6%
Other values (137) 513
67.7%
Decimal Number
ValueCountFrequency (%)
0 29
29.9%
2 26
26.8%
1 26
26.8%
4 5
 
5.2%
3 4
 
4.1%
5 2
 
2.1%
6 2
 
2.1%
7 1
 
1.0%
8 1
 
1.0%
9 1
 
1.0%
Other Punctuation
ValueCountFrequency (%)
. 12
46.2%
? 8
30.8%
, 4
 
15.4%
' 2
 
7.7%
Uppercase Letter
ValueCountFrequency (%)
F 1
33.3%
D 1
33.3%
P 1
33.3%
Space Separator
ValueCountFrequency (%)
198
100.0%
Open Punctuation
ValueCountFrequency (%)
( 9
100.0%
Close Punctuation
ValueCountFrequency (%)
) 9
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 2
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 758
68.8%
Common 341
30.9%
Latin 3
 
0.3%

Most frequent character per script

Hangul
ValueCountFrequency (%)
40
 
5.3%
37
 
4.9%
22
 
2.9%
22
 
2.9%
22
 
2.9%
21
 
2.8%
21
 
2.8%
20
 
2.6%
20
 
2.6%
20
 
2.6%
Other values (137) 513
67.7%
Common
ValueCountFrequency (%)
198
58.1%
0 29
 
8.5%
2 26
 
7.6%
1 26
 
7.6%
. 12
 
3.5%
( 9
 
2.6%
) 9
 
2.6%
? 8
 
2.3%
4 5
 
1.5%
, 4
 
1.2%
Other values (8) 15
 
4.4%
Latin
ValueCountFrequency (%)
F 1
33.3%
D 1
33.3%
P 1
33.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 758
68.8%
ASCII 344
31.2%

Most frequent character per block

ASCII
ValueCountFrequency (%)
198
57.6%
0 29
 
8.4%
2 26
 
7.6%
1 26
 
7.6%
. 12
 
3.5%
( 9
 
2.6%
) 9
 
2.6%
? 8
 
2.3%
4 5
 
1.5%
, 4
 
1.2%
Other values (11) 18
 
5.2%
Hangul
ValueCountFrequency (%)
40
 
5.3%
37
 
4.9%
22
 
2.9%
22
 
2.9%
22
 
2.9%
21
 
2.8%
21
 
2.8%
20
 
2.6%
20
 
2.6%
20
 
2.6%
Other values (137) 513
67.7%

조회수
Real number (ℝ)

HIGH CORRELATION 

Distinct41
Distinct (%)95.3%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean1016.2093
Minimum2
Maximum4254
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size519.0 B
2023-12-13T01:29:29.921894image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum2
5-th percentile4.2
Q120
median334
Q31409.5
95-th percentile3599.7
Maximum4254
Range4252
Interquartile range (IQR)1389.5

Descriptive statistics

Standard deviation1390.2208
Coefficient of variation (CV)1.3680457
Kurtosis-0.21622377
Mean1016.2093
Median Absolute Deviation (MAD)326
Skewness1.1884517
Sum43697
Variance1932713.8
MonotonicityNot monotonic
2023-12-13T01:29:30.064479image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=41)
ValueCountFrequency (%)
7 2
 
4.7%
22 2
 
4.7%
882 1
 
2.3%
4254 1
 
2.3%
2993 1
 
2.3%
442 1
 
2.3%
3406 1
 
2.3%
40 1
 
2.3%
3 1
 
2.3%
2 1
 
2.3%
Other values (31) 31
72.1%
ValueCountFrequency (%)
2 1
2.3%
3 1
2.3%
4 1
2.3%
6 1
2.3%
7 2
4.7%
8 1
2.3%
9 1
2.3%
12 1
2.3%
16 1
2.3%
18 1
2.3%
ValueCountFrequency (%)
4254 1
2.3%
3943 1
2.3%
3601 1
2.3%
3588 1
2.3%
3406 1
2.3%
3165 1
2.3%
3134 1
2.3%
3034 1
2.3%
2993 1
2.3%
2864 1
2.3%

Interactions

2023-12-13T01:29:27.922537image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T01:29:27.751123image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T01:29:28.020678image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T01:29:27.835207image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T01:29:30.157878image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
게시판명게시글 번호제목조회수
게시판명1.0000.9700.0000.000
게시글 번호0.9701.0000.0000.000
제목0.0000.0001.0000.890
조회수0.0000.0000.8901.000
2023-12-13T01:29:30.273271image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
게시글 번호조회수게시판명
게시글 번호1.000-0.8960.900
조회수-0.8961.0000.000
게시판명0.9000.0001.000

Missing values

2023-12-13T01:29:28.109877image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T01:29:28.195690image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

게시판명게시글 번호패스워드 사용여부제목조회수
0공지사항3N고등교육 재정지원 정보시스템이 오픈882
1공지사항3N고등교육 재정지원 정보시스템 자료요청시 참고사항(자료요청서 첨부)3943
2공지사항3N고등교육 재정지원 정보시스템 새이름 공모 당선자 발표3601
3자료실4N2012. 10. 19 고등교육 재정지원 정보시스템 사업설명회 자료909
4자료실4N2016년 지자체 조사양식 및 지침서3034
5자료실4N2012년 고등교육 재정지원 사용자 설명서1238
6QnA7N3-가. 지원대상 선정 및 사업비 배분 방식 관련 문의49
7자료실4N2012년 고등교육 재정지원 지침서(중앙정부,지자체)334
8공지사항3N하이에듀 포트 통계 산출 기준 변경으로 인한 2010, 2011년 통계 변경 안내3588
9자료실4N2013년 고등교육 재정지원 사용자 설명서320
게시판명게시글 번호패스워드 사용여부제목조회수
33자료실4N2014년 고등교육 재정지원 정보 조사 사업 설명회 자료(지방자치단체)240
34자료실4N2014년 고등교육 재정지원 정보 조사 사업 설명회 자료(중앙부처)377
35공지사항8N고등교육 재정지원 정보시스템 이용안내90
36FAQ9N하이에듀포트에서 오픈되는 자료가 정부 과제 신청시 평가 등에 유의미한 자료로 쓰이나요?8
37FAQ9N고등교육 재정지원의 사업의 정확한 정의가 무엇인가요?18
38고등교육 재정지원의 확보10N20107
39고등교육 재정지원의 배분 및 지출11N20106
40고등교육 재정지원의 성과12N20104
41이슈분석13N20107
42공지사항3N2018년 오픈 예정 '고등교육 재정정보 통합공시시스템'의 새이름 공모542