gimi9 Pandas Profiling

Dataset statistics

Number of variables	4
Number of observations	100
Missing cells	0
Missing cells (%)	0.0%
Duplicate rows	1
Duplicate rows (%)	1.0%
Total size in memory	3.4 KiB
Average record size in memory	34.3 B

Variable types

Numeric	1
Categorical	1
Text	2

Dataset

Description	수학교육 발전을 위해 기여한 교원을 발굴·포상하고 우수사례를 확산함으로써 수학교육 내실화를 추구하는 대한민국 수학교육상 목록입니다. 해당 데이터가 보유한 컬럼은 다음과 같습니다. 컬럼명 : 수상연도, 지역, 학교, 교사명
Author	한국과학창의재단
URL	https://www.data.go.kr/data/15093497/fileData.do

Alerts

Dataset has 1 (1.0%) duplicate rows

Duplicates

Reproduction

Analysis started	2023-12-12 04:27:12.153920
Analysis finished	2023-12-12 04:27:12.920927
Duration	0.77 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

수상연도
Real number (ℝ)

Distinct	7
Distinct (%)	7.0%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	2016.26

Minimum	2014
Maximum	2020
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	1.0 KiB

Quantile statistics

Minimum	2014
5-th percentile	2014
Q1	2015
median	2015.5
Q3	2018
95-th percentile	2020
Maximum	2020
Range	6
Interquartile range (IQR)	3

Descriptive statistics

Standard deviation	2.0480096
Coefficient of variation (CV)	0.0010157468
Kurtosis	-1.0759847
Mean	2016.26
Median Absolute Deviation (MAD)	1.5
Skewness	0.5475777
Sum	201626
Variance	4.1943434
Monotonicity	Not monotonic

Histogram with fixed size bins (bins=7)

Value	Count	Frequency (%)
2015	26	26.0%
2014	24	24.0%
2018	10	10.0%
2020	10	10.0%
2019	10	10.0%
2016	10	10.0%
2017	10	10.0%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
2014	24	24.0%
2015	26	26.0%
2016	10	10.0%
2017	10	10.0%
2018	10	10.0%
2019	10	10.0%
2020	10	10.0%

Value	Count	Frequency (%)
2020	10	10.0%
2019	10	10.0%
2018	10	10.0%
2017	10	10.0%
2016	10	10.0%
2015	26	26.0%
2014	24	24.0%

지역
Categorical

Distinct	17
Distinct (%)	17.0%
Missing	0
Missing (%)	0.0%
Memory size	932.0 B

경기	17
서울	11
대구	11
대전	11
인천	10
Other values (12)	40

Length

Max length	2
Median length	2
Mean length	2
Min length	2

Unique

Unique	3 ?
Unique (%)	3.0%

Sample

1st row	대전
2nd row	인천
3rd row	경기
4th row	서울
5th row	광주

Common Values

Value	Count	Frequency (%)
경기	17	17.0%
서울	11	11.0%
대구	11	11.0%
대전	11	11.0%
인천	10	10.0%
광주	6	6.0%
부산	6	6.0%
강원	5	5.0%
경북	4	4.0%
경남	4	4.0%
Other values (7)	15	15.0%

Length

Histogram of lengths of the category

Value	Count	Frequency (%)
경기	17	17.0%
대구	11	11.0%
대전	11	11.0%
서울	11	11.0%
인천	10	10.0%
광주	6	6.0%
부산	6	6.0%
강원	5	5.0%
충남	4	4.0%
경북	4	4.0%
Other values (7)	15	15.0%

학교
Text

Distinct	98
Distinct (%)	98.0%
Missing	0
Missing (%)	0.0%
Memory size	932.0 B

Length

Max length	15
Median length	12
Mean length	6.68
Min length	5

Characters and Unicode

Total characters	668
Distinct characters	122
Distinct categories	2 ?
Distinct scripts	2 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	96 ?
Unique (%)	96.0%

Sample

1st row	대신고등학교
2nd row	작전여자고등학교
3rd row	가온고등학교
4th row	반포고등학교
5th row	전남대학교사범대학 부설중학교

Value	Count	Frequency (%)
어등초등학교	2	1.8%
부설중학교	2	1.8%
강원체육고등학교	2	1.8%
초등학교	2	1.8%
가온고등학교	1	0.9%
반포고등학교	1	0.9%
대전탄방중학교	1	0.9%
김천중학교	1	0.9%
문지중학교	1	0.9%
어은중학교	1	0.9%
Other values (98)	98	87.5%

Most occurring characters

Value	Count	Frequency (%)
학	109	16.3%
교	104	15.6%
등	63	9.4%
중	39	5.8%
초	31	4.6%
고	31	4.6%
대	19	2.8%
	12	1.8%
동	11	1.6%
자	8	1.2%
Other values (112)	241	36.1%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	656	98.2%
Space Separator	12	1.8%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
학	109	16.6%
교	104	15.9%
등	63	9.6%
중	39	5.9%
초	31	4.7%
고	31	4.7%
대	19	2.9%
동	11	1.7%
자	8	1.2%
남	8	1.2%
Other values (111)	233	35.5%

Space Separator

Value	Count	Frequency (%)
	12	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	656	98.2%
Common	12	1.8%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
학	109	16.6%
교	104	15.9%
등	63	9.6%
중	39	5.9%
초	31	4.7%
고	31	4.7%
대	19	2.9%
동	11	1.7%
자	8	1.2%
남	8	1.2%
Other values (111)	233	35.5%

Common

Value	Count	Frequency (%)
	12	100.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	656	98.2%
ASCII	12	1.8%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
학	109	16.6%
교	104	15.9%
등	63	9.6%
중	39	5.9%
초	31	4.7%
고	31	4.7%
대	19	2.9%
동	11	1.7%
자	8	1.2%
남	8	1.2%
Other values (111)	233	35.5%

ASCII

Value	Count	Frequency (%)
	12	100.0%

교사명
Text

Distinct	98
Distinct (%)	98.0%
Missing	0
Missing (%)	0.0%
Memory size	932.0 B

Length

Max length	3
Median length	3
Mean length	2.99
Min length	2

Characters and Unicode

Total characters	299
Distinct characters	90
Distinct categories	2 ?
Distinct scripts	2 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	96 ?
Unique (%)	96.0%

Sample

1st row	하진수
2nd row	이현진
3rd row	신종환
4th row	박지현
5th row	이옥자

Value	Count	Frequency (%)
신은희	2	2.0%
김정주	2	2.0%
김혜진	1	1.0%
박근영	1	1.0%
최수연	1	1.0%
미	1	1.0%
주	1	1.0%
조미영	1	1.0%
안영지	1	1.0%
김형식	1	1.0%
Other values (89)	89	88.1%

Most occurring characters

Value	Count	Frequency (%)
김	28	9.4%
영	19	6.4%
정	14	4.7%
이	12	4.0%
은	11	3.7%
현	9	3.0%
최	8	2.7%
미	8	2.7%
박	7	2.3%
숙	7	2.3%
Other values (80)	176	58.9%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	298	99.7%
Space Separator	1	0.3%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
김	28	9.4%
영	19	6.4%
정	14	4.7%
이	12	4.0%
은	11	3.7%
현	9	3.0%
최	8	2.7%
미	8	2.7%
박	7	2.3%
숙	7	2.3%
Other values (79)	175	58.7%

Space Separator

Value	Count	Frequency (%)
	1	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	298	99.7%
Common	1	0.3%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
김	28	9.4%
영	19	6.4%
정	14	4.7%
이	12	4.0%
은	11	3.7%
현	9	3.0%
최	8	2.7%
미	8	2.7%
박	7	2.3%
숙	7	2.3%
Other values (79)	175	58.7%

Common

Value	Count	Frequency (%)
	1	100.0%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	298	99.7%
ASCII	1	0.3%

Most frequent character per block

Hangul

Value	Count	Frequency (%)
김	28	9.4%
영	19	6.4%
정	14	4.7%
이	12	4.0%
은	11	3.7%
현	9	3.0%
최	8	2.7%
미	8	2.7%
박	7	2.3%
숙	7	2.3%
Other values (79)	175	58.7%

ASCII

Value	Count	Frequency (%)
	1	100.0%

수상연도

수상연도

Phik (φk)
Auto

Heatmap
Table

	수상연도	지역	학교	교사명
수상연도	1.000	0.000	0.965	1.000
지역	0.000	1.000	1.000	0.986
학교	0.965	1.000	1.000	1.000
교사명	1.000	0.986	1.000	1.000

Heatmap
Table

	수상연도	지역
수상연도	1.000	0.000
지역	0.000	1.000

Count
Matrix

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

First rows
Last rows

	수상연도	지역	학교	교사명
0	2018	대전	대신고등학교	하진수
1	2018	인천	작전여자고등학교	이현진
2	2018	경기	가온고등학교	신종환
3	2018	서울	반포고등학교	박지현
4	2018	광주	전남대학교사범대학 부설중학교	이옥자
5	2018	경북	석전중학교	김희자
6	2018	인천	부평동중학교	김정란
7	2018	대구	두산초등학교	표명균
8	2018	서울	서빙고초등학교	김주숙
9	2018	서울	불암초등학교	김남준

	수상연도	지역	학교	교사명
90	2017	광주	어등초등학교	양종현
91	2017	서울	서울오류초등학교	임미인
92	2017	충남	한내여자중학교	김미영
93	2017	대구	경북대학교사범대학 부설중학교	김선혜
94	2017	대전	대전봉우중학교	송라영
95	2017	대구	동원중학교	임은영
96	2017	충남	공주 생명과학고등학교	김은숙
97	2017	경남	안의고등학교	박근영
98	2015	대구	덕원고등학교	조치연
99	2015	강원	강원체육고등학교	신은희

Most frequently occurring

	수상연도	지역	학교	교사명	# duplicates
0	2015	강원	강원체육고등학교	신은희	2

Overview

Variables

Common Values

Length

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Space Separator

Most occurring scripts

Most frequent character per script

Hangul

Common

Most occurring blocks

Most frequent character per block

Hangul

ASCII

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Space Separator

Most occurring scripts

Most frequent character per script

Hangul

Common

Most occurring blocks

Most frequent character per block

Hangul

ASCII

Interactions

Correlations

Missing values

Sample

Duplicate rows

Most frequently occurring