Overview

Dataset statistics

Number of variables3
Number of observations98
Missing cells0
Missing cells (%)0.0%
Duplicate rows1
Duplicate rows (%)1.0%
Total size in memory2.5 KiB
Average record size in memory26.3 B

Variable types

Numeric1
Categorical1
Text1

Dataset

Description한국연구재단이 보유하고있는 성과마루 시스템에 있는 성과소개 상세 논문 데이터 입니다. 대표 데이터는 성과번호, 출원등록 등이 있습니다.
Author한국연구재단
URLhttps://www.data.go.kr/data/15093401/fileData.do

Alerts

Dataset has 1 (1.0%) duplicate rowsDuplicates

Reproduction

Analysis started2023-12-12 14:16:38.438085
Analysis finished2023-12-12 14:16:38.976883
Duration0.54 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

성과번호
Real number (ℝ)

Distinct8
Distinct (%)8.2%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2.2244898
Minimum1
Maximum22
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1014.0 B
2023-12-12T23:16:39.047242image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile1
Q11
median1
Q31
95-th percentile12.9
Maximum22
Range21
Interquartile range (IQR)0

Descriptive statistics

Standard deviation4.3114104
Coefficient of variation (CV)1.938157
Kurtosis13.647567
Mean2.2244898
Median Absolute Deviation (MAD)0
Skewness3.8616205
Sum218
Variance18.58826
MonotonicityNot monotonic
2023-12-12T23:16:39.175809image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=8)
ValueCountFrequency (%)
1 78
79.6%
2 14
 
14.3%
12 1
 
1.0%
18 1
 
1.0%
19 1
 
1.0%
20 1
 
1.0%
21 1
 
1.0%
22 1
 
1.0%
ValueCountFrequency (%)
1 78
79.6%
2 14
 
14.3%
12 1
 
1.0%
18 1
 
1.0%
19 1
 
1.0%
20 1
 
1.0%
21 1
 
1.0%
22 1
 
1.0%
ValueCountFrequency (%)
22 1
 
1.0%
21 1
 
1.0%
20 1
 
1.0%
19 1
 
1.0%
18 1
 
1.0%
12 1
 
1.0%
2 14
 
14.3%
1 78
79.6%

출원등록
Categorical

Distinct2
Distinct (%)2.0%
Missing0
Missing (%)0.0%
Memory size916.0 B
전용
49 
통상
49 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row전용
2nd row전용
3rd row전용
4th row전용
5th row통상

Common Values

ValueCountFrequency (%)
전용 49
50.0%
통상 49
50.0%

Length

2023-12-12T23:16:39.345318image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-12T23:16:39.488712image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
전용 49
50.0%
통상 49
50.0%
Distinct97
Distinct (%)99.0%
Missing0
Missing (%)0.0%
Memory size916.0 B
2023-12-12T23:16:39.829323image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length105
Median length46
Mean length35.622449
Min length6

Characters and Unicode

Total characters3491
Distinct characters414
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique96 ?
Unique (%)98.0%

Sample

1st row갈륨나이트라이드기판의 제조방법
2nd row파네실 전이효소 저해제 및 이의 유도체, 이들의 제조방법 및 이들을 함유하는 조성물
3rd row신생혈관유도현상 억제활성을 갖는 계피유래의 신남 알데하이드 유도체, 이의 제조방법 및 이를 함유하는 조성물
4th row밀의 물추출물을 이용한 활성 밀가루 제조 관련 특허
5th row"분자설계 도킹기술로 수행한 단백질-단백질 상호작용 모델구축 기술"
ValueCountFrequency (%)
36
 
4.6%
이용한 20
 
2.6%
기술 16
 
2.1%
위한 9
 
1.2%
개발 9
 
1.2%
방법 7
 
0.9%
제조방법 7
 
0.9%
기술이전 7
 
0.9%
진단용 5
 
0.6%
용도 4
 
0.5%
Other values (529) 659
84.6%
2023-12-12T23:16:40.429432image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
686
 
19.7%
83
 
2.4%
79
 
2.3%
57
 
1.6%
51
 
1.5%
45
 
1.3%
42
 
1.2%
41
 
1.2%
37
 
1.1%
36
 
1.0%
Other values (404) 2334
66.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2353
67.4%
Space Separator 686
 
19.7%
Lowercase Letter 124
 
3.6%
Decimal Number 123
 
3.5%
Uppercase Letter 100
 
2.9%
Other Punctuation 44
 
1.3%
Dash Punctuation 19
 
0.5%
Close Punctuation 19
 
0.5%
Open Punctuation 19
 
0.5%
Math Symbol 2
 
0.1%
Other values (2) 2
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
83
 
3.5%
79
 
3.4%
57
 
2.4%
51
 
2.2%
45
 
1.9%
42
 
1.8%
41
 
1.7%
37
 
1.6%
36
 
1.5%
36
 
1.5%
Other values (337) 1846
78.5%
Lowercase Letter
ValueCountFrequency (%)
o 15
12.1%
a 14
11.3%
l 11
 
8.9%
e 10
 
8.1%
r 9
 
7.3%
n 9
 
7.3%
i 7
 
5.6%
c 6
 
4.8%
s 5
 
4.0%
t 5
 
4.0%
Other values (13) 33
26.6%
Uppercase Letter
ValueCountFrequency (%)
A 9
 
9.0%
S 8
 
8.0%
D 8
 
8.0%
G 8
 
8.0%
R 7
 
7.0%
E 7
 
7.0%
M 6
 
6.0%
L 6
 
6.0%
T 6
 
6.0%
O 5
 
5.0%
Other values (11) 30
30.0%
Decimal Number
ValueCountFrequency (%)
0 36
29.3%
1 22
17.9%
2 21
17.1%
5 11
 
8.9%
9 9
 
7.3%
6 8
 
6.5%
3 5
 
4.1%
7 4
 
3.3%
4 4
 
3.3%
8 3
 
2.4%
Other Punctuation
ValueCountFrequency (%)
, 20
45.5%
. 10
22.7%
/ 5
 
11.4%
" 5
 
11.4%
: 3
 
6.8%
; 1
 
2.3%
Space Separator
ValueCountFrequency (%)
686
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 19
100.0%
Close Punctuation
ValueCountFrequency (%)
) 19
100.0%
Open Punctuation
ValueCountFrequency (%)
( 19
100.0%
Math Symbol
ValueCountFrequency (%)
~ 2
100.0%
Final Punctuation
ValueCountFrequency (%)
1
100.0%
Initial Punctuation
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2353
67.4%
Common 914
 
26.2%
Latin 224
 
6.4%

Most frequent character per script

Hangul
ValueCountFrequency (%)
83
 
3.5%
79
 
3.4%
57
 
2.4%
51
 
2.2%
45
 
1.9%
42
 
1.8%
41
 
1.7%
37
 
1.6%
36
 
1.5%
36
 
1.5%
Other values (337) 1846
78.5%
Latin
ValueCountFrequency (%)
o 15
 
6.7%
a 14
 
6.2%
l 11
 
4.9%
e 10
 
4.5%
r 9
 
4.0%
A 9
 
4.0%
n 9
 
4.0%
S 8
 
3.6%
D 8
 
3.6%
G 8
 
3.6%
Other values (34) 123
54.9%
Common
ValueCountFrequency (%)
686
75.1%
0 36
 
3.9%
1 22
 
2.4%
2 21
 
2.3%
, 20
 
2.2%
- 19
 
2.1%
) 19
 
2.1%
( 19
 
2.1%
5 11
 
1.2%
. 10
 
1.1%
Other values (13) 51
 
5.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2353
67.4%
ASCII 1136
32.5%
Punctuation 2
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
686
60.4%
0 36
 
3.2%
1 22
 
1.9%
2 21
 
1.8%
, 20
 
1.8%
- 19
 
1.7%
) 19
 
1.7%
( 19
 
1.7%
o 15
 
1.3%
a 14
 
1.2%
Other values (55) 265
 
23.3%
Hangul
ValueCountFrequency (%)
83
 
3.5%
79
 
3.4%
57
 
2.4%
51
 
2.2%
45
 
1.9%
42
 
1.8%
41
 
1.7%
37
 
1.6%
36
 
1.5%
36
 
1.5%
Other values (337) 1846
78.5%
Punctuation
ValueCountFrequency (%)
1
50.0%
1
50.0%

Interactions

2023-12-12T23:16:38.693655image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-12T23:16:40.545600image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
성과번호출원등록실시기술명
성과번호1.0000.0951.000
출원등록0.0951.0001.000
실시기술명1.0001.0001.000
2023-12-12T23:16:40.660964image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
성과번호출원등록
성과번호1.0000.060
출원등록0.0601.000

Missing values

2023-12-12T23:16:38.815363image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T23:16:38.926821image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

성과번호출원등록실시기술명
01전용갈륨나이트라이드기판의 제조방법
12전용파네실 전이효소 저해제 및 이의 유도체, 이들의 제조방법 및 이들을 함유하는 조성물
22전용신생혈관유도현상 억제활성을 갖는 계피유래의 신남 알데하이드 유도체, 이의 제조방법 및 이를 함유하는 조성물
31전용밀의 물추출물을 이용한 활성 밀가루 제조 관련 특허
41통상"분자설계 도킹기술로 수행한 단백질-단백질 상호작용 모델구축 기술"
51전용새로운 개념의 골다공증 질환 치료약 개발
61전용도시유역 물순환 해석모형 판매 및 노하우
71전용폐공을 활용한 지하수 정화 및 재활용 장치(국내전용)
81전용강변여과수 청소기술(국내전용)
91전용누수저감 최적운영 시스템 기술
성과번호출원등록실시기술명
881통상인터넷중독 예방을 위한 상담 전문가시스템
891통상오픈 소스 기반 클라우드 플랫폼 기술
901전용하이브리드 비좌굴가새를 이용한 고층건물의 풍진동 제어기술 개발
911통상디지털 데이터 복원 기술
921전용세포사멸 수용체 5 (DR5)에 특이적으로 결합하는 항체 및 이를 포함하는 암 예방 또는 치료용 조성물
931전용신경신호기반 제어장치 및 신경신호기반 제어방법에 관한 기술이전 협약 - 락싸 (2010,04)
942통상한국형 중,상층 항공난류예측시스템 개발을 위한 기술이전 (기상청)
952전용대전-전사 시스템의 유전체를 포함한 방전특성 해석(삼성전자,11.09.01~12.08.31)
962전용상수도 환경에 적합한 낙뢰피해 저감기술 연구(12.05.01~13.12.31)
971통상저점도 토출이 가능한 고속디스펜서 시스템 개발

Duplicate rows

Most frequently occurring

성과번호출원등록실시기술명# duplicates
01통상모바일 통합형 생체인식기 (이동형 다중 바이오 인식 프로토타입 시스템을 개발하였으며, 이 시스템은 지문 인식 업체인 디젠트사에 기술이전 함 (2009년 5월 25일))2