Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 322.3 KiB |
Average record size in memory | 33.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 1 |
Dataset
Description | 한국연구재단이 보유하고있는 기초학문자료센터 시스템에 있는 논문, 저역서 저자 정보 입니다. 대표 데이터로는 저자SEQ_NUM, 저자구분 등이 있습니다. |
---|---|
Author | 한국연구재단 |
URL | https://www.data.go.kr/data/15092385/fileData.do |
순서 is highly overall correlated with 저자(SEQ_NUM) | High correlation |
저자(SEQ_NUM) is highly overall correlated with 순서 | High correlation |
순서 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 23:01:26.337000 |
---|---|
Analysis finished | 2023-12-12 23:03:47.374457 |
Duration | 2 minutes and 21.04 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
순서
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 50132.162 |
Minimum | 4 |
---|---|
Maximum | 99999 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 4 |
---|---|
5-th percentile | 5128.6 |
Q1 | 25102.5 |
median | 50620 |
Q3 | 74594.75 |
95-th percentile | 95338.2 |
Maximum | 99999 |
Range | 99995 |
Interquartile range (IQR) | 49492.25 |
Descriptive statistics
Standard deviation | 28797.703 |
---|---|
Coefficient of variation (CV) | 0.57443569 |
Kurtosis | -1.184375 |
Mean | 50132.162 |
Median Absolute Deviation (MAD) | 24874 |
Skewness | -0.0023009064 |
Sum | 5.0132162 × 108 |
Variance | 8.293077 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
26456 | 1 | < 0.1% |
27572 | 1 | < 0.1% |
57068 | 1 | < 0.1% |
88634 | 1 | < 0.1% |
96240 | 1 | < 0.1% |
94125 | 1 | < 0.1% |
23609 | 1 | < 0.1% |
23020 | 1 | < 0.1% |
772 | 1 | < 0.1% |
76373 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
4 | 1 | |
15 | 1 | |
17 | 1 | |
50 | 1 | |
53 | 1 | |
63 | 1 | |
70 | 1 | |
72 | 1 | |
93 | 1 | |
95 | 1 |
Value | Count | Frequency (%) |
99999 | 1 | |
99985 | 1 | |
99984 | 1 | |
99979 | 1 | |
99975 | 1 | |
99974 | 1 | |
99946 | 1 | |
99941 | 1 | |
99936 | 1 | |
99929 | 1 |
저자(SEQ_NUM)
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 8384 |
---|---|
Distinct (%) | 83.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 61087.842 |
Minimum | 2 |
---|---|
Maximum | 91859 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 22751.9 |
Q1 | 53276 |
median | 64094.5 |
Q3 | 76026.75 |
95-th percentile | 89310.05 |
Maximum | 91859 |
Range | 91857 |
Interquartile range (IQR) | 22750.75 |
Descriptive statistics
Standard deviation | 20329.741 |
---|---|
Coefficient of variation (CV) | 0.3327952 |
Kurtosis | -0.54272275 |
Mean | 61087.842 |
Median Absolute Deviation (MAD) | 11292.5 |
Skewness | -0.61910433 |
Sum | 6.1087842 × 108 |
Variance | 4.1329836 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
77894 | 7 | 0.1% |
58049 | 7 | 0.1% |
69141 | 7 | 0.1% |
80746 | 6 | 0.1% |
56165 | 6 | 0.1% |
52218 | 5 | 0.1% |
58631 | 5 | 0.1% |
76733 | 5 | 0.1% |
74705 | 5 | 0.1% |
58278 | 5 | 0.1% |
Other values (8374) | 9942 |
Value | Count | Frequency (%) |
2 | 1 | |
1074 | 1 | |
1374 | 1 | |
5225 | 1 | |
8282 | 1 | |
10203 | 1 | |
10641 | 2 | |
13816 | 2 | |
19363 | 1 | |
20121 | 2 |
Value | Count | Frequency (%) |
91859 | 1 | |
91854 | 2 | |
91852 | 1 | |
91847 | 1 | |
91846 | 1 | |
91836 | 1 | |
91832 | 1 | |
91827 | 1 | |
91823 | 1 | |
91821 | 2 |
저자구분
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
공저자 | |
---|---|
주저자 | |
교신저자 | |
공동저자 | 11 |
연구책임자 | 8 |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.1371 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공저자 |
---|---|
2nd row | 주저자 |
3rd row | 공저자 |
4th row | 공저자 |
5th row | 공저자 |
Common Values
Value | Count | Frequency (%) |
공저자 | 6305 | |
주저자 | 2332 | 23.3% |
교신저자 | 1344 | 13.4% |
공동저자 | 11 | 0.1% |
연구책임자 | 8 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
공저자 | 6305 | |
주저자 | 2332 | 23.3% |
교신저자 | 1344 | 13.4% |
공동저자 | 11 | 0.1% |
연구책임자 | 8 | 0.1% |
순서 | 저자(SEQ_NUM) | 저자구분 | |
---|---|---|---|
순서 | 1.000 | 0.975 | 0.311 |
저자(SEQ_NUM) | 0.975 | 1.000 | 0.323 |
저자구분 | 0.311 | 0.323 | 1.000 |
순서 | 저자(SEQ_NUM) | 저자구분 | |
---|---|---|---|
순서 | 1.000 | 1.000 | 0.134 |
저자(SEQ_NUM) | 1.000 | 1.000 | 0.000 |
저자구분 | 0.134 | 0.000 | 1.000 |
순서 | 저자(SEQ_NUM) | 저자구분 | |
---|---|---|---|
26455 | 26456 | 53956 | 공저자 |
55934 | 55935 | 66198 | 주저자 |
35826 | 35827 | 57850 | 공저자 |
5969 | 5970 | 23150 | 공저자 |
24647 | 24648 | 53094 | 공저자 |
36127 | 36128 | 57985 | 교신저자 |
16401 | 16402 | 31591 | 주저자 |
83235 | 83236 | 81260 | 공저자 |
18197 | 18198 | 35782 | 공저자 |
6375 | 6376 | 23326 | 공저자 |
순서 | 저자(SEQ_NUM) | 저자구분 | |
---|---|---|---|
65667 | 65668 | 71427 | 공저자 |
42949 | 42950 | 60940 | 주저자 |
73172 | 73173 | 75152 | 교신저자 |
58784 | 58785 | 67555 | 공저자 |
9907 | 9908 | 24629 | 공저자 |
23950 | 23951 | 52800 | 공저자 |
30539 | 30540 | 55685 | 교신저자 |
91140 | 91141 | 86746 | 교신저자 |
67368 | 67369 | 72161 | 교신저자 |
67054 | 67055 | 72020 | 주저자 |