Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 335 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 12 |
Duplicate rows (%) | 3.6% |
Total size in memory | 16.5 KiB |
Average record size in memory | 50.4 B |
Variable types
Categorical | 4 |
---|---|
Text | 1 |
Numeric | 1 |
Dataset
Description | 한국연구재단이 보유하고있는 인재매칭플랫폼 시스템의 연도별 개인회원 연구실 회원가입현황입니다. 가입년도, 회원국적, 연구분야(대), 연구분야(중), 성별, 회원수 정보가 있습니다 |
---|---|
URL | https://www.data.go.kr/data/15117653/fileData.do |
Dataset has 12 (3.6%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-12 13:19:01.641749 |
---|---|
Analysis finished | 2023-12-12 13:19:02.337593 |
Duration | 0.7 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
가입년도
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
2020 | |
---|---|
2021 | |
2022 | |
2023 | |
2019 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 2019 |
---|---|
2nd row | 2020 |
3rd row | 2020 |
4th row | 2020 |
5th row | 2020 |
Common Values
Value | Count | Frequency (%) |
2020 | 170 | |
2021 | 70 | |
2022 | 63 | 18.8% |
2023 | 31 | 9.3% |
2019 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2020 | 170 | |
2021 | 70 | |
2022 | 63 | 18.8% |
2023 | 31 | 9.3% |
2019 | 1 | 0.3% |
회원국적
Categorical
Distinct | 43 |
---|---|
Distinct (%) | 12.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
인도 | |
---|---|
대한민국 | |
파키스탄 | |
방글라데시 | |
네팔 | |
Other values (38) |
Length
Max length | 11 |
---|---|
Median length | 7 |
Mean length | 3.2686567 |
Min length | 2 |
Unique
Unique | 18 ? |
---|---|
Unique (%) | 5.4% |
Sample
1st row | 이집트 |
---|---|
2nd row | 네팔 |
3rd row | 네팔 |
4th row | 네팔 |
5th row | 네팔 |
Common Values
Value | Count | Frequency (%) |
인도 | 105 | |
대한민국 | 55 | |
파키스탄 | 28 | 8.4% |
방글라데시 | 20 | 6.0% |
네팔 | 12 | 3.6% |
베트남 | 12 | 3.6% |
이란 | 11 | 3.3% |
나이지리아 | 10 | 3.0% |
이집트 | 10 | 3.0% |
중화인민공화국 | 9 | 2.7% |
Other values (33) | 63 |
Length
Value | Count | Frequency (%) |
인도 | 105 | |
대한민국 | 55 | |
파키스탄 | 28 | 8.4% |
방글라데시 | 20 | 6.0% |
네팔 | 12 | 3.6% |
베트남 | 12 | 3.6% |
이란 | 11 | 3.3% |
나이지리아 | 10 | 3.0% |
이집트 | 10 | 3.0% |
중화인민공화국 | 9 | 2.7% |
Other values (33) | 63 |
연구분야(대)
Categorical
Distinct | 19 |
---|---|
Distinct (%) | 5.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
생명과학 | |
---|---|
화학 | |
재료 | |
농림수산식품 | |
물리학 | |
Other values (14) |
Length
Max length | 21 |
---|---|
Median length | 11 |
Mean length | 5.3940299 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 화학 |
---|---|
2nd row | 보건의료 |
3rd row | 보건의료 |
4th row | 보건의료 |
5th row | 생명과학 |
Common Values
Value | Count | Frequency (%) |
생명과학 | 56 | |
화학 | 44 | |
재료 | 32 | |
농림수산식품 | 29 | |
물리학 | 25 | |
보건의료 | 24 | |
에너지/ 자원 | 22 | 6.6% |
화공 | 17 | 5.1% |
환경 | 15 | 4.5% |
정보/ 통신 | 14 | 4.2% |
Other values (9) | 57 |
Length
Value | Count | Frequency (%) |
생명과학 | 56 | 13.1% |
화학 | 44 | 10.3% |
재료 | 32 | 7.5% |
농림수산식품 | 29 | 6.8% |
물리학 | 25 | 5.9% |
보건의료 | 24 | 5.6% |
에너지 | 22 | 5.2% |
자원 | 22 | 5.2% |
화공 | 17 | 4.0% |
환경 | 15 | 3.5% |
Other values (17) | 140 |
연구분야(중)
Text
Distinct | 117 |
---|---|
Distinct (%) | 34.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
Length
Max length | 17 |
---|---|
Median length | 15 |
Mean length | 8.2149254 |
Min length | 3 |
Characters and Unicode
Total characters | 2752 |
---|---|
Distinct characters | 159 |
Distinct categories | 5 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 54 ? |
---|---|
Unique (%) | 16.1% |
Sample
1st row | 유기 화학 |
---|---|
2nd row | 기타 보건 의료 |
3rd row | 의약품/ 의약품 개발 |
4th row | 의약품/ 의약품 개발 |
5th row | 기타 생명 과학 |
Value | Count | Frequency (%) |
화학 | 56 | 7.0% |
기타 | 42 | 5.2% |
과학 | 39 | 4.9% |
생물학 | 31 | 3.9% |
재료 | 29 | 3.6% |
세포 | 23 | 2.9% |
분자 | 23 | 2.9% |
물리 | 22 | 2.7% |
기술 | 19 | 2.4% |
에너지 | 15 | 1.9% |
Other values (163) | 502 |
Most occurring characters
Value | Count | Frequency (%) |
801 | ||
학 | 176 | 6.4% |
기 | 116 | 4.2% |
물 | 114 | 4.1% |
생 | 97 | 3.5% |
/ | 79 | 2.9% |
화 | 64 | 2.3% |
자 | 59 | 2.1% |
과 | 54 | 2.0% |
재 | 45 | 1.6% |
Other values (149) | 1147 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1864 | |
Space Separator | 801 | |
Other Punctuation | 79 | 2.9% |
Uppercase Letter | 6 | 0.2% |
Dash Punctuation | 2 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
학 | 176 | 9.4% |
기 | 116 | 6.2% |
물 | 114 | 6.1% |
생 | 97 | 5.2% |
화 | 64 | 3.4% |
자 | 59 | 3.2% |
과 | 54 | 2.9% |
재 | 45 | 2.4% |
리 | 44 | 2.4% |
분 | 44 | 2.4% |
Other values (143) | 1051 |
Uppercase Letter
Value | Count | Frequency (%) |
U | 2 | |
T | 2 | |
I | 2 |
Space Separator
Value | Count | Frequency (%) |
801 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 79 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1864 | |
Common | 882 | |
Latin | 6 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
학 | 176 | 9.4% |
기 | 116 | 6.2% |
물 | 114 | 6.1% |
생 | 97 | 5.2% |
화 | 64 | 3.4% |
자 | 59 | 3.2% |
과 | 54 | 2.9% |
재 | 45 | 2.4% |
리 | 44 | 2.4% |
분 | 44 | 2.4% |
Other values (143) | 1051 |
Common
Value | Count | Frequency (%) |
801 | ||
/ | 79 | 9.0% |
- | 2 | 0.2% |
Latin
Value | Count | Frequency (%) |
U | 2 | |
T | 2 | |
I | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1864 | |
ASCII | 888 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
801 | ||
/ | 79 | 8.9% |
U | 2 | 0.2% |
- | 2 | 0.2% |
T | 2 | 0.2% |
I | 2 | 0.2% |
Hangul
Value | Count | Frequency (%) |
학 | 176 | 9.4% |
기 | 116 | 6.2% |
물 | 114 | 6.1% |
생 | 97 | 5.2% |
화 | 64 | 3.4% |
자 | 59 | 3.2% |
과 | 54 | 2.9% |
재 | 45 | 2.4% |
리 | 44 | 2.4% |
분 | 44 | 2.4% |
Other values (143) | 1051 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.7 KiB |
남성 | |
---|---|
여성 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남성 |
---|---|
2nd row | 여성 |
3rd row | 남성 |
4th row | 여성 |
5th row | 남성 |
Common Values
Value | Count | Frequency (%) |
남성 | 274 | |
여성 | 61 | 18.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남성 | 274 | |
여성 | 61 | 18.2% |
회원수
Real number (ℝ)
Distinct | 6 |
---|---|
Distinct (%) | 1.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.1343284 |
Minimum | 1 |
---|---|
Maximum | 10 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 3.1 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 1 |
95-th percentile | 2 |
Maximum | 10 |
Range | 9 |
Interquartile range (IQR) | 0 |
Descriptive statistics
Standard deviation | 0.65422447 |
---|---|
Coefficient of variation (CV) | 0.57675052 |
Kurtosis | 106.7096 |
Mean | 1.1343284 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 9.0202348 |
Sum | 380 |
Variance | 0.42800965 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 309 | |
2 | 18 | 5.4% |
3 | 4 | 1.2% |
4 | 2 | 0.6% |
10 | 1 | 0.3% |
5 | 1 | 0.3% |
Value | Count | Frequency (%) |
1 | 309 | |
2 | 18 | 5.4% |
3 | 4 | 1.2% |
4 | 2 | 0.6% |
5 | 1 | 0.3% |
10 | 1 | 0.3% |
Value | Count | Frequency (%) |
10 | 1 | 0.3% |
5 | 1 | 0.3% |
4 | 2 | 0.6% |
3 | 4 | 1.2% |
2 | 18 | 5.4% |
1 | 309 |
가입년도 | 회원국적 | 연구분야(대) | 성별 | 회원수 | |
---|---|---|---|---|---|
가입년도 | 1.000 | 0.000 | 0.181 | 0.000 | 0.000 |
회원국적 | 0.000 | 1.000 | 0.384 | 0.395 | 0.000 |
연구분야(대) | 0.181 | 0.384 | 1.000 | 0.238 | 0.000 |
성별 | 0.000 | 0.395 | 0.238 | 1.000 | 0.000 |
회원수 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
연구분야(대) | 회원국적 | 성별 | 가입년도 | |
---|---|---|---|---|
연구분야(대) | 1.000 | 0.101 | 0.205 | 0.088 |
회원국적 | 0.101 | 1.000 | 0.309 | 0.000 |
성별 | 0.205 | 0.309 | 1.000 | 0.000 |
가입년도 | 0.088 | 0.000 | 0.000 | 1.000 |
회원수 | 가입년도 | 회원국적 | 연구분야(대) | 성별 | |
---|---|---|---|---|---|
회원수 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
가입년도 | 0.000 | 1.000 | 0.000 | 0.088 | 0.000 |
회원국적 | 0.000 | 0.000 | 1.000 | 0.101 | 0.309 |
연구분야(대) | 0.000 | 0.088 | 0.101 | 1.000 | 0.205 |
성별 | 0.000 | 0.000 | 0.309 | 0.205 | 1.000 |
가입년도 | 회원국적 | 연구분야(대) | 연구분야(중) | 성별 | 회원수 | |
---|---|---|---|---|---|---|
0 | 2019 | 이집트 | 화학 | 유기 화학 | 남성 | 1 |
1 | 2020 | 네팔 | 보건의료 | 기타 보건 의료 | 여성 | 1 |
2 | 2020 | 네팔 | 보건의료 | 의약품/ 의약품 개발 | 남성 | 1 |
3 | 2020 | 네팔 | 보건의료 | 의약품/ 의약품 개발 | 여성 | 1 |
4 | 2020 | 네팔 | 생명과학 | 기타 생명 과학 | 남성 | 1 |
5 | 2020 | 네팔 | 재료 | 세라믹 재료 | 남성 | 1 |
6 | 2020 | 네팔 | 전기/ 전자 | 기타 전기/전자 | 남성 | 1 |
7 | 2020 | 네팔 | 화학 | 전기 화학 | 남성 | 1 |
8 | 2020 | 노르웨이 | 생명과학 | 분자 세포 생물학 | 여성 | 1 |
9 | 2020 | 대한민국 | 생명과학 | 분자 세포 생물학 | 남성 | 1 |
가입년도 | 회원국적 | 연구분야(대) | 연구분야(중) | 성별 | 회원수 | |
---|---|---|---|---|---|---|
325 | 2023 | 인도 | 화학 | 융합 화학 | 남성 | 1 |
326 | 2023 | 인도네시아 | 화공 | 기타 화공 | 남성 | 1 |
327 | 2023 | 파키스탄 | 농림수산식품 | 식량 작물 과학 | 남성 | 1 |
328 | 2023 | 파키스탄 | 물리학 | 응집 물질 물리 | 여성 | 1 |
329 | 2023 | 파키스탄 | 생명과학 | 분자 세포 생물학 | 남성 | 1 |
330 | 2023 | 파키스탄 | 전기/ 전자 | 기타 전기/전자 | 남성 | 1 |
331 | 2023 | 파키스탄 | 화공 | 나노 화학 공정 기술 | 남성 | 1 |
332 | 2023 | 포르투갈 | 물리학 | 기타 물리학 | 여성 | 1 |
333 | 2023 | 나이지리아 | 에너지/ 자원 | 신재생 에너지 | 남성 | 1 |
334 | 2023 | 케냐 | 건설/ 교통 | 물류 기술 | 남성 | 1 |
Most frequently occurring
가입년도 | 회원국적 | 연구분야(대) | 연구분야(중) | 성별 | 회원수 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | 2020 | 대한민국 | 보건의료 | 보건학 | 여성 | 1 | 2 |
1 | 2020 | 대한민국 | 생명과학 | 분자 세포 생물학 | 남성 | 1 | 2 |
2 | 2020 | 미국 | 생명과학 | 분자 세포 생물학 | 여성 | 1 | 2 |
3 | 2020 | 방글라데시 | 생명과학 | 분자 세포 생물학 | 여성 | 1 | 2 |
4 | 2020 | 방글라데시 | 정보/ 통신 | 이동 통신 | 남성 | 1 | 2 |
5 | 2020 | 베트남 | 생명과학 | 분자 세포 생물학 | 여성 | 1 | 2 |
6 | 2020 | 베트남 | 재료 | 기타 재료 | 남성 | 1 | 2 |
7 | 2020 | 인도 | 보건의료 | 의생명 과학 | 남성 | 1 | 2 |
8 | 2020 | 인도 | 에너지/ 자원 | 신재생 에너지 | 남성 | 1 | 2 |
9 | 2020 | 인도 | 재료 | 분석/ 물성 평가 기술 | 남성 | 1 | 2 |