Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 5395 |
Missing cells | 11 |
Missing cells (%) | 0.1% |
Duplicate rows | 130 |
Duplicate rows (%) | 2.4% |
Total size in memory | 126.6 KiB |
Average record size in memory | 24.0 B |
Variable types
DateTime | 1 |
---|---|
Text | 2 |
Dataset
Description | 중앙행정기관 공무원의 국내·외 교육훈련 연구결과보고서 목록(2006~2017) |
---|---|
Author | 인사혁신처 |
URL | https://www.data.go.kr/data/15050434/fileData.do |
Dataset has 130 (2.4%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-12 12:09:44.693935 |
---|---|
Analysis finished | 2023-12-12 12:09:45.292754 |
Duration | 0.6 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
제출일자
Date
Distinct | 2588 |
---|---|
Distinct (%) | 48.1% |
Missing | 11 |
Missing (%) | 0.2% |
Memory size | 42.3 KiB |
Minimum | 2006-08-28 00:00:00 |
---|---|
Maximum | 2017-12-01 00:00:00 |
훈련과제명
Text
Distinct | 5113 |
---|---|
Distinct (%) | 94.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 42.3 KiB |
Length
Max length | 100 |
---|---|
Median length | 76 |
Mean length | 25.120482 |
Min length | 2 |
Characters and Unicode
Total characters | 135525 |
---|---|
Distinct characters | 769 |
Distinct categories | 13 ? |
Distinct scripts | 5 ? |
Distinct blocks | 8 ? |
Unique
Unique | 4898 ? |
---|---|
Unique (%) | 90.8% |
Sample
1st row | 미국의 지속가능농업정책 연구 |
---|---|
2nd row | 보육정책 성과지표 개발 제안 |
3rd row | 미국 지방정부의 행정혁신 |
4th row | 도로교통 안전정책 및 첨단교통체계 |
5th row | 한반도 평화체제 구축방안에 관한 연구 |
Value | Count | Frequency (%) |
연구 | 2867 | 9.2% |
및 | 1340 | 4.3% |
위한 | 928 | 3.0% |
방안 | 497 | 1.6% |
관한 | 428 | 1.4% |
대한 | 308 | 1.0% |
통한 | 303 | 1.0% |
미국의 | 219 | 0.7% |
미국 | 179 | 0.6% |
정책 | 172 | 0.6% |
Other values (10688) | 23903 |
Most occurring characters
Value | Count | Frequency (%) |
25794 | 19.0% | |
구 | 3978 | 2.9% |
연 | 3847 | 2.8% |
한 | 2869 | 2.1% |
의 | 2483 | 1.8% |
방 | 2238 | 1.7% |
국 | 2077 | 1.5% |
정 | 2014 | 1.5% |
제 | 1918 | 1.4% |
안 | 1915 | 1.4% |
Other values (759) | 86392 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 101519 | |
Space Separator | 25795 | 19.0% |
Lowercase Letter | 3604 | 2.7% |
Uppercase Letter | 2747 | 2.0% |
Other Punctuation | 537 | 0.4% |
Decimal Number | 374 | 0.3% |
Open Punctuation | 344 | 0.3% |
Close Punctuation | 340 | 0.3% |
Dash Punctuation | 229 | 0.2% |
Initial Punctuation | 13 | < 0.1% |
Other values (3) | 23 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 3978 | 3.9% |
연 | 3847 | 3.8% |
한 | 2869 | 2.8% |
의 | 2483 | 2.4% |
방 | 2238 | 2.2% |
국 | 2077 | 2.0% |
정 | 2014 | 2.0% |
제 | 1918 | 1.9% |
안 | 1915 | 1.9% |
기 | 1547 | 1.5% |
Other values (653) | 76633 |
Uppercase Letter
Value | Count | Frequency (%) |
T | 327 | |
A | 324 | |
C | 198 | 7.2% |
E | 197 | 7.2% |
I | 193 | 7.0% |
S | 193 | 7.0% |
F | 187 | 6.8% |
D | 160 | 5.8% |
O | 128 | 4.7% |
U | 127 | 4.6% |
Other values (32) | 713 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 437 | |
n | 342 | 9.5% |
t | 323 | 9.0% |
i | 306 | 8.5% |
a | 299 | 8.3% |
o | 296 | 8.2% |
r | 239 | 6.6% |
s | 198 | 5.5% |
l | 162 | 4.5% |
c | 146 | 4.1% |
Other values (16) | 856 |
Other Punctuation
Value | Count | Frequency (%) |
, | 220 | |
· | 115 | |
. | 68 | 12.7% |
& | 50 | 9.3% |
: | 35 | 6.5% |
/ | 22 | 4.1% |
' | 9 | 1.7% |
" | 8 | 1.5% |
; | 6 | 1.1% |
% | 2 | 0.4% |
Decimal Number
Value | Count | Frequency (%) |
0 | 97 | |
2 | 80 | |
1 | 67 | |
3 | 41 | |
4 | 28 | 7.5% |
5 | 20 | 5.3% |
6 | 15 | 4.0% |
7 | 12 | 3.2% |
9 | 10 | 2.7% |
8 | 4 | 1.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 340 | |
「 | 3 | 0.9% |
『 | 1 | 0.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 336 | |
」 | 3 | 0.9% |
』 | 1 | 0.3% |
Math Symbol
Value | Count | Frequency (%) |
+ | 3 | |
< | 1 | 20.0% |
> | 1 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
25794 | ||
1 | < 0.1% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 8 | |
“ | 5 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 7 | |
” | 5 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 229 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 101463 | |
Common | 27655 | 20.4% |
Latin | 6312 | 4.7% |
Han | 56 | < 0.1% |
Cyrillic | 39 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 3978 | 3.9% |
연 | 3847 | 3.8% |
한 | 2869 | 2.8% |
의 | 2483 | 2.4% |
방 | 2238 | 2.2% |
국 | 2077 | 2.0% |
정 | 2014 | 2.0% |
제 | 1918 | 1.9% |
안 | 1915 | 1.9% |
기 | 1547 | 1.5% |
Other values (617) | 76577 |
Latin
Value | Count | Frequency (%) |
e | 437 | 6.9% |
n | 342 | 5.4% |
T | 327 | 5.2% |
A | 324 | 5.1% |
t | 323 | 5.1% |
i | 306 | 4.8% |
a | 299 | 4.7% |
o | 296 | 4.7% |
r | 239 | 3.8% |
s | 198 | 3.1% |
Other values (42) | 3221 |
Common
Value | Count | Frequency (%) |
25794 | ||
( | 340 | 1.2% |
) | 336 | 1.2% |
- | 229 | 0.8% |
, | 220 | 0.8% |
· | 115 | 0.4% |
0 | 97 | 0.4% |
2 | 80 | 0.3% |
. | 68 | 0.2% |
1 | 67 | 0.2% |
Other values (28) | 309 | 1.1% |
Han
Value | Count | Frequency (%) |
對 | 5 | 8.9% |
中 | 5 | 8.9% |
美 | 4 | 7.1% |
韓 | 4 | 7.1% |
市 | 3 | 5.4% |
融 | 2 | 3.6% |
金 | 2 | 3.6% |
新 | 2 | 3.6% |
方 | 2 | 3.6% |
惡 | 1 | 1.8% |
Other values (26) | 26 |
Cyrillic
Value | Count | Frequency (%) |
И | 7 | |
А | 4 | |
Л | 4 | |
У | 3 | |
Т | 3 | |
М | 3 | |
О | 2 | 5.1% |
Н | 2 | 5.1% |
К | 2 | 5.1% |
Ь | 2 | 5.1% |
Other values (6) | 7 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 101454 | |
ASCII | 33818 | 25.0% |
None | 124 | 0.1% |
CJK | 55 | < 0.1% |
Cyrillic | 39 | < 0.1% |
Punctuation | 25 | < 0.1% |
Compat Jamo | 9 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
25794 | ||
e | 437 | 1.3% |
n | 342 | 1.0% |
( | 340 | 1.0% |
) | 336 | 1.0% |
T | 327 | 1.0% |
A | 324 | 1.0% |
t | 323 | 1.0% |
i | 306 | 0.9% |
a | 299 | 0.9% |
Other values (70) | 4990 | 14.8% |
Hangul
Value | Count | Frequency (%) |
구 | 3978 | 3.9% |
연 | 3847 | 3.8% |
한 | 2869 | 2.8% |
의 | 2483 | 2.4% |
방 | 2238 | 2.2% |
국 | 2077 | 2.0% |
정 | 2014 | 2.0% |
제 | 1918 | 1.9% |
안 | 1915 | 1.9% |
기 | 1547 | 1.5% |
Other values (614) | 76568 |
None
Value | Count | Frequency (%) |
· | 115 | |
」 | 3 | 2.4% |
「 | 3 | 2.4% |
『 | 1 | 0.8% |
』 | 1 | 0.8% |
1 | 0.8% |
Punctuation
Value | Count | Frequency (%) |
‘ | 8 | |
’ | 7 | |
“ | 5 | |
” | 5 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 7 | |
ㅇ | 1 | 11.1% |
ㄱ | 1 | 11.1% |
Cyrillic
Value | Count | Frequency (%) |
И | 7 | |
А | 4 | |
Л | 4 | |
У | 3 | |
Т | 3 | |
М | 3 | |
О | 2 | 5.1% |
Н | 2 | 5.1% |
К | 2 | 5.1% |
Ь | 2 | 5.1% |
Other values (6) | 7 |
CJK
Value | Count | Frequency (%) |
對 | 5 | 9.1% |
中 | 5 | 9.1% |
美 | 4 | 7.3% |
韓 | 4 | 7.3% |
市 | 3 | 5.5% |
融 | 2 | 3.6% |
金 | 2 | 3.6% |
新 | 2 | 3.6% |
方 | 2 | 3.6% |
惡 | 1 | 1.8% |
Other values (25) | 25 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
茶 | 1 |
등록자
Text
Distinct | 4342 |
---|---|
Distinct (%) | 80.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 42.3 KiB |
Value | Count | Frequency (%) |
김정삼 | 13 | 0.2% |
이성미 | 9 | 0.2% |
임창환 | 8 | 0.1% |
이태훈 | 7 | 0.1% |
김재현 | 7 | 0.1% |
이지현 | 6 | 0.1% |
김자영 | 6 | 0.1% |
박지은 | 5 | 0.1% |
김성호 | 5 | 0.1% |
이진수 | 5 | 0.1% |
Other values (4333) | 5325 |
Most occurring characters
Value | Count | Frequency (%) |
김 | 1057 | 6.6% |
이 | 857 | 5.3% |
정 | 587 | 3.6% |
영 | 497 | 3.1% |
박 | 421 | 2.6% |
성 | 358 | 2.2% |
진 | 345 | 2.1% |
현 | 326 | 2.0% |
수 | 297 | 1.8% |
경 | 284 | 1.8% |
Other values (261) | 11090 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 16094 | |
Uppercase Letter | 16 | 0.1% |
Close Punctuation | 4 | < 0.1% |
Open Punctuation | 4 | < 0.1% |
Space Separator | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 1057 | 6.6% |
이 | 857 | 5.3% |
정 | 587 | 3.6% |
영 | 497 | 3.1% |
박 | 421 | 2.6% |
성 | 358 | 2.2% |
진 | 345 | 2.1% |
현 | 326 | 2.0% |
수 | 297 | 1.8% |
경 | 284 | 1.8% |
Other values (255) | 11065 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 8 | |
N | 4 | |
U | 4 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Space Separator
Value | Count | Frequency (%) |
1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 16094 | |
Latin | 16 | 0.1% |
Common | 9 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 1057 | 6.6% |
이 | 857 | 5.3% |
정 | 587 | 3.6% |
영 | 497 | 3.1% |
박 | 421 | 2.6% |
성 | 358 | 2.2% |
진 | 345 | 2.1% |
현 | 326 | 2.0% |
수 | 297 | 1.8% |
경 | 284 | 1.8% |
Other values (255) | 11065 |
Latin
Value | Count | Frequency (%) |
L | 8 | |
N | 4 | |
U | 4 |
Common
Value | Count | Frequency (%) |
) | 4 | |
( | 4 | |
1 | 11.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 16094 | |
ASCII | 25 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
김 | 1057 | 6.6% |
이 | 857 | 5.3% |
정 | 587 | 3.6% |
영 | 497 | 3.1% |
박 | 421 | 2.6% |
성 | 358 | 2.2% |
진 | 345 | 2.1% |
현 | 326 | 2.0% |
수 | 297 | 1.8% |
경 | 284 | 1.8% |
Other values (255) | 11065 |
ASCII
Value | Count | Frequency (%) |
L | 8 | |
N | 4 | |
) | 4 | |
U | 4 | |
( | 4 | |
1 | 4.0% |
제출일자 | 훈련과제명 | 등록자 | |
---|---|---|---|
0 | 2007-06-28 | 미국의 지속가능농업정책 연구 | 하영효 |
1 | 2007-09-05 | 보육정책 성과지표 개발 제안 | 정봉협 |
2 | 2007-08-14 | 미국 지방정부의 행정혁신 | 이종배 |
3 | 2008-01-05 | 도로교통 안전정책 및 첨단교통체계 | 홍기범 |
4 | 2008-05-01 | 한반도 평화체제 구축방안에 관한 연구 | 오균 |
5 | 2007-08-28 | 한반도 평화체제 구축방안에 관한 연구 | 조재정 |
6 | 2007-07-26 | 재정효율성 제고방안 연구(미국의 사례분석) | 조경규 |
7 | 2007-05-21 | 남북중 3자경협방안 | 설동근 |
8 | 2007-08-26 | 미국헌법상 평등원칙의 심사기준 및 사례 | 홍두표 |
9 | 2007-11-01 | 미국의 고등교육정책 동향 및 미국, 일본의 대학가버넌스 고찰 | 황홍규 |
제출일자 | 훈련과제명 | 등록자 | |
---|---|---|---|
5385 | 2017-07-18 | 한국범죄분류 개발을 위한 국제표준범죄분류 도입 선진사례 연수 | 김현기 |
5386 | 2017-09-29 | 미국의 폴리그래프 검사 등 | 임익삼 |
5387 | 2017-09-29 | 야생동물 역학조사 현장실무교육 | 정지민 |
5388 | 2017-08-25 | 미승인 유전자변형식품 국내 유입차단을 위한 시험법 개발 및 개발동향 파악 | 문귀임 |
5389 | 2017-08-30 | 미국의 전자장치 개선 및 제도 운영 사례 연구 | 허강무 |
5390 | 2017-08-20 | 지진재해 경감을 위한 지진조기경보 현황 조사 및 지진재난 방재 업무 벤치마킹 | 함인경 |
5391 | 2017-05-25 | 지역경제활성화를 위한 공동체 금융연구 | 설창환 |
5392 | 2017-07-28 | 글로벌공동연수과정 | 엄기복 |
5393 | 2017-05-24 | 부산 크루즈통계 개발을 위한 연구 | 신연주 |
5394 | 2017-09-08 | 기록관리 평가 체계 혁신을 위한 선진기관 사례 연구 | 이혜원 |
Most frequently occurring
제출일자 | 훈련과제명 | 등록자 | # duplicates | |
---|---|---|---|---|
20 | 2008-07-09 | 첨단 IT 클러스터 구축, 활용방안 | 김정삼 | 12 |
21 | 2008-07-13 | 축산물 중 병원성 미생물 위해분석 기법 연수 | 이성미 | 8 |
16 | 2008-04-09 | EU환경에너지규제에대응한자동차산업기술전략 | 공성호 | 5 |
33 | 2009-01-02 | 한국.중국 해관 감관화물 관리제도 비교 연구 | 임창환 | 5 |
6 | 2007-08-01 | 수목장림 조성 및 운영기법 연수 | 배상원 | 4 |
40 | 2009-08-01 | 중국 경제금융제도현황과 금융제도개혁에 관한 연구 | 장도환 | 4 |
76 | 2013-12-18 | 과학기술기반 재난안전 관리정책 및 관리기술 개발(지진 및 기후변화 재난관리 연구) | 박병철 | 4 |
98 | 2014-06-14 | 부동산금융 선진화 추진 | 이지혜 | 4 |
8 | 2007-08-13 | 디지털 증거 전문분석도구 활용방안 | 독고지은 | 3 |
18 | 2008-05-26 | 식물유전자원 보존을 위한 종자 증식 및 관리기술 개발 | 김재현 | 3 |