Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 466 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 47 |
Duplicate rows (%) | 10.1% |
Total size in memory | 18.3 KiB |
Average record size in memory | 40.3 B |
Variable types
Text | 1 |
---|---|
Categorical | 3 |
DateTime | 1 |
Dataset
Description | 2001~현재까지의 수목보호기술자 자격 취득자에 대한 관리정보 데이터 파일입니다.(산림사업법인관리시스템에 등록된 수목보호기술자 자격정보) |
---|---|
Author | 산림청 |
URL | https://www.data.go.kr/data/15066523/fileData.do |
Dataset has 47 (10.1%) duplicate rows | Duplicates |
등록일시 is highly overall correlated with 자격증번호 and 1 other fields | High correlation |
자격증번호 is highly overall correlated with 합격일 and 1 other fields | High correlation |
합격일 is highly overall correlated with 자격증번호 and 1 other fields | High correlation |
Reproduction
Analysis started | 2023-12-12 05:17:54.348836 |
---|---|
Analysis finished | 2023-12-12 05:17:54.906197 |
Duration | 0.56 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
이름
Text
Distinct | 78 |
---|---|
Distinct (%) | 16.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
Value | Count | Frequency (%) |
김 | 81 | |
이 | 78 | |
박 | 36 | 7.7% |
최 | 28 | 6.0% |
정 | 26 | 5.6% |
조 | 15 | 3.2% |
강 | 14 | 3.0% |
임 | 14 | 3.0% |
유 | 10 | 2.1% |
권 | 10 | 2.1% |
Other values (68) | 154 |
Most occurring characters
Value | Count | Frequency (%) |
* | 876 | |
이 | 87 | 6.2% |
김 | 86 | 6.2% |
박 | 38 | 2.7% |
최 | 28 | 2.0% |
정 | 26 | 1.9% |
조 | 15 | 1.1% |
강 | 15 | 1.1% |
임 | 14 | 1.0% |
권 | 10 | 0.7% |
Other values (76) | 202 | 14.5% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 876 | |
Other Letter | 521 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
이 | 87 | |
김 | 86 | |
박 | 38 | 7.3% |
최 | 28 | 5.4% |
정 | 26 | 5.0% |
조 | 15 | 2.9% |
강 | 15 | 2.9% |
임 | 14 | 2.7% |
권 | 10 | 1.9% |
유 | 10 | 1.9% |
Other values (75) | 192 |
Other Punctuation
Value | Count | Frequency (%) |
* | 876 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 876 | |
Hangul | 521 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
이 | 87 | |
김 | 86 | |
박 | 38 | 7.3% |
최 | 28 | 5.4% |
정 | 26 | 5.0% |
조 | 15 | 2.9% |
강 | 15 | 2.9% |
임 | 14 | 2.7% |
권 | 10 | 1.9% |
유 | 10 | 1.9% |
Other values (75) | 192 |
Common
Value | Count | Frequency (%) |
* | 876 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 876 | |
Hangul | 521 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 876 |
Hangul
Value | Count | Frequency (%) |
이 | 87 | |
김 | 86 | |
박 | 38 | 7.3% |
최 | 28 | 5.4% |
정 | 26 | 5.0% |
조 | 15 | 2.9% |
강 | 15 | 2.9% |
임 | 14 | 2.7% |
권 | 10 | 1.9% |
유 | 10 | 1.9% |
Other values (75) | 192 |
자격증번호
Categorical
HIGH CORRELATION
 
Distinct | 44 |
---|---|
Distinct (%) | 9.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
2109*** | 31 |
---|---|
2111*** | 30 |
2806*** | 26 |
2906*** | 22 |
2609*** | 21 |
Other values (39) |
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 6.9935622 |
Min length | 4 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | 0.9% |
Sample
1st row | 2306*** |
---|---|
2nd row | 2612*** |
3rd row | 2612*** |
4th row | 2506*** |
5th row | 2609*** |
Common Values
Value | Count | Frequency (%) |
2109*** | 31 | 6.7% |
2111*** | 30 | 6.4% |
2806*** | 26 | 5.6% |
2906*** | 22 | 4.7% |
2609*** | 21 | 4.5% |
2306*** | 20 | 4.3% |
2201*** | 18 | 3.9% |
2605*** | 17 | 3.6% |
2912*** | 17 | 3.6% |
2403*** | 16 | 3.4% |
Other values (34) | 248 |
Length
Value | Count | Frequency (%) |
2109 | 31 | 6.7% |
2111 | 30 | 6.4% |
2806 | 26 | 5.6% |
2906 | 22 | 4.7% |
2609 | 21 | 4.5% |
2306 | 20 | 4.3% |
2201 | 18 | 3.9% |
2605 | 17 | 3.6% |
2912 | 17 | 3.6% |
2106 | 16 | 3.4% |
Other values (34) | 248 |
교부일
Date
Distinct | 168 |
---|---|
Distinct (%) | 36.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
Minimum | 2001-04-10 00:00:00 |
---|---|
Maximum | 2017-12-14 00:00:00 |
합격일
Categorical
HIGH CORRELATION
 
Distinct | 47 |
---|---|
Distinct (%) | 10.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
<NA> | |
---|---|
2016-08-10 | 20 |
2011-08-18 | 18 |
2009-12-03 | 17 |
2010-11-11 | 17 |
Other values (42) |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.5107296 |
Min length | 4 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 2015-05-20 |
5th row | 2016-08-10 |
Common Values
Value | Count | Frequency (%) |
<NA> | 38 | 8.2% |
2016-08-10 | 20 | 4.3% |
2011-08-18 | 18 | 3.9% |
2009-12-03 | 17 | 3.6% |
2010-11-11 | 17 | 3.6% |
2004-03-20 | 16 | 3.4% |
2008-11-27 | 16 | 3.4% |
2009-09-23 | 15 | 3.2% |
2010-06-24 | 15 | 3.2% |
2005-05-09 | 14 | 3.0% |
Other values (37) | 280 |
Length
Value | Count | Frequency (%) |
na | 38 | 8.2% |
2016-08-10 | 20 | 4.3% |
2011-08-18 | 18 | 3.9% |
2009-12-03 | 17 | 3.6% |
2010-11-11 | 17 | 3.6% |
2004-03-20 | 16 | 3.4% |
2008-11-27 | 16 | 3.4% |
2009-09-23 | 15 | 3.2% |
2010-06-24 | 15 | 3.2% |
2005-05-09 | 14 | 3.0% |
Other values (37) | 280 |
등록일시
Categorical
HIGH CORRELATION
 
Distinct | 32 |
---|---|
Distinct (%) | 6.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.8 KiB |
2010-06-21 | |
---|---|
2014-05-07 | |
2016-11-24 | |
2010-08-31 | |
2011-01-04 | |
Other values (27) |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 18 ? |
---|---|
Unique (%) | 3.9% |
Sample
1st row | 2017-12-15 |
---|---|
2nd row | 2017-02-07 |
3rd row | 2016-12-28 |
4th row | 2016-11-24 |
5th row | 2016-11-24 |
Common Values
Value | Count | Frequency (%) |
2010-06-21 | 191 | |
2014-05-07 | 66 | 14.2% |
2016-11-24 | 62 | 13.3% |
2010-08-31 | 32 | 6.9% |
2011-01-04 | 29 | 6.2% |
2011-12-19 | 28 | 6.0% |
2014-09-25 | 10 | 2.1% |
2015-01-09 | 9 | 1.9% |
2016-01-07 | 7 | 1.5% |
2016-01-08 | 6 | 1.3% |
Other values (22) | 26 | 5.6% |
Length
Value | Count | Frequency (%) |
2010-06-21 | 191 | |
2014-05-07 | 66 | 14.2% |
2016-11-24 | 62 | 13.3% |
2010-08-31 | 32 | 6.9% |
2011-01-04 | 29 | 6.2% |
2011-12-19 | 28 | 6.0% |
2014-09-25 | 10 | 2.1% |
2015-01-09 | 9 | 1.9% |
2016-01-07 | 7 | 1.5% |
2016-01-08 | 6 | 1.3% |
Other values (22) | 26 | 5.6% |
이름 | 자격증번호 | 합격일 | 등록일시 | |
---|---|---|---|---|
이름 | 1.000 | 0.798 | 0.000 | 0.975 |
자격증번호 | 0.798 | 1.000 | 1.000 | 0.962 |
합격일 | 0.000 | 1.000 | 1.000 | 1.000 |
등록일시 | 0.975 | 0.962 | 1.000 | 1.000 |
등록일시 | 자격증번호 | 합격일 | |
---|---|---|---|
등록일시 | 1.000 | 0.554 | 0.953 |
자격증번호 | 0.554 | 1.000 | 0.974 |
합격일 | 0.953 | 0.974 | 1.000 |
자격증번호 | 합격일 | 등록일시 | |
---|---|---|---|
자격증번호 | 1.000 | 0.974 | 0.554 |
합격일 | 0.974 | 1.000 | 0.953 |
등록일시 | 0.554 | 0.953 | 1.000 |
이름 | 자격증번호 | 교부일 | 합격일 | 등록일시 | |
---|---|---|---|---|---|
0 | 김** | 2306*** | 2017-12-14 | <NA> | 2017-12-15 |
1 | 최** | 2612*** | 2017-02-07 | <NA> | 2017-02-07 |
2 | 노** | 2612*** | 2016-12-28 | <NA> | 2016-12-28 |
3 | 강** | 2506*** | 2015-06-15 | 2015-05-20 | 2016-11-24 |
4 | 고** | 2609*** | 2016-09-12 | 2016-08-10 | 2016-11-24 |
5 | 곽** | 2506*** | 2015-09-22 | 2015-09-09 | 2016-11-24 |
6 | 권** | 2506*** | 2015-09-22 | 2015-09-09 | 2016-11-24 |
7 | 권** | 2609*** | 2016-09-12 | 2016-08-10 | 2016-11-24 |
8 | 김** | 2306*** | 2014-06-27 | 2014-05-28 | 2016-11-24 |
9 | 김** | 2609*** | 2016-09-12 | 2016-08-10 | 2016-11-24 |
이름 | 자격증번호 | 교부일 | 합격일 | 등록일시 | |
---|---|---|---|---|---|
456 | 최** | 2906*** | 2009-06-25 | 2009-05-29 | 2010-06-21 |
457 | 최** | 2806*** | 2008-12-08 | 2008-11-27 | 2010-06-21 |
458 | 표** | 2906*** | 2009-06-09 | 2009-05-29 | 2010-06-21 |
459 | 한** | 2304*** | 2003-04-23 | 2003-04-19 | 2010-06-21 |
460 | 한** | 2605*** | 2006-06-01 | 2006-05-19 | 2010-06-21 |
461 | 한** | 2611*** | 2006-11-13 | 2006-11-03 | 2010-06-21 |
462 | 현** | 2310*** | 2003-11-10 | 2003-10-11 | 2010-06-21 |
463 | 홍** | 2906*** | 2009-09-28 | 2009-09-23 | 2010-06-21 |
464 | 홍** | 2508*** | 2005-08-02 | 2005-07-26 | 2010-06-21 |
465 | 황** | 2906*** | 2009-06-15 | 2009-05-29 | 2010-06-21 |
Most frequently occurring
이름 | 자격증번호 | 교부일 | 합격일 | 등록일시 | # duplicates | |
---|---|---|---|---|---|---|
25 | 이** | 2111*** | 2010-11-29 | 2010-11-11 | 2011-01-04 | 6 |
24 | 이** | 2109*** | 2010-09-13 | 2010-08-26 | 2011-01-04 | 5 |
3 | 김** | 2109*** | 2011-09-19 | 2011-08-18 | 2011-12-19 | 3 |
5 | 김** | 2306*** | 2014-06-27 | 2014-05-28 | 2016-11-24 | 3 |
13 | 김** | 2609*** | 2016-09-12 | 2016-08-10 | 2016-11-24 | 3 |
27 | 이** | 2209*** | 2012-09-10 | 2012-08-22 | 2014-05-07 | 3 |
35 | 이** | 2512*** | 2015-12-24 | 2015-12-02 | 2016-11-24 | 3 |
46 | 최** | 2506*** | 2015-06-15 | 2015-05-20 | 2016-11-24 | 3 |
0 | 강** | 2311*** | 2013-12-03 | 2013-11-20 | 2014-05-07 | 2 |
1 | 김** | 2106*** | 2010-07-14 | 2010-06-24 | 2010-08-31 | 2 |