Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 691 |
Duplicate rows (%) | 6.9% |
Total size in memory | 322.3 KiB |
Average record size in memory | 33.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 1 |
Text | 1 |
Dataset
Description | 산림복지전문업지원시스템에서 추출한 자격증 발급 정보에 관련된 내용입니다. 자격취득연도, 자격종류, 성명 등으로 구성되어있습니다. |
---|---|
Author | 한국산림복지진흥원 |
URL | https://www.data.go.kr/data/15088850/fileData.do |
Dataset has 691 (6.9%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-12 05:50:31.117740 |
---|---|
Analysis finished | 2023-12-12 05:50:31.571851 |
Duration | 0.45 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
자격취득연도
Real number (ℝ)
Distinct | 9 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2016.7249 |
Minimum | 2013 |
---|---|
Maximum | 2021 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2013 |
---|---|
5-th percentile | 2013 |
Q1 | 2015 |
median | 2017 |
Q3 | 2019 |
95-th percentile | 2020 |
Maximum | 2021 |
Range | 8 |
Interquartile range (IQR) | 4 |
Descriptive statistics
Standard deviation | 2.3438791 |
---|---|
Coefficient of variation (CV) | 0.0011622206 |
Kurtosis | -1.1230527 |
Mean | 2016.7249 |
Median Absolute Deviation (MAD) | 2 |
Skewness | -0.2434831 |
Sum | 20167249 |
Variance | 5.4937694 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2019 | 1697 | |
2018 | 1655 | |
2013 | 1602 | |
2017 | 1308 | |
2016 | 1069 | |
2015 | 943 | |
2020 | 917 | |
2014 | 632 | 6.3% |
2021 | 177 | 1.8% |
Value | Count | Frequency (%) |
2013 | 1602 | |
2014 | 632 | 6.3% |
2015 | 943 | |
2016 | 1069 | |
2017 | 1308 | |
2018 | 1655 | |
2019 | 1697 | |
2020 | 917 | |
2021 | 177 | 1.8% |
Value | Count | Frequency (%) |
2021 | 177 | 1.8% |
2020 | 917 | |
2019 | 1697 | |
2018 | 1655 | |
2017 | 1308 | |
2016 | 1069 | |
2015 | 943 | |
2014 | 632 | 6.3% |
2013 | 1602 |
자격종류
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
숲해설가 | |
---|---|
유아숲지도사 | |
숲길등산지도사 | 321 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 4.8325 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 숲해설가 |
---|---|
2nd row | 유아숲지도사 |
3rd row | 숲해설가 |
4th row | 숲해설가 |
5th row | 숲해설가 |
Common Values
Value | Count | Frequency (%) |
숲해설가 | 5998 | |
유아숲지도사 | 3681 | |
숲길등산지도사 | 321 | 3.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
숲해설가 | 5998 | |
유아숲지도사 | 3681 | |
숲길등산지도사 | 321 | 3.2% |
성명
Text
Distinct | 91 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
김 | 2185 | |
이 | 1552 | |
박 | 821 | 8.2% |
최 | 478 | 4.8% |
정 | 467 | 4.7% |
조 | 296 | 3.0% |
강 | 261 | 2.6% |
임 | 249 | 2.5% |
윤 | 214 | 2.1% |
장 | 207 | 2.1% |
Other values (81) | 3270 |
Most occurring characters
Value | Count | Frequency (%) |
* | 20000 | |
김 | 2185 | 7.3% |
이 | 1552 | 5.2% |
박 | 821 | 2.7% |
최 | 478 | 1.6% |
정 | 467 | 1.6% |
조 | 296 | 1.0% |
강 | 261 | 0.9% |
임 | 249 | 0.8% |
윤 | 214 | 0.7% |
Other values (82) | 3477 | 11.6% |
Most occurring categories
Value | Count | Frequency (%) |
Other Punctuation | 20000 | |
Other Letter | 10000 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 2185 | |
이 | 1552 | |
박 | 821 | 8.2% |
최 | 478 | 4.8% |
정 | 467 | 4.7% |
조 | 296 | 3.0% |
강 | 261 | 2.6% |
임 | 249 | 2.5% |
윤 | 214 | 2.1% |
장 | 207 | 2.1% |
Other values (81) | 3270 |
Other Punctuation
Value | Count | Frequency (%) |
* | 20000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 20000 | |
Hangul | 10000 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 2185 | |
이 | 1552 | |
박 | 821 | 8.2% |
최 | 478 | 4.8% |
정 | 467 | 4.7% |
조 | 296 | 3.0% |
강 | 261 | 2.6% |
임 | 249 | 2.5% |
윤 | 214 | 2.1% |
장 | 207 | 2.1% |
Other values (81) | 3270 |
Common
Value | Count | Frequency (%) |
* | 20000 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 20000 | |
Hangul | 10000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
* | 20000 |
Hangul
Value | Count | Frequency (%) |
김 | 2185 | |
이 | 1552 | |
박 | 821 | 8.2% |
최 | 478 | 4.8% |
정 | 467 | 4.7% |
조 | 296 | 3.0% |
강 | 261 | 2.6% |
임 | 249 | 2.5% |
윤 | 214 | 2.1% |
장 | 207 | 2.1% |
Other values (81) | 3270 |
자격취득연도 | 자격종류 | 성명 | |
---|---|---|---|
자격취득연도 | 1.000 | 0.226 | 0.324 |
자격종류 | 0.226 | 1.000 | 0.169 |
성명 | 0.324 | 0.169 | 1.000 |
자격취득연도 | 자격종류 | |
---|---|---|
자격취득연도 | 1.000 | 0.267 |
자격종류 | 0.267 | 1.000 |
자격취득연도 | 자격종류 | 성명 | |
---|---|---|---|
11391 | 2020 | 숲해설가 | 조** |
4084 | 2016 | 유아숲지도사 | 노** |
10378 | 2019 | 숲해설가 | 최** |
6149 | 2017 | 숲해설가 | 최** |
11070 | 2020 | 숲해설가 | 박** |
3332 | 2015 | 숲해설가 | 장** |
11424 | 2020 | 유아숲지도사 | 이** |
2039 | 2014 | 숲해설가 | 정** |
8536 | 2018 | 숲해설가 | 이** |
2982 | 2015 | 숲해설가 | 이** |
자격취득연도 | 자격종류 | 성명 | |
---|---|---|---|
9090 | 2019 | 유아숲지도사 | 이** |
565 | 2013 | 숲해설가 | 조** |
5493 | 2017 | 숲해설가 | 정** |
2403 | 2014 | 숲해설가 | 김** |
10864 | 2019 | 숲해설가 | 김** |
3636 | 2015 | 숲해설가 | 정** |
5883 | 2017 | 숲해설가 | 송** |
1204 | 2013 | 숲해설가 | 이** |
5309 | 2017 | 유아숲지도사 | 김** |
3518 | 2015 | 숲해설가 | 이** |
Most frequently occurring
자격취득연도 | 자격종류 | 성명 | # duplicates | |
---|---|---|---|---|
14 | 2013 | 숲해설가 | 김** | 341 |
47 | 2013 | 숲해설가 | 이** | 246 |
541 | 2019 | 유아숲지도사 | 김** | 193 |
440 | 2018 | 유아숲지도사 | 김** | 183 |
350 | 2017 | 유아숲지도사 | 김** | 170 |
497 | 2019 | 숲해설가 | 김** | 162 |
566 | 2019 | 유아숲지도사 | 이** | 153 |
221 | 2016 | 숲해설가 | 김** | 139 |
519 | 2019 | 숲해설가 | 이** | 137 |
420 | 2018 | 숲해설가 | 이** | 133 |