Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 49 |
Missing cells | 12 |
Missing cells (%) | 3.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 3.3 KiB |
Average record size in memory | 69.7 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 4 |
Text | 2 |
Boolean | 1 |
Dataset
Description | 국립중앙과학관 홈페이지에 있는 과학학습콘텐츠의 곤충 목록입니다. 데이터 항목명: 콘텐츠 아이디, 대분류코드, 중분류코드, 콘텐츠 제목, 이름, 감수자, 공개유무, 첨부파일 ※ 대전광역시 유성구 대덕대로 481(국립중앙과학관) |
---|---|
URL | https://www.data.go.kr/data/15067836/fileData.do |
대분류코드 has constant value "" | Constant |
감수자 has constant value "" | Constant |
공개유무 has constant value "" | Constant |
중분류코드 is highly overall correlated with 콘텐츠 아이디 and 1 other fields | High correlation |
이름 is highly overall correlated with 콘텐츠 아이디 and 1 other fields | High correlation |
콘텐츠 아이디 is highly overall correlated with 중분류코드 and 1 other fields | High correlation |
첨부파일 has 12 (24.5%) missing values | Missing |
콘텐츠 아이디 has unique values | Unique |
콘텐츠 제목 has unique values | Unique |
Reproduction
Analysis started | 2023-12-11 22:53:18.777881 |
---|---|
Analysis finished | 2023-12-11 22:53:19.364282 |
Duration | 0.59 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
콘텐츠 아이디
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 49 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1410.1224 |
Minimum | 1386 |
---|---|
Maximum | 1437 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 573.0 B |
Quantile statistics
Minimum | 1386 |
---|---|
5-th percentile | 1388.4 |
Q1 | 1398 |
median | 1410 |
Q3 | 1422 |
95-th percentile | 1431.6 |
Maximum | 1437 |
Range | 51 |
Interquartile range (IQR) | 24 |
Descriptive statistics
Standard deviation | 14.505218 |
---|---|
Coefficient of variation (CV) | 0.010286496 |
Kurtosis | -1.1181116 |
Mean | 1410.1224 |
Median Absolute Deviation (MAD) | 12 |
Skewness | 0.053788529 |
Sum | 69096 |
Variance | 210.40136 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1411 | 1 | 2.0% |
1414 | 1 | 2.0% |
1398 | 1 | 2.0% |
1400 | 1 | 2.0% |
1402 | 1 | 2.0% |
1403 | 1 | 2.0% |
1404 | 1 | 2.0% |
1406 | 1 | 2.0% |
1407 | 1 | 2.0% |
1409 | 1 | 2.0% |
Other values (39) | 39 |
Value | Count | Frequency (%) |
1386 | 1 | |
1387 | 1 | |
1388 | 1 | |
1389 | 1 | |
1390 | 1 | |
1391 | 1 | |
1392 | 1 | |
1393 | 1 | |
1394 | 1 | |
1395 | 1 |
Value | Count | Frequency (%) |
1437 | 1 | |
1436 | 1 | |
1432 | 1 | |
1431 | 1 | |
1430 | 1 | |
1429 | 1 | |
1428 | 1 | |
1427 | 1 | |
1426 | 1 | |
1425 | 1 |
대분류코드
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 524.0 B |
1019 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1019 |
---|---|
2nd row | 1019 |
3rd row | 1019 |
4th row | 1019 |
5th row | 1019 |
Common Values
Value | Count | Frequency (%) |
1019 | 49 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1019 | 49 |
중분류코드
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 8.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 524.0 B |
1032 | |
---|---|
1031 | |
1030 | 2 |
1029 | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1032 |
---|---|
2nd row | 1032 |
3rd row | 1032 |
4th row | 1032 |
5th row | 1031 |
Common Values
Value | Count | Frequency (%) |
1032 | 24 | |
1031 | 21 | |
1030 | 2 | 4.1% |
1029 | 2 | 4.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1032 | 24 | |
1031 | 21 | |
1030 | 2 | 4.1% |
1029 | 2 | 4.1% |
콘텐츠 제목
Text
UNIQUE
 
Distinct | 49 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 524.0 B |
Value | Count | Frequency (%) |
나방 | 2 | 3.9% |
여치 | 1 | 2.0% |
바구미 | 1 | 2.0% |
다듬이벌레목 | 1 | 2.0% |
노린재목 | 1 | 2.0% |
풀잠자리목 | 1 | 2.0% |
딱정벌레목 | 1 | 2.0% |
부채벌레목 | 1 | 2.0% |
밑들이목 | 1 | 2.0% |
벼룩목 | 1 | 2.0% |
Other values (40) | 40 |
Most occurring characters
Value | Count | Frequency (%) |
목 | 25 | 13.7% |
이 | 9 | 4.9% |
리 | 9 | 4.9% |
벌 | 8 | 4.4% |
나 | 8 | 4.4% |
레 | 6 | 3.3% |
파 | 5 | 2.7% |
비 | 5 | 2.7% |
자 | 4 | 2.2% |
잠 | 4 | 2.2% |
Other values (71) | 99 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 180 | |
Space Separator | 2 | 1.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
목 | 25 | 13.9% |
이 | 9 | 5.0% |
리 | 9 | 5.0% |
벌 | 8 | 4.4% |
나 | 8 | 4.4% |
레 | 6 | 3.3% |
파 | 5 | 2.8% |
비 | 5 | 2.8% |
자 | 4 | 2.2% |
잠 | 4 | 2.2% |
Other values (70) | 97 |
Space Separator
Value | Count | Frequency (%) |
2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 180 | |
Common | 2 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
목 | 25 | 13.9% |
이 | 9 | 5.0% |
리 | 9 | 5.0% |
벌 | 8 | 4.4% |
나 | 8 | 4.4% |
레 | 6 | 3.3% |
파 | 5 | 2.8% |
비 | 5 | 2.8% |
자 | 4 | 2.2% |
잠 | 4 | 2.2% |
Other values (70) | 97 |
Common
Value | Count | Frequency (%) |
2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 180 | |
ASCII | 2 | 1.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
목 | 25 | 13.9% |
이 | 9 | 5.0% |
리 | 9 | 5.0% |
벌 | 8 | 4.4% |
나 | 8 | 4.4% |
레 | 6 | 3.3% |
파 | 5 | 2.8% |
비 | 5 | 2.8% |
자 | 4 | 2.2% |
잠 | 4 | 2.2% |
Other values (70) | 97 |
ASCII
Value | Count | Frequency (%) |
2 |
이름
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 14.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 524.0 B |
<NA> | |
---|---|
매뚜기계열 | |
밑들이계열 | |
노린재계열 | |
딱정벌레계열 | 2 |
Other values (2) | 2 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 4.4489796 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 4.1% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | <NA> |
5th row | 매뚜기계열 |
Common Values
Value | Count | Frequency (%) |
<NA> | 28 | |
매뚜기계열 | 8 | 16.3% |
밑들이계열 | 5 | 10.2% |
노린재계열 | 4 | 8.2% |
딱정벌레계열 | 2 | 4.1% |
벌계열 | 1 | 2.0% |
풀잠자리계열 | 1 | 2.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 28 | |
매뚜기계열 | 8 | 16.3% |
밑들이계열 | 5 | 10.2% |
노린재계열 | 4 | 8.2% |
딱정벌레계열 | 2 | 4.1% |
벌계열 | 1 | 2.0% |
풀잠자리계열 | 1 | 2.0% |
감수자
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 524.0 B |
변봉규 교수 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 변봉규 교수 |
---|---|
2nd row | 변봉규 교수 |
3rd row | 변봉규 교수 |
4th row | 변봉규 교수 |
5th row | 변봉규 교수 |
Common Values
Value | Count | Frequency (%) |
변봉규 교수 | 49 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
변봉규 | 49 | |
교수 | 49 |
공개유무
Boolean
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 181.0 B |
True |
---|
Value | Count | Frequency (%) |
True | 49 |
첨부파일
Text
MISSING
 
Distinct | 37 |
---|---|
Distinct (%) | 100.0% |
Missing | 12 |
Missing (%) | 24.5% |
Memory size | 524.0 B |
Length
Max length | 71 |
---|---|
Median length | 71 |
Mean length | 71 |
Min length | 71 |
Characters and Unicode
Total characters | 2627 |
---|---|
Distinct characters | 40 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 37 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E26.pdf |
---|---|
2nd row | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E08.pdf |
3rd row | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E09.pdf |
4th row | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E10.pdf |
5th row | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E03.pdf |
Value | Count | Frequency (%) |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e05.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e34.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e21.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e38.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e11.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e13.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e15.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e17.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e18.pdf | 1 | 2.7% |
https://smart.science.go.kr/upload_data/subject/bugs/pdf/insect_e19.pdf | 1 | 2.7% |
Other values (27) | 27 |
Most occurring characters
Value | Count | Frequency (%) |
/ | 259 | 9.9% |
s | 185 | 7.0% |
t | 185 | 7.0% |
p | 148 | 5.6% |
d | 148 | 5.6% |
a | 148 | 5.6% |
. | 148 | 5.6% |
u | 111 | 4.2% |
c | 111 | 4.2% |
e | 111 | 4.2% |
Other values (30) | 1073 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 1776 | |
Other Punctuation | 444 | 16.9% |
Uppercase Letter | 259 | 9.9% |
Connector Punctuation | 74 | 2.8% |
Decimal Number | 74 | 2.8% |
Most frequent character per category
Lowercase Letter
Value | Count | Frequency (%) |
s | 185 | 10.4% |
t | 185 | 10.4% |
p | 148 | 8.3% |
d | 148 | 8.3% |
a | 148 | 8.3% |
u | 111 | 6.2% |
c | 111 | 6.2% |
e | 111 | 6.2% |
g | 74 | 4.2% |
o | 74 | 4.2% |
Other values (10) | 481 |
Decimal Number
Value | Count | Frequency (%) |
2 | 13 | |
3 | 13 | |
1 | 12 | |
0 | 11 | |
8 | 5 | 6.8% |
9 | 5 | 6.8% |
4 | 5 | 6.8% |
6 | 4 | 5.4% |
5 | 3 | 4.1% |
7 | 3 | 4.1% |
Uppercase Letter
Value | Count | Frequency (%) |
E | 74 | |
S | 37 | |
N | 37 | |
I | 37 | |
C | 37 | |
T | 37 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 259 | |
. | 148 | |
: | 37 | 8.3% |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 74 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 2035 | |
Common | 592 | 22.5% |
Most frequent character per script
Latin
Value | Count | Frequency (%) |
s | 185 | 9.1% |
t | 185 | 9.1% |
p | 148 | 7.3% |
d | 148 | 7.3% |
a | 148 | 7.3% |
u | 111 | 5.5% |
c | 111 | 5.5% |
e | 111 | 5.5% |
g | 74 | 3.6% |
o | 74 | 3.6% |
Other values (16) | 740 |
Common
Value | Count | Frequency (%) |
/ | 259 | |
. | 148 | |
_ | 74 | 12.5% |
: | 37 | 6.2% |
2 | 13 | 2.2% |
3 | 13 | 2.2% |
1 | 12 | 2.0% |
0 | 11 | 1.9% |
8 | 5 | 0.8% |
9 | 5 | 0.8% |
Other values (4) | 15 | 2.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 2627 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
/ | 259 | 9.9% |
s | 185 | 7.0% |
t | 185 | 7.0% |
p | 148 | 5.6% |
d | 148 | 5.6% |
a | 148 | 5.6% |
. | 148 | 5.6% |
u | 111 | 4.2% |
c | 111 | 4.2% |
e | 111 | 4.2% |
Other values (30) | 1073 |
콘텐츠 아이디 | 중분류코드 | 콘텐츠 제목 | 이름 | 첨부파일 | |
---|---|---|---|---|---|
콘텐츠 아이디 | 1.000 | 0.790 | 1.000 | 0.790 | 1.000 |
중분류코드 | 0.790 | 1.000 | 1.000 | NaN | 1.000 |
콘텐츠 제목 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
이름 | 0.790 | NaN | 1.000 | 1.000 | 1.000 |
첨부파일 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
중분류코드 | 이름 | |
---|---|---|
중분류코드 | 1.000 | 1.000 |
이름 | 1.000 | 1.000 |
콘텐츠 아이디 | 중분류코드 | 이름 | |
---|---|---|---|
콘텐츠 아이디 | 1.000 | 0.587 | 0.647 |
중분류코드 | 0.587 | 1.000 | 1.000 |
이름 | 0.647 | 1.000 | 1.000 |
콘텐츠 아이디 | 대분류코드 | 중분류코드 | 콘텐츠 제목 | 이름 | 감수자 | 공개유무 | 첨부파일 | |
---|---|---|---|---|---|---|---|---|
0 | 1411 | 1019 | 1032 | 여치 | <NA> | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E26.pdf |
1 | 1412 | 1019 | 1032 | 이 | <NA> | 변봉규 교수 | Y | <NA> |
2 | 1420 | 1019 | 1032 | 벼룩 | <NA> | 변봉규 교수 | Y | <NA> |
3 | 1428 | 1019 | 1032 | 멋쟁이나비 | <NA> | 변봉규 교수 | Y | <NA> |
4 | 1393 | 1019 | 1031 | 흰개미목 | 매뚜기계열 | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E08.pdf |
5 | 1394 | 1019 | 1031 | 강도래목 | 매뚜기계열 | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E09.pdf |
6 | 1395 | 1019 | 1031 | 집게벌레목 | 매뚜기계열 | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E10.pdf |
7 | 1388 | 1019 | 1030 | 하루살이목 | <NA> | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E03.pdf |
8 | 1437 | 1019 | 1032 | 잠자리 | <NA> | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E49.pdf |
9 | 1386 | 1019 | 1029 | 좀목 | <NA> | 변봉규 교수 | Y | <NA> |
콘텐츠 아이디 | 대분류코드 | 중분류코드 | 콘텐츠 제목 | 이름 | 감수자 | 공개유무 | 첨부파일 | |
---|---|---|---|---|---|---|---|---|
39 | 1416 | 1019 | 1032 | 반날개 | <NA> | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E31.pdf |
40 | 1417 | 1019 | 1032 | 반딧불이 | <NA> | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E32.pdf |
41 | 1424 | 1019 | 1032 | 기생파리 | <NA> | 변봉규 교수 | Y | https://smart.science.go.kr/upload_data/subject/bugs/pdf/INSECT_E39.pdf |
42 | 1426 | 1019 | 1032 | 흰나비 | <NA> | 변봉규 교수 | Y | <NA> |
43 | 1427 | 1019 | 1032 | 모시나비 | <NA> | 변봉규 교수 | Y | <NA> |
44 | 1425 | 1019 | 1032 | 파리매 | <NA> | 변봉규 교수 | Y | <NA> |
45 | 1430 | 1019 | 1032 | 박각시 나방 | <NA> | 변봉규 교수 | Y | <NA> |
46 | 1429 | 1019 | 1032 | 팔랑나비 | <NA> | 변봉규 교수 | Y | <NA> |
47 | 1431 | 1019 | 1032 | 주머니 나방 | <NA> | 변봉규 교수 | Y | <NA> |
48 | 1432 | 1019 | 1032 | 독나방 | <NA> | 변봉규 교수 | Y | <NA> |