Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 2937 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 295 |
Duplicate rows (%) | 10.0% |
Total size in memory | 94.8 KiB |
Average record size in memory | 33.0 B |
Variable types
Text | 2 |
---|---|
Categorical | 1 |
Numeric | 1 |
Dataset
Description | 국립중앙과학관 홈페이지에 있는 과학학습콘텐츠의 통계테이블 목록입니다. |
---|---|
Author | 과학기술정보통신부 국립중앙과학관 |
URL | https://www.data.go.kr/data/15067817/fileData.do |
Dataset has 295 (10.0%) duplicate rows | Duplicates |
Reproduction
Analysis started | 2023-12-12 23:56:23.223752 |
---|---|
Analysis finished | 2023-12-12 23:56:23.610595 |
Duration | 0.39 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
내용 아이디
Text
Distinct | 154 |
---|---|
Distinct (%) | 5.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 23.1 KiB |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 12 |
Min length | 12 |
Characters and Unicode
Total characters | 35244 |
---|---|
Distinct characters | 12 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 19 ? |
---|---|
Unique (%) | 0.6% |
Sample
1st row | CT0000000069 |
---|---|
2nd row | CT0000000070 |
3rd row | CT0000000071 |
4th row | CT0000000072 |
5th row | CT0000000073 |
Value | Count | Frequency (%) |
ct0000000129 | 53 | 1.8% |
ct0000000137 | 50 | 1.7% |
ct0000000131 | 50 | 1.7% |
ct0000000130 | 47 | 1.6% |
ct0000000023 | 46 | 1.6% |
ct0000000127 | 44 | 1.5% |
ct0000000021 | 44 | 1.5% |
ct0000000125 | 42 | 1.4% |
ct0000000126 | 41 | 1.4% |
ct0000000079 | 40 | 1.4% |
Other values (144) | 2480 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 22336 | |
C | 2937 | 8.3% |
T | 2937 | 8.3% |
1 | 2032 | 5.8% |
3 | 896 | 2.5% |
2 | 768 | 2.2% |
4 | 650 | 1.8% |
5 | 624 | 1.8% |
6 | 603 | 1.7% |
7 | 558 | 1.6% |
Other values (2) | 903 | 2.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 29370 | |
Uppercase Letter | 5874 | 16.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 22336 | |
1 | 2032 | 6.9% |
3 | 896 | 3.1% |
2 | 768 | 2.6% |
4 | 650 | 2.2% |
5 | 624 | 2.1% |
6 | 603 | 2.1% |
7 | 558 | 1.9% |
8 | 459 | 1.6% |
9 | 444 | 1.5% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 2937 | |
T | 2937 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 29370 | |
Latin | 5874 | 16.7% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 22336 | |
1 | 2032 | 6.9% |
3 | 896 | 3.1% |
2 | 768 | 2.6% |
4 | 650 | 2.2% |
5 | 624 | 2.1% |
6 | 603 | 2.1% |
7 | 558 | 1.9% |
8 | 459 | 1.6% |
9 | 444 | 1.5% |
Latin
Value | Count | Frequency (%) |
C | 2937 | |
T | 2937 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 35244 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 22336 | |
C | 2937 | 8.3% |
T | 2937 | 8.3% |
1 | 2032 | 5.8% |
3 | 896 | 2.5% |
2 | 768 | 2.2% |
4 | 650 | 1.8% |
5 | 624 | 1.8% |
6 | 603 | 1.7% |
7 | 558 | 1.6% |
Other values (2) | 903 | 2.6% |
대분류코드
Categorical
Distinct | 3 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 23.1 KiB |
C001 | |
---|---|
C002 | |
C003 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | C002 |
---|---|
2nd row | C002 |
3rd row | C002 |
4th row | C002 |
5th row | C002 |
Common Values
Value | Count | Frequency (%) |
C001 | 1730 | |
C002 | 766 | |
C003 | 441 | 15.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
c001 | 1730 | |
c002 | 766 | |
c003 | 441 | 15.0% |
제목_한글명
Text
Distinct | 154 |
---|---|
Distinct (%) | 5.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 23.1 KiB |
Value | Count | Frequency (%) |
공룡은 | 186 | 4.3% |
금속활자 | 115 | 2.6% |
가장 | 103 | 2.4% |
공룡이 | 74 | 1.7% |
어떤 | 74 | 1.7% |
휴보 | 68 | 1.6% |
브라키오사우루스 | 53 | 1.2% |
했나요 | 50 | 1.1% |
왜 | 50 | 1.1% |
덩치가 | 50 | 1.1% |
Other values (179) | 3541 |
Most occurring characters
Value | Count | Frequency (%) |
스 | 1441 | 6.9% |
1427 | 6.8% | |
사 | 936 | 4.5% |
루 | 877 | 4.2% |
우 | 848 | 4.0% |
자 | 789 | 3.8% |
로 | 568 | 2.7% |
라 | 417 | 2.0% |
룡 | 399 | 1.9% |
오 | 363 | 1.7% |
Other values (214) | 12875 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 19059 | |
Space Separator | 1427 | 6.8% |
Other Punctuation | 361 | 1.7% |
Decimal Number | 92 | 0.4% |
Uppercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
스 | 1441 | 7.6% |
사 | 936 | 4.9% |
루 | 877 | 4.6% |
우 | 848 | 4.4% |
자 | 789 | 4.1% |
로 | 568 | 3.0% |
라 | 417 | 2.2% |
룡 | 399 | 2.1% |
오 | 363 | 1.9% |
의 | 332 | 1.7% |
Other values (209) | 12089 |
Decimal Number
Value | Count | Frequency (%) |
2 | 81 | |
6 | 11 | 12.0% |
Space Separator
Value | Count | Frequency (%) |
1427 |
Other Punctuation
Value | Count | Frequency (%) |
? | 361 |
Uppercase Letter
Value | Count | Frequency (%) |
P | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 19059 | |
Common | 1880 | 9.0% |
Latin | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
스 | 1441 | 7.6% |
사 | 936 | 4.9% |
루 | 877 | 4.6% |
우 | 848 | 4.4% |
자 | 789 | 4.1% |
로 | 568 | 3.0% |
라 | 417 | 2.2% |
룡 | 399 | 2.1% |
오 | 363 | 1.9% |
의 | 332 | 1.7% |
Other values (209) | 12089 |
Common
Value | Count | Frequency (%) |
1427 | ||
? | 361 | 19.2% |
2 | 81 | 4.3% |
6 | 11 | 0.6% |
Latin
Value | Count | Frequency (%) |
P | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 19059 | |
ASCII | 1881 | 9.0% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
스 | 1441 | 7.6% |
사 | 936 | 4.9% |
루 | 877 | 4.6% |
우 | 848 | 4.4% |
자 | 789 | 4.1% |
로 | 568 | 3.0% |
라 | 417 | 2.2% |
룡 | 399 | 2.1% |
오 | 363 | 1.9% |
의 | 332 | 1.7% |
Other values (209) | 12089 |
ASCII
Value | Count | Frequency (%) |
1427 | ||
? | 361 | 19.2% |
2 | 81 | 4.3% |
6 | 11 | 0.6% |
P | 1 | 0.1% |
조회수
Real number (ℝ)
Distinct | 18 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1.8781069 |
Minimum | 1 |
---|---|
Maximum | 20 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 25.9 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 1 |
median | 1 |
Q3 | 2 |
95-th percentile | 6 |
Maximum | 20 |
Range | 19 |
Interquartile range (IQR) | 1 |
Descriptive statistics
Standard deviation | 2.0439952 |
---|---|
Coefficient of variation (CV) | 1.0883274 |
Kurtosis | 14.750095 |
Mean | 1.8781069 |
Median Absolute Deviation (MAD) | 0 |
Skewness | 3.489275 |
Sum | 5516 |
Variance | 4.1779163 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 2072 | |
2 | 392 | 13.3% |
4 | 129 | 4.4% |
3 | 108 | 3.7% |
5 | 71 | 2.4% |
7 | 36 | 1.2% |
6 | 28 | 1.0% |
8 | 24 | 0.8% |
10 | 22 | 0.7% |
9 | 21 | 0.7% |
Other values (8) | 34 | 1.2% |
Value | Count | Frequency (%) |
1 | 2072 | |
2 | 392 | 13.3% |
3 | 108 | 3.7% |
4 | 129 | 4.4% |
5 | 71 | 2.4% |
6 | 28 | 1.0% |
7 | 36 | 1.2% |
8 | 24 | 0.8% |
9 | 21 | 0.7% |
10 | 22 | 0.7% |
Value | Count | Frequency (%) |
20 | 1 | < 0.1% |
18 | 1 | < 0.1% |
16 | 3 | 0.1% |
15 | 3 | 0.1% |
14 | 4 | 0.1% |
13 | 4 | 0.1% |
12 | 7 | 0.2% |
11 | 11 | |
10 | 22 | |
9 | 21 |
대분류코드 | 조회수 | |
---|---|---|
대분류코드 | 1.000 | 0.097 |
조회수 | 0.097 | 1.000 |
조회수 | 대분류코드 | |
---|---|---|
조회수 | 1.000 | 0.058 |
대분류코드 | 0.058 | 1.000 |
내용 아이디 | 대분류코드 | 제목_한글명 | 조회수 | |
---|---|---|---|---|
0 | CT0000000069 | C002 | 정유자 | 7 |
1 | CT0000000070 | C002 | 정리자 | 5 |
2 | CT0000000071 | C002 | 정리자체 철활자 | 9 |
3 | CT0000000072 | C002 | 전사자 | 4 |
4 | CT0000000073 | C002 | 필서체 철활자 | 10 |
5 | CT0000000074 | C002 | 신연활자자 | 9 |
6 | CT0000000075 | C002 | 구텐베르크 금속활자 | 10 |
7 | CT0000000075 | C002 | 구텐베르크 금속활자 | 7 |
8 | CT0000000075 | C002 | 구텐베르크 금속활자 | 6 |
9 | CT0000000079 | C003 | 휴보2 제작사양서 | 10 |
내용 아이디 | 대분류코드 | 제목_한글명 | 조회수 | |
---|---|---|---|---|
2927 | CT0000000112 | C001 | 스트루티오미무스 | 1 |
2928 | CT0000000163 | C001 | 투오지앙고사우루스 | 1 |
2929 | CT0000000130 | C001 | 가장 사나운 공룡은? | 1 |
2930 | CT0000000075 | C002 | 구텐베르크 금속활자 | 1 |
2931 | CT0000000037 | C002 | 고려시대의 금속활자 | 1 |
2932 | CT0000000137 | C001 | 공룡은 왜 멸종을 했나요? | 1 |
2933 | CT0000000041 | C002 | 흥덕사자 | 1 |
2934 | CT0000000032 | C002 | 금속활자 만들기 | 1 |
2935 | CT0000000073 | C002 | 필서체 철활자 | 1 |
2936 | CT0000000051 | C002 | 을유자 | 20 |
Most frequently occurring
내용 아이디 | 대분류코드 | 제목_한글명 | 조회수 | # duplicates | |
---|---|---|---|---|---|
192 | CT0000000130 | C001 | 가장 사나운 공룡은? | 1 | 30 |
198 | CT0000000131 | C001 | 가장 덩치가 큰 공룡은? | 1 | 30 |
9 | CT0000000021 | C003 | 휴보 | 1 | 29 |
15 | CT0000000023 | C003 | 키보 | 1 | 28 |
113 | CT0000000079 | C003 | 휴보2 제작사양서 | 1 | 28 |
29 | CT0000000027 | C002 | 금속활자란 무엇인가 | 1 | 27 |
52 | CT0000000041 | C002 | 흥덕사자 | 1 | 27 |
188 | CT0000000129 | C001 | 브라키오사우루스 | 1 | 27 |
40 | CT0000000036 | C002 | 금속활자의 의의 | 1 | 26 |
175 | CT0000000126 | C001 | 데이노니쿠스 | 1 | 26 |