Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 592 |
Missing cells | 196 |
Missing cells (%) | 8.3% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 19.2 KiB |
Average record size in memory | 33.2 B |
Variable types
Numeric | 1 |
---|---|
Text | 2 |
Categorical | 1 |
Dataset
Description | 국립중앙박물관에서 제공하는 조선총독부박물관 공문서에 대한 데이터로 문권제목, 정리분류, 연도 항목을 제공합니다. |
---|---|
Author | 문화체육관광부 국립중앙박물관 |
URL | https://www.data.go.kr/data/3070537/fileData.do |
Reproduction
Analysis started | 2023-12-12 06:14:18.886645 |
---|---|
Analysis finished | 2023-12-12 06:14:19.623417 |
Duration | 0.74 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 592 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 297.375 |
Minimum | 1 |
---|---|
Maximum | 593 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 5.3 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 30.55 |
Q1 | 149.75 |
median | 297.5 |
Q3 | 445.25 |
95-th percentile | 563.45 |
Maximum | 593 |
Range | 592 |
Interquartile range (IQR) | 295.5 |
Descriptive statistics
Standard deviation | 171.22977 |
---|---|
Coefficient of variation (CV) | 0.5758042 |
Kurtosis | -1.1975536 |
Mean | 297.375 |
Median Absolute Deviation (MAD) | 148 |
Skewness | -0.0028923879 |
Sum | 176046 |
Variance | 29319.636 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.2% |
392 | 1 | 0.2% |
394 | 1 | 0.2% |
395 | 1 | 0.2% |
396 | 1 | 0.2% |
397 | 1 | 0.2% |
398 | 1 | 0.2% |
399 | 1 | 0.2% |
400 | 1 | 0.2% |
401 | 1 | 0.2% |
Other values (582) | 582 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
593 | 1 | |
592 | 1 | |
591 | 1 | |
590 | 1 | |
589 | 1 | |
588 | 1 | |
587 | 1 | |
586 | 1 | |
585 | 1 | |
584 | 1 |
문권제목
Text
Distinct | 582 |
---|---|
Distinct (%) | 98.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
Length
Max length | 62 |
---|---|
Median length | 44.5 |
Mean length | 18.739865 |
Min length | 2 |
Characters and Unicode
Total characters | 11094 |
---|---|
Distinct characters | 673 |
Distinct categories | 8 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 573 ? |
---|---|
Unique (%) | 96.8% |
Sample
1st row | 기부품 목록 |
---|---|
2nd row | 백자투조모란문호(白磁透彫牡丹文壺) |
3rd row | 수탁증서(受託證書) 1~96호 |
4th row | 대정 13년도~소화 4년도 진열품 기부 문서철 |
5th row | 대정 4년도~소화 8년도 진열품 기부 문서철 |
Value | Count | Frequency (%) |
대정 | 53 | 2.2% |
및 | 48 | 1.9% |
관계 | 36 | 1.5% |
소화 | 36 | 1.5% |
건 | 31 | 1.3% |
목록 | 30 | 1.2% |
고적 | 29 | 1.2% |
28 | 1.1% | |
쇼와(昭和 | 26 | 1.1% |
지정 | 26 | 1.1% |
Other values (1079) | 2120 |
Most occurring characters
Value | Count | Frequency (%) |
1883 | 17.0% | |
( | 331 | 3.0% |
) | 330 | 3.0% |
사 | 277 | 2.5% |
고 | 275 | 2.5% |
도 | 267 | 2.4% |
적 | 205 | 1.8% |
물 | 178 | 1.6% |
년 | 164 | 1.5% |
대 | 160 | 1.4% |
Other values (663) | 7024 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 7959 | |
Space Separator | 1883 | 17.0% |
Decimal Number | 412 | 3.7% |
Open Punctuation | 340 | 3.1% |
Close Punctuation | 340 | 3.1% |
Other Punctuation | 56 | 0.5% |
Dash Punctuation | 54 | 0.5% |
Math Symbol | 50 | 0.5% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 277 | 3.5% |
고 | 275 | 3.5% |
도 | 267 | 3.4% |
적 | 205 | 2.6% |
물 | 178 | 2.2% |
년 | 164 | 2.1% |
대 | 160 | 2.0% |
조 | 153 | 1.9% |
보 | 142 | 1.8% |
관 | 132 | 1.7% |
Other values (641) | 6006 |
Decimal Number
Value | Count | Frequency (%) |
1 | 147 | |
5 | 44 | 10.7% |
2 | 42 | 10.2% |
3 | 34 | 8.3% |
4 | 32 | 7.8% |
8 | 29 | 7.0% |
6 | 27 | 6.6% |
7 | 19 | 4.6% |
9 | 19 | 4.6% |
0 | 19 | 4.6% |
Open Punctuation
Value | Count | Frequency (%) |
( | 331 | |
[ | 8 | 2.4% |
「 | 1 | 0.3% |
Close Punctuation
Value | Count | Frequency (%) |
) | 330 | |
] | 9 | 2.6% |
」 | 1 | 0.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 53 | |
· | 2 | 3.6% |
. | 1 | 1.8% |
Space Separator
Value | Count | Frequency (%) |
1883 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 54 |
Math Symbol
Value | Count | Frequency (%) |
~ | 50 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 7129 | |
Common | 3135 | |
Han | 829 | 7.5% |
Hiragana | 1 | < 0.1% |
Most frequent character per script
Han
Value | Count | Frequency (%) |
寺 | 77 | 9.3% |
和 | 35 | 4.2% |
昭 | 34 | 4.1% |
大 | 22 | 2.7% |
正 | 18 | 2.2% |
殿 | 15 | 1.8% |
門 | 13 | 1.6% |
山 | 11 | 1.3% |
址 | 10 | 1.2% |
海 | 7 | 0.8% |
Other values (325) | 587 |
Hangul
Value | Count | Frequency (%) |
사 | 277 | 3.9% |
고 | 275 | 3.9% |
도 | 267 | 3.7% |
적 | 205 | 2.9% |
물 | 178 | 2.5% |
년 | 164 | 2.3% |
대 | 160 | 2.2% |
조 | 153 | 2.1% |
보 | 142 | 2.0% |
관 | 132 | 1.9% |
Other values (305) | 5176 |
Common
Value | Count | Frequency (%) |
1883 | ||
( | 331 | 10.6% |
) | 330 | 10.5% |
1 | 147 | 4.7% |
- | 54 | 1.7% |
, | 53 | 1.7% |
~ | 50 | 1.6% |
5 | 44 | 1.4% |
2 | 42 | 1.3% |
3 | 34 | 1.1% |
Other values (12) | 167 | 5.3% |
Hiragana
Value | Count | Frequency (%) |
の | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 7129 | |
ASCII | 3131 | |
CJK | 804 | 7.2% |
CJK Compat Ideographs | 25 | 0.2% |
None | 4 | < 0.1% |
Hiragana | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1883 | ||
( | 331 | 10.6% |
) | 330 | 10.5% |
1 | 147 | 4.7% |
- | 54 | 1.7% |
, | 53 | 1.7% |
~ | 50 | 1.6% |
5 | 44 | 1.4% |
2 | 42 | 1.3% |
3 | 34 | 1.1% |
Other values (9) | 163 | 5.2% |
Hangul
Value | Count | Frequency (%) |
사 | 277 | 3.9% |
고 | 275 | 3.9% |
도 | 267 | 3.7% |
적 | 205 | 2.9% |
물 | 178 | 2.5% |
년 | 164 | 2.3% |
대 | 160 | 2.2% |
조 | 153 | 2.1% |
보 | 142 | 2.0% |
관 | 132 | 1.9% |
Other values (305) | 5176 |
CJK
Value | Count | Frequency (%) |
寺 | 77 | 9.6% |
和 | 35 | 4.4% |
昭 | 34 | 4.2% |
大 | 22 | 2.7% |
正 | 18 | 2.2% |
殿 | 15 | 1.9% |
門 | 13 | 1.6% |
山 | 11 | 1.4% |
址 | 10 | 1.2% |
海 | 7 | 0.9% |
Other values (312) | 562 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
林 | 5 | |
金 | 5 | |
陵 | 3 | |
嶺 | 2 | 8.0% |
洛 | 2 | 8.0% |
靈 | 1 | 4.0% |
不 | 1 | 4.0% |
練 | 1 | 4.0% |
立 | 1 | 4.0% |
丹 | 1 | 4.0% |
Other values (3) | 3 |
None
Value | Count | Frequency (%) |
· | 2 | |
「 | 1 | |
」 | 1 |
Hiragana
Value | Count | Frequency (%) |
の | 1 |
정리분류
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 4.8 KiB |
보존 | |
---|---|
고적조사 | |
지정 | |
진열 | |
국유림 | |
Other values (7) |
Length
Max length | 6 |
---|---|
Median length | 2 |
Mean length | 2.7179054 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.3% |
Sample
1st row | 기부 |
---|---|
2nd row | 기부 |
3rd row | 기부 |
4th row | 기부 |
5th row | 기부 |
Common Values
Value | Count | Frequency (%) |
보존 | 197 | |
고적조사 | 193 | |
지정 | 56 | 9.5% |
진열 | 33 | 5.6% |
국유림 | 33 | 5.6% |
기타 | 26 | 4.4% |
발견 | 24 | 4.1% |
구입 | 20 | 3.4% |
기부 | 6 | 1.0% |
도면 | 2 | 0.3% |
Other values (2) | 2 | 0.3% |
Length
Value | Count | Frequency (%) |
보존 | 197 | |
고적조사 | 193 | |
지정 | 56 | 9.5% |
진열 | 33 | 5.6% |
국유림 | 33 | 5.6% |
기타 | 26 | 4.4% |
발견 | 24 | 4.1% |
구입 | 20 | 3.4% |
기부 | 6 | 1.0% |
도면 | 2 | 0.3% |
Other values (2) | 2 | 0.3% |
연도
Text
MISSING
 
Distinct | 181 |
---|---|
Distinct (%) | 45.7% |
Missing | 196 |
Missing (%) | 33.1% |
Memory size | 4.8 KiB |
Value | Count | Frequency (%) |
대정 | 38 | 9.3% |
대정06 | 18 | 4.4% |
소화13 | 14 | 3.4% |
소화09 | 13 | 3.2% |
소화04 | 12 | 2.9% |
소화05 | 11 | 2.7% |
대정05 | 9 | 2.2% |
소화12 | 9 | 2.2% |
대정11 | 8 | 2.0% |
소화15 | 8 | 2.0% |
Other values (172) | 269 |
Most occurring characters
Value | Count | Frequency (%) |
1 | 327 | |
0 | 270 | |
소 | 251 | |
화 | 251 | |
대 | 164 | 7.5% |
정 | 164 | 7.5% |
~ | 113 | 5.2% |
4 | 74 | 3.4% |
5 | 72 | 3.3% |
, | 71 | 3.2% |
Other values (18) | 428 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 1093 | |
Other Letter | 872 | |
Math Symbol | 113 | 5.2% |
Other Punctuation | 73 | 3.3% |
Space Separator | 13 | 0.6% |
Open Punctuation | 8 | 0.4% |
Close Punctuation | 8 | 0.4% |
Dash Punctuation | 5 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
소 | 251 | |
화 | 251 | |
대 | 164 | |
정 | 164 | |
치 | 10 | 1.1% |
명 | 10 | 1.1% |
융 | 8 | 0.9% |
희 | 8 | 0.9% |
년 | 4 | 0.5% |
연 | 1 | 0.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 327 | |
0 | 270 | |
4 | 74 | 6.8% |
5 | 72 | 6.6% |
6 | 64 | 5.9% |
2 | 62 | 5.7% |
9 | 61 | 5.6% |
3 | 57 | 5.2% |
8 | 53 | 4.8% |
7 | 53 | 4.8% |
Other Punctuation
Value | Count | Frequency (%) |
, | 71 | |
. | 2 | 2.7% |
Math Symbol
Value | Count | Frequency (%) |
~ | 113 |
Space Separator
Value | Count | Frequency (%) |
13 |
Open Punctuation
Value | Count | Frequency (%) |
( | 8 |
Close Punctuation
Value | Count | Frequency (%) |
) | 8 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 1313 | |
Hangul | 872 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 327 | |
0 | 270 | |
~ | 113 | 8.6% |
4 | 74 | 5.6% |
5 | 72 | 5.5% |
, | 71 | 5.4% |
6 | 64 | 4.9% |
2 | 62 | 4.7% |
9 | 61 | 4.6% |
3 | 57 | 4.3% |
Other values (7) | 142 |
Hangul
Value | Count | Frequency (%) |
소 | 251 | |
화 | 251 | |
대 | 164 | |
정 | 164 | |
치 | 10 | 1.1% |
명 | 10 | 1.1% |
융 | 8 | 0.9% |
희 | 8 | 0.9% |
년 | 4 | 0.5% |
연 | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 1313 | |
Hangul | 872 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 327 | |
0 | 270 | |
~ | 113 | 8.6% |
4 | 74 | 5.6% |
5 | 72 | 5.5% |
, | 71 | 5.4% |
6 | 64 | 4.9% |
2 | 62 | 4.7% |
9 | 61 | 4.6% |
3 | 57 | 4.3% |
Other values (7) | 142 |
Hangul
Value | Count | Frequency (%) |
소 | 251 | |
화 | 251 | |
대 | 164 | |
정 | 164 | |
치 | 10 | 1.1% |
명 | 10 | 1.1% |
융 | 8 | 0.9% |
희 | 8 | 0.9% |
년 | 4 | 0.5% |
연 | 1 | 0.1% |
연번 | 정리분류 | |
---|---|---|
연번 | 1.000 | 0.849 |
정리분류 | 0.849 | 1.000 |
연번 | 정리분류 | |
---|---|---|
연번 | 1.000 | 0.576 |
정리분류 | 0.576 | 1.000 |
연번 | 문권제목 | 정리분류 | 연도 | |
---|---|---|---|---|
0 | 1 | 기부품 목록 | 기부 | 대정12, 소화19 |
1 | 2 | 백자투조모란문호(白磁透彫牡丹文壺) | 기부 | 소화15 |
2 | 3 | 수탁증서(受託證書) 1~96호 | 기부 | <NA> |
3 | 4 | 대정 13년도~소화 4년도 진열품 기부 문서철 | 기부 | 대정09~소화04 |
4 | 5 | 대정 4년도~소화 8년도 진열품 기부 문서철 | 기부 | 대정04~소화07 |
5 | 6 | 소화 8~13년도 진열품 기부 문서철 | 기부 | 소화09~13 |
6 | 7 | 대정 4년도 진열물품 청구서 | 진열 | 대정04 |
7 | 8 | 대정 5년도 박물관 진열품 대장 고본 | 진열 | 대정05 |
8 | 9 | 대정 6년도 진열물품 청구서 | 진열 | 대정06, 소화09.13,14 |
9 | 10 | 대정 7년도 진열물품 청구서 | 진열 | 대정07 |
연번 | 문권제목 | 정리분류 | 연도 | |
---|---|---|---|---|
582 | 584 | 부읍 소재 보물 건조물 전시 비상 조치 요강 | 기타 | <NA> |
583 | 585 | 상주분랑기(常住分記) | 기타 | <NA> |
584 | 586 | 고려도경 필사본 일부 및 고려자기 관련 내용 | 기타 | <NA> |
585 | 587 | 「조선의 혼인형태(朝鮮の婚姻形態)」, 아키바 다카시(秋葉隆, 추엽륭), 문학논집 49-64 | 기타 | <NA> |
586 | 588 | 좌석배치도 | 기타 | <NA> |
587 | 589 | 건조물 조사 계획 지도 | 기타 | <NA> |
588 | 590 | 진해 요항(要港) 부근 사적 개설 | 고적조사 | <NA> |
589 | 591 | 칭원(稱元)에 관한 자료 | 기타 | <NA> |
590 | 592 | 탁본 명세 | 기타 | <NA> |
591 | 593 | 제1회 조선총독부 사료 조사 사진첩 명함판 - 함경도 | 고적조사 | <NA> |