Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 10000 |
Missing cells | 874 |
Missing cells (%) | 0.7% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.1 MiB |
Average record size in memory | 115.0 B |
Variable types
Numeric | 3 |
---|---|
Text | 8 |
Boolean | 2 |
Dataset
Description | 독립운동가의 인적사항과 당시 활동상을 확인하기 위해서는 판결문이나 재소자 신분카드,범죄인 명부,수형인 명부,당시의 기관지,정보 보고서, 신문 등이 많이 활용됩니다. 그러나 사학을 전공한 전문가가 아닌 일반 개인이 이런 자료를 찾고 확인하기란 쉬운 일이 아니며, 검색채널 또한 제한적입니다. 따라서,국가기록원에 소장중인 형사사건 판결문 중 독립운동 관련 판결문을 선별하고, 내용 이해를 돕기 위해 판결주문을 번역, 사건개요 및 주제어 등을 작성하여 일반국민들과 학술연구자들이 보다 쉽게 검색 활용할 수 있게 하기 위해 본 콘텐츠을 구축하였습니다. |
---|---|
Author | 행정안전부 국가기록원 |
URL | https://www.data.go.kr/data/15084333/fileData.do |
판결문_원문_제공 is highly imbalanced (98.7%) | Imbalance |
판결문_번역본_제공 is highly imbalanced (95.6%) | Imbalance |
사건개요 has 844 (8.4%) missing values | Missing |
마이크로필름번호 is highly skewed (γ1 = 60.53749223) | Skewed |
연번 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 18:17:30.252581 |
---|---|
Analysis finished | 2023-12-12 18:17:34.355955 |
Duration | 4.1 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9530.3063 |
Minimum | 1 |
---|---|
Maximum | 19167 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 931.8 |
Q1 | 4802.75 |
median | 9464.5 |
Q3 | 14256.25 |
95-th percentile | 18208.05 |
Maximum | 19167 |
Range | 19166 |
Interquartile range (IQR) | 9453.5 |
Descriptive statistics
Standard deviation | 5497.3614 |
---|---|
Coefficient of variation (CV) | 0.57682946 |
Kurtosis | -1.1805993 |
Mean | 9530.3063 |
Median Absolute Deviation (MAD) | 4725.5 |
Skewness | 0.0058705807 |
Sum | 95303063 |
Variance | 30220982 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3794 | 1 | < 0.1% |
10064 | 1 | < 0.1% |
10965 | 1 | < 0.1% |
4363 | 1 | < 0.1% |
3109 | 1 | < 0.1% |
8518 | 1 | < 0.1% |
5359 | 1 | < 0.1% |
10586 | 1 | < 0.1% |
11498 | 1 | < 0.1% |
2900 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
1 | 1 | |
4 | 1 | |
6 | 1 | |
8 | 1 | |
10 | 1 | |
11 | 1 | |
16 | 1 | |
18 | 1 | |
19 | 1 | |
21 | 1 |
Value | Count | Frequency (%) |
19167 | 1 | |
19166 | 1 | |
19165 | 1 | |
19164 | 1 | |
19159 | 1 | |
19157 | 1 | |
19156 | 1 | |
19154 | 1 | |
19153 | 1 | |
19149 | 1 |
이름_별명
Text
Distinct | 7888 |
---|---|
Distinct (%) | 78.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 74 |
---|---|
Median length | 9 |
Mean length | 10.2807 |
Min length | 7 |
Characters and Unicode
Total characters | 102807 |
---|---|
Distinct characters | 1635 |
Distinct categories | 11 ? |
Distinct scripts | 5 ? |
Distinct blocks | 6 ? |
Unique
Unique | 6185 ? |
---|---|
Unique (%) | 61.9% |
Sample
1st row | 김응하(金應河) |
---|---|
2nd row | 최종하(崔宗河) |
3rd row | 정봉조(鄭鳳朝) |
4th row | 이채룡(李彩龍) |
5th row | 이중식(李仲植) |
Value | Count | Frequency (%) |
양전백(梁甸伯 | 7 | 0.1% |
최경호(崔京鎬 | 6 | 0.1% |
안경수(安敬秀 | 6 | 0.1% |
여도현(呂道鉉 | 6 | 0.1% |
김원배(金元培 | 6 | 0.1% |
김봉수(金鳳洙 | 6 | 0.1% |
김학수(金學洙 | 6 | 0.1% |
김윤식(金允植 | 6 | 0.1% |
김병기(金炳基 | 5 | < 0.1% |
양기탁(梁起鐸 | 5 | < 0.1% |
Other values (7889) | 10006 |
Most occurring characters
Value | Count | Frequency (%) |
( | 11719 | 11.4% |
) | 11716 | 11.4% |
8505 | 8.3% | |
金 | 2309 | 2.2% |
김 | 2304 | 2.2% |
이 | 1929 | 1.9% |
李 | 1813 | 1.8% |
박 | 820 | 0.8% |
朴 | 815 | 0.8% |
정 | 794 | 0.8% |
Other values (1625) | 60083 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 70424 | |
Open Punctuation | 11719 | 11.4% |
Close Punctuation | 11716 | 11.4% |
Space Separator | 8505 | 8.3% |
Decimal Number | 153 | 0.1% |
Connector Punctuation | 102 | 0.1% |
Other Punctuation | 53 | 0.1% |
Uppercase Letter | 51 | < 0.1% |
Lowercase Letter | 51 | < 0.1% |
Other Symbol | 31 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
金 | 2309 | 3.3% |
김 | 2304 | 3.3% |
이 | 1929 | 2.7% |
李 | 1813 | 2.6% |
박 | 820 | 1.2% |
朴 | 815 | 1.2% |
정 | 794 | 1.1% |
영 | 689 | 1.0% |
성 | 656 | 0.9% |
수 | 588 | 0.8% |
Other values (1614) | 57707 |
Other Punctuation
Value | Count | Frequency (%) |
, | 52 | |
/ | 1 | 1.9% |
Open Punctuation
Value | Count | Frequency (%) |
( | 11719 |
Close Punctuation
Value | Count | Frequency (%) |
) | 11716 |
Space Separator
Value | Count | Frequency (%) |
8505 |
Decimal Number
Value | Count | Frequency (%) |
0 | 153 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 102 |
Uppercase Letter
Value | Count | Frequency (%) |
D | 51 |
Lowercase Letter
Value | Count | Frequency (%) |
x | 51 |
Other Symbol
Value | Count | Frequency (%) |
○ | 31 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 35314 | |
Han | 35095 | |
Common | 32281 | |
Latin | 102 | 0.1% |
Katakana | 15 | < 0.1% |
Most frequent character per script
Han
Value | Count | Frequency (%) |
金 | 2309 | 6.6% |
李 | 1813 | 5.2% |
朴 | 815 | 2.3% |
崔 | 543 | 1.5% |
鄭 | 419 | 1.2% |
永 | 340 | 1.0% |
基 | 319 | 0.9% |
相 | 311 | 0.9% |
鍾 | 302 | 0.9% |
錫 | 296 | 0.8% |
Other values (1256) | 27628 |
Hangul
Value | Count | Frequency (%) |
김 | 2304 | 6.5% |
이 | 1929 | 5.5% |
박 | 820 | 2.3% |
정 | 794 | 2.2% |
영 | 689 | 2.0% |
성 | 656 | 1.9% |
수 | 588 | 1.7% |
기 | 550 | 1.6% |
최 | 543 | 1.5% |
용 | 489 | 1.4% |
Other values (334) | 25952 |
Katakana
Value | Count | Frequency (%) |
ス | 2 | |
リ | 1 | 6.7% |
バ | 1 | 6.7% |
サ | 1 | 6.7% |
エ | 1 | 6.7% |
ジ | 1 | 6.7% |
ル | 1 | 6.7% |
キ | 1 | 6.7% |
ブ | 1 | 6.7% |
ホ | 1 | 6.7% |
Other values (4) | 4 |
Common
Value | Count | Frequency (%) |
( | 11719 | |
) | 11716 | |
8505 | ||
0 | 153 | 0.5% |
_ | 102 | 0.3% |
, | 52 | 0.2% |
○ | 31 | 0.1% |
- | 2 | < 0.1% |
/ | 1 | < 0.1% |
Latin
Value | Count | Frequency (%) |
D | 51 | |
x | 51 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 35314 | |
ASCII | 32352 | |
CJK | 32079 | |
CJK Compat Ideographs | 3016 | 2.9% |
Geometric Shapes | 31 | < 0.1% |
Katakana | 15 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
( | 11719 | |
) | 11716 | |
8505 | ||
0 | 153 | 0.5% |
_ | 102 | 0.3% |
, | 52 | 0.2% |
D | 51 | 0.2% |
x | 51 | 0.2% |
- | 2 | < 0.1% |
/ | 1 | < 0.1% |
CJK
Value | Count | Frequency (%) |
金 | 2309 | 7.2% |
朴 | 815 | 2.5% |
崔 | 543 | 1.7% |
鄭 | 419 | 1.3% |
永 | 340 | 1.1% |
基 | 319 | 1.0% |
相 | 311 | 1.0% |
鍾 | 302 | 0.9% |
錫 | 296 | 0.9% |
元 | 294 | 0.9% |
Other values (1196) | 26131 |
Hangul
Value | Count | Frequency (%) |
김 | 2304 | 6.5% |
이 | 1929 | 5.5% |
박 | 820 | 2.3% |
정 | 794 | 2.2% |
영 | 689 | 2.0% |
성 | 656 | 1.9% |
수 | 588 | 1.7% |
기 | 550 | 1.6% |
최 | 543 | 1.5% |
용 | 489 | 1.4% |
Other values (334) | 25952 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
李 | 1813 | |
林 | 167 | 5.5% |
龍 | 137 | 4.5% |
金 | 118 | 3.9% |
柳 | 109 | 3.6% |
梁 | 106 | 3.5% |
劉 | 76 | 2.5% |
盧 | 61 | 2.0% |
羅 | 52 | 1.7% |
沈 | 44 | 1.5% |
Other values (50) | 333 | 11.0% |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 31 |
Katakana
Value | Count | Frequency (%) |
ス | 2 | |
リ | 1 | 6.7% |
バ | 1 | 6.7% |
サ | 1 | 6.7% |
エ | 1 | 6.7% |
ジ | 1 | 6.7% |
ル | 1 | 6.7% |
キ | 1 | 6.7% |
ブ | 1 | 6.7% |
ホ | 1 | 6.7% |
Other values (4) | 4 |
당시나이
Text
Distinct | 1801 |
---|---|
Distinct (%) | 18.0% |
Missing | 6 |
Missing (%) | 0.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
22세 | 387 | 3.3% |
24세 | 379 | 3.2% |
23세 | 374 | 3.2% |
25세 | 359 | 3.1% |
21세 | 358 | 3.1% |
26세 | 351 | 3.0% |
30세 | 341 | 2.9% |
27세 | 340 | 2.9% |
29세 | 336 | 2.9% |
20세 | 313 | 2.7% |
Other values (902) | 8199 |
Most occurring characters
Value | Count | Frequency (%) |
세 | 9975 | |
2 | 6654 | |
3 | 4152 | 8.7% |
1 | 3739 | 7.8% |
4 | 2533 | 5.3% |
) | 2036 | 4.2% |
( | 2033 | 4.2% |
월 | 2031 | 4.2% |
생 | 2026 | 4.2% |
일 | 1981 | 4.1% |
Other values (22) | 10804 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 26035 | |
Other Letter | 16112 | |
Close Punctuation | 2036 | 4.2% |
Open Punctuation | 2033 | 4.2% |
Space Separator | 1744 | 3.6% |
Other Punctuation | 3 | < 0.1% |
Other Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
세 | 9975 | |
월 | 2031 | 12.6% |
생 | 2026 | 12.6% |
일 | 1981 | 12.3% |
년 | 45 | 0.3% |
상 | 20 | 0.1% |
미 | 14 | 0.1% |
불 | 6 | < 0.1% |
음 | 4 | < 0.1% |
生 | 2 | < 0.1% |
Other values (6) | 8 | < 0.1% |
Decimal Number
Value | Count | Frequency (%) |
2 | 6654 | |
3 | 4152 | |
1 | 3739 | |
4 | 2533 | 9.7% |
5 | 1850 | 7.1% |
0 | 1526 | 5.9% |
6 | 1478 | 5.7% |
9 | 1429 | 5.5% |
8 | 1365 | 5.2% |
7 | 1309 | 5.0% |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 | |
, | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2036 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2033 |
Space Separator
Value | Count | Frequency (%) |
1744 |
Other Symbol
Value | Count | Frequency (%) |
○ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 31852 | |
Hangul | 16103 | |
Han | 9 | < 0.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
2 | 6654 | |
3 | 4152 | |
1 | 3739 | |
4 | 2533 | 8.0% |
) | 2036 | 6.4% |
( | 2033 | 6.4% |
5 | 1850 | 5.8% |
1744 | 5.5% | |
0 | 1526 | 4.8% |
6 | 1478 | 4.6% |
Other values (6) | 4107 |
Hangul
Value | Count | Frequency (%) |
세 | 9975 | |
월 | 2031 | 12.6% |
생 | 2026 | 12.6% |
일 | 1981 | 12.3% |
년 | 45 | 0.3% |
상 | 20 | 0.1% |
미 | 14 | 0.1% |
불 | 6 | < 0.1% |
음 | 4 | < 0.1% |
얼 | 1 | < 0.1% |
Han
Value | Count | Frequency (%) |
生 | 2 | |
日 | 2 | |
月 | 2 | |
陰 | 1 | |
永 | 1 | |
嘉 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 31851 | |
Hangul | 16103 | |
CJK | 9 | < 0.1% |
Geometric Shapes | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
세 | 9975 | |
월 | 2031 | 12.6% |
생 | 2026 | 12.6% |
일 | 1981 | 12.3% |
년 | 45 | 0.3% |
상 | 20 | 0.1% |
미 | 14 | 0.1% |
불 | 6 | < 0.1% |
음 | 4 | < 0.1% |
얼 | 1 | < 0.1% |
ASCII
Value | Count | Frequency (%) |
2 | 6654 | |
3 | 4152 | |
1 | 3739 | |
4 | 2533 | 8.0% |
) | 2036 | 6.4% |
( | 2033 | 6.4% |
5 | 1850 | 5.8% |
1744 | 5.5% | |
0 | 1526 | 4.8% |
6 | 1478 | 4.6% |
Other values (5) | 4106 |
CJK
Value | Count | Frequency (%) |
生 | 2 | |
日 | 2 | |
月 | 2 | |
陰 | 1 | |
永 | 1 | |
嘉 | 1 |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 1 |
본적주소
Text
Distinct | 6804 |
---|---|
Distinct (%) | 68.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 44 |
---|---|
Median length | 36 |
Mean length | 17.0037 |
Min length | 2 |
Characters and Unicode
Total characters | 170037 |
---|---|
Distinct characters | 571 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 5344 ? |
---|---|
Unique (%) | 53.4% |
Sample
1st row | 황해도 수안군 수안면 석교리 |
---|---|
2nd row | 강원도 횡성군 횡성면 읍상리 |
3rd row | 지나 간도 장백현 16도구 서덕수 |
4th row | 황해도 수안군 수안면 자의리 |
5th row | 경북 영덕군 영해면 묘곡동 |
Value | Count | Frequency (%) |
경기도 | 1353 | 3.2% |
전라남도 | 1173 | 2.7% |
번지 | 950 | 2.2% |
경상북도 | 878 | 2.0% |
경성부 | 878 | 2.0% |
전라북도 | 694 | 1.6% |
강원도 | 553 | 1.3% |
경북 | 547 | 1.3% |
황해도 | 516 | 1.2% |
함경남도 | 438 | 1.0% |
Other values (7268) | 34965 |
Most occurring characters
Value | Count | Frequency (%) |
33020 | 19.4% | |
군 | 8221 | 4.8% |
도 | 8066 | 4.7% |
면 | 7888 | 4.6% |
리 | 6100 | 3.6% |
경 | 5013 | 2.9% |
지 | 4454 | 2.6% |
동 | 4018 | 2.4% |
번 | 3953 | 2.3% |
북 | 3770 | 2.2% |
Other values (561) | 85534 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 124448 | |
Space Separator | 33020 | 19.4% |
Decimal Number | 12018 | 7.1% |
Close Punctuation | 219 | 0.1% |
Open Punctuation | 219 | 0.1% |
Dash Punctuation | 104 | 0.1% |
Other Symbol | 9 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 8221 | 6.6% |
도 | 8066 | 6.5% |
면 | 7888 | 6.3% |
리 | 6100 | 4.9% |
경 | 5013 | 4.0% |
지 | 4454 | 3.6% |
동 | 4018 | 3.2% |
번 | 3953 | 3.2% |
북 | 3770 | 3.0% |
남 | 3686 | 3.0% |
Other values (546) | 69279 |
Decimal Number
Value | Count | Frequency (%) |
1 | 2177 | |
2 | 1687 | |
3 | 1322 | |
4 | 1241 | |
5 | 1132 | |
7 | 975 | |
6 | 967 | |
9 | 909 | |
8 | 830 | 6.9% |
0 | 778 | 6.5% |
Space Separator
Value | Count | Frequency (%) |
33020 |
Close Punctuation
Value | Count | Frequency (%) |
) | 219 |
Open Punctuation
Value | Count | Frequency (%) |
( | 219 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 104 |
Other Symbol
Value | Count | Frequency (%) |
○ | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 123915 | |
Common | 45589 | 26.8% |
Han | 533 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 8221 | 6.6% |
도 | 8066 | 6.5% |
면 | 7888 | 6.4% |
리 | 6100 | 4.9% |
경 | 5013 | 4.0% |
지 | 4454 | 3.6% |
동 | 4018 | 3.2% |
번 | 3953 | 3.2% |
북 | 3770 | 3.0% |
남 | 3686 | 3.0% |
Other values (384) | 68746 |
Han
Value | Count | Frequency (%) |
定 | 110 | |
不 | 110 | |
朴 | 18 | 3.4% |
金 | 11 | 2.1% |
崔 | 9 | 1.7% |
光 | 9 | 1.7% |
鄭 | 9 | 1.7% |
李 | 7 | 1.3% |
不 | 6 | 1.1% |
錫 | 5 | 0.9% |
Other values (152) | 239 |
Common
Value | Count | Frequency (%) |
33020 | ||
1 | 2177 | 4.8% |
2 | 1687 | 3.7% |
3 | 1322 | 2.9% |
4 | 1241 | 2.7% |
5 | 1132 | 2.5% |
7 | 975 | 2.1% |
6 | 967 | 2.1% |
9 | 909 | 2.0% |
8 | 830 | 1.8% |
Other values (5) | 1329 | 2.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 123915 | |
ASCII | 45580 | 26.8% |
CJK | 508 | 0.3% |
CJK Compat Ideographs | 25 | < 0.1% |
Geometric Shapes | 9 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
33020 | ||
1 | 2177 | 4.8% |
2 | 1687 | 3.7% |
3 | 1322 | 2.9% |
4 | 1241 | 2.7% |
5 | 1132 | 2.5% |
7 | 975 | 2.1% |
6 | 967 | 2.1% |
9 | 909 | 2.0% |
8 | 830 | 1.8% |
Other values (4) | 1320 | 2.9% |
Hangul
Value | Count | Frequency (%) |
군 | 8221 | 6.6% |
도 | 8066 | 6.5% |
면 | 7888 | 6.4% |
리 | 6100 | 4.9% |
경 | 5013 | 4.0% |
지 | 4454 | 3.6% |
동 | 4018 | 3.2% |
번 | 3953 | 3.2% |
북 | 3770 | 3.0% |
남 | 3686 | 3.0% |
Other values (384) | 68746 |
CJK
Value | Count | Frequency (%) |
定 | 110 | |
不 | 110 | |
朴 | 18 | 3.5% |
金 | 11 | 2.2% |
崔 | 9 | 1.8% |
光 | 9 | 1.8% |
鄭 | 9 | 1.8% |
錫 | 5 | 1.0% |
學 | 5 | 1.0% |
致 | 5 | 1.0% |
Other values (141) | 217 |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 9 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
李 | 7 | |
不 | 6 | |
魯 | 3 | |
盧 | 2 | 8.0% |
女 | 1 | 4.0% |
烈 | 1 | 4.0% |
沈 | 1 | 4.0% |
旅 | 1 | 4.0% |
林 | 1 | 4.0% |
梁 | 1 | 4.0% |
죄명
Text
Distinct | 689 |
---|---|
Distinct (%) | 6.9% |
Missing | 11 |
Missing (%) | 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 91 |
---|---|
Median length | 63 |
Mean length | 10.130443 |
Min length | 2 |
Characters and Unicode
Total characters | 101193 |
---|---|
Distinct characters | 196 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 344 ? |
---|---|
Unique (%) | 3.4% |
Sample
1st row | 내란 |
---|---|
2nd row | 보안법위반 |
3rd row | 대정8년 제령 제7호 위반, 폭발물취체벌칙위반, 강도살인, 상인방조, 불법체포, 감금, 상해 |
4th row | 내란 |
5th row | 소요, 공무집행방해, 건조물손괴, 기물손괴, 공문서훼기, 상해, 보안법위반 |
Value | Count | Frequency (%) |
보안법위반 | 5360 | |
소요 | 1722 | 8.1% |
치안유지법위반 | 1271 | 6.0% |
출판법위반 | 1168 | 5.5% |
위반 | 1078 | 5.1% |
대정8년 | 1032 | 4.9% |
제령 | 1030 | 4.8% |
제7호 | 1019 | 4.8% |
강도 | 634 | 3.0% |
내란 | 384 | 1.8% |
Other values (266) | 6550 |
Most occurring characters
Value | Count | Frequency (%) |
11259 | 11.1% | |
위 | 10109 | 10.0% |
반 | 9789 | 9.7% |
법 | 8404 | 8.3% |
안 | 6925 | 6.8% |
, | 6673 | 6.6% |
보 | 5564 | 5.5% |
제 | 2089 | 2.1% |
소 | 1855 | 1.8% |
요 | 1723 | 1.7% |
Other values (186) | 36803 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 81073 | |
Space Separator | 11259 | 11.1% |
Other Punctuation | 6673 | 6.6% |
Decimal Number | 2160 | 2.1% |
Open Punctuation | 14 | < 0.1% |
Close Punctuation | 14 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
위 | 10109 | 12.5% |
반 | 9789 | 12.1% |
법 | 8404 | 10.4% |
안 | 6925 | 8.5% |
보 | 5564 | 6.9% |
제 | 2089 | 2.6% |
소 | 1855 | 2.3% |
요 | 1723 | 2.1% |
치 | 1590 | 2.0% |
령 | 1475 | 1.8% |
Other values (172) | 31550 |
Decimal Number
Value | Count | Frequency (%) |
8 | 1051 | |
7 | 1026 | |
6 | 36 | 1.7% |
3 | 26 | 1.2% |
1 | 7 | 0.3% |
4 | 6 | 0.3% |
9 | 3 | 0.1% |
2 | 2 | 0.1% |
0 | 2 | 0.1% |
5 | 1 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
11259 |
Other Punctuation
Value | Count | Frequency (%) |
, | 6673 |
Open Punctuation
Value | Count | Frequency (%) |
( | 14 |
Close Punctuation
Value | Count | Frequency (%) |
) | 14 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 81073 | |
Common | 20120 | 19.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
위 | 10109 | 12.5% |
반 | 9789 | 12.1% |
법 | 8404 | 10.4% |
안 | 6925 | 8.5% |
보 | 5564 | 6.9% |
제 | 2089 | 2.6% |
소 | 1855 | 2.3% |
요 | 1723 | 2.1% |
치 | 1590 | 2.0% |
령 | 1475 | 1.8% |
Other values (172) | 31550 |
Common
Value | Count | Frequency (%) |
11259 | ||
, | 6673 | |
8 | 1051 | 5.2% |
7 | 1026 | 5.1% |
6 | 36 | 0.2% |
3 | 26 | 0.1% |
( | 14 | 0.1% |
) | 14 | 0.1% |
1 | 7 | < 0.1% |
4 | 6 | < 0.1% |
Other values (4) | 8 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 81073 | |
ASCII | 20120 | 19.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
11259 | ||
, | 6673 | |
8 | 1051 | 5.2% |
7 | 1026 | 5.1% |
6 | 36 | 0.2% |
3 | 26 | 0.1% |
( | 14 | 0.1% |
) | 14 | 0.1% |
1 | 7 | < 0.1% |
4 | 6 | < 0.1% |
Other values (4) | 8 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
위 | 10109 | 12.5% |
반 | 9789 | 12.1% |
법 | 8404 | 10.4% |
안 | 6925 | 8.5% |
보 | 5564 | 6.9% |
제 | 2089 | 2.6% |
소 | 1855 | 2.3% |
요 | 1723 | 2.1% |
치 | 1590 | 2.0% |
령 | 1475 | 1.8% |
Other values (172) | 31550 |
주문
Text
Distinct | 1444 |
---|---|
Distinct (%) | 14.4% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 137 |
---|---|
Median length | 83 |
Mean length | 12.010701 |
Min length | 2 |
Characters and Unicode
Total characters | 120095 |
---|---|
Distinct characters | 291 |
Distinct categories | 6 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 860 ? |
---|---|
Unique (%) | 8.6% |
Sample
1st row | 관할재판소를 경성지방법원으로 지정 |
---|---|
2nd row | 징역 6월 |
3rd row | 징역 10년 |
4th row | 관할재판소를 경성지방법원으로 지정 |
5th row | 징역 6월 |
Value | Count | Frequency (%) |
징역 | 4920 | 15.0% |
기각 | 2605 | 8.0% |
상고 | 1772 | 5.4% |
취소 | 1184 | 3.6% |
산입 | 1178 | 3.6% |
본형에 | 1176 | 3.6% |
6월 | 1124 | 3.4% |
1년 | 1099 | 3.4% |
공소 | 847 | 2.6% |
미결구류일수 | 842 | 2.6% |
Other values (879) | 15961 |
Most occurring characters
Value | Count | Frequency (%) |
22778 | 19.0% | |
역 | 5075 | 4.2% |
징 | 4980 | 4.1% |
년 | 3959 | 3.3% |
일 | 3263 | 2.7% |
소 | 3116 | 2.6% |
결 | 2907 | 2.4% |
월 | 2832 | 2.4% |
기 | 2826 | 2.4% |
0 | 2768 | 2.3% |
Other values (281) | 65591 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 80386 | |
Space Separator | 22778 | 19.0% |
Decimal Number | 12648 | 10.5% |
Close Punctuation | 1604 | 1.3% |
Open Punctuation | 1602 | 1.3% |
Other Punctuation | 1077 | 0.9% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
역 | 5075 | 6.3% |
징 | 4980 | 6.2% |
년 | 3959 | 4.9% |
일 | 3263 | 4.1% |
소 | 3116 | 3.9% |
결 | 2907 | 3.6% |
월 | 2832 | 3.5% |
기 | 2826 | 3.5% |
각 | 2714 | 3.4% |
원 | 2372 | 3.0% |
Other values (264) | 46342 |
Decimal Number
Value | Count | Frequency (%) |
0 | 2768 | |
1 | 2615 | |
6 | 2056 | |
2 | 1424 | |
3 | 1128 | |
5 | 901 | 7.1% |
8 | 620 | 4.9% |
4 | 509 | 4.0% |
9 | 375 | 3.0% |
7 | 252 | 2.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1601 | |
] | 3 | 0.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1599 | |
[ | 3 | 0.2% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1068 | |
. | 9 | 0.8% |
Space Separator
Value | Count | Frequency (%) |
22778 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 79808 | |
Common | 39709 | |
Han | 578 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
역 | 5075 | 6.4% |
징 | 4980 | 6.2% |
년 | 3959 | 5.0% |
일 | 3263 | 4.1% |
소 | 3116 | 3.9% |
결 | 2907 | 3.6% |
월 | 2832 | 3.5% |
기 | 2826 | 3.5% |
각 | 2714 | 3.4% |
원 | 2372 | 3.0% |
Other values (237) | 45764 |
Han
Value | Count | Frequency (%) |
流 | 120 | |
絞 | 62 | |
刑 | 45 | 7.8% |
前 | 45 | 7.8% |
示 | 45 | 7.8% |
期 | 45 | 7.8% |
訴 | 39 | 6.7% |
公 | 35 | 6.1% |
却 | 24 | 4.2% |
下 | 24 | 4.2% |
Other values (17) | 94 |
Common
Value | Count | Frequency (%) |
22778 | ||
0 | 2768 | 7.0% |
1 | 2615 | 6.6% |
6 | 2056 | 5.2% |
) | 1601 | 4.0% |
( | 1599 | 4.0% |
2 | 1424 | 3.6% |
3 | 1128 | 2.8% |
, | 1068 | 2.7% |
5 | 901 | 2.3% |
Other values (7) | 1771 | 4.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 79808 | |
ASCII | 39709 | |
CJK | 433 | 0.4% |
CJK Compat Ideographs | 145 | 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
22778 | ||
0 | 2768 | 7.0% |
1 | 2615 | 6.6% |
6 | 2056 | 5.2% |
) | 1601 | 4.0% |
( | 1599 | 4.0% |
2 | 1424 | 3.6% |
3 | 1128 | 2.8% |
, | 1068 | 2.7% |
5 | 901 | 2.3% |
Other values (7) | 1771 | 4.5% |
Hangul
Value | Count | Frequency (%) |
역 | 5075 | 6.4% |
징 | 4980 | 6.2% |
년 | 3959 | 5.0% |
일 | 3263 | 4.1% |
소 | 3116 | 3.9% |
결 | 2907 | 3.6% |
월 | 2832 | 3.5% |
기 | 2826 | 3.5% |
각 | 2714 | 3.4% |
원 | 2372 | 3.0% |
Other values (237) | 45764 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
流 | 120 | |
不 | 22 | 15.2% |
狀 | 3 | 2.1% |
CJK
Value | Count | Frequency (%) |
絞 | 62 | |
刑 | 45 | |
前 | 45 | |
示 | 45 | |
期 | 45 | |
訴 | 39 | |
公 | 35 | |
却 | 24 | 5.5% |
下 | 24 | 5.5% |
理 | 22 | 5.1% |
Other values (14) | 47 |
판결날짜
Text
Distinct | 1836 |
---|---|
Distinct (%) | 18.4% |
Missing | 5 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 22 |
---|---|
Median length | 22 |
Mean length | 22 |
Min length | 22 |
Characters and Unicode
Total characters | 219890 |
---|---|
Distinct characters | 15 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 891 ? |
---|---|
Unique (%) | 8.9% |
Sample
1st row | 1920-03-22 오전 12:00:00 |
---|---|
2nd row | 1919-06-09 오전 12:00:00 |
3rd row | 1924-03-24 오전 12:00:00 |
4th row | 1920-03-22 오전 12:00:00 |
5th row | 1919-06-05 오전 12:00:00 |
Value | Count | Frequency (%) |
오전 | 9995 | |
12:00:00 | 9995 | |
1920-03-22 | 187 | 0.6% |
1919-08-30 | 166 | 0.6% |
1919-11-06 | 130 | 0.4% |
1919-05-31 | 103 | 0.3% |
1919-07-05 | 92 | 0.3% |
1919-07-12 | 90 | 0.3% |
1919-06-05 | 89 | 0.3% |
1919-06-12 | 80 | 0.3% |
Other values (1828) | 9058 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 54268 | |
1 | 33424 | |
- | 19990 | 9.1% |
19990 | 9.1% | |
: | 19990 | 9.1% |
2 | 18251 | 8.3% |
9 | 16954 | 7.7% |
오 | 9995 | 4.5% |
전 | 9995 | 4.5% |
3 | 4343 | 2.0% |
Other values (5) | 12690 | 5.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 139930 | |
Dash Punctuation | 19990 | 9.1% |
Space Separator | 19990 | 9.1% |
Other Punctuation | 19990 | 9.1% |
Other Letter | 19990 | 9.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 54268 | |
1 | 33424 | |
2 | 18251 | 13.0% |
9 | 16954 | 12.1% |
3 | 4343 | 3.1% |
4 | 2696 | 1.9% |
5 | 2648 | 1.9% |
7 | 2521 | 1.8% |
8 | 2425 | 1.7% |
6 | 2400 | 1.7% |
Other Letter
Value | Count | Frequency (%) |
오 | 9995 | |
전 | 9995 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 19990 |
Space Separator
Value | Count | Frequency (%) |
19990 |
Other Punctuation
Value | Count | Frequency (%) |
: | 19990 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 199900 | |
Hangul | 19990 | 9.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 54268 | |
1 | 33424 | |
- | 19990 | 10.0% |
19990 | 10.0% | |
: | 19990 | 10.0% |
2 | 18251 | 9.1% |
9 | 16954 | 8.5% |
3 | 4343 | 2.2% |
4 | 2696 | 1.3% |
5 | 2648 | 1.3% |
Other values (3) | 7346 | 3.7% |
Hangul
Value | Count | Frequency (%) |
오 | 9995 | |
전 | 9995 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 199900 | |
Hangul | 19990 | 9.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 54268 | |
1 | 33424 | |
- | 19990 | 10.0% |
19990 | 10.0% | |
: | 19990 | 10.0% |
2 | 18251 | 9.1% |
9 | 16954 | 8.5% |
3 | 4343 | 2.2% |
4 | 2696 | 1.3% |
5 | 2648 | 1.3% |
Other values (3) | 7346 | 3.7% |
Hangul
Value | Count | Frequency (%) |
오 | 9995 | |
전 | 9995 |
사건개요
Text
MISSING
 
Distinct | 3917 |
---|---|
Distinct (%) | 42.8% |
Missing | 844 |
Missing (%) | 8.4% |
Memory size | 156.2 KiB |
Length
Max length | 262 |
---|---|
Median length | 160 |
Mean length | 62.879314 |
Min length | 1 |
Characters and Unicode
Total characters | 575723 |
---|---|
Distinct characters | 872 |
Distinct categories | 14 ? |
Distinct scripts | 4 ? |
Distinct blocks | 8 ? |
Unique
Unique | 2690 ? |
---|---|
Unique (%) | 29.4% |
Sample
1st row | 천도교도들이 독립선언서를 인쇄배포하고 군중이 시위하며 헌병분대내로 난입 하자 발포저지하였다. |
---|---|
2nd row | 조선 독립선언서 12장을 교부받아 신재근, 김인경에게 취지를 말하고 교부하였다. |
3rd row | 지나에서 광정단을 조직하고 조선독립운도에 종사하여 광정단원 40여명이 군자금및 무기약탈을 목적으로 조선 내로 침입하고 영성경찰관주재소를 습격하여 순사를 살해하고 다른 2명의 순사에게 중상을 입히는 사건을 방조, 밀정자를 감금, 구타하였다. |
4th row | 천도교도들이 독립선언서를 인쇄배포하고 군중이 시위하며 헌병분대내로 난입 하자 발포저지하였다. |
5th row | 성내동에서 이천여명의 군중과 같이 한국독립만세를 부르고 시장 부근을 행진하였다. |
Value | Count | Frequency (%) |
조선독립만세를 | 2010 | 1.7% |
함께 | 1232 | 1.0% |
군중과 | 1011 | 0.8% |
자이다 | 918 | 0.8% |
하였다 | 892 | 0.7% |
치안을 | 859 | 0.7% |
독립만세를 | 734 | 0.6% |
목적으로 | 696 | 0.6% |
관련건 | 674 | 0.6% |
방해한 | 650 | 0.5% |
Other values (18116) | 110261 |
Most occurring characters
Value | Count | Frequency (%) |
111952 | 19.4% | |
하 | 20958 | 3.6% |
를 | 12766 | 2.2% |
을 | 12690 | 2.2% |
고 | 9570 | 1.7% |
다 | 9454 | 1.6% |
에 | 9284 | 1.6% |
선 | 9099 | 1.6% |
독 | 8726 | 1.5% |
의 | 8538 | 1.5% |
Other values (862) | 362686 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 428835 | |
Space Separator | 111952 | 19.4% |
Decimal Number | 16243 | 2.8% |
Other Punctuation | 14899 | 2.6% |
Uppercase Letter | 3373 | 0.6% |
Final Punctuation | 101 | < 0.1% |
Initial Punctuation | 87 | < 0.1% |
Open Punctuation | 60 | < 0.1% |
Close Punctuation | 59 | < 0.1% |
Lowercase Letter | 45 | < 0.1% |
Other values (4) | 69 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
하 | 20958 | 4.9% |
를 | 12766 | 3.0% |
을 | 12690 | 3.0% |
고 | 9570 | 2.2% |
다 | 9454 | 2.2% |
에 | 9284 | 2.2% |
선 | 9099 | 2.1% |
독 | 8726 | 2.0% |
의 | 8538 | 2.0% |
립 | 8271 | 1.9% |
Other values (820) | 319479 |
Decimal Number
Value | Count | Frequency (%) |
0 | 6745 | |
1 | 2826 | |
3 | 1200 | 7.4% |
2 | 1190 | 7.3% |
4 | 1063 | 6.5% |
9 | 1058 | 6.5% |
7 | 787 | 4.8% |
5 | 671 | 4.1% |
6 | 377 | 2.3% |
8 | 326 | 2.0% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 1119 | |
A | 1118 | |
J | 1117 | |
H | 7 | 0.2% |
M | 7 | 0.2% |
S | 2 | 0.1% |
K | 1 | < 0.1% |
R | 1 | < 0.1% |
L | 1 | < 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
. | 8270 | |
, | 6218 | |
' | 348 | 2.3% |
! | 27 | 0.2% |
" | 25 | 0.2% |
? | 7 | < 0.1% |
· | 4 | < 0.1% |
Lowercase Letter
Value | Count | Frequency (%) |
j | 15 | |
a | 15 | |
c | 15 |
Final Punctuation
Value | Count | Frequency (%) |
’ | 53 | |
” | 48 |
Initial Punctuation
Value | Count | Frequency (%) |
“ | 47 | |
‘ | 40 |
Open Punctuation
Value | Count | Frequency (%) |
( | 31 | |
「 | 29 |
Close Punctuation
Value | Count | Frequency (%) |
) | 31 | |
」 | 28 |
Space Separator
Value | Count | Frequency (%) |
111952 |
Math Symbol
Value | Count | Frequency (%) |
~ | 30 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 20 |
Modifier Symbol
Value | Count | Frequency (%) |
´ | 18 |
Other Symbol
Value | Count | Frequency (%) |
○ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 428793 | |
Common | 143470 | 24.9% |
Latin | 3418 | 0.6% |
Han | 42 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
하 | 20958 | 4.9% |
를 | 12766 | 3.0% |
을 | 12690 | 3.0% |
고 | 9570 | 2.2% |
다 | 9454 | 2.2% |
에 | 9284 | 2.2% |
선 | 9099 | 2.1% |
독 | 8726 | 2.0% |
의 | 8538 | 2.0% |
립 | 8271 | 1.9% |
Other values (786) | 319437 |
Han
Value | Count | Frequency (%) |
鮮 | 4 | 9.5% |
旗 | 2 | 4.8% |
幟 | 2 | 4.8% |
內 | 2 | 4.8% |
排 | 2 | 4.8% |
斥 | 2 | 4.8% |
壇 | 1 | 2.4% |
佛 | 1 | 2.4% |
謹 | 1 | 2.4% |
羽 | 1 | 2.4% |
Other values (24) | 24 |
Common
Value | Count | Frequency (%) |
111952 | ||
. | 8270 | 5.8% |
0 | 6745 | 4.7% |
, | 6218 | 4.3% |
1 | 2826 | 2.0% |
3 | 1200 | 0.8% |
2 | 1190 | 0.8% |
4 | 1063 | 0.7% |
9 | 1058 | 0.7% |
7 | 787 | 0.5% |
Other values (20) | 2161 | 1.5% |
Latin
Value | Count | Frequency (%) |
C | 1119 | |
A | 1118 | |
J | 1117 | |
j | 15 | 0.4% |
a | 15 | 0.4% |
c | 15 | 0.4% |
H | 7 | 0.2% |
M | 7 | 0.2% |
S | 2 | 0.1% |
K | 1 | < 0.1% |
Other values (2) | 2 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 428787 | |
ASCII | 146620 | 25.5% |
Punctuation | 188 | < 0.1% |
None | 79 | < 0.1% |
CJK | 41 | < 0.1% |
Compat Jamo | 6 | < 0.1% |
Geometric Shapes | 1 | < 0.1% |
CJK Compat Ideographs | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
111952 | ||
. | 8270 | 5.6% |
0 | 6745 | 4.6% |
, | 6218 | 4.2% |
1 | 2826 | 1.9% |
3 | 1200 | 0.8% |
2 | 1190 | 0.8% |
C | 1119 | 0.8% |
A | 1118 | 0.8% |
J | 1117 | 0.8% |
Other values (23) | 4865 | 3.3% |
Hangul
Value | Count | Frequency (%) |
하 | 20958 | 4.9% |
를 | 12766 | 3.0% |
을 | 12690 | 3.0% |
고 | 9570 | 2.2% |
다 | 9454 | 2.2% |
에 | 9284 | 2.2% |
선 | 9099 | 2.1% |
독 | 8726 | 2.0% |
의 | 8538 | 2.0% |
립 | 8271 | 1.9% |
Other values (781) | 319431 |
Punctuation
Value | Count | Frequency (%) |
’ | 53 | |
” | 48 | |
“ | 47 | |
‘ | 40 |
None
Value | Count | Frequency (%) |
「 | 29 | |
」 | 28 | |
´ | 18 | |
· | 4 | 5.1% |
CJK
Value | Count | Frequency (%) |
鮮 | 4 | 9.8% |
旗 | 2 | 4.9% |
幟 | 2 | 4.9% |
內 | 2 | 4.9% |
排 | 2 | 4.9% |
斥 | 2 | 4.9% |
壇 | 1 | 2.4% |
佛 | 1 | 2.4% |
謹 | 1 | 2.4% |
羽 | 1 | 2.4% |
Other values (23) | 23 |
Compat Jamo
Value | Count | Frequency (%) |
ㅍ | 2 | |
ㅎ | 1 | |
ㅆ | 1 | |
ㅈ | 1 | |
ㄹ | 1 |
Geometric Shapes
Value | Count | Frequency (%) |
○ | 1 |
CJK Compat Ideographs
Value | Count | Frequency (%) |
李 | 1 |
판결문_원문_제공
Boolean
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 87.9 KiB |
True | |
---|---|
False | 12 |
Value | Count | Frequency (%) |
True | 9988 | |
False | 12 | 0.1% |
판결문_번역본_제공
Boolean
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 87.9 KiB |
True | |
---|---|
False | 48 |
Value | Count | Frequency (%) |
True | 9952 | |
False | 48 | 0.5% |
생산년도
Real number (ℝ)
Distinct | 40 |
---|---|
Distinct (%) | 0.4% |
Missing | 4 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1922.4544 |
Minimum | 1906 |
---|---|
Maximum | 1945 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1906 |
---|---|
5-th percentile | 1910 |
Q1 | 1919 |
median | 1919 |
Q3 | 1925 |
95-th percentile | 1942 |
Maximum | 1945 |
Range | 39 |
Interquartile range (IQR) | 6 |
Descriptive statistics
Standard deviation | 8.2633747 |
---|---|
Coefficient of variation (CV) | 0.0042983463 |
Kurtosis | 0.90530311 |
Mean | 1922.4544 |
Median Absolute Deviation (MAD) | 1 |
Skewness | 1.0666081 |
Sum | 19216854 |
Variance | 68.283361 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1919 | 4319 | |
1920 | 1264 | 12.6% |
1921 | 434 | 4.3% |
1922 | 322 | 3.2% |
1909 | 290 | 2.9% |
1931 | 277 | 2.8% |
1934 | 242 | 2.4% |
1945 | 194 | 1.9% |
1930 | 190 | 1.9% |
1942 | 180 | 1.8% |
Other values (30) | 2284 |
Value | Count | Frequency (%) |
1906 | 64 | 0.6% |
1907 | 14 | 0.1% |
1908 | 117 | |
1909 | 290 | |
1910 | 141 | |
1911 | 53 | 0.5% |
1912 | 124 | |
1913 | 80 | 0.8% |
1914 | 2 | < 0.1% |
1915 | 36 | 0.4% |
Value | Count | Frequency (%) |
1945 | 194 | |
1944 | 122 | |
1943 | 66 | 0.7% |
1942 | 180 | |
1941 | 88 | |
1940 | 38 | 0.4% |
1939 | 51 | 0.5% |
1938 | 76 | 0.8% |
1937 | 76 | 0.8% |
1936 | 100 |
관리번호
Text
Distinct | 817 |
---|---|
Distinct (%) | 8.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Characters and Unicode
Total characters | 100000 |
---|---|
Distinct characters | 13 |
Distinct categories | 2 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 204 ? |
---|---|
Unique (%) | 2.0% |
Sample
1st row | CJA0000477 |
---|---|
2nd row | CJA0000408 |
3rd row | CJA0000131 |
4th row | CJA0000477 |
5th row | CJA0001284 |
Value | Count | Frequency (%) |
cja0000401 | 371 | 3.7% |
cja0000477 | 182 | 1.8% |
cja0000252 | 165 | 1.7% |
cja0001990 | 122 | 1.2% |
cja0002172 | 110 | 1.1% |
cja0000060 | 105 | 1.1% |
cja0001284 | 103 | 1.0% |
cja0000450 | 101 | 1.0% |
cja0000140 | 100 | 1.0% |
cja0000453 | 96 | 1.0% |
Other values (807) | 8545 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 40562 | |
C | 10000 | 10.0% |
J | 10000 | 10.0% |
A | 10000 | 10.0% |
1 | 5754 | 5.8% |
4 | 5021 | 5.0% |
7 | 3763 | 3.8% |
9 | 3432 | 3.4% |
2 | 3290 | 3.3% |
8 | 2263 | 2.3% |
Other values (3) | 5915 | 5.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 70000 | |
Uppercase Letter | 30000 |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 40562 | |
1 | 5754 | 8.2% |
4 | 5021 | 7.2% |
7 | 3763 | 5.4% |
9 | 3432 | 4.9% |
2 | 3290 | 4.7% |
8 | 2263 | 3.2% |
5 | 2244 | 3.2% |
6 | 2088 | 3.0% |
3 | 1583 | 2.3% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 10000 | |
J | 10000 | |
A | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 70000 | |
Latin | 30000 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 40562 | |
1 | 5754 | 8.2% |
4 | 5021 | 7.2% |
7 | 3763 | 5.4% |
9 | 3432 | 4.9% |
2 | 3290 | 4.7% |
8 | 2263 | 3.2% |
5 | 2244 | 3.2% |
6 | 2088 | 3.0% |
3 | 1583 | 2.3% |
Latin
Value | Count | Frequency (%) |
C | 10000 | |
J | 10000 | |
A | 10000 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 100000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 40562 | |
C | 10000 | 10.0% |
J | 10000 | 10.0% |
A | 10000 | 10.0% |
1 | 5754 | 5.8% |
4 | 5021 | 5.0% |
7 | 3763 | 3.8% |
9 | 3432 | 3.4% |
2 | 3290 | 3.3% |
8 | 2263 | 2.3% |
Other values (3) | 5915 | 5.9% |
마이크로필름번호
Real number (ℝ)
SKEWED
 
Distinct | 566 |
---|---|
Distinct (%) | 5.7% |
Missing | 3 |
Missing (%) | < 0.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 938613.8 |
Minimum | 95375 |
---|---|
Maximum | 9671011 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 95375 |
---|---|
5-th percentile | 930585 |
Q1 | 930673 |
median | 930897 |
Q3 | 950065 |
95-th percentile | 960846 |
Maximum | 9671011 |
Range | 9575636 |
Interquartile range (IQR) | 19392 |
Descriptive statistics
Standard deviation | 129692.42 |
---|---|
Coefficient of variation (CV) | 0.13817442 |
Kurtosis | 4115.2947 |
Mean | 938613.8 |
Median Absolute Deviation (MAD) | 228 |
Skewness | 60.537492 |
Sum | 9.3833221 × 109 |
Variance | 1.6820123 × 1010 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
930909 | 375 | 3.8% |
930675 | 198 | 2.0% |
930679 | 195 | 1.9% |
930586 | 175 | 1.8% |
930908 | 169 | 1.7% |
930673 | 168 | 1.7% |
930900 | 158 | 1.6% |
950039 | 156 | 1.6% |
930676 | 149 | 1.5% |
930670 | 149 | 1.5% |
Other values (556) | 8105 |
Value | Count | Frequency (%) |
95375 | 20 | 0.2% |
930530 | 13 | 0.1% |
930531 | 12 | 0.1% |
930550 | 85 | |
930552 | 5 | 0.1% |
930553 | 12 | 0.1% |
930554 | 3 | < 0.1% |
930558 | 1 | < 0.1% |
930560 | 62 | |
930565 | 2 | < 0.1% |
Value | Count | Frequency (%) |
9671011 | 2 | < 0.1% |
970977 | 2 | < 0.1% |
970976 | 1 | < 0.1% |
961012 | 1 | < 0.1% |
961011 | 1 | < 0.1% |
960992 | 3 | < 0.1% |
960991 | 1 | < 0.1% |
960989 | 4 | < 0.1% |
960987 | 23 | |
960979 | 5 | 0.1% |
연번 | 판결문_원문_제공 | 판결문_번역본_제공 | 생산년도 | 마이크로필름번호 | |
---|---|---|---|---|---|
연번 | 1.000 | 0.019 | 0.020 | 0.221 | 0.000 |
판결문_원문_제공 | 0.019 | 1.000 | 0.526 | 0.073 | 0.000 |
판결문_번역본_제공 | 0.020 | 0.526 | 1.000 | 0.110 | 0.000 |
생산년도 | 0.221 | 0.073 | 0.110 | 1.000 | 0.065 |
마이크로필름번호 | 0.000 | 0.000 | 0.000 | 0.065 | 1.000 |
판결문_원문_제공 | 판결문_번역본_제공 | |
---|---|---|
판결문_원문_제공 | 1.000 | 0.353 |
판결문_번역본_제공 | 0.353 | 1.000 |
연번 | 생산년도 | 마이크로필름번호 | 판결문_원문_제공 | 판결문_번역본_제공 | |
---|---|---|---|---|---|
연번 | 1.000 | -0.014 | -0.056 | 0.014 | 0.015 |
생산년도 | -0.014 | 1.000 | 0.263 | 0.056 | 0.081 |
마이크로필름번호 | -0.056 | 0.263 | 1.000 | 0.000 | 0.000 |
판결문_원문_제공 | 0.014 | 0.056 | 0.000 | 1.000 | 0.353 |
판결문_번역본_제공 | 0.015 | 0.081 | 0.000 | 0.353 | 1.000 |
연번 | 이름_별명 | 당시나이 | 본적주소 | 죄명 | 주문 | 판결날짜 | 사건개요 | 판결문_원문_제공 | 판결문_번역본_제공 | 생산년도 | 관리번호 | 마이크로필름번호 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
3793 | 3794 | 김응하(金應河) | 63세 | 황해도 수안군 수안면 석교리 | 내란 | 관할재판소를 경성지방법원으로 지정 | 1920-03-22 오전 12:00:00 | 천도교도들이 독립선언서를 인쇄배포하고 군중이 시위하며 헌병분대내로 난입 하자 발포저지하였다. | Y | Y | 1920 | CJA0000477 | 930679 |
17748 | 17749 | 최종하(崔宗河) | 43세 | 강원도 횡성군 횡성면 읍상리 | 보안법위반 | 징역 6월 | 1919-06-09 오전 12:00:00 | 조선 독립선언서 12장을 교부받아 신재근, 김인경에게 취지를 말하고 교부하였다. | Y | Y | 1919 | CJA0000408 | 930903 |
15486 | 15487 | 정봉조(鄭鳳朝) | 31세 | 지나 간도 장백현 16도구 서덕수 | 대정8년 제령 제7호 위반, 폭발물취체벌칙위반, 강도살인, 상인방조, 불법체포, 감금, 상해 | 징역 10년 | 1924-03-24 오전 12:00:00 | 지나에서 광정단을 조직하고 조선독립운도에 종사하여 광정단원 40여명이 군자금및 무기약탈을 목적으로 조선 내로 침입하고 영성경찰관주재소를 습격하여 순사를 살해하고 다른 2명의 순사에게 중상을 입히는 사건을 방조, 밀정자를 감금, 구타하였다. | Y | Y | 1924 | CJA0000131 | 930609 |
13770 | 13771 | 이채룡(李彩龍) | 40세 | 황해도 수안군 수안면 자의리 | 내란 | 관할재판소를 경성지방법원으로 지정 | 1920-03-22 오전 12:00:00 | 천도교도들이 독립선언서를 인쇄배포하고 군중이 시위하며 헌병분대내로 난입 하자 발포저지하였다. | Y | Y | 1920 | CJA0000477 | 930679 |
13647 | 13648 | 이중식(李仲植) | 40세 | 경북 영덕군 영해면 묘곡동 | 소요, 공무집행방해, 건조물손괴, 기물손괴, 공문서훼기, 상해, 보안법위반 | 징역 6월 | 1919-06-05 오전 12:00:00 | 성내동에서 이천여명의 군중과 같이 한국독립만세를 부르고 시장 부근을 행진하였다. | Y | Y | 1919 | CJA0001284 | 950039 |
4261 | 4262 | 김종창(金鍾暢) | 41세 | 전라북도 임실군 둔남면 둔덕리 | 소요 | 징역 1년 | 1919-07-31 오전 12:00:00 | 1919년 3월 23일 오수리 장날 수괴 이기송은 연설하고 군중을 지휘 만세를 고창하며 소요 시위 관공서를 파괴하였다. | Y | Y | 1919 | CJA0001749 | 960864 |
16494 | 16495 | 좌공림(左公琳) | 29세 | 경성부 화동 98번지 | 치안유지법위반 | 징역 2년 | 1929-03-22 오전 12:00:00 | 공산당이 조선이 일본의 압제에서 벗어나 공산사회를 실현하는 것이 목적인 줄 알면서 가입하여 활동하였다. | Y | Y | 1929 | CJA0000398 | 930942 |
5892 | 5893 | 문영복(文永福) | 25세 | 전라남도 영암군 영암면 장암리 569 번지 | 가택침입, 폭력행위 등 처벌에 관한 법률위반 | 벌금 30원 환형유치일수 30일 | 1933-09-29 오전 12:00:00 | <NA> | Y | Y | 1934 | CJA0002027 | 960659 |
7678 | 7679 | 변길성(卞吉成) | 22세 | 전라남도 나주군 봉황면 덕림리 | 대정8년 제령 제7호 위반 | 무죄 | 1921-08-13 오전 12:00:00 | 덕림 부속학교의 교사로 조선의 독립사상을 고취시키기 위하여 생도에게 가르칠 목적으로 감동가 노래를 복사했다. | Y | Y | 1921 | CJA0001955 | 960597 |
13454 | 13455 | 이종기(李鍾基) | 25세 | 경상북도 의성군 단촌면 병방동 472번지 | 대정8년 제령 제7호 위반 | 원판결취소 징역 1년 | 1921-11-26 오전 12:00:00 | 치성비를 출자하고 일대집단을 조직하여 국권회복운동을 결의하여 교주 차경석이1924년 갑자년에 계룡산에 도읍을 정하고 제위에 올라 독립조선을 통치할 것이라고 망상하고 선전하였다. | Y | Y | 1922 | CJA0002172 | 950216 |
연번 | 이름_별명 | 당시나이 | 본적주소 | 죄명 | 주문 | 판결날짜 | 사건개요 | 판결문_원문_제공 | 판결문_번역본_제공 | 생산년도 | 관리번호 | 마이크로필름번호 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
12078 | 12079 | 이병국(李炳國) | 23세 | 경성부 도렴동 52 번지 | 치안유지법위반 | 징역 1년6월집행유예 2년 | 1934-09-17 오전 12:00:00 | 사유재산제도를 부인하고 공산주의 제도 사회실현을 목적으로 좌익서적을 탐독하고 연구하였으며 비밀결사를 조직하여 활동하였다. | Y | Y | 1934 | CJA0001799 | 960905 |
17293 | 17294 | 최봉규(崔鳳奎) | 20세(5월 25일생) | 함흥부 주길정 67번지 | 치안유지법위반 | 징역 2년 원심미결구류일수 중 60일 당심미결구류일수 중 60일 본형에 산입 | 1936-03-06 오전 12:00:00 | 메이데이를 기념하며 사유재산제도를 부인하고 공산주의 연구 그룹을 조직하는 등 체제개혁을 목적으로 하는 공산주의 실천운동을 하였다. | Y | Y | 1936 | CJA0000649 | 930635 |
10728 | 10729 | 유창성(柳昌成) | 44세 | 전라북도 완주군 소양면 화심리 514 번지 | 육해군형법위반, 조선임시보안령위반 | 징역 1년 | 1942-11-27 오전 12:00:00 | 조선인 경제범을 검거 다액의 벌금을 징수하여 전비로 쓰고 있고 전쟁이 끝나면 벌금을 반환해야 한다고 말하였다. | Y | Y | 1942 | CJA0001815 | 960923 |
5597 | 5598 | 덕본광의(德本光毅)한관영(韓寬泳) | 26세 | 경성부 중구 남미창정 62번지 | 치안유지법위반 | 경성지방법원 합의부의 공판에 부침 | 1943-10-25 오전 12:00:00 | 좌익서적을 탐독 공산주의사상에 공명하여 조선의 독립과 공산화를 희망하고 경성콤그룹의 목적수행을 위해 활동하였다. | Y | Y | 1945 | CJA0000008 | 930974 |
15508 | 15509 | 정석규(鄭錫奎) | 19세 | 전라남도 광주군 광주면 서남리 최동문(崔東文)방 | 치안유지법위반 | 징역 2년6월 미결구류일수 70일 본형에 산입 | 1930-10-18 오전 12:00:00 | <NA> | Y | Y | 1931 | CJA0001990 | 960623 |
3120 | 3121 | 김영기(金寧基) | 36세 | 경상북도 김천군 대항면 향천동 | 대정8년 제령 제7호 위반 | 상고 기각 | 1920-04-17 오전 12:00:00 | CJA0000750, CJA0000752의 관련건 | Y | Y | 1920 | CJA0000478 | 930679 |
11596 | 11597 | 이기영(李璣榮)이무록(李武菉) | 40세 | 충청북도 영동군 학산면 봉소리 | 보안법위반, 소요 | 공소 기각 | 1919-09-17 오전 12:00:00 | 조선독립만세운동을 찬성하여 독립시위운동을 하였다. | Y | Y | 1919 | CJA0000140 | 930586 |
3675 | 3676 | 김윤옥(金允玉) | 18세(1월 12일생) | 황해도 송화군 연정면 조령리 284번지 | 출판법위반, 보안법위반 | 경성지방법원의 공판에 부침 | 1919-08-30 오전 12:00:00 | 조선독립선언과 동시에 선언서를 발포하여 대한독립만세, 조선독립만세를 절구하며 독립시위운동을 하였다. | Y | Y | 1920 | CJA0000401 | 930909 |
3625 | 3626 | 김윤구(金崙求) | 27세 | 경기도 양평군 용문면 오촌리 281번지 | 보안법위반 | 상고 기각 | 1919-07-26 오전 12:00:00 | <NA> | Y | Y | 1919 | CJA0000418 | 930900 |
2113 | 2114 | 김명진(金明辰) | 18세(10월 8일생) | 인천부 내리 152번지 | 보안법위반, 절도, 전신법위반 | 상고 기각 | 1919-10-09 오전 12:00:00 | CJA0000142, CJA0000418 관련건 | Y | Y | 1919 | CJA0000678 | 930676 |