Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 10000 |
Missing cells | 1145 |
Missing cells (%) | 0.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.1 MiB |
Average record size in memory | 114.0 B |
Variable types
Numeric | 2 |
---|---|
Text | 4 |
Categorical | 6 |
Boolean | 1 |
Dataset
Description | 정부에서 독립운동 공적으로 서훈한 독립유공자 명단입니다.독립유공자의 관리번호, 성명, 생년월일, 사망년월일, 성별, 본적, 운동계열 등을 제공하고 있습니다. |
---|---|
Author | 국가보훈부 |
URL | https://www.data.go.kr/data/15125208/fileData.do |
외국인여부 is highly overall correlated with 관리번호 and 3 other fields | High correlation |
운동계열 is highly overall correlated with 관리번호 and 1 other fields | High correlation |
훈격(대분류) is highly overall correlated with 훈격(소분류) | High correlation |
훈격(소분류) is highly overall correlated with 훈격(대분류) | High correlation |
관리번호 is highly overall correlated with 포상년도 and 2 other fields | High correlation |
포상년도 is highly overall correlated with 관리번호 and 1 other fields | High correlation |
본적(대분류) is highly overall correlated with 외국인여부 | High correlation |
성별 is highly imbalanced (77.3%) | Imbalance |
외국인여부 is highly imbalanced (96.0%) | Imbalance |
본적(소분류) has 1145 (11.5%) missing values | Missing |
관리번호 has unique values | Unique |
Reproduction
Analysis started | 2024-05-04 07:57:25.927004 |
---|---|
Analysis finished | 2024-05-04 07:57:32.756727 |
Duration | 6.83 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
관리번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 307317.52 |
Minimum | 2 |
---|---|
Maximum | 965906 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 2 |
---|---|
5-th percentile | 1068.9 |
Q1 | 6317.25 |
median | 31486.5 |
Q3 | 951507.75 |
95-th percentile | 960942.05 |
Maximum | 965906 |
Range | 965904 |
Interquartile range (IQR) | 945190.5 |
Descriptive statistics
Standard deviation | 432327.2 |
---|---|
Coefficient of variation (CV) | 1.4067769 |
Kurtosis | -1.3030498 |
Mean | 307317.52 |
Median Absolute Deviation (MAD) | 28727.5 |
Skewness | 0.82954995 |
Sum | 3.0731752 × 109 |
Variance | 1.8690681 × 1011 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
36656 | 1 | < 0.1% |
954947 | 1 | < 0.1% |
6326 | 1 | < 0.1% |
6506 | 1 | < 0.1% |
6976 | 1 | < 0.1% |
7233 | 1 | < 0.1% |
954871 | 1 | < 0.1% |
965027 | 1 | < 0.1% |
9832 | 1 | < 0.1% |
953387 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
2 | 1 | |
3 | 1 | |
5 | 1 | |
7 | 1 | |
10 | 1 | |
11 | 1 | |
13 | 1 | |
18 | 1 | |
23 | 1 | |
27 | 1 |
Value | Count | Frequency (%) |
965906 | 1 | |
965796 | 1 | |
965795 | 1 | |
965791 | 1 | |
965575 | 1 | |
965545 | 1 | |
965543 | 1 | |
965541 | 1 | |
965537 | 1 | |
965496 | 1 |
성명
Text
Distinct | 9235 |
---|---|
Distinct (%) | 92.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
김용환 | 5 | < 0.1% |
김창환 | 5 | < 0.1% |
김봉수 | 5 | < 0.1% |
김상옥 | 4 | < 0.1% |
김동진 | 4 | < 0.1% |
김정기 | 4 | < 0.1% |
이기영 | 4 | < 0.1% |
김형석 | 4 | < 0.1% |
이병철 | 4 | < 0.1% |
김재명 | 4 | < 0.1% |
Other values (9266) | 10006 |
Most occurring characters
Value | Count | Frequency (%) |
김 | 2053 | 6.8% |
이 | 1637 | 5.5% |
박 | 721 | 2.4% |
정 | 689 | 2.3% |
영 | 580 | 1.9% |
성 | 523 | 1.7% |
최 | 517 | 1.7% |
기 | 439 | 1.5% |
수 | 424 | 1.4% |
윤 | 416 | 1.4% |
Other values (384) | 22017 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 29967 | |
Space Separator | 49 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 2053 | 6.9% |
이 | 1637 | 5.5% |
박 | 721 | 2.4% |
정 | 689 | 2.3% |
영 | 580 | 1.9% |
성 | 523 | 1.7% |
최 | 517 | 1.7% |
기 | 439 | 1.5% |
수 | 424 | 1.4% |
윤 | 416 | 1.4% |
Other values (383) | 21968 |
Space Separator
Value | Count | Frequency (%) |
49 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 29967 | |
Common | 49 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 2053 | 6.9% |
이 | 1637 | 5.5% |
박 | 721 | 2.4% |
정 | 689 | 2.3% |
영 | 580 | 1.9% |
성 | 523 | 1.7% |
최 | 517 | 1.7% |
기 | 439 | 1.5% |
수 | 424 | 1.4% |
윤 | 416 | 1.4% |
Other values (383) | 21968 |
Common
Value | Count | Frequency (%) |
49 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 29967 | |
ASCII | 49 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
김 | 2053 | 6.9% |
이 | 1637 | 5.5% |
박 | 721 | 2.4% |
정 | 689 | 2.3% |
영 | 580 | 1.9% |
성 | 523 | 1.7% |
최 | 517 | 1.7% |
기 | 439 | 1.5% |
수 | 424 | 1.4% |
윤 | 416 | 1.4% |
Other values (383) | 21968 |
ASCII
Value | Count | Frequency (%) |
49 |
생년월일
Text
Distinct | 5858 |
---|---|
Distinct (%) | 58.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.3809 |
Min length | 2 |
Characters and Unicode
Total characters | 93809 |
---|---|
Distinct characters | 16 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4842 ? |
---|---|
Unique (%) | 48.4% |
Sample
1st row | 1887-05-12 |
---|---|
2nd row | 1922-09-05 |
3rd row | 1912-10-18 |
4th row | 1886-08-14 |
5th row | 1888-11-27 |
Value | Count | Frequency (%) |
미상 | 773 | 7.7% |
1882-00-00 | 96 | 1.0% |
1881-00-00 | 95 | 0.9% |
1880-00-00 | 90 | 0.9% |
1883-00-00 | 89 | 0.9% |
1879-00-00 | 82 | 0.8% |
1884-00-00 | 79 | 0.8% |
1878-00-00 | 69 | 0.7% |
1877-00-00 | 68 | 0.7% |
1885-00-00 | 68 | 0.7% |
Other values (5848) | 8491 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 20311 | |
- | 18452 | |
1 | 17085 | |
8 | 10944 | |
9 | 6976 | 7.4% |
2 | 5485 | 5.8% |
7 | 3343 | 3.6% |
6 | 2638 | 2.8% |
5 | 2504 | 2.7% |
3 | 2351 | 2.5% |
Other values (6) | 3720 | 4.0% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 73808 | |
Dash Punctuation | 18452 | 19.7% |
Other Letter | 1549 | 1.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 20311 | |
1 | 17085 | |
8 | 10944 | |
9 | 6976 | 9.5% |
2 | 5485 | 7.4% |
7 | 3343 | 4.5% |
6 | 2638 | 3.6% |
5 | 2504 | 3.4% |
3 | 2351 | 3.2% |
4 | 2171 | 2.9% |
Other Letter
Value | Count | Frequency (%) |
미 | 773 | |
상 | 773 | |
비 | 1 | 0.1% |
공 | 1 | 0.1% |
개 | 1 | 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 18452 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 92260 | |
Hangul | 1549 | 1.7% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 20311 | |
- | 18452 | |
1 | 17085 | |
8 | 10944 | |
9 | 6976 | 7.6% |
2 | 5485 | 5.9% |
7 | 3343 | 3.6% |
6 | 2638 | 2.9% |
5 | 2504 | 2.7% |
3 | 2351 | 2.5% |
Hangul
Value | Count | Frequency (%) |
미 | 773 | |
상 | 773 | |
비 | 1 | 0.1% |
공 | 1 | 0.1% |
개 | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 92260 | |
Hangul | 1549 | 1.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 20311 | |
- | 18452 | |
1 | 17085 | |
8 | 10944 | |
9 | 6976 | 7.6% |
2 | 5485 | 5.9% |
7 | 3343 | 3.6% |
6 | 2638 | 2.9% |
5 | 2504 | 2.7% |
3 | 2351 | 2.5% |
Hangul
Value | Count | Frequency (%) |
미 | 773 | |
상 | 773 | |
비 | 1 | 0.1% |
공 | 1 | 0.1% |
개 | 1 | 0.1% |
사망년월일
Text
Distinct | 5889 |
---|---|
Distinct (%) | 58.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 7.8936 |
Min length | 2 |
Characters and Unicode
Total characters | 78936 |
---|---|
Distinct characters | 15 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 5100 ? |
---|---|
Unique (%) | 51.0% |
Sample
1st row | 1956-05-30 |
---|---|
2nd row | 1979-10-06 |
3rd row | 1969-03-18 |
4th row | 1955-02-24 |
5th row | 1966-07-15 |
Value | Count | Frequency (%) |
미상 | 2632 | 26.3% |
1920-00-00 | 30 | 0.3% |
1920-10-22 | 28 | 0.3% |
1908-00-00 | 26 | 0.3% |
1921-12-04 | 22 | 0.2% |
1922-00-00 | 19 | 0.2% |
1920-11-03 | 18 | 0.2% |
1919-04-01 | 17 | 0.2% |
1919-04-15 | 17 | 0.2% |
1919-03-00 | 16 | 0.2% |
Other values (5879) | 7175 |
Most occurring characters
Value | Count | Frequency (%) |
- | 14734 | |
1 | 14363 | |
0 | 12592 | |
9 | 9434 | |
2 | 6155 | |
3 | 3145 | 4.0% |
5 | 3016 | 3.8% |
4 | 2942 | 3.7% |
미 | 2632 | 3.3% |
상 | 2632 | 3.3% |
Other values (5) | 7291 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 58936 | |
Dash Punctuation | 14734 | 18.7% |
Other Letter | 5266 | 6.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 14363 | |
0 | 12592 | |
9 | 9434 | |
2 | 6155 | |
3 | 3145 | 5.3% |
5 | 3016 | 5.1% |
4 | 2942 | 5.0% |
7 | 2505 | 4.3% |
6 | 2448 | 4.2% |
8 | 2336 | 4.0% |
Other Letter
Value | Count | Frequency (%) |
미 | 2632 | |
상 | 2632 | |
생 | 1 | < 0.1% |
존 | 1 | < 0.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 14734 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 73670 | |
Hangul | 5266 | 6.7% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 14734 | |
1 | 14363 | |
0 | 12592 | |
9 | 9434 | |
2 | 6155 | |
3 | 3145 | 4.3% |
5 | 3016 | 4.1% |
4 | 2942 | 4.0% |
7 | 2505 | 3.4% |
6 | 2448 | 3.3% |
Hangul
Value | Count | Frequency (%) |
미 | 2632 | |
상 | 2632 | |
생 | 1 | < 0.1% |
존 | 1 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 73670 | |
Hangul | 5266 | 6.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 14734 | |
1 | 14363 | |
0 | 12592 | |
9 | 9434 | |
2 | 6155 | |
3 | 3145 | 4.3% |
5 | 3016 | 4.1% |
4 | 2942 | 4.0% |
7 | 2505 | 3.4% |
6 | 2448 | 3.3% |
Hangul
Value | Count | Frequency (%) |
미 | 2632 | |
상 | 2632 | |
생 | 1 | < 0.1% |
존 | 1 | < 0.1% |
성별
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
남 | |
---|---|
여 | 367 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 남 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
남 | 9633 | |
여 | 367 | 3.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남 | 9633 | |
여 | 367 | 3.7% |
본적(대분류)
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경상북도 | |
---|---|
충청남도 | |
미상 | |
전라남도 | |
경기도 | |
Other values (17) |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.5867 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 충청남도 |
---|---|
2nd row | 평안남도 |
3rd row | 전라남도 |
4th row | 충청남도 |
5th row | 충청남도 |
Common Values
Value | Count | Frequency (%) |
경상북도 | 1391 | |
충청남도 | 986 | |
미상 | 885 | |
전라남도 | 849 | |
경기도 | 813 | |
경상남도 | 797 | |
평안북도 | 761 | |
전라북도 | 637 | 6.4% |
평안남도 | 566 | 5.7% |
함경남도 | 473 | 4.7% |
Other values (12) | 1842 |
Length
Value | Count | Frequency (%) |
경상북도 | 1391 | |
충청남도 | 986 | |
미상 | 885 | |
전라남도 | 849 | |
경기도 | 813 | |
경상남도 | 797 | |
평안북도 | 761 | |
전라북도 | 637 | 6.4% |
평안남도 | 566 | 5.7% |
함경남도 | 473 | 4.7% |
Other values (12) | 1842 |
본적(소분류)
Text
MISSING
 
Distinct | 267 |
---|---|
Distinct (%) | 3.0% |
Missing | 1145 |
Missing (%) | 11.5% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
안동 | 218 | 2.5% |
기타 | 211 | 2.4% |
청양 | 168 | 1.9% |
홍성 | 139 | 1.6% |
의주 | 138 | 1.6% |
영덕 | 134 | 1.5% |
평양 | 116 | 1.3% |
서산 | 107 | 1.2% |
의성 | 102 | 1.2% |
안성 | 102 | 1.2% |
Other values (257) | 7420 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 1213 | 6.8% |
천 | 1059 | 6.0% |
산 | 965 | 5.4% |
성 | 945 | 5.3% |
양 | 719 | 4.1% |
안 | 650 | 3.7% |
영 | 542 | 3.1% |
원 | 482 | 2.7% |
청 | 428 | 2.4% |
동 | 427 | 2.4% |
Other values (141) | 10318 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 17748 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 1213 | 6.8% |
천 | 1059 | 6.0% |
산 | 965 | 5.4% |
성 | 945 | 5.3% |
양 | 719 | 4.1% |
안 | 650 | 3.7% |
영 | 542 | 3.1% |
원 | 482 | 2.7% |
청 | 428 | 2.4% |
동 | 427 | 2.4% |
Other values (141) | 10318 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 17748 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 1213 | 6.8% |
천 | 1059 | 6.0% |
산 | 965 | 5.4% |
성 | 945 | 5.3% |
양 | 719 | 4.1% |
안 | 650 | 3.7% |
영 | 542 | 3.1% |
원 | 482 | 2.7% |
청 | 428 | 2.4% |
동 | 427 | 2.4% |
Other values (141) | 10318 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 17748 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 1213 | 6.8% |
천 | 1059 | 6.0% |
산 | 965 | 5.4% |
성 | 945 | 5.3% |
양 | 719 | 4.1% |
안 | 650 | 3.7% |
영 | 542 | 3.1% |
원 | 482 | 2.7% |
청 | 428 | 2.4% |
동 | 427 | 2.4% |
Other values (141) | 10318 |
운동계열
Categorical
HIGH CORRELATION
 
Distinct | 16 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
3.1운동 | |
---|---|
국내항일 | |
의병 | |
만주방면 | |
학생운동 | |
Other values (11) |
Length
Max length | 7 |
---|---|
Median length | 6 |
Mean length | 4.0276 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 3.1운동 |
---|---|
2nd row | 광복군 |
3rd row | 학생운동 |
4th row | 3.1운동 |
5th row | 3.1운동 |
Common Values
Value | Count | Frequency (%) |
3.1운동 | 3495 | |
국내항일 | 1681 | |
의병 | 1509 | |
만주방면 | 1409 | |
학생운동 | 454 | 4.5% |
광복군 | 317 | 3.2% |
미주방면 | 221 | 2.2% |
임시정부 | 218 | 2.2% |
일본방면 | 181 | 1.8% |
중국방면 | 168 | 1.7% |
Other values (6) | 347 | 3.5% |
Length
Value | Count | Frequency (%) |
3.1운동 | 3495 | |
국내항일 | 1681 | |
의병 | 1509 | |
만주방면 | 1409 | |
학생운동 | 454 | 4.5% |
광복군 | 317 | 3.2% |
미주방면 | 221 | 2.2% |
임시정부 | 218 | 2.2% |
일본방면 | 181 | 1.8% |
중국방면 | 168 | 1.7% |
Other values (6) | 347 | 3.5% |
포상년도
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 52 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2001.8771 |
Minimum | 1949 |
---|---|
Maximum | 2024 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1949 |
---|---|
5-th percentile | 1990 |
Q1 | 1991 |
median | 2002 |
Q3 | 2014 |
95-th percentile | 2022 |
Maximum | 2024 |
Range | 75 |
Interquartile range (IQR) | 23 |
Descriptive statistics
Standard deviation | 13.810484 |
---|---|
Coefficient of variation (CV) | 0.0068987672 |
Kurtosis | 0.19204473 |
Mean | 2001.8771 |
Median Absolute Deviation (MAD) | 12 |
Skewness | -0.44104039 |
Sum | 20018771 |
Variance | 190.72947 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1990 | 2011 | |
1995 | 796 | 8.0% |
1991 | 622 | 6.2% |
2021 | 375 | 3.8% |
2019 | 356 | 3.6% |
2020 | 346 | 3.5% |
2022 | 329 | 3.3% |
2005 | 317 | 3.2% |
1992 | 314 | 3.1% |
2006 | 281 | 2.8% |
Other values (42) | 4253 |
Value | Count | Frequency (%) |
1949 | 2 | < 0.1% |
1950 | 10 | 0.1% |
1953 | 1 | < 0.1% |
1962 | 119 | |
1963 | 151 | |
1966 | 1 | < 0.1% |
1968 | 54 | 0.5% |
1969 | 1 | < 0.1% |
1976 | 1 | < 0.1% |
1977 | 54 | 0.5% |
Value | Count | Frequency (%) |
2024 | 60 | 0.6% |
2023 | 152 | |
2022 | 329 | |
2021 | 375 | |
2020 | 346 | |
2019 | 356 | |
2018 | 198 | |
2017 | 134 | 1.3% |
2016 | 176 | |
2015 | 267 |
훈격(대분류)
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
건국훈장 | |
---|---|
표창 | |
포장 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.311 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 표창 |
---|---|
2nd row | 건국훈장 |
3rd row | 표창 |
4th row | 표창 |
5th row | 표창 |
Common Values
Value | Count | Frequency (%) |
건국훈장 | 6555 | |
표창 | 2628 | |
포장 | 817 | 8.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
건국훈장 | 6555 | |
표창 | 2628 | |
포장 | 817 | 8.2% |
훈격(소분류)
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
애족장 | |
---|---|
대통령표창 | |
애국장 | |
건국포장 | |
독립장 | |
Other values (2) | 77 |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.6171 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대통령표창 |
---|---|
2nd row | 애국장 |
3rd row | 대통령표창 |
4th row | 대통령표창 |
5th row | 대통령표창 |
Common Values
Value | Count | Frequency (%) |
애족장 | 3515 | |
대통령표창 | 2628 | |
애국장 | 2505 | |
건국포장 | 817 | 8.2% |
독립장 | 458 | 4.6% |
대통령장 | 56 | 0.6% |
대한민국장 | 21 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
애족장 | 3515 | |
대통령표창 | 2628 | |
애국장 | 2505 | |
건국포장 | 817 | 8.2% |
독립장 | 458 | 4.6% |
대통령장 | 56 | 0.6% |
대한민국장 | 21 | 0.2% |
훈장전수여부
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
전수 | |
---|---|
미전수 | |
비해당 | 1 |
Length
Max length | 3 |
---|---|
Median length | 2 |
Mean length | 2.3976 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 전수 |
---|---|
2nd row | 전수 |
3rd row | 전수 |
4th row | 전수 |
5th row | 전수 |
Common Values
Value | Count | Frequency (%) |
전수 | 6024 | |
미전수 | 3975 | |
비해당 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
전수 | 6024 | |
미전수 | 3975 | |
비해당 | 1 | < 0.1% |
외국인여부
Boolean
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 87.9 KiB |
False | |
---|---|
True | 43 |
Value | Count | Frequency (%) |
False | 9957 | |
True | 43 | 0.4% |
관리번호 | 성별 | 본적(대분류) | 운동계열 | 포상년도 | 훈격(대분류) | 훈격(소분류) | 훈장전수여부 | 외국인여부 | |
---|---|---|---|---|---|---|---|---|---|
관리번호 | 1.000 | 0.047 | 0.701 | 0.739 | 0.779 | 0.490 | 0.380 | 0.416 | 0.489 |
성별 | 0.047 | 1.000 | 0.149 | 0.327 | 0.228 | 0.078 | 0.125 | 0.016 | 0.019 |
본적(대분류) | 0.701 | 0.149 | 1.000 | 0.723 | 0.486 | 0.417 | 0.466 | 0.573 | 0.984 |
운동계열 | 0.739 | 0.327 | 0.723 | 1.000 | 0.555 | 0.567 | 0.553 | 0.466 | 1.000 |
포상년도 | 0.779 | 0.228 | 0.486 | 0.555 | 1.000 | 0.485 | 0.635 | 0.482 | 0.717 |
훈격(대분류) | 0.490 | 0.078 | 0.417 | 0.567 | 0.485 | 1.000 | 1.000 | 0.250 | 0.022 |
훈격(소분류) | 0.380 | 0.125 | 0.466 | 0.553 | 0.635 | 1.000 | 1.000 | 0.261 | 0.194 |
훈장전수여부 | 0.416 | 0.016 | 0.573 | 0.466 | 0.482 | 0.250 | 0.261 | 1.000 | 0.019 |
외국인여부 | 0.489 | 0.019 | 0.984 | 1.000 | 0.717 | 0.022 | 0.194 | 0.019 | 1.000 |
성별 | 외국인여부 | 운동계열 | 훈격(대분류) | 훈장전수여부 | 본적(대분류) | 훈격(소분류) | |
---|---|---|---|---|---|---|---|
성별 | 1.000 | 0.012 | 0.257 | 0.129 | 0.026 | 0.118 | 0.133 |
외국인여부 | 0.012 | 1.000 | 0.999 | 0.037 | 0.032 | 0.899 | 0.207 |
운동계열 | 0.257 | 0.999 | 1.000 | 0.374 | 0.288 | 0.310 | 0.292 |
훈격(대분류) | 0.129 | 0.037 | 0.374 | 1.000 | 0.081 | 0.240 | 1.000 |
훈장전수여부 | 0.026 | 0.032 | 0.288 | 0.081 | 1.000 | 0.364 | 0.181 |
본적(대분류) | 0.118 | 0.899 | 0.310 | 0.240 | 0.364 | 1.000 | 0.219 |
훈격(소분류) | 0.133 | 0.207 | 0.292 | 1.000 | 0.181 | 0.219 | 1.000 |
관리번호 | 포상년도 | 성별 | 본적(대분류) | 운동계열 | 훈격(대분류) | 훈격(소분류) | 훈장전수여부 | 외국인여부 | |
---|---|---|---|---|---|---|---|---|---|
관리번호 | 1.000 | 0.735 | 0.078 | 0.490 | 0.556 | 0.197 | 0.277 | 0.155 | 0.747 |
포상년도 | 0.735 | 1.000 | 0.175 | 0.194 | 0.246 | 0.333 | 0.393 | 0.331 | 0.524 |
성별 | 0.078 | 0.175 | 1.000 | 0.118 | 0.257 | 0.129 | 0.133 | 0.026 | 0.012 |
본적(대분류) | 0.490 | 0.194 | 0.118 | 1.000 | 0.310 | 0.240 | 0.219 | 0.364 | 0.899 |
운동계열 | 0.556 | 0.246 | 0.257 | 0.310 | 1.000 | 0.374 | 0.292 | 0.288 | 0.999 |
훈격(대분류) | 0.197 | 0.333 | 0.129 | 0.240 | 0.374 | 1.000 | 1.000 | 0.081 | 0.037 |
훈격(소분류) | 0.277 | 0.393 | 0.133 | 0.219 | 0.292 | 1.000 | 1.000 | 0.181 | 0.207 |
훈장전수여부 | 0.155 | 0.331 | 0.026 | 0.364 | 0.288 | 0.081 | 0.181 | 1.000 | 0.032 |
외국인여부 | 0.747 | 0.524 | 0.012 | 0.899 | 0.999 | 0.037 | 0.207 | 0.032 | 1.000 |
관리번호 | 성명 | 생년월일 | 사망년월일 | 성별 | 본적(대분류) | 본적(소분류) | 운동계열 | 포상년도 | 훈격(대분류) | 훈격(소분류) | 훈장전수여부 | 외국인여부 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
10441 | 36656 | 조재창 | 1887-05-12 | 1956-05-30 | 남 | 충청남도 | 청양 | 3.1운동 | 2019 | 표창 | 대통령표창 | 전수 | N |
6357 | 8481 | 신영묵 | 1922-09-05 | 1979-10-06 | 남 | 평안남도 | 평원 | 광복군 | 1990 | 건국훈장 | 애국장 | 전수 | N |
11124 | 50835 | 조창섭 | 1912-10-18 | 1969-03-18 | 남 | 전라남도 | 영암 | 학생운동 | 2018 | 표창 | 대통령표창 | 전수 | N |
10054 | 34486 | 박병문 | 1886-08-14 | 1955-02-24 | 남 | 충청남도 | 공주 | 3.1운동 | 2020 | 표창 | 대통령표창 | 전수 | N |
16224 | 957421 | 김운배 | 1888-11-27 | 1966-07-15 | 남 | 충청남도 | 아산 | 3.1운동 | 2021 | 표창 | 대통령표창 | 전수 | N |
13579 | 951588 | 김화서 | 1886-00-00 | 미상 | 남 | 충청북도 | 충주 | 의병 | 2014 | 건국훈장 | 애국장 | 미전수 | N |
1161 | 1421 | 감익룡 | 1887-12-29 | 1946-09-00 | 남 | 황해도 | 송화 | 계몽운동 | 1990 | 건국훈장 | 애족장 | 전수 | N |
7262 | 9584 | 박수찬 | 1867-10-27 | 1922-08-14 | 남 | 경상북도 | 청송 | 의병 | 2010 | 포장 | 건국포장 | 전수 | N |
12419 | 90302 | 마뇌병 | 1888-06-29 | 1950-06-25 | 남 | 강원도 | 춘천 | 국내항일 | 2012 | 포장 | 건국포장 | 전수 | N |
2050 | 2679 | 정성언 | 1892-07-07 | 1952-02-03 | 남 | 경상남도 | 동래 | 3.1운동 | 1993 | 표창 | 대통령표창 | 전수 | N |
관리번호 | 성명 | 생년월일 | 사망년월일 | 성별 | 본적(대분류) | 본적(소분류) | 운동계열 | 포상년도 | 훈격(대분류) | 훈격(소분류) | 훈장전수여부 | 외국인여부 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
13028 | 950534 | 김원식 | 1858-00-00 | 1907-12-14 | 남 | 미상 | <NA> | 의병 | 2003 | 건국훈장 | 애국장 | 미전수 | N |
3365 | 4664 | 송훈익 | 1884-09-22 | 1961-02-27 | 남 | 경상북도 | 성주 | 3.1운동 | 1990 | 건국훈장 | 애족장 | 전수 | N |
8754 | 30666 | 김성실 | 1869-04-03 | 1931-01-25 | 남 | 경기도 | 수원 | 3.1운동 | 2007 | 표창 | 대통령표창 | 전수 | N |
15544 | 956082 | 홍익삼 | 1888-06-20 | 미상 | 남 | 서울 | <NA> | 미주방면 | 2020 | 포장 | 건국포장 | 미전수 | N |
13577 | 951585 | 모명순 | 1879-00-00 | 미상 | 남 | 충청북도 | 괴산 | 의병 | 2014 | 건국훈장 | 애족장 | 미전수 | N |
5344 | 7365 | 유상 | 1890-08-30 | 1950-07-10 | 남 | 전라북도 | 정읍 | 국내항일 | 2005 | 표창 | 대통령표창 | 전수 | N |
10796 | 42374 | 최경훈 | 1867-00-00 | 미상 | 남 | 평안남도 | 성천 | 국내항일 | 2010 | 포장 | 건국포장 | 미전수 | N |
13251 | 950822 | 안수갑 | 1897-11-21 | 1973-09-27 | 남 | 경상북도 | 달성 | 국내항일 | 2018 | 건국훈장 | 애족장 | 전수 | N |
1189 | 1459 | 이석근 | 1885-11-27 | 1947-02-17 | 남 | 경기도 | 안성 | 3.1운동 | 1990 | 건국훈장 | 애족장 | 전수 | N |
8613 | 30227 | 권재갑 | 1900-03-27 | 미상 | 남 | 경상북도 | 달성 | 3.1운동 | 2020 | 표창 | 대통령표창 | 미전수 | N |