Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 1561 |
Missing cells (%) | 2.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 644.5 KiB |
Average record size in memory | 66.0 B |
Variable types
Categorical | 5 |
---|---|
Numeric | 2 |
Dataset
Description | 중앙암등록본부(국립암센터 지정)가 국가암등록통계사업을 통해 수집한 [2021년 암등록통계]자료로 1999년부터 2021년도 까지의 암발생 통계 정보를 제공합니다.(단위 : 명, 10만 명 당 발생률) |
---|---|
Author | 국립암센터 |
URL | https://www.data.go.kr/data/3039563/fileData.do |
국제질병분류 is highly overall correlated with 암종 | High correlation |
암종 is highly overall correlated with 국제질병분류 | High correlation |
발생자수 is highly overall correlated with 조발생률 | High correlation |
조발생률 is highly overall correlated with 발생자수 | High correlation |
조발생률 has 1561 (15.6%) missing values | Missing |
발생자수 is highly skewed (γ1 = 69.98564945) | Skewed |
발생자수 has 1561 (15.6%) zeros | Zeros |
조발생률 has 189 (1.9%) zeros | Zeros |
Reproduction
Analysis started | 2024-03-14 19:33:53.122428 |
---|---|
Analysis finished | 2024-03-14 19:33:55.728793 |
Duration | 2.61 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
발생연도
Categorical
Distinct | 24 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2020 | 444 |
---|---|
2001 | 442 |
2005 | 437 |
1999 | 432 |
2014 | 432 |
Other values (19) |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 4.203 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2009 |
---|---|
2nd row | 2015 |
3rd row | 2009 |
4th row | 2017 |
5th row | 2011 |
Common Values
Value | Count | Frequency (%) |
2020 | 444 | 4.4% |
2001 | 442 | 4.4% |
2005 | 437 | 4.4% |
1999 | 432 | 4.3% |
2014 | 432 | 4.3% |
2004 | 431 | 4.3% |
2003 | 425 | 4.2% |
2013 | 422 | 4.2% |
2002 | 422 | 4.2% |
2008 | 420 | 4.2% |
Other values (14) | 5693 |
Length
Value | Count | Frequency (%) |
2020 | 444 | 4.4% |
2001 | 442 | 4.4% |
2005 | 437 | 4.4% |
1999 | 432 | 4.3% |
2014 | 432 | 4.3% |
2004 | 431 | 4.3% |
2003 | 425 | 4.2% |
2013 | 422 | 4.2% |
2002 | 422 | 4.2% |
2008 | 420 | 4.2% |
Other values (14) | 5693 |
성별
Categorical
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
남자 | |
---|---|
남녀전체 | |
여자 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.6648 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남자 |
---|---|
2nd row | 남자 |
3rd row | 남녀전체 |
4th row | 남자 |
5th row | 여자 |
Common Values
Value | Count | Frequency (%) |
남자 | 3387 | |
남녀전체 | 3324 | |
여자 | 3289 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남자 | 3387 | |
남녀전체 | 3324 | |
여자 | 3289 |
국제질병분류
Categorical
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
18. C70-C72 | 427 |
---|---|
17. C67 | 424 |
20. C81 | 420 |
03. C16 | 417 |
00. All cancers | 416 |
Other values (20) |
Length
Max length | 21 |
---|---|
Median length | 7 |
Mean length | 9.2062 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 14. C61 |
---|---|
2nd row | 05. C22 |
3rd row | 15. C62 |
4th row | 15. C62 |
5th row | 00. All cancers |
Common Values
Value | Count | Frequency (%) |
18. C70-C72 | 427 | 4.3% |
17. C67 | 424 | 4.2% |
20. C81 | 420 | 4.2% |
03. C16 | 417 | 4.2% |
00. All cancers | 416 | 4.2% |
24. All other cancers | 415 | 4.2% |
01. C00-C14 | 411 | 4.1% |
16. C64 | 405 | 4.0% |
22. C90 | 405 | 4.0% |
04. C18-C20 | 405 | 4.0% |
Other values (15) | 5855 |
Length
Value | Count | Frequency (%) |
all | 831 | 3.9% |
cancers | 831 | 3.9% |
18 | 427 | 2.0% |
c70-c72 | 427 | 2.0% |
c67 | 424 | 2.0% |
17 | 424 | 2.0% |
20 | 420 | 2.0% |
c81 | 420 | 2.0% |
03 | 417 | 2.0% |
c16 | 417 | 2.0% |
Other values (41) | 16208 |
암종
Categorical
HIGH CORRELATION
 
Distinct | 25 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
뇌 및 중추신경계 | 427 |
---|---|
방광 | 424 |
호지킨림프종 | 420 |
위 | 417 |
모든암 | 416 |
Other values (20) |
Length
Max length | 11 |
---|---|
Median length | 9 |
Mean length | 3.7994 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전립선 |
---|---|
2nd row | 간 |
3rd row | 고환 |
4th row | 고환 |
5th row | 모든암 |
Common Values
Value | Count | Frequency (%) |
뇌 및 중추신경계 | 427 | 4.3% |
방광 | 424 | 4.2% |
호지킨림프종 | 420 | 4.2% |
위 | 417 | 4.2% |
모든암 | 416 | 4.2% |
기타 암 | 415 | 4.2% |
입술, 구강 및 인두 | 411 | 4.1% |
신장 | 405 | 4.0% |
다발성 골수종 | 405 | 4.0% |
대장 | 405 | 4.0% |
Other values (15) | 5855 |
Length
Value | Count | Frequency (%) |
및 | 1239 | 9.0% |
뇌 | 427 | 3.1% |
중추신경계 | 427 | 3.1% |
방광 | 424 | 3.1% |
호지킨림프종 | 420 | 3.1% |
위 | 417 | 3.0% |
모든암 | 416 | 3.0% |
기타 | 415 | 3.0% |
암 | 415 | 3.0% |
입술 | 411 | 3.0% |
Other values (22) | 8698 |
연령군
Categorical
Distinct | 19 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
50-54세 | 558 |
---|---|
25-29세 | 545 |
80-84세 | 544 |
70-74세 | 542 |
05-09세 | 536 |
Other values (14) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.8437 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 60-64세 |
---|---|
2nd row | 40-44세 |
3rd row | 15-19세 |
4th row | 25-29세 |
5th row | 60-64세 |
Common Values
Value | Count | Frequency (%) |
50-54세 | 558 | 5.6% |
25-29세 | 545 | 5.5% |
80-84세 | 544 | 5.4% |
70-74세 | 542 | 5.4% |
05-09세 | 536 | 5.4% |
40-44세 | 529 | 5.3% |
35-39세 | 529 | 5.3% |
15-19세 | 528 | 5.3% |
30-34세 | 528 | 5.3% |
45-49세 | 527 | 5.3% |
Other values (9) | 4634 |
Length
Value | Count | Frequency (%) |
50-54세 | 558 | 5.6% |
25-29세 | 545 | 5.5% |
80-84세 | 544 | 5.4% |
70-74세 | 542 | 5.4% |
05-09세 | 536 | 5.4% |
40-44세 | 529 | 5.3% |
35-39세 | 529 | 5.3% |
15-19세 | 528 | 5.3% |
30-34세 | 528 | 5.3% |
45-49세 | 527 | 5.3% |
Other values (9) | 4634 |
발생자수
Real number (ℝ)
HIGH CORRELATION
  SKEWED
  ZEROS
 
Distinct | 2230 |
---|---|
Distinct (%) | 22.3% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2469.8342 |
Minimum | 0 |
---|---|
Maximum | 4382233 |
Zeros | 1561 |
Zeros (%) | 15.6% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 5 |
median | 72 |
Q3 | 404 |
95-th percentile | 4791.3 |
Maximum | 4382233 |
Range | 4382233 |
Interquartile range (IQR) | 399 |
Descriptive statistics
Standard deviation | 51776.306 |
---|---|
Coefficient of variation (CV) | 20.963475 |
Kurtosis | 5519.0499 |
Mean | 2469.8342 |
Median Absolute Deviation (MAD) | 72 |
Skewness | 69.985649 |
Sum | 24698342 |
Variance | 2.6807859 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 1561 | 15.6% |
1 | 379 | 3.8% |
2 | 231 | 2.3% |
3 | 171 | 1.7% |
4 | 123 | 1.2% |
5 | 110 | 1.1% |
6 | 100 | 1.0% |
11 | 82 | 0.8% |
9 | 82 | 0.8% |
7 | 80 | 0.8% |
Other values (2220) | 7081 |
Value | Count | Frequency (%) |
0 | 1561 | |
1 | 379 | 3.8% |
2 | 231 | 2.3% |
3 | 171 | 1.7% |
4 | 123 | 1.2% |
5 | 110 | 1.1% |
6 | 100 | 1.0% |
7 | 80 | 0.8% |
8 | 74 | 0.7% |
9 | 82 | 0.8% |
Value | Count | Frequency (%) |
4382233 | 1 | |
2306970 | 1 | |
634529 | 1 | |
531576 | 1 | |
485175 | 1 | |
429086 | 1 | |
423824 | 1 | |
356435 | 1 | |
315660 | 1 | |
267463 | 1 |
조발생률
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 1711 |
---|---|
Distinct (%) | 20.3% |
Missing | 1561 |
Missing (%) | 15.6% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 63.398625 |
Minimum | 0 |
---|---|
Maximum | 3259.9 |
Zeros | 189 |
Zeros (%) | 1.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0.1 |
Q1 | 1.2 |
median | 7.1 |
Q3 | 30.9 |
95-th percentile | 250.55 |
Maximum | 3259.9 |
Range | 3259.9 |
Interquartile range (IQR) | 29.7 |
Descriptive statistics
Standard deviation | 233.04569 |
---|---|
Coefficient of variation (CV) | 3.6758792 |
Kurtosis | 77.636249 |
Mean | 63.398625 |
Median Absolute Deviation (MAD) | 6.8 |
Skewness | 8.0053721 |
Sum | 535021 |
Variance | 54310.294 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.1 | 497 | 5.0% |
0.2 | 266 | 2.7% |
0.3 | 220 | 2.2% |
0.0 | 189 | 1.9% |
0.4 | 162 | 1.6% |
0.5 | 153 | 1.5% |
0.7 | 128 | 1.3% |
0.6 | 104 | 1.0% |
0.8 | 95 | 0.9% |
0.9 | 94 | 0.9% |
Other values (1701) | 6531 | |
(Missing) | 1561 | 15.6% |
Value | Count | Frequency (%) |
0.0 | 189 | 1.9% |
0.1 | 497 | |
0.2 | 266 | |
0.3 | 220 | |
0.4 | 162 | 1.6% |
0.5 | 153 | 1.5% |
0.6 | 104 | 1.0% |
0.7 | 128 | 1.3% |
0.8 | 95 | 0.9% |
0.9 | 94 | 0.9% |
Value | Count | Frequency (%) |
3259.9 | 1 | |
3193.7 | 1 | |
3188.1 | 1 | |
3187.6 | 1 | |
3166.4 | 1 | |
3116.0 | 1 | |
3059.5 | 1 | |
3000.5 | 1 | |
2973.0 | 1 | |
2955.9 | 1 |
발생연도 | 성별 | 국제질병분류 | 암종 | 연령군 | 발생자수 | 조발생률 | |
---|---|---|---|---|---|---|---|
발생연도 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.085 | 0.000 |
성별 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.015 | 0.161 |
국제질병분류 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 | 0.036 | 0.527 |
암종 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 | 0.036 | 0.527 |
연령군 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.220 |
발생자수 | 0.085 | 0.015 | 0.036 | 0.036 | 0.000 | 1.000 | 0.189 |
조발생률 | 0.000 | 0.161 | 0.527 | 0.527 | 0.220 | 0.189 | 1.000 |
연령군 | 발생연도 | 국제질병분류 | 암종 | 성별 | |
---|---|---|---|---|---|
연령군 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
발생연도 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
국제질병분류 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
암종 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
성별 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
발생자수 | 조발생률 | 발생연도 | 성별 | 국제질병분류 | 암종 | 연령군 | |
---|---|---|---|---|---|---|---|
발생자수 | 1.000 | 0.857 | 0.041 | 0.014 | 0.019 | 0.019 | 0.000 |
조발생률 | 0.857 | 1.000 | 0.000 | 0.097 | 0.214 | 0.214 | 0.084 |
발생연도 | 0.041 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
성별 | 0.014 | 0.097 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
국제질병분류 | 0.019 | 0.214 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
암종 | 0.019 | 0.214 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 |
연령군 | 0.000 | 0.084 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
발생연도 | 성별 | 국제질병분류 | 암종 | 연령군 | 발생자수 | 조발생률 | |
---|---|---|---|---|---|---|---|
19753 | 2009 | 남자 | 14. C61 | 전립선 | 60-64세 | 958 | 94.3 |
7779 | 2015 | 남자 | 05. C22 | 간 | 40-44세 | 438 | 19.5 |
21093 | 2009 | 남녀전체 | 15. C62 | 고환 | 15-19세 | 12 | 0.3 |
21570 | 2017 | 남자 | 15. C62 | 고환 | 25-29세 | 71 | 4.2 |
734 | 2011 | 여자 | 00. All cancers | 모든암 | 60-64세 | 9903 | 855.8 |
26082 | 2000 | 남자 | 19. C73 | 갑상선 | 70-74세 | 19 | 5.8 |
26948 | 2015 | 여자 | 19. C73 | 갑상선 | 30-34세 | 1698 | 91.6 |
15447 | 2006 | 남녀전체 | 11. C53 | 자궁경부 | 00-04세 | 0 | <NA> |
5931 | 2007 | 남녀전체 | 04. C18-C20 | 대장 | 15-19세 | 8 | 0.2 |
7223 | 2005 | 여자 | 05. C22 | 간 | 15-19세 | 6 | 0.4 |
발생연도 | 성별 | 국제질병분류 | 암종 | 연령군 | 발생자수 | 조발생률 | |
---|---|---|---|---|---|---|---|
1916 | 2008 | 남자 | 01. C00-C14 | 입술, 구강 및 인두 | 80-84세 | 52 | 35.2 |
21549 | 2017 | 남녀전체 | 15. C62 | 고환 | 15-19세 | 6 | 0.2 |
6132 | 2010 | 남자 | 04. C18-C20 | 대장 | 70-74세 | 2480 | 377.2 |
27768 | 2006 | 남녀전체 | 20. C81 | 호지킨림프종 | 45-49세 | 14 | 0.3 |
8784 | 2009 | 남녀전체 | 06. C23-C24 | 담낭 및 기타담도 | 30-34세 | 13 | 0.3 |
11693 | 2012 | 남녀전체 | 08. C32 | 후두 | 40-44세 | 10 | 0.2 |
13059 | 2012 | 남녀전체 | 09. C33-C34 | 폐 | 30-34세 | 48 | 1.2 |
29971 | 2020 | 여자 | 21. C82-C86,C96 | 비호지킨림프종 | 40-44세 | 93 | 4.9 |
22649 | 2012 | 남자 | 16. C64 | 신장 | 05-09세 | 1 | 0.1 |
9350 | 2019 | 남녀전체 | 06. C23-C24 | 담낭 및 기타담도 | 10-14세 | 0 | <NA> |