Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
Categorical | 3 |
---|---|
Text | 1 |
Numeric | 1 |
Dataset
Description | 1. 등록연도: 2018년~2022년 2. 암 상병별(KCD기준 상병코드 3단까지) 등록자 수(신규암, 재등록암, 중복암 포함) * 암: 보건복지부고시 「본인일부부담금 산정특례에 관한 기준」 [별표 3] 중증질환자 산정특례 대상 의 구분1에 해당하는 경우 전체 ** 삭제 건 제외 3. 성별구분: 남, 여 4. 연령구분: 연도말 기준 만나이. 5세 단위 구분. 단 0세와 1~4세는 구분. (0세, 1~4세/5~9세/…/100세 이상) ※ 민원인의 제공 신청에 따른 제공 건으로서 2023-07-14 발췌 |
---|---|
URL | https://www.data.go.kr/data/15116694/fileData.do |
등록자수 has 3492 (34.9%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 21:16:22.533671 |
---|---|
Analysis finished | 2023-12-12 21:16:23.029660 |
Duration | 0.5 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
등록연도
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2021 | |
---|---|
2022 | |
2018 | |
2020 | |
2019 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2021 |
---|---|
2nd row | 2022 |
3rd row | 2019 |
4th row | 2019 |
5th row | 2018 |
Common Values
Value | Count | Frequency (%) |
2021 | 2017 | |
2022 | 2014 | |
2018 | 2004 | |
2020 | 1990 | |
2019 | 1975 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2021 | 2017 | |
2022 | 2014 | |
2018 | 2004 | |
2020 | 1990 | |
2019 | 1975 |
등록 상병(KCD 분류 기준)
Text
Distinct | 112 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
c88 | 111 | 1.1% |
c81 | 106 | 1.1% |
c66 | 105 | 1.1% |
c20 | 104 | 1.0% |
c68 | 104 | 1.0% |
c07 | 102 | 1.0% |
d05 | 102 | 1.0% |
c11 | 101 | 1.0% |
c85 | 101 | 1.0% |
c46 | 100 | 1.0% |
Other values (102) | 8964 |
Most occurring characters
Value | Count | Frequency (%) |
C | 7982 | |
0 | 2795 | 9.3% |
4 | 2606 | 8.7% |
3 | 2323 | 7.7% |
D | 2018 | 6.7% |
1 | 1933 | 6.4% |
6 | 1899 | 6.3% |
7 | 1867 | 6.2% |
5 | 1781 | 5.9% |
8 | 1695 | 5.7% |
Other values (2) | 3101 | 10.3% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 20000 | |
Uppercase Letter | 10000 |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 2795 | |
4 | 2606 | |
3 | 2323 | |
1 | 1933 | |
6 | 1899 | |
7 | 1867 | |
5 | 1781 | |
8 | 1695 | |
2 | 1656 | |
9 | 1445 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 7982 | |
D | 2018 | 20.2% |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 20000 | |
Latin | 10000 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 2795 | |
4 | 2606 | |
3 | 2323 | |
1 | 1933 | |
6 | 1899 | |
7 | 1867 | |
5 | 1781 | |
8 | 1695 | |
2 | 1656 | |
9 | 1445 |
Latin
Value | Count | Frequency (%) |
C | 7982 | |
D | 2018 | 20.2% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 30000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
C | 7982 | |
0 | 2795 | 9.3% |
4 | 2606 | 8.7% |
3 | 2323 | 7.7% |
D | 2018 | 6.7% |
1 | 1933 | 6.4% |
6 | 1899 | 6.3% |
7 | 1867 | 6.2% |
5 | 1781 | 5.9% |
8 | 1695 | 5.7% |
Other values (2) | 3101 | 10.3% |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여 | |
---|---|
남 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남 |
---|---|
2nd row | 여 |
3rd row | 남 |
4th row | 남 |
5th row | 남 |
Common Values
Value | Count | Frequency (%) |
여 | 5040 | |
남 | 4960 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여 | 5040 | |
남 | 4960 |
연령
Categorical
Distinct | 22 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
55~59 | 500 |
---|---|
90~94 | 484 |
5~9 | 482 |
70~74 | 471 |
35~39 | 464 |
Other values (17) |
Length
Max length | 6 |
---|---|
Median length | 5 |
Mean length | 4.6809 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 75~79 |
---|---|
2nd row | 90~94 |
3rd row | 60~64 |
4th row | 45~49 |
5th row | 45~49 |
Common Values
Value | Count | Frequency (%) |
55~59 | 500 | 5.0% |
90~94 | 484 | 4.8% |
5~9 | 482 | 4.8% |
70~74 | 471 | 4.7% |
35~39 | 464 | 4.6% |
95~99 | 463 | 4.6% |
40~44 | 462 | 4.6% |
1~4 | 460 | 4.6% |
60~64 | 459 | 4.6% |
20~24 | 458 | 4.6% |
Other values (12) | 5297 |
Length
Value | Count | Frequency (%) |
55~59 | 500 | 4.8% |
90~94 | 484 | 4.6% |
5~9 | 482 | 4.6% |
70~74 | 471 | 4.5% |
35~39 | 464 | 4.4% |
95~99 | 463 | 4.4% |
40~44 | 462 | 4.4% |
1~4 | 460 | 4.4% |
60~64 | 459 | 4.4% |
20~24 | 458 | 4.4% |
Other values (13) | 5726 |
등록자수
Real number (ℝ)
ZEROS
 
Distinct | 649 |
---|---|
Distinct (%) | 6.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 66.4386 |
Minimum | 0 |
---|---|
Maximum | 5262 |
Zeros | 3492 |
Zeros (%) | 34.9% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 3 |
Q3 | 22 |
95-th percentile | 266 |
Maximum | 5262 |
Range | 5262 |
Interquartile range (IQR) | 22 |
Descriptive statistics
Standard deviation | 292.48421 |
---|---|
Coefficient of variation (CV) | 4.4023235 |
Kurtosis | 110.21405 |
Mean | 66.4386 |
Median Absolute Deviation (MAD) | 3 |
Skewness | 9.4246897 |
Sum | 664386 |
Variance | 85547.014 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 3492 | |
1 | 772 | 7.7% |
2 | 494 | 4.9% |
3 | 385 | 3.9% |
4 | 297 | 3.0% |
5 | 266 | 2.7% |
6 | 225 | 2.2% |
7 | 188 | 1.9% |
8 | 173 | 1.7% |
9 | 156 | 1.6% |
Other values (639) | 3552 |
Value | Count | Frequency (%) |
0 | 3492 | |
1 | 772 | 7.7% |
2 | 494 | 4.9% |
3 | 385 | 3.9% |
4 | 297 | 3.0% |
5 | 266 | 2.7% |
6 | 225 | 2.2% |
7 | 188 | 1.9% |
8 | 173 | 1.7% |
9 | 156 | 1.6% |
Value | Count | Frequency (%) |
5262 | 1 | |
5189 | 1 | |
5129 | 1 | |
4911 | 1 | |
4412 | 1 | |
4398 | 1 | |
4147 | 1 | |
3967 | 1 | |
3860 | 1 | |
3837 | 1 |
등록연도 | 성별 | 연령 | 등록자수 | |
---|---|---|---|---|
등록연도 | 1.000 | 0.000 | 0.000 | 0.000 |
성별 | 0.000 | 1.000 | 0.000 | 0.026 |
연령 | 0.000 | 0.000 | 1.000 | 0.180 |
등록자수 | 0.000 | 0.026 | 0.180 | 1.000 |
등록연도 | 연령 | 성별 | |
---|---|---|---|
등록연도 | 1.000 | 0.000 | 0.000 |
연령 | 0.000 | 1.000 | 0.000 |
성별 | 0.000 | 0.000 | 1.000 |
등록자수 | 등록연도 | 성별 | 연령 | |
---|---|---|---|---|
등록자수 | 1.000 | 0.000 | 0.020 | 0.068 |
등록연도 | 0.000 | 1.000 | 0.000 | 0.000 |
성별 | 0.020 | 0.000 | 1.000 | 0.000 |
연령 | 0.068 | 0.000 | 0.000 | 1.000 |
등록연도 | 등록 상병(KCD 분류 기준) | 성별 | 연령 | 등록자수 | |
---|---|---|---|---|---|
15592 | 2021 | C18 | 남 | 75~79 | 1282 |
22305 | 2022 | C65 | 여 | 90~94 | 7 |
5293 | 2019 | C08 | 남 | 60~64 | 23 |
9778 | 2019 | D47 | 남 | 45~49 | 73 |
1330 | 2018 | C33 | 남 | 45~49 | 2 |
19308 | 2021 | D39 | 여 | 65~69 | 39 |
17575 | 2021 | C70 | 남 | 90~94 | 0 |
19845 | 2022 | C03 | 남 | 1~4 | 0 |
21818 | 2022 | C53 | 여 | 75~79 | 144 |
6176 | 2019 | C31 | 남 | 75~79 | 13 |
등록연도 | 등록 상병(KCD 분류 기준) | 성별 | 연령 | 등록자수 | |
---|---|---|---|---|---|
10773 | 2020 | C20 | 여 | 70~74 | 266 |
1442 | 2018 | C37 | 여 | 55~59 | 49 |
3463 | 2018 | C85 | 여 | 40~44 | 53 |
2516 | 2018 | C64 | 남 | 35~39 | 168 |
18020 | 2021 | C80 | 여 | 5~9 | 1 |
9285 | 2019 | D33 | 남 | 1~4 | 4 |
11462 | 2020 | C41 | 여 | 0 | 3 |
306 | 2018 | C06 | 여 | 95~99 | 2 |
4292 | 2018 | D09 | 여 | 5~9 | 0 |
17601 | 2021 | C71 | 남 | 1~4 | 7 |