Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 535 |
Missing cells (%) | 0.8% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 634.8 KiB |
Average record size in memory | 65.0 B |
Variable types
Categorical | 5 |
---|---|
Text | 1 |
Numeric | 1 |
Dataset
Description | 1. 진료일기준(한의분류 제외, 약국 제외), 연령(연말기준)2. 건강보험 급여실적(의료급여 제외)이며, 비급여는 제외- 2023년 6월 지급분까지 반영3. 아래 질병통계 자료는 요양기관에서 환자진료중 진단명이 확정되지 않은 상태에서의 호소, 증세 등에 따라, 일차진단명을 부여하고 청구한 내역 중 주진단명 및 제1부상병 기준으로 발췌한 것이므로 최종 확정된 질병과는 다를 수 있음<주상병코드 및 제1부상병코드>-A: F70-99, R62-B: G40-47, G70-73, G80-83, Q00-07, Q85, Q87, Q90-99* 각 코드별 상세설명은 KOICD 질병분류정보센터(https://www.koicd.kr)에서 참조※ 시군구 단위의 5인 미만 자료는 개인정보 보호를 위해 공란으로 처리됩니다.※ 2023.12.4. 발췌 데이터로서, 민원인의 제공 신청에 따른 제공 건 |
---|---|
Author | 국민건강보험공단 |
URL | https://www.data.go.kr/data/15125351/fileData.do |
진료인원(명) has 535 (5.3%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 00:02:50.789217 |
---|---|
Analysis finished | 2023-12-12 00:02:51.651629 |
Duration | 0.86 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
주부상병코드그룹
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
B | |
---|---|
A |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | B |
---|---|
2nd row | A |
3rd row | B |
4th row | A |
5th row | A |
Common Values
Value | Count | Frequency (%) |
B | 5036 | |
A | 4964 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
b | 5036 | |
a | 4964 |
진료년도
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
2021년 | |
---|---|
2019년 | |
2020년 | |
2022년 | |
2018년 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2021년 |
---|---|
2nd row | 2019년 |
3rd row | 2020년 |
4th row | 2019년 |
5th row | 2021년 |
Common Values
Value | Count | Frequency (%) |
2021년 | 2038 | |
2019년 | 2007 | |
2020년 | 1997 | |
2022년 | 1988 | |
2018년 | 1970 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2021년 | 2038 | |
2019년 | 2007 | |
2020년 | 1997 | |
2022년 | 1988 | |
2018년 | 1970 |
시도
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
경기도 | |
---|---|
서울특별시 |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.7492 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 |
---|---|
2nd row | 경기도 |
3rd row | 서울특별시 |
4th row | 경기도 |
5th row | 경기도 |
Common Values
Value | Count | Frequency (%) |
경기도 | 6254 | |
서울특별시 | 3746 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
경기도 | 6254 | |
서울특별시 | 3746 |
시군구
Text
Distinct | 72 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
수원시 | 597 | 4.8% |
성남시 | 456 | 3.6% |
고양시 | 451 | 3.6% |
용인시 | 434 | 3.5% |
안산시 | 318 | 2.5% |
안양시 | 297 | 2.4% |
부천시 | 163 | 1.3% |
동작구 | 162 | 1.3% |
노원구 | 161 | 1.3% |
일산서구 | 160 | 1.3% |
Other values (66) | 9331 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 6566 | 15.9% |
시 | 5974 | 14.5% |
2530 | 6.1% | |
양 | 1497 | 3.6% |
안 | 1215 | 2.9% |
천 | 1194 | 2.9% |
원 | 1072 | 2.6% |
성 | 1052 | 2.6% |
동 | 1043 | 2.5% |
산 | 940 | 2.3% |
Other values (70) | 18115 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 38668 | |
Space Separator | 2530 | 6.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 6566 | 17.0% |
시 | 5974 | 15.4% |
양 | 1497 | 3.9% |
안 | 1215 | 3.1% |
천 | 1194 | 3.1% |
원 | 1072 | 2.8% |
성 | 1052 | 2.7% |
동 | 1043 | 2.7% |
산 | 940 | 2.4% |
남 | 914 | 2.4% |
Other values (69) | 17201 |
Space Separator
Value | Count | Frequency (%) |
2530 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 38668 | |
Common | 2530 | 6.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 6566 | 17.0% |
시 | 5974 | 15.4% |
양 | 1497 | 3.9% |
안 | 1215 | 3.1% |
천 | 1194 | 3.1% |
원 | 1072 | 2.8% |
성 | 1052 | 2.7% |
동 | 1043 | 2.7% |
산 | 940 | 2.4% |
남 | 914 | 2.4% |
Other values (69) | 17201 |
Common
Value | Count | Frequency (%) |
2530 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 38668 | |
ASCII | 2530 | 6.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 6566 | 17.0% |
시 | 5974 | 15.4% |
양 | 1497 | 3.9% |
안 | 1215 | 3.1% |
천 | 1194 | 3.1% |
원 | 1072 | 2.8% |
성 | 1052 | 2.7% |
동 | 1043 | 2.7% |
산 | 940 | 2.4% |
남 | 914 | 2.4% |
Other values (69) | 17201 |
ASCII
Value | Count | Frequency (%) |
2530 |
연령
Categorical
Distinct | 10 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
16~18세 | |
---|---|
1세 | |
4세 | |
2세 | |
3세 | |
Other values (5) |
Length
Max length | 6 |
---|---|
Median length | 2 |
Mean length | 3.1041 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 4세 |
---|---|
2nd row | 11~15세 |
3rd row | 5세 |
4th row | 4세 |
5th row | 4세 |
Common Values
Value | Count | Frequency (%) |
16~18세 | 1027 | |
1세 | 1018 | |
4세 | 1007 | |
2세 | 1006 | |
3세 | 1004 | |
11~15세 | 1002 | |
5세 | 992 | |
6세 | 992 | |
0세 | 977 | |
7~10세 | 975 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
16~18세 | 1027 | |
1세 | 1018 | |
4세 | 1007 | |
2세 | 1006 | |
3세 | 1004 | |
11~15세 | 1002 | |
5세 | 992 | |
6세 | 992 | |
0세 | 977 | |
7~10세 | 975 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
여자 | |
---|---|
남자 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남자 |
---|---|
2nd row | 남자 |
3rd row | 여자 |
4th row | 남자 |
5th row | 여자 |
Common Values
Value | Count | Frequency (%) |
여자 | 5006 | |
남자 | 4994 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
여자 | 5006 | |
남자 | 4994 |
진료인원(명)
Real number (ℝ)
MISSING
 
Distinct | 582 |
---|---|
Distinct (%) | 6.1% |
Missing | 535 |
Missing (%) | 5.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 80.345061 |
Minimum | 5 |
---|---|
Maximum | 1559 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 5 |
---|---|
5-th percentile | 7 |
Q1 | 17 |
median | 35 |
Q3 | 90 |
95-th percentile | 313 |
Maximum | 1559 |
Range | 1554 |
Interquartile range (IQR) | 73 |
Descriptive statistics
Standard deviation | 118.32596 |
---|---|
Coefficient of variation (CV) | 1.4727222 |
Kurtosis | 18.70616 |
Mean | 80.345061 |
Median Absolute Deviation (MAD) | 23 |
Skewness | 3.5634552 |
Sum | 760466 |
Variance | 14001.032 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
11 | 217 | 2.2% |
15 | 212 | 2.1% |
12 | 204 | 2.0% |
14 | 200 | 2.0% |
16 | 198 | 2.0% |
13 | 187 | 1.9% |
10 | 185 | 1.8% |
19 | 179 | 1.8% |
9 | 176 | 1.8% |
8 | 174 | 1.7% |
Other values (572) | 7533 | |
(Missing) | 535 | 5.3% |
Value | Count | Frequency (%) |
5 | 168 | |
6 | 161 | |
7 | 164 | |
8 | 174 | |
9 | 176 | |
10 | 185 | |
11 | 217 | |
12 | 204 | |
13 | 187 | |
14 | 200 |
Value | Count | Frequency (%) |
1559 | 1 | |
1427 | 1 | |
1231 | 1 | |
1224 | 1 | |
1215 | 1 | |
1189 | 1 | |
1039 | 1 | |
1020 | 1 | |
986 | 1 | |
985 | 1 |
주부상병코드그룹 | 진료년도 | 시도 | 시군구 | 연령 | 성별 | 진료인원(명) | |
---|---|---|---|---|---|---|---|
주부상병코드그룹 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.007 | 0.039 |
진료년도 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.085 |
시도 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.008 |
시군구 | 0.000 | 0.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.325 |
연령 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.400 |
성별 | 0.007 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.078 |
진료인원(명) | 0.039 | 0.085 | 0.008 | 0.325 | 0.400 | 0.078 | 1.000 |
주부상병코드그룹 | 시도 | 성별 | 연령 | 진료년도 | |
---|---|---|---|---|---|
주부상병코드그룹 | 1.000 | 0.000 | 0.005 | 0.000 | 0.000 |
시도 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
성별 | 0.005 | 0.000 | 1.000 | 0.000 | 0.000 |
연령 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
진료년도 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
진료인원(명) | 주부상병코드그룹 | 진료년도 | 시도 | 연령 | 성별 | |
---|---|---|---|---|---|---|
진료인원(명) | 1.000 | 0.039 | 0.049 | 0.008 | 0.194 | 0.078 |
주부상병코드그룹 | 0.039 | 1.000 | 0.000 | 0.000 | 0.000 | 0.005 |
진료년도 | 0.049 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
시도 | 0.008 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 |
연령 | 0.194 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
성별 | 0.078 | 0.005 | 0.000 | 0.000 | 0.000 | 1.000 |
주부상병코드그룹 | 진료년도 | 시도 | 시군구 | 연령 | 성별 | 진료인원(명) | |
---|---|---|---|---|---|---|---|
11065 | B | 2021년 | 서울특별시 | 구로구 | 4세 | 남자 | 24 |
2253 | A | 2019년 | 경기도 | 과천시 | 11~15세 | 남자 | 51 |
9732 | B | 2020년 | 서울특별시 | 구로구 | 5세 | 여자 | 19 |
2385 | A | 2019년 | 경기도 | 하남시 | 4세 | 남자 | 61 |
4948 | A | 2021년 | 경기도 | 구리시 | 4세 | 여자 | 17 |
9381 | B | 2019년 | 경기도 | 양평군 | 0세 | 남자 | <NA> |
4652 | A | 2021년 | 경기도 | 성남시 분당구 | 0세 | 여자 | 20 |
185 | A | 2018년 | 서울특별시 | 도봉구 | 2세 | 여자 | 17 |
3636 | A | 2020년 | 경기도 | 오산시 | 0세 | 여자 | 10 |
4014 | A | 2020년 | 경기도 | 양평군 | 1세 | 여자 | <NA> |
주부상병코드그룹 | 진료년도 | 시도 | 시군구 | 연령 | 성별 | 진료인원(명) | |
---|---|---|---|---|---|---|---|
10065 | B | 2020년 | 경기도 | 안양시 만안구 | 2세 | 남자 | 8 |
2127 | A | 2019년 | 경기도 | 안산시 | 1세 | 남자 | <NA> |
10 | A | 2018년 | 서울특별시 | 종로구 | 5세 | 남자 | 24 |
12900 | B | 2022년 | 경기도 | 고양시 덕양구 | 1세 | 남자 | 37 |
10165 | B | 2020년 | 경기도 | 동두천시 | 2세 | 남자 | <NA> |
12598 | B | 2022년 | 경기도 | 수원시 권선구 | 1세 | 남자 | 20 |
10945 | B | 2021년 | 서울특별시 | 노원구 | 4세 | 남자 | 23 |
5692 | A | 2022년 | 서울특별시 | 강서구 | 6세 | 남자 | 152 |
8941 | B | 2019년 | 경기도 | 고양시 일산서구 | 11~15세 | 남자 | 240 |
12198 | B | 2022년 | 서울특별시 | 중랑구 | 1세 | 남자 | 23 |