Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 24 |
Missing cells | 5 |
Missing cells (%) | 4.2% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.2 KiB |
Average record size in memory | 49.5 B |
Variable types
Text | 1 |
---|---|
Numeric | 2 |
Categorical | 2 |
Dataset
Description | 경상북도 각 시군 병원 개업 및 폐업에 대한 데이터로 각 병원의 폐업, 개원, 휴업에 관한 현황입니다. 참고하시기바랍니다. |
---|---|
Author | 경상북도 |
URL | https://www.data.go.kr/data/15039077/fileData.do |
폐업 is highly overall correlated with 병원 개소 수 and 2 other fields | High correlation |
병원 개소 수 is highly overall correlated with 폐업 and 1 other fields | High correlation |
휴업 is highly overall correlated with 폐업 | High correlation |
개원 is highly overall correlated with 폐업 and 1 other fields | High correlation |
휴업 is highly imbalanced (50.5%) | Imbalance |
개원 is highly imbalanced (50.5%) | Imbalance |
폐업 has 4 (16.7%) missing values | Missing |
병원 개소 수 has 1 (4.2%) missing values | Missing |
시군 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 23:33:20.281336 |
---|---|
Analysis finished | 2023-12-12 23:33:21.158697 |
Duration | 0.88 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시군
Text
UNIQUE
 
Distinct | 24 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
Value | Count | Frequency (%) |
포항남구 | 1 | 4.2% |
포항북구 | 1 | 4.2% |
울진군 | 1 | 4.2% |
봉화군 | 1 | 4.2% |
예천군 | 1 | 4.2% |
칠곡군 | 1 | 4.2% |
성주군 | 1 | 4.2% |
고령군 | 1 | 4.2% |
청도군 | 1 | 4.2% |
영덕군 | 1 | 4.2% |
Other values (14) | 14 |
Most occurring characters
Value | Count | Frequency (%) |
46 | ||
군 | 14 | 11.7% |
시 | 9 | 7.5% |
주 | 4 | 3.3% |
영 | 4 | 3.3% |
구 | 3 | 2.5% |
경 | 3 | 2.5% |
천 | 3 | 2.5% |
항 | 2 | 1.7% |
청 | 2 | 1.7% |
Other values (27) | 30 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 74 | |
Space Separator | 46 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 14 | |
시 | 9 | 12.2% |
주 | 4 | 5.4% |
영 | 4 | 5.4% |
구 | 3 | 4.1% |
경 | 3 | 4.1% |
천 | 3 | 4.1% |
항 | 2 | 2.7% |
청 | 2 | 2.7% |
울 | 2 | 2.7% |
Other values (26) | 28 |
Space Separator
Value | Count | Frequency (%) |
46 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 74 | |
Common | 46 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 14 | |
시 | 9 | 12.2% |
주 | 4 | 5.4% |
영 | 4 | 5.4% |
구 | 3 | 4.1% |
경 | 3 | 4.1% |
천 | 3 | 4.1% |
항 | 2 | 2.7% |
청 | 2 | 2.7% |
울 | 2 | 2.7% |
Other values (26) | 28 |
Common
Value | Count | Frequency (%) |
46 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 74 | |
ASCII | 46 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
46 |
Hangul
Value | Count | Frequency (%) |
군 | 14 | |
시 | 9 | 12.2% |
주 | 4 | 5.4% |
영 | 4 | 5.4% |
구 | 3 | 4.1% |
경 | 3 | 4.1% |
천 | 3 | 4.1% |
항 | 2 | 2.7% |
청 | 2 | 2.7% |
울 | 2 | 2.7% |
Other values (26) | 28 |
폐업
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 16 |
---|---|
Distinct (%) | 80.0% |
Missing | 4 |
Missing (%) | 16.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 12.85 |
Minimum | 1 |
---|---|
Maximum | 40 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 348.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 2.75 |
median | 6.5 |
Q3 | 20.25 |
95-th percentile | 36.2 |
Maximum | 40 |
Range | 39 |
Interquartile range (IQR) | 17.5 |
Descriptive statistics
Standard deviation | 12.786815 |
---|---|
Coefficient of variation (CV) | 0.99508286 |
Kurtosis | -0.34405541 |
Mean | 12.85 |
Median Absolute Deviation (MAD) | 5.5 |
Skewness | 0.9734948 |
Sum | 257 |
Variance | 163.50263 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 3 | |
2 | 2 | 8.3% |
6 | 2 | 8.3% |
19 | 1 | 4.2% |
36 | 1 | 4.2% |
4 | 1 | 4.2% |
18 | 1 | 4.2% |
40 | 1 | 4.2% |
15 | 1 | 4.2% |
25 | 1 | 4.2% |
Other values (6) | 6 | |
(Missing) | 4 |
Value | Count | Frequency (%) |
1 | 3 | |
2 | 2 | |
3 | 1 | 4.2% |
4 | 1 | 4.2% |
5 | 1 | 4.2% |
6 | 2 | |
7 | 1 | 4.2% |
8 | 1 | 4.2% |
15 | 1 | 4.2% |
18 | 1 | 4.2% |
Value | Count | Frequency (%) |
40 | 1 | |
36 | 1 | |
34 | 1 | |
25 | 1 | |
24 | 1 | |
19 | 1 | |
18 | 1 | |
15 | 1 | |
8 | 1 | |
7 | 1 |
휴업
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 12.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
<NA> | |
---|---|
1 | |
2 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.5 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 4.2% |
Sample
1st row | <NA> |
---|---|
2nd row | 1 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 20 | |
1 | 3 | 12.5% |
2 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 20 | |
1 | 3 | 12.5% |
2 | 1 | 4.2% |
개원
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 12.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 324.0 B |
<NA> | |
---|---|
1 | |
2 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.5 |
Min length | 1 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 4.2% |
Sample
1st row | <NA> |
---|---|
2nd row | <NA> |
3rd row | 2 |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 20 | |
1 | 3 | 12.5% |
2 | 1 | 4.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 20 | |
1 | 3 | 12.5% |
2 | 1 | 4.2% |
병원 개소 수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 14 |
---|---|
Distinct (%) | 60.9% |
Missing | 1 |
Missing (%) | 4.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9.7391304 |
Minimum | 1 |
---|---|
Maximum | 35 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 348.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 7 |
Q3 | 11 |
95-th percentile | 30.3 |
Maximum | 35 |
Range | 34 |
Interquartile range (IQR) | 8 |
Descriptive statistics
Standard deviation | 9.5404278 |
---|---|
Coefficient of variation (CV) | 0.9795975 |
Kurtosis | 1.5694348 |
Mean | 9.7391304 |
Median Absolute Deviation (MAD) | 4 |
Skewness | 1.4829868 |
Sum | 224 |
Variance | 91.019763 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
7 | 4 | |
1 | 3 | |
3 | 3 | |
11 | 2 | |
2 | 2 | |
35 | 1 | 4.2% |
31 | 1 | 4.2% |
18 | 1 | 4.2% |
24 | 1 | 4.2% |
8 | 1 | 4.2% |
Other values (4) | 4 |
Value | Count | Frequency (%) |
1 | 3 | |
2 | 2 | |
3 | 3 | |
4 | 1 | 4.2% |
7 | 4 | |
8 | 1 | 4.2% |
9 | 1 | 4.2% |
10 | 1 | 4.2% |
11 | 2 | |
18 | 1 | 4.2% |
Value | Count | Frequency (%) |
35 | 1 | 4.2% |
31 | 1 | 4.2% |
24 | 1 | 4.2% |
19 | 1 | 4.2% |
18 | 1 | 4.2% |
11 | 2 | |
10 | 1 | 4.2% |
9 | 1 | 4.2% |
8 | 1 | 4.2% |
7 | 4 |
시군 | 폐업 | 휴업 | 개원 | 병원 개소 수 | |
---|---|---|---|---|---|
시군 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
폐업 | 1.000 | 1.000 | 1.000 | 1.000 | 0.816 |
휴업 | 1.000 | 1.000 | 1.000 | NaN | 0.000 |
개원 | 1.000 | 1.000 | NaN | 1.000 | 1.000 |
병원 개소 수 | 1.000 | 0.816 | 0.000 | 1.000 | 1.000 |
휴업 | 개원 | |
---|---|---|
휴업 | 1.000 | NaN |
개원 | NaN | 1.000 |
폐업 | 병원 개소 수 | 휴업 | 개원 | |
---|---|---|---|---|
폐업 | 1.000 | 0.863 | 1.000 | 1.000 |
병원 개소 수 | 0.863 | 1.000 | 0.000 | 1.000 |
휴업 | 1.000 | 0.000 | 1.000 | 0.000 |
개원 | 1.000 | 1.000 | 0.000 | 1.000 |
시군 | 폐업 | 휴업 | 개원 | 병원 개소 수 | |
---|---|---|---|---|---|
0 | 포항남구 | 8 | <NA> | <NA> | 11 |
1 | 포항북구 | 40 | 1 | <NA> | 35 |
2 | 경주시 | 34 | <NA> | 2 | 31 |
3 | 김천시 | 15 | <NA> | <NA> | 7 |
4 | 안동시 | 19 | <NA> | <NA> | 18 |
5 | 구미시 | 36 | <NA> | <NA> | 24 |
6 | 영주시 | 4 | 1 | <NA> | 11 |
7 | 영천시 | 18 | <NA> | <NA> | 8 |
8 | 상주시 | 6 | <NA> | 1 | 7 |
9 | 문경시 | 2 | <NA> | <NA> | 4 |
시군 | 폐업 | 휴업 | 개원 | 병원 개소 수 | |
---|---|---|---|---|---|
14 | 영양군 | <NA> | <NA> | <NA> | 1 |
15 | 영덕군 | 6 | <NA> | <NA> | 2 |
16 | 청도군 | 5 | 1 | <NA> | 7 |
17 | 고령군 | 1 | <NA> | <NA> | 3 |
18 | 성주군 | 7 | <NA> | <NA> | 7 |
19 | 칠곡군 | <NA> | <NA> | 1 | 9 |
20 | 예천군 | 1 | <NA> | <NA> | 3 |
21 | 봉화군 | 1 | <NA> | <NA> | 2 |
22 | 울진군 | 2 | <NA> | <NA> | 3 |
23 | 울릉군 | <NA> | <NA> | <NA> | 1 |