Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 66 |
Missing cells | 18 |
Missing cells (%) | 3.0% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.5% |
Total size in memory | 5.0 KiB |
Average record size in memory | 78.0 B |
Variable types
Numeric | 2 |
---|---|
Categorical | 6 |
Boolean | 1 |
Dataset
Description | 부산광역시 남구 2017년부터 2019년까지 연도별 납세자유형, 관내/관외 구분, 납세자수와 관련된 지방세 납세자 현황에 대해 세목별로 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15078574/fileData.do |
Dataset has 1 (1.5%) duplicate rows | Duplicates |
과세년도 is highly overall correlated with 연번 and 3 other fields | High correlation |
납세자유형 is highly overall correlated with 납세자수 and 3 other fields | High correlation |
시군구명 is highly overall correlated with 연번 and 7 other fields | High correlation |
자치단체코드 is highly overall correlated with 연번 and 7 other fields | High correlation |
시도명 is highly overall correlated with 연번 and 7 other fields | High correlation |
관내_관외 is highly overall correlated with 시도명 and 2 other fields | High correlation |
세목명 is highly overall correlated with 시도명 and 2 other fields | High correlation |
연번 is highly overall correlated with 시도명 and 3 other fields | High correlation |
납세자수 is highly overall correlated with 시도명 and 3 other fields | High correlation |
시도명 is highly imbalanced (56.1%) | Imbalance |
시군구명 is highly imbalanced (56.1%) | Imbalance |
자치단체코드 is highly imbalanced (56.1%) | Imbalance |
연번 has 6 (9.1%) missing values | Missing |
관내_관외 has 6 (9.1%) missing values | Missing |
납세자수 has 6 (9.1%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 06:15:12.905504 |
---|---|
Analysis finished | 2023-12-12 06:15:14.224928 |
Duration | 1.32 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연번
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 60 |
---|---|
Distinct (%) | 100.0% |
Missing | 6 |
Missing (%) | 9.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 30.5 |
Minimum | 1 |
---|---|
Maximum | 60 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 726.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 3.95 |
Q1 | 15.75 |
median | 30.5 |
Q3 | 45.25 |
95-th percentile | 57.05 |
Maximum | 60 |
Range | 59 |
Interquartile range (IQR) | 29.5 |
Descriptive statistics
Standard deviation | 17.464249 |
---|---|
Coefficient of variation (CV) | 0.57259833 |
Kurtosis | -1.2 |
Mean | 30.5 |
Median Absolute Deviation (MAD) | 15 |
Skewness | 0 |
Sum | 1830 |
Variance | 305 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
32 | 1 | 1.5% |
34 | 1 | 1.5% |
35 | 1 | 1.5% |
36 | 1 | 1.5% |
37 | 1 | 1.5% |
38 | 1 | 1.5% |
39 | 1 | 1.5% |
40 | 1 | 1.5% |
41 | 1 | 1.5% |
42 | 1 | 1.5% |
Other values (50) | 50 | |
(Missing) | 6 | 9.1% |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
60 | 1 | |
59 | 1 | |
58 | 1 | |
57 | 1 | |
56 | 1 | |
55 | 1 | |
54 | 1 | |
53 | 1 | |
52 | 1 | |
51 | 1 |
시도명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
부산광역시 | |
---|---|
<NA> | 6 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9090909 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 부산광역시 |
---|---|
2nd row | 부산광역시 |
3rd row | 부산광역시 |
4th row | 부산광역시 |
5th row | 부산광역시 |
Common Values
Value | Count | Frequency (%) |
부산광역시 | 60 | |
<NA> | 6 | 9.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
부산광역시 | 60 | |
na | 6 | 9.1% |
시군구명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
남구 | |
---|---|
<NA> | 6 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1818182 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남구 |
---|---|
2nd row | 남구 |
3rd row | 남구 |
4th row | 남구 |
5th row | 남구 |
Common Values
Value | Count | Frequency (%) |
남구 | 60 | |
<NA> | 6 | 9.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남구 | 60 | |
na | 6 | 9.1% |
자치단체코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
26290 | |
---|---|
<NA> | 6 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9090909 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 26290 |
---|---|
2nd row | 26290 |
3rd row | 26290 |
4th row | 26290 |
5th row | 26290 |
Common Values
Value | Count | Frequency (%) |
26290 | 60 | |
<NA> | 6 | 9.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
26290 | 60 | |
na | 6 | 9.1% |
과세년도
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 4.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
2020 | |
---|---|
2021 | |
<NA> |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2020 |
---|---|
2nd row | 2020 |
3rd row | 2020 |
4th row | 2020 |
5th row | 2020 |
Common Values
Value | Count | Frequency (%) |
2020 | 31 | |
2021 | 29 | |
<NA> | 6 | 9.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2020 | 31 | |
2021 | 29 | |
na | 6 | 9.1% |
세목명
Categorical
HIGH CORRELATION
 
Distinct | 11 |
---|---|
Distinct (%) | 16.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
등록면허세 | |
---|---|
지방소득세 | |
지역자원시설세 | |
재산세 | |
주민세 | |
Other values (6) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.2424242 |
Min length | 3 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 3.0% |
Sample
1st row | 등록면허세 |
---|---|
2nd row | 등록면허세 |
3rd row | 지방소득세 |
4th row | 지방소득세 |
5th row | 지방소득세 |
Common Values
Value | Count | Frequency (%) |
등록면허세 | 8 | |
지방소득세 | 8 | |
지역자원시설세 | 8 | |
재산세 | 8 | |
주민세 | 8 | |
취득세 | 8 | |
자동차세 | 8 | |
<NA> | 6 | |
지방소비세 | 2 | 3.0% |
등록세 | 1 | 1.5% |
Length
Value | Count | Frequency (%) |
등록면허세 | 8 | |
지방소득세 | 8 | |
지역자원시설세 | 8 | |
재산세 | 8 | |
주민세 | 8 | |
취득세 | 8 | |
자동차세 | 8 | |
na | 6 | |
지방소비세 | 2 | 3.0% |
등록세 | 1 | 1.5% |
납세자유형
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 4.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 660.0 B |
법인 | |
---|---|
개인 | |
<NA> |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1818182 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 법인 |
---|---|
2nd row | 법인 |
3rd row | 개인 |
4th row | 개인 |
5th row | 법인 |
Common Values
Value | Count | Frequency (%) |
법인 | 31 | |
개인 | 29 | |
<NA> | 6 | 9.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
법인 | 31 | |
개인 | 29 | |
na | 6 | 9.1% |
관내_관외
Boolean
HIGH CORRELATION
  MISSING
 
Distinct | 2 |
---|---|
Distinct (%) | 3.3% |
Missing | 6 |
Missing (%) | 9.1% |
Memory size | 264.0 B |
True | |
---|---|
False | |
(Missing) |
Value | Count | Frequency (%) |
True | 31 | |
False | 29 | |
(Missing) | 6 | 9.1% |
납세자수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 56 |
---|---|
Distinct (%) | 93.3% |
Missing | 6 |
Missing (%) | 9.1% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 13545.183 |
Minimum | 1 |
---|---|
Maximum | 95702 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 726.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 298 |
median | 1979.5 |
Q3 | 11109.25 |
95-th percentile | 77369.45 |
Maximum | 95702 |
Range | 95701 |
Interquartile range (IQR) | 10811.25 |
Descriptive statistics
Standard deviation | 24807.658 |
---|---|
Coefficient of variation (CV) | 1.8314745 |
Kurtosis | 3.8193505 |
Mean | 13545.183 |
Median Absolute Deviation (MAD) | 1953 |
Skewness | 2.1968911 |
Sum | 812711 |
Variance | 6.1541992 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 4 | 6.1% |
5 | 2 | 3.0% |
302 | 1 | 1.5% |
659 | 1 | 1.5% |
8367 | 1 | 1.5% |
95702 | 1 | 1.5% |
1121 | 1 | 1.5% |
2415 | 1 | 1.5% |
2940 | 1 | 1.5% |
6201 | 1 | 1.5% |
Other values (46) | 46 | |
(Missing) | 6 | 9.1% |
Value | Count | Frequency (%) |
1 | 4 | |
5 | 2 | |
25 | 1 | 1.5% |
28 | 1 | 1.5% |
29 | 1 | 1.5% |
33 | 1 | 1.5% |
71 | 1 | 1.5% |
80 | 1 | 1.5% |
143 | 1 | 1.5% |
186 | 1 | 1.5% |
Value | Count | Frequency (%) |
95702 | 1 | |
92072 | 1 | |
80114 | 1 | |
77225 | 1 | |
70461 | 1 | |
66656 | 1 | |
45014 | 1 | |
39636 | 1 | |
32984 | 1 | |
32660 | 1 |
연번 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | 납세자수 | |
---|---|---|---|---|---|---|
연번 | 1.000 | 0.999 | 0.897 | 0.000 | 0.000 | 0.000 |
과세년도 | 0.999 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
세목명 | 0.897 | 0.000 | 1.000 | 0.000 | 0.000 | 0.413 |
납세자유형 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.607 |
관내_관외 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.437 |
납세자수 | 0.000 | 0.000 | 0.413 | 0.607 | 0.437 | 1.000 |
과세년도 | 납세자유형 | 시군구명 | 자치단체코드 | 시도명 | 관내_관외 | 세목명 | |
---|---|---|---|---|---|---|---|
과세년도 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 |
납세자유형 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 |
시군구명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
자치단체코드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시도명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
관내_관외 | 0.000 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 |
세목명 | 0.000 | 0.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 |
연번 | 납세자수 | 시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | |
---|---|---|---|---|---|---|---|---|---|
연번 | 1.000 | 0.015 | 1.000 | 1.000 | 1.000 | 0.897 | 0.491 | 0.000 | 0.000 |
납세자수 | 0.015 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.192 | 0.573 | 0.408 |
시도명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시군구명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
자치단체코드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
과세년도 | 0.897 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
세목명 | 0.491 | 0.192 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 | 0.000 | 0.000 |
납세자유형 | 0.000 | 0.573 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 1.000 | 0.000 |
관내_관외 | 0.000 | 0.408 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 | 1.000 |
연번 | 시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | 납세자수 | |
---|---|---|---|---|---|---|---|---|---|
0 | 1 | 부산광역시 | 남구 | 26290 | 2020 | 등록면허세 | 법인 | N | 1891 |
1 | 2 | 부산광역시 | 남구 | 26290 | 2020 | 등록면허세 | 법인 | Y | 1945 |
2 | 3 | 부산광역시 | 남구 | 26290 | 2020 | 지방소득세 | 개인 | N | 10121 |
3 | 4 | 부산광역시 | 남구 | 26290 | 2020 | 지방소득세 | 개인 | Y | 39636 |
4 | 5 | 부산광역시 | 남구 | 26290 | 2020 | 지방소득세 | 법인 | N | 1017 |
5 | 6 | 부산광역시 | 남구 | 26290 | 2020 | 지방소득세 | 법인 | Y | 2049 |
6 | 7 | 부산광역시 | 남구 | 26290 | 2020 | 지방소비세 | 법인 | Y | 1 |
7 | 8 | 부산광역시 | 남구 | 26290 | 2020 | 지역자원시설세 | 개인 | N | 33 |
8 | 9 | 부산광역시 | 남구 | 26290 | 2020 | 지역자원시설세 | 개인 | Y | 71 |
9 | 10 | 부산광역시 | 남구 | 26290 | 2020 | 지역자원시설세 | 법인 | N | 5 |
연번 | 시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | 납세자수 | |
---|---|---|---|---|---|---|---|---|---|
56 | 57 | 부산광역시 | 남구 | 26290 | 2021 | 지역자원시설세 | 개인 | N | 25 |
57 | 58 | 부산광역시 | 남구 | 26290 | 2021 | 지역자원시설세 | 개인 | Y | 80 |
58 | 59 | 부산광역시 | 남구 | 26290 | 2021 | 지역자원시설세 | 법인 | N | 5 |
59 | 60 | 부산광역시 | 남구 | 26290 | 2021 | 지역자원시설세 | 법인 | Y | 29 |
60 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
61 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
62 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
63 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
64 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
65 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
연번 | 시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | 납세자수 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 6 |