Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 38 |
Missing cells | 4 |
Missing cells (%) | 1.3% |
Duplicate rows | 1 |
Duplicate rows (%) | 2.6% |
Total size in memory | 2.6 KiB |
Average record size in memory | 70.5 B |
Variable types
Categorical | 6 |
---|---|
Boolean | 1 |
Numeric | 1 |
Dataset
Description | 지방세 납세자 현황으로 시도명, 시군구명, 과세년도, 세목명, 납세자유형, 관내/관외 , 납세자수 등을 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15079186/fileData.do |
Dataset has 1 (2.6%) duplicate rows | Duplicates |
시도명 is highly overall correlated with 납세자수 and 6 other fields | High correlation |
관내_관외 is highly overall correlated with 시도명 and 3 other fields | High correlation |
자치단체코드 is highly overall correlated with 납세자수 and 6 other fields | High correlation |
시군구명 is highly overall correlated with 납세자수 and 6 other fields | High correlation |
과세년도 is highly overall correlated with 납세자수 and 6 other fields | High correlation |
세목명 is highly overall correlated with 시도명 and 3 other fields | High correlation |
납세자유형 is highly overall correlated with 시도명 and 3 other fields | High correlation |
납세자수 is highly overall correlated with 시도명 and 3 other fields | High correlation |
시도명 is highly imbalanced (70.3%) | Imbalance |
시군구명 is highly imbalanced (70.3%) | Imbalance |
자치단체코드 is highly imbalanced (70.3%) | Imbalance |
과세년도 is highly imbalanced (70.3%) | Imbalance |
관내_관외 has 2 (5.3%) missing values | Missing |
납세자수 has 2 (5.3%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 16:09:27.709493 |
---|---|
Analysis finished | 2023-12-12 16:09:28.810923 |
Duration | 1.1 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 5.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
전라남도 | |
---|---|
<NA> | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 전라남도 |
---|---|
2nd row | 전라남도 |
3rd row | 전라남도 |
4th row | 전라남도 |
5th row | 전라남도 |
Common Values
Value | Count | Frequency (%) |
전라남도 | 36 | |
<NA> | 2 | 5.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
전라남도 | 36 | |
na | 2 | 5.3% |
시군구명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 5.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
강진군 | |
---|---|
<NA> | 2 |
Length
Max length | 4 |
---|---|
Median length | 3 |
Mean length | 3.0526316 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강진군 |
---|---|
2nd row | 강진군 |
3rd row | 강진군 |
4th row | 강진군 |
5th row | 강진군 |
Common Values
Value | Count | Frequency (%) |
강진군 | 36 | |
<NA> | 2 | 5.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
강진군 | 36 | |
na | 2 | 5.3% |
자치단체코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 5.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
46810 | |
---|---|
<NA> | 2 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9473684 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 46810 |
---|---|
2nd row | 46810 |
3rd row | 46810 |
4th row | 46810 |
5th row | 46810 |
Common Values
Value | Count | Frequency (%) |
46810 | 36 | |
<NA> | 2 | 5.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
46810 | 36 | |
na | 2 | 5.3% |
과세년도
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 5.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
2022 | |
---|---|
<NA> | 2 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2022 |
---|---|
2nd row | 2022 |
3rd row | 2022 |
4th row | 2022 |
5th row | 2022 |
Common Values
Value | Count | Frequency (%) |
2022 | 36 | |
<NA> | 2 | 5.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2022 | 36 | |
na | 2 | 5.3% |
세목명
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 31.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
등록세 | |
---|---|
재산세 | |
주민세 | |
취득세 | |
자동차세 | |
Other values (7) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.0526316 |
Min length | 3 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 2.6% |
Sample
1st row | 등록세 |
---|---|
2nd row | 등록세 |
3rd row | 등록세 |
4th row | 등록세 |
5th row | 레저세 |
Common Values
Value | Count | Frequency (%) |
등록세 | 4 | |
재산세 | 4 | |
주민세 | 4 | |
취득세 | 4 | |
자동차세 | 4 | |
등록면허세 | 4 | |
지방소득세 | 4 | |
지역자원시설세 | 3 | |
레저세 | 2 | |
담배소비세 | 2 | |
Other values (2) | 3 |
Length
Value | Count | Frequency (%) |
등록세 | 4 | |
재산세 | 4 | |
주민세 | 4 | |
취득세 | 4 | |
자동차세 | 4 | |
등록면허세 | 4 | |
지방소득세 | 4 | |
지역자원시설세 | 3 | |
레저세 | 2 | |
담배소비세 | 2 | |
Other values (2) | 3 |
납세자유형
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 7.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 436.0 B |
개인 | |
---|---|
법인 | |
<NA> |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1052632 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 개인 |
---|---|
2nd row | 개인 |
3rd row | 법인 |
4th row | 법인 |
5th row | 개인 |
Common Values
Value | Count | Frequency (%) |
개인 | 19 | |
법인 | 17 | |
<NA> | 2 | 5.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
개인 | 19 | |
법인 | 17 | |
na | 2 | 5.3% |
관내_관외
Boolean
HIGH CORRELATION
  MISSING
 
Distinct | 2 |
---|---|
Distinct (%) | 5.6% |
Missing | 2 |
Missing (%) | 5.3% |
Memory size | 208.0 B |
False | |
---|---|
True | |
(Missing) | 2 |
Value | Count | Frequency (%) |
False | 20 | |
True | 16 | |
(Missing) | 2 | 5.3% |
납세자수
Real number (ℝ)
HIGH CORRELATION
  MISSING
 
Distinct | 33 |
---|---|
Distinct (%) | 91.7% |
Missing | 2 |
Missing (%) | 5.3% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2962.4167 |
Minimum | 1 |
---|---|
Maximum | 25397 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 474.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2.5 |
Q1 | 33.25 |
median | 597.5 |
Q3 | 1659 |
95-th percentile | 17944 |
Maximum | 25397 |
Range | 25396 |
Interquartile range (IQR) | 1625.75 |
Descriptive statistics
Standard deviation | 6276.1117 |
---|---|
Coefficient of variation (CV) | 2.1185783 |
Kurtosis | 6.9637688 |
Mean | 2962.4167 |
Median Absolute Deviation (MAD) | 583 |
Skewness | 2.7455343 |
Sum | 106647 |
Variance | 39389578 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 3 | 7.9% |
1 | 2 | 5.3% |
767 | 1 | 2.6% |
73 | 1 | 2.6% |
471 | 1 | 2.6% |
38 | 1 | 2.6% |
2085 | 1 | 2.6% |
6524 | 1 | 2.6% |
715 | 1 | 2.6% |
967 | 1 | 2.6% |
Other values (23) | 23 | |
(Missing) | 2 | 5.3% |
Value | Count | Frequency (%) |
1 | 2 | |
3 | 3 | |
5 | 1 | 2.6% |
8 | 1 | 2.6% |
10 | 1 | 2.6% |
19 | 1 | 2.6% |
38 | 1 | 2.6% |
73 | 1 | 2.6% |
94 | 1 | 2.6% |
202 | 1 | 2.6% |
Value | Count | Frequency (%) |
25397 | 1 | |
23503 | 1 | |
16091 | 1 | |
11676 | 1 | |
6524 | 1 | |
5105 | 1 | |
3946 | 1 | |
2368 | 1 | |
2085 | 1 | |
1517 | 1 |
세목명 | 납세자유형 | 관내_관외 | 납세자수 | |
---|---|---|---|---|
세목명 | 1.000 | 0.000 | 0.000 | 0.000 |
납세자유형 | 0.000 | 1.000 | 0.000 | 0.415 |
관내_관외 | 0.000 | 0.000 | 1.000 | 0.390 |
납세자수 | 0.000 | 0.415 | 0.390 | 1.000 |
시도명 | 관내_관외 | 자치단체코드 | 시군구명 | 과세년도 | 세목명 | 납세자유형 | |
---|---|---|---|---|---|---|---|
시도명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
관내_관외 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 |
자치단체코드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시군구명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
과세년도 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
세목명 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 |
납세자유형 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 |
납세자수 | 시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | |
---|---|---|---|---|---|---|---|---|
납세자수 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.274 | 0.256 |
시도명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시군구명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
자치단체코드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
과세년도 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
세목명 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 |
납세자유형 | 0.274 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 | 0.000 |
관내_관외 | 0.256 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 1.000 |
시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | 납세자수 | |
---|---|---|---|---|---|---|---|---|
0 | 전라남도 | 강진군 | 46810 | 2022 | 등록세 | 개인 | N | 452 |
1 | 전라남도 | 강진군 | 46810 | 2022 | 등록세 | 개인 | Y | 516 |
2 | 전라남도 | 강진군 | 46810 | 2022 | 등록세 | 법인 | N | 5 |
3 | 전라남도 | 강진군 | 46810 | 2022 | 등록세 | 법인 | Y | 19 |
4 | 전라남도 | 강진군 | 46810 | 2022 | 레저세 | 개인 | N | 1 |
5 | 전라남도 | 강진군 | 46810 | 2022 | 레저세 | 법인 | N | 3 |
6 | 전라남도 | 강진군 | 46810 | 2022 | 재산세 | 개인 | N | 25397 |
7 | 전라남도 | 강진군 | 46810 | 2022 | 재산세 | 개인 | Y | 23503 |
8 | 전라남도 | 강진군 | 46810 | 2022 | 재산세 | 법인 | N | 719 |
9 | 전라남도 | 강진군 | 46810 | 2022 | 재산세 | 법인 | Y | 2368 |
시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | 납세자수 | |
---|---|---|---|---|---|---|---|---|
28 | 전라남도 | 강진군 | 46810 | 2022 | 지방소득세 | 개인 | N | 967 |
29 | 전라남도 | 강진군 | 46810 | 2022 | 지방소득세 | 개인 | Y | 5105 |
30 | 전라남도 | 강진군 | 46810 | 2022 | 지방소득세 | 법인 | N | 305 |
31 | 전라남도 | 강진군 | 46810 | 2022 | 지방소득세 | 법인 | Y | 681 |
32 | 전라남도 | 강진군 | 46810 | 2022 | 지방소비세 | 개인 | N | 1 |
33 | 전라남도 | 강진군 | 46810 | 2022 | 지역자원시설세 | 개인 | N | 3 |
34 | 전라남도 | 강진군 | 46810 | 2022 | 지역자원시설세 | 개인 | Y | 10 |
35 | 전라남도 | 강진군 | 46810 | 2022 | 지역자원시설세 | 법인 | Y | 8 |
36 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
37 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 납세자유형 | 관내_관외 | 납세자수 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 2 |