Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 103 |
Missing cells | 30 |
Missing cells (%) | 3.2% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.0% |
Total size in memory | 7.8 KiB |
Average record size in memory | 77.3 B |
Variable types
Categorical | 6 |
---|---|
Text | 1 |
Numeric | 2 |
Dataset
Description | 지방세 과세를 위해 세원이 되는 과세 대상 유형별 부과된 현황을 제공하며, 물건 유형에 따른 세부담 수준의 형평성 검토 및 부동산 등 관련분야 규제정책 대상 확인 시 기초자료 활용된다. |
---|---|
URL | https://www.data.go.kr/data/15080261/fileData.do |
Dataset has 1 (1.0%) duplicate rows | Duplicates |
데이터기준일 is highly overall correlated with 부과건수 and 6 other fields | High correlation |
세목명 is highly overall correlated with 부과건수 and 4 other fields | High correlation |
과세년도 is highly overall correlated with 시도명 and 3 other fields | High correlation |
시도명 is highly overall correlated with 부과건수 and 6 other fields | High correlation |
시군구명 is highly overall correlated with 부과건수 and 6 other fields | High correlation |
자치단체코드 is highly overall correlated with 부과건수 and 6 other fields | High correlation |
부과건수 is highly overall correlated with 부과금액 and 5 other fields | High correlation |
부과금액 is highly overall correlated with 부과건수 and 4 other fields | High correlation |
시도명 is highly imbalanced (54.0%) | Imbalance |
시군구명 is highly imbalanced (54.0%) | Imbalance |
자치단체코드 is highly imbalanced (54.0%) | Imbalance |
데이터기준일 is highly imbalanced (54.0%) | Imbalance |
세원 유형명 has 10 (9.7%) missing values | Missing |
부과건수 has 10 (9.7%) missing values | Missing |
부과금액 has 10 (9.7%) missing values | Missing |
부과건수 has 25 (24.3%) zeros | Zeros |
부과금액 has 26 (25.2%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 05:41:23.866343 |
---|---|
Analysis finished | 2023-12-12 05:41:24.943461 |
Duration | 1.08 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시도명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
울산광역시 | |
---|---|
<NA> |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9029126 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 울산광역시 |
---|---|
2nd row | 울산광역시 |
3rd row | 울산광역시 |
4th row | 울산광역시 |
5th row | 울산광역시 |
Common Values
Value | Count | Frequency (%) |
울산광역시 | 93 | |
<NA> | 10 | 9.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
울산광역시 | 93 | |
na | 10 | 9.7% |
시군구명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
북구 | |
---|---|
<NA> |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.1941748 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 북구 |
---|---|
2nd row | 북구 |
3rd row | 북구 |
4th row | 북구 |
5th row | 북구 |
Common Values
Value | Count | Frequency (%) |
북구 | 93 | |
<NA> | 10 | 9.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
북구 | 93 | |
na | 10 | 9.7% |
자치단체코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
31200 | |
---|---|
<NA> |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.9029126 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 31200 |
---|---|
2nd row | 31200 |
3rd row | 31200 |
4th row | 31200 |
5th row | 31200 |
Common Values
Value | Count | Frequency (%) |
31200 | 93 | |
<NA> | 10 | 9.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
31200 | 93 | |
na | 10 | 9.7% |
과세년도
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 2.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
2020 | |
---|---|
2021 | |
<NA> |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2020 |
---|---|
2nd row | 2020 |
3rd row | 2020 |
4th row | 2020 |
5th row | 2020 |
Common Values
Value | Count | Frequency (%) |
2020 | 47 | |
2021 | 46 | |
<NA> | 10 | 9.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2020 | 47 | |
2021 | 46 | |
na | 10 | 9.7% |
세목명
Categorical
HIGH CORRELATION
 
Distinct | 14 |
---|---|
Distinct (%) | 13.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
취득세 | |
---|---|
주민세 | |
자동차세 | |
재산세 | |
<NA> | |
Other values (9) |
Length
Max length | 7 |
---|---|
Median length | 3 |
Mean length | 3.7572816 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 담배소비세 |
---|---|
2nd row | 교육세 |
3rd row | 도시계획세 |
4th row | 취득세 |
5th row | 취득세 |
Common Values
Value | Count | Frequency (%) |
취득세 | 18 | |
주민세 | 16 | |
자동차세 | 14 | |
재산세 | 10 | |
<NA> | 10 | |
레저세 | 8 | |
지방소득세 | 8 | |
지역자원시설세 | 5 | 4.9% |
등록면허세 | 4 | 3.9% |
담배소비세 | 2 | 1.9% |
Other values (4) | 8 |
Length
Value | Count | Frequency (%) |
취득세 | 18 | |
주민세 | 16 | |
자동차세 | 14 | |
재산세 | 10 | |
na | 10 | |
레저세 | 8 | |
지방소득세 | 8 | |
지역자원시설세 | 5 | 4.9% |
등록면허세 | 4 | 3.9% |
담배소비세 | 2 | 1.9% |
Other values (4) | 8 |
세원 유형명
Text
MISSING
 
Distinct | 50 |
---|---|
Distinct (%) | 53.8% |
Missing | 10 |
Missing (%) | 9.7% |
Memory size | 956.0 B |
Value | Count | Frequency (%) |
자동차세(주행 | 2 | 2.2% |
담배소비세 | 2 | 2.2% |
화물 | 2 | 2.2% |
3륜이하 | 2 | 2.2% |
기타승용 | 2 | 2.2% |
승용 | 2 | 2.2% |
지방소비세 | 2 | 2.2% |
등록면허세(면허 | 2 | 2.2% |
특수 | 2 | 2.2% |
지역자원시설세(소방 | 2 | 2.2% |
Other values (40) | 73 |
Most occurring characters
Value | Count | Frequency (%) |
세 | 55 | 9.8% |
( | 49 | 8.7% |
) | 49 | 8.7% |
소 | 27 | 4.8% |
주 | 24 | 4.3% |
지 | 19 | 3.4% |
득 | 18 | 3.2% |
민 | 16 | 2.9% |
방 | 12 | 2.1% |
산 | 11 | 2.0% |
Other values (64) | 281 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 461 | |
Open Punctuation | 49 | 8.7% |
Close Punctuation | 49 | 8.7% |
Decimal Number | 2 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
세 | 55 | 11.9% |
소 | 27 | 5.9% |
주 | 24 | 5.2% |
지 | 19 | 4.1% |
득 | 18 | 3.9% |
민 | 16 | 3.5% |
방 | 12 | 2.6% |
산 | 11 | 2.4% |
재 | 11 | 2.4% |
기 | 10 | 2.2% |
Other values (61) | 258 |
Open Punctuation
Value | Count | Frequency (%) |
( | 49 |
Close Punctuation
Value | Count | Frequency (%) |
) | 49 |
Decimal Number
Value | Count | Frequency (%) |
3 | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 461 | |
Common | 100 | 17.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
세 | 55 | 11.9% |
소 | 27 | 5.9% |
주 | 24 | 5.2% |
지 | 19 | 4.1% |
득 | 18 | 3.9% |
민 | 16 | 3.5% |
방 | 12 | 2.6% |
산 | 11 | 2.4% |
재 | 11 | 2.4% |
기 | 10 | 2.2% |
Other values (61) | 258 |
Common
Value | Count | Frequency (%) |
( | 49 | |
) | 49 | |
3 | 2 | 2.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 461 | |
ASCII | 100 | 17.8% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
세 | 55 | 11.9% |
소 | 27 | 5.9% |
주 | 24 | 5.2% |
지 | 19 | 4.1% |
득 | 18 | 3.9% |
민 | 16 | 3.5% |
방 | 12 | 2.6% |
산 | 11 | 2.4% |
재 | 11 | 2.4% |
기 | 10 | 2.2% |
Other values (61) | 258 |
ASCII
Value | Count | Frequency (%) |
( | 49 | |
) | 49 | |
3 | 2 | 2.0% |
부과건수
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 69 |
---|---|
Distinct (%) | 74.2% |
Missing | 10 |
Missing (%) | 9.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 26501.516 |
Minimum | 0 |
---|---|
Maximum | 437257 |
Zeros | 25 |
Zeros (%) | 24.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 1162 |
Q3 | 12279 |
95-th percentile | 124224.4 |
Maximum | 437257 |
Range | 437257 |
Interquartile range (IQR) | 12279 |
Descriptive statistics
Standard deviation | 71133.073 |
---|---|
Coefficient of variation (CV) | 2.6841133 |
Kurtosis | 22.955678 |
Mean | 26501.516 |
Median Absolute Deviation (MAD) | 1162 |
Skewness | 4.488098 |
Sum | 2464641 |
Variance | 5.059914 × 109 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 25 | |
945 | 1 | 1.0% |
80470 | 1 | 1.0% |
1003 | 1 | 1.0% |
1493 | 1 | 1.0% |
12932 | 1 | 1.0% |
188 | 1 | 1.0% |
15 | 1 | 1.0% |
33947 | 1 | 1.0% |
3553 | 1 | 1.0% |
Other values (59) | 59 | |
(Missing) | 10 | 9.7% |
Value | Count | Frequency (%) |
0 | 25 | |
6 | 1 | 1.0% |
7 | 1 | 1.0% |
10 | 1 | 1.0% |
15 | 1 | 1.0% |
25 | 1 | 1.0% |
31 | 1 | 1.0% |
33 | 1 | 1.0% |
41 | 1 | 1.0% |
43 | 1 | 1.0% |
Value | Count | Frequency (%) |
437257 | 1 | |
435672 | 1 | |
159248 | 1 | |
157745 | 1 | |
130795 | 1 | |
119844 | 1 | |
119439 | 1 | |
115815 | 1 | |
80470 | 1 | |
79752 | 1 |
부과금액
Real number (ℝ)
HIGH CORRELATION
  MISSING
  ZEROS
 
Distinct | 68 |
---|---|
Distinct (%) | 73.1% |
Missing | 10 |
Missing (%) | 9.7% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6.8419459 × 109 |
Minimum | 0 |
---|---|
Maximum | 5.9398151 × 1010 |
Zeros | 26 |
Zeros (%) | 25.2% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 0 |
median | 3.11072 × 108 |
Q3 | 7.532908 × 109 |
95-th percentile | 3.3536746 × 1010 |
Maximum | 5.9398151 × 1010 |
Range | 5.9398151 × 1010 |
Interquartile range (IQR) | 7.532908 × 109 |
Descriptive statistics
Standard deviation | 1.2381122 × 1010 |
---|---|
Coefficient of variation (CV) | 1.8095907 |
Kurtosis | 5.344308 |
Mean | 6.8419459 × 109 |
Median Absolute Deviation (MAD) | 3.11072 × 108 |
Skewness | 2.3210964 |
Sum | 6.3630097 × 1011 |
Variance | 1.5329217 × 1020 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 26 | |
12691772000 | 1 | 1.0% |
139588000 | 1 | 1.0% |
19527517000 | 1 | 1.0% |
311072000 | 1 | 1.0% |
34720000 | 1 | 1.0% |
428702000 | 1 | 1.0% |
12311000 | 1 | 1.0% |
44495675000 | 1 | 1.0% |
15529136000 | 1 | 1.0% |
Other values (58) | 58 | |
(Missing) | 10 | 9.7% |
Value | Count | Frequency (%) |
0 | 26 | |
5414000 | 1 | 1.0% |
5554000 | 1 | 1.0% |
11579000 | 1 | 1.0% |
12311000 | 1 | 1.0% |
13603000 | 1 | 1.0% |
13676000 | 1 | 1.0% |
15696000 | 1 | 1.0% |
16981000 | 1 | 1.0% |
25476000 | 1 | 1.0% |
Value | Count | Frequency (%) |
59398151000 | 1 | |
46239683000 | 1 | |
46206814000 | 1 | |
44495675000 | 1 | |
43532300000 | 1 | |
26873043000 | 1 | |
24759156000 | 1 | |
24570776000 | 1 | |
24257537000 | 1 | |
23734377000 | 1 |
데이터기준일
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 1.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 956.0 B |
2023-04-04 | |
---|---|
<NA> |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.4174757 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-04-04 |
---|---|
2nd row | 2023-04-04 |
3rd row | 2023-04-04 |
4th row | 2023-04-04 |
5th row | 2023-04-04 |
Common Values
Value | Count | Frequency (%) |
2023-04-04 | 93 | |
<NA> | 10 | 9.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-04-04 | 93 | |
na | 10 | 9.7% |
과세년도 | 세목명 | 세원 유형명 | 부과건수 | 부과금액 | |
---|---|---|---|---|---|
과세년도 | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 |
세목명 | 0.000 | 1.000 | 1.000 | 0.840 | 0.580 |
세원 유형명 | 0.000 | 1.000 | 1.000 | 1.000 | 0.913 |
부과건수 | 0.000 | 0.840 | 1.000 | 1.000 | 0.630 |
부과금액 | 0.000 | 0.580 | 0.913 | 0.630 | 1.000 |
데이터기준일 | 세목명 | 과세년도 | 시도명 | 시군구명 | 자치단체코드 | |
---|---|---|---|---|---|---|
데이터기준일 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
세목명 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 |
과세년도 | 1.000 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시도명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시군구명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
자치단체코드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
부과건수 | 부과금액 | 시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 데이터기준일 | |
---|---|---|---|---|---|---|---|---|
부과건수 | 1.000 | 0.846 | 1.000 | 1.000 | 1.000 | 0.000 | 0.627 | 1.000 |
부과금액 | 0.846 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.302 | 1.000 |
시도명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시군구명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
자치단체코드 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
과세년도 | 0.000 | 0.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 |
세목명 | 0.627 | 0.302 | 1.000 | 1.000 | 1.000 | 0.000 | 1.000 | 1.000 |
데이터기준일 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 세원 유형명 | 부과건수 | 부과금액 | 데이터기준일 | |
---|---|---|---|---|---|---|---|---|---|
0 | 울산광역시 | 북구 | 31200 | 2020 | 담배소비세 | 담배소비세 | 0 | 0 | 2023-04-04 |
1 | 울산광역시 | 북구 | 31200 | 2020 | 교육세 | 교육세 | 435672 | 19013660000 | 2023-04-04 |
2 | 울산광역시 | 북구 | 31200 | 2020 | 도시계획세 | 도시계획세 | 0 | 0 | 2023-04-04 |
3 | 울산광역시 | 북구 | 31200 | 2020 | 취득세 | 건축물 | 945 | 12691772000 | 2023-04-04 |
4 | 울산광역시 | 북구 | 31200 | 2020 | 취득세 | 주택(개별) | 466 | 3594440000 | 2023-04-04 |
5 | 울산광역시 | 북구 | 31200 | 2020 | 취득세 | 주택(단독) | 4969 | 13064365000 | 2023-04-04 |
6 | 울산광역시 | 북구 | 31200 | 2020 | 취득세 | 기타 | 25 | 163390000 | 2023-04-04 |
7 | 울산광역시 | 북구 | 31200 | 2020 | 취득세 | 항공기 | 0 | 0 | 2023-04-04 |
8 | 울산광역시 | 북구 | 31200 | 2020 | 취득세 | 기계장비 | 33 | 25476000 | 2023-04-04 |
9 | 울산광역시 | 북구 | 31200 | 2020 | 취득세 | 차량 | 2456 | 412356000 | 2023-04-04 |
시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 세원 유형명 | 부과건수 | 부과금액 | 데이터기준일 | |
---|---|---|---|---|---|---|---|---|---|
93 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
94 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
95 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
96 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
97 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
98 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
99 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
100 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
101 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
102 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
시도명 | 시군구명 | 자치단체코드 | 과세년도 | 세목명 | 세원 유형명 | 부과건수 | 부과금액 | 데이터기준일 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 10 |