Dataset statistics
Number of variables | 8 |
---|---|
Number of observations | 62 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 4.3 KiB |
Average record size in memory | 71.1 B |
Variable types
Numeric | 4 |
---|---|
Categorical | 3 |
Text | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 노바코스 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=43426070-1507-11eb-8adf-f5453fd1d47b |
기준년도 has constant value "" | Constant |
기본키아이디 is highly overall correlated with 집계구역코드 | High correlation |
전년도총인구수 is highly overall correlated with 당해년도총인구건수 and 1 other fields | High correlation |
당해년도총인구건수 is highly overall correlated with 전년도총인구수 and 1 other fields | High correlation |
집계구역코드 is highly overall correlated with 기본키아이디 and 2 other fields | High correlation |
기본키아이디 has unique values | Unique |
Reproduction
Analysis started | 2023-12-10 12:08:04.142325 |
---|---|
Analysis finished | 2023-12-10 12:08:06.632942 |
Duration | 2.49 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
기본키아이디
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 62 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 31.5 |
Minimum | 1 |
---|---|
Maximum | 62 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 690.0 B |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 4.05 |
Q1 | 16.25 |
median | 31.5 |
Q3 | 46.75 |
95-th percentile | 58.95 |
Maximum | 62 |
Range | 61 |
Interquartile range (IQR) | 30.5 |
Descriptive statistics
Standard deviation | 18.041619 |
---|---|
Coefficient of variation (CV) | 0.5727498 |
Kurtosis | -1.2 |
Mean | 31.5 |
Median Absolute Deviation (MAD) | 15.5 |
Skewness | 0 |
Sum | 1953 |
Variance | 325.5 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 1.6% |
48 | 1 | 1.6% |
35 | 1 | 1.6% |
36 | 1 | 1.6% |
37 | 1 | 1.6% |
38 | 1 | 1.6% |
39 | 1 | 1.6% |
40 | 1 | 1.6% |
41 | 1 | 1.6% |
42 | 1 | 1.6% |
Other values (52) | 52 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
62 | 1 | |
61 | 1 | |
60 | 1 | |
59 | 1 | |
58 | 1 | |
57 | 1 | |
56 | 1 | |
55 | 1 | |
54 | 1 | |
53 | 1 |
기준년도
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 628.0 B |
2019 |
---|
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2019 |
---|---|
2nd row | 2019 |
3rd row | 2019 |
4th row | 2019 |
5th row | 2019 |
Common Values
Value | Count | Frequency (%) |
2019 | 62 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2019 | 62 |
지점id
Text
Distinct | 31 |
---|---|
Distinct (%) | 50.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 628.0 B |
Length
Max length | 14 |
---|---|
Median length | 14 |
Mean length | 14 |
Min length | 14 |
Characters and Unicode
Total characters | 868 |
---|---|
Distinct characters | 14 |
Distinct categories | 3 ? |
Distinct scripts | 2 ? |
Distinct blocks | 1 ? |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | A-0010-0391S-6 |
---|---|
2nd row | A-0010-0391S-6 |
3rd row | A-0010-0728S-6 |
4th row | A-0010-0728S-6 |
5th row | A-0010-2583E-7 |
Value | Count | Frequency (%) |
a-0010-0391s-6 | 2 | 3.2% |
a-0160-0058e-4 | 2 | 3.2% |
a-0600-0636s-4 | 2 | 3.2% |
a-0600-0547s-4 | 2 | 3.2% |
a-0550-1837s-4 | 2 | 3.2% |
a-0550-1490e-4 | 2 | 3.2% |
a-0500-0701e-8 | 2 | 3.2% |
a-0450-1129e-4 | 2 | 3.2% |
a-0450-0703e-4 | 2 | 3.2% |
a-0450-0557e-4 | 2 | 3.2% |
Other values (21) | 42 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 202 | |
- | 186 | |
A | 62 | 7.1% |
1 | 58 | 6.7% |
4 | 56 | 6.5% |
6 | 50 | 5.8% |
5 | 50 | 5.8% |
2 | 48 | 5.5% |
E | 40 | 4.6% |
7 | 30 | 3.5% |
Other values (4) | 86 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 558 | |
Dash Punctuation | 186 | 21.4% |
Uppercase Letter | 124 | 14.3% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 202 | |
1 | 58 | 10.4% |
4 | 56 | 10.0% |
6 | 50 | 9.0% |
5 | 50 | 9.0% |
2 | 48 | 8.6% |
7 | 30 | 5.4% |
8 | 28 | 5.0% |
3 | 18 | 3.2% |
9 | 18 | 3.2% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 62 | |
E | 40 | |
S | 22 | 17.7% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 186 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 744 | |
Latin | 124 | 14.3% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 202 | |
- | 186 | |
1 | 58 | 7.8% |
4 | 56 | 7.5% |
6 | 50 | 6.7% |
5 | 50 | 6.7% |
2 | 48 | 6.5% |
7 | 30 | 4.0% |
8 | 28 | 3.8% |
3 | 18 | 2.4% |
Latin
Value | Count | Frequency (%) |
A | 62 | |
E | 40 | |
S | 22 | 17.7% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 868 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 202 | |
- | 186 | |
A | 62 | 7.1% |
1 | 58 | 6.7% |
4 | 56 | 6.5% |
6 | 50 | 5.8% |
5 | 50 | 5.8% |
2 | 48 | 5.5% |
E | 40 | 4.6% |
7 | 30 | 3.5% |
Other values (4) | 86 |
집계구역코드
Categorical
HIGH CORRELATION
 
Distinct | 30 |
---|---|
Distinct (%) | 48.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 628.0 B |
경상남도 진주시 정촌면 | 4 |
---|---|
울산광역시 울주군 삼남면 | 2 |
충청북도 옥천군 옥천읍 | 2 |
충청북도 옥천군 군북면 | 2 |
경상남도 사천시 축동면 | 2 |
Other values (25) |
Length
Max length | 14 |
---|---|
Median length | 12 |
Mean length | 12 |
Min length | 11 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 울산광역시 울주군 삼남면 |
---|---|
2nd row | 울산광역시 울주군 삼남면 |
3rd row | 경상북도 경주시 건천읍 |
4th row | 경상북도 경주시 건천읍 |
5th row | 충청북도 옥천군 옥천읍 |
Common Values
Value | Count | Frequency (%) |
경상남도 진주시 정촌면 | 4 | 6.5% |
울산광역시 울주군 삼남면 | 2 | 3.2% |
충청북도 옥천군 옥천읍 | 2 | 3.2% |
충청북도 옥천군 군북면 | 2 | 3.2% |
경상남도 사천시 축동면 | 2 | 3.2% |
전라남도 담양군 고서면 | 2 | 3.2% |
전라남도 담양군 봉산면 | 2 | 3.2% |
경상남도 함양군 함양읍 | 2 | 3.2% |
경상남도 거창군 남상면 | 2 | 3.2% |
경상북도 고령군 성산면 | 2 | 3.2% |
Other values (20) | 40 |
Length
Value | Count | Frequency (%) |
경상북도 | 14 | 7.5% |
경상남도 | 10 | 5.4% |
충청북도 | 8 | 4.3% |
전라북도 | 6 | 3.2% |
전라남도 | 6 | 3.2% |
남원시 | 6 | 3.2% |
충청남도 | 4 | 2.2% |
울산광역시 | 4 | 2.2% |
정촌면 | 4 | 2.2% |
옥천군 | 4 | 2.2% |
Other values (53) | 120 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 3.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 628.0 B |
남자 | |
---|---|
여자 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 남자 |
---|---|
2nd row | 여자 |
3rd row | 남자 |
4th row | 여자 |
5th row | 남자 |
Common Values
Value | Count | Frequency (%) |
남자 | 31 | |
여자 | 31 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
남자 | 31 | |
여자 | 31 |
전년도총인구수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 59 |
---|---|
Distinct (%) | 95.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2034.1935 |
Minimum | 264 |
---|---|
Maximum | 8820 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 690.0 B |
Quantile statistics
Minimum | 264 |
---|---|
5-th percentile | 284.1 |
Q1 | 498 |
median | 1291 |
Q3 | 2621 |
95-th percentile | 7325.2 |
Maximum | 8820 |
Range | 8556 |
Interquartile range (IQR) | 2123 |
Descriptive statistics
Standard deviation | 2194.6292 |
---|---|
Coefficient of variation (CV) | 1.0788694 |
Kurtosis | 2.3716038 |
Mean | 2034.1935 |
Median Absolute Deviation (MAD) | 846 |
Skewness | 1.7300908 |
Sum | 126120 |
Variance | 4816397.5 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1326 | 2 | 3.2% |
1440 | 2 | 3.2% |
622 | 2 | 3.2% |
1908 | 1 | 1.6% |
3826 | 1 | 1.6% |
280 | 1 | 1.6% |
264 | 1 | 1.6% |
1484 | 1 | 1.6% |
1550 | 1 | 1.6% |
3648 | 1 | 1.6% |
Other values (49) | 49 |
Value | Count | Frequency (%) |
264 | 1 | |
274 | 1 | |
280 | 1 | |
284 | 1 | |
286 | 1 | |
296 | 1 | |
320 | 1 | |
344 | 1 | |
366 | 1 | |
394 | 1 |
Value | Count | Frequency (%) |
8820 | 1 | |
8754 | 1 | |
8004 | 1 | |
7374 | 1 | |
6398 | 1 | |
4912 | 1 | |
4904 | 1 | |
4786 | 1 | |
4602 | 1 | |
4594 | 1 |
당해년도총인구건수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 59 |
---|---|
Distinct (%) | 95.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 1903.1613 |
Minimum | 256 |
---|---|
Maximum | 8710 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 690.0 B |
Quantile statistics
Minimum | 256 |
---|---|
5-th percentile | 288.1 |
Q1 | 484.5 |
median | 1230 |
Q3 | 2271 |
95-th percentile | 6874.7 |
Maximum | 8710 |
Range | 8454 |
Interquartile range (IQR) | 1786.5 |
Descriptive statistics
Standard deviation | 2066.033 |
---|---|
Coefficient of variation (CV) | 1.0855796 |
Kurtosis | 2.9803425 |
Mean | 1903.1613 |
Median Absolute Deviation (MAD) | 809 |
Skewness | 1.8331525 |
Sum | 117996 |
Variance | 4268492.3 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1230 | 2 | 3.2% |
1248 | 2 | 3.2% |
352 | 2 | 3.2% |
1742 | 1 | 1.6% |
3686 | 1 | 1.6% |
290 | 1 | 1.6% |
1500 | 1 | 1.6% |
1572 | 1 | 1.6% |
2940 | 1 | 1.6% |
2316 | 1 | 1.6% |
Other values (49) | 49 |
Value | Count | Frequency (%) |
256 | 1 | |
278 | 1 | |
284 | 1 | |
288 | 1 | |
290 | 1 | |
298 | 1 | |
300 | 1 | |
352 | 2 | |
358 | 1 | |
400 | 1 |
Value | Count | Frequency (%) |
8710 | 1 | |
8578 | 1 | |
7396 | 1 | |
6954 | 1 | |
5368 | 1 | |
4436 | 1 | |
4378 | 1 | |
4376 | 1 | |
4374 | 1 | |
4282 | 1 |
전년대비 변경율
Real number (ℝ)
Distinct | 59 |
---|---|
Distinct (%) | 95.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | -2.9803226 |
Minimum | -30.25 |
---|---|
Maximum | 4.76 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 51 |
Negative (%) | 82.3% |
Memory size | 690.0 B |
Quantile statistics
Minimum | -30.25 |
---|---|
5-th percentile | -9.126 |
Q1 | -4.85 |
median | -2.015 |
Q3 | -0.955 |
95-th percentile | 3.0365 |
Maximum | 4.76 |
Range | 35.01 |
Interquartile range (IQR) | 3.895 |
Descriptive statistics
Standard deviation | 4.9126825 |
---|---|
Coefficient of variation (CV) | -1.6483727 |
Kurtosis | 14.827287 |
Mean | -2.9803226 |
Median Absolute Deviation (MAD) | 1.95 |
Skewness | -2.8457755 |
Sum | -184.78 |
Variance | 24.134449 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
-2.54 | 2 | 3.2% |
-7.14 | 2 | 3.2% |
-3.76 | 2 | 3.2% |
-4.55 | 1 | 1.6% |
-5.71 | 1 | 1.6% |
-1.13 | 1 | 1.6% |
1.0 | 1 | 1.6% |
-0.97 | 1 | 1.6% |
-1.47 | 1 | 1.6% |
-9.14 | 1 | 1.6% |
Other values (49) | 49 |
Value | Count | Frequency (%) |
-30.25 | 1 | |
-10.75 | 1 | |
-10.65 | 1 | |
-9.14 | 1 | |
-8.86 | 1 | |
-8.75 | 1 | |
-7.14 | 2 | |
-6.77 | 1 | |
-5.75 | 1 | |
-5.71 | 1 |
Value | Count | Frequency (%) |
4.76 | 1 | |
4.69 | 1 | |
4.53 | 1 | |
3.11 | 1 | |
1.64 | 1 | |
1.46 | 1 | |
1.41 | 1 | |
1.33 | 1 | |
1.0 | 1 | |
0.7 | 1 |
기본키아이디 | 지점id | 집계구역코드 | 성별 | 전년도총인구수 | 당해년도총인구건수 | 전년대비 변경율 | |
---|---|---|---|---|---|---|---|
기본키아이디 | 1.000 | 0.973 | 0.987 | 0.000 | 0.537 | 0.514 | 0.264 |
지점id | 0.973 | 1.000 | 1.000 | 0.000 | 0.938 | 0.926 | 0.717 |
집계구역코드 | 0.987 | 1.000 | 1.000 | 0.000 | 0.943 | 0.932 | 0.780 |
성별 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 | 0.000 |
전년도총인구수 | 0.537 | 0.938 | 0.943 | 0.000 | 1.000 | 0.997 | 0.464 |
당해년도총인구건수 | 0.514 | 0.926 | 0.932 | 0.000 | 0.997 | 1.000 | 0.426 |
전년대비 변경율 | 0.264 | 0.717 | 0.780 | 0.000 | 0.464 | 0.426 | 1.000 |
집계구역코드 | 성별 | |
---|---|---|
집계구역코드 | 1.000 | 0.000 |
성별 | 0.000 | 1.000 |
기본키아이디 | 전년도총인구수 | 당해년도총인구건수 | 전년대비 변경율 | 집계구역코드 | 성별 | |
---|---|---|---|---|---|---|
기본키아이디 | 1.000 | -0.120 | -0.126 | 0.049 | 0.642 | 0.000 |
전년도총인구수 | -0.120 | 1.000 | 0.993 | -0.249 | 0.566 | 0.000 |
당해년도총인구건수 | -0.126 | 0.993 | 1.000 | -0.183 | 0.540 | 0.000 |
전년대비 변경율 | 0.049 | -0.249 | -0.183 | 1.000 | 0.324 | 0.000 |
집계구역코드 | 0.642 | 0.566 | 0.540 | 0.324 | 1.000 | 0.000 |
성별 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
기본키아이디 | 기준년도 | 지점id | 집계구역코드 | 성별 | 전년도총인구수 | 당해년도총인구건수 | 전년대비 변경율 | |
---|---|---|---|---|---|---|---|---|
0 | 1 | 2019 | A-0010-0391S-6 | 울산광역시 울주군 삼남면 | 남자 | 1908 | 1742 | -4.55 |
1 | 2 | 2019 | A-0010-0391S-6 | 울산광역시 울주군 삼남면 | 여자 | 2014 | 1810 | -5.33 |
2 | 3 | 2019 | A-0010-0728S-6 | 경상북도 경주시 건천읍 | 남자 | 4602 | 4374 | -2.54 |
3 | 4 | 2019 | A-0010-0728S-6 | 경상북도 경주시 건천읍 | 여자 | 4594 | 4376 | -2.43 |
4 | 5 | 2019 | A-0010-2583E-7 | 충청북도 옥천군 옥천읍 | 남자 | 8820 | 8578 | -1.39 |
5 | 6 | 2019 | A-0010-2583E-7 | 충청북도 옥천군 옥천읍 | 여자 | 8754 | 8710 | -0.25 |
6 | 7 | 2019 | A-0010-2626S-6 | 충청북도 옥천군 군북면 | 남자 | 2138 | 2136 | -0.05 |
7 | 8 | 2019 | A-0010-2626S-6 | 충청북도 옥천군 군북면 | 여자 | 2136 | 2072 | -1.52 |
8 | 9 | 2019 | A-0100-0668E-6 | 경상남도 사천시 축동면 | 남자 | 274 | 300 | 4.53 |
9 | 10 | 2019 | A-0100-0668E-6 | 경상남도 사천시 축동면 | 여자 | 296 | 284 | -2.07 |
기본키아이디 | 기준년도 | 지점id | 집계구역코드 | 성별 | 전년도총인구수 | 당해년도총인구건수 | 전년대비 변경율 | |
---|---|---|---|---|---|---|---|---|
52 | 53 | 2019 | A-0550-1490E-4 | 경상북도 군위군 군위읍 | 남자 | 1708 | 1754 | 1.33 |
53 | 54 | 2019 | A-0550-1490E-4 | 경상북도 군위군 군위읍 | 여자 | 1714 | 1698 | -0.47 |
54 | 55 | 2019 | A-0550-1837S-4 | 경상북도 안동시 남후면 | 남자 | 918 | 892 | -1.44 |
55 | 56 | 2019 | A-0550-1837S-4 | 경상북도 안동시 남후면 | 여자 | 1112 | 1054 | -2.68 |
56 | 57 | 2019 | A-0600-0547S-4 | 강원도 춘천시 남산면 | 남자 | 2788 | 2658 | -2.39 |
57 | 58 | 2019 | A-0600-0547S-4 | 강원도 춘천시 남산면 | 여자 | 2828 | 2688 | -2.54 |
58 | 59 | 2019 | A-0600-0636S-4 | 강원도 춘천시 동산면 | 남자 | 930 | 498 | -30.25 |
59 | 60 | 2019 | A-0600-0636S-4 | 강원도 춘천시 동산면 | 여자 | 474 | 460 | -1.5 |
60 | 61 | 2019 | A-6000-0396E-4 | 부산광역시 금정구 선두구동 | 남자 | 546 | 506 | -3.8 |
61 | 62 | 2019 | A-6000-0396E-4 | 부산광역시 금정구 선두구동 | 여자 | 482 | 480 | -0.21 |