Dataset statistics
Number of variables | 9 |
---|---|
Number of observations | 100 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 7.6 KiB |
Average record size in memory | 78.3 B |
Variable types
Categorical | 8 |
---|---|
Numeric | 1 |
Dataset
Description | 샘플 데이터 |
---|---|
Author | 지디에스컨설팅그룹 |
URL | https://www.bigdata-environment.kr/user/data_market/detail.do?id=e8039240-2dff-11ea-9713-eb3e5186fb38 |
오염원 지역 코드 has constant value "" | Constant |
오염원 경도 is highly overall correlated with 오염원 고유번호 and 3 other fields | High correlation |
오염원 고유번호 is highly overall correlated with 오염원 종류 명 and 3 other fields | High correlation |
오염원 종류 명 is highly overall correlated with 오염원 고유번호 and 3 other fields | High correlation |
오염원 상세 종류 명 is highly overall correlated with 오염원 고유번호 and 3 other fields | High correlation |
오염원 위도 is highly overall correlated with 오염원 고유번호 and 3 other fields | High correlation |
인구수 is highly overall correlated with 연령대 | High correlation |
연령대 is highly overall correlated with 인구수 | High correlation |
인구수 has 6 (6.0%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-10 12:34:04.088538 |
---|---|
Analysis finished | 2023-12-10 12:34:05.772270 |
Duration | 1.68 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
오염원 고유번호
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
1 | |
---|---|
2 | |
3 |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1 |
---|---|
2nd row | 1 |
3rd row | 1 |
4th row | 1 |
5th row | 1 |
Common Values
Value | Count | Frequency (%) |
1 | 42 | |
2 | 42 | |
3 | 16 | 16.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1 | 42 | |
2 | 42 | |
3 | 16 | 16.0% |
오염원 지역 코드
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
27000 |
---|
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 5 |
Min length | 5 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 27000 |
---|---|
2nd row | 27000 |
3rd row | 27000 |
4th row | 27000 |
5th row | 27000 |
Common Values
Value | Count | Frequency (%) |
27000 | 100 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
27000 | 100 |
오염원 종류 명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
주유소 | |
---|---|
세차장 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 주유소 |
---|---|
2nd row | 주유소 |
3rd row | 주유소 |
4th row | 주유소 |
5th row | 주유소 |
Common Values
Value | Count | Frequency (%) |
주유소 | 58 | |
세차장 | 42 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
주유소 | 58 | |
세차장 | 42 |
오염원 상세 종류 명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
주유소 | |
---|---|
세차장 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 3 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 주유소 |
---|---|
2nd row | 주유소 |
3rd row | 주유소 |
4th row | 주유소 |
5th row | 주유소 |
Common Values
Value | Count | Frequency (%) |
주유소 | 58 | |
세차장 | 42 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
주유소 | 58 | |
세차장 | 42 |
오염원 경도
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
1095595.01174 | |
---|---|
1096153.37895 | |
1096684.3279 |
Length
Max length | 13 |
---|---|
Median length | 13 |
Mean length | 12.84 |
Min length | 12 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1095595.01174 |
---|---|
2nd row | 1095595.01174 |
3rd row | 1095595.01174 |
4th row | 1095595.01174 |
5th row | 1095595.01174 |
Common Values
Value | Count | Frequency (%) |
1095595.01174 | 42 | |
1096153.37895 | 42 | |
1096684.3279 | 16 | 16.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1095595.01174 | 42 | |
1096153.37895 | 42 | |
1096684.3279 | 16 | 16.0% |
오염원 위도
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 3.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
1760933.90633 | |
---|---|
1761643.77909 | |
1761283.12639 |
Length
Max length | 13 |
---|---|
Median length | 13 |
Mean length | 13 |
Min length | 13 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 1760933.90633 |
---|---|
2nd row | 1760933.90633 |
3rd row | 1760933.90633 |
4th row | 1760933.90633 |
5th row | 1760933.90633 |
Common Values
Value | Count | Frequency (%) |
1760933.90633 | 42 | |
1761643.77909 | 42 | |
1761283.12639 | 16 | 16.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
1760933.90633 | 42 | |
1761643.77909 | 42 | |
1761283.12639 | 16 | 16.0% |
연령대
Categorical
HIGH CORRELATION
 
Distinct | 21 |
---|---|
Distinct (%) | 21.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
10~14세 | 6 |
---|---|
25~29세 | 6 |
0~4세 | 6 |
15~19세 | 6 |
20~24세 | 6 |
Other values (16) |
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 5.76 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 90~94세 |
---|---|
2nd row | 5~9세 |
3rd row | 55~59세 |
4th row | 90~94세 |
5th row | 25~29세 |
Common Values
Value | Count | Frequency (%) |
10~14세 | 6 | 6.0% |
25~29세 | 6 | 6.0% |
0~4세 | 6 | 6.0% |
15~19세 | 6 | 6.0% |
20~24세 | 6 | 6.0% |
30~34세 | 6 | 6.0% |
5~9세 | 6 | 6.0% |
35~39세 | 6 | 6.0% |
85~89세 | 4 | 4.0% |
55~59세 | 4 | 4.0% |
Other values (11) | 44 |
Length
Value | Count | Frequency (%) |
10~14세 | 6 | 6.0% |
0~4세 | 6 | 6.0% |
15~19세 | 6 | 6.0% |
20~24세 | 6 | 6.0% |
30~34세 | 6 | 6.0% |
5~9세 | 6 | 6.0% |
35~39세 | 6 | 6.0% |
25~29세 | 6 | 6.0% |
45~49세 | 4 | 4.0% |
90~94세 | 4 | 4.0% |
Other values (11) | 44 |
성별
Categorical
Distinct | 2 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 932.0 B |
F | |
---|---|
M |
Length
Max length | 1 |
---|---|
Median length | 1 |
Mean length | 1 |
Min length | 1 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | F |
---|---|
2nd row | F |
3rd row | M |
4th row | M |
5th row | M |
Common Values
Value | Count | Frequency (%) |
F | 50 | |
M | 50 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
f | 50 | |
m | 50 |
인구수
Real number (ℝ)
HIGH CORRELATION
  ZEROS
 
Distinct | 56 |
---|---|
Distinct (%) | 56.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 591.12 |
Minimum | 0 |
---|---|
Maximum | 1170 |
Zeros | 6 |
Zeros (%) | 6.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 1.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 0 |
Q1 | 263 |
median | 597 |
Q3 | 944 |
95-th percentile | 1125 |
Maximum | 1170 |
Range | 1170 |
Interquartile range (IQR) | 681 |
Descriptive statistics
Standard deviation | 361.18674 |
---|---|
Coefficient of variation (CV) | 0.61102102 |
Kurtosis | -1.127969 |
Mean | 591.12 |
Median Absolute Deviation (MAD) | 340 |
Skewness | -0.1819017 |
Sum | 59112 |
Variance | 130455.86 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 6 | 6.0% |
55 | 2 | 2.0% |
947 | 2 | 2.0% |
884 | 2 | 2.0% |
725 | 2 | 2.0% |
802 | 2 | 2.0% |
246 | 2 | 2.0% |
517 | 2 | 2.0% |
538 | 2 | 2.0% |
991 | 2 | 2.0% |
Other values (46) | 76 |
Value | Count | Frequency (%) |
0 | 6 | |
8 | 2 | 2.0% |
11 | 2 | 2.0% |
43 | 2 | 2.0% |
55 | 2 | 2.0% |
126 | 2 | 2.0% |
130 | 2 | 2.0% |
191 | 1 | 1.0% |
221 | 1 | 1.0% |
246 | 2 | 2.0% |
Value | Count | Frequency (%) |
1170 | 2 | |
1158 | 2 | |
1125 | 2 | |
1109 | 2 | |
1050 | 2 | |
1046 | 2 | |
1032 | 2 | |
991 | 2 | |
961 | 2 | |
950 | 2 |
오염원 고유번호 | 오염원 종류 명 | 오염원 상세 종류 명 | 오염원 경도 | 오염원 위도 | 연령대 | 성별 | 인구수 | |
---|---|---|---|---|---|---|---|---|
오염원 고유번호 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.446 |
오염원 종류 명 | 1.000 | 1.000 | 0.999 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
오염원 상세 종류 명 | 1.000 | 0.999 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.000 |
오염원 경도 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.446 |
오염원 위도 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 | 0.000 | 0.000 | 0.446 |
연령대 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.905 |
성별 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
인구수 | 0.446 | 0.000 | 0.000 | 0.446 | 0.446 | 0.905 | 0.000 | 1.000 |
오염원 경도 | 오염원 고유번호 | 오염원 종류 명 | 오염원 상세 종류 명 | 연령대 | 오염원 위도 | 성별 | |
---|---|---|---|---|---|---|---|
오염원 경도 | 1.000 | 1.000 | 0.995 | 0.995 | 0.000 | 1.000 | 0.000 |
오염원 고유번호 | 1.000 | 1.000 | 0.995 | 0.995 | 0.000 | 1.000 | 0.000 |
오염원 종류 명 | 0.995 | 0.995 | 1.000 | 0.979 | 0.000 | 0.995 | 0.000 |
오염원 상세 종류 명 | 0.995 | 0.995 | 0.979 | 1.000 | 0.000 | 0.995 | 0.000 |
연령대 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 | 0.000 |
오염원 위도 | 1.000 | 1.000 | 0.995 | 0.995 | 0.000 | 1.000 | 0.000 |
성별 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
인구수 | 오염원 고유번호 | 오염원 종류 명 | 오염원 상세 종류 명 | 오염원 경도 | 오염원 위도 | 연령대 | 성별 | |
---|---|---|---|---|---|---|---|---|
인구수 | 1.000 | 0.288 | 0.000 | 0.000 | 0.288 | 0.288 | 0.590 | 0.000 |
오염원 고유번호 | 0.288 | 1.000 | 0.995 | 0.995 | 1.000 | 1.000 | 0.000 | 0.000 |
오염원 종류 명 | 0.000 | 0.995 | 1.000 | 0.979 | 0.995 | 0.995 | 0.000 | 0.000 |
오염원 상세 종류 명 | 0.000 | 0.995 | 0.979 | 1.000 | 0.995 | 0.995 | 0.000 | 0.000 |
오염원 경도 | 0.288 | 1.000 | 0.995 | 0.995 | 1.000 | 1.000 | 0.000 | 0.000 |
오염원 위도 | 0.288 | 1.000 | 0.995 | 0.995 | 1.000 | 1.000 | 0.000 | 0.000 |
연령대 | 0.590 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 | 0.000 |
성별 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 1.000 |
오염원 고유번호 | 오염원 지역 코드 | 오염원 종류 명 | 오염원 상세 종류 명 | 오염원 경도 | 오염원 위도 | 연령대 | 성별 | 인구수 | |
---|---|---|---|---|---|---|---|---|---|
0 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 90~94세 | F | 55 |
1 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 5~9세 | F | 517 |
2 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 55~59세 | M | 1050 |
3 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 90~94세 | M | 8 |
4 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 25~29세 | M | 766 |
5 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 75~79세 | M | 263 |
6 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 40~44세 | F | 961 |
7 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 65~69세 | M | 632 |
8 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 70~74세 | F | 500 |
9 | 1 | 27000 | 주유소 | 주유소 | 1095595.01174 | 1760933.90633 | 85~89세 | F | 130 |
오염원 고유번호 | 오염원 지역 코드 | 오염원 종류 명 | 오염원 상세 종류 명 | 오염원 경도 | 오염원 위도 | 연령대 | 성별 | 인구수 | |
---|---|---|---|---|---|---|---|---|---|
90 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 30~34세 | M | 681 |
91 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 10~14세 | M | 251 |
92 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 10~14세 | F | 221 |
93 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 25~29세 | M | 581 |
94 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 15~19세 | M | 410 |
95 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 15~19세 | F | 391 |
96 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 25~29세 | F | 569 |
97 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 30~34세 | F | 659 |
98 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 35~39세 | F | 613 |
99 | 3 | 27000 | 주유소 | 주유소 | 1096684.3279 | 1761283.12639 | 35~39세 | M | 633 |