Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1 |
Duplicate rows (%) | < 0.1% |
Total size in memory | 634.8 KiB |
Average record size in memory | 65.0 B |
Variable types
Text | 3 |
---|---|
Numeric | 1 |
Categorical | 1 |
DateTime | 2 |
Dataset
Description | 경주시 대형폐기물온라인센터로 신고된 현황입니다.(배출품명, 배출규격, 수량, 금액, 결제방법, 접수일자, 수거일자 등)을 나타냅니다. |
---|---|
Author | 경상북도 경주시 |
URL | https://www.data.go.kr/data/15062552/fileData.do |
Dataset has 1 (< 0.1%) duplicate rows | Duplicates |
결제방법 is highly imbalanced (61.5%) | Imbalance |
Reproduction
Analysis started | 2024-03-14 16:39:51.444836 |
---|---|
Analysis finished | 2024-03-14 16:39:53.096291 |
Duration | 1.65 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
배출폐기물
Text
Distinct | 2113 |
---|---|
Distinct (%) | 21.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
의자 | 812 | 6.3% |
침대목재 | 811 | 6.3% |
매트리스 | 727 | 5.6% |
소파 | 550 | 4.2% |
매트 | 441 | 3.4% |
장난감류 | 347 | 2.7% |
가방 | 343 | 2.6% |
장식장 | 311 | 2.4% |
인형류 | 306 | 2.4% |
서랍장 | 280 | 2.2% |
Other values (2204) | 8037 |
Most occurring characters
Value | Count | Frequency (%) |
, | 9335 | 12.8% |
장 | 3745 | 5.1% |
2965 | 4.1% | |
기 | 2654 | 3.6% |
자 | 2447 | 3.3% |
트 | 2359 | 3.2% |
스 | 2312 | 3.2% |
매 | 2044 | 2.8% |
식 | 1735 | 2.4% |
대 | 1674 | 2.3% |
Other values (157) | 41792 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 56858 | |
Other Punctuation | 9335 | 12.8% |
Space Separator | 2965 | 4.1% |
Decimal Number | 1988 | 2.7% |
Open Punctuation | 730 | 1.0% |
Close Punctuation | 730 | 1.0% |
Uppercase Letter | 456 | 0.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 3745 | 6.6% |
기 | 2654 | 4.7% |
자 | 2447 | 4.3% |
트 | 2359 | 4.1% |
스 | 2312 | 4.1% |
매 | 2044 | 3.6% |
식 | 1735 | 3.1% |
대 | 1674 | 2.9% |
리 | 1637 | 2.9% |
의 | 1558 | 2.7% |
Other values (138) | 34693 |
Decimal Number
Value | Count | Frequency (%) |
0 | 983 | |
2 | 366 | 18.4% |
1 | 304 | 15.3% |
3 | 188 | 9.5% |
4 | 60 | 3.0% |
5 | 57 | 2.9% |
6 | 13 | 0.7% |
7 | 11 | 0.6% |
8 | 4 | 0.2% |
9 | 2 | 0.1% |
Uppercase Letter
Value | Count | Frequency (%) |
V | 222 | |
T | 222 | |
F | 4 | 0.9% |
P | 4 | 0.9% |
R | 4 | 0.9% |
Other Punctuation
Value | Count | Frequency (%) |
, | 9335 |
Space Separator
Value | Count | Frequency (%) |
2965 |
Open Punctuation
Value | Count | Frequency (%) |
( | 730 |
Close Punctuation
Value | Count | Frequency (%) |
) | 730 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 56858 | |
Common | 15748 | 21.6% |
Latin | 456 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 3745 | 6.6% |
기 | 2654 | 4.7% |
자 | 2447 | 4.3% |
트 | 2359 | 4.1% |
스 | 2312 | 4.1% |
매 | 2044 | 3.6% |
식 | 1735 | 3.1% |
대 | 1674 | 2.9% |
리 | 1637 | 2.9% |
의 | 1558 | 2.7% |
Other values (138) | 34693 |
Common
Value | Count | Frequency (%) |
, | 9335 | |
2965 | 18.8% | |
0 | 983 | 6.2% |
( | 730 | 4.6% |
) | 730 | 4.6% |
2 | 366 | 2.3% |
1 | 304 | 1.9% |
3 | 188 | 1.2% |
4 | 60 | 0.4% |
5 | 57 | 0.4% |
Other values (4) | 30 | 0.2% |
Latin
Value | Count | Frequency (%) |
V | 222 | |
T | 222 | |
F | 4 | 0.9% |
P | 4 | 0.9% |
R | 4 | 0.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 56858 | |
ASCII | 16204 | 22.2% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
, | 9335 | |
2965 | 18.3% | |
0 | 983 | 6.1% |
( | 730 | 4.5% |
) | 730 | 4.5% |
2 | 366 | 2.3% |
1 | 304 | 1.9% |
V | 222 | 1.4% |
T | 222 | 1.4% |
3 | 188 | 1.2% |
Other values (9) | 159 | 1.0% |
Hangul
Value | Count | Frequency (%) |
장 | 3745 | 6.6% |
기 | 2654 | 4.7% |
자 | 2447 | 4.3% |
트 | 2359 | 4.1% |
스 | 2312 | 4.1% |
매 | 2044 | 3.6% |
식 | 1735 | 3.1% |
대 | 1674 | 2.9% |
리 | 1637 | 2.9% |
의 | 1558 | 2.7% |
Other values (138) | 34693 |
배출규격
Text
Distinct | 2111 |
---|---|
Distinct (%) | 21.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
이상 | 2698 | 8.6% |
규격 | 2332 | 7.4% |
모든 | 2332 | 7.4% |
미만 | 2225 | 7.1% |
1m | 1618 | 5.2% |
각종 | 994 | 3.2% |
품목 | 993 | 3.2% |
높이 | 870 | 2.8% |
철재의자 | 756 | 2.4% |
목재 | 756 | 2.4% |
Other values (99) | 15747 |
Most occurring characters
Value | Count | Frequency (%) |
22591 | 20.1% | |
용 | 5034 | 4.5% |
이 | 4510 | 4.0% |
1 | 3744 | 3.3% |
m | 3487 | 3.1% |
규 | 2867 | 2.5% |
격 | 2867 | 2.5% |
상 | 2703 | 2.4% |
모 | 2646 | 2.4% |
인 | 2637 | 2.3% |
Other values (125) | 59365 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 67931 | |
Space Separator | 22591 | 20.1% |
Decimal Number | 11182 | 9.9% |
Lowercase Letter | 6104 | 5.4% |
Open Punctuation | 1988 | 1.8% |
Close Punctuation | 1988 | 1.8% |
Math Symbol | 546 | 0.5% |
Other Punctuation | 65 | 0.1% |
Other Symbol | 56 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
용 | 5034 | 7.4% |
이 | 4510 | 6.6% |
규 | 2867 | 4.2% |
격 | 2867 | 4.2% |
상 | 2703 | 4.0% |
모 | 2646 | 3.9% |
인 | 2637 | 3.9% |
든 | 2557 | 3.8% |
미 | 2448 | 3.6% |
만 | 2265 | 3.3% |
Other values (101) | 37397 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3744 | |
0 | 2193 | |
2 | 1860 | |
4 | 1041 | 9.3% |
3 | 746 | 6.7% |
6 | 634 | 5.7% |
9 | 521 | 4.7% |
5 | 400 | 3.6% |
8 | 43 | 0.4% |
Lowercase Letter
Value | Count | Frequency (%) |
m | 3487 | |
c | 1555 | |
g | 488 | 8.0% |
k | 488 | 8.0% |
ℓ | 86 | 1.4% |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 24 | |
㎥ | 17 | |
㎝ | 15 |
Math Symbol
Value | Count | Frequency (%) |
+ | 378 | |
× | 168 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 61 | |
. | 4 | 6.2% |
Space Separator
Value | Count | Frequency (%) |
22591 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1988 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1988 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 67931 | |
Common | 38502 | |
Latin | 6018 | 5.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
용 | 5034 | 7.4% |
이 | 4510 | 6.6% |
규 | 2867 | 4.2% |
격 | 2867 | 4.2% |
상 | 2703 | 4.0% |
모 | 2646 | 3.9% |
인 | 2637 | 3.9% |
든 | 2557 | 3.8% |
미 | 2448 | 3.6% |
만 | 2265 | 3.3% |
Other values (101) | 37397 |
Common
Value | Count | Frequency (%) |
22591 | ||
1 | 3744 | 9.7% |
0 | 2193 | 5.7% |
( | 1988 | 5.2% |
) | 1988 | 5.2% |
2 | 1860 | 4.8% |
4 | 1041 | 2.7% |
3 | 746 | 1.9% |
6 | 634 | 1.6% |
9 | 521 | 1.4% |
Other values (10) | 1196 | 3.1% |
Latin
Value | Count | Frequency (%) |
m | 3487 | |
c | 1555 | |
g | 488 | 8.1% |
k | 488 | 8.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 67931 | |
ASCII | 44210 | |
None | 168 | 0.1% |
Letterlike Symbols | 86 | 0.1% |
CJK Compat | 56 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
22591 | ||
1 | 3744 | 8.5% |
m | 3487 | 7.9% |
0 | 2193 | 5.0% |
( | 1988 | 4.5% |
) | 1988 | 4.5% |
2 | 1860 | 4.2% |
c | 1555 | 3.5% |
4 | 1041 | 2.4% |
3 | 746 | 1.7% |
Other values (9) | 3017 | 6.8% |
Hangul
Value | Count | Frequency (%) |
용 | 5034 | 7.4% |
이 | 4510 | 6.6% |
규 | 2867 | 4.2% |
격 | 2867 | 4.2% |
상 | 2703 | 4.0% |
모 | 2646 | 3.9% |
인 | 2637 | 3.9% |
든 | 2557 | 3.8% |
미 | 2448 | 3.6% |
만 | 2265 | 3.3% |
Other values (101) | 37397 |
None
Value | Count | Frequency (%) |
× | 168 |
Letterlike Symbols
Value | Count | Frequency (%) |
ℓ | 86 |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 24 | |
㎥ | 17 | |
㎝ | 15 |
수량
Text
Distinct | 363 |
---|---|
Distinct (%) | 3.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
1 | 6324 | |
1,1 | 1078 | 10.8% |
2 | 713 | 7.1% |
1,1,1 | 377 | 3.8% |
3 | 152 | 1.5% |
1,1,1,1 | 131 | 1.3% |
2,1 | 125 | 1.2% |
1,2 | 102 | 1.0% |
4 | 76 | 0.8% |
1,1,1,1,1 | 57 | 0.6% |
Other values (332) | 865 | 8.6% |
Most occurring characters
Value | Count | Frequency (%) |
1 | 13201 | |
, | 5718 | |
2 | 1644 | 7.7% |
3 | 427 | 2.0% |
4 | 178 | 0.8% |
5 | 88 | 0.4% |
0 | 60 | 0.3% |
6 | 43 | 0.2% |
7 | 27 | 0.1% |
8 | 15 | 0.1% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 15695 | |
Other Punctuation | 5718 | 26.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
1 | 13201 | |
2 | 1644 | 10.5% |
3 | 427 | 2.7% |
4 | 178 | 1.1% |
5 | 88 | 0.6% |
0 | 60 | 0.4% |
6 | 43 | 0.3% |
7 | 27 | 0.2% |
8 | 15 | 0.1% |
9 | 12 | 0.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 5718 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 21413 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
1 | 13201 | |
, | 5718 | |
2 | 1644 | 7.7% |
3 | 427 | 2.0% |
4 | 178 | 0.8% |
5 | 88 | 0.4% |
0 | 60 | 0.3% |
6 | 43 | 0.2% |
7 | 27 | 0.1% |
8 | 15 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 21413 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1 | 13201 | |
, | 5718 | |
2 | 1644 | 7.7% |
3 | 427 | 2.0% |
4 | 178 | 0.8% |
5 | 88 | 0.4% |
0 | 60 | 0.3% |
6 | 43 | 0.2% |
7 | 27 | 0.1% |
8 | 15 | 0.1% |
결제금액
Real number (ℝ)
Distinct | 106 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 7606.4 |
Minimum | 1000 |
---|---|
Maximum | 235000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1000 |
---|---|
5-th percentile | 2000 |
Q1 | 3000 |
median | 4000 |
Q3 | 8000 |
95-th percentile | 23000 |
Maximum | 235000 |
Range | 234000 |
Interquartile range (IQR) | 5000 |
Descriptive statistics
Standard deviation | 10803.136 |
---|---|
Coefficient of variation (CV) | 1.4202693 |
Kurtosis | 59.436968 |
Mean | 7606.4 |
Median Absolute Deviation (MAD) | 2000 |
Skewness | 5.9969718 |
Sum | 76064000 |
Variance | 1.1670775 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
2000 | 2189 | |
4000 | 1458 | |
3000 | 1358 | |
5000 | 864 | 8.6% |
6000 | 778 | 7.8% |
8000 | 631 | 6.3% |
10000 | 607 | 6.1% |
12000 | 260 | 2.6% |
7000 | 222 | 2.2% |
15000 | 209 | 2.1% |
Other values (96) | 1424 |
Value | Count | Frequency (%) |
1000 | 127 | 1.3% |
2000 | 2189 | |
3000 | 1358 | |
4000 | 1458 | |
5000 | 864 | 8.6% |
6000 | 778 | 7.8% |
7000 | 222 | 2.2% |
8000 | 631 | 6.3% |
9000 | 162 | 1.6% |
10000 | 607 | 6.1% |
Value | Count | Frequency (%) |
235000 | 1 | |
189000 | 1 | |
152000 | 1 | |
143000 | 1 | |
138000 | 1 | |
130000 | 1 | |
124000 | 1 | |
122000 | 1 | |
121000 | 1 | |
115000 | 1 |
결제방법
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
카드결제 | |
---|---|
계좌이체 | |
현장결제 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 카드결제 |
---|---|
2nd row | 카드결제 |
3rd row | 카드결제 |
4th row | 카드결제 |
5th row | 카드결제 |
Common Values
Value | Count | Frequency (%) |
카드결제 | 8506 | |
계좌이체 | 1493 | 14.9% |
현장결제 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
카드결제 | 8506 | |
계좌이체 | 1493 | 14.9% |
현장결제 | 1 | < 0.1% |
등록일
Date
Distinct | 9878 |
---|---|
Distinct (%) | 98.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2022-09-01 07:31:00 |
---|---|
Maximum | 2024-01-30 08:34:00 |
수거요청일
Date
Distinct | 443 |
---|---|
Distinct (%) | 4.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2022-09-02 00:00:00 |
---|---|
Maximum | 2024-01-30 00:00:00 |
결제금액 | 결제방법 | |
---|---|---|
결제금액 | 1.000 | 0.055 |
결제방법 | 0.055 | 1.000 |
결제금액 | 결제방법 | |
---|---|---|
결제금액 | 1.000 | 0.024 |
결제방법 | 0.024 | 1.000 |
배출폐기물 | 배출규격 | 수량 | 결제금액 | 결제방법 | 등록일 | 수거요청일 | |
---|---|---|---|---|---|---|---|
12752 | 자전거 | 아동용 3발 | 1 | 2000 | 카드결제 | 2023-08-16 9:48 | 2023-08-17 |
8718 | 카펫, 매트 | 한 묶음 | 1 | 4000 | 카드결제 | 2023-05-16 10:11 | 2023-05-17 |
17378 | 변기 | 모든 규격 | 1 | 3000 | 카드결제 | 2023-11-22 21:36 | 2023-11-23 |
1039 | 침대목재, 매트리스 | 1인용(매트리스+목재) | 2 | 20000 | 카드결제 | 2022-09-30 13:15 | 2022-10-04 |
14841 | 기타03 | 각종 품목 | 1 | 3000 | 카드결제 | 2023-09-26 8:57 | 2023-09-27 |
20191 | 장식장 | 높이 1m 미만 | 1 | 4000 | 카드결제 | 2024-01-26 22:17 | 2024-01-27 |
9884 | 가방 | 여행용 가방(캐리어) | 1 | 2000 | 카드결제 | 2023-06-16 12:31 | 2023-06-17 |
8468 | 선풍기 | 모든 규격 | 2 | 4000 | 카드결제 | 2023-05-09 13:50 | 2023-05-10 |
13039 | 기타02,기타02,기타02,기타02, | 각종 품목 각종 품목 각종 품목 각종 품목 | 1,1,1,1, | 8000 | 카드결제 | 2023-08-21 14:04 | 2023-08-22 |
3065 | 유모차, 보행기 | 모든 규격 | 1 | 2000 | 카드결제 | 2022-12-08 23:59 | 2022-12-10 |
배출폐기물 | 배출규격 | 수량 | 결제금액 | 결제방법 | 등록일 | 수거요청일 | |
---|---|---|---|---|---|---|---|
4753 | 침대목재, 매트리스 | 2인용 매트리스 | 1 | 8000 | 카드결제 | 2023-02-01 17:33 | 2023-02-02 |
2831 | 소파,장식장 | 3인용 이상 높이 1m 이상 | 1,1 | 16000 | 카드결제 | 2022-12-01 7:12 | 2022-12-02 |
1660 | 장롱,문짝,의자 | 폭 90cm 이상 1짝 나무문 목재 철재의자 | 1,2,1 | 25000 | 계좌이체 | 2022-10-20 15:22 | 2022-10-22 |
3162 | 유모차, 보행기 | 모든 규격 | 1 | 2000 | 카드결제 | 2022-12-12 19:12 | 2022-12-14 |
6434 | 싱크찬장,캐비닛 | 2칸 3단 이하 | 1,1 | 5000 | 카드결제 | 2023-03-13 8:48 | 2023-03-14 |
18248 | 거울,캐비닛 | 1m 이상 3단 이하 | 1,1 | 6000 | 카드결제 | 2023-12-16 22:02 | 2023-12-18 |
13979 | 전기장판 | 모든 규격 | 1 | 4000 | 카드결제 | 2023-09-08 13:30 | 2023-09-09 |
18414 | 소파,기타01,식탁 | 3인용 이상 각종 품목 6인용 미만(대리석) | 1,1,1 | 19000 | 카드결제 | 2023-12-20 14:17 | 2023-12-26 |
11381 | 장롱 | 폭 90cm 미만 1짝 | 1 | 12000 | 카드결제 | 2023-07-19 22:54 | 2023-07-20 |
12267 | 의자 | 사무용의자 | 2 | 6000 | 카드결제 | 2023-08-05 17:17 | 2023-08-07 |
Most frequently occurring
배출폐기물 | 배출규격 | 수량 | 결제금액 | 결제방법 | 등록일 | 수거요청일 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 카시트 | 모든 규격 | 1 | 2000 | 카드결제 | 2022-10-26 14:55 | 2022-10-27 | 2 |