Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 1 |
Missing cells (%) | < 0.1% |
Duplicate rows | 13 |
Duplicate rows (%) | 0.1% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
DateTime | 1 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 수도권매립지 토사반입정보에 대한 정보입니다개방항목 : 반입일자, 발주처, 공사명, 반입량(t), 반입대수의 항목을 제공합니다. |
---|---|
Author | 수도권매립지관리공사 |
URL | https://www.data.go.kr/data/15064399/fileData.do |
Dataset has 13 (0.1%) duplicate rows | Duplicates |
반입량(t) is highly overall correlated with 반입대수 | High correlation |
반입대수 is highly overall correlated with 반입량(t) | High correlation |
반입량(t) is highly skewed (γ1 = 23.03242065) | Skewed |
Reproduction
Analysis started | 2024-03-16 04:21:16.637824 |
---|---|
Analysis finished | 2024-03-16 04:21:17.722353 |
Duration | 1.08 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
반입일자
Date
Distinct | 3556 |
---|---|
Distinct (%) | 35.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2004-01-03 00:00:00 |
---|---|
Maximum | 2024-01-24 00:00:00 |
발주처
Text
Distinct | 153 |
---|---|
Distinct (%) | 1.5% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
남부수도사업소 | 1411 | |
서울시시설관리공단 | 998 | 10.0% |
강서수도사업소 | 841 | 8.4% |
강남수도사업소 | 649 | 6.5% |
강동수도사업소 | 583 | 5.8% |
중부수도사업소 | 557 | 5.6% |
동부수도사업소 | 474 | 4.7% |
서부수도사업소 | 473 | 4.7% |
영등포수도사업소 | 455 | 4.5% |
서울시설공단 | 343 | 3.4% |
Other values (138) | 3226 |
Most occurring characters
Value | Count | Frequency (%) |
도 | 6790 | 9.7% |
사 | 6687 | 9.5% |
수 | 6293 | 9.0% |
업 | 6120 | 8.7% |
소 | 5971 | 8.5% |
부 | 3986 | 5.7% |
서 | 3633 | 5.2% |
시 | 3497 | 5.0% |
강 | 2326 | 3.3% |
공 | 2302 | 3.3% |
Other values (128) | 22618 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 69447 | |
Uppercase Letter | 706 | 1.0% |
Lowercase Letter | 46 | 0.1% |
Space Separator | 18 | < 0.1% |
Other Punctuation | 3 | < 0.1% |
Other Symbol | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
도 | 6790 | 9.8% |
사 | 6687 | 9.6% |
수 | 6293 | 9.1% |
업 | 6120 | 8.8% |
소 | 5971 | 8.6% |
부 | 3986 | 5.7% |
서 | 3633 | 5.2% |
시 | 3497 | 5.0% |
강 | 2326 | 3.3% |
공 | 2302 | 3.3% |
Other values (117) | 21842 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 338 | |
H | 338 | |
T | 15 | 2.1% |
K | 15 | 2.1% |
Lowercase Letter
Value | Count | Frequency (%) |
l | 22 | |
h | 22 | |
g | 1 | 2.2% |
s | 1 | 2.2% |
Space Separator
Value | Count | Frequency (%) |
18 |
Other Punctuation
Value | Count | Frequency (%) |
/ | 3 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 69450 | |
Latin | 752 | 1.1% |
Common | 21 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
도 | 6790 | 9.8% |
사 | 6687 | 9.6% |
수 | 6293 | 9.1% |
업 | 6120 | 8.8% |
소 | 5971 | 8.6% |
부 | 3986 | 5.7% |
서 | 3633 | 5.2% |
시 | 3497 | 5.0% |
강 | 2326 | 3.3% |
공 | 2302 | 3.3% |
Other values (118) | 21845 |
Latin
Value | Count | Frequency (%) |
S | 338 | |
H | 338 | |
l | 22 | 2.9% |
h | 22 | 2.9% |
T | 15 | 2.0% |
K | 15 | 2.0% |
g | 1 | 0.1% |
s | 1 | 0.1% |
Common
Value | Count | Frequency (%) |
18 | ||
/ | 3 | 14.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 69447 | |
ASCII | 773 | 1.1% |
None | 3 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
도 | 6790 | 9.8% |
사 | 6687 | 9.6% |
수 | 6293 | 9.1% |
업 | 6120 | 8.8% |
소 | 5971 | 8.6% |
부 | 3986 | 5.7% |
서 | 3633 | 5.2% |
시 | 3497 | 5.0% |
강 | 2326 | 3.3% |
공 | 2302 | 3.3% |
Other values (117) | 21842 |
ASCII
Value | Count | Frequency (%) |
S | 338 | |
H | 338 | |
l | 22 | 2.8% |
h | 22 | 2.8% |
18 | 2.3% | |
T | 15 | 1.9% |
K | 15 | 1.9% |
/ | 3 | 0.4% |
g | 1 | 0.1% |
s | 1 | 0.1% |
None
Value | Count | Frequency (%) |
㈜ | 3 |
공사명
Text
Distinct | 2490 |
---|---|
Distinct (%) | 24.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 44 |
---|---|
Median length | 34 |
Mean length | 18.7725 |
Min length | 6 |
Characters and Unicode
Total characters | 187725 |
---|---|
Distinct characters | 454 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 948 ? |
---|---|
Unique (%) | 9.5% |
Sample
1st row | 가산동43번지일원침수방지사업 |
---|---|
2nd row | 2018은평구관내상수도시설물유지관리공사 |
3rd row | 고양드론센터건립공사 |
4th row | 성동.광진구관내포장도로굴착복구공사 |
5th row | 2019안양천시민이용잔디광장조성공사 |
Value | Count | Frequency (%) |
동작구관내포장도로굴착복구공사 | 222 | 2.1% |
관악구관내포장도로굴착복구공사 | 195 | 1.8% |
강서구관내포장도로굴착복구공사 | 164 | 1.5% |
인천국제공항철도2-3a공구 | 110 | 1.0% |
구로.금천구관내포장도로굴착복구공사 | 101 | 0.9% |
영등포구관내포장도로굴착복구공사 | 100 | 0.9% |
강남구관내포장도로굴착복구공사 | 78 | 0.7% |
2022년 | 71 | 0.7% |
동작관내포장도로굴착복구공사 | 65 | 0.6% |
마포구관내포장도로굴착복구공사 | 61 | 0.6% |
Other values (2542) | 9572 |
Most occurring characters
Value | Count | Frequency (%) |
사 | 10915 | 5.8% |
공 | 10476 | 5.6% |
관 | 7320 | 3.9% |
구 | 7103 | 3.8% |
수 | 6581 | 3.5% |
1 | 5914 | 3.2% |
2 | 5820 | 3.1% |
도 | 5617 | 3.0% |
동 | 5318 | 2.8% |
0 | 4415 | 2.4% |
Other values (444) | 118246 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 152870 | |
Decimal Number | 27887 | 14.9% |
Dash Punctuation | 2424 | 1.3% |
Math Symbol | 1300 | 0.7% |
Space Separator | 972 | 0.5% |
Other Punctuation | 839 | 0.4% |
Uppercase Letter | 522 | 0.3% |
Open Punctuation | 439 | 0.2% |
Close Punctuation | 439 | 0.2% |
Lowercase Letter | 33 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 10915 | 7.1% |
공 | 10476 | 6.9% |
관 | 7320 | 4.8% |
구 | 7103 | 4.6% |
수 | 6581 | 4.3% |
도 | 5617 | 3.7% |
동 | 5318 | 3.5% |
로 | 4292 | 2.8% |
장 | 3635 | 2.4% |
내 | 3627 | 2.4% |
Other values (401) | 87986 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 246 | |
B | 75 | 14.4% |
L | 55 | 10.5% |
C | 27 | 5.2% |
E | 24 | 4.6% |
R | 23 | 4.4% |
P | 21 | 4.0% |
I | 19 | 3.6% |
S | 12 | 2.3% |
V | 9 | 1.7% |
Other values (4) | 11 | 2.1% |
Decimal Number
Value | Count | Frequency (%) |
1 | 5914 | |
2 | 5820 | |
0 | 4415 | |
3 | 2217 | 7.9% |
4 | 2004 | 7.2% |
5 | 1625 | 5.8% |
6 | 1584 | 5.7% |
8 | 1504 | 5.4% |
9 | 1450 | 5.2% |
7 | 1354 | 4.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 578 | |
, | 197 | 23.5% |
/ | 30 | 3.6% |
# | 18 | 2.1% |
· | 8 | 1.0% |
& | 8 | 1.0% |
Lowercase Letter
Value | Count | Frequency (%) |
k | 17 | |
m | 13 | |
c | 1 | 3.0% |
v | 1 | 3.0% |
i | 1 | 3.0% |
Math Symbol
Value | Count | Frequency (%) |
~ | 1233 | |
∼ | 47 | 3.6% |
> | 10 | 0.8% |
< | 10 | 0.8% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2424 |
Space Separator
Value | Count | Frequency (%) |
972 |
Open Punctuation
Value | Count | Frequency (%) |
( | 439 |
Close Punctuation
Value | Count | Frequency (%) |
) | 439 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 152870 | |
Common | 34300 | 18.3% |
Latin | 555 | 0.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 10915 | 7.1% |
공 | 10476 | 6.9% |
관 | 7320 | 4.8% |
구 | 7103 | 4.6% |
수 | 6581 | 4.3% |
도 | 5617 | 3.7% |
동 | 5318 | 3.5% |
로 | 4292 | 2.8% |
장 | 3635 | 2.4% |
내 | 3627 | 2.4% |
Other values (401) | 87986 |
Common
Value | Count | Frequency (%) |
1 | 5914 | |
2 | 5820 | |
0 | 4415 | |
- | 2424 | |
3 | 2217 | 6.5% |
4 | 2004 | 5.8% |
5 | 1625 | 4.7% |
6 | 1584 | 4.6% |
8 | 1504 | 4.4% |
9 | 1450 | 4.2% |
Other values (14) | 5343 |
Latin
Value | Count | Frequency (%) |
A | 246 | |
B | 75 | 13.5% |
L | 55 | 9.9% |
C | 27 | 4.9% |
E | 24 | 4.3% |
R | 23 | 4.1% |
P | 21 | 3.8% |
I | 19 | 3.4% |
k | 17 | 3.1% |
m | 13 | 2.3% |
Other values (9) | 35 | 6.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 152861 | |
ASCII | 34800 | 18.5% |
Math Operators | 47 | < 0.1% |
Compat Jamo | 9 | < 0.1% |
None | 8 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
사 | 10915 | 7.1% |
공 | 10476 | 6.9% |
관 | 7320 | 4.8% |
구 | 7103 | 4.6% |
수 | 6581 | 4.3% |
도 | 5617 | 3.7% |
동 | 5318 | 3.5% |
로 | 4292 | 2.8% |
장 | 3635 | 2.4% |
내 | 3627 | 2.4% |
Other values (400) | 87977 |
ASCII
Value | Count | Frequency (%) |
1 | 5914 | |
2 | 5820 | |
0 | 4415 | |
- | 2424 | |
3 | 2217 | 6.4% |
4 | 2004 | 5.8% |
5 | 1625 | 4.7% |
6 | 1584 | 4.6% |
8 | 1504 | 4.3% |
9 | 1450 | 4.2% |
Other values (31) | 5843 |
Math Operators
Value | Count | Frequency (%) |
∼ | 47 |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 9 |
None
Value | Count | Frequency (%) |
· | 8 |
반입량(t)
Real number (ℝ)
HIGH CORRELATION
  SKEWED
 
Distinct | 263 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 560.654 |
Minimum | 15 |
---|---|
Maximum | 212415 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 15 |
---|---|
5-th percentile | 15 |
Q1 | 45 |
median | 120 |
Q3 | 300 |
95-th percentile | 1050 |
Maximum | 212415 |
Range | 212400 |
Interquartile range (IQR) | 255 |
Descriptive statistics
Standard deviation | 5310.9335 |
---|---|
Coefficient of variation (CV) | 9.472747 |
Kurtosis | 625.9165 |
Mean | 560.654 |
Median Absolute Deviation (MAD) | 90 |
Skewness | 23.032421 |
Sum | 5606540 |
Variance | 28206015 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
15 | 1178 | 11.8% |
30 | 928 | 9.3% |
45 | 877 | 8.8% |
60 | 720 | 7.2% |
75 | 445 | 4.5% |
90 | 393 | 3.9% |
120 | 346 | 3.5% |
150 | 335 | 3.4% |
105 | 322 | 3.2% |
135 | 309 | 3.1% |
Other values (253) | 4147 |
Value | Count | Frequency (%) |
15 | 1178 | |
20 | 1 | < 0.1% |
30 | 928 | |
45 | 877 | |
60 | 720 | |
75 | 445 | 4.5% |
90 | 393 | 3.9% |
105 | 322 | 3.2% |
120 | 346 | 3.5% |
135 | 309 | 3.1% |
Value | Count | Frequency (%) |
212415 | 1 | |
165375 | 1 | |
147015 | 1 | |
138240 | 1 | |
129735 | 1 | |
116160 | 1 | |
108375 | 1 | |
105840 | 1 | |
98415 | 1 | |
96000 | 1 |
반입대수
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 221 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 17.3183 |
Minimum | 1 |
---|---|
Maximum | 474 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 1 |
Q1 | 3 |
median | 8 |
Q3 | 20 |
95-th percentile | 64 |
Maximum | 474 |
Range | 473 |
Interquartile range (IQR) | 17 |
Descriptive statistics
Standard deviation | 30.31666 |
---|---|
Coefficient of variation (CV) | 1.7505564 |
Kurtosis | 45.032808 |
Mean | 17.3183 |
Median Absolute Deviation (MAD) | 6 |
Skewness | 5.4087968 |
Sum | 173183 |
Variance | 919.0999 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
1 | 1178 | 11.8% |
2 | 943 | 9.4% |
3 | 891 | 8.9% |
4 | 714 | 7.1% |
5 | 452 | 4.5% |
6 | 402 | 4.0% |
8 | 351 | 3.5% |
10 | 339 | 3.4% |
7 | 327 | 3.3% |
9 | 300 | 3.0% |
Other values (211) | 4103 |
Value | Count | Frequency (%) |
1 | 1178 | |
2 | 943 | |
3 | 891 | |
4 | 714 | |
5 | 452 | 4.5% |
6 | 402 | 4.0% |
7 | 327 | 3.3% |
8 | 351 | 3.5% |
9 | 300 | 3.0% |
10 | 339 | 3.4% |
Value | Count | Frequency (%) |
474 | 1 | |
468 | 1 | |
450 | 1 | |
418 | 1 | |
406 | 1 | |
402 | 1 | |
374 | 1 | |
350 | 1 | |
339 | 1 | |
324 | 1 |
반입량(t) | 반입대수 | |
---|---|---|
반입량(t) | 1.000 | 0.189 |
반입대수 | 0.189 | 1.000 |
반입량(t) | 반입대수 | |
---|---|---|
반입량(t) | 1.000 | 0.993 |
반입대수 | 0.993 | 1.000 |
반입일자 | 발주처 | 공사명 | 반입량(t) | 반입대수 | |
---|---|---|---|---|---|
21276 | 2013-09-30 | 금천구청 | 가산동43번지일원침수방지사업 | 510 | 34 |
28912 | 2019-07-03 | 서부수도사업소 | 2018은평구관내상수도시설물유지관리공사 | 15 | 1 |
31529 | 2021-09-10 | 고양시청 | 고양드론센터건립공사 | 45 | 3 |
4525 | 2005-07-18 | 서울시시설관리공단 | 성동.광진구관내포장도로굴착복구공사 | 45 | 3 |
29518 | 2019-10-29 | 서울시설공단 | 2019안양천시민이용잔디광장조성공사 | 30 | 2 |
22466 | 2014-09-01 | 서울시시설관리공단 | 성북1배수지급수취약환경관망이중화공사 | 150 | 10 |
31153 | 2020-12-11 | 서울시도시기반시설본부 | 월드컵대교건설공사 | 45 | 3 |
7812 | 2006-09-08 | 서울시시설관리공단 | 은평구관내상수도시설물및소화전보수공사 | 90 | 6 |
27950 | 2018-12-06 | 동부수도사업소 | 2017광진구관내상수도시설물설치및보수공사 | 15 | 1 |
10189 | 2007-07-30 | 영등포수도사업소 | 영등포구관내포장도로굴착복구공사 | 15 | 1 |
반입일자 | 발주처 | 공사명 | 반입량(t) | 반입대수 | |
---|---|---|---|---|---|
27777 | 2018-11-13 | 중부수도사업소 | 장위동246-173~189호외6개소배급수관정비공사 | 60 | 4 |
3418 | 2005-01-07 | 송파구청 | 위례성길-성내천간도로개설공사 | 525 | 35 |
31417 | 2021-06-15 | 인천시 서구청 | 원당문화체육센터건립공사 | 180 | 12 |
11272 | 2007-11-21 | 강남수도사업소 | 강남구일원동남부순환로배수관부설공사 | 45 | 3 |
17383 | 2010-07-12 | 서울시시설관리공단 | 교보타워사거리-양재역간송배수관정비공사 | 375 | 25 |
13551 | 2008-11-12 | 중부수도사업소 | 2008명륜3동등5개동상수도및계량기교체공사 | 60 | 4 |
6461 | 2006-03-02 | 인천국제공항철도 | 인천국제공항철도2-3A공구 | 195 | 13 |
14311 | 2009-03-16 | SH공사 | 상암2지구3단지아파트건설공사 | 2715 | 181 |
12284 | 2008-05-23 | 영등포구청 | 대림운동장지하공영주차장건설공사 | 825 | 55 |
16634 | 2010-01-29 | 남부수도사업소 | 2009관악.동작구관내긴급누수복구공사 | 45 | 3 |
Most frequently occurring
반입일자 | 발주처 | 공사명 | 반입량(t) | 반입대수 | # duplicates | |
---|---|---|---|---|---|---|
0 | 2004-01-08 | 서울시건설안전본부 | 서남권농수산물시장지하차도현장 | 870 | 58 | 2 |
1 | 2004-06-01 | 강서수도사업소 | 강서구관내포장도로굴착복구공사 | 75 | 5 | 2 |
2 | 2005-07-27 | 마포구청 | 토정길확장공사2-3공구 | 375 | 25 | 2 |
3 | 2006-07-03 | 남부수도사업소 | 동작구관내포장도로굴착복구공사 | 45 | 3 | 2 |
4 | 2006-07-03 | 서울시시설관리공단 | 종로4~6가간보도및시설물정비공사 | 180 | 12 | 2 |
5 | 2006-07-03 | 중부수도사업소 | 명동외2개동배급수관및불용관정비공사 | 60 | 4 | 2 |
6 | 2006-09-07 | 강남수도사업소 | 강남구관내포장도로굴착복구공사 | 45 | 3 | 2 |
7 | 2006-09-07 | 남부수도사업소 | 동작구관내포장도로굴착복구공사 | 30 | 2 | 2 |
8 | 2006-09-07 | 영등포수도사업소 | 시흥1동외5개동상수도공사 | 15 | 1 | 2 |
9 | 2009-04-14 | 남부수도사업소 | 신림1동외4개동상수도공사 | 75 | 5 | 2 |