Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1356 |
Duplicate rows (%) | 13.6% |
Total size in memory | 312.5 KiB |
Average record size in memory | 32.0 B |
Variable types
Text | 2 |
---|---|
Categorical | 1 |
Dataset
Description | 폐기물관리법 제17조에 근거하여 사업장폐기물배출자 신고현황 및 내용에 관한 데이터입니다.(사업장명, 사업장 주소지, 사업장폐기물 배출자 신고항목(폐기물 종류)) |
---|---|
URL | https://www.data.go.kr/data/15062394/fileData.do |
Dataset has 1356 (13.6%) duplicate rows | Duplicates |
건설폐기물 종류 is highly imbalanced (61.4%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 07:40:14.625910 |
---|---|
Analysis finished | 2023-12-12 07:40:15.243363 |
Duration | 0.62 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상호
Text
Distinct | 1273 |
---|---|
Distinct (%) | 12.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
개인 | 2085 | 19.7% |
주)청산건설 | 404 | 3.8% |
주)터원 | 352 | 3.3% |
동작구청 | 320 | 3.0% |
주식회사 | 281 | 2.7% |
윤정이엔씨(주 | 179 | 1.7% |
문창토건 | 125 | 1.2% |
호림건설(주 | 111 | 1.0% |
주언건설(주 | 111 | 1.0% |
주)대우건설 | 111 | 1.0% |
Other values (1278) | 6493 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 6124 | 9.6% |
( | 5441 | 8.5% |
) | 5441 | 8.5% |
건 | 3657 | 5.7% |
개 | 2890 | 4.5% |
설 | 2844 | 4.5% |
인 | 2219 | 3.5% |
산 | 1316 | 2.1% |
청 | 1083 | 1.7% |
이 | 1064 | 1.7% |
Other values (418) | 31787 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 51955 | |
Open Punctuation | 5441 | 8.5% |
Close Punctuation | 5441 | 8.5% |
Space Separator | 572 | 0.9% |
Decimal Number | 290 | 0.5% |
Uppercase Letter | 129 | 0.2% |
Other Punctuation | 18 | < 0.1% |
Other Symbol | 10 | < 0.1% |
Lowercase Letter | 8 | < 0.1% |
Dash Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 6124 | 11.8% |
건 | 3657 | 7.0% |
개 | 2890 | 5.6% |
설 | 2844 | 5.5% |
인 | 2219 | 4.3% |
산 | 1316 | 2.5% |
청 | 1083 | 2.1% |
이 | 1064 | 2.0% |
업 | 956 | 1.8% |
동 | 898 | 1.7% |
Other values (383) | 28904 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 29 | |
E | 22 | |
J | 17 | |
H | 16 | |
N | 11 | 8.5% |
K | 8 | 6.2% |
T | 8 | 6.2% |
C | 5 | 3.9% |
G | 4 | 3.1% |
L | 3 | 2.3% |
Other values (4) | 6 | 4.7% |
Decimal Number
Value | Count | Frequency (%) |
2 | 75 | |
1 | 75 | |
0 | 59 | |
3 | 35 | |
6 | 20 | 6.9% |
5 | 18 | 6.2% |
4 | 4 | 1.4% |
9 | 2 | 0.7% |
7 | 2 | 0.7% |
Lowercase Letter
Value | Count | Frequency (%) |
o | 3 | |
s | 2 | |
c | 1 | 12.5% |
m | 1 | 12.5% |
e | 1 | 12.5% |
Other Punctuation
Value | Count | Frequency (%) |
. | 14 | |
& | 4 | 22.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 5441 |
Close Punctuation
Value | Count | Frequency (%) |
) | 5441 |
Space Separator
Value | Count | Frequency (%) |
572 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 10 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 51965 | |
Common | 11764 | 18.4% |
Latin | 137 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 6124 | 11.8% |
건 | 3657 | 7.0% |
개 | 2890 | 5.6% |
설 | 2844 | 5.5% |
인 | 2219 | 4.3% |
산 | 1316 | 2.5% |
청 | 1083 | 2.1% |
이 | 1064 | 2.0% |
업 | 956 | 1.8% |
동 | 898 | 1.7% |
Other values (384) | 28914 |
Latin
Value | Count | Frequency (%) |
S | 29 | |
E | 22 | |
J | 17 | |
H | 16 | |
N | 11 | 8.0% |
K | 8 | 5.8% |
T | 8 | 5.8% |
C | 5 | 3.6% |
G | 4 | 2.9% |
o | 3 | 2.2% |
Other values (9) | 14 |
Common
Value | Count | Frequency (%) |
( | 5441 | |
) | 5441 | |
572 | 4.9% | |
2 | 75 | 0.6% |
1 | 75 | 0.6% |
0 | 59 | 0.5% |
3 | 35 | 0.3% |
6 | 20 | 0.2% |
5 | 18 | 0.2% |
. | 14 | 0.1% |
Other values (5) | 14 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 51955 | |
ASCII | 11901 | 18.6% |
None | 10 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 6124 | 11.8% |
건 | 3657 | 7.0% |
개 | 2890 | 5.6% |
설 | 2844 | 5.5% |
인 | 2219 | 4.3% |
산 | 1316 | 2.5% |
청 | 1083 | 2.1% |
이 | 1064 | 2.0% |
업 | 956 | 1.8% |
동 | 898 | 1.7% |
Other values (383) | 28904 |
ASCII
Value | Count | Frequency (%) |
( | 5441 | |
) | 5441 | |
572 | 4.8% | |
2 | 75 | 0.6% |
1 | 75 | 0.6% |
0 | 59 | 0.5% |
3 | 35 | 0.3% |
S | 29 | 0.2% |
E | 22 | 0.2% |
6 | 20 | 0.2% |
Other values (24) | 132 | 1.1% |
None
Value | Count | Frequency (%) |
㈜ | 10 |
건설폐기물 종류
Categorical
IMBALANCE
 
Distinct | 18 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
건설폐재류:폐콘크리트 | |
---|---|
혼합건설폐기물 | |
건설폐재류:폐아스팔트콘크리트 | 530 |
건설폐재류:건설폐토석 | 166 |
폐합성수지 | 154 |
Other values (13) | 240 |
Length
Max length | 43 |
---|---|
Median length | 11 |
Mean length | 9.8865 |
Min length | 3 |
Unique
Unique | 4 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 건설폐재류:폐콘크리트 |
---|---|
2nd row | 폐목재(나무의 뿌리ㆍ가지 등 임목폐기물이 5톤 이상인 경우는 제외한다) |
3rd row | 혼합건설폐기물 |
4th row | 건설폐재류:폐콘크리트 |
5th row | 건설폐재류:폐콘크리트 |
Common Values
Value | Count | Frequency (%) |
건설폐재류:폐콘크리트 | 5411 | |
혼합건설폐기물 | 3499 | |
건설폐재류:폐아스팔트콘크리트 | 530 | 5.3% |
건설폐재류:건설폐토석 | 166 | 1.7% |
폐합성수지 | 154 | 1.5% |
폐목재(나무의 뿌리ㆍ가지 등 임목폐기물이 5톤 이상인 경우는 제외한다) | 78 | 0.8% |
건설폐재류:폐벽돌 | 75 | 0.8% |
건설오니 | 39 | 0.4% |
건설폐재류:폐블록 | 23 | 0.2% |
폐보드류 | 13 | 0.1% |
Other values (8) | 12 | 0.1% |
Length
Value | Count | Frequency (%) |
건설폐재류:폐콘크리트 | 5411 | |
혼합건설폐기물 | 3499 | |
건설폐재류:폐아스팔트콘크리트 | 530 | 5.0% |
건설폐재류:건설폐토석 | 166 | 1.6% |
폐합성수지 | 154 | 1.5% |
제외한다 | 80 | 0.8% |
5톤 | 78 | 0.7% |
이상인 | 78 | 0.7% |
경우는 | 78 | 0.7% |
임목폐기물이 | 78 | 0.7% |
Other values (27) | 417 | 3.9% |
지번주소(발주자)
Text
Distinct | 1604 |
---|---|
Distinct (%) | 16.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 50 |
---|---|
Median length | 43 |
Mean length | 16.0707 |
Min length | 1 |
Characters and Unicode
Total characters | 160707 |
---|---|
Distinct characters | 411 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 423 ? |
---|---|
Unique (%) | 4.2% |
Sample
1st row | 서울특별시 영등포구 신길동 238번지 33호 네오캐슬 |
---|---|
2nd row | |
3rd row | 서울특별시 동작구 노량진동 47번지 2호 동작구청 |
4th row | |
5th row | 서울특별시 동작구 노량진동 232번지 142호 |
Value | Count | Frequency (%) |
서울특별시 | 5561 | 17.2% |
동작구 | 4506 | 13.9% |
상도동 | 1274 | 3.9% |
사당동 | 1041 | 3.2% |
노량진동 | 787 | 2.4% |
신대방동 | 432 | 1.3% |
1호 | 431 | 1.3% |
2호 | 386 | 1.2% |
동작구청 | 286 | 0.9% |
대방동 | 281 | 0.9% |
Other values (2067) | 17327 |
Most occurring characters
Value | Count | Frequency (%) |
29892 | ||
동 | 11648 | 7.2% |
구 | 6535 | 4.1% |
시 | 6358 | 4.0% |
서 | 6309 | 3.9% |
1 | 6117 | 3.8% |
울 | 5880 | 3.7% |
별 | 5728 | 3.6% |
특 | 5726 | 3.6% |
지 | 5169 | 3.2% |
Other values (401) | 71345 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 99414 | |
Space Separator | 29892 | 18.6% |
Decimal Number | 29385 | 18.3% |
Dash Punctuation | 1475 | 0.9% |
Uppercase Letter | 206 | 0.1% |
Connector Punctuation | 198 | 0.1% |
Lowercase Letter | 58 | < 0.1% |
Close Punctuation | 29 | < 0.1% |
Open Punctuation | 29 | < 0.1% |
Other Punctuation | 21 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 11648 | 11.7% |
구 | 6535 | 6.6% |
시 | 6358 | 6.4% |
서 | 6309 | 6.3% |
울 | 5880 | 5.9% |
별 | 5728 | 5.8% |
특 | 5726 | 5.8% |
지 | 5169 | 5.2% |
작 | 5050 | 5.1% |
번 | 4859 | 4.9% |
Other values (357) | 36152 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 25 | |
T | 24 | |
B | 21 | |
S | 21 | |
H | 18 | |
C | 13 | 6.3% |
G | 11 | 5.3% |
P | 11 | 5.3% |
A | 10 | 4.9% |
L | 9 | 4.4% |
Other values (10) | 43 |
Decimal Number
Value | Count | Frequency (%) |
1 | 6117 | |
2 | 4936 | |
4 | 3390 | |
3 | 3140 | |
7 | 2326 | 7.9% |
5 | 2198 | 7.5% |
0 | 2174 | 7.4% |
6 | 1955 | 6.7% |
9 | 1614 | 5.5% |
8 | 1535 | 5.2% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 20 | |
t | 7 | 12.1% |
s | 7 | 12.1% |
b | 6 | 10.3% |
o | 6 | 10.3% |
n | 6 | 10.3% |
l | 6 | 10.3% |
Other Punctuation
Value | Count | Frequency (%) |
. | 13 | |
& | 8 |
Space Separator
Value | Count | Frequency (%) |
29892 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1475 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 198 |
Close Punctuation
Value | Count | Frequency (%) |
) | 29 |
Open Punctuation
Value | Count | Frequency (%) |
( | 29 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 99414 | |
Common | 61029 | |
Latin | 264 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 11648 | 11.7% |
구 | 6535 | 6.6% |
시 | 6358 | 6.4% |
서 | 6309 | 6.3% |
울 | 5880 | 5.9% |
별 | 5728 | 5.8% |
특 | 5726 | 5.8% |
지 | 5169 | 5.2% |
작 | 5050 | 5.1% |
번 | 4859 | 4.9% |
Other values (357) | 36152 |
Latin
Value | Count | Frequency (%) |
K | 25 | 9.5% |
T | 24 | 9.1% |
B | 21 | 8.0% |
S | 21 | 8.0% |
e | 20 | 7.6% |
H | 18 | 6.8% |
C | 13 | 4.9% |
G | 11 | 4.2% |
P | 11 | 4.2% |
A | 10 | 3.8% |
Other values (17) | 90 |
Common
Value | Count | Frequency (%) |
29892 | ||
1 | 6117 | 10.0% |
2 | 4936 | 8.1% |
4 | 3390 | 5.6% |
3 | 3140 | 5.1% |
7 | 2326 | 3.8% |
5 | 2198 | 3.6% |
0 | 2174 | 3.6% |
6 | 1955 | 3.2% |
9 | 1614 | 2.6% |
Other values (7) | 3287 | 5.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 99414 | |
ASCII | 61293 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
29892 | ||
1 | 6117 | 10.0% |
2 | 4936 | 8.1% |
4 | 3390 | 5.5% |
3 | 3140 | 5.1% |
7 | 2326 | 3.8% |
5 | 2198 | 3.6% |
0 | 2174 | 3.5% |
6 | 1955 | 3.2% |
9 | 1614 | 2.6% |
Other values (34) | 3551 | 5.8% |
Hangul
Value | Count | Frequency (%) |
동 | 11648 | 11.7% |
구 | 6535 | 6.6% |
시 | 6358 | 6.4% |
서 | 6309 | 6.3% |
울 | 5880 | 5.9% |
별 | 5728 | 5.8% |
특 | 5726 | 5.8% |
지 | 5169 | 5.2% |
작 | 5050 | 5.1% |
번 | 4859 | 4.9% |
Other values (357) | 36152 |
상호 | 건설폐기물 종류 | 지번주소(발주자) | |
---|---|---|---|
1740 | 동광건설산업(주) | 건설폐재류:폐콘크리트 | 서울특별시 영등포구 신길동 238번지 33호 네오캐슬 |
7462 | 대림산업(주) | 폐목재(나무의 뿌리ㆍ가지 등 임목폐기물이 5톤 이상인 경우는 제외한다) | |
4462 | 명문종합건설(주) | 혼합건설폐기물 | 서울특별시 동작구 노량진동 47번지 2호 동작구청 |
7455 | 대림산업(주) | 건설폐재류:폐콘크리트 | |
1466 | (주)현암도시개발 | 건설폐재류:폐콘크리트 | 서울특별시 동작구 노량진동 232번지 142호 |
3234 | (주)성현이엔씨 | 혼합건설폐기물 | 서울특별시 동작구 대방동 390번지 5호 서울공업고등학교 |
4382 | (주)터원 | 건설폐재류:폐콘크리트 | 서울특별시 동작구 노량진동 119번지 100호 |
9382 | 정대엔지니어링(주) | 건설폐재류:폐아스팔트콘크리트 | |
7532 | 주언건설(주) | 혼합건설폐기물 | |
9751 | 태라관광주식회사 | 혼합건설폐기물 | 서울특별시 동작구 상도동 353-2번지 |
상호 | 건설폐기물 종류 | 지번주소(발주자) | |
---|---|---|---|
6751 | 롯데건설(주) | 폐합성수지 | |
5126 | 삼경건기 | 건설폐재류:폐콘크리트 | |
8903 | 개인 | 혼합건설폐기물 | |
1886 | 동신물류 | 건설폐재류:폐콘크리트 | 서울특별시 종로구 세종로 211번지 광화문빌딩 |
2113 | (주)청산건설 | 건설폐재류:폐콘크리트 | 서울특별시 동작구 사당동 432번지 21호 |
9464 | (주)하오삼건설 | 건설폐재류:폐콘크리트 | |
9717 | 인투종합건설(주) | 건설폐재류:폐콘크리트 | 서울특별시 송파구 오금동 152번지 1호 |
8626 | 개인 | 혼합건설폐기물 | |
9025 | (주)엠케이지종합건설 | 혼합건설폐기물 | |
9545 | 두리공영(주) | 혼합건설폐기물 | 서울특별시 동작구 사당동 1034번지 33호 |
Most frequently occurring
상호 | 건설폐기물 종류 | 지번주소(발주자) | # duplicates | |
---|---|---|---|---|
455 | 개인 | 건설폐재류:폐콘크리트 | 695 | |
524 | 개인 | 혼합건설폐기물 | 515 | |
1179 | 주언건설(주) | 건설폐재류:폐콘크리트 | 57 | |
318 | (주)터원 | 건설폐재류:폐콘크리트 | 52 | |
745 | 동작구청 | 건설폐재류:폐콘크리트 | 서울특별시 동작구 노량진동 47-2번지 | 47 |
348 | (주)터원 | 혼합건설폐기물 | 45 | |
215 | (주)청산건설 | 건설폐재류:폐콘크리트 | 41 | |
2 | (주)가람주택건설 | 건설폐재류:폐콘크리트 | 35 | |
35 | (주)대우건설 | 건설폐재류:폐콘크리트 | 34 | |
1080 | 윤정이엔씨(주) | 건설폐재류:폐콘크리트 | 34 |