Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 460 |
Missing cells | 1 |
Missing cells (%) | 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 14.5 KiB |
Average record size in memory | 32.3 B |
Variable types
Text | 3 |
---|---|
Categorical | 1 |
Dataset
Description | 함안군 폐수배수시설 설치현황 제공, 폐수배출시설의 사업장명, 폐수배출시설의 소재지 주소, 폐수배출시설 업장의 업종명, 폐수배출시설의 종별 구분 등의 정보를 포함합니다. |
---|---|
Author | 경상남도 함안군 |
URL | https://www.data.go.kr/data/3066728/fileData.do |
종 is highly imbalanced (85.6%) | Imbalance |
Reproduction
Analysis started | 2023-12-13 00:36:39.660887 |
---|---|
Analysis finished | 2023-12-13 00:36:40.110489 |
Duration | 0.45 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
사업장명
Text
Distinct | 455 |
---|---|
Distinct (%) | 98.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
Value | Count | Frequency (%) |
주식회사 | 6 | 1.2% |
함안지점 | 5 | 1.0% |
2공장 | 4 | 0.8% |
제3공장 | 3 | 0.6% |
함안공장 | 3 | 0.6% |
광진테크(주 | 2 | 0.4% |
주)지티씨 | 2 | 0.4% |
주)쎄노텍 | 2 | 0.4% |
주)삼화대림화학 | 2 | 0.4% |
의료법인 | 2 | 0.4% |
Other values (471) | 482 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 303 | 8.9% |
( | 293 | 8.6% |
) | 293 | 8.6% |
공 | 80 | 2.4% |
이 | 80 | 2.4% |
업 | 65 | 1.9% |
장 | 62 | 1.8% |
성 | 56 | 1.7% |
산 | 54 | 1.6% |
53 | 1.6% | |
Other values (287) | 2053 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 2674 | |
Open Punctuation | 293 | 8.6% |
Close Punctuation | 293 | 8.6% |
Space Separator | 53 | 1.6% |
Uppercase Letter | 38 | 1.1% |
Decimal Number | 37 | 1.1% |
Other Punctuation | 4 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 303 | 11.3% |
공 | 80 | 3.0% |
이 | 80 | 3.0% |
업 | 65 | 2.4% |
장 | 62 | 2.3% |
성 | 56 | 2.1% |
산 | 54 | 2.0% |
에 | 53 | 2.0% |
스 | 53 | 2.0% |
크 | 47 | 1.8% |
Other values (260) | 1821 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 6 | |
C | 4 | |
H | 4 | |
G | 4 | |
N | 4 | |
T | 3 | |
S | 3 | |
P | 2 | 5.3% |
B | 2 | 5.3% |
M | 2 | 5.3% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
2 | 16 | |
1 | 10 | |
3 | 5 | 13.5% |
8 | 2 | 5.4% |
4 | 1 | 2.7% |
0 | 1 | 2.7% |
5 | 1 | 2.7% |
6 | 1 | 2.7% |
Other Punctuation
Value | Count | Frequency (%) |
& | 3 | |
. | 1 | 25.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 293 |
Close Punctuation
Value | Count | Frequency (%) |
) | 293 |
Space Separator
Value | Count | Frequency (%) |
53 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 2674 | |
Common | 680 | 20.0% |
Latin | 38 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 303 | 11.3% |
공 | 80 | 3.0% |
이 | 80 | 3.0% |
업 | 65 | 2.4% |
장 | 62 | 2.3% |
성 | 56 | 2.1% |
산 | 54 | 2.0% |
에 | 53 | 2.0% |
스 | 53 | 2.0% |
크 | 47 | 1.8% |
Other values (260) | 1821 |
Latin
Value | Count | Frequency (%) |
E | 6 | |
C | 4 | |
H | 4 | |
G | 4 | |
N | 4 | |
T | 3 | |
S | 3 | |
P | 2 | 5.3% |
B | 2 | 5.3% |
M | 2 | 5.3% |
Other values (4) | 4 |
Common
Value | Count | Frequency (%) |
( | 293 | |
) | 293 | |
53 | 7.8% | |
2 | 16 | 2.4% |
1 | 10 | 1.5% |
3 | 5 | 0.7% |
& | 3 | 0.4% |
8 | 2 | 0.3% |
4 | 1 | 0.1% |
0 | 1 | 0.1% |
Other values (3) | 3 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 2674 | |
ASCII | 718 | 21.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 303 | 11.3% |
공 | 80 | 3.0% |
이 | 80 | 3.0% |
업 | 65 | 2.4% |
장 | 62 | 2.3% |
성 | 56 | 2.1% |
산 | 54 | 2.0% |
에 | 53 | 2.0% |
스 | 53 | 2.0% |
크 | 47 | 1.8% |
Other values (260) | 1821 |
ASCII
Value | Count | Frequency (%) |
( | 293 | |
) | 293 | |
53 | 7.4% | |
2 | 16 | 2.2% |
1 | 10 | 1.4% |
E | 6 | 0.8% |
3 | 5 | 0.7% |
C | 4 | 0.6% |
H | 4 | 0.6% |
G | 4 | 0.6% |
Other values (17) | 30 | 4.2% |
도로명소재지
Text
Distinct | 447 |
---|---|
Distinct (%) | 97.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
Length
Max length | 40 |
---|---|
Median length | 37 |
Mean length | 22.713043 |
Min length | 18 |
Characters and Unicode
Total characters | 10448 |
---|---|
Distinct characters | 208 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 434 ? |
---|---|
Unique (%) | 94.3% |
Sample
1st row | 경상남도 함안군 가야읍 가야11길 13 |
---|---|
2nd row | 경상남도 함안군 가야읍 가야16길 11 |
3rd row | 경상남도 함안군 가야읍 가야로 103-1 |
4th row | 경상남도 함안군 가야읍 가야로 132 |
5th row | 경상남도 함안군 가야읍 가야로 64 |
Value | Count | Frequency (%) |
경상남도 | 460 | |
함안군 | 460 | |
칠원읍 | 118 | 4.9% |
군북면 | 92 | 3.9% |
칠서면 | 85 | 3.6% |
칠북면 | 38 | 1.6% |
법수면 | 33 | 1.4% |
가야읍 | 32 | 1.3% |
산인면 | 29 | 1.2% |
대산면 | 23 | 1.0% |
Other values (565) | 1018 |
Most occurring characters
Value | Count | Frequency (%) |
1975 | ||
군 | 552 | 5.3% |
함 | 538 | 5.1% |
안 | 525 | 5.0% |
남 | 482 | 4.6% |
경 | 470 | 4.5% |
상 | 463 | 4.4% |
도 | 462 | 4.4% |
1 | 357 | 3.4% |
면 | 310 | 3.0% |
Other values (198) | 4314 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6561 | |
Space Separator | 1975 | 18.9% |
Decimal Number | 1619 | 15.5% |
Dash Punctuation | 166 | 1.6% |
Close Punctuation | 57 | 0.5% |
Open Punctuation | 57 | 0.5% |
Uppercase Letter | 12 | 0.1% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
군 | 552 | 8.4% |
함 | 538 | 8.2% |
안 | 525 | 8.0% |
남 | 482 | 7.3% |
경 | 470 | 7.2% |
상 | 463 | 7.1% |
도 | 462 | 7.0% |
면 | 310 | 4.7% |
칠 | 262 | 4.0% |
로 | 231 | 3.5% |
Other values (175) | 2266 |
Decimal Number
Value | Count | Frequency (%) |
1 | 357 | |
2 | 227 | |
3 | 190 | |
4 | 135 | 8.3% |
6 | 132 | 8.2% |
5 | 131 | 8.1% |
9 | 131 | 8.1% |
7 | 128 | 7.9% |
0 | 107 | 6.6% |
8 | 81 | 5.0% |
Uppercase Letter
Value | Count | Frequency (%) |
T | 2 | |
C | 2 | |
G | 2 | |
N | 2 | |
I | 1 | |
E | 1 | |
P | 1 | |
K | 1 |
Space Separator
Value | Count | Frequency (%) |
1975 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 166 |
Close Punctuation
Value | Count | Frequency (%) |
) | 57 |
Open Punctuation
Value | Count | Frequency (%) |
( | 57 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6561 | |
Common | 3875 | |
Latin | 12 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
군 | 552 | 8.4% |
함 | 538 | 8.2% |
안 | 525 | 8.0% |
남 | 482 | 7.3% |
경 | 470 | 7.2% |
상 | 463 | 7.1% |
도 | 462 | 7.0% |
면 | 310 | 4.7% |
칠 | 262 | 4.0% |
로 | 231 | 3.5% |
Other values (175) | 2266 |
Common
Value | Count | Frequency (%) |
1975 | ||
1 | 357 | 9.2% |
2 | 227 | 5.9% |
3 | 190 | 4.9% |
- | 166 | 4.3% |
4 | 135 | 3.5% |
6 | 132 | 3.4% |
5 | 131 | 3.4% |
9 | 131 | 3.4% |
7 | 128 | 3.3% |
Other values (5) | 303 | 7.8% |
Latin
Value | Count | Frequency (%) |
T | 2 | |
C | 2 | |
G | 2 | |
N | 2 | |
I | 1 | |
E | 1 | |
P | 1 | |
K | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6561 | |
ASCII | 3887 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1975 | ||
1 | 357 | 9.2% |
2 | 227 | 5.8% |
3 | 190 | 4.9% |
- | 166 | 4.3% |
4 | 135 | 3.5% |
6 | 132 | 3.4% |
5 | 131 | 3.4% |
9 | 131 | 3.4% |
7 | 128 | 3.3% |
Other values (13) | 315 | 8.1% |
Hangul
Value | Count | Frequency (%) |
군 | 552 | 8.4% |
함 | 538 | 8.2% |
안 | 525 | 8.0% |
남 | 482 | 7.3% |
경 | 470 | 7.2% |
상 | 463 | 7.1% |
도 | 462 | 7.0% |
면 | 310 | 4.7% |
칠 | 262 | 4.0% |
로 | 231 | 3.5% |
Other values (175) | 2266 |
대표업종
Text
Distinct | 242 |
---|---|
Distinct (%) | 52.7% |
Missing | 1 |
Missing (%) | 0.2% |
Memory size | 3.7 KiB |
Value | Count | Frequency (%) |
제조업 | 221 | 15.9% |
및 | 136 | 9.8% |
기타 | 76 | 5.5% |
금속 | 41 | 2.9% |
자동차 | 39 | 2.8% |
절삭가공 | 28 | 2.0% |
유사처리업 | 26 | 1.9% |
그외 | 24 | 1.7% |
세차업 | 22 | 1.6% |
처리업 | 17 | 1.2% |
Other values (354) | 764 |
Most occurring characters
Value | Count | Frequency (%) |
965 | 17.5% | |
업 | 425 | 7.7% |
제 | 345 | 6.3% |
조 | 338 | 6.1% |
기 | 228 | 4.1% |
및 | 142 | 2.6% |
품 | 126 | 2.3% |
금 | 121 | 2.2% |
속 | 113 | 2.1% |
리 | 107 | 1.9% |
Other values (217) | 2598 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4517 | |
Space Separator | 965 | 17.5% |
Other Punctuation | 18 | 0.3% |
Decimal Number | 8 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 425 | 9.4% |
제 | 345 | 7.6% |
조 | 338 | 7.5% |
기 | 228 | 5.0% |
및 | 142 | 3.1% |
품 | 126 | 2.8% |
금 | 121 | 2.7% |
속 | 113 | 2.5% |
리 | 107 | 2.4% |
타 | 95 | 2.1% |
Other values (209) | 2477 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 | |
2 | 2 | |
3 | 2 | |
5 | 1 | 12.5% |
Other Punctuation
Value | Count | Frequency (%) |
, | 16 | |
· | 1 | 5.6% |
. | 1 | 5.6% |
Space Separator
Value | Count | Frequency (%) |
965 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4517 | |
Common | 991 | 18.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 425 | 9.4% |
제 | 345 | 7.6% |
조 | 338 | 7.5% |
기 | 228 | 5.0% |
및 | 142 | 3.1% |
품 | 126 | 2.8% |
금 | 121 | 2.7% |
속 | 113 | 2.5% |
리 | 107 | 2.4% |
타 | 95 | 2.1% |
Other values (209) | 2477 |
Common
Value | Count | Frequency (%) |
965 | ||
, | 16 | 1.6% |
1 | 3 | 0.3% |
2 | 2 | 0.2% |
3 | 2 | 0.2% |
· | 1 | 0.1% |
. | 1 | 0.1% |
5 | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4517 | |
ASCII | 990 | 18.0% |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
965 | ||
, | 16 | 1.6% |
1 | 3 | 0.3% |
2 | 2 | 0.2% |
3 | 2 | 0.2% |
. | 1 | 0.1% |
5 | 1 | 0.1% |
Hangul
Value | Count | Frequency (%) |
업 | 425 | 9.4% |
제 | 345 | 7.6% |
조 | 338 | 7.5% |
기 | 228 | 5.0% |
및 | 142 | 3.1% |
품 | 126 | 2.8% |
금 | 121 | 2.7% |
속 | 113 | 2.5% |
리 | 107 | 2.4% |
타 | 95 | 2.1% |
Other values (209) | 2477 |
None
Value | Count | Frequency (%) |
· | 1 |
종
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 1.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
5종 | |
---|---|
4종 | 21 |
1 | |
2종 | 1 |
3종 | 1 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 1.9978261 |
Min length | 1 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.7% |
Sample
1st row | 5종 |
---|---|
2nd row | 5종 |
3rd row | 5종 |
4th row | 5종 |
5th row | 5종 |
Common Values
Value | Count | Frequency (%) |
5종 | 436 | |
4종 | 21 | 4.6% |
1 | 0.2% | |
2종 | 1 | 0.2% |
3종 | 1 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
5종 | 436 | |
4종 | 21 | 4.6% |
2종 | 1 | 0.2% |
3종 | 1 | 0.2% |
사업장명 | 도로명소재지 | 대표업종 | 종 | |
---|---|---|---|---|
0 | 팀일레븐 | 경상남도 함안군 가야읍 가야11길 13 | 자동차 세차업 | 5종 |
1 | 쌍둥이세차장 | 경상남도 함안군 가야읍 가야16길 11 | 자동차 세차업 | 5종 |
2 | 강남 손 세차장 | 경상남도 함안군 가야읍 가야로 103-1 | 자동차 세차업 | 5종 |
3 | 수영 손세차장 | 경상남도 함안군 가야읍 가야로 132 | 자동차 세차업 | 5종 |
4 | 함안주유소 | 경상남도 함안군 가야읍 가야로 64 | 주유소 운영업 | 5종 |
5 | 삼진알루늄 | 경상남도 함안군 가야읍 검암리 990-17 | 5종 | |
6 | 삼진알미늄 | 경상남도 함안군 가야읍 검암리 990-17 | 5종 | |
7 | 함안셀프세차장 | 경상남도 함안군 가야읍 검암천북길 19 ((주)대동공업함안대리점) | 자동차 세차업 | 5종 |
8 | (주)케이씨피 제5공장 | 경상남도 함안군 가야읍 광정로 312 | 토목공사 및 유사용 기계장비 제조업 | 5종 |
9 | 고려주유소 | 경상남도 함안군 가야읍 광정리 302 | 주유소 운영업 | 5종 |
사업장명 | 도로명소재지 | 대표업종 | 종 | |
---|---|---|---|---|
450 | 금성열처리 | 경상남도 함안군 함안면 광정로 339-14 | 금속 열처리업 | 5종 |
451 | (주)오양기업 함안공장 | 경상남도 함안군 함안면 광정로 344-17 | 도장 및 기타 피막처리업 | 4종 |
452 | (주)건양메탈 함안지점 | 경상남도 함안군 함안면 광정로 372 | 혼성 및 재생플라스틱 소재 물질 제조업 | 5종 |
453 | 신진물산(주) | 경상남도 함안군 함안면 봉성1길 41 | 음·식료품 제조업 | 3종 |
454 | 지리산농산 | 경상남도 함안군 함안면 봉수로 715 (지리산농산) | 과실 및 채소 절임식품 제조업 | 5종 |
455 | (주)케이씨피 제3공장 | 경상남도 함안군 함안면 봉수로 721 | 토목공사 및 유사용 기계장비 제조업 | 5종 |
456 | 동원ENG | 경상남도 함안군 함안면 봉수로 733 | 금속조립구조재 제조업 | 5종 |
457 | 태성기업 | 경상남도 함안군 함안면 파수리 465-4 파수농공단지 | 금속조립구조재 제조업 | 5종 |
458 | 영은금속 | 경상남도 함안군 함안면 파수리 파수농공단지 465-17 | 수동식 식품 가공기기 및 금속주방용기 제조업 | 5종 |
459 | 칠서제일주유소 | 경상남도 함안군 칠서면 청계3길 1, 공단주유소 | 주유소 운영업 | 5종 |