Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 1318 |
Missing cells | 176 |
Missing cells (%) | 3.3% |
Duplicate rows | 60 |
Duplicate rows (%) | 4.6% |
Total size in memory | 41.3 KiB |
Average record size in memory | 32.1 B |
Variable types
Text | 3 |
---|---|
Categorical | 1 |
Dataset
Description | 충청북도 청주시 사업장 폐기물 배출자 신고현황에 대한 데이터로 상호 및 소재지(주소), 전화번호, 데이터 기준일자의 항목을 제공 합니다. |
---|---|
URL | https://www.data.go.kr/data/15081133/fileData.do |
기준일자 has constant value "" | Constant |
Dataset has 60 (4.6%) duplicate rows | Duplicates |
전화번호 has 176 (13.4%) missing values | Missing |
Reproduction
Analysis started | 2023-12-13 00:56:42.732201 |
---|---|
Analysis finished | 2023-12-13 00:56:43.234896 |
Duration | 0.5 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상호
Text
Distinct | 1191 |
---|---|
Distinct (%) | 90.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.4 KiB |
Length
Max length | 31 |
---|---|
Median length | 26 |
Mean length | 8.9567527 |
Min length | 2 |
Characters and Unicode
Total characters | 11805 |
---|---|
Distinct characters | 533 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 1080 ? |
---|---|
Unique (%) | 81.9% |
Sample
1st row | 서원대학교 |
---|---|
2nd row | 충북대학교 |
3rd row | 충북대학교병원 |
4th row | 충청북도 청주의료원 |
5th row | (주)이마트 청주점 |
Value | Count | Frequency (%) |
주식회사 | 90 | 5.7% |
오송공장 | 13 | 0.8% |
청주공장 | 8 | 0.5% |
한국전력공사 | 8 | 0.5% |
오창공장 | 7 | 0.4% |
환경시설관리 | 6 | 0.4% |
오창 | 6 | 0.4% |
공군제17전투비행단 | 5 | 0.3% |
현대바이오랜드 | 5 | 0.3% |
한국교원대학교 | 4 | 0.3% |
Other values (1264) | 1430 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 880 | 7.5% |
) | 684 | 5.8% |
( | 683 | 5.8% |
원 | 343 | 2.9% |
267 | 2.3% | |
이 | 253 | 2.1% |
스 | 250 | 2.1% |
의 | 216 | 1.8% |
사 | 216 | 1.8% |
청 | 182 | 1.5% |
Other values (523) | 7831 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9928 | |
Close Punctuation | 691 | 5.9% |
Open Punctuation | 690 | 5.8% |
Space Separator | 267 | 2.3% |
Decimal Number | 82 | 0.7% |
Uppercase Letter | 73 | 0.6% |
Other Symbol | 48 | 0.4% |
Lowercase Letter | 14 | 0.1% |
Other Punctuation | 8 | 0.1% |
Connector Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 880 | 8.9% |
원 | 343 | 3.5% |
이 | 253 | 2.5% |
스 | 250 | 2.5% |
의 | 216 | 2.2% |
사 | 216 | 2.2% |
청 | 182 | 1.8% |
과 | 182 | 1.8% |
공 | 178 | 1.8% |
한 | 170 | 1.7% |
Other values (478) | 7058 |
Uppercase Letter
Value | Count | Frequency (%) |
G | 11 | |
L | 9 | |
I | 9 | |
S | 8 | |
E | 5 | |
F | 5 | |
K | 5 | |
T | 4 | 5.5% |
R | 3 | 4.1% |
A | 3 | 4.1% |
Other values (5) | 11 |
Lowercase Letter
Value | Count | Frequency (%) |
k | 3 | |
e | 3 | |
s | 1 | 7.1% |
r | 1 | 7.1% |
t | 1 | 7.1% |
w | 1 | 7.1% |
o | 1 | 7.1% |
p | 1 | 7.1% |
a | 1 | 7.1% |
c | 1 | 7.1% |
Decimal Number
Value | Count | Frequency (%) |
2 | 28 | |
1 | 19 | |
3 | 15 | |
7 | 6 | 7.3% |
6 | 5 | 6.1% |
5 | 4 | 4.9% |
4 | 3 | 3.7% |
9 | 2 | 2.4% |
Other Punctuation
Value | Count | Frequency (%) |
. | 6 | |
/ | 1 | 12.5% |
& | 1 | 12.5% |
Close Punctuation
Value | Count | Frequency (%) |
) | 684 | |
] | 7 | 1.0% |
Open Punctuation
Value | Count | Frequency (%) |
( | 683 | |
[ | 7 | 1.0% |
Math Symbol
Value | Count | Frequency (%) |
> | 1 | |
< | 1 |
Space Separator
Value | Count | Frequency (%) |
267 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 48 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9976 | |
Common | 1742 | 14.8% |
Latin | 87 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 880 | 8.8% |
원 | 343 | 3.4% |
이 | 253 | 2.5% |
스 | 250 | 2.5% |
의 | 216 | 2.2% |
사 | 216 | 2.2% |
청 | 182 | 1.8% |
과 | 182 | 1.8% |
공 | 178 | 1.8% |
한 | 170 | 1.7% |
Other values (479) | 7106 |
Latin
Value | Count | Frequency (%) |
G | 11 | |
L | 9 | 10.3% |
I | 9 | 10.3% |
S | 8 | 9.2% |
E | 5 | 5.7% |
F | 5 | 5.7% |
K | 5 | 5.7% |
T | 4 | 4.6% |
k | 3 | 3.4% |
R | 3 | 3.4% |
Other values (15) | 25 |
Common
Value | Count | Frequency (%) |
) | 684 | |
( | 683 | |
267 | 15.3% | |
2 | 28 | 1.6% |
1 | 19 | 1.1% |
3 | 15 | 0.9% |
] | 7 | 0.4% |
[ | 7 | 0.4% |
7 | 6 | 0.3% |
. | 6 | 0.3% |
Other values (9) | 20 | 1.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9928 | |
ASCII | 1829 | 15.5% |
None | 48 | 0.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 880 | 8.9% |
원 | 343 | 3.5% |
이 | 253 | 2.5% |
스 | 250 | 2.5% |
의 | 216 | 2.2% |
사 | 216 | 2.2% |
청 | 182 | 1.8% |
과 | 182 | 1.8% |
공 | 178 | 1.8% |
한 | 170 | 1.7% |
Other values (478) | 7058 |
ASCII
Value | Count | Frequency (%) |
) | 684 | |
( | 683 | |
267 | 14.6% | |
2 | 28 | 1.5% |
1 | 19 | 1.0% |
3 | 15 | 0.8% |
G | 11 | 0.6% |
L | 9 | 0.5% |
I | 9 | 0.5% |
S | 8 | 0.4% |
Other values (34) | 96 | 5.2% |
None
Value | Count | Frequency (%) |
㈜ | 48 |
주소
Text
Distinct | 1138 |
---|---|
Distinct (%) | 86.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.4 KiB |
Length
Max length | 50 |
---|---|
Median length | 46 |
Mean length | 28.58953 |
Min length | 18 |
Characters and Unicode
Total characters | 37681 |
---|---|
Distinct characters | 358 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 1001 ? |
---|---|
Unique (%) | 75.9% |
Sample
1st row | 충청북도 청주시 서원구 모충동 231-5 |
---|---|
2nd row | 충청북도 청주시 서원구 충대로 1 |
3rd row | 충청북도 청주시 서원구 1순환로 776 |
4th row | 충청북도 청주시 서원구 사직동 554-6 |
5th row | 충청북도 청주시 서원구 미평동 123-1 |
Value | Count | Frequency (%) |
충청북도 | 1346 | 16.3% |
청주시 | 1321 | 16.0% |
흥덕구 | 569 | 6.9% |
청원구 | 485 | 5.9% |
오창읍 | 264 | 3.2% |
서원구 | 147 | 1.8% |
옥산면 | 124 | 1.5% |
상당구 | 117 | 1.4% |
오송읍 | 108 | 1.3% |
북이면 | 89 | 1.1% |
Other values (1411) | 3703 |
Most occurring characters
Value | Count | Frequency (%) |
7076 | ||
청 | 3265 | 8.7% |
북 | 1463 | 3.9% |
주 | 1418 | 3.8% |
도 | 1402 | 3.7% |
충 | 1380 | 3.7% |
시 | 1362 | 3.6% |
구 | 1361 | 3.6% |
1 | 1024 | 2.7% |
로 | 907 | 2.4% |
Other values (348) | 17023 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 23985 | |
Space Separator | 7076 | 18.8% |
Decimal Number | 5029 | 13.3% |
Open Punctuation | 424 | 1.1% |
Close Punctuation | 424 | 1.1% |
Dash Punctuation | 374 | 1.0% |
Connector Punctuation | 259 | 0.7% |
Uppercase Letter | 53 | 0.1% |
Other Punctuation | 47 | 0.1% |
Math Symbol | 9 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
청 | 3265 | 13.6% |
북 | 1463 | 6.1% |
주 | 1418 | 5.9% |
도 | 1402 | 5.8% |
충 | 1380 | 5.8% |
시 | 1362 | 5.7% |
구 | 1361 | 5.7% |
로 | 907 | 3.8% |
원 | 687 | 2.9% |
덕 | 615 | 2.6% |
Other values (313) | 10125 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 9 | |
S | 8 | |
I | 6 | |
T | 5 | |
A | 4 | |
F | 4 | |
L | 4 | |
G | 4 | |
D | 2 | 3.8% |
H | 1 | 1.9% |
Other values (6) | 6 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1024 | |
2 | 730 | |
3 | 608 | |
4 | 499 | |
5 | 444 | |
0 | 434 | |
6 | 395 | 7.9% |
8 | 316 | 6.3% |
7 | 303 | 6.0% |
9 | 276 | 5.5% |
Other Punctuation
Value | Count | Frequency (%) |
, | 46 | |
& | 1 | 2.1% |
Space Separator
Value | Count | Frequency (%) |
7076 |
Open Punctuation
Value | Count | Frequency (%) |
( | 424 |
Close Punctuation
Value | Count | Frequency (%) |
) | 424 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 374 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 259 |
Math Symbol
Value | Count | Frequency (%) |
~ | 9 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 23986 | |
Common | 13642 | |
Latin | 53 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
청 | 3265 | 13.6% |
북 | 1463 | 6.1% |
주 | 1418 | 5.9% |
도 | 1402 | 5.8% |
충 | 1380 | 5.8% |
시 | 1362 | 5.7% |
구 | 1361 | 5.7% |
로 | 907 | 3.8% |
원 | 687 | 2.9% |
덕 | 615 | 2.6% |
Other values (314) | 10126 |
Common
Value | Count | Frequency (%) |
7076 | ||
1 | 1024 | 7.5% |
2 | 730 | 5.4% |
3 | 608 | 4.5% |
4 | 499 | 3.7% |
5 | 444 | 3.3% |
0 | 434 | 3.2% |
( | 424 | 3.1% |
) | 424 | 3.1% |
6 | 395 | 2.9% |
Other values (8) | 1584 | 11.6% |
Latin
Value | Count | Frequency (%) |
K | 9 | |
S | 8 | |
I | 6 | |
T | 5 | |
A | 4 | |
F | 4 | |
L | 4 | |
G | 4 | |
D | 2 | 3.8% |
H | 1 | 1.9% |
Other values (6) | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 23985 | |
ASCII | 13695 | |
None | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
7076 | ||
1 | 1024 | 7.5% |
2 | 730 | 5.3% |
3 | 608 | 4.4% |
4 | 499 | 3.6% |
5 | 444 | 3.2% |
0 | 434 | 3.2% |
( | 424 | 3.1% |
) | 424 | 3.1% |
6 | 395 | 2.9% |
Other values (24) | 1637 | 12.0% |
Hangul
Value | Count | Frequency (%) |
청 | 3265 | 13.6% |
북 | 1463 | 6.1% |
주 | 1418 | 5.9% |
도 | 1402 | 5.8% |
충 | 1380 | 5.8% |
시 | 1362 | 5.7% |
구 | 1361 | 5.7% |
로 | 907 | 3.8% |
원 | 687 | 2.9% |
덕 | 615 | 2.6% |
Other values (313) | 10125 |
None
Value | Count | Frequency (%) |
㈜ | 1 |
전화번호
Text
MISSING
 
Distinct | 1002 |
---|---|
Distinct (%) | 87.7% |
Missing | 176 |
Missing (%) | 13.4% |
Memory size | 10.4 KiB |
Length
Max length | 13 |
---|---|
Median length | 12 |
Mean length | 11.879159 |
Min length | 1 |
Characters and Unicode
Total characters | 13566 |
---|---|
Distinct characters | 13 |
Distinct categories | 4 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 893 ? |
---|---|
Unique (%) | 78.2% |
Sample
1st row | 043-299-8114 |
---|---|
2nd row | 043-261-2994 |
3rd row | 043-269-6684 |
4th row | 043-279-0134 |
5th row | 043-210-1234 |
Value | Count | Frequency (%) |
043-218-0510 | 10 | 0.9% |
043 | 5 | 0.4% |
043-214-7588 | 3 | 0.3% |
043-240-8600 | 3 | 0.3% |
043-265-0071 | 3 | 0.3% |
043-240-1069 | 3 | 0.3% |
043-211-1837 | 3 | 0.3% |
043-240-6051 | 3 | 0.3% |
043-711-8899 | 3 | 0.3% |
043-249-8759 | 3 | 0.3% |
Other values (992) | 1094 |
Most occurring characters
Value | Count | Frequency (%) |
- | 2249 | |
0 | 2111 | |
3 | 1743 | |
2 | 1606 | |
4 | 1600 | |
1 | 1102 | |
7 | 792 | 5.8% |
5 | 649 | 4.8% |
8 | 599 | 4.4% |
6 | 579 | 4.3% |
Other values (3) | 536 | 4.0% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 11296 | |
Dash Punctuation | 2249 | 16.6% |
Space Separator | 20 | 0.1% |
Close Punctuation | 1 | < 0.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 2111 | |
3 | 1743 | |
2 | 1606 | |
4 | 1600 | |
1 | 1102 | |
7 | 792 | 7.0% |
5 | 649 | 5.7% |
8 | 599 | 5.3% |
6 | 579 | 5.1% |
9 | 515 | 4.6% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2249 |
Space Separator
Value | Count | Frequency (%) |
20 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 13566 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 2249 | |
0 | 2111 | |
3 | 1743 | |
2 | 1606 | |
4 | 1600 | |
1 | 1102 | |
7 | 792 | 5.8% |
5 | 649 | 4.8% |
8 | 599 | 4.4% |
6 | 579 | 4.3% |
Other values (3) | 536 | 4.0% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 13566 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 2249 | |
0 | 2111 | |
3 | 1743 | |
2 | 1606 | |
4 | 1600 | |
1 | 1102 | |
7 | 792 | 5.8% |
5 | 649 | 4.8% |
8 | 599 | 4.4% |
6 | 579 | 4.3% |
Other values (3) | 536 | 4.0% |
기준일자
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 10.4 KiB |
2023-06-30 |
---|
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 10 |
Min length | 10 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-06-30 |
---|---|
2nd row | 2023-06-30 |
3rd row | 2023-06-30 |
4th row | 2023-06-30 |
5th row | 2023-06-30 |
Common Values
Value | Count | Frequency (%) |
2023-06-30 | 1318 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-06-30 | 1318 |
상호 | 주소 | 전화번호 | 기준일자 | |
---|---|---|---|---|
0 | 서원대학교 | 충청북도 청주시 서원구 모충동 231-5 | 043-299-8114 | 2023-06-30 |
1 | 충북대학교 | 충청북도 청주시 서원구 충대로 1 | 043-261-2994 | 2023-06-30 |
2 | 충북대학교병원 | 충청북도 청주시 서원구 1순환로 776 | 043-269-6684 | 2023-06-30 |
3 | 충청북도 청주의료원 | 충청북도 청주시 서원구 사직동 554-6 | 043-279-0134 | 2023-06-30 |
4 | (주)이마트 청주점 | 충청북도 청주시 서원구 미평동 123-1 | 043-210-1234 | 2023-06-30 |
5 | 넥상스코리아(주) | 충청북도 청주시 서원구 남이면 사동길 50 | 043-270-0217 | 2023-06-30 |
6 | (주)서일기업 | 충청북도 청주시 서원구 남이면 사동리 124 | 043-269-0846 | 2023-06-30 |
7 | 한국지역난방공사청주지사 | 충청북도 청주시 서원구 죽림동 224 | 043-230-4661 | 2023-06-30 |
8 | 성진엔지니어링(주) | 충청북도 청주시 서원구 남이면 갈원리 162-1 | 043-269-4222 | 2023-06-30 |
9 | 오비맥주 주식회사 청주공장 | 충청북도 청주시 서원구 현도면 중삼리 52번지 | 043-279-4723 | 2023-06-30 |
상호 | 주소 | 전화번호 | 기준일자 | |
---|---|---|---|---|
1308 | 손경락내과의원 | 충청북도 청주시 흥덕구 사직대로 74 | <NA> | 2023-06-30 |
1309 | 녹십자외과의원 | 충청북도 청주시 흥덕구 직지대로 575 | <NA> | 2023-06-30 |
1310 | 서울정형외과 | 충청북도 청주시 흥덕구 1순환로 509 | <NA> | 2023-06-30 |
1311 | 양치과의원 | 충청북도 청주시 흥덕구 직지대로 559 | <NA> | 2023-06-30 |
1312 | 김태룡내과의원 | 충청북도 청주시 흥덕구 1순환로 511-1 | <NA> | 2023-06-30 |
1313 | 스마일치과의원 | 충청북도 청주시 흥덕구 증안로 54 | <NA> | 2023-06-30 |
1314 | 임상헌치과의원 | 충청북도 청주시 흥덕구 가로수로 1340-1, 중앙빌딩 5층 | <NA> | 2023-06-30 |
1315 | 김박내과의원 | 충청북도 청주시 흥덕구 복대로 179, 메디포스 2층 | <NA> | 2023-06-30 |
1316 | 한국도자기(주) | 충청북도 청주시 흥덕구 송정동 27-10 | <NA> | 2023-06-30 |
1317 | 한국도자기(주) 슈퍼2부 | 충청북도 청주시 흥덕구 송정동 140-34 | <NA> | 2023-06-30 |
Most frequently occurring
상호 | 주소 | 전화번호 | 기준일자 | # duplicates | |
---|---|---|---|---|---|
5 | (주)노바렉스(3공장) | 충청북도 청주시 청원구 오창읍 각리1길 64 | 043-218-0510 | 2023-06-30 | 3 |
9 | (주)렉스진바이오텍 | 충청북도 청주시 청원구 오창읍 각리1길 94 | 043-218-0510 | 2023-06-30 | 3 |
12 | (주)바이오톡스텍 | 충청북도 청주시 청원구 오창읍 연구단지로 53 | 043-210-7777 | 2023-06-30 | 3 |
16 | (주)유한양행 | 충청북도 청주시 청원구 오창읍 연구단지로 219 | 043-240-1069 | 2023-06-30 | 3 |
41 | 주식회사 현대바이오랜드 오창 | 충청북도 청주시 청원구 오창읍 과학산업3로 162 | 043-240-8600 | 2023-06-30 | 3 |
0 | (재)한국건설생활환경시험연구원 오창 | 충청북도 청주시 청원구 오창읍 양청3길 73 | 043-718-9003 | 2023-06-30 | 2 |
1 | (주)강내자동차해체재활용산업 | 충청북도 청주시 흥덕구 강내면 황탄리길 183 | 043-238-7777 | 2023-06-30 | 2 |
2 | (주)그린광학 오송공장 | 충청북도 청주시 흥덕구 오송읍 오송생명4로 168-19 (주)그린광학 | 043-218-2183 | 2023-06-30 | 2 |
3 | (주)나이스폐차 | 충청북도 청주시 청원구 오창읍 여천3길 149 | 043-213-4000 | 2023-06-30 | 2 |
4 | (주)노바렉스(2공장) | 충청북도 청주시 청원구 오창읍 각리1길 60 | 043-218-0510 | 2023-06-30 | 2 |