Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 687 |
Missing cells | 4 |
Missing cells (%) | 0.1% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 27.6 KiB |
Average record size in memory | 41.2 B |
Variable types
Numeric | 1 |
---|---|
Text | 3 |
Categorical | 1 |
Dataset
Description | 청주시 관내의 대기오염물질 배출사업장(1종~5종)의 데이터로 배출사업장 업체명, 소재지, 업종 및 종별에 대한 데이터 |
---|---|
URL | https://www.data.go.kr/data/15080689/fileData.do |
Reproduction
Analysis started | 2023-12-12 12:49:14.796416 |
---|---|
Analysis finished | 2023-12-12 12:49:15.720170 |
Duration | 0.92 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
연 번
Real number (ℝ)
UNIQUE
 
Distinct | 687 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 344 |
Minimum | 1 |
---|---|
Maximum | 687 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.2 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 35.3 |
Q1 | 172.5 |
median | 344 |
Q3 | 515.5 |
95-th percentile | 652.7 |
Maximum | 687 |
Range | 686 |
Interquartile range (IQR) | 343 |
Descriptive statistics
Standard deviation | 198.4641 |
---|---|
Coefficient of variation (CV) | 0.57693053 |
Kurtosis | -1.2 |
Mean | 344 |
Median Absolute Deviation (MAD) | 172 |
Skewness | 0 |
Sum | 236328 |
Variance | 39388 |
Monotonicity | Strictly increasing |
Value | Count | Frequency (%) |
1 | 1 | 0.1% |
463 | 1 | 0.1% |
455 | 1 | 0.1% |
456 | 1 | 0.1% |
457 | 1 | 0.1% |
458 | 1 | 0.1% |
459 | 1 | 0.1% |
460 | 1 | 0.1% |
461 | 1 | 0.1% |
462 | 1 | 0.1% |
Other values (677) | 677 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 1 |
Value | Count | Frequency (%) |
687 | 1 | |
686 | 1 | |
685 | 1 | |
684 | 1 | |
683 | 1 | |
682 | 1 | |
681 | 1 | |
680 | 1 | |
679 | 1 | |
678 | 1 |
업체명
Text
Distinct | 677 |
---|---|
Distinct (%) | 98.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.5 KiB |
Value | Count | Frequency (%) |
주식회사 | 43 | 5.4% |
농업회사법인 | 7 | 0.9% |
청주공장 | 6 | 0.8% |
청주농산(주 | 3 | 0.4% |
청주지점 | 3 | 0.4% |
우리도시산업(주 | 2 | 0.3% |
광복영농조합법인 | 2 | 0.3% |
청주시시설관리공단 | 2 | 0.3% |
주)창우rs | 2 | 0.3% |
주)동원레미콘 | 2 | 0.3% |
Other values (708) | 721 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 501 | 8.7% |
) | 379 | 6.6% |
( | 379 | 6.6% |
업 | 147 | 2.6% |
사 | 145 | 2.5% |
스 | 133 | 2.3% |
공 | 113 | 2.0% |
107 | 1.9% | |
이 | 106 | 1.9% |
청 | 104 | 1.8% |
Other values (398) | 3615 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4748 | |
Close Punctuation | 379 | 6.6% |
Open Punctuation | 379 | 6.6% |
Space Separator | 107 | 1.9% |
Decimal Number | 50 | 0.9% |
Uppercase Letter | 33 | 0.6% |
Other Symbol | 29 | 0.5% |
Other Punctuation | 2 | < 0.1% |
Dash Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 501 | 10.6% |
업 | 147 | 3.1% |
사 | 145 | 3.1% |
스 | 133 | 2.8% |
공 | 113 | 2.4% |
이 | 106 | 2.2% |
청 | 104 | 2.2% |
산 | 80 | 1.7% |
회 | 79 | 1.7% |
동 | 75 | 1.6% |
Other values (369) | 3265 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 6 | |
C | 5 | |
R | 4 | |
T | 2 | 6.1% |
G | 2 | 6.1% |
A | 2 | 6.1% |
I | 2 | 6.1% |
O | 1 | 3.0% |
B | 1 | 3.0% |
N | 1 | 3.0% |
Other values (7) | 7 |
Decimal Number
Value | Count | Frequency (%) |
1 | 26 | |
2 | 17 | |
0 | 2 | 4.0% |
8 | 2 | 4.0% |
7 | 2 | 4.0% |
3 | 1 | 2.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 379 |
Open Punctuation
Value | Count | Frequency (%) |
( | 379 |
Space Separator
Value | Count | Frequency (%) |
107 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 29 |
Other Punctuation
Value | Count | Frequency (%) |
. | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4777 | |
Common | 919 | 16.0% |
Latin | 33 | 0.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 501 | 10.5% |
업 | 147 | 3.1% |
사 | 145 | 3.0% |
스 | 133 | 2.8% |
공 | 113 | 2.4% |
이 | 106 | 2.2% |
청 | 104 | 2.2% |
산 | 80 | 1.7% |
회 | 79 | 1.7% |
동 | 75 | 1.6% |
Other values (370) | 3294 |
Latin
Value | Count | Frequency (%) |
S | 6 | |
C | 5 | |
R | 4 | |
T | 2 | 6.1% |
G | 2 | 6.1% |
A | 2 | 6.1% |
I | 2 | 6.1% |
O | 1 | 3.0% |
B | 1 | 3.0% |
N | 1 | 3.0% |
Other values (7) | 7 |
Common
Value | Count | Frequency (%) |
) | 379 | |
( | 379 | |
107 | 11.6% | |
1 | 26 | 2.8% |
2 | 17 | 1.8% |
. | 2 | 0.2% |
0 | 2 | 0.2% |
8 | 2 | 0.2% |
7 | 2 | 0.2% |
- | 2 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4748 | |
ASCII | 952 | 16.6% |
None | 29 | 0.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 501 | 10.6% |
업 | 147 | 3.1% |
사 | 145 | 3.1% |
스 | 133 | 2.8% |
공 | 113 | 2.4% |
이 | 106 | 2.2% |
청 | 104 | 2.2% |
산 | 80 | 1.7% |
회 | 79 | 1.7% |
동 | 75 | 1.6% |
Other values (369) | 3265 |
ASCII
Value | Count | Frequency (%) |
) | 379 | |
( | 379 | |
107 | 11.2% | |
1 | 26 | 2.7% |
2 | 17 | 1.8% |
S | 6 | 0.6% |
C | 5 | 0.5% |
R | 4 | 0.4% |
. | 2 | 0.2% |
0 | 2 | 0.2% |
Other values (18) | 25 | 2.6% |
None
Value | Count | Frequency (%) |
㈜ | 29 |
소재지
Text
Distinct | 672 |
---|---|
Distinct (%) | 98.0% |
Missing | 1 |
Missing (%) | 0.1% |
Memory size | 5.5 KiB |
Length
Max length | 56 |
---|---|
Median length | 45 |
Mean length | 25.91691 |
Min length | 16 |
Characters and Unicode
Total characters | 17779 |
---|---|
Distinct characters | 240 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 659 ? |
---|---|
Unique (%) | 96.1% |
Sample
1st row | 충청북도 청주시 상당구 가덕면 상장인차로 27 |
---|---|
2nd row | 충청북도 청주시 흥덕구 옥산면 오산가좌로 415-14 |
3rd row | 충청북도 청주시 흥덕구 강내면 태성1길 64 |
4th row | 충청북도 청주시 흥덕구 오송읍 상정쌍청로 256 |
5th row | 충청북도 청주시 흥덕구 오송읍 상정쌍청로 171 |
Value | Count | Frequency (%) |
청주시 | 686 | 17.2% |
충청북도 | 544 | 13.6% |
청원구 | 262 | 6.6% |
흥덕구 | 217 | 5.4% |
서원구 | 141 | 3.5% |
북이면 | 106 | 2.7% |
오창읍 | 88 | 2.2% |
남이면 | 72 | 1.8% |
강내면 | 70 | 1.8% |
상당구 | 65 | 1.6% |
Other values (953) | 1737 |
Most occurring characters
Value | Count | Frequency (%) |
3923 | ||
청 | 1533 | 8.6% |
주 | 710 | 4.0% |
구 | 693 | 3.9% |
시 | 692 | 3.9% |
북 | 658 | 3.7% |
도 | 585 | 3.3% |
충 | 560 | 3.1% |
1 | 502 | 2.8% |
- | 449 | 2.5% |
Other values (230) | 7474 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 10722 | |
Space Separator | 3923 | 22.1% |
Decimal Number | 2617 | 14.7% |
Dash Punctuation | 449 | 2.5% |
Close Punctuation | 23 | 0.1% |
Open Punctuation | 23 | 0.1% |
Other Punctuation | 15 | 0.1% |
Uppercase Letter | 7 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
청 | 1533 | 14.3% |
주 | 710 | 6.6% |
구 | 693 | 6.5% |
시 | 692 | 6.5% |
북 | 658 | 6.1% |
도 | 585 | 5.5% |
충 | 560 | 5.2% |
원 | 432 | 4.0% |
면 | 390 | 3.6% |
리 | 327 | 3.0% |
Other values (206) | 4142 |
Decimal Number
Value | Count | Frequency (%) |
1 | 502 | |
2 | 424 | |
3 | 331 | |
4 | 235 | |
6 | 218 | |
8 | 191 | 7.3% |
5 | 188 | 7.2% |
0 | 185 | 7.1% |
7 | 183 | 7.0% |
9 | 160 | 6.1% |
Uppercase Letter
Value | Count | Frequency (%) |
D | 2 | |
N | 1 | |
B | 1 | |
C | 1 | |
K | 1 | |
S | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 21 | |
] | 2 | 8.7% |
Open Punctuation
Value | Count | Frequency (%) |
( | 21 | |
[ | 2 | 8.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 12 | |
. | 3 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
3923 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 449 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 10722 | |
Common | 7050 | |
Latin | 7 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
청 | 1533 | 14.3% |
주 | 710 | 6.6% |
구 | 693 | 6.5% |
시 | 692 | 6.5% |
북 | 658 | 6.1% |
도 | 585 | 5.5% |
충 | 560 | 5.2% |
원 | 432 | 4.0% |
면 | 390 | 3.6% |
리 | 327 | 3.0% |
Other values (206) | 4142 |
Common
Value | Count | Frequency (%) |
3923 | ||
1 | 502 | 7.1% |
- | 449 | 6.4% |
2 | 424 | 6.0% |
3 | 331 | 4.7% |
4 | 235 | 3.3% |
6 | 218 | 3.1% |
8 | 191 | 2.7% |
5 | 188 | 2.7% |
0 | 185 | 2.6% |
Other values (8) | 404 | 5.7% |
Latin
Value | Count | Frequency (%) |
D | 2 | |
N | 1 | |
B | 1 | |
C | 1 | |
K | 1 | |
S | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 10722 | |
ASCII | 7057 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3923 | ||
1 | 502 | 7.1% |
- | 449 | 6.4% |
2 | 424 | 6.0% |
3 | 331 | 4.7% |
4 | 235 | 3.3% |
6 | 218 | 3.1% |
8 | 191 | 2.7% |
5 | 188 | 2.7% |
0 | 185 | 2.6% |
Other values (14) | 411 | 5.8% |
Hangul
Value | Count | Frequency (%) |
청 | 1533 | 14.3% |
주 | 710 | 6.6% |
구 | 693 | 6.5% |
시 | 692 | 6.5% |
북 | 658 | 6.1% |
도 | 585 | 5.5% |
충 | 560 | 5.2% |
원 | 432 | 4.0% |
면 | 390 | 3.6% |
리 | 327 | 3.0% |
Other values (206) | 4142 |
업 종
Text
Distinct | 319 |
---|---|
Distinct (%) | 46.6% |
Missing | 3 |
Missing (%) | 0.4% |
Memory size | 5.5 KiB |
Value | Count | Frequency (%) |
제조업 | 223 | 10.6% |
및 | 200 | 9.5% |
자동차 | 103 | 4.9% |
수리업 | 95 | 4.5% |
기타 | 93 | 4.4% |
종합 | 58 | 2.8% |
플라스틱 | 46 | 2.2% |
처리업 | 42 | 2.0% |
폐기물 | 33 | 1.6% |
가스상물질 | 29 | 1.4% |
Other values (448) | 1184 |
Most occurring characters
Value | Count | Frequency (%) |
1499 | 18.3% | |
업 | 603 | 7.4% |
제 | 449 | 5.5% |
조 | 346 | 4.2% |
리 | 227 | 2.8% |
기 | 226 | 2.8% |
물 | 213 | 2.6% |
및 | 204 | 2.5% |
자 | 167 | 2.0% |
품 | 152 | 1.9% |
Other values (238) | 4111 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6652 | |
Space Separator | 1499 | 18.3% |
Other Punctuation | 39 | 0.5% |
Decimal Number | 3 | < 0.1% |
Open Punctuation | 2 | < 0.1% |
Close Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
업 | 603 | 9.1% |
제 | 449 | 6.7% |
조 | 346 | 5.2% |
리 | 227 | 3.4% |
기 | 226 | 3.4% |
물 | 213 | 3.2% |
및 | 204 | 3.1% |
자 | 167 | 2.5% |
품 | 152 | 2.3% |
스 | 146 | 2.2% |
Other values (231) | 3919 |
Other Punctuation
Value | Count | Frequency (%) |
, | 35 | |
· | 3 | 7.7% |
? | 1 | 2.6% |
Space Separator
Value | Count | Frequency (%) |
1499 |
Decimal Number
Value | Count | Frequency (%) |
1 | 3 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6652 | |
Common | 1545 | 18.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
업 | 603 | 9.1% |
제 | 449 | 6.7% |
조 | 346 | 5.2% |
리 | 227 | 3.4% |
기 | 226 | 3.4% |
물 | 213 | 3.2% |
및 | 204 | 3.1% |
자 | 167 | 2.5% |
품 | 152 | 2.3% |
스 | 146 | 2.2% |
Other values (231) | 3919 |
Common
Value | Count | Frequency (%) |
1499 | ||
, | 35 | 2.3% |
1 | 3 | 0.2% |
· | 3 | 0.2% |
( | 2 | 0.1% |
) | 2 | 0.1% |
? | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6637 | |
ASCII | 1542 | 18.8% |
Compat Jamo | 15 | 0.2% |
None | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1499 | ||
, | 35 | 2.3% |
1 | 3 | 0.2% |
( | 2 | 0.1% |
) | 2 | 0.1% |
? | 1 | 0.1% |
Hangul
Value | Count | Frequency (%) |
업 | 603 | 9.1% |
제 | 449 | 6.8% |
조 | 346 | 5.2% |
리 | 227 | 3.4% |
기 | 226 | 3.4% |
물 | 213 | 3.2% |
및 | 204 | 3.1% |
자 | 167 | 2.5% |
품 | 152 | 2.3% |
스 | 146 | 2.2% |
Other values (230) | 3904 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 15 |
None
Value | Count | Frequency (%) |
· | 3 |
종별
Categorical
IMBALANCE
 
Distinct | 8 |
---|---|
Distinct (%) | 1.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 5.5 KiB |
5종 | |
---|---|
4종 | |
2종 | 11 |
3종 | 10 |
1종 | 5 |
Other values (3) | 6 |
Length
Max length | 5 |
---|---|
Median length | 2 |
Mean length | 2.0262009 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 1종 |
---|---|
2nd row | 3종 |
3rd row | 1종 |
4th row | 1종 |
5th row | 1종 |
Common Values
Value | Count | Frequency (%) |
5종 | 453 | |
4종 | 202 | |
2종 | 11 | 1.6% |
3종 | 10 | 1.5% |
1종 | 5 | 0.7% |
5종(허) | 3 | 0.4% |
4종(허) | 2 | 0.3% |
3종(허) | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
5종 | 453 | |
4종 | 202 | |
2종 | 11 | 1.6% |
3종 | 10 | 1.5% |
1종 | 5 | 0.7% |
5종(허 | 3 | 0.4% |
4종(허 | 2 | 0.3% |
3종(허 | 1 | 0.1% |
연 번 | 종별 | |
---|---|---|
연 번 | 1.000 | 0.209 |
종별 | 0.209 | 1.000 |
연 번 | 종별 | |
---|---|---|
연 번 | 1.000 | 0.101 |
종별 | 0.101 | 1.000 |
연 번 | 업체명 | 소재지 | 업 종 | 종별 | |
---|---|---|---|---|---|
0 | 1 | ㈜유니온 | 충청북도 청주시 상당구 가덕면 상장인차로 27 | 석회 및 플라스터 제조업 | 1종 |
1 | 2 | 삼화제지㈜ | 충청북도 청주시 흥덕구 옥산면 오산가좌로 415-14 | 종이제품제조 | 3종 |
2 | 3 | 깨끗한나라㈜ | 충청북도 청주시 흥덕구 강내면 태성1길 64 | 종이제품제조 | 1종 |
3 | 4 | 대한제지㈜ | 충청북도 청주시 흥덕구 오송읍 상정쌍청로 256 | 종이제품제조 | 1종 |
4 | 5 | 나투라페이퍼(주) | 충청북도 청주시 흥덕구 오송읍 상정쌍청로 171 | 종이제품제조 | 1종 |
5 | 6 | ㈜팜스토리한냉 | 충청북도 청주시 청원구 오창읍 성재2길 21 | 육지동물가공처리 | 4종 |
6 | 7 | 대진산업㈜ | 충청북도 청주시 흥덕구 강내면 황탄리길 169 | 도장및피막처리업 | 2종 |
7 | 8 | ㈜금진 | 충청북도 청주시 흥덕구 옥산면 환희길 337 | 벽지 및 장판제조업 | 2종 |
8 | 9 | 영보화학㈜ | 충청북도 청주시 흥덕구 강내면 서부로 230-23 | 플라스틱 발포 성형제품제조업 | 2종 |
9 | 10 | (주)청주석회 | 충청북도 청주시 상당구 가덕면 금거리 281-7 | 비금속광물 분쇄물 생산업 | 4종 |
연 번 | 업체명 | 소재지 | 업 종 | 종별 | |
---|---|---|---|---|---|
677 | 678 | (주)유라코퍼레이션 | 충청북도 청주시 흥덕구 오송읍 연제리 388-10 | 자동차부품 제조업 | 5종 |
678 | 679 | 롯데쇼핑(주) 아울렛청주점 | 충청북도 청주시 흥덕구 비하동 811 롯데아울렛 청주점 | 기타 대형 종합 소매업 | 4종 |
679 | 680 | (주)유한 | 충청북도 청주시 흥덕구 옥산면 수락리 356-6 | 포장용 플라스틱 성형용기 제조업 | 5종 |
680 | 681 | (주)똥광미곡처리장 | 충청북도 청주시 흥덕구 강내면 월탄리 222 | 곡물 도정업 | 4종 |
681 | 682 | (주)유니켐텍 | 충청북도 청주시 흥덕구 옥산면 환희리 27-25 27-26 | 플라스틱제품 제조업 | 5종 |
682 | 683 | 동아식품(주) | 충청북도 청주시 흥덕구 송절동 89 동아식품(주) | 육류 가공식품 도매업 | 5종 |
683 | 684 | 농협은행 주식회사(지웰시티몰2) | 충청북도 청주시 흥덕구 복대동 3381 | 금융업 | 5종 |
684 | 685 | 주식회사 아이케이엠앤에스 | 충청북도 청주시 흥덕구 옥산면 환희리 산 87 산90-2 | 비금속광물 분쇄물 생산업 | 4종 |
685 | 686 | (주)서룡개발 | 충청북도 청주시 흥덕구 옥산면 동림리 247-7 산86 산84-4 | 비금속광물 분쇄물 생산업 | 4종 |
686 | 687 | (주)창우RS | 충청북도 청주시 흥덕구 옥산면 국사리 182-2 | 폐기물 처리업 | 5종 |