Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 10000 |
Missing cells | 4608 |
Missing cells (%) | 3.5% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.1 MiB |
Average record size in memory | 113.0 B |
Variable types
Numeric | 1 |
---|---|
Categorical | 4 |
Text | 8 |
Dataset
Description | 환경정보공개시스템 업체 사업장 정보(20.10.22 기준 / 사업장명, 대표명, 전화번호, 주소, 업종, 주요 업무 등) |
---|---|
Author | 한국환경산업기술원 |
URL | https://www.data.go.kr/data/15071996/fileData.do |
업체유형 is highly overall correlated with 업체특성 and 2 other fields | High correlation |
세부업종 is highly overall correlated with 번호 and 3 other fields | High correlation |
업종 is highly overall correlated with 업체유형 and 1 other fields | High correlation |
업체특성 is highly overall correlated with 업체유형 and 1 other fields | High correlation |
번호 is highly overall correlated with 세부업종 | High correlation |
상세주소 has 1409 (14.1%) missing values | Missing |
주요업무 has 3120 (31.2%) missing values | Missing |
번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 14:03:31.796354 |
---|---|
Analysis finished | 2023-12-12 14:03:35.269337 |
Duration | 3.47 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 6459.7411 |
Minimum | 1 |
---|---|
Maximum | 12904 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 628.95 |
Q1 | 3250.75 |
median | 6455.5 |
Q3 | 9694.25 |
95-th percentile | 12275.05 |
Maximum | 12904 |
Range | 12903 |
Interquartile range (IQR) | 6443.5 |
Descriptive statistics
Standard deviation | 3726.7191 |
---|---|
Coefficient of variation (CV) | 0.57691463 |
Kurtosis | -1.1992879 |
Mean | 6459.7411 |
Median Absolute Deviation (MAD) | 3225 |
Skewness | -0.0041569003 |
Sum | 64597411 |
Variance | 13888436 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
5523 | 1 | < 0.1% |
5343 | 1 | < 0.1% |
5014 | 1 | < 0.1% |
5508 | 1 | < 0.1% |
11630 | 1 | < 0.1% |
10268 | 1 | < 0.1% |
12839 | 1 | < 0.1% |
2330 | 1 | < 0.1% |
4501 | 1 | < 0.1% |
322 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
3 | 1 | |
4 | 1 | |
5 | 1 | |
7 | 1 | |
9 | 1 | |
10 | 1 | |
11 | 1 | |
12 | 1 |
Value | Count | Frequency (%) |
12904 | 1 | |
12902 | 1 | |
12901 | 1 | |
12900 | 1 | |
12899 | 1 | |
12898 | 1 | |
12897 | 1 | |
12895 | 1 | |
12894 | 1 | |
12893 | 1 |
업체유형
Categorical
HIGH CORRELATION
 
Distinct | 7 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
공공행정 | |
---|---|
제조 | |
기타서비스 | |
기타산업 | 293 |
교육서비스 | 250 |
Other values (2) | 186 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.8075 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공공행정 |
---|---|
2nd row | 공공행정 |
3rd row | 공공행정 |
4th row | 제조 |
5th row | 기타서비스 |
Common Values
Value | Count | Frequency (%) |
공공행정 | 6086 | |
제조 | 1728 | 17.3% |
기타서비스 | 1457 | 14.6% |
기타산업 | 293 | 2.9% |
교육서비스 | 250 | 2.5% |
<NA> | 98 | 1.0% |
보건 | 88 | 0.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
공공행정 | 6086 | |
제조 | 1728 | 17.3% |
기타서비스 | 1457 | 14.6% |
기타산업 | 293 | 2.9% |
교육서비스 | 250 | 2.5% |
na | 98 | 1.0% |
보건 | 88 | 0.9% |
업체특성
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
지방자치단체 | |
---|---|
배출권할당대상업체 | |
공공기관 | |
온실가스목표관리업체 | |
지방공단 | |
Other values (7) |
Length
Max length | 10 |
---|---|
Median length | 9 |
Mean length | 6.435 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공공기관 |
---|---|
2nd row | 중앙행정기관 |
3rd row | 공공기관 |
4th row | 배출권할당대상업체 |
5th row | 배출권할당대상업체 |
Common Values
Value | Count | Frequency (%) |
지방자치단체 | 4052 | |
배출권할당대상업체 | 1990 | |
공공기관 | 1324 | 13.2% |
온실가스목표관리업체 | 886 | 8.9% |
지방공단 | 432 | 4.3% |
중앙행정기관 | 419 | 4.2% |
<NA> | 332 | 3.3% |
녹색기업 | 216 | 2.2% |
지방공사 | 205 | 2.1% |
국공립대학 | 130 | 1.3% |
Other values (2) | 14 | 0.1% |
Length
Value | Count | Frequency (%) |
지방자치단체 | 4052 | |
배출권할당대상업체 | 1990 | |
공공기관 | 1324 | 13.2% |
온실가스목표관리업체 | 886 | 8.9% |
지방공단 | 432 | 4.3% |
중앙행정기관 | 419 | 4.2% |
na | 332 | 3.3% |
녹색기업 | 216 | 2.2% |
지방공사 | 205 | 2.1% |
국공립대학 | 130 | 1.3% |
Other values (2) | 14 | 0.1% |
대표사업장명
Text
Distinct | 2054 |
---|---|
Distinct (%) | 20.5% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 29 |
---|---|
Median length | 23 |
Mean length | 7.620262 |
Min length | 2 |
Characters and Unicode
Total characters | 76195 |
---|---|
Distinct characters | 535 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 1179 ? |
---|---|
Unique (%) | 11.8% |
Sample
1st row | 한국광해관리공단 |
---|---|
2nd row | 법무부 |
3rd row | 도로교통공단 |
4th row | 대한유화(주) |
5th row | 롯데쇼핑(주) 본점(본사) |
Value | Count | Frequency (%) |
본사 | 381 | 3.0% |
부산광역시 | 142 | 1.1% |
주)이마트(본사+성수점 | 137 | 1.1% |
주식회사 | 121 | 1.0% |
서울특별시 | 121 | 1.0% |
본부 | 108 | 0.9% |
롯데쇼핑(주 | 105 | 0.8% |
본점(본사 | 105 | 0.8% |
대구광역시 | 102 | 0.8% |
삼성생명본사(서초타워 | 100 | 0.8% |
Other values (2230) | 11154 |
Most occurring characters
Value | Count | Frequency (%) |
청 | 4393 | 5.8% |
시 | 3570 | 4.7% |
주 | 3052 | 4.0% |
) | 2792 | 3.7% |
( | 2774 | 3.6% |
2578 | 3.4% | |
사 | 2213 | 2.9% |
공 | 2039 | 2.7% |
구 | 1770 | 2.3% |
본 | 1483 | 1.9% |
Other values (525) | 49531 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 66759 | |
Close Punctuation | 2792 | 3.7% |
Open Punctuation | 2774 | 3.6% |
Space Separator | 2578 | 3.4% |
Uppercase Letter | 769 | 1.0% |
Math Symbol | 137 | 0.2% |
Lowercase Letter | 135 | 0.2% |
Decimal Number | 116 | 0.2% |
Connector Punctuation | 66 | 0.1% |
Other Punctuation | 48 | 0.1% |
Other values (2) | 21 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
청 | 4393 | 6.6% |
시 | 3570 | 5.3% |
주 | 3052 | 4.6% |
사 | 2213 | 3.3% |
공 | 2039 | 3.1% |
구 | 1770 | 2.7% |
본 | 1483 | 2.2% |
한 | 1452 | 2.2% |
국 | 1407 | 2.1% |
산 | 1286 | 1.9% |
Other values (465) | 44094 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 163 | |
K | 103 | |
C | 99 | |
L | 63 | 8.2% |
G | 44 | 5.7% |
D | 38 | 4.9% |
J | 33 | 4.3% |
I | 30 | 3.9% |
N | 29 | 3.8% |
P | 24 | 3.1% |
Other values (13) | 143 |
Lowercase Letter
Value | Count | Frequency (%) |
k | 28 | |
t | 27 | |
s | 13 | |
e | 12 | |
a | 11 | 8.1% |
p | 8 | 5.9% |
m | 6 | 4.4% |
b | 6 | 4.4% |
u | 5 | 3.7% |
r | 5 | 3.7% |
Other values (7) | 14 |
Decimal Number
Value | Count | Frequency (%) |
1 | 78 | |
2 | 24 | 20.7% |
3 | 8 | 6.9% |
4 | 3 | 2.6% |
7 | 1 | 0.9% |
6 | 1 | 0.9% |
5 | 1 | 0.9% |
Other Punctuation
Value | Count | Frequency (%) |
& | 18 | |
, | 15 | |
. | 11 | |
/ | 4 | 8.3% |
Other Symbol
Value | Count | Frequency (%) |
◀ | 2 | |
▶ | 2 | |
㈜ | 1 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2792 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2774 |
Space Separator
Value | Count | Frequency (%) |
2578 |
Math Symbol
Value | Count | Frequency (%) |
+ | 137 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 66 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 16 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 66760 | |
Common | 8531 | 11.2% |
Latin | 904 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
청 | 4393 | 6.6% |
시 | 3570 | 5.3% |
주 | 3052 | 4.6% |
사 | 2213 | 3.3% |
공 | 2039 | 3.1% |
구 | 1770 | 2.7% |
본 | 1483 | 2.2% |
한 | 1452 | 2.2% |
국 | 1407 | 2.1% |
산 | 1286 | 1.9% |
Other values (466) | 44095 |
Latin
Value | Count | Frequency (%) |
S | 163 | |
K | 103 | 11.4% |
C | 99 | 11.0% |
L | 63 | 7.0% |
G | 44 | 4.9% |
D | 38 | 4.2% |
J | 33 | 3.7% |
I | 30 | 3.3% |
N | 29 | 3.2% |
k | 28 | 3.1% |
Other values (30) | 274 |
Common
Value | Count | Frequency (%) |
) | 2792 | |
( | 2774 | |
2578 | ||
+ | 137 | 1.6% |
1 | 78 | 0.9% |
_ | 66 | 0.8% |
2 | 24 | 0.3% |
& | 18 | 0.2% |
- | 16 | 0.2% |
, | 15 | 0.2% |
Other values (9) | 33 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 66759 | |
ASCII | 9431 | 12.4% |
Geometric Shapes | 4 | < 0.1% |
None | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
청 | 4393 | 6.6% |
시 | 3570 | 5.3% |
주 | 3052 | 4.6% |
사 | 2213 | 3.3% |
공 | 2039 | 3.1% |
구 | 1770 | 2.7% |
본 | 1483 | 2.2% |
한 | 1452 | 2.2% |
국 | 1407 | 2.1% |
산 | 1286 | 1.9% |
Other values (465) | 44094 |
ASCII
Value | Count | Frequency (%) |
) | 2792 | |
( | 2774 | |
2578 | ||
S | 163 | 1.7% |
+ | 137 | 1.5% |
K | 103 | 1.1% |
C | 99 | 1.0% |
1 | 78 | 0.8% |
_ | 66 | 0.7% |
L | 63 | 0.7% |
Other values (47) | 578 | 6.1% |
Geometric Shapes
Value | Count | Frequency (%) |
◀ | 2 | |
▶ | 2 |
None
Value | Count | Frequency (%) |
㈜ | 1 |
사업장명
Text
Distinct | 9534 |
---|---|
Distinct (%) | 95.4% |
Missing | 2 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 29 |
---|---|
Median length | 23 |
Mean length | 9.8257652 |
Min length | 2 |
Characters and Unicode
Total characters | 98238 |
---|---|
Distinct characters | 678 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 9291 ? |
---|---|
Unique (%) | 92.9% |
Sample
1st row | 한국광해관리공단 충청지사 |
---|---|
2nd row | 청주출입국·외국인사무소 |
3rd row | 강원교통방송 |
4th row | 대한유화(주) |
5th row | 롯데쇼핑(주)안양점 |
Value | Count | Frequency (%) |
주)이마트 | 135 | 0.9% |
주민센터 | 129 | 0.9% |
본사 | 89 | 0.6% |
농업기술센터 | 84 | 0.6% |
보건소 | 83 | 0.6% |
주식회사 | 75 | 0.5% |
홈플러스 | 75 | 0.5% |
한국산업은행 | 59 | 0.4% |
롯데마트 | 55 | 0.4% |
행정복지센터 | 55 | 0.4% |
Other values (9092) | 13595 |
Most occurring characters
Value | Count | Frequency (%) |
4443 | 4.5% | |
주 | 3673 | 3.7% |
사 | 3159 | 3.2% |
공 | 2247 | 2.3% |
) | 2187 | 2.2% |
( | 2182 | 2.2% |
소 | 2137 | 2.2% |
동 | 2053 | 2.1% |
시 | 1805 | 1.8% |
지 | 1794 | 1.8% |
Other values (668) | 72558 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 86164 | |
Space Separator | 4443 | 4.5% |
Close Punctuation | 2189 | 2.2% |
Open Punctuation | 2184 | 2.2% |
Decimal Number | 1195 | 1.2% |
Uppercase Letter | 1092 | 1.1% |
Connector Punctuation | 596 | 0.6% |
Lowercase Letter | 135 | 0.1% |
Dash Punctuation | 134 | 0.1% |
Other Punctuation | 95 | 0.1% |
Other values (2) | 11 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 3673 | 4.3% |
사 | 3159 | 3.7% |
공 | 2247 | 2.6% |
소 | 2137 | 2.5% |
동 | 2053 | 2.4% |
시 | 1805 | 2.1% |
지 | 1794 | 2.1% |
산 | 1753 | 2.0% |
터 | 1650 | 1.9% |
센 | 1625 | 1.9% |
Other values (599) | 64268 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 166 | |
C | 138 | |
K | 112 | |
L | 83 | 7.6% |
T | 68 | 6.2% |
D | 54 | 4.9% |
G | 54 | 4.9% |
I | 53 | 4.9% |
N | 48 | 4.4% |
P | 43 | 3.9% |
Other values (15) | 273 |
Lowercase Letter
Value | Count | Frequency (%) |
k | 25 | |
t | 25 | |
a | 12 | |
s | 9 | 6.7% |
o | 8 | 5.9% |
e | 8 | 5.9% |
u | 7 | 5.2% |
g | 6 | 4.4% |
p | 6 | 4.4% |
b | 5 | 3.7% |
Other values (8) | 24 |
Decimal Number
Value | Count | Frequency (%) |
2 | 402 | |
1 | 373 | |
3 | 177 | |
4 | 88 | 7.4% |
0 | 56 | 4.7% |
5 | 43 | 3.6% |
6 | 28 | 2.3% |
9 | 11 | 0.9% |
7 | 11 | 0.9% |
8 | 6 | 0.5% |
Other Punctuation
Value | Count | Frequency (%) |
. | 33 | |
& | 27 | |
, | 19 | |
· | 11 | 11.6% |
/ | 5 | 5.3% |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 6 | |
◀ | 2 | 20.0% |
▶ | 2 | 20.0% |
Close Punctuation
Value | Count | Frequency (%) |
) | 2187 | |
] | 2 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 2182 | |
[ | 2 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
4443 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 596 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 134 |
Math Symbol
Value | Count | Frequency (%) |
+ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 86170 | |
Common | 10841 | 11.0% |
Latin | 1227 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 3673 | 4.3% |
사 | 3159 | 3.7% |
공 | 2247 | 2.6% |
소 | 2137 | 2.5% |
동 | 2053 | 2.4% |
시 | 1805 | 2.1% |
지 | 1794 | 2.1% |
산 | 1753 | 2.0% |
터 | 1650 | 1.9% |
센 | 1625 | 1.9% |
Other values (600) | 64274 |
Latin
Value | Count | Frequency (%) |
S | 166 | |
C | 138 | 11.2% |
K | 112 | 9.1% |
L | 83 | 6.8% |
T | 68 | 5.5% |
D | 54 | 4.4% |
G | 54 | 4.4% |
I | 53 | 4.3% |
N | 48 | 3.9% |
P | 43 | 3.5% |
Other values (33) | 408 |
Common
Value | Count | Frequency (%) |
4443 | ||
) | 2187 | |
( | 2182 | |
_ | 596 | 5.5% |
2 | 402 | 3.7% |
1 | 373 | 3.4% |
3 | 177 | 1.6% |
- | 134 | 1.2% |
4 | 88 | 0.8% |
0 | 56 | 0.5% |
Other values (15) | 203 | 1.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 86160 | |
ASCII | 12053 | 12.3% |
None | 17 | < 0.1% |
Compat Jamo | 4 | < 0.1% |
Geometric Shapes | 4 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4443 | ||
) | 2187 | |
( | 2182 | |
_ | 596 | 4.9% |
2 | 402 | 3.3% |
1 | 373 | 3.1% |
3 | 177 | 1.5% |
S | 166 | 1.4% |
C | 138 | 1.1% |
- | 134 | 1.1% |
Other values (55) | 1255 | 10.4% |
Hangul
Value | Count | Frequency (%) |
주 | 3673 | 4.3% |
사 | 3159 | 3.7% |
공 | 2247 | 2.6% |
소 | 2137 | 2.5% |
동 | 2053 | 2.4% |
시 | 1805 | 2.1% |
지 | 1794 | 2.1% |
산 | 1753 | 2.0% |
터 | 1650 | 1.9% |
센 | 1625 | 1.9% |
Other values (598) | 64264 |
None
Value | Count | Frequency (%) |
· | 11 | |
㈜ | 6 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 4 |
Geometric Shapes
Value | Count | Frequency (%) |
◀ | 2 | |
▶ | 2 |
업체 대표명
Text
Distinct | 5407 |
---|---|
Distinct (%) | 54.2% |
Missing | 20 |
Missing (%) | 0.2% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
동장 | 141 | 1.3% |
강희석 | 113 | 1.1% |
임일순 | 96 | 0.9% |
김창수 | 93 | 0.9% |
소장 | 91 | 0.9% |
대표이사 | 76 | 0.7% |
면장 | 70 | 0.7% |
성낙인 | 58 | 0.6% |
이원준 | 50 | 0.5% |
이상철 | 46 | 0.4% |
Other values (5482) | 9648 |
Most occurring characters
Value | Count | Frequency (%) |
장 | 2329 | 6.4% |
김 | 1697 | 4.7% |
이 | 1360 | 3.7% |
동 | 918 | 2.5% |
수 | 694 | 1.9% |
정 | 683 | 1.9% |
영 | 637 | 1.8% |
박 | 622 | 1.7% |
성 | 556 | 1.5% |
석 | 515 | 1.4% |
Other values (466) | 26385 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 34945 | |
Space Separator | 509 | 1.4% |
Other Punctuation | 353 | 1.0% |
Decimal Number | 274 | 0.8% |
Uppercase Letter | 143 | 0.4% |
Close Punctuation | 79 | 0.2% |
Open Punctuation | 79 | 0.2% |
Lowercase Letter | 10 | < 0.1% |
Dash Punctuation | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 2329 | 6.7% |
김 | 1697 | 4.9% |
이 | 1360 | 3.9% |
동 | 918 | 2.6% |
수 | 694 | 2.0% |
정 | 683 | 2.0% |
영 | 637 | 1.8% |
박 | 622 | 1.8% |
성 | 556 | 1.6% |
석 | 515 | 1.5% |
Other values (422) | 24934 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 14 | 9.8% |
N | 12 | 8.4% |
I | 12 | 8.4% |
O | 11 | 7.7% |
L | 10 | 7.0% |
C | 10 | 7.0% |
E | 10 | 7.0% |
G | 9 | 6.3% |
R | 9 | 6.3% |
S | 8 | 5.6% |
Other values (11) | 38 |
Decimal Number
Value | Count | Frequency (%) |
2 | 99 | |
1 | 91 | |
3 | 41 | |
4 | 17 | 6.2% |
5 | 8 | 2.9% |
6 | 7 | 2.6% |
0 | 5 | 1.8% |
9 | 3 | 1.1% |
7 | 2 | 0.7% |
8 | 1 | 0.4% |
Lowercase Letter
Value | Count | Frequency (%) |
h | 2 | |
d | 2 | |
z | 2 | |
t | 1 | |
g | 1 | |
w | 1 | |
j | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 347 | |
. | 6 | 1.7% |
Space Separator
Value | Count | Frequency (%) |
509 |
Close Punctuation
Value | Count | Frequency (%) |
) | 79 |
Open Punctuation
Value | Count | Frequency (%) |
( | 79 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 34931 | |
Common | 1298 | 3.6% |
Latin | 153 | 0.4% |
Han | 14 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 2329 | 6.7% |
김 | 1697 | 4.9% |
이 | 1360 | 3.9% |
동 | 918 | 2.6% |
수 | 694 | 2.0% |
정 | 683 | 2.0% |
영 | 637 | 1.8% |
박 | 622 | 1.8% |
성 | 556 | 1.6% |
석 | 515 | 1.5% |
Other values (421) | 24920 |
Latin
Value | Count | Frequency (%) |
A | 14 | 9.2% |
N | 12 | 7.8% |
I | 12 | 7.8% |
O | 11 | 7.2% |
L | 10 | 6.5% |
C | 10 | 6.5% |
E | 10 | 6.5% |
G | 9 | 5.9% |
R | 9 | 5.9% |
S | 8 | 5.2% |
Other values (18) | 48 |
Common
Value | Count | Frequency (%) |
509 | ||
, | 347 | |
2 | 99 | 7.6% |
1 | 91 | 7.0% |
) | 79 | 6.1% |
( | 79 | 6.1% |
3 | 41 | 3.2% |
4 | 17 | 1.3% |
5 | 8 | 0.6% |
6 | 7 | 0.5% |
Other values (6) | 21 | 1.6% |
Han
Value | Count | Frequency (%) |
外 | 14 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 34931 | |
ASCII | 1451 | 4.0% |
CJK | 14 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
장 | 2329 | 6.7% |
김 | 1697 | 4.9% |
이 | 1360 | 3.9% |
동 | 918 | 2.6% |
수 | 694 | 2.0% |
정 | 683 | 2.0% |
영 | 637 | 1.8% |
박 | 622 | 1.8% |
성 | 556 | 1.6% |
석 | 515 | 1.5% |
Other values (421) | 24920 |
ASCII
Value | Count | Frequency (%) |
509 | ||
, | 347 | |
2 | 99 | 6.8% |
1 | 91 | 6.3% |
) | 79 | 5.4% |
( | 79 | 5.4% |
3 | 41 | 2.8% |
4 | 17 | 1.2% |
A | 14 | 1.0% |
N | 12 | 0.8% |
Other values (34) | 163 | 11.2% |
CJK
Value | Count | Frequency (%) |
外 | 14 |
사업자등록번호
Text
Distinct | 6154 |
---|---|
Distinct (%) | 61.9% |
Missing | 55 |
Missing (%) | 0.5% |
Memory size | 156.2 KiB |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 12 |
Min length | 12 |
Characters and Unicode
Total characters | 119340 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 5351 ? |
---|---|
Unique (%) | 53.8% |
Sample
1st row | 305-82-14803 |
---|---|
2nd row | 315-83-02636 |
3rd row | 203-82-32086 |
4th row | 104-81-06794 |
5th row | 123-85-27798 |
Value | Count | Frequency (%) |
206-86-50913 | 137 | 1.4% |
220-81-60348 | 77 | 0.8% |
120-82-00052 | 62 | 0.6% |
220-81-39938 | 47 | 0.5% |
418-83-00034 | 42 | 0.4% |
119-82-08433 | 40 | 0.4% |
125-83-01960 | 37 | 0.4% |
203-82-32086 | 37 | 0.4% |
128-83-00937 | 35 | 0.4% |
403-83-00013 | 34 | 0.3% |
Other values (6144) | 9397 |
Most occurring characters
Value | Count | Frequency (%) |
- | 19890 | |
0 | 18959 | |
1 | 15105 | |
8 | 14102 | |
3 | 12054 | |
2 | 11326 | |
6 | 6588 | 5.5% |
5 | 6579 | 5.5% |
4 | 6433 | 5.4% |
7 | 4308 | 3.6% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 99450 | |
Dash Punctuation | 19890 | 16.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 18959 | |
1 | 15105 | |
8 | 14102 | |
3 | 12054 | |
2 | 11326 | |
6 | 6588 | 6.6% |
5 | 6579 | 6.6% |
4 | 6433 | 6.5% |
7 | 4308 | 4.3% |
9 | 3996 | 4.0% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 19890 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 119340 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 19890 | |
0 | 18959 | |
1 | 15105 | |
8 | 14102 | |
3 | 12054 | |
2 | 11326 | |
6 | 6588 | 5.5% |
5 | 6579 | 5.5% |
4 | 6433 | 5.4% |
7 | 4308 | 3.6% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 119340 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 19890 | |
0 | 18959 | |
1 | 15105 | |
8 | 14102 | |
3 | 12054 | |
2 | 11326 | |
6 | 6588 | 5.5% |
5 | 6579 | 5.5% |
4 | 6433 | 5.4% |
7 | 4308 | 3.6% |
대표팩스번호
Text
Distinct | 6137 |
---|---|
Distinct (%) | 61.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 14 |
---|---|
Median length | 12 |
Mean length | 11.6179 |
Min length | 10 |
Characters and Unicode
Total characters | 116179 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 5624 ? |
---|---|
Unique (%) | 56.2% |
Sample
1st row | 042-627-6209 |
---|---|
2nd row | 043-236-4907 |
3rd row | 00-000-000 |
4th row | 02-2122-1459 |
5th row | 02-2118-2280 |
Value | Count | Frequency (%) |
00-000-000 | 1738 | 17.4% |
02-3709-5221 | 99 | 1.0% |
02-3459-8160 | 95 | 0.9% |
02-2145-8587 | 45 | 0.4% |
063-281-2613 | 36 | 0.4% |
054-840-6189 | 31 | 0.3% |
054-760-7415 | 31 | 0.3% |
061-339-2825 | 30 | 0.3% |
02-2118-2280 | 29 | 0.3% |
02-509-2239 | 27 | 0.3% |
Other values (6127) | 7839 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 29651 | |
- | 20000 | |
3 | 9488 | 8.2% |
2 | 9302 | 8.0% |
5 | 8648 | 7.4% |
1 | 7490 | 6.4% |
6 | 7104 | 6.1% |
4 | 7092 | 6.1% |
9 | 6576 | 5.7% |
8 | 5531 | 4.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 96179 | |
Dash Punctuation | 20000 | 17.2% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 29651 | |
3 | 9488 | 9.9% |
2 | 9302 | 9.7% |
5 | 8648 | 9.0% |
1 | 7490 | 7.8% |
6 | 7104 | 7.4% |
4 | 7092 | 7.4% |
9 | 6576 | 6.8% |
8 | 5531 | 5.8% |
7 | 5297 | 5.5% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 20000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 116179 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 29651 | |
- | 20000 | |
3 | 9488 | 8.2% |
2 | 9302 | 8.0% |
5 | 8648 | 7.4% |
1 | 7490 | 6.4% |
6 | 7104 | 6.1% |
4 | 7092 | 6.1% |
9 | 6576 | 5.7% |
8 | 5531 | 4.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 116179 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 29651 | |
- | 20000 | |
3 | 9488 | 8.2% |
2 | 9302 | 8.0% |
5 | 8648 | 7.4% |
1 | 7490 | 6.4% |
6 | 7104 | 6.1% |
4 | 7092 | 6.1% |
9 | 6576 | 5.7% |
8 | 5531 | 4.8% |
주소
Text
Distinct | 8830 |
---|---|
Distinct (%) | 88.3% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 56 |
---|---|
Median length | 39 |
Mean length | 19.270427 |
Min length | 3 |
Characters and Unicode
Total characters | 192685 |
---|---|
Distinct characters | 571 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 8123 ? |
---|---|
Unique (%) | 81.2% |
Sample
1st row | 대전광역시 대덕구 한밭대로 1027 |
---|---|
2nd row | 충청북도 청주시 흥덕구 비하로12번길 52 |
3rd row | 강원도 원주시 동부순환로 183 |
4th row | 서울특별시 종로구 자하문로 77 |
5th row | 경기도 안양시 만안구 만안로 244 |
Value | Count | Frequency (%) |
경기도 | 1488 | 3.3% |
서울특별시 | 1446 | 3.2% |
경상남도 | 734 | 1.6% |
경상북도 | 719 | 1.6% |
전라남도 | 571 | 1.3% |
전라북도 | 545 | 1.2% |
부산광역시 | 540 | 1.2% |
충청남도 | 529 | 1.2% |
강원도 | 501 | 1.1% |
충청북도 | 466 | 1.0% |
Other values (10065) | 37489 |
Most occurring characters
Value | Count | Frequency (%) |
35068 | 18.2% | |
시 | 8704 | 4.5% |
로 | 8081 | 4.2% |
1 | 6322 | 3.3% |
도 | 6139 | 3.2% |
구 | 5843 | 3.0% |
2 | 4342 | 2.3% |
3 | 3360 | 1.7% |
경 | 3358 | 1.7% |
남 | 3323 | 1.7% |
Other values (561) | 108145 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 124820 | |
Space Separator | 35068 | 18.2% |
Decimal Number | 31064 | 16.1% |
Dash Punctuation | 1334 | 0.7% |
Open Punctuation | 165 | 0.1% |
Close Punctuation | 165 | 0.1% |
Uppercase Letter | 48 | < 0.1% |
Other Punctuation | 20 | < 0.1% |
Lowercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 8704 | 7.0% |
로 | 8081 | 6.5% |
도 | 6139 | 4.9% |
구 | 5843 | 4.7% |
경 | 3358 | 2.7% |
남 | 3323 | 2.7% |
산 | 3287 | 2.6% |
광 | 2974 | 2.4% |
동 | 2959 | 2.4% |
서 | 2916 | 2.3% |
Other values (526) | 77236 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 9 | |
G | 7 | |
C | 7 | |
A | 4 | |
D | 3 | 6.2% |
P | 3 | 6.2% |
E | 3 | 6.2% |
J | 2 | 4.2% |
K | 2 | 4.2% |
B | 2 | 4.2% |
Other values (6) | 6 |
Decimal Number
Value | Count | Frequency (%) |
1 | 6322 | |
2 | 4342 | |
3 | 3360 | |
5 | 2903 | |
4 | 2690 | |
0 | 2567 | |
6 | 2443 | 7.9% |
7 | 2376 | 7.6% |
8 | 2090 | 6.7% |
9 | 1971 | 6.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 8 | |
· | 6 | |
. | 5 | |
' | 1 | 5.0% |
Space Separator
Value | Count | Frequency (%) |
35068 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1334 |
Open Punctuation
Value | Count | Frequency (%) |
( | 165 |
Close Punctuation
Value | Count | Frequency (%) |
) | 165 |
Lowercase Letter
Value | Count | Frequency (%) |
l | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 124820 | |
Common | 67816 | |
Latin | 49 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 8704 | 7.0% |
로 | 8081 | 6.5% |
도 | 6139 | 4.9% |
구 | 5843 | 4.7% |
경 | 3358 | 2.7% |
남 | 3323 | 2.7% |
산 | 3287 | 2.6% |
광 | 2974 | 2.4% |
동 | 2959 | 2.4% |
서 | 2916 | 2.3% |
Other values (526) | 77236 |
Common
Value | Count | Frequency (%) |
35068 | ||
1 | 6322 | 9.3% |
2 | 4342 | 6.4% |
3 | 3360 | 5.0% |
5 | 2903 | 4.3% |
4 | 2690 | 4.0% |
0 | 2567 | 3.8% |
6 | 2443 | 3.6% |
7 | 2376 | 3.5% |
8 | 2090 | 3.1% |
Other values (8) | 3655 | 5.4% |
Latin
Value | Count | Frequency (%) |
L | 9 | |
G | 7 | |
C | 7 | |
A | 4 | |
D | 3 | 6.1% |
P | 3 | 6.1% |
E | 3 | 6.1% |
J | 2 | 4.1% |
K | 2 | 4.1% |
B | 2 | 4.1% |
Other values (7) | 7 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 124820 | |
ASCII | 67859 | |
None | 6 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
35068 | ||
1 | 6322 | 9.3% |
2 | 4342 | 6.4% |
3 | 3360 | 5.0% |
5 | 2903 | 4.3% |
4 | 2690 | 4.0% |
0 | 2567 | 3.8% |
6 | 2443 | 3.6% |
7 | 2376 | 3.5% |
8 | 2090 | 3.1% |
Other values (24) | 3698 | 5.4% |
Hangul
Value | Count | Frequency (%) |
시 | 8704 | 7.0% |
로 | 8081 | 6.5% |
도 | 6139 | 4.9% |
구 | 5843 | 4.7% |
경 | 3358 | 2.7% |
남 | 3323 | 2.7% |
산 | 3287 | 2.6% |
광 | 2974 | 2.4% |
동 | 2959 | 2.4% |
서 | 2916 | 2.3% |
Other values (526) | 77236 |
None
Value | Count | Frequency (%) |
· | 6 |
상세주소
Text
MISSING
 
Distinct | 7513 |
---|---|
Distinct (%) | 87.5% |
Missing | 1409 |
Missing (%) | 14.1% |
Memory size | 156.2 KiB |
Length
Max length | 48 |
---|---|
Median length | 41 |
Mean length | 8.7424048 |
Min length | 1 |
Characters and Unicode
Total characters | 75106 |
---|---|
Distinct characters | 672 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 7033 ? |
---|---|
Unique (%) | 81.9% |
Sample
1st row | 우성빌딩 6층 한국광해관리공단 충청지사 |
---|---|
2nd row | 법무부 청주출입국·외국인사무소 |
3rd row | 원주시 동부순환로 183 한국교통방송 강원본부 |
4th row | 유남빌딩 대한유화공업(주) |
5th row | 독산도서관 |
Value | Count | Frequency (%) |
주민센터 | 141 | 1.1% |
이마트 | 127 | 1.0% |
2층 | 92 | 0.7% |
홈플러스 | 77 | 0.6% |
3층 | 76 | 0.6% |
행정복지센터 | 66 | 0.5% |
4층 | 64 | 0.5% |
56 | 0.4% | |
5층 | 54 | 0.4% |
서울대학교 | 51 | 0.4% |
Other values (8323) | 12253 |
Most occurring characters
Value | Count | Frequency (%) |
4480 | 6.0% | |
동 | 1962 | 2.6% |
주 | 1923 | 2.6% |
사 | 1850 | 2.5% |
1 | 1390 | 1.9% |
공 | 1333 | 1.8% |
소 | 1322 | 1.8% |
터 | 1285 | 1.7% |
센 | 1267 | 1.7% |
) | 1265 | 1.7% |
Other values (662) | 57029 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 60071 | |
Decimal Number | 6043 | 8.0% |
Space Separator | 4480 | 6.0% |
Close Punctuation | 1265 | 1.7% |
Open Punctuation | 1262 | 1.7% |
Uppercase Letter | 1153 | 1.5% |
Dash Punctuation | 387 | 0.5% |
Other Punctuation | 267 | 0.4% |
Lowercase Letter | 151 | 0.2% |
Math Symbol | 21 | < 0.1% |
Other values (2) | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 1962 | 3.3% |
주 | 1923 | 3.2% |
사 | 1850 | 3.1% |
공 | 1333 | 2.2% |
소 | 1322 | 2.2% |
터 | 1285 | 2.1% |
센 | 1267 | 2.1% |
지 | 1231 | 2.0% |
산 | 1062 | 1.8% |
원 | 1006 | 1.7% |
Other values (587) | 45830 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 152 | |
L | 135 | |
G | 114 | |
C | 108 | 9.4% |
K | 102 | 8.8% |
T | 73 | 6.3% |
D | 55 | 4.8% |
I | 50 | 4.3% |
E | 49 | 4.2% |
B | 43 | 3.7% |
Other values (15) | 272 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 24 | |
t | 18 | |
s | 13 | 8.6% |
k | 13 | 8.6% |
n | 12 | 7.9% |
e | 10 | 6.6% |
r | 7 | 4.6% |
i | 7 | 4.6% |
m | 5 | 3.3% |
o | 5 | 3.3% |
Other values (14) | 37 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1390 | |
2 | 940 | |
3 | 698 | |
4 | 533 | 8.8% |
0 | 514 | 8.5% |
5 | 511 | 8.5% |
6 | 462 | 7.6% |
7 | 361 | 6.0% |
8 | 344 | 5.7% |
9 | 290 | 4.8% |
Other Punctuation
Value | Count | Frequency (%) |
, | 166 | |
. | 67 | |
& | 17 | 6.4% |
/ | 9 | 3.4% |
· | 7 | 2.6% |
& | 1 | 0.4% |
Math Symbol
Value | Count | Frequency (%) |
~ | 18 | |
+ | 2 | 9.5% |
∼ | 1 | 4.8% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1261 | |
[ | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
4480 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1265 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 387 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 3 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 60069 | |
Common | 13728 | 18.3% |
Latin | 1304 | 1.7% |
Han | 5 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 1962 | 3.3% |
주 | 1923 | 3.2% |
사 | 1850 | 3.1% |
공 | 1333 | 2.2% |
소 | 1322 | 2.2% |
터 | 1285 | 2.1% |
센 | 1267 | 2.1% |
지 | 1231 | 2.0% |
산 | 1062 | 1.8% |
원 | 1006 | 1.7% |
Other values (586) | 45828 |
Latin
Value | Count | Frequency (%) |
S | 152 | 11.7% |
L | 135 | 10.4% |
G | 114 | 8.7% |
C | 108 | 8.3% |
K | 102 | 7.8% |
T | 73 | 5.6% |
D | 55 | 4.2% |
I | 50 | 3.8% |
E | 49 | 3.8% |
B | 43 | 3.3% |
Other values (39) | 423 |
Common
Value | Count | Frequency (%) |
4480 | ||
1 | 1390 | 10.1% |
) | 1265 | 9.2% |
( | 1261 | 9.2% |
2 | 940 | 6.8% |
3 | 698 | 5.1% |
4 | 533 | 3.9% |
0 | 514 | 3.7% |
5 | 511 | 3.7% |
6 | 462 | 3.4% |
Other values (15) | 1674 | 12.2% |
Han
Value | Count | Frequency (%) |
內 | 4 | |
舊 | 1 | 20.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 60064 | |
ASCII | 15023 | 20.0% |
None | 11 | < 0.1% |
CJK | 5 | < 0.1% |
Compat Jamo | 2 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4480 | ||
1 | 1390 | 9.3% |
) | 1265 | 8.4% |
( | 1261 | 8.4% |
2 | 940 | 6.3% |
3 | 698 | 4.6% |
4 | 533 | 3.5% |
0 | 514 | 3.4% |
5 | 511 | 3.4% |
6 | 462 | 3.1% |
Other values (61) | 2969 |
Hangul
Value | Count | Frequency (%) |
동 | 1962 | 3.3% |
주 | 1923 | 3.2% |
사 | 1850 | 3.1% |
공 | 1333 | 2.2% |
소 | 1322 | 2.2% |
터 | 1285 | 2.1% |
센 | 1267 | 2.1% |
지 | 1231 | 2.0% |
산 | 1062 | 1.8% |
원 | 1006 | 1.7% |
Other values (584) | 45823 |
None
Value | Count | Frequency (%) |
· | 7 | |
㈜ | 3 | |
& | 1 | 9.1% |
CJK
Value | Count | Frequency (%) |
內 | 4 | |
舊 | 1 | 20.0% |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 2 |
Math Operators
Value | Count | Frequency (%) |
∼ | 1 |
업종
Categorical
HIGH CORRELATION
 
Distinct | 20 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
공공행정, 국방 및 사회보장 행정 | |
---|---|
제조업 | |
도매 및 소매업 | 456 |
전기, 가스, 증기 및 수도사업 | 355 |
보건업 및 사회복지 서비스업 | 355 |
Other values (15) |
Length
Max length | 24 |
---|---|
Median length | 23 |
Mean length | 13.8059 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공공행정, 국방 및 사회보장 행정 |
---|---|
2nd row | 공공행정, 국방 및 사회보장 행정 |
3rd row | 출판, 영상, 방송통신 및 정보서비스업 |
4th row | 제조업 |
5th row | 도매 및 소매업 |
Common Values
Value | Count | Frequency (%) |
공공행정, 국방 및 사회보장 행정 | 4651 | |
제조업 | 1657 | 16.6% |
도매 및 소매업 | 456 | 4.6% |
전기, 가스, 증기 및 수도사업 | 355 | 3.5% |
보건업 및 사회복지 서비스업 | 355 | 3.5% |
교육 서비스업 | 349 | 3.5% |
예술, 스포츠 및 여가관련 서비스업 | 334 | 3.3% |
사업시설관리 및 사업지원 서비스업 | 313 | 3.1% |
금융 및 보험업 | 296 | 3.0% |
하수·폐기물 처리, 원료재생 및 환경복원업 | 284 | 2.8% |
Other values (10) | 950 | 9.5% |
Length
Value | Count | Frequency (%) |
및 | 7741 | |
공공행정 | 4651 | |
사회보장 | 4651 | |
행정 | 4651 | |
국방 | 4651 | |
제조업 | 1657 | 4.3% |
서비스업 | 1632 | 4.2% |
도매 | 456 | 1.2% |
소매업 | 456 | 1.2% |
수도사업 | 355 | 0.9% |
Other values (40) | 7733 |
세부업종
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
<NA> | |
---|---|
공공행정, 국방 및 사회보장 행정 |
Length
Max length | 18 |
---|---|
Median length | 4 |
Mean length | 10.5114 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공공행정, 국방 및 사회보장 행정 |
---|---|
2nd row | 공공행정, 국방 및 사회보장 행정 |
3rd row | <NA> |
4th row | <NA> |
5th row | <NA> |
Common Values
Value | Count | Frequency (%) |
<NA> | 5349 | |
공공행정, 국방 및 사회보장 행정 | 4651 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 5349 | |
공공행정 | 4651 | |
국방 | 4651 | |
및 | 4651 | |
사회보장 | 4651 | |
행정 | 4651 |
주요업무
Text
MISSING
 
Distinct | 3294 |
---|---|
Distinct (%) | 47.9% |
Missing | 3120 |
Missing (%) | 31.2% |
Memory size | 156.2 KiB |
Length
Max length | 50 |
---|---|
Median length | 46 |
Mean length | 8.3023256 |
Min length | 1 |
Characters and Unicode
Total characters | 57120 |
---|---|
Distinct characters | 640 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 2670 ? |
---|---|
Unique (%) | 38.8% |
Sample
1st row | 광해방지사업, 석탄지역진흥 |
---|---|
2nd row | 외국인 체류관리, 출입국심사 |
3rd row | 교통방송 |
4th row | 석유화학 제품 제조 및 판매 |
5th row | 시설관리, 주차사업, 체육사업 |
Value | Count | Frequency (%) |
및 | 662 | 4.9% |
공공행정 | 602 | 4.4% |
등 | 405 | 3.0% |
제조 | 340 | 2.5% |
운영 | 291 | 2.1% |
관리 | 246 | 1.8% |
업무 | 196 | 1.4% |
생산 | 190 | 1.4% |
판매 | 176 | 1.3% |
제조업 | 110 | 0.8% |
Other values (3865) | 10400 |
Most occurring characters
Value | Count | Frequency (%) |
6751 | 11.8% | |
공 | 2362 | 4.1% |
업 | 1559 | 2.7% |
, | 1478 | 2.6% |
정 | 1444 | 2.5% |
관 | 1363 | 2.4% |
행 | 1292 | 2.3% |
리 | 1211 | 2.1% |
제 | 968 | 1.7% |
지 | 944 | 1.7% |
Other values (630) | 37748 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 47620 | |
Space Separator | 6751 | 11.8% |
Other Punctuation | 1730 | 3.0% |
Uppercase Letter | 407 | 0.7% |
Lowercase Letter | 213 | 0.4% |
Close Punctuation | 138 | 0.2% |
Open Punctuation | 138 | 0.2% |
Decimal Number | 107 | 0.2% |
Dash Punctuation | 12 | < 0.1% |
Math Symbol | 2 | < 0.1% |
Other values (2) | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
공 | 2362 | 5.0% |
업 | 1559 | 3.3% |
정 | 1444 | 3.0% |
관 | 1363 | 2.9% |
행 | 1292 | 2.7% |
리 | 1211 | 2.5% |
제 | 968 | 2.0% |
지 | 944 | 2.0% |
시 | 919 | 1.9% |
조 | 857 | 1.8% |
Other values (555) | 34701 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 62 | |
P | 46 | |
D | 30 | 7.4% |
T | 29 | 7.1% |
S | 26 | 6.4% |
I | 26 | 6.4% |
E | 23 | 5.7% |
L | 22 | 5.4% |
H | 21 | 5.2% |
A | 21 | 5.2% |
Other values (15) | 101 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 24 | |
a | 19 | 8.9% |
l | 18 | 8.5% |
i | 18 | 8.5% |
o | 15 | 7.0% |
r | 14 | 6.6% |
s | 14 | 6.6% |
t | 13 | 6.1% |
u | 11 | 5.2% |
c | 10 | 4.7% |
Other values (15) | 57 |
Decimal Number
Value | Count | Frequency (%) |
1 | 29 | |
8 | 28 | |
2 | 18 | |
0 | 9 | 8.4% |
4 | 6 | 5.6% |
3 | 5 | 4.7% |
6 | 5 | 4.7% |
9 | 3 | 2.8% |
7 | 3 | 2.8% |
5 | 1 | 0.9% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1478 | |
. | 129 | 7.5% |
/ | 76 | 4.4% |
* | 20 | 1.2% |
· | 12 | 0.7% |
& | 8 | 0.5% |
' | 4 | 0.2% |
: | 3 | 0.2% |
Space Separator
Value | Count | Frequency (%) |
6751 |
Close Punctuation
Value | Count | Frequency (%) |
) | 138 |
Open Punctuation
Value | Count | Frequency (%) |
( | 138 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 12 |
Math Symbol
Value | Count | Frequency (%) |
+ | 2 |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 1 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 47619 | |
Common | 8880 | 15.5% |
Latin | 620 | 1.1% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
공 | 2362 | 5.0% |
업 | 1559 | 3.3% |
정 | 1444 | 3.0% |
관 | 1363 | 2.9% |
행 | 1292 | 2.7% |
리 | 1211 | 2.5% |
제 | 968 | 2.0% |
지 | 944 | 2.0% |
시 | 919 | 1.9% |
조 | 857 | 1.8% |
Other values (554) | 34700 |
Latin
Value | Count | Frequency (%) |
C | 62 | 10.0% |
P | 46 | 7.4% |
D | 30 | 4.8% |
T | 29 | 4.7% |
S | 26 | 4.2% |
I | 26 | 4.2% |
e | 24 | 3.9% |
E | 23 | 3.7% |
L | 22 | 3.5% |
H | 21 | 3.4% |
Other values (40) | 311 |
Common
Value | Count | Frequency (%) |
6751 | ||
, | 1478 | 16.6% |
) | 138 | 1.6% |
( | 138 | 1.6% |
. | 129 | 1.5% |
/ | 76 | 0.9% |
1 | 29 | 0.3% |
8 | 28 | 0.3% |
* | 20 | 0.2% |
2 | 18 | 0.2% |
Other values (15) | 75 | 0.8% |
Han
Value | Count | Frequency (%) |
外 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 47613 | |
ASCII | 9487 | 16.6% |
None | 12 | < 0.1% |
Compat Jamo | 6 | < 0.1% |
CJK | 1 | < 0.1% |
CJK Compat | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6751 | ||
, | 1478 | 15.6% |
) | 138 | 1.5% |
( | 138 | 1.5% |
. | 129 | 1.4% |
/ | 76 | 0.8% |
C | 62 | 0.7% |
P | 46 | 0.5% |
D | 30 | 0.3% |
T | 29 | 0.3% |
Other values (63) | 610 | 6.4% |
Hangul
Value | Count | Frequency (%) |
공 | 2362 | 5.0% |
업 | 1559 | 3.3% |
정 | 1444 | 3.0% |
관 | 1363 | 2.9% |
행 | 1292 | 2.7% |
리 | 1211 | 2.5% |
제 | 968 | 2.0% |
지 | 944 | 2.0% |
시 | 919 | 1.9% |
조 | 857 | 1.8% |
Other values (552) | 34694 |
None
Value | Count | Frequency (%) |
· | 12 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 3 | |
ㅇ | 3 |
CJK
Value | Count | Frequency (%) |
外 | 1 |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 1 |
번호 | 업체유형 | 업체특성 | 업종 | |
---|---|---|---|---|
번호 | 1.000 | 0.470 | 0.596 | 0.634 |
업체유형 | 0.470 | 1.000 | 0.781 | 0.913 |
업체특성 | 0.596 | 0.781 | 1.000 | 0.792 |
업종 | 0.634 | 0.913 | 0.792 | 1.000 |
업체유형 | 세부업종 | 업종 | 업체특성 | |
---|---|---|---|---|
업체유형 | 1.000 | 1.000 | 0.726 | 0.550 |
세부업종 | 1.000 | 1.000 | 1.000 | 1.000 |
업종 | 0.726 | 1.000 | 1.000 | 0.435 |
업체특성 | 0.550 | 1.000 | 0.435 | 1.000 |
번호 | 업체유형 | 업체특성 | 업종 | 세부업종 | |
---|---|---|---|---|---|
번호 | 1.000 | 0.270 | 0.303 | 0.252 | 1.000 |
업체유형 | 0.270 | 1.000 | 0.550 | 0.726 | 1.000 |
업체특성 | 0.303 | 0.550 | 1.000 | 0.435 | 1.000 |
업종 | 0.252 | 0.726 | 0.435 | 1.000 | 1.000 |
세부업종 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
번호 | 업체유형 | 업체특성 | 대표사업장명 | 사업장명 | 업체 대표명 | 사업자등록번호 | 대표팩스번호 | 주소 | 상세주소 | 업종 | 세부업종 | 주요업무 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
5522 | 5523 | 공공행정 | 공공기관 | 한국광해관리공단 | 한국광해관리공단 충청지사 | 남광수 | 305-82-14803 | 042-627-6209 | 대전광역시 대덕구 한밭대로 1027 | 우성빌딩 6층 한국광해관리공단 충청지사 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 광해방지사업, 석탄지역진흥 |
4229 | 4230 | 공공행정 | 중앙행정기관 | 법무부 | 청주출입국·외국인사무소 | 대표자 | 315-83-02636 | 043-236-4907 | 충청북도 청주시 흥덕구 비하로12번길 52 | 법무부 청주출입국·외국인사무소 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 외국인 체류관리, 출입국심사 |
11842 | 11843 | 공공행정 | 공공기관 | 도로교통공단 | 강원교통방송 | 윤종기 | 203-82-32086 | 00-000-000 | 강원도 원주시 동부순환로 183 | 원주시 동부순환로 183 한국교통방송 강원본부 | 출판, 영상, 방송통신 및 정보서비스업 | <NA> | 교통방송 |
11224 | 11225 | 제조 | 배출권할당대상업체 | 대한유화(주) | 대한유화(주) | 정영태 | 104-81-06794 | 02-2122-1459 | 서울특별시 종로구 자하문로 77 | 유남빌딩 대한유화공업(주) | 제조업 | <NA> | 석유화학 제품 제조 및 판매 |
11720 | 11721 | 기타서비스 | 배출권할당대상업체 | 롯데쇼핑(주) 본점(본사) | 롯데쇼핑(주)안양점 | 이원준 | 123-85-27798 | 02-2118-2280 | 경기도 안양시 만안구 만안로 244 | <NA> | 도매 및 소매업 | <NA> | <NA> |
1436 | 1437 | 공공행정 | 지방공단 | 금천구시설관리공단(공단본부) | 독산도서관 | 문길수 | 119-82-03909 | 02-863-9548 | 서울특별시 금천구 독산로54길 114 | 독산도서관 | 사업시설관리 및 사업지원 서비스업 | <NA> | 시설관리, 주차사업, 체육사업 |
8157 | 8158 | 교육서비스 | 국공립대학 | 공주교육대학교 | 공주교육대학교 | 안병근 | 307-83-00490 | 041-854-1578 | 충청남도 공주시 봉황동 웅진로 27 공주교육대학교 | 봉황동 376 | 교육 서비스업 | <NA> | 교육대학교 |
9949 | 9950 | 공공행정 | 지방자치단체 | 부여군청 | 양화면사무소 | 황인덕 | 308-83-01153 | 041-830-2649 | 충청남도 부여군 양화면 입포로 53 | 5 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 공공행정서비스 |
8387 | 8388 | 공공행정 | 공공기관 | 근로복지공단 | 대구병원 | 김봉옥 | 504-82-15603 | 053-715-7722 | 대구광역시 북구 학정동 학정로 515 | 대구병원 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 산재병원 |
5303 | 5304 | 공공행정 | 지방자치단체 | 화성시청 | 진안동주민센터 | 김명숙 | 124-83-06318 | 031-369-4931 | 경기도 화성시 진안동 병점4로 34 | 진안동주민센터 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 공공행정 |
번호 | 업체유형 | 업체특성 | 대표사업장명 | 사업장명 | 업체 대표명 | 사업자등록번호 | 대표팩스번호 | 주소 | 상세주소 | 업종 | 세부업종 | 주요업무 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
6373 | 6374 | 공공행정 | 지방자치단체 | 평택시청 | 평택시청(중앙동) | 공재광 | 125-83-01960 | 031-8024-3859 | 경기도 평택시 중앙로 275 | 평택시청 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 서비스 |
3418 | 3419 | 공공행정 | 지방자치단체 | 홍천군청 | 내면 | 홍천군수 | 223-83-00023 | 033-430-2609 | 강원도 홍천군 내면 창촌로 59 | 내면사무소 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 공공행정 |
5191 | 5192 | 공공행정 | 지방자치단체 | 서대문구 | 남가좌1동주민센터 | 문석진 | 111-83-00749 | 02-330-8623 | 서울특별시 서대문구 수색로2길 48 | <NA> | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | <NA> |
10117 | 10118 | 공공행정 | 공공기관 | 한전KDN(주) | 한전KDN(주) 대전충남지역본부 | 임수경 | 116-81-32242 | 042-330-7519 | 대전광역시 대덕구 동서대로 1784 | 비래동(555-1) | 출판, 영상, 방송통신 및 정보서비스업 | <NA> | 전력IT유지보수 및 공사 |
2446 | 2447 | 제조 | 온실가스목표관리업체 | 영흥철강 창원공장 | 영흥철강 창원공장 | 한재열 | 609-81-02065 | 055-282-2676 | 경상남도 창원시 성산구 공단로 193 | 영흥철강(주) | 제조업 | <NA> | 영흥철강(주) |
10166 | 10167 | 공공행정 | 지방자치단체 | 부산광역시 수영구 | 수영구의회 | 이정희 | 617-83-01834 | 051-610-4099 | 부산광역시 수영구 남천동로 100 | 수영구의회 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 구조례의 제정 및 개정폐지, 예산의 심의확저으 결산 승인, 행정사무감사.조사등 |
3662 | 3663 | 기타서비스 | 공공기관 | 한국승강기안전관리원 | 한국승강기안전관리원전북지원 | 공창석 | 418-82-03392 | 02-3497-7420 | 전라북도 전주시 덕진구 백제대로 566 | (금암동, 전북은행사옥 14층) | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | <NA> |
2268 | 2269 | 기타서비스 | 공공기관 | 한국산업은행 | 한국산업은행 서소문지점 | 서소문지점장 | 104-82-12221 | 02-398-9599 | 서울 중구 세종대로 9길 41 | 올리브타워 1층 | 금융 및 보험업 | <NA> | <NA> |
7787 | 7788 | 공공행정 | 지방자치단체 | 해운대구 | 반여2동주민센터 | 반여2동장 | 618-83-00314 | 051-749-4389 | 부산광역시 해운대구 재반로211번길 9 | <NA> | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | <NA> |
2068 | 2069 | 기타산업 | 온실가스목표관리업체 | (주)금남고속 | (주)금남고속 | 조성일 | 305-81-00637 | 042-585-7774 | 대전광역시 대덕구 읍내동 171 | (주)금남고속 | 운수업 | <NA> | 시외여객운송 |