Dataset statistics
Number of variables | 20 |
---|---|
Number of observations | 10000 |
Missing cells | 13772 |
Missing cells (%) | 6.9% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1.6 MiB |
Average record size in memory | 169.0 B |
Variable types
Numeric | 1 |
---|---|
Text | 11 |
Categorical | 8 |
Dataset
Description | 환경정보공개시스템 기관등록 명단(2020-10-22 기준 / 업체명, 업체특성, 사업장명, 주소, 세부업종, 주요업무, 연도별 대상여부 등)) |
---|---|
Author | 한국환경산업기술원 |
URL | https://www.data.go.kr/data/15072038/fileData.do |
2017 is highly overall correlated with 번호 and 2 other fields | High correlation |
2016 is highly overall correlated with 번호 and 2 other fields | High correlation |
번호 is highly overall correlated with 2016 and 1 other fields | High correlation |
업체분야 is highly overall correlated with 업체특성 and 1 other fields | High correlation |
업체특성 is highly overall correlated with 업체분야 | High correlation |
업체구분 is highly overall correlated with 2019 | High correlation |
업종 is highly overall correlated with 업체분야 | High correlation |
2018 is highly overall correlated with 2016 and 1 other fields | High correlation |
2019 is highly overall correlated with 업체구분 | High correlation |
업체 대표명 has 1012 (10.1%) missing values | Missing |
대표전화번호 has 1612 (16.1%) missing values | Missing |
상세주소 has 1616 (16.2%) missing values | Missing |
주요업무 has 2389 (23.9%) missing values | Missing |
홈페이지 has 7039 (70.4%) missing values | Missing |
번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 15:46:27.043177 |
---|---|
Analysis finished | 2023-12-12 15:46:32.666174 |
Duration | 5.62 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
번호
Real number (ℝ)
HIGH CORRELATION
  UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 9342.0639 |
Minimum | 1 |
---|---|
Maximum | 18659 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 961.7 |
Q1 | 4670.75 |
median | 9267 |
Q3 | 14038.75 |
95-th percentile | 17697.2 |
Maximum | 18659 |
Range | 18658 |
Interquartile range (IQR) | 9368 |
Descriptive statistics
Standard deviation | 5386.3631 |
---|---|
Coefficient of variation (CV) | 0.576571 |
Kurtosis | -1.2111776 |
Mean | 9342.0639 |
Median Absolute Deviation (MAD) | 4686 |
Skewness | 0.0064197719 |
Sum | 93420639 |
Variance | 29012908 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
11986 | 1 | < 0.1% |
13767 | 1 | < 0.1% |
14629 | 1 | < 0.1% |
13170 | 1 | < 0.1% |
12027 | 1 | < 0.1% |
551 | 1 | < 0.1% |
693 | 1 | < 0.1% |
5813 | 1 | < 0.1% |
17816 | 1 | < 0.1% |
5189 | 1 | < 0.1% |
Other values (9990) | 9990 |
Value | Count | Frequency (%) |
1 | 1 | |
2 | 1 | |
4 | 1 | |
6 | 1 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
11 | 1 | |
12 | 1 | |
14 | 1 |
Value | Count | Frequency (%) |
18659 | 1 | |
18658 | 1 | |
18657 | 1 | |
18656 | 1 | |
18652 | 1 | |
18649 | 1 | |
18645 | 1 | |
18643 | 1 | |
18642 | 1 | |
18639 | 1 |
업체명
Text
Distinct | 2534 |
---|---|
Distinct (%) | 25.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 36 |
---|---|
Median length | 29 |
Mean length | 7.7352 |
Min length | 2 |
Characters and Unicode
Total characters | 77352 |
---|---|
Distinct characters | 549 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 1609 ? |
---|---|
Unique (%) | 16.1% |
Sample
1st row | 임실군청 |
---|---|
2nd row | 롯데쇼핑(주) 본점(본사) |
3rd row | 한국남동발전(주) 영동화력발전처 |
4th row | 은평구청 |
5th row | 진주시청 |
Value | Count | Frequency (%) |
본사 | 368 | 2.9% |
주)이마트(본사+성수점 | 195 | 1.5% |
서울특별시 | 141 | 1.1% |
홈플러스(주 | 124 | 1.0% |
본부 | 110 | 0.9% |
부산광역시 | 110 | 0.9% |
주식회사 | 100 | 0.8% |
롯데쇼핑(주 | 96 | 0.8% |
본점(본사 | 95 | 0.8% |
안동시청 | 90 | 0.7% |
Other values (2720) | 11155 |
Most occurring characters
Value | Count | Frequency (%) |
청 | 4230 | 5.5% |
시 | 3459 | 4.5% |
주 | 3176 | 4.1% |
) | 2730 | 3.5% |
( | 2711 | 3.5% |
2586 | 3.3% | |
사 | 2297 | 3.0% |
공 | 1969 | 2.5% |
구 | 1620 | 2.1% |
본 | 1475 | 1.9% |
Other values (539) | 51099 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 67813 | |
Close Punctuation | 2730 | 3.5% |
Open Punctuation | 2711 | 3.5% |
Space Separator | 2586 | 3.3% |
Uppercase Letter | 703 | 0.9% |
Decimal Number | 223 | 0.3% |
Math Symbol | 197 | 0.3% |
Other Symbol | 130 | 0.2% |
Lowercase Letter | 125 | 0.2% |
Connector Punctuation | 73 | 0.1% |
Other values (2) | 61 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
청 | 4230 | 6.2% |
시 | 3459 | 5.1% |
주 | 3176 | 4.7% |
사 | 2297 | 3.4% |
공 | 1969 | 2.9% |
구 | 1620 | 2.4% |
본 | 1475 | 2.2% |
한 | 1407 | 2.1% |
국 | 1396 | 2.1% |
군 | 1230 | 1.8% |
Other values (476) | 45554 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 164 | |
K | 124 | |
C | 80 | |
L | 48 | 6.8% |
P | 48 | 6.8% |
D | 33 | 4.7% |
G | 31 | 4.4% |
N | 24 | 3.4% |
I | 24 | 3.4% |
J | 23 | 3.3% |
Other values (13) | 104 |
Lowercase Letter
Value | Count | Frequency (%) |
t | 34 | |
k | 31 | |
e | 11 | 8.8% |
s | 10 | 8.0% |
a | 8 | 6.4% |
p | 7 | 5.6% |
u | 5 | 4.0% |
m | 4 | 3.2% |
b | 3 | 2.4% |
r | 3 | 2.4% |
Other values (7) | 9 | 7.2% |
Decimal Number
Value | Count | Frequency (%) |
1 | 119 | |
2 | 42 | 18.8% |
5 | 24 | 10.8% |
3 | 23 | 10.3% |
4 | 7 | 3.1% |
0 | 3 | 1.3% |
6 | 3 | 1.3% |
9 | 1 | 0.4% |
7 | 1 | 0.4% |
Other Punctuation
Value | Count | Frequency (%) |
, | 21 | |
. | 14 | |
& | 14 | |
/ | 2 | 3.8% |
· | 1 | 1.9% |
Math Symbol
Value | Count | Frequency (%) |
+ | 195 | |
→ | 2 | 1.0% |
Other Symbol
Value | Count | Frequency (%) |
▶ | 65 | |
◀ | 65 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2730 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2711 |
Space Separator
Value | Count | Frequency (%) |
2586 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 73 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 67813 | |
Common | 8711 | 11.3% |
Latin | 828 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
청 | 4230 | 6.2% |
시 | 3459 | 5.1% |
주 | 3176 | 4.7% |
사 | 2297 | 3.4% |
공 | 1969 | 2.9% |
구 | 1620 | 2.4% |
본 | 1475 | 2.2% |
한 | 1407 | 2.1% |
국 | 1396 | 2.1% |
군 | 1230 | 1.8% |
Other values (476) | 45554 |
Latin
Value | Count | Frequency (%) |
S | 164 | |
K | 124 | |
C | 80 | 9.7% |
L | 48 | 5.8% |
P | 48 | 5.8% |
t | 34 | 4.1% |
D | 33 | 4.0% |
k | 31 | 3.7% |
G | 31 | 3.7% |
N | 24 | 2.9% |
Other values (30) | 211 |
Common
Value | Count | Frequency (%) |
) | 2730 | |
( | 2711 | |
2586 | ||
+ | 195 | 2.2% |
1 | 119 | 1.4% |
_ | 73 | 0.8% |
▶ | 65 | 0.7% |
◀ | 65 | 0.7% |
2 | 42 | 0.5% |
5 | 24 | 0.3% |
Other values (13) | 101 | 1.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 67813 | |
ASCII | 9406 | 12.2% |
Geometric Shapes | 130 | 0.2% |
Arrows | 2 | < 0.1% |
None | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
청 | 4230 | 6.2% |
시 | 3459 | 5.1% |
주 | 3176 | 4.7% |
사 | 2297 | 3.4% |
공 | 1969 | 2.9% |
구 | 1620 | 2.4% |
본 | 1475 | 2.2% |
한 | 1407 | 2.1% |
국 | 1396 | 2.1% |
군 | 1230 | 1.8% |
Other values (476) | 45554 |
ASCII
Value | Count | Frequency (%) |
) | 2730 | |
( | 2711 | |
2586 | ||
+ | 195 | 2.1% |
S | 164 | 1.7% |
K | 124 | 1.3% |
1 | 119 | 1.3% |
C | 80 | 0.9% |
_ | 73 | 0.8% |
L | 48 | 0.5% |
Other values (49) | 576 | 6.1% |
Geometric Shapes
Value | Count | Frequency (%) |
▶ | 65 | |
◀ | 65 |
Arrows
Value | Count | Frequency (%) |
→ | 2 |
None
Value | Count | Frequency (%) |
· | 1 |
업체분야
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
공공행정 | |
---|---|
제조 | |
기타서비스 | |
기타산업 | 280 |
교육서비스 | 230 |
Length
Max length | 5 |
---|---|
Median length | 4 |
Mean length | 3.8341 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공공행정 |
---|---|
2nd row | 기타서비스 |
3rd row | 제조 |
4th row | 공공행정 |
5th row | 공공행정 |
Common Values
Value | Count | Frequency (%) |
공공행정 | 6327 | |
제조 | 1586 | 15.9% |
기타서비스 | 1479 | 14.8% |
기타산업 | 280 | 2.8% |
교육서비스 | 230 | 2.3% |
보건 | 98 | 1.0% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
공공행정 | 6327 | |
제조 | 1586 | 15.9% |
기타서비스 | 1479 | 14.8% |
기타산업 | 280 | 2.8% |
교육서비스 | 230 | 2.3% |
보건 | 98 | 1.0% |
업체특성
Categorical
HIGH CORRELATION
 
Distinct | 12 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
지방자치단체 | |
---|---|
배출권할당대상업체 | |
공공기관 | |
온실가스목표관리업체 | |
중앙행정기관 | 417 |
Other values (7) |
Length
Max length | 10 |
---|---|
Median length | 9 |
Mean length | 6.3794 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 지방자치단체 |
---|---|
2nd row | 온실가스목표관리업체 |
3rd row | 녹색기업 |
4th row | 지방자치단체 |
5th row | 지방자치단체 |
Common Values
Value | Count | Frequency (%) |
지방자치단체 | 4344 | |
배출권할당대상업체 | 1791 | |
공공기관 | 1446 | 14.5% |
온실가스목표관리업체 | 865 | 8.6% |
중앙행정기관 | 417 | 4.2% |
지방공단 | 381 | 3.8% |
<NA> | 241 | 2.4% |
녹색기업 | 201 | 2.0% |
지방공사 | 176 | 1.8% |
국공립대학 | 115 | 1.1% |
Other values (2) | 23 | 0.2% |
Length
Value | Count | Frequency (%) |
지방자치단체 | 4344 | |
배출권할당대상업체 | 1791 | |
공공기관 | 1446 | 14.5% |
온실가스목표관리업체 | 865 | 8.6% |
중앙행정기관 | 417 | 4.2% |
지방공단 | 381 | 3.8% |
na | 241 | 2.4% |
녹색기업 | 201 | 2.0% |
지방공사 | 176 | 1.8% |
국공립대학 | 115 | 1.1% |
Other values (2) | 23 | 0.2% |
업체구분
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
사업장 | |
---|---|
대표사업장 |
Length
Max length | 5 |
---|---|
Median length | 3 |
Mean length | 3.6108 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 사업장 |
---|---|
2nd row | 사업장 |
3rd row | 대표사업장 |
4th row | 사업장 |
5th row | 사업장 |
Common Values
Value | Count | Frequency (%) |
사업장 | 6946 | |
대표사업장 | 3054 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
사업장 | 6946 | |
대표사업장 | 3054 |
사업장명
Text
Distinct | 8055 |
---|---|
Distinct (%) | 80.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 36 |
---|---|
Median length | 26 |
Mean length | 9.6469 |
Min length | 1 |
Characters and Unicode
Total characters | 96469 |
---|---|
Distinct characters | 661 |
Distinct categories | 12 ? |
Distinct scripts | 3 ? |
Distinct blocks | 5 ? |
Unique
Unique | 6910 ? |
---|---|
Unique (%) | 69.1% |
Sample
1st row | 임실군 청웅면사무소 |
---|---|
2nd row | 롯데시네마 |
3rd row | 한국남동발전(주) 영동화력발전처 |
4th row | 구립응암정보도서관 |
5th row | 사봉면 |
Value | Count | Frequency (%) |
본사 | 116 | 0.8% |
주민센터 | 111 | 0.8% |
주)이마트 | 110 | 0.8% |
주)이마트(본사+성수점 | 88 | 0.6% |
홈플러스 | 77 | 0.5% |
농업기술센터 | 73 | 0.5% |
보건소 | 67 | 0.5% |
주식회사 | 67 | 0.5% |
한국주택금융공사 | 65 | 0.5% |
롯데마트 | 61 | 0.4% |
Other values (7794) | 13276 |
Most occurring characters
Value | Count | Frequency (%) |
4117 | 4.3% | |
주 | 3670 | 3.8% |
사 | 3390 | 3.5% |
소 | 2273 | 2.4% |
) | 2246 | 2.3% |
( | 2237 | 2.3% |
공 | 2150 | 2.2% |
동 | 1997 | 2.1% |
시 | 1965 | 2.0% |
산 | 1637 | 1.7% |
Other values (651) | 70787 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 84740 | |
Space Separator | 4117 | 4.3% |
Close Punctuation | 2251 | 2.3% |
Open Punctuation | 2242 | 2.3% |
Decimal Number | 1100 | 1.1% |
Uppercase Letter | 951 | 1.0% |
Connector Punctuation | 503 | 0.5% |
Lowercase Letter | 149 | 0.2% |
Other Symbol | 133 | 0.1% |
Dash Punctuation | 99 | 0.1% |
Other values (2) | 184 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 3670 | 4.3% |
사 | 3390 | 4.0% |
소 | 2273 | 2.7% |
공 | 2150 | 2.5% |
동 | 1997 | 2.4% |
시 | 1965 | 2.3% |
산 | 1637 | 1.9% |
지 | 1607 | 1.9% |
청 | 1561 | 1.8% |
터 | 1494 | 1.8% |
Other values (579) | 62996 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 169 | |
K | 129 | |
C | 116 | |
L | 60 | 6.3% |
P | 60 | 6.3% |
T | 59 | 6.2% |
I | 50 | 5.3% |
D | 46 | 4.8% |
G | 38 | 4.0% |
N | 35 | 3.7% |
Other values (15) | 189 |
Lowercase Letter
Value | Count | Frequency (%) |
t | 35 | |
k | 32 | |
e | 12 | 8.1% |
o | 11 | 7.4% |
a | 11 | 7.4% |
p | 7 | 4.7% |
s | 6 | 4.0% |
r | 5 | 3.4% |
n | 5 | 3.4% |
l | 5 | 3.4% |
Other values (10) | 20 |
Decimal Number
Value | Count | Frequency (%) |
2 | 358 | |
1 | 346 | |
3 | 149 | |
4 | 87 | 7.9% |
5 | 60 | 5.5% |
0 | 45 | 4.1% |
6 | 21 | 1.9% |
7 | 15 | 1.4% |
9 | 10 | 0.9% |
8 | 9 | 0.8% |
Other Punctuation
Value | Count | Frequency (%) |
. | 34 | |
· | 22 | |
& | 20 | |
, | 16 | |
/ | 2 | 2.1% |
Other Symbol
Value | Count | Frequency (%) |
◀ | 64 | |
▶ | 64 | |
㈜ | 5 | 3.8% |
Close Punctuation
Value | Count | Frequency (%) |
) | 2246 | |
] | 5 | 0.2% |
Open Punctuation
Value | Count | Frequency (%) |
( | 2237 | |
[ | 5 | 0.2% |
Math Symbol
Value | Count | Frequency (%) |
+ | 88 | |
→ | 2 | 2.2% |
Space Separator
Value | Count | Frequency (%) |
4117 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 503 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 99 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 84745 | |
Common | 10624 | 11.0% |
Latin | 1100 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 3670 | 4.3% |
사 | 3390 | 4.0% |
소 | 2273 | 2.7% |
공 | 2150 | 2.5% |
동 | 1997 | 2.4% |
시 | 1965 | 2.3% |
산 | 1637 | 1.9% |
지 | 1607 | 1.9% |
청 | 1561 | 1.8% |
터 | 1494 | 1.8% |
Other values (580) | 63001 |
Latin
Value | Count | Frequency (%) |
S | 169 | |
K | 129 | 11.7% |
C | 116 | 10.5% |
L | 60 | 5.5% |
P | 60 | 5.5% |
T | 59 | 5.4% |
I | 50 | 4.5% |
D | 46 | 4.2% |
G | 38 | 3.5% |
t | 35 | 3.2% |
Other values (35) | 338 |
Common
Value | Count | Frequency (%) |
4117 | ||
) | 2246 | |
( | 2237 | |
_ | 503 | 4.7% |
2 | 358 | 3.4% |
1 | 346 | 3.3% |
3 | 149 | 1.4% |
- | 99 | 0.9% |
+ | 88 | 0.8% |
4 | 87 | 0.8% |
Other values (16) | 394 | 3.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 84740 | |
ASCII | 11572 | 12.0% |
Geometric Shapes | 128 | 0.1% |
None | 27 | < 0.1% |
Arrows | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4117 | ||
) | 2246 | |
( | 2237 | |
_ | 503 | 4.3% |
2 | 358 | 3.1% |
1 | 346 | 3.0% |
S | 169 | 1.5% |
3 | 149 | 1.3% |
K | 129 | 1.1% |
C | 116 | 1.0% |
Other values (57) | 1202 | 10.4% |
Hangul
Value | Count | Frequency (%) |
주 | 3670 | 4.3% |
사 | 3390 | 4.0% |
소 | 2273 | 2.7% |
공 | 2150 | 2.5% |
동 | 1997 | 2.4% |
시 | 1965 | 2.3% |
산 | 1637 | 1.9% |
지 | 1607 | 1.9% |
청 | 1561 | 1.8% |
터 | 1494 | 1.8% |
Other values (579) | 62996 |
Geometric Shapes
Value | Count | Frequency (%) |
◀ | 64 | |
▶ | 64 |
None
Value | Count | Frequency (%) |
· | 22 | |
㈜ | 5 | 18.5% |
Arrows
Value | Count | Frequency (%) |
→ | 2 |
업체 대표명
Text
MISSING
 
Distinct | 1600 |
---|---|
Distinct (%) | 17.8% |
Missing | 1012 |
Missing (%) | 10.1% |
Memory size | 156.2 KiB |
Length
Max length | 28 |
---|---|
Median length | 24 |
Mean length | 7.4165554 |
Min length | 1 |
Characters and Unicode
Total characters | 66660 |
---|---|
Distinct characters | 494 |
Distinct categories | 9 ? |
Distinct scripts | 4 ? |
Distinct blocks | 3 ? |
Unique
Unique | 752 ? |
---|---|
Unique (%) | 8.4% |
Sample
1st row | 전라북도 임실군 |
---|---|
2nd row | 롯데쇼핑(주) |
3rd row | 한국남동발전(주) |
4th row | 서울특별시 은평구 |
5th row | 경상남도 진주시 |
Value | Count | Frequency (%) |
경상북도 | 533 | 4.2% |
경기도 | 501 | 3.9% |
서울특별시 | 443 | 3.5% |
전라남도 | 356 | 2.8% |
전라북도 | 352 | 2.7% |
경상남도 | 334 | 2.6% |
강원도 | 230 | 1.8% |
충청남도 | 215 | 1.7% |
충청북도 | 212 | 1.7% |
부산광역시 | 209 | 1.6% |
Other values (1625) | 9428 |
Most occurring characters
Value | Count | Frequency (%) |
3826 | 5.7% | |
시 | 3578 | 5.4% |
도 | 3095 | 4.6% |
주 | 2795 | 4.2% |
) | 1986 | 3.0% |
( | 1985 | 3.0% |
경 | 1664 | 2.5% |
구 | 1402 | 2.1% |
전 | 1263 | 1.9% |
공 | 1262 | 1.9% |
Other values (484) | 43804 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 58037 | |
Space Separator | 3826 | 5.7% |
Close Punctuation | 1986 | 3.0% |
Open Punctuation | 1985 | 3.0% |
Uppercase Letter | 624 | 0.9% |
Other Punctuation | 109 | 0.2% |
Dash Punctuation | 54 | 0.1% |
Decimal Number | 29 | < 0.1% |
Lowercase Letter | 10 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 3578 | 6.2% |
도 | 3095 | 5.3% |
주 | 2795 | 4.8% |
경 | 1664 | 2.9% |
구 | 1402 | 2.4% |
전 | 1263 | 2.2% |
공 | 1262 | 2.2% |
남 | 1240 | 2.1% |
북 | 1220 | 2.1% |
군 | 1149 | 2.0% |
Other values (443) | 39369 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 133 | |
L | 90 | |
G | 81 | |
K | 80 | |
P | 45 | 7.2% |
C | 41 | 6.6% |
T | 31 | 5.0% |
J | 19 | 3.0% |
I | 18 | 2.9% |
N | 18 | 2.9% |
Other values (12) | 68 |
Decimal Number
Value | Count | Frequency (%) |
2 | 13 | |
5 | 6 | |
1 | 4 | 13.8% |
3 | 3 | 10.3% |
4 | 2 | 6.9% |
9 | 1 | 3.4% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 4 | |
l | 2 | |
t | 2 | |
a | 1 | 10.0% |
d | 1 | 10.0% |
Other Punctuation
Value | Count | Frequency (%) |
, | 92 | |
& | 13 | 11.9% |
. | 3 | 2.8% |
/ | 1 | 0.9% |
Space Separator
Value | Count | Frequency (%) |
3826 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1986 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1985 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 54 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 58036 | |
Common | 7989 | 12.0% |
Latin | 634 | 1.0% |
Han | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 3578 | 6.2% |
도 | 3095 | 5.3% |
주 | 2795 | 4.8% |
경 | 1664 | 2.9% |
구 | 1402 | 2.4% |
전 | 1263 | 2.2% |
공 | 1262 | 2.2% |
남 | 1240 | 2.1% |
북 | 1220 | 2.1% |
군 | 1149 | 2.0% |
Other values (442) | 39368 |
Latin
Value | Count | Frequency (%) |
S | 133 | |
L | 90 | |
G | 81 | |
K | 80 | |
P | 45 | 7.1% |
C | 41 | 6.5% |
T | 31 | 4.9% |
J | 19 | 3.0% |
I | 18 | 2.8% |
N | 18 | 2.8% |
Other values (17) | 78 |
Common
Value | Count | Frequency (%) |
3826 | ||
) | 1986 | |
( | 1985 | |
, | 92 | 1.2% |
- | 54 | 0.7% |
& | 13 | 0.2% |
2 | 13 | 0.2% |
5 | 6 | 0.1% |
1 | 4 | 0.1% |
3 | 3 | < 0.1% |
Other values (4) | 7 | 0.1% |
Han
Value | Count | Frequency (%) |
美 | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 58036 | |
ASCII | 8623 | 12.9% |
CJK | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
3826 | ||
) | 1986 | |
( | 1985 | |
S | 133 | 1.5% |
, | 92 | 1.1% |
L | 90 | 1.0% |
G | 81 | 0.9% |
K | 80 | 0.9% |
- | 54 | 0.6% |
P | 45 | 0.5% |
Other values (31) | 251 | 2.9% |
Hangul
Value | Count | Frequency (%) |
시 | 3578 | 6.2% |
도 | 3095 | 5.3% |
주 | 2795 | 4.8% |
경 | 1664 | 2.9% |
구 | 1402 | 2.4% |
전 | 1263 | 2.2% |
공 | 1262 | 2.2% |
남 | 1240 | 2.1% |
북 | 1220 | 2.1% |
군 | 1149 | 2.0% |
Other values (442) | 39368 |
CJK
Value | Count | Frequency (%) |
美 | 1 |
사업자등록번호
Text
Distinct | 5274 |
---|---|
Distinct (%) | 53.3% |
Missing | 98 |
Missing (%) | 1.0% |
Memory size | 156.2 KiB |
Length
Max length | 12 |
---|---|
Median length | 12 |
Mean length | 12 |
Min length | 12 |
Characters and Unicode
Total characters | 118824 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 3894 ? |
---|---|
Unique (%) | 39.3% |
Sample
1st row | 407-83-02560 |
---|---|
2nd row | 215-85-13462 |
3rd row | 226-85-22656 |
4th row | 110-82-13924 |
5th row | 613-83-01415 |
Value | Count | Frequency (%) |
206-86-50913 | 198 | 2.0% |
220-81-60348 | 124 | 1.3% |
125-83-01960 | 81 | 0.8% |
104-81-86269 | 65 | 0.7% |
120-82-00052 | 56 | 0.6% |
418-83-00034 | 54 | 0.5% |
505-83-00022 | 52 | 0.5% |
512-83-00068 | 52 | 0.5% |
314-81-11803 | 49 | 0.5% |
417-83-00216 | 46 | 0.5% |
Other values (5264) | 9125 |
Most occurring characters
Value | Count | Frequency (%) |
- | 19804 | |
0 | 19318 | |
1 | 14792 | |
8 | 14003 | |
3 | 12083 | |
2 | 11164 | |
6 | 6590 | 5.5% |
5 | 6477 | 5.5% |
4 | 6414 | 5.4% |
7 | 4145 | 3.5% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 99020 | |
Dash Punctuation | 19804 | 16.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 19318 | |
1 | 14792 | |
8 | 14003 | |
3 | 12083 | |
2 | 11164 | |
6 | 6590 | 6.7% |
5 | 6477 | 6.5% |
4 | 6414 | 6.5% |
7 | 4145 | 4.2% |
9 | 4034 | 4.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 19804 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 118824 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
- | 19804 | |
0 | 19318 | |
1 | 14792 | |
8 | 14003 | |
3 | 12083 | |
2 | 11164 | |
6 | 6590 | 5.5% |
5 | 6477 | 5.5% |
4 | 6414 | 5.4% |
7 | 4145 | 3.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 118824 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 19804 | |
0 | 19318 | |
1 | 14792 | |
8 | 14003 | |
3 | 12083 | |
2 | 11164 | |
6 | 6590 | 5.5% |
5 | 6477 | 5.5% |
4 | 6414 | 5.4% |
7 | 4145 | 3.5% |
대표자
Text
Distinct | 2295 |
---|---|
Distinct (%) | 23.0% |
Missing | 1 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
강희석 | 195 | 1.8% |
임일순 | 173 | 1.6% |
강희태 | 97 | 0.9% |
권영세 | 89 | 0.8% |
평택시장 | 83 | 0.8% |
대표이사 | 71 | 0.7% |
현성철 | 69 | 0.6% |
이정환 | 65 | 0.6% |
김진숙 | 62 | 0.6% |
이환주 | 59 | 0.6% |
Other values (2394) | 9658 |
Most occurring characters
Value | Count | Frequency (%) |
김 | 1571 | 4.3% |
장 | 1561 | 4.3% |
이 | 1395 | 3.8% |
수 | 1115 | 3.0% |
시 | 1007 | 2.7% |
영 | 790 | 2.2% |
박 | 734 | 2.0% |
정 | 724 | 2.0% |
성 | 654 | 1.8% |
군 | 644 | 1.8% |
Other values (383) | 26496 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 35372 | |
Space Separator | 641 | 1.7% |
Other Punctuation | 333 | 0.9% |
Uppercase Letter | 156 | 0.4% |
Close Punctuation | 70 | 0.2% |
Open Punctuation | 70 | 0.2% |
Decimal Number | 46 | 0.1% |
Dash Punctuation | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
김 | 1571 | 4.4% |
장 | 1561 | 4.4% |
이 | 1395 | 3.9% |
수 | 1115 | 3.2% |
시 | 1007 | 2.8% |
영 | 790 | 2.2% |
박 | 734 | 2.1% |
정 | 724 | 2.0% |
성 | 654 | 1.8% |
군 | 644 | 1.8% |
Other values (354) | 25177 |
Uppercase Letter
Value | Count | Frequency (%) |
N | 17 | |
G | 16 | 10.3% |
L | 14 | 9.0% |
I | 13 | 8.3% |
U | 11 | 7.1% |
K | 10 | 6.4% |
Y | 9 | 5.8% |
E | 9 | 5.8% |
A | 9 | 5.8% |
O | 8 | 5.1% |
Other values (9) | 40 |
Other Punctuation
Value | Count | Frequency (%) |
, | 331 | |
/ | 1 | 0.3% |
. | 1 | 0.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 16 | |
2 | 16 | |
3 | 14 |
Space Separator
Value | Count | Frequency (%) |
641 |
Close Punctuation
Value | Count | Frequency (%) |
) | 70 |
Open Punctuation
Value | Count | Frequency (%) |
( | 70 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 3 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 35361 | |
Common | 1163 | 3.2% |
Latin | 156 | 0.4% |
Han | 11 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
김 | 1571 | 4.4% |
장 | 1561 | 4.4% |
이 | 1395 | 3.9% |
수 | 1115 | 3.2% |
시 | 1007 | 2.8% |
영 | 790 | 2.2% |
박 | 734 | 2.1% |
정 | 724 | 2.0% |
성 | 654 | 1.8% |
군 | 644 | 1.8% |
Other values (353) | 25166 |
Latin
Value | Count | Frequency (%) |
N | 17 | |
G | 16 | 10.3% |
L | 14 | 9.0% |
I | 13 | 8.3% |
U | 11 | 7.1% |
K | 10 | 6.4% |
Y | 9 | 5.8% |
E | 9 | 5.8% |
A | 9 | 5.8% |
O | 8 | 5.1% |
Other values (9) | 40 |
Common
Value | Count | Frequency (%) |
641 | ||
, | 331 | |
) | 70 | 6.0% |
( | 70 | 6.0% |
1 | 16 | 1.4% |
2 | 16 | 1.4% |
3 | 14 | 1.2% |
- | 3 | 0.3% |
/ | 1 | 0.1% |
. | 1 | 0.1% |
Han
Value | Count | Frequency (%) |
外 | 11 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 35361 | |
ASCII | 1319 | 3.6% |
CJK | 11 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
김 | 1571 | 4.4% |
장 | 1561 | 4.4% |
이 | 1395 | 3.9% |
수 | 1115 | 3.2% |
시 | 1007 | 2.8% |
영 | 790 | 2.2% |
박 | 734 | 2.1% |
정 | 724 | 2.0% |
성 | 654 | 1.8% |
군 | 644 | 1.8% |
Other values (353) | 25166 |
ASCII
Value | Count | Frequency (%) |
641 | ||
, | 331 | |
) | 70 | 5.3% |
( | 70 | 5.3% |
N | 17 | 1.3% |
G | 16 | 1.2% |
1 | 16 | 1.2% |
2 | 16 | 1.2% |
3 | 14 | 1.1% |
L | 14 | 1.1% |
Other values (19) | 114 | 8.6% |
CJK
Value | Count | Frequency (%) |
外 | 11 |
대표전화번호
Text
MISSING
 
Distinct | 6214 |
---|---|
Distinct (%) | 74.1% |
Missing | 1612 |
Missing (%) | 16.1% |
Memory size | 156.2 KiB |
Length
Max length | 13 |
---|---|
Median length | 12 |
Mean length | 11.959704 |
Min length | 8 |
Characters and Unicode
Total characters | 100318 |
---|---|
Distinct characters | 11 |
Distinct categories | 2 ? |
Distinct scripts | 1 ? |
Distinct blocks | 1 ? |
Unique
Unique | 5271 ? |
---|---|
Unique (%) | 62.8% |
Sample
1st row | 033-640-3329 |
---|---|
2nd row | 054-534-3501 |
3rd row | 054-977-8773 |
4th row | 054-280-6354 |
5th row | 033-258-9333 |
Value | Count | Frequency (%) |
02-3459-1668 | 163 | 1.9% |
02-380-9209 | 88 | 1.0% |
031-8024-3732 | 54 | 0.6% |
02-2145-8101 | 50 | 0.6% |
054-779-6364 | 38 | 0.5% |
02-380-0680 | 34 | 0.4% |
02-879-6254 | 31 | 0.4% |
02-6100-3689 | 30 | 0.4% |
031-940-4453 | 30 | 0.4% |
051-607-4391 | 27 | 0.3% |
Other values (6204) | 7843 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 17977 | |
- | 16766 | |
2 | 10110 | |
3 | 9968 | |
5 | 8624 | |
1 | 8254 | |
4 | 7323 | |
6 | 7081 | 7.1% |
8 | 5014 | 5.0% |
7 | 4905 | 4.9% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 83552 | |
Dash Punctuation | 16766 | 16.7% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 17977 | |
2 | 10110 | |
3 | 9968 | |
5 | 8624 | |
1 | 8254 | |
4 | 7323 | |
6 | 7081 | 8.5% |
8 | 5014 | 6.0% |
7 | 4905 | 5.9% |
9 | 4296 | 5.1% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 16766 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 100318 |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 17977 | |
- | 16766 | |
2 | 10110 | |
3 | 9968 | |
5 | 8624 | |
1 | 8254 | |
4 | 7323 | |
6 | 7081 | 7.1% |
8 | 5014 | 5.0% |
7 | 4905 | 4.9% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 100318 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 17977 | |
- | 16766 | |
2 | 10110 | |
3 | 9968 | |
5 | 8624 | |
1 | 8254 | |
4 | 7323 | |
6 | 7081 | 7.1% |
8 | 5014 | 5.0% |
7 | 4905 | 4.9% |
주소
Text
Distinct | 7437 |
---|---|
Distinct (%) | 74.4% |
Missing | 5 |
Missing (%) | < 0.1% |
Memory size | 156.2 KiB |
Length
Max length | 56 |
---|---|
Median length | 36 |
Mean length | 19.153677 |
Min length | 6 |
Characters and Unicode
Total characters | 191441 |
---|---|
Distinct characters | 551 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 4 ? |
Unique
Unique | 5996 ? |
---|---|
Unique (%) | 60.0% |
Sample
1st row | 전라북도 임실군 청웅면 청웅로 153 |
---|---|
2nd row | 서울특별시 송파구 올림픽로 269 |
3rd row | 강원 강릉시 강동면 안인리 |
4th row | 서울시 은평구 가좌로7길 15(응암동 730-3) |
5th row | 경상남도 진주시 사봉면 사군로 105 |
Value | Count | Frequency (%) |
서울특별시 | 1575 | 3.5% |
경기도 | 1427 | 3.2% |
경상북도 | 846 | 1.9% |
경상남도 | 703 | 1.6% |
전라북도 | 613 | 1.4% |
전라남도 | 601 | 1.3% |
부산광역시 | 514 | 1.1% |
충청남도 | 491 | 1.1% |
강원도 | 479 | 1.1% |
충청북도 | 457 | 1.0% |
Other values (8885) | 37221 |
Most occurring characters
Value | Count | Frequency (%) |
34964 | 18.3% | |
시 | 8711 | 4.6% |
로 | 8171 | 4.3% |
1 | 6310 | 3.3% |
도 | 6165 | 3.2% |
구 | 5695 | 3.0% |
2 | 4176 | 2.2% |
3 | 3433 | 1.8% |
경 | 3403 | 1.8% |
남 | 3262 | 1.7% |
Other values (541) | 107151 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 124127 | |
Space Separator | 34964 | 18.3% |
Decimal Number | 30751 | 16.1% |
Dash Punctuation | 1253 | 0.7% |
Open Punctuation | 143 | 0.1% |
Close Punctuation | 143 | 0.1% |
Uppercase Letter | 36 | < 0.1% |
Other Punctuation | 22 | < 0.1% |
Letter Number | 1 | < 0.1% |
Lowercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 8711 | 7.0% |
로 | 8171 | 6.6% |
도 | 6165 | 5.0% |
구 | 5695 | 4.6% |
경 | 3403 | 2.7% |
남 | 3262 | 2.6% |
산 | 3131 | 2.5% |
동 | 3107 | 2.5% |
서 | 3084 | 2.5% |
광 | 2845 | 2.3% |
Other values (507) | 76553 |
Uppercase Letter
Value | Count | Frequency (%) |
L | 6 | |
C | 5 | |
G | 5 | |
A | 4 | |
E | 3 | |
P | 3 | |
K | 2 | 5.6% |
D | 2 | 5.6% |
T | 1 | 2.8% |
Y | 1 | 2.8% |
Other values (4) | 4 |
Decimal Number
Value | Count | Frequency (%) |
1 | 6310 | |
2 | 4176 | |
3 | 3433 | |
5 | 2935 | |
4 | 2512 | 8.2% |
7 | 2501 | 8.1% |
0 | 2488 | 8.1% |
6 | 2413 | 7.8% |
8 | 2062 | 6.7% |
9 | 1921 | 6.2% |
Other Punctuation
Value | Count | Frequency (%) |
· | 9 | |
, | 7 | |
. | 5 | |
' | 1 | 4.5% |
Space Separator
Value | Count | Frequency (%) |
34964 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1253 |
Open Punctuation
Value | Count | Frequency (%) |
( | 143 |
Close Punctuation
Value | Count | Frequency (%) |
) | 143 |
Letter Number
Value | Count | Frequency (%) |
Ⅲ | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
l | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 124127 | |
Common | 67276 | |
Latin | 38 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 8711 | 7.0% |
로 | 8171 | 6.6% |
도 | 6165 | 5.0% |
구 | 5695 | 4.6% |
경 | 3403 | 2.7% |
남 | 3262 | 2.6% |
산 | 3131 | 2.5% |
동 | 3107 | 2.5% |
서 | 3084 | 2.5% |
광 | 2845 | 2.3% |
Other values (507) | 76553 |
Common
Value | Count | Frequency (%) |
34964 | ||
1 | 6310 | 9.4% |
2 | 4176 | 6.2% |
3 | 3433 | 5.1% |
5 | 2935 | 4.4% |
4 | 2512 | 3.7% |
7 | 2501 | 3.7% |
0 | 2488 | 3.7% |
6 | 2413 | 3.6% |
8 | 2062 | 3.1% |
Other values (8) | 3482 | 5.2% |
Latin
Value | Count | Frequency (%) |
L | 6 | |
C | 5 | |
G | 5 | |
A | 4 | |
E | 3 | |
P | 3 | |
K | 2 | 5.3% |
D | 2 | 5.3% |
T | 1 | 2.6% |
Y | 1 | 2.6% |
Other values (6) | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 124127 | |
ASCII | 67304 | |
None | 9 | < 0.1% |
Number Forms | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
34964 | ||
1 | 6310 | 9.4% |
2 | 4176 | 6.2% |
3 | 3433 | 5.1% |
5 | 2935 | 4.4% |
4 | 2512 | 3.7% |
7 | 2501 | 3.7% |
0 | 2488 | 3.7% |
6 | 2413 | 3.6% |
8 | 2062 | 3.1% |
Other values (22) | 3510 | 5.2% |
Hangul
Value | Count | Frequency (%) |
시 | 8711 | 7.0% |
로 | 8171 | 6.6% |
도 | 6165 | 5.0% |
구 | 5695 | 4.6% |
경 | 3403 | 2.7% |
남 | 3262 | 2.6% |
산 | 3131 | 2.5% |
동 | 3107 | 2.5% |
서 | 3084 | 2.5% |
광 | 2845 | 2.3% |
Other values (507) | 76553 |
None
Value | Count | Frequency (%) |
· | 9 |
Number Forms
Value | Count | Frequency (%) |
Ⅲ | 1 |
상세주소
Text
MISSING
 
Distinct | 6287 |
---|---|
Distinct (%) | 75.0% |
Missing | 1616 |
Missing (%) | 16.2% |
Memory size | 156.2 KiB |
Length
Max length | 43 |
---|---|
Median length | 36 |
Mean length | 8.7062261 |
Min length | 1 |
Characters and Unicode
Total characters | 72993 |
---|---|
Distinct characters | 661 |
Distinct categories | 12 ? |
Distinct scripts | 4 ? |
Distinct blocks | 6 ? |
Unique
Unique | 5320 ? |
---|---|
Unique (%) | 63.5% |
Sample
1st row | 롯데캐슬골드 4층 롯데시네마 |
---|---|
2nd row | 200 영동화력발전처 |
3rd row | 대한적십자사 상주적십자병원 총무팀 |
4th row | 국립칠곡숲체원 |
5th row | 243 |
Value | Count | Frequency (%) |
이마트 | 279 | 2.1% |
본사 | 158 | 1.2% |
홈플러스 | 139 | 1.1% |
주민센터 | 125 | 1.0% |
성수점 | 88 | 0.7% |
및 | 88 | 0.7% |
2층 | 86 | 0.7% |
3층 | 79 | 0.6% |
4층 | 66 | 0.5% |
64 | 0.5% | |
Other values (7050) | 11808 |
Most occurring characters
Value | Count | Frequency (%) |
4606 | 6.3% | |
사 | 1873 | 2.6% |
동 | 1851 | 2.5% |
주 | 1770 | 2.4% |
1 | 1313 | 1.8% |
소 | 1242 | 1.7% |
공 | 1233 | 1.7% |
) | 1158 | 1.6% |
( | 1153 | 1.6% |
지 | 1143 | 1.6% |
Other values (651) | 55651 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 58473 | |
Decimal Number | 5797 | 7.9% |
Space Separator | 4606 | 6.3% |
Close Punctuation | 1159 | 1.6% |
Open Punctuation | 1155 | 1.6% |
Uppercase Letter | 990 | 1.4% |
Dash Punctuation | 373 | 0.5% |
Other Punctuation | 266 | 0.4% |
Lowercase Letter | 149 | 0.2% |
Math Symbol | 19 | < 0.1% |
Other values (2) | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 1873 | 3.2% |
동 | 1851 | 3.2% |
주 | 1770 | 3.0% |
소 | 1242 | 2.1% |
공 | 1233 | 2.1% |
지 | 1143 | 2.0% |
터 | 1135 | 1.9% |
센 | 1120 | 1.9% |
시 | 1067 | 1.8% |
산 | 1056 | 1.8% |
Other values (576) | 44983 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 143 | |
L | 102 | |
K | 100 | |
C | 95 | |
G | 86 | 8.7% |
T | 72 | 7.3% |
I | 51 | 5.2% |
D | 49 | 4.9% |
E | 35 | 3.5% |
B | 33 | 3.3% |
Other values (15) | 224 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 19 | |
t | 18 | |
n | 16 | |
k | 15 | |
e | 10 | 6.7% |
c | 8 | 5.4% |
s | 8 | 5.4% |
o | 7 | 4.7% |
i | 6 | 4.0% |
r | 6 | 4.0% |
Other values (14) | 36 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1313 | |
2 | 907 | |
3 | 674 | |
4 | 516 | 8.9% |
5 | 492 | 8.5% |
0 | 475 | 8.2% |
6 | 455 | 7.8% |
7 | 380 | 6.6% |
8 | 303 | 5.2% |
9 | 282 | 4.9% |
Other Punctuation
Value | Count | Frequency (%) |
, | 154 | |
. | 68 | |
· | 19 | 7.1% |
& | 15 | 5.6% |
/ | 9 | 3.4% |
& | 1 | 0.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 1158 | |
] | 1 | 0.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 1153 | |
[ | 2 | 0.2% |
Math Symbol
Value | Count | Frequency (%) |
~ | 18 | |
∼ | 1 | 5.3% |
Space Separator
Value | Count | Frequency (%) |
4606 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 373 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 5 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 58467 | |
Common | 13380 | 18.3% |
Latin | 1139 | 1.6% |
Han | 7 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 1873 | 3.2% |
동 | 1851 | 3.2% |
주 | 1770 | 3.0% |
소 | 1242 | 2.1% |
공 | 1233 | 2.1% |
지 | 1143 | 2.0% |
터 | 1135 | 1.9% |
센 | 1120 | 1.9% |
시 | 1067 | 1.8% |
산 | 1056 | 1.8% |
Other values (575) | 44977 |
Latin
Value | Count | Frequency (%) |
S | 143 | 12.6% |
L | 102 | 9.0% |
K | 100 | 8.8% |
C | 95 | 8.3% |
G | 86 | 7.6% |
T | 72 | 6.3% |
I | 51 | 4.5% |
D | 49 | 4.3% |
E | 35 | 3.1% |
B | 33 | 2.9% |
Other values (39) | 373 |
Common
Value | Count | Frequency (%) |
4606 | ||
1 | 1313 | 9.8% |
) | 1158 | 8.7% |
( | 1153 | 8.6% |
2 | 907 | 6.8% |
3 | 674 | 5.0% |
4 | 516 | 3.9% |
5 | 492 | 3.7% |
0 | 475 | 3.6% |
6 | 455 | 3.4% |
Other values (15) | 1631 | 12.2% |
Han
Value | Count | Frequency (%) |
內 | 5 | |
舊 | 2 | 28.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 58461 | |
ASCII | 14498 | 19.9% |
None | 21 | < 0.1% |
CJK | 7 | < 0.1% |
Compat Jamo | 5 | < 0.1% |
Math Operators | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4606 | ||
1 | 1313 | 9.1% |
) | 1158 | 8.0% |
( | 1153 | 8.0% |
2 | 907 | 6.3% |
3 | 674 | 4.6% |
4 | 516 | 3.6% |
5 | 492 | 3.4% |
0 | 475 | 3.3% |
6 | 455 | 3.1% |
Other values (61) | 2749 |
Hangul
Value | Count | Frequency (%) |
사 | 1873 | 3.2% |
동 | 1851 | 3.2% |
주 | 1770 | 3.0% |
소 | 1242 | 2.1% |
공 | 1233 | 2.1% |
지 | 1143 | 2.0% |
터 | 1135 | 1.9% |
센 | 1120 | 1.9% |
시 | 1067 | 1.8% |
산 | 1056 | 1.8% |
Other values (571) | 44971 |
None
Value | Count | Frequency (%) |
· | 19 | |
& | 1 | 4.8% |
㈜ | 1 | 4.8% |
CJK
Value | Count | Frequency (%) |
內 | 5 | |
舊 | 2 | 28.6% |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 3 | |
ㅗ | 1 | 20.0% |
ㅏ | 1 | 20.0% |
Math Operators
Value | Count | Frequency (%) |
∼ | 1 |
업종
Categorical
HIGH CORRELATION
 
Distinct | 20 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
공공행정, 국방 및 사회보장 행정 | |
---|---|
제조업 | |
도매 및 소매업 | |
보건업 및 사회복지 서비스업 | 342 |
전기, 가스, 증기 및 수도사업 | 335 |
Other values (15) |
Length
Max length | 24 |
---|---|
Median length | 18 |
Mean length | 13.9956 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공공행정, 국방 및 사회보장 행정 |
---|---|
2nd row | 도매 및 소매업 |
3rd row | 전기, 가스, 증기 및 수도사업 |
4th row | 예술, 스포츠 및 여가관련 서비스업 |
5th row | 공공행정, 국방 및 사회보장 행정 |
Common Values
Value | Count | Frequency (%) |
공공행정, 국방 및 사회보장 행정 | 4930 | |
제조업 | 1486 | 14.9% |
도매 및 소매업 | 566 | 5.7% |
보건업 및 사회복지 서비스업 | 342 | 3.4% |
전기, 가스, 증기 및 수도사업 | 335 | 3.4% |
사업시설관리 및 사업지원 서비스업 | 322 | 3.2% |
교육 서비스업 | 307 | 3.1% |
금융 및 보험업 | 280 | 2.8% |
예술, 스포츠 및 여가관련 서비스업 | 259 | 2.6% |
전문, 과학 및 기술 서비스업 | 248 | 2.5% |
Other values (10) | 925 | 9.2% |
Length
Value | Count | Frequency (%) |
및 | 7980 | |
공공행정 | 4930 | |
행정 | 4930 | |
국방 | 4930 | |
사회보장 | 4930 | |
서비스업 | 1489 | 3.8% |
제조업 | 1486 | 3.8% |
도매 | 566 | 1.4% |
소매업 | 566 | 1.4% |
보건업 | 342 | 0.9% |
Other values (40) | 7127 |
세부업종
Text
Distinct | 72 |
---|---|
Distinct (%) | 0.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 28 |
---|---|
Median length | 18 |
Mean length | 14.7266 |
Min length | 2 |
Characters and Unicode
Total characters | 147266 |
---|---|
Distinct characters | 164 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 3 ? |
Unique
Unique | 6 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 공공행정, 국방 및 사회보장 행정 |
---|---|
2nd row | 소매업; 자동차 제외 |
3rd row | 전기, 가스, 증기 및 공기조절 공급업 |
4th row | 창작, 예술 및 여가관련 서비스업 |
5th row | 공공행정, 국방 및 사회보장 행정 |
Value | Count | Frequency (%) |
및 | 6938 | |
공공행정 | 4930 | |
행정 | 4930 | |
국방 | 4930 | |
사회보장 | 4930 | |
제조업 | 1201 | 3.0% |
서비스업 | 1117 | 2.7% |
제외 | 858 | 2.1% |
자동차 | 614 | 1.5% |
소매업 | 526 | 1.3% |
Other values (142) | 9709 |
Most occurring characters
Value | Count | Frequency (%) |
30683 | ||
공 | 10385 | 7.1% |
정 | 9914 | 6.7% |
행 | 9860 | 6.7% |
및 | 6938 | 4.7% |
, | 6335 | 4.3% |
사 | 5462 | 3.7% |
업 | 5359 | 3.6% |
보 | 5246 | 3.6% |
장 | 5174 | 3.5% |
Other values (154) | 51910 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 109175 | |
Space Separator | 30683 | 20.8% |
Other Punctuation | 7255 | 4.9% |
Decimal Number | 153 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
공 | 10385 | 9.5% |
정 | 9914 | 9.1% |
행 | 9860 | 9.0% |
및 | 6938 | 6.4% |
사 | 5462 | 5.0% |
업 | 5359 | 4.9% |
보 | 5246 | 4.8% |
장 | 5174 | 4.7% |
회 | 5015 | 4.6% |
국 | 4976 | 4.6% |
Other values (149) | 40846 |
Other Punctuation
Value | Count | Frequency (%) |
, | 6335 | |
; | 918 | 12.7% |
· | 2 | < 0.1% |
Space Separator
Value | Count | Frequency (%) |
30683 |
Decimal Number
Value | Count | Frequency (%) |
1 | 153 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 109175 | |
Common | 38091 | 25.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
공 | 10385 | 9.5% |
정 | 9914 | 9.1% |
행 | 9860 | 9.0% |
및 | 6938 | 6.4% |
사 | 5462 | 5.0% |
업 | 5359 | 4.9% |
보 | 5246 | 4.8% |
장 | 5174 | 4.7% |
회 | 5015 | 4.6% |
국 | 4976 | 4.6% |
Other values (149) | 40846 |
Common
Value | Count | Frequency (%) |
30683 | ||
, | 6335 | 16.6% |
; | 918 | 2.4% |
1 | 153 | 0.4% |
· | 2 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 109175 | |
ASCII | 38089 | 25.9% |
None | 2 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
30683 | ||
, | 6335 | 16.6% |
; | 918 | 2.4% |
1 | 153 | 0.4% |
Hangul
Value | Count | Frequency (%) |
공 | 10385 | 9.5% |
정 | 9914 | 9.1% |
행 | 9860 | 9.0% |
및 | 6938 | 6.4% |
사 | 5462 | 5.0% |
업 | 5359 | 4.9% |
보 | 5246 | 4.8% |
장 | 5174 | 4.7% |
회 | 5015 | 4.6% |
국 | 4976 | 4.6% |
Other values (149) | 40846 |
None
Value | Count | Frequency (%) |
· | 2 |
주요업무
Text
MISSING
 
Distinct | 2960 |
---|---|
Distinct (%) | 38.9% |
Missing | 2389 |
Missing (%) | 23.9% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
808 | 5.6% | |
및 | 636 | 4.4% |
공공행정 | 603 | 4.2% |
등 | 459 | 3.2% |
운영 | 339 | 2.4% |
제조 | 313 | 2.2% |
판매 | 234 | 1.6% |
관리 | 215 | 1.5% |
업무 | 182 | 1.3% |
평생교육 | 177 | 1.2% |
Other values (3493) | 10437 |
Most occurring characters
Value | Count | Frequency (%) |
6801 | 11.8% | |
공 | 2339 | 4.1% |
, | 1557 | 2.7% |
업 | 1482 | 2.6% |
정 | 1457 | 2.5% |
관 | 1299 | 2.3% |
행 | 1293 | 2.3% |
리 | 1108 | 1.9% |
지 | 928 | 1.6% |
시 | 903 | 1.6% |
Other values (607) | 38269 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 47133 | |
Space Separator | 6801 | 11.8% |
Other Punctuation | 1803 | 3.1% |
Dash Punctuation | 733 | 1.3% |
Uppercase Letter | 416 | 0.7% |
Lowercase Letter | 174 | 0.3% |
Open Punctuation | 131 | 0.2% |
Close Punctuation | 130 | 0.2% |
Decimal Number | 109 | 0.2% |
Connector Punctuation | 3 | < 0.1% |
Other values (2) | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
공 | 2339 | 5.0% |
업 | 1482 | 3.1% |
정 | 1457 | 3.1% |
관 | 1299 | 2.8% |
행 | 1293 | 2.7% |
리 | 1108 | 2.4% |
지 | 928 | 2.0% |
시 | 903 | 1.9% |
제 | 859 | 1.8% |
조 | 789 | 1.7% |
Other values (537) | 34676 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 21 | |
l | 16 | 9.2% |
i | 14 | 8.0% |
o | 14 | 8.0% |
d | 12 | 6.9% |
a | 12 | 6.9% |
r | 12 | 6.9% |
t | 11 | 6.3% |
s | 10 | 5.7% |
c | 8 | 4.6% |
Other values (13) | 44 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 76 | |
P | 49 | |
D | 40 | |
L | 31 | 7.5% |
A | 23 | 5.5% |
S | 23 | 5.5% |
E | 22 | 5.3% |
H | 20 | 4.8% |
R | 19 | 4.6% |
B | 18 | 4.3% |
Other values (12) | 95 |
Decimal Number
Value | Count | Frequency (%) |
1 | 28 | |
8 | 25 | |
2 | 17 | |
4 | 9 | 8.3% |
0 | 9 | 8.3% |
6 | 7 | 6.4% |
3 | 5 | 4.6% |
7 | 3 | 2.8% |
5 | 3 | 2.8% |
9 | 3 | 2.8% |
Other Punctuation
Value | Count | Frequency (%) |
, | 1557 | |
. | 125 | 6.9% |
/ | 74 | 4.1% |
* | 17 | 0.9% |
· | 16 | 0.9% |
& | 9 | 0.5% |
: | 4 | 0.2% |
' | 1 | 0.1% |
Space Separator
Value | Count | Frequency (%) |
6801 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 733 |
Open Punctuation
Value | Count | Frequency (%) |
( | 131 |
Close Punctuation
Value | Count | Frequency (%) |
) | 130 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 3 |
Math Symbol
Value | Count | Frequency (%) |
= | 2 |
Other Symbol
Value | Count | Frequency (%) |
㎡ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 47133 | |
Common | 9713 | 16.9% |
Latin | 590 | 1.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
공 | 2339 | 5.0% |
업 | 1482 | 3.1% |
정 | 1457 | 3.1% |
관 | 1299 | 2.8% |
행 | 1293 | 2.7% |
리 | 1108 | 2.4% |
지 | 928 | 2.0% |
시 | 903 | 1.9% |
제 | 859 | 1.8% |
조 | 789 | 1.7% |
Other values (537) | 34676 |
Latin
Value | Count | Frequency (%) |
C | 76 | 12.9% |
P | 49 | 8.3% |
D | 40 | 6.8% |
L | 31 | 5.3% |
A | 23 | 3.9% |
S | 23 | 3.9% |
E | 22 | 3.7% |
e | 21 | 3.6% |
H | 20 | 3.4% |
R | 19 | 3.2% |
Other values (35) | 266 |
Common
Value | Count | Frequency (%) |
6801 | ||
, | 1557 | 16.0% |
- | 733 | 7.5% |
( | 131 | 1.3% |
) | 130 | 1.3% |
. | 125 | 1.3% |
/ | 74 | 0.8% |
1 | 28 | 0.3% |
8 | 25 | 0.3% |
* | 17 | 0.2% |
Other values (15) | 92 | 0.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 47122 | |
ASCII | 10286 | 17.9% |
None | 16 | < 0.1% |
Compat Jamo | 11 | < 0.1% |
CJK Compat | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6801 | ||
, | 1557 | 15.1% |
- | 733 | 7.1% |
( | 131 | 1.3% |
) | 130 | 1.3% |
. | 125 | 1.2% |
C | 76 | 0.7% |
/ | 74 | 0.7% |
P | 49 | 0.5% |
D | 40 | 0.4% |
Other values (58) | 570 | 5.5% |
Hangul
Value | Count | Frequency (%) |
공 | 2339 | 5.0% |
업 | 1482 | 3.1% |
정 | 1457 | 3.1% |
관 | 1299 | 2.8% |
행 | 1293 | 2.7% |
리 | 1108 | 2.4% |
지 | 928 | 2.0% |
시 | 903 | 1.9% |
제 | 859 | 1.8% |
조 | 789 | 1.7% |
Other values (533) | 34665 |
None
Value | Count | Frequency (%) |
· | 16 |
Compat Jamo
Value | Count | Frequency (%) |
ㅇ | 8 | |
ㅋ | 1 | 9.1% |
ㆍ | 1 | 9.1% |
ㅐ | 1 | 9.1% |
CJK Compat
Value | Count | Frequency (%) |
㎡ | 1 |
홈페이지
Text
MISSING
 
Distinct | 1548 |
---|---|
Distinct (%) | 52.3% |
Missing | 7039 |
Missing (%) | 70.4% |
Memory size | 156.2 KiB |
Length
Max length | 98 |
---|---|
Median length | 73 |
Mean length | 22.390746 |
Min length | 1 |
Characters and Unicode
Total characters | 66299 |
---|---|
Distinct characters | 198 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 1128 ? |
---|---|
Unique (%) | 38.1% |
Sample
1st row | www.rch.or.kr |
---|---|
2nd row | www.poscocnc.com |
3rd row | www.knuh.or.kr |
4th row | http://seobu-market.gwangju.go.kr |
5th row | http://www.dgs.go.kr |
Value | Count | Frequency (%) |
http://corporate.homeplus.co.kr | 173 | 5.7% |
www.hf.go.kr | 52 | 1.7% |
www.snu.ac.kr | 33 | 1.1% |
http://www.bsnamgu.go.kr | 26 | 0.9% |
http://seogu.gwangju.kr | 26 | 0.9% |
http://yeosu.go.kr | 23 | 0.8% |
http://www.wonju.go.kr | 23 | 0.8% |
www.kwater.or.kr | 20 | 0.7% |
18 | 0.6% | |
http://www.goryeong.go.kr | 17 | 0.6% |
Other values (1548) | 2601 |
Most occurring characters
Value | Count | Frequency (%) |
. | 8168 | 12.3% |
w | 7079 | 10.7% |
o | 4887 | 7.4% |
/ | 4536 | 6.8% |
t | 4355 | 6.6% |
r | 4083 | 6.2% |
k | 3201 | 4.8% |
h | 2697 | 4.1% |
p | 2647 | 4.0% |
c | 2594 | 3.9% |
Other values (188) | 22052 |
Most occurring categories
Value | Count | Frequency (%) |
Lowercase Letter | 50478 | |
Other Punctuation | 14417 | 21.7% |
Decimal Number | 608 | 0.9% |
Other Letter | 304 | 0.5% |
Uppercase Letter | 156 | 0.2% |
Dash Punctuation | 127 | 0.2% |
Connector Punctuation | 94 | 0.1% |
Math Symbol | 62 | 0.1% |
Space Separator | 51 | 0.1% |
Close Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 14 | 4.6% |
이 | 11 | 3.6% |
청 | 8 | 2.6% |
장 | 7 | 2.3% |
없 | 7 | 2.3% |
본 | 6 | 2.0% |
로 | 6 | 2.0% |
일 | 6 | 2.0% |
도 | 6 | 2.0% |
음 | 6 | 2.0% |
Other values (115) | 227 |
Lowercase Letter
Value | Count | Frequency (%) |
w | 7079 | |
o | 4887 | 9.7% |
t | 4355 | 8.6% |
r | 4083 | 8.1% |
k | 3201 | 6.3% |
h | 2697 | 5.3% |
p | 2647 | 5.2% |
c | 2594 | 5.1% |
n | 2491 | 4.9% |
g | 2368 | 4.7% |
Other values (16) | 14076 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 20 | |
I | 17 | |
W | 15 | |
K | 12 | 7.7% |
C | 11 | 7.1% |
S | 11 | 7.1% |
M | 10 | 6.4% |
R | 9 | 5.8% |
D | 7 | 4.5% |
H | 7 | 4.5% |
Other values (11) | 37 |
Other Punctuation
Value | Count | Frequency (%) |
. | 8168 | |
/ | 4536 | |
: | 1632 | 11.3% |
? | 46 | 0.3% |
& | 16 | 0.1% |
@ | 8 | 0.1% |
, | 8 | 0.1% |
' | 1 | < 0.1% |
; | 1 | < 0.1% |
# | 1 | < 0.1% |
Decimal Number
Value | Count | Frequency (%) |
0 | 204 | |
1 | 188 | |
2 | 75 | 12.3% |
3 | 32 | 5.3% |
9 | 30 | 4.9% |
5 | 27 | 4.4% |
4 | 21 | 3.5% |
6 | 14 | 2.3% |
7 | 9 | 1.5% |
8 | 8 | 1.3% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 127 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 94 |
Math Symbol
Value | Count | Frequency (%) |
= | 62 |
Space Separator
Value | Count | Frequency (%) |
51 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Latin | 50634 | |
Common | 15361 | 23.2% |
Hangul | 304 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 14 | 4.6% |
이 | 11 | 3.6% |
청 | 8 | 2.6% |
장 | 7 | 2.3% |
없 | 7 | 2.3% |
본 | 6 | 2.0% |
로 | 6 | 2.0% |
일 | 6 | 2.0% |
도 | 6 | 2.0% |
음 | 6 | 2.0% |
Other values (115) | 227 |
Latin
Value | Count | Frequency (%) |
w | 7079 | |
o | 4887 | 9.7% |
t | 4355 | 8.6% |
r | 4083 | 8.1% |
k | 3201 | 6.3% |
h | 2697 | 5.3% |
p | 2647 | 5.2% |
c | 2594 | 5.1% |
n | 2491 | 4.9% |
g | 2368 | 4.7% |
Other values (37) | 14232 |
Common
Value | Count | Frequency (%) |
. | 8168 | |
/ | 4536 | |
: | 1632 | 10.6% |
0 | 204 | 1.3% |
1 | 188 | 1.2% |
- | 127 | 0.8% |
_ | 94 | 0.6% |
2 | 75 | 0.5% |
= | 62 | 0.4% |
51 | 0.3% | |
Other values (16) | 224 | 1.5% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 65995 | |
Hangul | 303 | 0.5% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
. | 8168 | 12.4% |
w | 7079 | 10.7% |
o | 4887 | 7.4% |
/ | 4536 | 6.9% |
t | 4355 | 6.6% |
r | 4083 | 6.2% |
k | 3201 | 4.9% |
h | 2697 | 4.1% |
p | 2647 | 4.0% |
c | 2594 | 3.9% |
Other values (63) | 21748 |
Hangul
Value | Count | Frequency (%) |
사 | 14 | 4.6% |
이 | 11 | 3.6% |
청 | 8 | 2.6% |
장 | 7 | 2.3% |
없 | 7 | 2.3% |
본 | 6 | 2.0% |
로 | 6 | 2.0% |
일 | 6 | 2.0% |
도 | 6 | 2.0% |
음 | 6 | 2.0% |
Other values (114) | 226 |
Compat Jamo
Value | Count | Frequency (%) |
ㄷ | 1 |
2016
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대상 | |
---|---|
대상아님 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.613 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대상 |
---|---|
2nd row | 대상아님 |
3rd row | 대상아님 |
4th row | 대상 |
5th row | 대상 |
Common Values
Value | Count | Frequency (%) |
대상 | 6935 | |
대상아님 | 3065 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대상 | 6935 | |
대상아님 | 3065 |
2017
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대상 | |
---|---|
대상아님 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.6002 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대상 |
---|---|
2nd row | 대상아님 |
3rd row | 대상아님 |
4th row | 대상 |
5th row | 대상 |
Common Values
Value | Count | Frequency (%) |
대상 | 6999 | |
대상아님 | 3001 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대상 | 6999 | |
대상아님 | 3001 |
2018
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대상 | |
---|---|
대상아님 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.6086 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대상 |
---|---|
2nd row | 대상아님 |
3rd row | 대상아님 |
4th row | 대상 |
5th row | 대상 |
Common Values
Value | Count | Frequency (%) |
대상 | 6957 | |
대상아님 | 3043 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대상 | 6957 | |
대상아님 | 3043 |
2019
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
대상제외 | |
---|---|
대상 | |
<NA> | |
대상(제외신청 거절) | 52 |
대상제외신청중 | 1 |
Length
Max length | 11 |
---|---|
Median length | 4 |
Mean length | 3.4891 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | < 0.1% |
Sample
1st row | 대상제외 |
---|---|
2nd row | <NA> |
3rd row | <NA> |
4th row | 대상제외 |
5th row | 대상제외 |
Common Values
Value | Count | Frequency (%) |
대상제외 | 4475 | |
대상 | 2738 | |
<NA> | 2734 | |
대상(제외신청 거절) | 52 | 0.5% |
대상제외신청중 | 1 | < 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대상제외 | 4475 | |
대상 | 2738 | |
na | 2734 | |
대상(제외신청 | 52 | 0.5% |
거절 | 52 | 0.5% |
대상제외신청중 | 1 | < 0.1% |
번호 | 업체분야 | 업체특성 | 업체구분 | 업종 | 세부업종 | 2016 | 2017 | 2018 | 2019 | |
---|---|---|---|---|---|---|---|---|---|---|
번호 | 1.000 | 0.397 | 0.498 | 0.444 | 0.562 | 0.584 | 0.675 | 0.660 | 0.620 | 0.363 |
업체분야 | 0.397 | 1.000 | 0.773 | 0.323 | 0.908 | 0.953 | 0.222 | 0.188 | 0.197 | 0.476 |
업체특성 | 0.498 | 0.773 | 1.000 | 0.263 | 0.791 | 0.846 | 0.374 | 0.364 | 0.329 | 0.593 |
업체구분 | 0.444 | 0.323 | 0.263 | 1.000 | 0.295 | 0.335 | 0.389 | 0.389 | 0.352 | 0.882 |
업종 | 0.562 | 0.908 | 0.791 | 0.295 | 1.000 | 1.000 | 0.300 | 0.290 | 0.286 | 0.673 |
세부업종 | 0.584 | 0.953 | 0.846 | 0.335 | 1.000 | 1.000 | 0.337 | 0.313 | 0.314 | 0.705 |
2016 | 0.675 | 0.222 | 0.374 | 0.389 | 0.300 | 0.337 | 1.000 | 0.988 | 0.957 | 0.321 |
2017 | 0.660 | 0.188 | 0.364 | 0.389 | 0.290 | 0.313 | 0.988 | 1.000 | 0.985 | 0.322 |
2018 | 0.620 | 0.197 | 0.329 | 0.352 | 0.286 | 0.314 | 0.957 | 0.985 | 1.000 | 0.337 |
2019 | 0.363 | 0.476 | 0.593 | 0.882 | 0.673 | 0.705 | 0.321 | 0.322 | 0.337 | 1.000 |
업체구분 | 업체분야 | 2017 | 업체특성 | 2016 | 2018 | 2019 | 업종 | |
---|---|---|---|---|---|---|---|---|
업체구분 | 1.000 | 0.232 | 0.254 | 0.251 | 0.254 | 0.229 | 0.689 | 0.233 |
업체분야 | 0.232 | 1.000 | 0.135 | 0.539 | 0.160 | 0.142 | 0.325 | 0.716 |
2017 | 0.254 | 0.135 | 1.000 | 0.349 | 0.901 | 0.891 | 0.215 | 0.229 |
업체특성 | 0.251 | 0.539 | 0.349 | 1.000 | 0.358 | 0.315 | 0.398 | 0.433 |
2016 | 0.254 | 0.160 | 0.901 | 0.358 | 1.000 | 0.813 | 0.214 | 0.237 |
2018 | 0.229 | 0.142 | 0.891 | 0.315 | 0.813 | 1.000 | 0.225 | 0.226 |
2019 | 0.689 | 0.325 | 0.215 | 0.398 | 0.214 | 0.225 | 1.000 | 0.380 |
업종 | 0.233 | 0.716 | 0.229 | 0.433 | 0.237 | 0.226 | 0.380 | 1.000 |
번호 | 업체분야 | 업체특성 | 업체구분 | 업종 | 2016 | 2017 | 2018 | 2019 | |
---|---|---|---|---|---|---|---|---|---|
번호 | 1.000 | 0.222 | 0.238 | 0.341 | 0.211 | 0.525 | 0.513 | 0.480 | 0.225 |
업체분야 | 0.222 | 1.000 | 0.539 | 0.232 | 0.716 | 0.160 | 0.135 | 0.142 | 0.325 |
업체특성 | 0.238 | 0.539 | 1.000 | 0.251 | 0.433 | 0.358 | 0.349 | 0.315 | 0.398 |
업체구분 | 0.341 | 0.232 | 0.251 | 1.000 | 0.233 | 0.254 | 0.254 | 0.229 | 0.689 |
업종 | 0.211 | 0.716 | 0.433 | 0.233 | 1.000 | 0.237 | 0.229 | 0.226 | 0.380 |
2016 | 0.525 | 0.160 | 0.358 | 0.254 | 0.237 | 1.000 | 0.901 | 0.813 | 0.214 |
2017 | 0.513 | 0.135 | 0.349 | 0.254 | 0.229 | 0.901 | 1.000 | 0.891 | 0.215 |
2018 | 0.480 | 0.142 | 0.315 | 0.229 | 0.226 | 0.813 | 0.891 | 1.000 | 0.225 |
2019 | 0.225 | 0.325 | 0.398 | 0.689 | 0.380 | 0.214 | 0.215 | 0.225 | 1.000 |
번호 | 업체명 | 업체분야 | 업체특성 | 업체구분 | 사업장명 | 업체 대표명 | 사업자등록번호 | 대표자 | 대표전화번호 | 주소 | 상세주소 | 업종 | 세부업종 | 주요업무 | 홈페이지 | 2016 | 2017 | 2018 | 2019 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
11982 | 11986 | 임실군청 | 공공행정 | 지방자치단체 | 사업장 | 임실군 청웅면사무소 | 전라북도 임실군 | 407-83-02560 | 임실군수 | <NA> | 전라북도 임실군 청웅면 청웅로 153 | <NA> | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | <NA> | <NA> | 대상 | 대상 | 대상 | 대상제외 |
10389 | 10391 | 롯데쇼핑(주) 본점(본사) | 기타서비스 | 온실가스목표관리업체 | 사업장 | 롯데시네마 | 롯데쇼핑(주) | 215-85-13462 | 강희태 | <NA> | 서울특별시 송파구 올림픽로 269 | 롯데캐슬골드 4층 롯데시네마 | 도매 및 소매업 | 소매업; 자동차 제외 | <NA> | <NA> | 대상아님 | 대상아님 | 대상아님 | <NA> |
16549 | 16552 | 한국남동발전(주) 영동화력발전처 | 제조 | 녹색기업 | 대표사업장 | 한국남동발전(주) 영동화력발전처 | 한국남동발전(주) | 226-85-22656 | 영동화력발전처장 | 033-640-3329 | 강원 강릉시 강동면 안인리 | 200 영동화력발전처 | 전기, 가스, 증기 및 수도사업 | 전기, 가스, 증기 및 공기조절 공급업 | - | <NA> | 대상아님 | 대상아님 | 대상아님 | <NA> |
8277 | 8279 | 은평구청 | 공공행정 | 지방자치단체 | 사업장 | 구립응암정보도서관 | 서울특별시 은평구 | 110-82-13924 | 김미경 | <NA> | 서울시 은평구 가좌로7길 15(응암동 730-3) | <NA> | 예술, 스포츠 및 여가관련 서비스업 | 창작, 예술 및 여가관련 서비스업 | <NA> | <NA> | 대상 | 대상 | 대상 | 대상제외 |
8290 | 8292 | 진주시청 | 공공행정 | 지방자치단체 | 사업장 | 사봉면 | 경상남도 진주시 | 613-83-01415 | 조규일 | <NA> | 경상남도 진주시 사봉면 사군로 105 | <NA> | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | <NA> | <NA> | 대상 | 대상 | 대상 | 대상제외 |
11272 | 11274 | 대한적십자사 | 보건 | 공공기관 | 사업장 | 대한적십자사 상주적십자병원 | 대한적십자사 | 511-82-00113 | 박경서 | 054-534-3501 | 경상북도 상주시 상서문로 53 | 대한적십자사 상주적십자병원 총무팀 | 보건업 및 사회복지 서비스업 | 보건업 | 의료 | www.rch.or.kr | 대상 | 대상 | 대상 | 대상제외 |
1865 | 1866 | 한국산림복지진흥원(본사) | 기타서비스 | 공공기관 | 사업장 | 국립칠곡숲체원 | 한국산림복지진흥원 | 827-82-00089 | 이창재 | 054-977-8773 | 경상북도 칠곡군 석적읍 성곡리 산73-13 | 국립칠곡숲체원 | 보건업 및 사회복지 서비스업 | 사회복지 서비스업 | 산림복지서비스 | <NA> | 대상아님 | 대상 | 대상 | 대상제외 |
14129 | 14131 | 포스코강판(주) 도금공장 | 제조 | 배출권할당대상업체 | 사업장 | 포스코강판(주) 컬러공장 | 포스코강판(주) | 506-81-05517 | 대표이사 | 054-280-6354 | 경상북도 포항시 남구 대송로 243 (괴동동) | 243 | 제조업 | 1차 금속 제조업 | 컬러강판 제조업 | www.poscocnc.com | 대상 | 대상 | 대상 | 대상 |
14604 | 14606 | 강원대학교병원 | 보건 | 공공기관 | 대표사업장 | 강원대학교병원 | 강원대학교병원 | 221-82-08323 | 이승준 | 033-258-9333 | 강원도 춘천시 백령로 156 | 강원대학교병원 | 보건업 및 사회복지 서비스업 | 보건업 | 의료서비스업 | www.knuh.or.kr | 대상 | 대상 | 대상 | 대상 |
17578 | 17598 | 서부농수산물도매시장관리사무소 | 공공행정 | 지방공사 | 대표사업장 | 서부농수산물도매시장관리사무소 | <NA> | 410-83-06067 | 변주봉 | 062-613-5475 | 광주광역시 서구 매월2로 16 | 서부농수산물도매시장관리사무소 | 농업,임업 및 어업 | 농업 | 농수산물 유통거래 | http://seobu-market.gwangju.go.kr | 대상아님 | 대상아님 | 대상아님 | <NA> |
번호 | 업체명 | 업체분야 | 업체특성 | 업체구분 | 사업장명 | 업체 대표명 | 사업자등록번호 | 대표자 | 대표전화번호 | 주소 | 상세주소 | 업종 | 세부업종 | 주요업무 | 홈페이지 | 2016 | 2017 | 2018 | 2019 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
16763 | 16765 | (주)한화구미사업장 | 제조 | 온실가스목표관리업체 | 대표사업장 | (주)한화구미사업장 | <NA> | 513-85-12203 | 심경섭 | 054-467-8573 | 경상북도 구미시 산호대로 264-36 | <NA> | 제조업 | 식료품 제조업 | 한화구미사업장 | <NA> | 대상아님 | 대상아님 | 대상아님 | <NA> |
6126 | 6127 | 청양군청 | 공공행정 | 지방자치단체 | 사업장 | 공공시설사업소(칠갑산휴양림) | 충청남도 청양군청 | 307-83-01257 | 청양군수 | <NA> | 충청남도 청양군 대치면 칠갑산로 668-103 | <NA> | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | <NA> | <NA> | 대상 | 대상 | 대상 | 대상제외 |
9431 | 9433 | 한국보건복지인력개발원 | 교육서비스 | 공공기관 | 대표사업장 | 한국보건복지인력개발원 | 한국보건복지인력개발원 | 110-82-10761 | 허선 | 043-710-9135 | 충청북도 청주시 흥덕구 오송읍 오송생명2로 187 | 오송생명과학단지 한국보건복지인력개발원 | 교육 서비스업 | 교육 서비스업 | 교육서비스 | http://www.kohi.or.kr | 대상 | 대상 | 대상 | 대상 |
13517 | 13519 | 광주광역시청 | 공공행정 | 지방자치단체 | 사업장 | 시립도서관 | 광주광역시 | 409-83-02718 | 이용섭 | 062-613-7712 | 광주광역시 북구 면앙로 130 | 광주광역시시립도서관 | 부동산업 및 임대업 | 임대업;부동산 제외 | 시립도서관 관리업무 | <NA> | 대상 | 대상 | 대상 | 대상제외 |
1834 | 1835 | 보성군청 | 공공행정 | 지방자치단체 | 사업장 | 노동면사무소 | 전라남도 보성군 | 413-83-00077 | 보성군수 | <NA> | 전라남도 보성군 노동면 광곡길 28 | <NA> | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | <NA> | <NA> | 대상 | 대상 | 대상 | 대상제외 |
3315 | 3316 | 제주소방서 | 공공행정 | 지방자치단체 | 대표사업장 | 제주소방서 | 제주소방서 | 616-83-00055 | 윤두진 | 064-729-0142 | 제주특별자치도 제주시 중앙로 342 | 제주소방서 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 화재,구조,구급,예방, 사회안전 | <NA> | 대상아님 | 대상아님 | 대상아님 | <NA> |
10403 | 10405 | (주)이마트(본사+성수점) | 기타서비스 | 배출권할당대상업체 | 대표사업장 | (주)이마트(본사+성수점) | 강희석 | 206-86-50913 | 강희석 | 02-380-9209 | 서울특별시 성동구 뚝섬로 377 | 이마트 본사 및 이마트 성수점 | 도매 및 소매업 | 소매업; 자동차 제외 | 본사 | <NA> | 대상 | 대상 | 대상 | 대상 |
5628 | 5629 | 파주시청 | 공공행정 | 지방자치단체 | 대표사업장 | 파주시청 | 경기도 파주시 | 128-83-00937 | 최종환 | 031-940-4453 | 경기도 파주시 시청로 50 | 파주시청 | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | 공공기관 | http://www.paju.go.kr/main/main.tdf?a=user.index.IndexApp&c=1001 | 대상 | 대상 | 대상 | 대상 |
14900 | 14902 | 한국철도공사 | 기타산업 | 온실가스목표관리업체 | 사업장 | 한국철도공사_부산경남본부 | 손병석 | 314-82-10024 | 손병석 | 051-440-2828 | 부산광역시 동구 중앙대로 206 | 한국철도공사 부산경남본부 | 운수업 | 창고 및 운송관련 서비스업 | 운송사업 | korail.com | 대상 | 대상 | 대상 | 대상 |
17168 | 17164 | 남면사무소 | 공공행정 | 지방자치단체 | 대표사업장 | 남면사무소 | <NA> | 310-83-01379 | 박종관 | 041-670-5134 | 충청남도 태안군 남면 달산포로 311 | <NA> | 공공행정, 국방 및 사회보장 행정 | 공공행정, 국방 및 사회보장 행정 | - | <NA> | 대상아님 | 대상아님 | 대상아님 | <NA> |