Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 1702 |
Missing cells | 2632 |
Missing cells (%) | 11.9% |
Duplicate rows | 6 |
Duplicate rows (%) | 0.4% |
Total size in memory | 181.3 KiB |
Average record size in memory | 109.1 B |
Variable types
Text | 4 |
---|---|
Numeric | 2 |
Categorical | 5 |
Boolean | 1 |
Unsupported | 1 |
Dataset
Description | 업체(시설)명,인허가번호,업종코드,업종명,지도점검일자,점검기관,점검기관명,지도점검구분,처분대상여부,점검사항,점검결과,소재지도로명주소,소재지주소 |
---|---|
Author | 강남구 |
URL | https://data.seoul.go.kr/dataList/OA-11279/S/1/datasetView.do |
점검기관 has constant value "" | Constant |
점검기관명 has constant value "" | Constant |
Dataset has 6 (0.4%) duplicate rows | Duplicates |
업종코드 is highly overall correlated with 인허가번호 and 1 other fields | High correlation |
업종명 is highly overall correlated with 인허가번호 and 1 other fields | High correlation |
인허가번호 is highly overall correlated with 업종코드 and 1 other fields | High correlation |
지도점검구분 is highly imbalanced (65.3%) | Imbalance |
처분대상여부 is highly imbalanced (94.7%) | Imbalance |
처분대상여부 has 23 (1.4%) missing values | Missing |
점검결과 has 1702 (100.0%) missing values | Missing |
소재지도로명주소 has 765 (44.9%) missing values | Missing |
소재지주소 has 140 (8.2%) missing values | Missing |
점검결과 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-05-11 08:02:27.986232 |
---|---|
Analysis finished | 2024-05-11 08:02:29.926180 |
Duration | 1.94 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업체(시설)명
Text
Distinct | 680 |
---|---|
Distinct (%) | 40.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.4 KiB |
Length
Max length | 30 |
---|---|
Median length | 24 |
Mean length | 8.5346651 |
Min length | 2 |
Characters and Unicode
Total characters | 14526 |
---|---|
Distinct characters | 457 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 271 ? |
---|---|
Unique (%) | 15.9% |
Sample
1st row | 한국자산관리공사(캠코양재타워) |
---|---|
2nd row | 능인선원 |
3rd row | 한국지역난방공사 강남지사(수서열원) |
4th row | 강남자원회수시설 |
5th row | 서울시탄천물재생센터((주)탄천환경) |
Value | Count | Frequency (%) |
덴트닥터칼라 | 21 | 1.1% |
삼성서울병원 | 18 | 0.9% |
논현점 | 15 | 0.8% |
논현서비스프라자 | 14 | 0.7% |
쌍용자동차 | 14 | 0.7% |
서울자동차서비스 | 13 | 0.7% |
코션코리아역삼 | 13 | 0.7% |
강남자원회수시설 | 13 | 0.7% |
강남제일세차장 | 13 | 0.7% |
애니카랜드 | 13 | 0.7% |
Other values (751) | 1839 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 802 | 5.5% |
) | 693 | 4.8% |
( | 690 | 4.8% |
스 | 429 | 3.0% |
동 | 346 | 2.4% |
자 | 302 | 2.1% |
차 | 297 | 2.0% |
284 | 2.0% | |
사 | 233 | 1.6% |
성 | 220 | 1.5% |
Other values (447) | 10230 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 12571 | |
Close Punctuation | 693 | 4.8% |
Open Punctuation | 690 | 4.8% |
Space Separator | 284 | 2.0% |
Uppercase Letter | 186 | 1.3% |
Decimal Number | 62 | 0.4% |
Lowercase Letter | 23 | 0.2% |
Other Punctuation | 11 | 0.1% |
Dash Punctuation | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 802 | 6.4% |
스 | 429 | 3.4% |
동 | 346 | 2.8% |
자 | 302 | 2.4% |
차 | 297 | 2.4% |
사 | 233 | 1.9% |
성 | 220 | 1.8% |
서 | 220 | 1.8% |
터 | 213 | 1.7% |
삼 | 204 | 1.6% |
Other values (405) | 9305 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 59 | |
K | 39 | |
G | 24 | |
L | 8 | 4.3% |
O | 6 | 3.2% |
P | 6 | 3.2% |
B | 6 | 3.2% |
C | 5 | 2.7% |
R | 5 | 2.7% |
M | 4 | 2.2% |
Other values (10) | 24 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 10 | |
y | 4 | 17.4% |
f | 2 | 8.7% |
h | 2 | 8.7% |
u | 2 | 8.7% |
l | 1 | 4.3% |
s | 1 | 4.3% |
i | 1 | 4.3% |
Decimal Number
Value | Count | Frequency (%) |
1 | 33 | |
9 | 11 | 17.7% |
2 | 6 | 9.7% |
6 | 6 | 9.7% |
3 | 3 | 4.8% |
4 | 2 | 3.2% |
8 | 1 | 1.6% |
Other Punctuation
Value | Count | Frequency (%) |
& | 6 | |
. | 4 | |
, | 1 | 9.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 693 |
Open Punctuation
Value | Count | Frequency (%) |
( | 690 |
Space Separator
Value | Count | Frequency (%) |
284 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 6 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 12571 | |
Common | 1746 | 12.0% |
Latin | 209 | 1.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 802 | 6.4% |
스 | 429 | 3.4% |
동 | 346 | 2.8% |
자 | 302 | 2.4% |
차 | 297 | 2.4% |
사 | 233 | 1.9% |
성 | 220 | 1.8% |
서 | 220 | 1.8% |
터 | 213 | 1.7% |
삼 | 204 | 1.6% |
Other values (405) | 9305 |
Latin
Value | Count | Frequency (%) |
S | 59 | |
K | 39 | |
G | 24 | |
e | 10 | 4.8% |
L | 8 | 3.8% |
O | 6 | 2.9% |
P | 6 | 2.9% |
B | 6 | 2.9% |
C | 5 | 2.4% |
R | 5 | 2.4% |
Other values (18) | 41 |
Common
Value | Count | Frequency (%) |
) | 693 | |
( | 690 | |
284 | ||
1 | 33 | 1.9% |
9 | 11 | 0.6% |
2 | 6 | 0.3% |
6 | 6 | 0.3% |
& | 6 | 0.3% |
- | 6 | 0.3% |
. | 4 | 0.2% |
Other values (4) | 7 | 0.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 12571 | |
ASCII | 1955 | 13.5% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 802 | 6.4% |
스 | 429 | 3.4% |
동 | 346 | 2.8% |
자 | 302 | 2.4% |
차 | 297 | 2.4% |
사 | 233 | 1.9% |
성 | 220 | 1.8% |
서 | 220 | 1.8% |
터 | 213 | 1.7% |
삼 | 204 | 1.6% |
Other values (405) | 9305 |
ASCII
Value | Count | Frequency (%) |
) | 693 | |
( | 690 | |
284 | ||
S | 59 | 3.0% |
K | 39 | 2.0% |
1 | 33 | 1.7% |
G | 24 | 1.2% |
9 | 11 | 0.6% |
e | 10 | 0.5% |
L | 8 | 0.4% |
Other values (32) | 104 | 5.3% |
인허가번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 650 |
---|---|
Distinct (%) | 38.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.2200002 × 1017 |
Minimum | 3.2200002 × 1017 |
---|---|
Maximum | 3.2200006 × 1017 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 15.1 KiB |
Quantile statistics
Minimum | 3.2200002 × 1017 |
---|---|
5-th percentile | 3.2200002 × 1017 |
Q1 | 3.2200002 × 1017 |
median | 3.2200002 × 1017 |
Q3 | 3.2200002 × 1017 |
95-th percentile | 3.2200003 × 1017 |
Maximum | 3.2200006 × 1017 |
Range | 4.00026 × 1010 |
Interquartile range (IQR) | 9.9939994 × 108 |
Descriptive statistics
Standard deviation | 1.421301 × 109 |
---|---|
Coefficient of variation (CV) | 4.4139779 × 10-9 |
Kurtosis | 334.77662 |
Mean | 3.2200002 × 1017 |
Median Absolute Deviation (MAD) | 999552 |
Skewness | 12.96589 |
Sum | -5.3582845 × 1018 |
Variance | 2.0200964 × 1018 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
322000022200900001 | 21 | 1.2% |
322000022200600001 | 16 | 0.9% |
322000022199700185 | 14 | 0.8% |
322000022200900015 | 14 | 0.8% |
322000022200100145 | 13 | 0.8% |
322000022200700007 | 13 | 0.8% |
322000022199600034 | 12 | 0.7% |
322000021199800143 | 11 | 0.6% |
322000022200800018 | 11 | 0.6% |
322000021199300161 | 11 | 0.6% |
Other values (640) | 1566 |
Value | Count | Frequency (%) |
322000021199100145 | 1 | 0.1% |
322000021199100147 | 6 | |
322000021199100152 | 7 | |
322000021199200155 | 10 | |
322000021199300161 | 11 | |
322000021199400163 | 9 | |
322000021199400164 | 11 | |
322000021199400168 | 10 | |
322000021199500167 | 3 | 0.2% |
322000021199500169 | 1 | 0.1% |
Value | Count | Frequency (%) |
322000061201700001 | 1 | |
322000025201600006 | 1 | |
322000025201600005 | 1 | |
322000025201600004 | 1 | |
322000025201600003 | 1 | |
322000025201500007 | 2 | |
322000025201500006 | 1 | |
322000025201500005 | 2 | |
322000025201500004 | 2 | |
322000025201500003 | 2 |
업종코드
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.4 KiB |
22 | |
---|---|
21 | |
25 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 21 |
---|---|
2nd row | 21 |
3rd row | 21 |
4th row | 21 |
5th row | 21 |
Common Values
Value | Count | Frequency (%) |
22 | 991 | |
21 | 560 | |
25 | 151 | 8.9% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
22 | 991 | |
21 | 560 | |
25 | 151 | 8.9% |
업종명
Categorical
HIGH CORRELATION
 
Distinct | 4 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.4 KiB |
폐수배출업소관리 | |
---|---|
대기배출업소관리 | |
기타수질오염원관리 | |
<NA> | 22 |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 8.0370153 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 대기배출업소관리 |
---|---|
2nd row | 대기배출업소관리 |
3rd row | 대기배출업소관리 |
4th row | 대기배출업소관리 |
5th row | 대기배출업소관리 |
Common Values
Value | Count | Frequency (%) |
폐수배출업소관리 | 976 | |
대기배출업소관리 | 553 | |
기타수질오염원관리 | 151 | 8.9% |
<NA> | 22 | 1.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
폐수배출업소관리 | 976 | |
대기배출업소관리 | 553 | |
기타수질오염원관리 | 151 | 8.9% |
na | 22 | 1.3% |
지도점검일자
Real number (ℝ)
Distinct | 420 |
---|---|
Distinct (%) | 24.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20140527 |
Minimum | 20100204 |
---|---|
Maximum | 20171130 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 15.1 KiB |
Quantile statistics
Minimum | 20100204 |
---|---|
5-th percentile | 20100812 |
Q1 | 20111224 |
median | 20150706 |
Q3 | 20161110 |
95-th percentile | 20171115 |
Maximum | 20171130 |
Range | 70926 |
Interquartile range (IQR) | 49886.25 |
Descriptive statistics
Standard deviation | 25687.091 |
---|---|
Coefficient of variation (CV) | 0.0012753932 |
Kurtosis | -1.4732864 |
Mean | 20140527 |
Median Absolute Deviation (MAD) | 20079 |
Skewness | -0.28945091 |
Sum | 3.4279177 × 1010 |
Variance | 6.5982667 × 108 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
20161020 | 28 | 1.6% |
20100914 | 26 | 1.5% |
20161026 | 22 | 1.3% |
20100913 | 19 | 1.1% |
20100915 | 18 | 1.1% |
20171116 | 16 | 0.9% |
20171114 | 16 | 0.9% |
20161018 | 15 | 0.9% |
20171115 | 15 | 0.9% |
20161021 | 14 | 0.8% |
Other values (410) | 1513 |
Value | Count | Frequency (%) |
20100204 | 2 | |
20100205 | 4 | |
20100212 | 1 | 0.1% |
20100217 | 1 | 0.1% |
20100222 | 1 | 0.1% |
20100428 | 1 | 0.1% |
20100513 | 1 | 0.1% |
20100609 | 1 | 0.1% |
20100610 | 1 | 0.1% |
20100621 | 3 |
Value | Count | Frequency (%) |
20171130 | 7 | |
20171129 | 13 | |
20171127 | 7 | |
20171124 | 11 | |
20171122 | 7 | |
20171121 | 13 | |
20171117 | 11 | |
20171116 | 16 | |
20171115 | 15 | |
20171114 | 16 |
점검기관
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.4 KiB |
3220000 |
---|
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 3220000 |
---|---|
2nd row | 3220000 |
3rd row | 3220000 |
4th row | 3220000 |
5th row | 3220000 |
Common Values
Value | Count | Frequency (%) |
3220000 | 1702 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
3220000 | 1702 |
점검기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.4 KiB |
서울특별시 강남구 |
---|
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 강남구 |
---|---|
2nd row | 서울특별시 강남구 |
3rd row | 서울특별시 강남구 |
4th row | 서울특별시 강남구 |
5th row | 서울특별시 강남구 |
Common Values
Value | Count | Frequency (%) |
서울특별시 강남구 | 1702 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 1702 | |
강남구 | 1702 |
지도점검구분
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 13.4 KiB |
정기 | |
---|---|
수시 | |
기타 | 56 |
일제 | 12 |
합동 | 10 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 정기 |
---|---|
2nd row | 정기 |
3rd row | 정기 |
4th row | 정기 |
5th row | 정기 |
Common Values
Value | Count | Frequency (%) |
정기 | 1441 | |
수시 | 183 | 10.8% |
기타 | 56 | 3.3% |
일제 | 12 | 0.7% |
합동 | 10 | 0.6% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정기 | 1441 | |
수시 | 183 | 10.8% |
기타 | 56 | 3.3% |
일제 | 12 | 0.7% |
합동 | 10 | 0.6% |
처분대상여부
Boolean
IMBALANCE
  MISSING
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 23 |
Missing (%) | 1.4% |
Memory size | 3.5 KiB |
False | |
---|---|
True | 10 |
(Missing) | 23 |
Value | Count | Frequency (%) |
False | 1669 | |
True | 10 | 0.6% |
(Missing) | 23 | 1.4% |
점검사항
Text
Distinct | 137 |
---|---|
Distinct (%) | 8.1% |
Missing | 2 |
Missing (%) | 0.1% |
Memory size | 13.4 KiB |
Length
Max length | 67 |
---|---|
Median length | 54 |
Mean length | 17.264118 |
Min length | 6 |
Characters and Unicode
Total characters | 29349 |
---|---|
Distinct characters | 132 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 4 ? |
Unique
Unique | 73 ? |
---|---|
Unique (%) | 4.3% |
Sample
1st row | 대기배출시설 및 방지시설 적정 운영 여부 |
---|---|
2nd row | 대기배출시설 및 방지시설 적정 운영 여부 |
3rd row | 대기배출시설 및 방지시설 적정 운영 여부 |
4th row | 대기배출시설 및 방지시설 적정 운영 여부 |
5th row | 대기배출시설 및 방지시설 적정 운영 여부 |
Value | Count | Frequency (%) |
및 | 1091 | |
방지시설 | 1082 | |
폐수배출시설 | 693 | |
대기배출시설 | 473 | 6.9% |
가동상태 | 453 | 6.6% |
배출시설 | 403 | 5.8% |
점검 | 400 | 5.8% |
운영상태 | 396 | 5.7% |
여부 | 382 | 5.5% |
적정 | 257 | 3.7% |
Other values (134) | 1272 |
Most occurring characters
Value | Count | Frequency (%) |
5205 | ||
시 | 2738 | 9.3% |
설 | 2698 | 9.2% |
배 | 1624 | 5.5% |
출 | 1623 | 5.5% |
지 | 1204 | 4.1% |
및 | 1096 | 3.7% |
방 | 1089 | 3.7% |
운 | 1035 | 3.5% |
영 | 1029 | 3.5% |
Other values (122) | 10008 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 23892 | |
Space Separator | 5205 | 17.7% |
Other Punctuation | 95 | 0.3% |
Decimal Number | 52 | 0.2% |
Dash Punctuation | 45 | 0.2% |
Open Punctuation | 30 | 0.1% |
Close Punctuation | 30 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 2738 | 11.5% |
설 | 2698 | 11.3% |
배 | 1624 | 6.8% |
출 | 1623 | 6.8% |
지 | 1204 | 5.0% |
및 | 1096 | 4.6% |
방 | 1089 | 4.6% |
운 | 1035 | 4.3% |
영 | 1029 | 4.3% |
상 | 901 | 3.8% |
Other values (105) | 8855 |
Decimal Number
Value | Count | Frequency (%) |
1 | 21 | |
0 | 20 | |
4 | 3 | 5.8% |
3 | 2 | 3.8% |
6 | 2 | 3.8% |
7 | 1 | 1.9% |
8 | 1 | 1.9% |
9 | 1 | 1.9% |
2 | 1 | 1.9% |
Other Punctuation
Value | Count | Frequency (%) |
. | 50 | |
, | 25 | |
% | 19 | 20.0% |
? | 1 | 1.1% |
Space Separator
Value | Count | Frequency (%) |
5205 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 45 |
Open Punctuation
Value | Count | Frequency (%) |
( | 30 |
Close Punctuation
Value | Count | Frequency (%) |
) | 30 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 23892 | |
Common | 5457 | 18.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 2738 | 11.5% |
설 | 2698 | 11.3% |
배 | 1624 | 6.8% |
출 | 1623 | 6.8% |
지 | 1204 | 5.0% |
및 | 1096 | 4.6% |
방 | 1089 | 4.6% |
운 | 1035 | 4.3% |
영 | 1029 | 4.3% |
상 | 901 | 3.8% |
Other values (105) | 8855 |
Common
Value | Count | Frequency (%) |
5205 | ||
. | 50 | 0.9% |
- | 45 | 0.8% |
( | 30 | 0.5% |
) | 30 | 0.5% |
, | 25 | 0.5% |
1 | 21 | 0.4% |
0 | 20 | 0.4% |
% | 19 | 0.3% |
4 | 3 | 0.1% |
Other values (7) | 9 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 23891 | |
ASCII | 5456 | 18.6% |
None | 1 | < 0.1% |
Compat Jamo | 1 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
5205 | ||
. | 50 | 0.9% |
- | 45 | 0.8% |
( | 30 | 0.5% |
) | 30 | 0.5% |
, | 25 | 0.5% |
1 | 21 | 0.4% |
0 | 20 | 0.4% |
% | 19 | 0.3% |
4 | 3 | 0.1% |
Other values (6) | 8 | 0.1% |
Hangul
Value | Count | Frequency (%) |
시 | 2738 | 11.5% |
설 | 2698 | 11.3% |
배 | 1624 | 6.8% |
출 | 1623 | 6.8% |
지 | 1204 | 5.0% |
및 | 1096 | 4.6% |
방 | 1089 | 4.6% |
운 | 1035 | 4.3% |
영 | 1029 | 4.3% |
상 | 901 | 3.8% |
Other values (104) | 8854 |
None
Value | Count | Frequency (%) |
? | 1 |
Compat Jamo
Value | Count | Frequency (%) |
ㅌ | 1 |
점검결과
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 1702 |
---|---|
Missing (%) | 100.0% |
Memory size | 15.1 KiB |
소재지도로명주소
Text
MISSING
 
Distinct | 518 |
---|---|
Distinct (%) | 55.3% |
Missing | 765 |
Missing (%) | 44.9% |
Memory size | 13.4 KiB |
Length
Max length | 47 |
---|---|
Median length | 42 |
Mean length | 27.665955 |
Min length | 22 |
Characters and Unicode
Total characters | 25923 |
---|---|
Distinct characters | 262 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 254 ? |
---|---|
Unique (%) | 27.1% |
Sample
1st row | 서울특별시 강남구 강남대로 262 (도곡동) |
---|---|
2nd row | 서울특별시 강남구 양재대로 340 (개포동, 능인선원) |
3rd row | 서울특별시 강남구 광평로39길 105 (수서동) |
4th row | 서울특별시 강남구 남부순환로 3318 (일원동) |
5th row | 서울특별시 강남구 개포로 625 (일원동, 탄천물재생센터) |
Value | Count | Frequency (%) |
서울특별시 | 937 | 18.4% |
강남구 | 937 | 18.4% |
역삼동 | 207 | 4.1% |
대치동 | 114 | 2.2% |
논현동 | 110 | 2.2% |
테헤란로 | 108 | 2.1% |
신사동 | 103 | 2.0% |
삼성동 | 89 | 1.7% |
개포동 | 59 | 1.2% |
언주로 | 57 | 1.1% |
Other values (681) | 2367 |
Most occurring characters
Value | Count | Frequency (%) |
4304 | 16.6% | |
남 | 1070 | 4.1% |
동 | 1030 | 4.0% |
강 | 1026 | 4.0% |
구 | 1002 | 3.9% |
서 | 982 | 3.8% |
로 | 951 | 3.7% |
) | 948 | 3.7% |
( | 948 | 3.7% |
울 | 948 | 3.7% |
Other values (252) | 12714 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15690 | |
Space Separator | 4304 | 16.6% |
Decimal Number | 3560 | 13.7% |
Close Punctuation | 948 | 3.7% |
Open Punctuation | 948 | 3.7% |
Other Punctuation | 377 | 1.5% |
Uppercase Letter | 57 | 0.2% |
Dash Punctuation | 38 | 0.1% |
Lowercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
남 | 1070 | 6.8% |
동 | 1030 | 6.6% |
강 | 1026 | 6.5% |
구 | 1002 | 6.4% |
서 | 982 | 6.3% |
로 | 951 | 6.1% |
울 | 948 | 6.0% |
시 | 946 | 6.0% |
특 | 937 | 6.0% |
별 | 937 | 6.0% |
Other values (221) | 5861 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 13 | |
A | 12 | |
S | 9 | |
K | 3 | 5.3% |
H | 3 | 5.3% |
C | 3 | 5.3% |
P | 3 | 5.3% |
D | 2 | 3.5% |
G | 2 | 3.5% |
Y | 2 | 3.5% |
Other values (3) | 5 | 8.8% |
Decimal Number
Value | Count | Frequency (%) |
1 | 718 | |
2 | 563 | |
3 | 406 | |
5 | 379 | |
4 | 323 | |
6 | 304 | |
0 | 274 | 7.7% |
7 | 253 | 7.1% |
8 | 218 | 6.1% |
9 | 122 | 3.4% |
Other Punctuation
Value | Count | Frequency (%) |
, | 374 | |
& | 2 | 0.5% |
/ | 1 | 0.3% |
Space Separator
Value | Count | Frequency (%) |
4304 |
Close Punctuation
Value | Count | Frequency (%) |
) | 948 |
Open Punctuation
Value | Count | Frequency (%) |
( | 948 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 38 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15690 | |
Common | 10175 | |
Latin | 58 | 0.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
남 | 1070 | 6.8% |
동 | 1030 | 6.6% |
강 | 1026 | 6.5% |
구 | 1002 | 6.4% |
서 | 982 | 6.3% |
로 | 951 | 6.1% |
울 | 948 | 6.0% |
시 | 946 | 6.0% |
특 | 937 | 6.0% |
별 | 937 | 6.0% |
Other values (221) | 5861 |
Common
Value | Count | Frequency (%) |
4304 | ||
) | 948 | 9.3% |
( | 948 | 9.3% |
1 | 718 | 7.1% |
2 | 563 | 5.5% |
3 | 406 | 4.0% |
5 | 379 | 3.7% |
, | 374 | 3.7% |
4 | 323 | 3.2% |
6 | 304 | 3.0% |
Other values (7) | 908 | 8.9% |
Latin
Value | Count | Frequency (%) |
B | 13 | |
A | 12 | |
S | 9 | |
K | 3 | 5.2% |
H | 3 | 5.2% |
C | 3 | 5.2% |
P | 3 | 5.2% |
D | 2 | 3.4% |
G | 2 | 3.4% |
Y | 2 | 3.4% |
Other values (4) | 6 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 15690 | |
ASCII | 10233 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4304 | ||
) | 948 | 9.3% |
( | 948 | 9.3% |
1 | 718 | 7.0% |
2 | 563 | 5.5% |
3 | 406 | 4.0% |
5 | 379 | 3.7% |
, | 374 | 3.7% |
4 | 323 | 3.2% |
6 | 304 | 3.0% |
Other values (21) | 966 | 9.4% |
Hangul
Value | Count | Frequency (%) |
남 | 1070 | 6.8% |
동 | 1030 | 6.6% |
강 | 1026 | 6.5% |
구 | 1002 | 6.4% |
서 | 982 | 6.3% |
로 | 951 | 6.1% |
울 | 948 | 6.0% |
시 | 946 | 6.0% |
특 | 937 | 6.0% |
별 | 937 | 6.0% |
Other values (221) | 5861 |
소재지주소
Text
MISSING
 
Distinct | 546 |
---|---|
Distinct (%) | 35.0% |
Missing | 140 |
Missing (%) | 8.2% |
Memory size | 13.4 KiB |
Length
Max length | 53 |
---|---|
Median length | 38 |
Mean length | 23.537772 |
Min length | 14 |
Characters and Unicode
Total characters | 36766 |
---|---|
Distinct characters | 178 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 219 ? |
---|---|
Unique (%) | 14.0% |
Sample
1st row | 서울특별시 강남구 도곡동 949-3번지 |
---|---|
2nd row | 서울특별시 강남구 개포동 1055번지 |
3rd row | 서울특별시 강남구 일원동 4-1번지 |
4th row | 서울특별시 강남구 일원동 580번지 |
5th row | 서울특별시 강남구 도곡동 448-2번지 |
Value | Count | Frequency (%) |
서울특별시 | 1562 | |
강남구 | 1562 | |
역삼동 | 313 | 4.6% |
신사동 | 308 | 4.5% |
논현동 | 184 | 2.7% |
대치동 | 157 | 2.3% |
삼성동 | 153 | 2.2% |
개포동 | 110 | 1.6% |
도곡동 | 85 | 1.2% |
청담동 | 77 | 1.1% |
Other values (653) | 2313 |
Most occurring characters
Value | Count | Frequency (%) |
6831 | ||
1 | 1638 | 4.5% |
서 | 1609 | 4.4% |
동 | 1591 | 4.3% |
지 | 1579 | 4.3% |
구 | 1575 | 4.3% |
시 | 1572 | 4.3% |
남 | 1568 | 4.3% |
강 | 1565 | 4.3% |
별 | 1562 | 4.2% |
Other values (168) | 15676 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 21525 | |
Decimal Number | 6909 | 18.8% |
Space Separator | 6831 | 18.6% |
Dash Punctuation | 1343 | 3.7% |
Other Punctuation | 51 | 0.1% |
Uppercase Letter | 36 | 0.1% |
Open Punctuation | 33 | 0.1% |
Close Punctuation | 33 | 0.1% |
Lowercase Letter | 3 | < 0.1% |
Math Symbol | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 1609 | 7.5% |
동 | 1591 | 7.4% |
지 | 1579 | 7.3% |
구 | 1575 | 7.3% |
시 | 1572 | 7.3% |
남 | 1568 | 7.3% |
강 | 1565 | 7.3% |
별 | 1562 | 7.3% |
특 | 1562 | 7.3% |
울 | 1562 | 7.3% |
Other values (146) | 5780 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1638 | |
2 | 994 | |
5 | 743 | |
3 | 639 | 9.2% |
6 | 578 | 8.4% |
7 | 541 | 7.8% |
4 | 468 | 6.8% |
8 | 451 | 6.5% |
9 | 434 | 6.3% |
0 | 423 | 6.1% |
Other Punctuation
Value | Count | Frequency (%) |
, | 48 | |
: | 2 | 3.9% |
/ | 1 | 2.0% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 17 | |
A | 16 | |
C | 3 | 8.3% |
Space Separator
Value | Count | Frequency (%) |
6831 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1343 |
Open Punctuation
Value | Count | Frequency (%) |
( | 33 |
Close Punctuation
Value | Count | Frequency (%) |
) | 33 |
Lowercase Letter
Value | Count | Frequency (%) |
a | 3 |
Math Symbol
Value | Count | Frequency (%) |
~ | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 21525 | |
Common | 15202 | |
Latin | 39 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 1609 | 7.5% |
동 | 1591 | 7.4% |
지 | 1579 | 7.3% |
구 | 1575 | 7.3% |
시 | 1572 | 7.3% |
남 | 1568 | 7.3% |
강 | 1565 | 7.3% |
별 | 1562 | 7.3% |
특 | 1562 | 7.3% |
울 | 1562 | 7.3% |
Other values (146) | 5780 |
Common
Value | Count | Frequency (%) |
6831 | ||
1 | 1638 | 10.8% |
- | 1343 | 8.8% |
2 | 994 | 6.5% |
5 | 743 | 4.9% |
3 | 639 | 4.2% |
6 | 578 | 3.8% |
7 | 541 | 3.6% |
4 | 468 | 3.1% |
8 | 451 | 3.0% |
Other values (8) | 976 | 6.4% |
Latin
Value | Count | Frequency (%) |
B | 17 | |
A | 16 | |
C | 3 | 7.7% |
a | 3 | 7.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 21525 | |
ASCII | 15241 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6831 | ||
1 | 1638 | 10.7% |
- | 1343 | 8.8% |
2 | 994 | 6.5% |
5 | 743 | 4.9% |
3 | 639 | 4.2% |
6 | 578 | 3.8% |
7 | 541 | 3.5% |
4 | 468 | 3.1% |
8 | 451 | 3.0% |
Other values (12) | 1015 | 6.7% |
Hangul
Value | Count | Frequency (%) |
서 | 1609 | 7.5% |
동 | 1591 | 7.4% |
지 | 1579 | 7.3% |
구 | 1575 | 7.3% |
시 | 1572 | 7.3% |
남 | 1568 | 7.3% |
강 | 1565 | 7.3% |
별 | 1562 | 7.3% |
특 | 1562 | 7.3% |
울 | 1562 | 7.3% |
Other values (146) | 5780 |
인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 지도점검구분 | 처분대상여부 | |
---|---|---|---|---|---|---|
인허가번호 | 1.000 | 0.943 | 0.943 | 0.374 | 0.125 | 0.202 |
업종코드 | 0.943 | 1.000 | 1.000 | 0.559 | 0.176 | 0.042 |
업종명 | 0.943 | 1.000 | 1.000 | 0.558 | 0.177 | 0.042 |
지도점검일자 | 0.374 | 0.559 | 0.558 | 1.000 | 0.300 | 0.097 |
지도점검구분 | 0.125 | 0.176 | 0.177 | 0.300 | 1.000 | 0.000 |
처분대상여부 | 0.202 | 0.042 | 0.042 | 0.097 | 0.000 | 1.000 |
처분대상여부 | 업종코드 | 지도점검구분 | 업종명 | |
---|---|---|---|---|
처분대상여부 | 1.000 | 0.070 | 0.000 | 0.070 |
업종코드 | 0.070 | 1.000 | 0.134 | 1.000 |
지도점검구분 | 0.000 | 0.134 | 1.000 | 0.135 |
업종명 | 0.070 | 1.000 | 0.135 | 1.000 |
인허가번호 | 지도점검일자 | 업종코드 | 업종명 | 지도점검구분 | 처분대상여부 | |
---|---|---|---|---|---|---|
인허가번호 | 1.000 | -0.131 | 0.707 | 0.707 | 0.094 | 0.314 |
지도점검일자 | -0.131 | 1.000 | 0.425 | 0.424 | 0.188 | 0.072 |
업종코드 | 0.707 | 0.425 | 1.000 | 1.000 | 0.134 | 0.070 |
업종명 | 0.707 | 0.424 | 1.000 | 1.000 | 0.135 | 0.070 |
지도점검구분 | 0.094 | 0.188 | 0.134 | 0.135 | 1.000 | 0.000 |
처분대상여부 | 0.314 | 0.072 | 0.070 | 0.070 | 0.000 | 1.000 |
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 점검결과 | 소재지도로명주소 | 소재지주소 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 한국자산관리공사(캠코양재타워) | 322000021201500110 | 21 | 대기배출업소관리 | 20171130 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 강남대로 262 (도곡동) | 서울특별시 강남구 도곡동 949-3번지 |
1 | 능인선원 | 322000021201500032 | 21 | 대기배출업소관리 | 20171130 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 양재대로 340 (개포동, 능인선원) | 서울특별시 강남구 개포동 1055번지 |
2 | 한국지역난방공사 강남지사(수서열원) | 322000021201500153 | 21 | 대기배출업소관리 | 20171130 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 광평로39길 105 (수서동) | <NA> |
3 | 강남자원회수시설 | 322000021199900176 | 21 | 대기배출업소관리 | 20171130 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 남부순환로 3318 (일원동) | 서울특별시 강남구 일원동 4-1번지 |
4 | 서울시탄천물재생센터((주)탄천환경) | 322000021200600001 | 21 | 대기배출업소관리 | 20171130 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 개포로 625 (일원동, 탄천물재생센터) | 서울특별시 강남구 일원동 580번지 |
5 | 골든사우나 | 322000021201600012 | 21 | 대기배출업소관리 | 20171130 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 삼성로135길 28 (청담동, 골든아트빌) | <NA> |
6 | (주)퍼시픽제8호기업구조조정부동산투자회사 | 322000021201600008 | 21 | 대기배출업소관리 | 20171130 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 양재천로 163 (도곡동, 바디프랜드도곡타워) | 서울특별시 강남구 도곡동 448-2번지 |
7 | 르노삼성자동차역삼센타 | 322000025200300229 | 25 | 기타수질오염원관리 | 20171129 | 3220000 | 서울특별시 강남구 | 정기 | N | 배출시설 운영상태 점검 | <NA> | 서울특별시 강남구 테헤란로 114 (역삼동,5,6) | 서울특별시 강남구 역삼동 824번지 5,6 |
8 | 공우이엔씨주식회사(군인공제회관) | 322000021201500125 | 21 | 대기배출업소관리 | 20171129 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 남부순환로 2806 (도곡동, 군인공제회관) | 서울특별시 강남구 도곡동 467-12번지 |
9 | 대림아크로텔관리단 | 322000021201500132 | 21 | 대기배출업소관리 | 20171129 | 3220000 | 서울특별시 강남구 | 정기 | N | 대기배출시설 및 방지시설 적정 운영 여부 | <NA> | 서울특별시 강남구 언주로30길 13 (도곡동,(선릉로서81길 56)) | 서울특별시 강남구 도곡동 467-6번지 (선릉로서81길 56) |
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 점검결과 | 소재지도로명주소 | 소재지주소 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1692 | 현대오토피아 삼성점 | 322000022201000001 | 22 | 폐수배출업소관리 | 20100428 | 3220000 | 서울특별시 강남구 | 수시 | <NA> | 폐수배출시설 및 방지시설 적정 운영 여부(가동개시) | <NA> | <NA> | 서울특별시 강남구 삼성동 44-13번지 |
1693 | GS칼덱스(주)직영 삼성로점 | 322000022200800018 | 22 | 폐수배출업소관리 | 20100222 | 3220000 | 서울특별시 강남구 | 수시 | N | 조업정지 이행보고 확인 | <NA> | <NA> | 서울특별시 강남구 삼성동 119-18번지 |
1694 | GS칼덱스(주)직영 삼성로점 | 322000022200800018 | 22 | 폐수배출업소관리 | 20100217 | 3220000 | 서울특별시 강남구 | 수시 | N | 행정처분 이행여부 확인 | <NA> | <NA> | 서울특별시 강남구 삼성동 119-18번지 |
1695 | GS칼덱스(주)직영 삼성로점 | 322000022200800018 | 22 | <NA> | 20100212 | 3220000 | 서울특별시 강남구 | 수시 | <NA> | 행정처분 철저히 이행하도록 독려 | <NA> | <NA> | 서울특별시 강남구 삼성동 119-18번지 |
1696 | 주식회사 맥바겐 | 322000022200900011 | 22 | 폐수배출업소관리 | 20100205 | 3220000 | 서울특별시 강남구 | 수시 | N | 가동개시신고확인 | <NA> | 서울특별시 강남구 역삼로 425 (대치동) | 서울특별시 강남구 대치동 906-19번지 |
1697 | GS칼덱스(주)직영 삼성로점 | 322000022200800018 | 22 | 폐수배출업소관리 | 20100205 | 3220000 | 서울특별시 강남구 | 수시 | N | 설연휴전 중점대상 사업장 점검 | <NA> | <NA> | 서울특별시 강남구 삼성동 119-18번지 |
1698 | 코션코리아역삼 | 322000022199700185 | 22 | 폐수배출업소관리 | 20100205 | 3220000 | 서울특별시 강남구 | 수시 | N | 설연휴전 중점대상 사업장 점검 | <NA> | <NA> | 서울특별시 강남구 역삼동 834-68번지 |
1699 | 강남제일세차장 | 322000022200700007 | 22 | 폐수배출업소관리 | 20100205 | 3220000 | 서울특별시 강남구 | 수시 | N | 설연휴전 중점대상 사업장 점검 | <NA> | <NA> | 서울특별시 강남구 율현동 113-1번지 외 1필지 A동 |
1700 | 덴트닥터칼라 | 322000022200900001 | 22 | 폐수배출업소관리 | 20100204 | 3220000 | 서울특별시 강남구 | 수시 | N | 설연휴전 중점대상 사업장 점검 | <NA> | <NA> | 서울특별시 강남구 신사동 628-6번지 |
1701 | 현대오일뱅크(주)직영 한양주유소 | 322000022200700015 | 22 | 폐수배출업소관리 | 20100204 | 3220000 | 서울특별시 강남구 | 수시 | N | 설연휴전 중점대상 사업장 점검 | <NA> | <NA> | 서울특별시 강남구 신사동 638번지 |
Most frequently occurring
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 소재지도로명주소 | 소재지주소 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 광신 | 322000022200100086 | 22 | 폐수배출업소관리 | 20100916 | 3220000 | 서울특별시 강남구 | 정기 | N | 폐수배출시설 운영사항 | <NA> | 서울특별시 강남구 신사동 615-1번지 코끼리상가 303호 | 2 |
1 | 기성모터스 | 322000022199400011 | 22 | 폐수배출업소관리 | 20120621 | 3220000 | 서울특별시 강남구 | 정기 | N | 폐수배출시설 및 방지시설 가동상태 | <NA> | 서울특별시 강남구 신사동 564-16번지 | 2 |
2 | 기성모터스 | 322000022199400011 | 22 | 폐수배출업소관리 | 20130731 | 3220000 | 서울특별시 강남구 | 정기 | N | 폐수배출시설 및 방지시설 가동상태 | <NA> | 서울특별시 강남구 신사동 564-16번지 | 2 |
3 | 대치손세차장 | 322000022201100002 | 22 | 폐수배출업소관리 | 20120613 | 3220000 | 서울특별시 강남구 | 정기 | N | 폐수배출시설 및 방지시설 가동상태 | 서울특별시 강남구 도곡로 435 (대치동) | 서울특별시 강남구 대치동 940-3번지 12, 13 | 2 |
4 | 덴트닥터칼라 | 322000022200900001 | 22 | 폐수배출업소관리 | 20120621 | 3220000 | 서울특별시 강남구 | 정기 | N | 폐수배출시설 및 방지시설 가동상태 | <NA> | 서울특별시 강남구 신사동 628-6번지 | 2 |
5 | 아성카랜드 | 322000022200400007 | 22 | 폐수배출업소관리 | 20130731 | 3220000 | 서울특별시 강남구 | 정기 | N | 폐수배출시설 및 방지시설 가동상태 | <NA> | 서울특별시 강남구 신사동 628-22번지 | 2 |