Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 747 |
Missing cells | 1710 |
Missing cells (%) | 17.6% |
Duplicate rows | 2 |
Duplicate rows (%) | 0.3% |
Total size in memory | 79.6 KiB |
Average record size in memory | 109.2 B |
Variable types
Text | 4 |
---|---|
Numeric | 2 |
Categorical | 5 |
Boolean | 1 |
Unsupported | 1 |
Dataset
Description | 업체(시설)명,인허가번호,업종코드,업종명,지도점검일자,점검기관,점검기관명,지도점검구분,처분대상여부,점검사항,점검결과,소재지도로명주소,소재지주소 |
---|---|
Author | 서초구 |
URL | https://data.seoul.go.kr/dataList/OA-11048/S/1/datasetView.do |
점검기관 has constant value "" | Constant |
점검기관명 has constant value "" | Constant |
Dataset has 2 (0.3%) duplicate rows | Duplicates |
업종명 is highly overall correlated with 인허가번호 and 1 other fields | High correlation |
업종코드 is highly overall correlated with 인허가번호 and 1 other fields | High correlation |
인허가번호 is highly overall correlated with 업종코드 and 2 other fields | High correlation |
처분대상여부 is highly overall correlated with 인허가번호 | High correlation |
지도점검구분 is highly imbalanced (77.7%) | Imbalance |
처분대상여부 is highly imbalanced (88.9%) | Imbalance |
처분대상여부 has 271 (36.3%) missing values | Missing |
점검사항 has 95 (12.7%) missing values | Missing |
점검결과 has 747 (100.0%) missing values | Missing |
소재지도로명주소 has 490 (65.6%) missing values | Missing |
소재지주소 has 107 (14.3%) missing values | Missing |
점검결과 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-05-11 03:36:00.859595 |
---|---|
Analysis finished | 2024-05-11 03:36:06.707326 |
Duration | 5.85 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업체(시설)명
Text
Distinct | 355 |
---|---|
Distinct (%) | 47.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.0 KiB |
Value | Count | Frequency (%) |
코오롱글로벌(주 | 10 | 1.1% |
현대자동차 | 9 | 1.0% |
주)천산 | 8 | 0.9% |
주)농협유통하나로주유소 | 8 | 0.9% |
엘지전자(주 | 7 | 0.8% |
주)우림자동차 | 7 | 0.8% |
지에스넥스테이션 | 7 | 0.8% |
선우상사q엔느 | 7 | 0.8% |
주)동원석유주유소 | 6 | 0.7% |
대정자동차공업사 | 6 | 0.7% |
Other values (393) | 795 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 417 | 6.3% |
( | 269 | 4.0% |
) | 267 | 4.0% |
스 | 217 | 3.3% |
동 | 181 | 2.7% |
차 | 180 | 2.7% |
자 | 179 | 2.7% |
유 | 166 | 2.5% |
서 | 159 | 2.4% |
소 | 133 | 2.0% |
Other values (357) | 4494 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5812 | |
Open Punctuation | 270 | 4.1% |
Close Punctuation | 268 | 4.0% |
Space Separator | 123 | 1.8% |
Uppercase Letter | 76 | 1.1% |
Decimal Number | 59 | 0.9% |
Dash Punctuation | 37 | 0.6% |
Lowercase Letter | 9 | 0.1% |
Other Punctuation | 8 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 417 | 7.2% |
스 | 217 | 3.7% |
동 | 181 | 3.1% |
차 | 180 | 3.1% |
자 | 179 | 3.1% |
유 | 166 | 2.9% |
서 | 159 | 2.7% |
소 | 133 | 2.3% |
사 | 119 | 2.0% |
대 | 116 | 2.0% |
Other values (312) | 3945 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 9 | |
S | 8 | |
T | 8 | |
Q | 7 | |
M | 7 | |
D | 6 | |
G | 6 | |
E | 6 | |
I | 5 | |
A | 3 | 3.9% |
Other values (8) | 11 |
Decimal Number
Value | Count | Frequency (%) |
2 | 14 | |
7 | 9 | |
1 | 9 | |
3 | 6 | |
6 | 6 | |
5 | 4 | 6.8% |
4 | 4 | 6.8% |
8 | 4 | 6.8% |
0 | 2 | 3.4% |
9 | 1 | 1.7% |
Lowercase Letter
Value | Count | Frequency (%) |
o | 2 | |
m | 1 | |
s | 1 | |
r | 1 | |
t | 1 | |
e | 1 | |
n | 1 | |
i | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 6 | |
. | 1 | 12.5% |
? | 1 | 12.5% |
Open Punctuation
Value | Count | Frequency (%) |
( | 269 | |
[ | 1 | 0.4% |
Close Punctuation
Value | Count | Frequency (%) |
) | 267 | |
] | 1 | 0.4% |
Space Separator
Value | Count | Frequency (%) |
123 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 37 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5812 | |
Common | 765 | 11.5% |
Latin | 85 | 1.3% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 417 | 7.2% |
스 | 217 | 3.7% |
동 | 181 | 3.1% |
차 | 180 | 3.1% |
자 | 179 | 3.1% |
유 | 166 | 2.9% |
서 | 159 | 2.7% |
소 | 133 | 2.3% |
사 | 119 | 2.0% |
대 | 116 | 2.0% |
Other values (312) | 3945 |
Latin
Value | Count | Frequency (%) |
K | 9 | |
S | 8 | 9.4% |
T | 8 | 9.4% |
Q | 7 | 8.2% |
M | 7 | 8.2% |
D | 6 | 7.1% |
G | 6 | 7.1% |
E | 6 | 7.1% |
I | 5 | 5.9% |
A | 3 | 3.5% |
Other values (16) | 20 |
Common
Value | Count | Frequency (%) |
( | 269 | |
) | 267 | |
123 | ||
- | 37 | 4.8% |
2 | 14 | 1.8% |
7 | 9 | 1.2% |
1 | 9 | 1.2% |
, | 6 | 0.8% |
3 | 6 | 0.8% |
6 | 6 | 0.8% |
Other values (9) | 19 | 2.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5812 | |
ASCII | 849 | 12.7% |
None | 1 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 417 | 7.2% |
스 | 217 | 3.7% |
동 | 181 | 3.1% |
차 | 180 | 3.1% |
자 | 179 | 3.1% |
유 | 166 | 2.9% |
서 | 159 | 2.7% |
소 | 133 | 2.3% |
사 | 119 | 2.0% |
대 | 116 | 2.0% |
Other values (312) | 3945 |
ASCII
Value | Count | Frequency (%) |
( | 269 | |
) | 267 | |
123 | ||
- | 37 | 4.4% |
2 | 14 | 1.6% |
7 | 9 | 1.1% |
1 | 9 | 1.1% |
K | 9 | 1.1% |
S | 8 | 0.9% |
T | 8 | 0.9% |
Other values (34) | 96 | 11.3% |
None
Value | Count | Frequency (%) |
? | 1 |
인허가번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 340 |
---|---|
Distinct (%) | 45.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.2100002 × 1017 |
Minimum | 3.2100002 × 1017 |
---|---|
Maximum | 3.2100003 × 1017 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.7 KiB |
Quantile statistics
Minimum | 3.2100002 × 1017 |
---|---|
5-th percentile | 3.2100002 × 1017 |
Q1 | 3.2100002 × 1017 |
median | 3.2100002 × 1017 |
Q3 | 3.2100002 × 1017 |
95-th percentile | 3.2100002 × 1017 |
Maximum | 3.2100003 × 1017 |
Range | 1.30017 × 1010 |
Interquartile range (IQR) | 9.990999 × 108 |
Descriptive statistics
Standard deviation | 7.7026021 × 108 |
---|---|
Coefficient of variation (CV) | 2.3995644 × 10-9 |
Kurtosis | 168.8361 |
Mean | 3.2100002 × 1017 |
Median Absolute Deviation (MAD) | 599872 |
Skewness | 10.50763 |
Sum | -2.0656543 × 1016 |
Variance | 5.9330079 × 1017 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
321000022200600023 | 8 | 1.1% |
321000022200800018 | 8 | 1.1% |
321000022200000238 | 7 | 0.9% |
321000022200900001 | 7 | 0.9% |
321000022200000011 | 7 | 0.9% |
321000022200700003 | 7 | 0.9% |
321000022200000088 | 6 | 0.8% |
321000022199100006 | 6 | 0.8% |
321000022200600014 | 6 | 0.8% |
321000022200000043 | 6 | 0.8% |
Other values (330) | 679 |
Value | Count | Frequency (%) |
321000021199200003 | 2 | |
321000021199800002 | 1 | 0.1% |
321000021199800009 | 1 | 0.1% |
321000021199800010 | 1 | 0.1% |
321000021199900001 | 1 | 0.1% |
321000021199900003 | 3 | |
321000021200200001 | 2 | |
321000021200200005 | 1 | 0.1% |
321000021200300003 | 1 | 0.1% |
321000021200400006 | 1 | 0.1% |
Value | Count | Frequency (%) |
321000034200900456 | 1 | 0.1% |
321000034200900089 | 1 | 0.1% |
321000022201600003 | 1 | 0.1% |
321000022201600002 | 1 | 0.1% |
321000022201600001 | 1 | 0.1% |
321000022201500724 | 2 | |
321000022201500004 | 1 | 0.1% |
321000022201500003 | 2 | |
321000022201500002 | 3 | |
321000022201500001 | 2 |
업종코드
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.0 KiB |
22 | |
---|---|
21 | |
34 | 2 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 22 |
---|---|
2nd row | 22 |
3rd row | 22 |
4th row | 22 |
5th row | 22 |
Common Values
Value | Count | Frequency (%) |
22 | 552 | |
21 | 193 | 25.8% |
34 | 2 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
22 | 552 | |
21 | 193 | 25.8% |
34 | 2 | 0.3% |
업종명
Categorical
HIGH CORRELATION
 
Distinct | 3 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.0 KiB |
폐수배출업소관리 | |
---|---|
<NA> | |
대기배출업소관리 | 36 |
Length
Max length | 8 |
---|---|
Median length | 8 |
Mean length | 6.4953146 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 폐수배출업소관리 |
---|---|
2nd row | 폐수배출업소관리 |
3rd row | 폐수배출업소관리 |
4th row | 폐수배출업소관리 |
5th row | 폐수배출업소관리 |
Common Values
Value | Count | Frequency (%) |
폐수배출업소관리 | 430 | |
<NA> | 281 | |
대기배출업소관리 | 36 | 4.8% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
폐수배출업소관리 | 430 | |
na | 281 | |
대기배출업소관리 | 36 | 4.8% |
지도점검일자
Real number (ℝ)
Distinct | 274 |
---|---|
Distinct (%) | 36.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20132298 |
Minimum | 20100209 |
---|---|
Maximum | 20170713 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 6.7 KiB |
Quantile statistics
Minimum | 20100209 |
---|---|
5-th percentile | 20100416 |
Q1 | 20110525 |
median | 20130808 |
Q3 | 20160315 |
95-th percentile | 20161031 |
Maximum | 20170713 |
Range | 70504 |
Interquartile range (IQR) | 49790 |
Descriptive statistics
Standard deviation | 22983.009 |
---|---|
Coefficient of variation (CV) | 0.0011415989 |
Kurtosis | -1.3851606 |
Mean | 20132298 |
Median Absolute Deviation (MAD) | 20296 |
Skewness | 0.071397799 |
Sum | 1.5038826 × 1010 |
Variance | 5.2821869 × 108 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
20161024 | 22 | 2.9% |
20161026 | 17 | 2.3% |
20161025 | 15 | 2.0% |
20161027 | 15 | 2.0% |
20161019 | 14 | 1.9% |
20161031 | 13 | 1.7% |
20100927 | 11 | 1.5% |
20100930 | 10 | 1.3% |
20110324 | 9 | 1.2% |
20161021 | 8 | 1.1% |
Other values (264) | 613 |
Value | Count | Frequency (%) |
20100209 | 3 | |
20100223 | 3 | |
20100309 | 3 | |
20100311 | 3 | |
20100316 | 1 | 0.1% |
20100324 | 3 | |
20100406 | 5 | |
20100409 | 5 | |
20100413 | 2 | 0.3% |
20100414 | 6 |
Value | Count | Frequency (%) |
20170713 | 4 | |
20170711 | 2 | 0.3% |
20170705 | 4 | |
20170704 | 2 | 0.3% |
20170630 | 5 | |
20170605 | 1 | 0.1% |
20170519 | 1 | 0.1% |
20170424 | 5 | |
20170421 | 3 | |
20170420 | 1 | 0.1% |
점검기관
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.0 KiB |
3210000 |
---|
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 3210000 |
---|---|
2nd row | 3210000 |
3rd row | 3210000 |
4th row | 3210000 |
5th row | 3210000 |
Common Values
Value | Count | Frequency (%) |
3210000 | 747 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
3210000 | 747 |
점검기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.0 KiB |
서울특별시 서초구 |
---|
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 서초구 |
---|---|
2nd row | 서울특별시 서초구 |
3rd row | 서울특별시 서초구 |
4th row | 서울특별시 서초구 |
5th row | 서울특별시 서초구 |
Common Values
Value | Count | Frequency (%) |
서울특별시 서초구 | 747 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 747 | |
서초구 | 747 |
지도점검구분
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.8% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 6.0 KiB |
정기 | |
---|---|
기타 | 32 |
합동 | 13 |
<NA> | 8 |
수시 | 8 |
Length
Max length | 4 |
---|---|
Median length | 2 |
Mean length | 2.021419 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 정기 |
---|---|
2nd row | 정기 |
3rd row | 정기 |
4th row | 정기 |
5th row | 정기 |
Common Values
Value | Count | Frequency (%) |
정기 | 684 | |
기타 | 32 | 4.3% |
합동 | 13 | 1.7% |
<NA> | 8 | 1.1% |
수시 | 8 | 1.1% |
일제 | 2 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정기 | 684 | |
기타 | 32 | 4.3% |
합동 | 13 | 1.7% |
na | 8 | 1.1% |
수시 | 8 | 1.1% |
일제 | 2 | 0.3% |
처분대상여부
Boolean
HIGH CORRELATION
  IMBALANCE
  MISSING
 
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 271 |
Missing (%) | 36.3% |
Memory size | 1.6 KiB |
False | |
---|---|
True | 7 |
(Missing) |
Value | Count | Frequency (%) |
False | 469 | |
True | 7 | 0.9% |
(Missing) | 271 |
점검사항
Text
MISSING
 
Distinct | 117 |
---|---|
Distinct (%) | 17.9% |
Missing | 95 |
Missing (%) | 12.7% |
Memory size | 6.0 KiB |
Length
Max length | 47 |
---|---|
Median length | 37 |
Mean length | 16.02454 |
Min length | 4 |
Characters and Unicode
Total characters | 10448 |
---|---|
Distinct characters | 101 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 51 ? |
---|---|
Unique (%) | 7.8% |
Sample
1st row | 폐수배출시설 및 방지시설 적정운영 여부 |
---|---|
2nd row | 폐수배출시설 및 방지시설 적정운영 여부 |
3rd row | 폐수배출시설 및 방지시설 적정운영 여부 |
4th row | 폐수배출시설 및 방지시설 적정운영 여부 |
5th row | 폐수배출시설 및 방지시설 적정운영 여부 |
Value | Count | Frequency (%) |
배출시설 | 399 | |
여부 | 344 | |
방지시설 | 330 | |
및 | 318 | |
적정가동 | 150 | 6.1% |
적정가동여부 | 100 | 4.1% |
적정운영 | 92 | 3.8% |
적정관리 | 76 | 3.1% |
대기배출시설 | 67 | 2.7% |
폐수배출시설 | 48 | 2.0% |
Other values (97) | 523 |
Most occurring characters
Value | Count | Frequency (%) |
1795 | ||
시 | 935 | 8.9% |
설 | 918 | 8.8% |
배 | 574 | 5.5% |
출 | 574 | 5.5% |
부 | 566 | 5.4% |
여 | 565 | 5.4% |
정 | 553 | 5.3% |
적 | 473 | 4.5% |
방 | 378 | 3.6% |
Other values (91) | 3117 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8613 | |
Space Separator | 1795 | 17.2% |
Other Punctuation | 26 | 0.2% |
Close Punctuation | 7 | 0.1% |
Open Punctuation | 7 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 935 | 10.9% |
설 | 918 | 10.7% |
배 | 574 | 6.7% |
출 | 574 | 6.7% |
부 | 566 | 6.6% |
여 | 565 | 6.6% |
정 | 553 | 6.4% |
적 | 473 | 5.5% |
방 | 378 | 4.4% |
지 | 368 | 4.3% |
Other values (86) | 2709 |
Other Punctuation
Value | Count | Frequency (%) |
, | 23 | |
? | 3 | 11.5% |
Space Separator
Value | Count | Frequency (%) |
1795 |
Close Punctuation
Value | Count | Frequency (%) |
) | 7 |
Open Punctuation
Value | Count | Frequency (%) |
( | 7 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8613 | |
Common | 1835 | 17.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 935 | 10.9% |
설 | 918 | 10.7% |
배 | 574 | 6.7% |
출 | 574 | 6.7% |
부 | 566 | 6.6% |
여 | 565 | 6.6% |
정 | 553 | 6.4% |
적 | 473 | 5.5% |
방 | 378 | 4.4% |
지 | 368 | 4.3% |
Other values (86) | 2709 |
Common
Value | Count | Frequency (%) |
1795 | ||
, | 23 | 1.3% |
) | 7 | 0.4% |
( | 7 | 0.4% |
? | 3 | 0.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8613 | |
ASCII | 1835 | 17.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1795 | ||
, | 23 | 1.3% |
) | 7 | 0.4% |
( | 7 | 0.4% |
? | 3 | 0.2% |
Hangul
Value | Count | Frequency (%) |
시 | 935 | 10.9% |
설 | 918 | 10.7% |
배 | 574 | 6.7% |
출 | 574 | 6.7% |
부 | 566 | 6.6% |
여 | 565 | 6.6% |
정 | 553 | 6.4% |
적 | 473 | 5.5% |
방 | 378 | 4.4% |
지 | 368 | 4.3% |
Other values (86) | 2709 |
점검결과
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 747 |
---|---|
Missing (%) | 100.0% |
Memory size | 6.7 KiB |
소재지도로명주소
Text
MISSING
 
Distinct | 184 |
---|---|
Distinct (%) | 71.6% |
Missing | 490 |
Missing (%) | 65.6% |
Memory size | 6.0 KiB |
Length
Max length | 49 |
---|---|
Median length | 42 |
Mean length | 26.77821 |
Min length | 21 |
Characters and Unicode
Total characters | 6882 |
---|---|
Distinct characters | 192 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 136 ? |
---|---|
Unique (%) | 52.9% |
Sample
1st row | 서울특별시 서초구 헌릉로 210 (내곡동) |
---|---|
2nd row | 서울특별시 서초구 명달로 101 (서초동) |
3rd row | 서울특별시 서초구 명달로 36-1 (서초동) |
4th row | 서울특별시 서초구 남부순환로296길 4-16 (방배동) |
5th row | 서울특별시 서초구 남부순환로342길 62-26 (양재동) |
Value | Count | Frequency (%) |
서울특별시 | 257 | |
서초구 | 257 | |
방배동 | 61 | 4.5% |
양재동 | 53 | 3.9% |
서초동 | 52 | 3.9% |
반포동 | 49 | 3.6% |
반포대로 | 23 | 1.7% |
신반포로 | 18 | 1.3% |
남부순환로 | 16 | 1.2% |
바우뫼로 | 16 | 1.2% |
Other values (263) | 545 |
Most occurring characters
Value | Count | Frequency (%) |
1159 | 16.8% | |
서 | 614 | 8.9% |
초 | 345 | 5.0% |
동 | 270 | 3.9% |
울 | 267 | 3.9% |
) | 262 | 3.8% |
( | 262 | 3.8% |
구 | 261 | 3.8% |
시 | 261 | 3.8% |
특 | 257 | 3.7% |
Other values (182) | 2924 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4257 | |
Space Separator | 1159 | 16.8% |
Decimal Number | 848 | 12.3% |
Close Punctuation | 262 | 3.8% |
Open Punctuation | 262 | 3.8% |
Other Punctuation | 53 | 0.8% |
Dash Punctuation | 33 | 0.5% |
Uppercase Letter | 8 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 614 | |
초 | 345 | 8.1% |
동 | 270 | 6.3% |
울 | 267 | 6.3% |
구 | 261 | 6.1% |
시 | 261 | 6.1% |
특 | 257 | 6.0% |
별 | 257 | 6.0% |
로 | 249 | 5.8% |
포 | 100 | 2.3% |
Other values (163) | 1376 |
Decimal Number
Value | Count | Frequency (%) |
2 | 164 | |
1 | 154 | |
6 | 92 | |
3 | 85 | |
4 | 84 | |
7 | 78 | |
5 | 57 | 6.7% |
9 | 47 | 5.5% |
8 | 44 | 5.2% |
0 | 43 | 5.1% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 4 | |
B | 2 | |
G | 1 | 12.5% |
L | 1 | 12.5% |
Space Separator
Value | Count | Frequency (%) |
1159 |
Close Punctuation
Value | Count | Frequency (%) |
) | 262 |
Open Punctuation
Value | Count | Frequency (%) |
( | 262 |
Other Punctuation
Value | Count | Frequency (%) |
, | 53 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 33 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4257 | |
Common | 2617 | |
Latin | 8 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 614 | |
초 | 345 | 8.1% |
동 | 270 | 6.3% |
울 | 267 | 6.3% |
구 | 261 | 6.1% |
시 | 261 | 6.1% |
특 | 257 | 6.0% |
별 | 257 | 6.0% |
로 | 249 | 5.8% |
포 | 100 | 2.3% |
Other values (163) | 1376 |
Common
Value | Count | Frequency (%) |
1159 | ||
) | 262 | 10.0% |
( | 262 | 10.0% |
2 | 164 | 6.3% |
1 | 154 | 5.9% |
6 | 92 | 3.5% |
3 | 85 | 3.2% |
4 | 84 | 3.2% |
7 | 78 | 3.0% |
5 | 57 | 2.2% |
Other values (5) | 220 | 8.4% |
Latin
Value | Count | Frequency (%) |
C | 4 | |
B | 2 | |
G | 1 | 12.5% |
L | 1 | 12.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4257 | |
ASCII | 2625 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1159 | ||
) | 262 | 10.0% |
( | 262 | 10.0% |
2 | 164 | 6.2% |
1 | 154 | 5.9% |
6 | 92 | 3.5% |
3 | 85 | 3.2% |
4 | 84 | 3.2% |
7 | 78 | 3.0% |
5 | 57 | 2.2% |
Other values (9) | 228 | 8.7% |
Hangul
Value | Count | Frequency (%) |
서 | 614 | |
초 | 345 | 8.1% |
동 | 270 | 6.3% |
울 | 267 | 6.3% |
구 | 261 | 6.1% |
시 | 261 | 6.1% |
특 | 257 | 6.0% |
별 | 257 | 6.0% |
로 | 249 | 5.8% |
포 | 100 | 2.3% |
Other values (163) | 1376 |
소재지주소
Text
MISSING
 
Distinct | 220 |
---|---|
Distinct (%) | 34.4% |
Missing | 107 |
Missing (%) | 14.3% |
Memory size | 6.0 KiB |
Length
Max length | 45 |
---|---|
Median length | 36 |
Mean length | 22.778125 |
Min length | 14 |
Characters and Unicode
Total characters | 14578 |
---|---|
Distinct characters | 71 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 62 ? |
---|---|
Unique (%) | 9.7% |
Sample
1st row | 서울특별시 서초구 내곡동 142-3번지 |
---|---|
2nd row | 서울특별시 서초구 서초동 1516-1번지 |
3rd row | 서울특별시 서초구 양재동 229번지 |
4th row | 서울특별시 서초구 서초동 1487-137번지 |
5th row | 서울특별시 서초구 방배동 584번지 |
Value | Count | Frequency (%) |
서울특별시 | 640 | |
서초구 | 640 | |
양재동 | 189 | 7.1% |
방배동 | 172 | 6.5% |
서초동 | 151 | 5.7% |
반포동 | 66 | 2.5% |
내곡동 | 23 | 0.9% |
우면동 | 18 | 0.7% |
584번지 | 14 | 0.5% |
산 | 12 | 0.5% |
Other values (233) | 729 |
Most occurring characters
Value | Count | Frequency (%) |
2674 | ||
서 | 1439 | 9.9% |
초 | 791 | 5.4% |
1 | 666 | 4.6% |
지 | 657 | 4.5% |
울 | 648 | 4.4% |
동 | 642 | 4.4% |
구 | 640 | 4.4% |
시 | 640 | 4.4% |
별 | 640 | 4.4% |
Other values (61) | 5141 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8538 | |
Decimal Number | 2781 | 19.1% |
Space Separator | 2674 | 18.3% |
Dash Punctuation | 519 | 3.6% |
Other Punctuation | 34 | 0.2% |
Close Punctuation | 11 | 0.1% |
Open Punctuation | 11 | 0.1% |
Uppercase Letter | 10 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
서 | 1439 | |
초 | 791 | |
지 | 657 | |
울 | 648 | |
동 | 642 | |
구 | 640 | |
시 | 640 | |
별 | 640 | |
특 | 640 | |
번 | 638 | |
Other values (44) | 1163 |
Decimal Number
Value | Count | Frequency (%) |
1 | 666 | |
3 | 341 | |
2 | 319 | |
5 | 234 | 8.4% |
4 | 233 | 8.4% |
9 | 227 | 8.2% |
6 | 210 | 7.6% |
0 | 195 | 7.0% |
7 | 187 | 6.7% |
8 | 169 | 6.1% |
Uppercase Letter
Value | Count | Frequency (%) |
C | 8 | |
B | 2 | 20.0% |
Space Separator
Value | Count | Frequency (%) |
2674 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 519 |
Other Punctuation
Value | Count | Frequency (%) |
, | 34 |
Close Punctuation
Value | Count | Frequency (%) |
) | 11 |
Open Punctuation
Value | Count | Frequency (%) |
( | 11 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8538 | |
Common | 6030 | |
Latin | 10 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
서 | 1439 | |
초 | 791 | |
지 | 657 | |
울 | 648 | |
동 | 642 | |
구 | 640 | |
시 | 640 | |
별 | 640 | |
특 | 640 | |
번 | 638 | |
Other values (44) | 1163 |
Common
Value | Count | Frequency (%) |
2674 | ||
1 | 666 | 11.0% |
- | 519 | 8.6% |
3 | 341 | 5.7% |
2 | 319 | 5.3% |
5 | 234 | 3.9% |
4 | 233 | 3.9% |
9 | 227 | 3.8% |
6 | 210 | 3.5% |
0 | 195 | 3.2% |
Other values (5) | 412 | 6.8% |
Latin
Value | Count | Frequency (%) |
C | 8 | |
B | 2 | 20.0% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8538 | |
ASCII | 6040 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2674 | ||
1 | 666 | 11.0% |
- | 519 | 8.6% |
3 | 341 | 5.6% |
2 | 319 | 5.3% |
5 | 234 | 3.9% |
4 | 233 | 3.9% |
9 | 227 | 3.8% |
6 | 210 | 3.5% |
0 | 195 | 3.2% |
Other values (7) | 422 | 7.0% |
Hangul
Value | Count | Frequency (%) |
서 | 1439 | |
초 | 791 | |
지 | 657 | |
울 | 648 | |
동 | 642 | |
구 | 640 | |
시 | 640 | |
별 | 640 | |
특 | 640 | |
번 | 638 | |
Other values (44) | 1163 |
인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 지도점검구분 | 처분대상여부 | |
---|---|---|---|---|---|---|
인허가번호 | 1.000 | 1.000 | NaN | 0.188 | 0.000 | NaN |
업종코드 | 1.000 | 1.000 | 1.000 | 0.428 | 0.095 | 0.000 |
업종명 | NaN | 1.000 | 1.000 | 0.573 | 0.000 | 0.000 |
지도점검일자 | 0.188 | 0.428 | 0.573 | 1.000 | 0.285 | 0.540 |
지도점검구분 | 0.000 | 0.095 | 0.000 | 0.285 | 1.000 | 0.000 |
처분대상여부 | NaN | 0.000 | 0.000 | 0.540 | 0.000 | 1.000 |
지도점검구분 | 업종명 | 업종코드 | 처분대상여부 | |
---|---|---|---|---|
지도점검구분 | 1.000 | 0.000 | 0.071 | 0.000 |
업종명 | 0.000 | 1.000 | 0.985 | 0.000 |
업종코드 | 0.071 | 0.985 | 1.000 | 0.000 |
처분대상여부 | 0.000 | 0.000 | 0.000 | 1.000 |
인허가번호 | 지도점검일자 | 업종코드 | 업종명 | 지도점검구분 | 처분대상여부 | |
---|---|---|---|---|---|---|
인허가번호 | 1.000 | -0.045 | 0.999 | 1.000 | 0.000 | 1.000 |
지도점검일자 | -0.045 | 1.000 | 0.300 | 0.423 | 0.179 | 0.405 |
업종코드 | 0.999 | 0.300 | 1.000 | 0.985 | 0.071 | 0.000 |
업종명 | 1.000 | 0.423 | 0.985 | 1.000 | 0.000 | 0.000 |
지도점검구분 | 0.000 | 0.179 | 0.071 | 0.000 | 1.000 | 0.000 |
처분대상여부 | 1.000 | 0.405 | 0.000 | 0.000 | 0.000 | 1.000 |
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 점검결과 | 소재지도로명주소 | 소재지주소 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 내곡주유소 | 321000022200000011 | 22 | 폐수배출업소관리 | 20170713 | 3210000 | 서울특별시 서초구 | 정기 | N | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | 서울특별시 서초구 헌릉로 210 (내곡동) | 서울특별시 서초구 내곡동 142-3번지 |
1 | 지쓰리(G3)카케어 | 321000022201500724 | 22 | 폐수배출업소관리 | 20170713 | 3210000 | 서울특별시 서초구 | 정기 | N | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | 서울특별시 서초구 명달로 101 (서초동) | <NA> |
2 | 현대공업사 | 321000022200500022 | 22 | 폐수배출업소관리 | 20170713 | 3210000 | 서울특별시 서초구 | 정기 | N | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | <NA> | 서울특별시 서초구 서초동 1516-1번지 |
3 | (주)농협유통하나로주유소 | 321000022200700003 | 22 | 폐수배출업소관리 | 20170713 | 3210000 | 서울특별시 서초구 | 정기 | N | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | <NA> | 서울특별시 서초구 양재동 229번지 |
4 | 위드모터스 | 321000022201500003 | 22 | 폐수배출업소관리 | 20170711 | 3210000 | 서울특별시 서초구 | 정기 | Y | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | 서울특별시 서초구 명달로 36-1 (서초동) | <NA> |
5 | 발전카세차장 | 321000022200000145 | 22 | 폐수배출업소관리 | 20170711 | 3210000 | 서울특별시 서초구 | 정기 | N | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | <NA> | 서울특별시 서초구 서초동 1487-137번지 |
6 | (주)서하앤컴퍼니 | 321000022200800018 | 22 | 폐수배출업소관리 | 20170705 | 3210000 | 서울특별시 서초구 | 정기 | Y | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | 서울특별시 서초구 남부순환로296길 4-16 (방배동) | 서울특별시 서초구 방배동 584번지 |
7 | 양재자동자운전학원 | 321000022200000437 | 22 | 폐수배출업소관리 | 20170705 | 3210000 | 서울특별시 서초구 | 정기 | N | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | 서울특별시 서초구 남부순환로342길 62-26 (양재동) | 서울특별시 서초구 양재동 174번지 |
8 | 카웍스 | 321000022200200585 | 22 | 폐수배출업소관리 | 20170705 | 3210000 | 서울특별시 서초구 | 정기 | Y | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | 서울특별시 서초구 남부순환로 2224 (방배동) | 서울특별시 서초구 방배동 623-5번지 |
9 | (주)골든듀 | 321000022201500001 | 22 | 폐수배출업소관리 | 20170705 | 3210000 | 서울특별시 서초구 | 정기 | N | 폐수배출시설 및 방지시설 적정운영 여부 | <NA> | 서울특별시 서초구 남부순환로 2365 (서초동) | <NA> |
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 점검결과 | 소재지도로명주소 | 소재지주소 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
737 | (주)강남서초에너지 금정주유소 | 321000022200900001 | 22 | 폐수배출업소관리 | 20100311 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 및 방지시설 정상가동여부 | <NA> | <NA> | 서울특별시 서초구 양재동 106-5번지 |
738 | 에스케이네트웍스(주)사평로주유소 | 321000022200000171 | 22 | 폐수배출업소관리 | 20100309 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설및 방지시설 정상가동 여부 | <NA> | <NA> | 서울특별시 서초구 서초동 1302번지 |
739 | 효성토요타(주) | 321000022201000001 | 22 | 폐수배출업소관리 | 20100309 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설및 방지시설 정상가동 여부 | <NA> | <NA> | 서울특별시 서초구 반포동 63-7번지 |
740 | 연일주유소 | 321000022200000170 | 22 | 폐수배출업소관리 | 20100309 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설및 방지시설 정상가동 여부 | <NA> | <NA> | 서울특별시 서초구 서초동 1426-13번지 |
741 | 두꺼비카랜드 | 321000022200000106 | 22 | 폐수배출업소관리 | 20100223 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 및 방지시설 적정가동여부 | <NA> | <NA> | 서울특별시 서초구 양재동 350-10번지 |
742 | 동양자동차 | 321000022200800016 | 22 | 폐수배출업소관리 | 20100223 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 및 방지시설 적정가동여부 | <NA> | <NA> | 서울특별시 서초구 양재동 262-5번지 |
743 | 르노삼성자동차양재개포점 | 321000022200000109 | 22 | 폐수배출업소관리 | 20100223 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 및 방지시설 적정가동여부 | <NA> | <NA> | 서울특별시 서초구 양재동 263-3번지 |
744 | 광혁건설(주) | 321000022200800013 | 22 | 폐수배출업소관리 | 20100209 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 및 방지시설 적정 가동여부 | <NA> | <NA> | 서울특별시 서초구 우면동 산 67-8번지 |
745 | 신분당선 2공구 | 321000022200800010 | 22 | 폐수배출업소관리 | 20100209 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 및 방지시설 적정 가동여부 | <NA> | <NA> | 서울특별시 서초구 양재동 232번지 대 |
746 | 신분당선전철공사-3번환기구 상일토건(주) | 321000022200700016 | 22 | 폐수배출업소관리 | 20100209 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 및 방지시설 적정 가동여부 | <NA> | <NA> | 서울특별시 서초구 양재동 126-1번지 |
Most frequently occurring
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 소재지도로명주소 | 소재지주소 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 스페이스카세차장 | 321000022200800008 | 22 | 폐수배출업소관리 | 20110518 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 및 방지시설 적정가동 여부 | <NA> | 서울특별시 서초구 서초동 1537-3번지 | 2 |
1 | 태봉주유소 | 321000022200000206 | 22 | 폐수배출업소관리 | 20120503 | 3210000 | 서울특별시 서초구 | 정기 | N | 배출시설 적정가동여부 | <NA> | 서울특별시 서초구 우면동 13-4,5,6번지 | 2 |