Dataset statistics
Number of variables | 13 |
---|---|
Number of observations | 1231 |
Missing cells | 1945 |
Missing cells (%) | 12.2% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.1% |
Total size in memory | 131.2 KiB |
Average record size in memory | 109.1 B |
Variable types
Text | 4 |
---|---|
Numeric | 2 |
Categorical | 5 |
Boolean | 1 |
Unsupported | 1 |
Dataset
Description | 업체(시설)명,인허가번호,업종코드,업종명,지도점검일자,점검기관,점검기관명,지도점검구분,처분대상여부,점검사항,점검결과,소재지도로명주소,소재지주소 |
---|---|
Author | 구로구 |
URL | https://data.seoul.go.kr/dataList/OA-2502/S/1/datasetView.do |
점검기관 has constant value "" | Constant |
점검기관명 has constant value "" | Constant |
Dataset has 1 (0.1%) duplicate rows | Duplicates |
업종명 is highly overall correlated with 인허가번호 and 1 other fields | High correlation |
업종코드 is highly overall correlated with 인허가번호 and 1 other fields | High correlation |
인허가번호 is highly overall correlated with 업종코드 and 1 other fields | High correlation |
업종코드 is highly imbalanced (53.5%) | Imbalance |
업종명 is highly imbalanced (55.1%) | Imbalance |
지도점검구분 is highly imbalanced (64.1%) | Imbalance |
처분대상여부 is highly imbalanced (90.9%) | Imbalance |
처분대상여부 has 17 (1.4%) missing values | Missing |
점검사항 has 15 (1.2%) missing values | Missing |
점검결과 has 1231 (100.0%) missing values | Missing |
소재지도로명주소 has 606 (49.2%) missing values | Missing |
소재지주소 has 76 (6.2%) missing values | Missing |
점검결과 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2024-05-11 06:56:30.995990 |
---|---|
Analysis finished | 2024-05-11 06:56:34.035792 |
Duration | 3.04 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
업체(시설)명
Text
Distinct | 315 |
---|---|
Distinct (%) | 25.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.7 KiB |
Length
Max length | 28 |
---|---|
Median length | 20 |
Mean length | 7.1754671 |
Min length | 2 |
Characters and Unicode
Total characters | 8833 |
---|---|
Distinct characters | 315 |
Distinct categories | 11 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 92 ? |
---|---|
Unique (%) | 7.5% |
Sample
1st row | 삼호세차장 |
---|---|
2nd row | 서울석유(주) 풀페이주유소 |
3rd row | 아주지오텍(주)-신부평~영서2구간 전력구 공사 |
4th row | 소낙스 |
5th row | 구로성심병원별관 |
Value | Count | Frequency (%) |
성금사 | 24 | 1.8% |
대한특수연마도금 | 21 | 1.6% |
덕영특수금속 | 19 | 1.4% |
대광특수 | 17 | 1.3% |
명원금속 | 16 | 1.2% |
한일시멘트(주)영등포공장 | 16 | 1.2% |
동광금속 | 15 | 1.1% |
현대그랜드 | 15 | 1.1% |
태성특수도금 | 15 | 1.1% |
구로그린주유소 | 14 | 1.1% |
Other values (331) | 1158 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 480 | 5.4% |
( | 363 | 4.1% |
) | 363 | 4.1% |
업 | 292 | 3.3% |
동 | 236 | 2.7% |
공 | 217 | 2.5% |
금 | 208 | 2.4% |
사 | 201 | 2.3% |
차 | 186 | 2.1% |
대 | 184 | 2.1% |
Other values (305) | 6103 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 7902 | |
Open Punctuation | 367 | 4.2% |
Close Punctuation | 367 | 4.2% |
Space Separator | 99 | 1.1% |
Uppercase Letter | 46 | 0.5% |
Dash Punctuation | 14 | 0.2% |
Lowercase Letter | 12 | 0.1% |
Decimal Number | 9 | 0.1% |
Other Symbol | 7 | 0.1% |
Other Punctuation | 6 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 480 | 6.1% |
업 | 292 | 3.7% |
동 | 236 | 3.0% |
공 | 217 | 2.7% |
금 | 208 | 2.6% |
사 | 201 | 2.5% |
차 | 186 | 2.4% |
대 | 184 | 2.3% |
수 | 169 | 2.1% |
성 | 159 | 2.0% |
Other values (278) | 5570 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 10 | |
K | 9 | |
I | 7 | |
C | 4 | 8.7% |
D | 4 | 8.7% |
T | 3 | 6.5% |
F | 3 | 6.5% |
E | 2 | 4.3% |
P | 2 | 4.3% |
J | 1 | 2.2% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 3 | |
s | 3 | |
l | 3 | |
f | 3 |
Decimal Number
Value | Count | Frequency (%) |
2 | 4 | |
1 | 4 | |
5 | 1 | 11.1% |
Open Punctuation
Value | Count | Frequency (%) |
( | 363 | |
[ | 4 | 1.1% |
Close Punctuation
Value | Count | Frequency (%) |
) | 363 | |
] | 4 | 1.1% |
Space Separator
Value | Count | Frequency (%) |
99 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 14 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 7 |
Other Punctuation
Value | Count | Frequency (%) |
& | 6 |
Math Symbol
Value | Count | Frequency (%) |
~ | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 7909 | |
Common | 866 | 9.8% |
Latin | 58 | 0.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 480 | 6.1% |
업 | 292 | 3.7% |
동 | 236 | 3.0% |
공 | 217 | 2.7% |
금 | 208 | 2.6% |
사 | 201 | 2.5% |
차 | 186 | 2.4% |
대 | 184 | 2.3% |
수 | 169 | 2.1% |
성 | 159 | 2.0% |
Other values (279) | 5577 |
Latin
Value | Count | Frequency (%) |
S | 10 | |
K | 9 | |
I | 7 | |
C | 4 | 6.9% |
D | 4 | 6.9% |
e | 3 | 5.2% |
s | 3 | 5.2% |
l | 3 | 5.2% |
T | 3 | 5.2% |
f | 3 | 5.2% |
Other values (5) | 9 |
Common
Value | Count | Frequency (%) |
( | 363 | |
) | 363 | |
99 | 11.4% | |
- | 14 | 1.6% |
& | 6 | 0.7% |
[ | 4 | 0.5% |
] | 4 | 0.5% |
2 | 4 | 0.5% |
~ | 4 | 0.5% |
1 | 4 | 0.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 7902 | |
ASCII | 924 | 10.5% |
None | 7 | 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 480 | 6.1% |
업 | 292 | 3.7% |
동 | 236 | 3.0% |
공 | 217 | 2.7% |
금 | 208 | 2.6% |
사 | 201 | 2.5% |
차 | 186 | 2.4% |
대 | 184 | 2.3% |
수 | 169 | 2.1% |
성 | 159 | 2.0% |
Other values (278) | 5570 |
ASCII
Value | Count | Frequency (%) |
( | 363 | |
) | 363 | |
99 | 10.7% | |
- | 14 | 1.5% |
S | 10 | 1.1% |
K | 9 | 1.0% |
I | 7 | 0.8% |
& | 6 | 0.6% |
[ | 4 | 0.4% |
] | 4 | 0.4% |
Other values (16) | 45 | 4.9% |
None
Value | Count | Frequency (%) |
㈜ | 7 |
인허가번호
Real number (ℝ)
HIGH CORRELATION
 
Distinct | 371 |
---|---|
Distinct (%) | 30.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 3.1600002 × 1017 |
Minimum | 3.1600002 × 1017 |
---|---|
Maximum | 3.1600004 × 1017 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.9 KiB |
Quantile statistics
Minimum | 3.1600002 × 1017 |
---|---|
5-th percentile | 3.1600002 × 1017 |
Q1 | 3.1600002 × 1017 |
median | 3.1600002 × 1017 |
Q3 | 3.1600002 × 1017 |
95-th percentile | 3.1600002 × 1017 |
Maximum | 3.1600004 × 1017 |
Range | 2.10031 × 1010 |
Interquartile range (IQR) | 9.9989997 × 108 |
Descriptive statistics
Standard deviation | 9.7723194 × 108 |
---|---|
Coefficient of variation (CV) | 3.0925059 × 10-9 |
Kurtosis | 312.06105 |
Mean | 3.1600002 × 1017 |
Median Absolute Deviation (MAD) | 2600000 |
Skewness | 15.011218 |
Sum | 1.6144012 × 1018 |
Variance | 9.5498227 × 1017 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
316000022199300022 | 14 | 1.1% |
316000021200900004 | 13 | 1.1% |
316000021200600024 | 12 | 1.0% |
316000022200000250 | 12 | 1.0% |
316000022200600007 | 11 | 0.9% |
316000022200900007 | 11 | 0.9% |
316000021200500024 | 10 | 0.8% |
316000022200400003 | 9 | 0.7% |
316000022200600031 | 9 | 0.7% |
316000022200500042 | 9 | 0.7% |
Other values (361) | 1121 |
Value | Count | Frequency (%) |
316000021197200032 | 5 | |
316000021197600021 | 3 | |
316000021198400027 | 4 | |
316000021198800006 | 1 | 0.1% |
316000021198900002 | 3 | |
316000021198900010 | 4 | |
316000021198900020 | 5 | |
316000021199200004 | 4 | |
316000021199300017 | 1 | 0.1% |
316000021199500013 | 1 | 0.1% |
Value | Count | Frequency (%) |
316000042200300034 | 1 | |
316000042200000074 | 1 | |
316000025200600003 | 1 | |
316000023201000001 | 1 | |
316000023200200002 | 1 | |
316000023200100002 | 1 | |
316000023199700057 | 1 | |
316000023198900017 | 1 | |
316000023198000001 | 1 | |
316000023197900006 | 1 |
업종코드
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.7 KiB |
21 | |
---|---|
22 | |
23 | 9 |
42 | 2 |
25 | 1 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 22 |
---|---|
2nd row | 22 |
3rd row | 22 |
4th row | 22 |
5th row | 22 |
Common Values
Value | Count | Frequency (%) |
21 | 630 | |
22 | 589 | |
23 | 9 | 0.7% |
42 | 2 | 0.2% |
25 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
21 | 630 | |
22 | 589 | |
23 | 9 | 0.7% |
42 | 2 | 0.2% |
25 | 1 | 0.1% |
업종명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 0.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.7 KiB |
대기배출업소관리 | |
---|---|
폐수배출업소관리 | |
<NA> | 15 |
소음진동관리 | 9 |
유독물판매업관리 | 2 |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 7.9374492 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 폐수배출업소관리 |
---|---|
2nd row | 폐수배출업소관리 |
3rd row | 폐수배출업소관리 |
4th row | 폐수배출업소관리 |
5th row | 폐수배출업소관리 |
Common Values
Value | Count | Frequency (%) |
대기배출업소관리 | 625 | |
폐수배출업소관리 | 579 | |
<NA> | 15 | 1.2% |
소음진동관리 | 9 | 0.7% |
유독물판매업관리 | 2 | 0.2% |
기타수질오염원관리 | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
대기배출업소관리 | 625 | |
폐수배출업소관리 | 579 | |
na | 15 | 1.2% |
소음진동관리 | 9 | 0.7% |
유독물판매업관리 | 2 | 0.2% |
기타수질오염원관리 | 1 | 0.1% |
지도점검일자
Real number (ℝ)
Distinct | 281 |
---|---|
Distinct (%) | 22.8% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 20134206 |
Minimum | 20100127 |
---|---|
Maximum | 20171130 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.9 KiB |
Quantile statistics
Minimum | 20100127 |
---|---|
5-th percentile | 20100704 |
Q1 | 20110926 |
median | 20130628 |
Q3 | 20160421 |
95-th percentile | 20170918 |
Maximum | 20171130 |
Range | 71003 |
Interquartile range (IQR) | 49495 |
Descriptive statistics
Standard deviation | 23795.578 |
---|---|
Coefficient of variation (CV) | 0.0011818483 |
Kurtosis | -1.3405838 |
Mean | 20134206 |
Median Absolute Deviation (MAD) | 20020 |
Skewness | 0.087440585 |
Sum | 2.4785208 × 1010 |
Variance | 5.6622953 × 108 |
Monotonicity | Decreasing |
Value | Count | Frequency (%) |
20121126 | 16 | 1.3% |
20120622 | 15 | 1.2% |
20120625 | 13 | 1.1% |
20160616 | 12 | 1.0% |
20160421 | 12 | 1.0% |
20100723 | 12 | 1.0% |
20160429 | 11 | 0.9% |
20140919 | 11 | 0.9% |
20150304 | 11 | 0.9% |
20101217 | 10 | 0.8% |
Other values (271) | 1108 |
Value | Count | Frequency (%) |
20100127 | 2 | |
20100212 | 1 | 0.1% |
20100218 | 3 | |
20100224 | 1 | 0.1% |
20100302 | 1 | 0.1% |
20100316 | 2 | |
20100330 | 1 | 0.1% |
20100401 | 1 | 0.1% |
20100402 | 1 | 0.1% |
20100405 | 2 |
Value | Count | Frequency (%) |
20171130 | 3 | |
20171128 | 4 | |
20171114 | 3 | |
20171113 | 4 | |
20171110 | 2 | |
20171109 | 2 | |
20171027 | 2 | |
20171026 | 3 | |
20170929 | 4 | |
20170928 | 4 |
점검기관
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.7 KiB |
3160000 |
---|
Length
Max length | 7 |
---|---|
Median length | 7 |
Mean length | 7 |
Min length | 7 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 3160000 |
---|---|
2nd row | 3160000 |
3rd row | 3160000 |
4th row | 3160000 |
5th row | 3160000 |
Common Values
Value | Count | Frequency (%) |
3160000 | 1231 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
3160000 | 1231 |
점검기관명
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.7 KiB |
서울특별시 구로구 |
---|
Length
Max length | 9 |
---|---|
Median length | 9 |
Mean length | 9 |
Min length | 9 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서울특별시 구로구 |
---|---|
2nd row | 서울특별시 구로구 |
3rd row | 서울특별시 구로구 |
4th row | 서울특별시 구로구 |
5th row | 서울특별시 구로구 |
Common Values
Value | Count | Frequency (%) |
서울특별시 구로구 | 1231 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
서울특별시 | 1231 | |
구로구 | 1231 |
지도점검구분
Categorical
IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.7 KiB |
정기 | |
---|---|
합동 | 90 |
수시 | 38 |
기타 | 26 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 정기 |
---|---|
2nd row | 정기 |
3rd row | 정기 |
4th row | 정기 |
5th row | 정기 |
Common Values
Value | Count | Frequency (%) |
정기 | 1077 | |
합동 | 90 | 7.3% |
수시 | 38 | 3.1% |
기타 | 26 | 2.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
정기 | 1077 | |
합동 | 90 | 7.3% |
수시 | 38 | 3.1% |
기타 | 26 | 2.1% |
처분대상여부
Boolean
IMBALANCE
  MISSING
 
Distinct | 2 |
---|---|
Distinct (%) | 0.2% |
Missing | 17 |
Missing (%) | 1.4% |
Memory size | 2.5 KiB |
False | |
---|---|
True | 14 |
(Missing) | 17 |
Value | Count | Frequency (%) |
False | 1200 | |
True | 14 | 1.1% |
(Missing) | 17 | 1.4% |
점검사항
Text
MISSING
 
Distinct | 139 |
---|---|
Distinct (%) | 11.4% |
Missing | 15 |
Missing (%) | 1.2% |
Memory size | 9.7 KiB |
Value | Count | Frequency (%) |
및 | 940 | |
방지시설 | 913 | |
배출시설 | 857 | |
여부 | 697 | |
등 | 305 | 5.6% |
정상가동 | 261 | 4.8% |
적정 | 181 | 3.3% |
정상운영 | 125 | 2.3% |
적정운영 | 117 | 2.1% |
대기 | 104 | 1.9% |
Other values (76) | 987 |
Most occurring characters
Value | Count | Frequency (%) |
4271 | ||
시 | 1960 | 9.6% |
설 | 1959 | 9.6% |
배 | 998 | 4.9% |
및 | 998 | 4.9% |
출 | 998 | 4.9% |
지 | 986 | 4.8% |
방 | 964 | 4.7% |
부 | 811 | 4.0% |
여 | 810 | 4.0% |
Other values (78) | 5747 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 16214 | |
Space Separator | 4271 | 20.8% |
Other Punctuation | 13 | 0.1% |
Close Punctuation | 2 | < 0.1% |
Open Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 1960 | 12.1% |
설 | 1959 | 12.1% |
배 | 998 | 6.2% |
및 | 998 | 6.2% |
출 | 998 | 6.2% |
지 | 986 | 6.1% |
방 | 964 | 5.9% |
부 | 811 | 5.0% |
여 | 810 | 5.0% |
정 | 787 | 4.9% |
Other values (74) | 4943 |
Space Separator
Value | Count | Frequency (%) |
4271 |
Other Punctuation
Value | Count | Frequency (%) |
, | 13 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 16214 | |
Common | 4288 | 20.9% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 1960 | 12.1% |
설 | 1959 | 12.1% |
배 | 998 | 6.2% |
및 | 998 | 6.2% |
출 | 998 | 6.2% |
지 | 986 | 6.1% |
방 | 964 | 5.9% |
부 | 811 | 5.0% |
여 | 810 | 5.0% |
정 | 787 | 4.9% |
Other values (74) | 4943 |
Common
Value | Count | Frequency (%) |
4271 | ||
, | 13 | 0.3% |
) | 2 | < 0.1% |
( | 2 | < 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 16214 | |
ASCII | 4288 | 20.9% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4271 | ||
, | 13 | 0.3% |
) | 2 | < 0.1% |
( | 2 | < 0.1% |
Hangul
Value | Count | Frequency (%) |
시 | 1960 | 12.1% |
설 | 1959 | 12.1% |
배 | 998 | 6.2% |
및 | 998 | 6.2% |
출 | 998 | 6.2% |
지 | 986 | 6.1% |
방 | 964 | 5.9% |
부 | 811 | 5.0% |
여 | 810 | 5.0% |
정 | 787 | 4.9% |
Other values (74) | 4943 |
점검결과
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 1231 |
---|---|
Missing (%) | 100.0% |
Memory size | 10.9 KiB |
소재지도로명주소
Text
MISSING
 
Distinct | 174 |
---|---|
Distinct (%) | 27.8% |
Missing | 606 |
Missing (%) | 49.2% |
Memory size | 9.7 KiB |
Length
Max length | 67 |
---|---|
Median length | 51 |
Mean length | 27.8896 |
Min length | 21 |
Characters and Unicode
Total characters | 17431 |
---|---|
Distinct characters | 173 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 38 ? |
---|---|
Unique (%) | 6.1% |
Sample
1st row | 서울특별시 구로구 중앙로 93 (고척동) |
---|---|
2nd row | 서울특별시 구로구 경인로 41 (온수동) |
3rd row | 서울특별시 구로구 경인로 15-20 (온수동) |
4th row | 서울특별시 구로구 가마산로 91-30 (구로동) |
5th row | 서울특별시 구로구 중앙로 10-15 (고척동) |
Value | Count | Frequency (%) |
서울특별시 | 625 | |
구로구 | 625 | |
구로동 | 311 | 9.4% |
신도림동 | 129 | 3.9% |
경인로 | 72 | 2.2% |
온수동 | 58 | 1.8% |
경인로55길 | 57 | 1.7% |
61 | 57 | 1.7% |
구로중앙로42길 | 57 | 1.7% |
고척동 | 48 | 1.5% |
Other values (259) | 1259 |
Most occurring characters
Value | Count | Frequency (%) |
2673 | 15.3% | |
구 | 1701 | 9.8% |
로 | 1693 | 9.7% |
동 | 669 | 3.8% |
서 | 634 | 3.6% |
시 | 630 | 3.6% |
특 | 625 | 3.6% |
별 | 625 | 3.6% |
울 | 625 | 3.6% |
) | 625 | 3.6% |
Other values (163) | 6931 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 10496 | |
Decimal Number | 2709 | 15.5% |
Space Separator | 2673 | 15.3% |
Close Punctuation | 625 | 3.6% |
Open Punctuation | 625 | 3.6% |
Other Punctuation | 177 | 1.0% |
Dash Punctuation | 101 | 0.6% |
Uppercase Letter | 17 | 0.1% |
Math Symbol | 8 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 1701 | |
로 | 1693 | |
동 | 669 | 6.4% |
서 | 634 | 6.0% |
시 | 630 | 6.0% |
특 | 625 | 6.0% |
별 | 625 | 6.0% |
울 | 625 | 6.0% |
길 | 404 | 3.8% |
림 | 185 | 1.8% |
Other values (140) | 2705 |
Decimal Number
Value | Count | Frequency (%) |
1 | 564 | |
2 | 417 | |
5 | 344 | |
3 | 280 | |
4 | 271 | |
6 | 203 | 7.5% |
0 | 202 | 7.5% |
7 | 199 | 7.3% |
8 | 127 | 4.7% |
9 | 102 | 3.8% |
Uppercase Letter
Value | Count | Frequency (%) |
B | 8 | |
G | 5 | |
S | 2 | 11.8% |
C | 1 | 5.9% |
J | 1 | 5.9% |
Other Punctuation
Value | Count | Frequency (%) |
, | 175 | |
& | 2 | 1.1% |
Math Symbol
Value | Count | Frequency (%) |
~ | 5 | |
+ | 3 |
Space Separator
Value | Count | Frequency (%) |
2673 |
Close Punctuation
Value | Count | Frequency (%) |
) | 625 |
Open Punctuation
Value | Count | Frequency (%) |
( | 625 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 101 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 10496 | |
Common | 6918 | |
Latin | 17 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 1701 | |
로 | 1693 | |
동 | 669 | 6.4% |
서 | 634 | 6.0% |
시 | 630 | 6.0% |
특 | 625 | 6.0% |
별 | 625 | 6.0% |
울 | 625 | 6.0% |
길 | 404 | 3.8% |
림 | 185 | 1.8% |
Other values (140) | 2705 |
Common
Value | Count | Frequency (%) |
2673 | ||
) | 625 | 9.0% |
( | 625 | 9.0% |
1 | 564 | 8.2% |
2 | 417 | 6.0% |
5 | 344 | 5.0% |
3 | 280 | 4.0% |
4 | 271 | 3.9% |
6 | 203 | 2.9% |
0 | 202 | 2.9% |
Other values (8) | 714 | 10.3% |
Latin
Value | Count | Frequency (%) |
B | 8 | |
G | 5 | |
S | 2 | 11.8% |
C | 1 | 5.9% |
J | 1 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 10496 | |
ASCII | 6935 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
2673 | ||
) | 625 | 9.0% |
( | 625 | 9.0% |
1 | 564 | 8.1% |
2 | 417 | 6.0% |
5 | 344 | 5.0% |
3 | 280 | 4.0% |
4 | 271 | 3.9% |
6 | 203 | 2.9% |
0 | 202 | 2.9% |
Other values (13) | 731 | 10.5% |
Hangul
Value | Count | Frequency (%) |
구 | 1701 | |
로 | 1693 | |
동 | 669 | 6.4% |
서 | 634 | 6.0% |
시 | 630 | 6.0% |
특 | 625 | 6.0% |
별 | 625 | 6.0% |
울 | 625 | 6.0% |
길 | 404 | 3.8% |
림 | 185 | 1.8% |
Other values (140) | 2705 |
소재지주소
Text
MISSING
 
Distinct | 271 |
---|---|
Distinct (%) | 23.5% |
Missing | 76 |
Missing (%) | 6.2% |
Memory size | 9.7 KiB |
Length
Max length | 42 |
---|---|
Median length | 38 |
Mean length | 24.038095 |
Min length | 14 |
Characters and Unicode
Total characters | 27764 |
---|---|
Distinct characters | 110 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 77 ? |
---|---|
Unique (%) | 6.7% |
Sample
1st row | 서울특별시 구로구 고척동 185-9번지 |
---|---|
2nd row | 서울특별시 구로구 온수동 35-3번지 |
3rd row | 서울특별시 구로구 온수동 45-24번지 |
4th row | 서울특별시 구로구 구로동 701-22번지 |
5th row | 서울특별시 구로구 고척동 76-147번지 |
Value | Count | Frequency (%) |
서울특별시 | 1155 | |
구로구 | 1155 | |
구로동 | 542 | 10.9% |
신도림동 | 254 | 5.1% |
온수동 | 107 | 2.2% |
616-1번지 | 106 | 2.1% |
고척동 | 105 | 2.1% |
개봉동 | 59 | 1.2% |
오류동 | 57 | 1.1% |
286-3번지 | 46 | 0.9% |
Other values (311) | 1372 |
Most occurring characters
Value | Count | Frequency (%) |
4892 | ||
구 | 2853 | 10.3% |
로 | 1697 | 6.1% |
1 | 1322 | 4.8% |
동 | 1163 | 4.2% |
지 | 1158 | 4.2% |
서 | 1155 | 4.2% |
특 | 1155 | 4.2% |
별 | 1155 | 4.2% |
시 | 1155 | 4.2% |
Other values (100) | 10059 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 15962 | |
Decimal Number | 5685 | 20.5% |
Space Separator | 4892 | 17.6% |
Dash Punctuation | 1117 | 4.0% |
Other Punctuation | 37 | 0.1% |
Close Punctuation | 28 | 0.1% |
Open Punctuation | 28 | 0.1% |
Uppercase Letter | 15 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 2853 | |
로 | 1697 | |
동 | 1163 | |
지 | 1158 | |
서 | 1155 | |
특 | 1155 | |
별 | 1155 | |
시 | 1155 | |
울 | 1155 | |
번 | 1144 | |
Other values (80) | 2172 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1322 | |
2 | 808 | |
6 | 775 | |
0 | 472 | 8.3% |
8 | 440 | 7.7% |
3 | 414 | 7.3% |
7 | 406 | 7.1% |
5 | 376 | 6.6% |
4 | 354 | 6.2% |
9 | 318 | 5.6% |
Uppercase Letter
Value | Count | Frequency (%) |
I | 6 | |
T | 5 | |
B | 2 | 13.3% |
E | 1 | 6.7% |
Z | 1 | 6.7% |
Space Separator
Value | Count | Frequency (%) |
4892 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1117 |
Other Punctuation
Value | Count | Frequency (%) |
, | 37 |
Close Punctuation
Value | Count | Frequency (%) |
) | 28 |
Open Punctuation
Value | Count | Frequency (%) |
( | 28 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 15962 | |
Common | 11787 | |
Latin | 15 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 2853 | |
로 | 1697 | |
동 | 1163 | |
지 | 1158 | |
서 | 1155 | |
특 | 1155 | |
별 | 1155 | |
시 | 1155 | |
울 | 1155 | |
번 | 1144 | |
Other values (80) | 2172 |
Common
Value | Count | Frequency (%) |
4892 | ||
1 | 1322 | 11.2% |
- | 1117 | 9.5% |
2 | 808 | 6.9% |
6 | 775 | 6.6% |
0 | 472 | 4.0% |
8 | 440 | 3.7% |
3 | 414 | 3.5% |
7 | 406 | 3.4% |
5 | 376 | 3.2% |
Other values (5) | 765 | 6.5% |
Latin
Value | Count | Frequency (%) |
I | 6 | |
T | 5 | |
B | 2 | 13.3% |
E | 1 | 6.7% |
Z | 1 | 6.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 15962 | |
ASCII | 11802 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4892 | ||
1 | 1322 | 11.2% |
- | 1117 | 9.5% |
2 | 808 | 6.8% |
6 | 775 | 6.6% |
0 | 472 | 4.0% |
8 | 440 | 3.7% |
3 | 414 | 3.5% |
7 | 406 | 3.4% |
5 | 376 | 3.2% |
Other values (10) | 780 | 6.6% |
Hangul
Value | Count | Frequency (%) |
구 | 2853 | |
로 | 1697 | |
동 | 1163 | |
지 | 1158 | |
서 | 1155 | |
특 | 1155 | |
별 | 1155 | |
시 | 1155 | |
울 | 1155 | |
번 | 1144 | |
Other values (80) | 2172 |
인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 지도점검구분 | 처분대상여부 | |
---|---|---|---|---|---|---|
인허가번호 | 1.000 | 1.000 | 1.000 | 0.066 | 0.000 | 0.000 |
업종코드 | 1.000 | 1.000 | 1.000 | 0.140 | 0.053 | 0.062 |
업종명 | 1.000 | 1.000 | 1.000 | 0.137 | 0.059 | 0.062 |
지도점검일자 | 0.066 | 0.140 | 0.137 | 1.000 | 0.561 | 0.112 |
지도점검구분 | 0.000 | 0.053 | 0.059 | 0.561 | 1.000 | 0.233 |
처분대상여부 | 0.000 | 0.062 | 0.062 | 0.112 | 0.233 | 1.000 |
업종명 | 업종코드 | 처분대상여부 | 지도점검구분 | |
---|---|---|---|---|
업종명 | 1.000 | 1.000 | 0.076 | 0.048 |
업종코드 | 1.000 | 1.000 | 0.076 | 0.043 |
처분대상여부 | 0.076 | 0.076 | 1.000 | 0.154 |
지도점검구분 | 0.048 | 0.043 | 0.154 | 1.000 |
인허가번호 | 지도점검일자 | 업종코드 | 업종명 | 지도점검구분 | 처분대상여부 | |
---|---|---|---|---|---|---|
인허가번호 | 1.000 | 0.046 | 0.999 | 0.999 | 0.000 | 0.000 |
지도점검일자 | 0.046 | 1.000 | 0.085 | 0.083 | 0.277 | 0.084 |
업종코드 | 0.999 | 0.085 | 1.000 | 1.000 | 0.043 | 0.076 |
업종명 | 0.999 | 0.083 | 1.000 | 1.000 | 0.048 | 0.076 |
지도점검구분 | 0.000 | 0.277 | 0.043 | 0.048 | 1.000 | 0.154 |
처분대상여부 | 0.000 | 0.084 | 0.076 | 0.076 | 0.154 | 1.000 |
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 점검결과 | 소재지도로명주소 | 소재지주소 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 삼호세차장 | 316000022198400059 | 22 | 폐수배출업소관리 | 20171130 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | 서울특별시 구로구 중앙로 93 (고척동) | 서울특별시 구로구 고척동 185-9번지 |
1 | 서울석유(주) 풀페이주유소 | 316000022199700098 | 22 | 폐수배출업소관리 | 20171130 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | 서울특별시 구로구 경인로 41 (온수동) | 서울특별시 구로구 온수동 35-3번지 |
2 | 아주지오텍(주)-신부평~영서2구간 전력구 공사 | 316000022201400007 | 22 | 폐수배출업소관리 | 20171130 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | 서울특별시 구로구 경인로 15-20 (온수동) | 서울특별시 구로구 온수동 45-24번지 |
3 | 소낙스 | 316000022201400003 | 22 | 폐수배출업소관리 | 20171128 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | 서울특별시 구로구 가마산로 91-30 (구로동) | 서울특별시 구로구 구로동 701-22번지 |
4 | 구로성심병원별관 | 316000022201000010 | 22 | 폐수배출업소관리 | 20171128 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | 서울특별시 구로구 중앙로 10-15 (고척동) | 서울특별시 구로구 고척동 76-147번지 |
5 | 대성모터스 | 316000022199600085 | 22 | 폐수배출업소관리 | 20171128 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | 서울특별시 구로구 구로동로 3 (가리봉동) | 서울특별시 구로구 가리봉동 121-43번지 |
6 | 구로아지트셀프세차장 | 316000022200000250 | 22 | 폐수배출업소관리 | 20171128 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | 서울특별시 구로구 가마산로 91-30, 110호 (구로동) | 서울특별시 구로구 구로동 701-22번지 |
7 | 대성산업(주) 오류충전소 | 316000022200200041 | 22 | 폐수배출업소관리 | 20171114 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | <NA> | 서울특별시 구로구 오류동 74-8번지 |
8 | 대형상운(주) | 316000022200700006 | 22 | 폐수배출업소관리 | 20171114 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | <NA> | 서울특별시 구로구 오류동 123번지 |
9 | (주)삼신교통 | 316000022198700070 | 22 | 폐수배출업소관리 | 20171114 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수 | <NA> | 서울특별시 구로구 경인로 107 (오류동) | 서울특별시 구로구 오류동 90-5번지 |
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 점검결과 | 소재지도로명주소 | 소재지주소 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1221 | ㈜청룡환경 | 316000022200800015 | 22 | 폐수배출업소관리 | 20100316 | 3160000 | 서울특별시 구로구 | 합동 | N | 환경관련법 준수사항 여부 등 | <NA> | <NA> | 서울특별시 구로구 구로동 197-22번지 에이스테크노타워 209호 |
1222 | (주)청룡환경 | 316000022200900008 | 22 | 폐수배출업소관리 | 20100316 | 3160000 | 서울특별시 구로구 | 정기 | N | 환경관련법 준수사항 여부 등 | <NA> | <NA> | 서울특별시 구로구 구로동 197-22번지 에이크테크노타워5차 403호 |
1223 | 한일시멘트(주)영등포공장 | 316000021197200032 | 21 | 대기배출업소관리 | 20100302 | 3160000 | 서울특별시 구로구 | 정기 | N | 환경관련법 준수사항 이행여부 등 | <NA> | 서울특별시 구로구 경인로 302 (개봉동) | 서울특별시 구로구 개봉동 222번지 |
1224 | 덴트젠구로점 | 316000022200900009 | 22 | 폐수배출업소관리 | 20100224 | 3160000 | 서울특별시 구로구 | 정기 | N | 배출시설 및 방지시설 적정 설치 운영 여부 | <NA> | <NA> | 서울특별시 구로구 구로동 808-34번지 4필지 |
1225 | 보성운수-주 | 316000022198000026 | 22 | 폐수배출업소관리 | 20100218 | 3160000 | 서울특별시 구로구 | 정기 | N | 방지시설 적정운영 및 개선명령이행 여부 확인 | <NA> | <NA> | 서울특별시 구로구 구로동 145-17번지 |
1226 | 대성산업(주)제5주유소 | 316000022199500011 | 22 | 폐수배출업소관리 | 20100218 | 3160000 | 서울특별시 구로구 | 정기 | N | 방지시설 적정운영 및 개선명령이행 여부 확인 | <NA> | <NA> | 서울특별시 구로구 신도림동 361번지 |
1227 | 현대오일뱅크(주)구로공단주유소 | 316000022200500016 | 22 | 폐수배출업소관리 | 20100218 | 3160000 | 서울특별시 구로구 | 정기 | N | 방지시설 적정운영 및 개선명령이행 여부 확인 | <NA> | <NA> | 서울특별시 구로구 구로동 1131-4번지 |
1228 | 동선주유소 | 316000022200600021 | 22 | 폐수배출업소관리 | 20100212 | 3160000 | 서울특별시 구로구 | 정기 | N | 방지시설 적정운영 및 개선명령이행 여부 | <NA> | <NA> | 서울특별시 구로구 오류동 77-10번지 |
1229 | 한일시멘트(주)영등포공장 | 316000022197200063 | 22 | 폐수배출업소관리 | 20100127 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수배출시설 및 방지시설 운영 적정 여부 등 | <NA> | 서울특별시 구로구 경인로 302 (개봉동) | 서울특별시 구로구 개봉동 222번지 |
1230 | (주)유진개발 | 316000022200600007 | 22 | 폐수배출업소관리 | 20100127 | 3160000 | 서울특별시 구로구 | 정기 | N | 폐수배출시설 및 방지시설 적정 운영 여부 등 | <NA> | <NA> | 서울특별시 구로구 오류동 331-25번지 |
Most frequently occurring
업체(시설)명 | 인허가번호 | 업종코드 | 업종명 | 지도점검일자 | 점검기관 | 점검기관명 | 지도점검구분 | 처분대상여부 | 점검사항 | 소재지도로명주소 | 소재지주소 | # duplicates | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 직암특수금속 | 316000021200400051 | 21 | 대기배출업소관리 | 20101025 | 3160000 | 서울특별시 구로구 | 정기 | N | 배출시설 및 방지시설 운영사항 | <NA> | 서울특별시 구로구 신도림동 286-3번지 | 2 |