Overview

Dataset statistics

Number of variables6
Number of observations10000
Missing cells5987
Missing cells (%)10.0%
Duplicate rows1018
Duplicate rows (%)10.2%
Total size in memory546.9 KiB
Average record size in memory56.0 B

Variable types

Text5
Categorical1

Dataset

Description경기도 고양시 지정폐기물 처리계획의 정보에 대한 데이터로 고양시 지정폐기물 인허가관리번호, 신고번호, 상호, 대표자, 사업자등록번호, 폐기물종류 등의 항목을 제공합니다.(시스템 등록 이전 신고건은 신고번호와 사업자등록번호 미등록)
Author경기도 고양시
URLhttps://www.data.go.kr/data/3078973/fileData.do

Alerts

업무구분 has constant value ""Constant
Dataset has 1018 (10.2%) duplicate rowsDuplicates
사업장도로명우편번호 has 5987 (59.9%) missing valuesMissing

Reproduction

Analysis started2024-03-14 23:24:10.283846
Analysis finished2024-03-14 23:24:12.529497
Duration2.25 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

상호
Text

Distinct3804
Distinct (%)38.0%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-03-15T08:24:13.236372image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length24
Median length21
Mean length7.3435
Min length1

Characters and Unicode

Total characters73435
Distinct characters656
Distinct categories13 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique1058 ?
Unique (%)10.6%

Sample

1st row일산라쥬네스내과
2nd row나무치과
3rd row백세케어요양원
4th row(주)창조인쇄
5th row두승전력(주)
ValueCountFrequency (%)
주식회사 90
 
0.8%
의료법인 30
 
0.3%
동국대학교 29
 
0.3%
국군고양병원 27
 
0.3%
8350부대 23
 
0.2%
제1군수지원여단 22
 
0.2%
천지환경연합회 21
 
0.2%
동물병원 21
 
0.2%
동국대학교의료원(일산 20
 
0.2%
고양시덕양구보건소 19
 
0.2%
Other values (3901) 10294
97.1%
2024-03-15T08:24:14.634288image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
4875
 
6.6%
3758
 
5.1%
2908
 
4.0%
1367
 
1.9%
) 1324
 
1.8%
1322
 
1.8%
( 1314
 
1.8%
1239
 
1.7%
1163
 
1.6%
1161
 
1.6%
Other values (646) 53004
72.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 68687
93.5%
Close Punctuation 1324
 
1.8%
Open Punctuation 1314
 
1.8%
Decimal Number 825
 
1.1%
Space Separator 676
 
0.9%
Uppercase Letter 432
 
0.6%
Lowercase Letter 99
 
0.1%
Other Punctuation 37
 
0.1%
Other Symbol 16
 
< 0.1%
Connector Punctuation 15
 
< 0.1%
Other values (3) 10
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
4875
 
7.1%
3758
 
5.5%
2908
 
4.2%
1367
 
2.0%
1322
 
1.9%
1239
 
1.8%
1163
 
1.7%
1161
 
1.7%
1135
 
1.7%
1104
 
1.6%
Other values (586) 48655
70.8%
Uppercase Letter
ValueCountFrequency (%)
S 57
13.2%
K 48
 
11.1%
T 37
 
8.6%
R 27
 
6.2%
N 25
 
5.8%
O 25
 
5.8%
M 24
 
5.6%
D 24
 
5.6%
I 20
 
4.6%
P 20
 
4.6%
Other values (15) 125
28.9%
Lowercase Letter
ValueCountFrequency (%)
e 22
22.2%
s 13
13.1%
r 13
13.1%
d 11
11.1%
w 10
10.1%
i 10
10.1%
o 5
 
5.1%
g 4
 
4.0%
l 3
 
3.0%
h 3
 
3.0%
Other values (4) 5
 
5.1%
Decimal Number
ValueCountFrequency (%)
1 155
18.8%
3 128
15.5%
5 98
11.9%
2 89
10.8%
6 76
9.2%
7 67
8.1%
9 61
 
7.4%
0 58
 
7.0%
8 57
 
6.9%
4 36
 
4.4%
Other Punctuation
ValueCountFrequency (%)
. 30
81.1%
& 6
 
16.2%
/ 1
 
2.7%
Close Punctuation
ValueCountFrequency (%)
) 1324
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1314
100.0%
Space Separator
ValueCountFrequency (%)
676
100.0%
Other Symbol
ValueCountFrequency (%)
16
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 15
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 7
100.0%
Math Symbol
ValueCountFrequency (%)
+ 2
100.0%
Modifier Symbol
ValueCountFrequency (%)
` 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 68703
93.6%
Common 4201
 
5.7%
Latin 531
 
0.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
4875
 
7.1%
3758
 
5.5%
2908
 
4.2%
1367
 
2.0%
1322
 
1.9%
1239
 
1.8%
1163
 
1.7%
1161
 
1.7%
1135
 
1.7%
1104
 
1.6%
Other values (587) 48671
70.8%
Latin
ValueCountFrequency (%)
S 57
 
10.7%
K 48
 
9.0%
T 37
 
7.0%
R 27
 
5.1%
N 25
 
4.7%
O 25
 
4.7%
M 24
 
4.5%
D 24
 
4.5%
e 22
 
4.1%
I 20
 
3.8%
Other values (29) 222
41.8%
Common
ValueCountFrequency (%)
) 1324
31.5%
( 1314
31.3%
676
16.1%
1 155
 
3.7%
3 128
 
3.0%
5 98
 
2.3%
2 89
 
2.1%
6 76
 
1.8%
7 67
 
1.6%
9 61
 
1.5%
Other values (10) 213
 
5.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 68687
93.5%
ASCII 4732
 
6.4%
None 16
 
< 0.1%

Most frequent character per block

Hangul
ValueCountFrequency (%)
4875
 
7.1%
3758
 
5.5%
2908
 
4.2%
1367
 
2.0%
1322
 
1.9%
1239
 
1.8%
1163
 
1.7%
1161
 
1.7%
1135
 
1.7%
1104
 
1.6%
Other values (586) 48655
70.8%
ASCII
ValueCountFrequency (%)
) 1324
28.0%
( 1314
27.8%
676
14.3%
1 155
 
3.3%
3 128
 
2.7%
5 98
 
2.1%
2 89
 
1.9%
6 76
 
1.6%
7 67
 
1.4%
9 61
 
1.3%
Other values (49) 744
15.7%
None
ValueCountFrequency (%)
16
100.0%
Distinct79
Distinct (%)0.8%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-03-15T08:24:15.479175image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length81
Median length75
Mean length14.0906
Min length1

Characters and Unicode

Total characters140906
Distinct characters209
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique15 ?
Unique (%)0.1%

Sample

1st row손상성폐기물
2nd row조직물류폐기물(태반을 재활용하는 경우는 제외한다)
3rd row일반의료폐기물
4th row그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]
5th row그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]
ValueCountFrequency (%)
2051
 
7.3%
밖의 1991
 
7.1%
손상성폐기물 1777
 
6.3%
일반의료폐기물 1543
 
5.5%
광물류 1041
 
3.7%
제외한다 976
 
3.5%
조직물류폐기물(태반을 963
 
3.4%
재활용하는 963
 
3.4%
경우는 963
 
3.4%
폐유 653
 
2.3%
Other values (153) 15135
53.9%
2024-03-15T08:24:16.951576image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
18116
 
12.9%
8777
 
6.2%
7721
 
5.5%
6440
 
4.6%
5034
 
3.6%
4026
 
2.9%
2718
 
1.9%
2673
 
1.9%
2591
 
1.8%
2534
 
1.8%
Other values (199) 80276
57.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 115599
82.0%
Space Separator 18116
 
12.9%
Close Punctuation 1954
 
1.4%
Open Punctuation 1954
 
1.4%
Lowercase Letter 1680
 
1.2%
Decimal Number 1014
 
0.7%
Connector Punctuation 575
 
0.4%
Other Punctuation 14
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
8777
 
7.6%
7721
 
6.7%
6440
 
5.6%
5034
 
4.4%
4026
 
3.5%
2718
 
2.4%
2673
 
2.3%
2591
 
2.2%
2534
 
2.2%
2508
 
2.2%
Other values (181) 70577
61.1%
Lowercase Letter
ValueCountFrequency (%)
e 560
33.3%
s 280
16.7%
a 280
16.7%
r 280
16.7%
g 280
16.7%
Decimal Number
ValueCountFrequency (%)
2 342
33.7%
1 334
32.9%
0 280
27.6%
8 58
 
5.7%
Close Punctuation
ValueCountFrequency (%)
) 1616
82.7%
] 280
 
14.3%
58
 
3.0%
Open Punctuation
ValueCountFrequency (%)
( 1616
82.7%
[ 280
 
14.3%
58
 
3.0%
Space Separator
ValueCountFrequency (%)
18116
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 575
100.0%
Other Punctuation
ValueCountFrequency (%)
· 14
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 115599
82.0%
Common 23627
 
16.8%
Latin 1680
 
1.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
8777
 
7.6%
7721
 
6.7%
6440
 
5.6%
5034
 
4.4%
4026
 
3.5%
2718
 
2.4%
2673
 
2.3%
2591
 
2.2%
2534
 
2.2%
2508
 
2.2%
Other values (181) 70577
61.1%
Common
ValueCountFrequency (%)
18116
76.7%
) 1616
 
6.8%
( 1616
 
6.8%
_ 575
 
2.4%
2 342
 
1.4%
1 334
 
1.4%
[ 280
 
1.2%
0 280
 
1.2%
] 280
 
1.2%
58
 
0.2%
Other values (3) 130
 
0.6%
Latin
ValueCountFrequency (%)
e 560
33.3%
s 280
16.7%
a 280
16.7%
r 280
16.7%
g 280
16.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 113570
80.6%
ASCII 25177
 
17.9%
Compat Jamo 2029
 
1.4%
None 130
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
18116
72.0%
) 1616
 
6.4%
( 1616
 
6.4%
_ 575
 
2.3%
e 560
 
2.2%
2 342
 
1.4%
1 334
 
1.3%
[ 280
 
1.1%
s 280
 
1.1%
a 280
 
1.1%
Other values (5) 1178
 
4.7%
Hangul
ValueCountFrequency (%)
8777
 
7.7%
7721
 
6.8%
6440
 
5.7%
5034
 
4.4%
4026
 
3.5%
2718
 
2.4%
2673
 
2.4%
2591
 
2.3%
2534
 
2.2%
2508
 
2.2%
Other values (180) 68548
60.4%
Compat Jamo
ValueCountFrequency (%)
2029
100.0%
None
ValueCountFrequency (%)
58
44.6%
58
44.6%
· 14
 
10.8%
Distinct2984
Distinct (%)29.8%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-03-15T08:24:18.704799image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length65
Median length55
Mean length27.5647
Min length1

Characters and Unicode

Total characters275647
Distinct characters429
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique750 ?
Unique (%)7.5%

Sample

1st row경기도 고양시 일산동구 무궁화로 18 (장항동_남정씨티프라자 3층)
2nd row경기도 고양시 덕양구 신원로 40_ 302호 (신원동)
3rd row경기도 고양시 일산동구 고봉로702번길 21-35 (설문동)
4th row경기도 고양시 일산동구 장항로 203-68_ 가_ 나동 2층 (장항동)
5th row
ValueCountFrequency (%)
고양시 8074
 
14.5%
경기도 8072
 
14.5%
일산동구 3022
 
5.4%
덕양구 2973
 
5.3%
일산서구 2077
 
3.7%
중앙로 1106
 
2.0%
장항동 769
 
1.4%
대화동 443
 
0.8%
3층 431
 
0.8%
화정동 400
 
0.7%
Other values (3023) 28399
50.9%
2024-03-15T08:24:20.482737image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
52399
 
19.0%
11965
 
4.3%
11681
 
4.2%
8790
 
3.2%
8372
 
3.0%
8366
 
3.0%
8258
 
3.0%
8140
 
3.0%
( 8119
 
2.9%
) 8119
 
2.9%
Other values (419) 141438
51.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 156560
56.8%
Space Separator 52399
 
19.0%
Decimal Number 41615
 
15.1%
Open Punctuation 8119
 
2.9%
Close Punctuation 8119
 
2.9%
Connector Punctuation 6165
 
2.2%
Dash Punctuation 1760
 
0.6%
Uppercase Letter 560
 
0.2%
Math Symbol 306
 
0.1%
Lowercase Letter 25
 
< 0.1%
Other values (2) 19
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
11965
 
7.6%
11681
 
7.5%
8790
 
5.6%
8372
 
5.3%
8366
 
5.3%
8258
 
5.3%
8140
 
5.2%
8113
 
5.2%
7696
 
4.9%
7674
 
4.9%
Other values (372) 67505
43.1%
Uppercase Letter
ValueCountFrequency (%)
A 99
17.7%
B 87
15.5%
I 74
13.2%
K 35
 
6.2%
M 33
 
5.9%
C 29
 
5.2%
L 28
 
5.0%
Z 27
 
4.8%
P 27
 
4.8%
E 20
 
3.6%
Other values (12) 101
18.0%
Decimal Number
ValueCountFrequency (%)
1 7826
18.8%
2 6387
15.3%
0 5182
12.5%
3 5058
12.2%
4 4001
9.6%
5 3634
8.7%
6 3095
 
7.4%
7 2600
 
6.2%
8 2184
 
5.2%
9 1648
 
4.0%
Lowercase Letter
ValueCountFrequency (%)
e 15
60.0%
a 4
 
16.0%
p 2
 
8.0%
l 2
 
8.0%
z 2
 
8.0%
Other Punctuation
ValueCountFrequency (%)
. 9
56.2%
& 4
25.0%
/ 3
 
18.8%
Space Separator
ValueCountFrequency (%)
52399
100.0%
Open Punctuation
ValueCountFrequency (%)
( 8119
100.0%
Close Punctuation
ValueCountFrequency (%)
) 8119
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 6165
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1760
100.0%
Math Symbol
ValueCountFrequency (%)
~ 306
100.0%
Letter Number
ValueCountFrequency (%)
3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 156560
56.8%
Common 118499
43.0%
Latin 588
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
11965
 
7.6%
11681
 
7.5%
8790
 
5.6%
8372
 
5.3%
8366
 
5.3%
8258
 
5.3%
8140
 
5.2%
8113
 
5.2%
7696
 
4.9%
7674
 
4.9%
Other values (372) 67505
43.1%
Latin
ValueCountFrequency (%)
A 99
16.8%
B 87
14.8%
I 74
12.6%
K 35
 
6.0%
M 33
 
5.6%
C 29
 
4.9%
L 28
 
4.8%
Z 27
 
4.6%
P 27
 
4.6%
E 20
 
3.4%
Other values (18) 129
21.9%
Common
ValueCountFrequency (%)
52399
44.2%
( 8119
 
6.9%
) 8119
 
6.9%
1 7826
 
6.6%
2 6387
 
5.4%
_ 6165
 
5.2%
0 5182
 
4.4%
3 5058
 
4.3%
4 4001
 
3.4%
5 3634
 
3.1%
Other values (9) 11609
 
9.8%

Most occurring blocks

ValueCountFrequency (%)
Hangul 156560
56.8%
ASCII 119084
43.2%
Number Forms 3
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
52399
44.0%
( 8119
 
6.8%
) 8119
 
6.8%
1 7826
 
6.6%
2 6387
 
5.4%
_ 6165
 
5.2%
0 5182
 
4.4%
3 5058
 
4.2%
4 4001
 
3.4%
5 3634
 
3.1%
Other values (36) 12194
 
10.2%
Hangul
ValueCountFrequency (%)
11965
 
7.6%
11681
 
7.5%
8790
 
5.6%
8372
 
5.3%
8366
 
5.3%
8258
 
5.3%
8140
 
5.2%
8113
 
5.2%
7696
 
4.9%
7674
 
4.9%
Other values (372) 67505
43.1%
Number Forms
ValueCountFrequency (%)
3
100.0%
Distinct352
Distinct (%)8.8%
Missing5987
Missing (%)59.9%
Memory size156.2 KiB
2024-03-15T08:24:21.799422image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length7
Median length6
Mean length6.1682033
Min length1

Characters and Unicode

Total characters24753
Distinct characters11
Distinct categories2 ?
Distinct scripts1 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique43 ?
Unique (%)1.1%

Sample

1st row'412070
2nd row'10432
3rd row'10228
4th row'411838
5th row'10403
ValueCountFrequency (%)
10500 101
 
2.5%
10402 100
 
2.5%
10585 98
 
2.4%
10414 93
 
2.3%
10551 71
 
1.8%
410837 71
 
1.8%
10386 71
 
1.8%
10381 56
 
1.4%
10326 56
 
1.4%
10518 55
 
1.4%
Other values (342) 3241
80.8%
2024-03-15T08:24:23.489357image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1 5153
20.8%
0 4844
19.6%
' 4013
16.2%
4 2653
10.7%
3 1761
 
7.1%
5 1673
 
6.8%
2 1619
 
6.5%
8 1195
 
4.8%
6 747
 
3.0%
7 650
 
2.6%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 20740
83.8%
Other Punctuation 4013
 
16.2%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
1 5153
24.8%
0 4844
23.4%
4 2653
12.8%
3 1761
 
8.5%
5 1673
 
8.1%
2 1619
 
7.8%
8 1195
 
5.8%
6 747
 
3.6%
7 650
 
3.1%
9 445
 
2.1%
Other Punctuation
ValueCountFrequency (%)
' 4013
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 24753
100.0%

Most frequent character per script

Common
ValueCountFrequency (%)
1 5153
20.8%
0 4844
19.6%
' 4013
16.2%
4 2653
10.7%
3 1761
 
7.1%
5 1673
 
6.8%
2 1619
 
6.5%
8 1195
 
4.8%
6 747
 
3.0%
7 650
 
2.6%

Most occurring blocks

ValueCountFrequency (%)
ASCII 24753
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1 5153
20.8%
0 4844
19.6%
' 4013
16.2%
4 2653
10.7%
3 1761
 
7.1%
5 1673
 
6.8%
2 1619
 
6.5%
8 1195
 
4.8%
6 747
 
3.0%
7 650
 
2.6%
Distinct3279
Distinct (%)32.8%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-03-15T08:24:25.016304image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length61
Median length45
Mean length24.445
Min length1

Characters and Unicode

Total characters244450
Distinct characters422
Distinct categories11 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique935 ?
Unique (%)9.3%

Sample

1st row경기도 고양시 일산동구 장항동 760 남정씨티프라자 3층
2nd row
3rd row경기도 고양시 일산동구 설문동 756-21
4th row경기도 고양시 일산동구 장항동 601-27
5th row경기도 고양시 덕양구 주교동 772-1
ValueCountFrequency (%)
경기도 9149
17.4%
고양시 9148
17.4%
덕양구 3498
 
6.6%
일산동구 3282
 
6.2%
일산서구 2299
 
4.4%
장항동 967
 
1.8%
행신동 569
 
1.1%
대화동 562
 
1.1%
일산동 558
 
1.1%
화정동 550
 
1.0%
Other values (3549) 22020
41.9%
2024-03-15T08:24:27.001878image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
55135
22.6%
13004
 
5.3%
12931
 
5.3%
9381
 
3.8%
9328
 
3.8%
9323
 
3.8%
9257
 
3.8%
9185
 
3.8%
9174
 
3.8%
1 8239
 
3.4%
Other values (412) 99493
40.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 139046
56.9%
Space Separator 55135
 
22.6%
Decimal Number 43232
 
17.7%
Dash Punctuation 5986
 
2.4%
Uppercase Letter 549
 
0.2%
Connector Punctuation 325
 
0.1%
Math Symbol 68
 
< 0.1%
Open Punctuation 29
 
< 0.1%
Close Punctuation 29
 
< 0.1%
Lowercase Letter 28
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
13004
 
9.4%
12931
 
9.3%
9381
 
6.7%
9328
 
6.7%
9323
 
6.7%
9257
 
6.7%
9185
 
6.6%
9174
 
6.6%
7320
 
5.3%
6590
 
4.7%
Other values (364) 43553
31.3%
Uppercase Letter
ValueCountFrequency (%)
B 104
18.9%
A 88
16.0%
I 68
12.4%
K 40
 
7.3%
L 35
 
6.4%
M 34
 
6.2%
C 31
 
5.6%
Z 25
 
4.6%
P 24
 
4.4%
E 20
 
3.6%
Other values (11) 80
14.6%
Decimal Number
ValueCountFrequency (%)
1 8239
19.1%
2 6051
14.0%
0 4419
10.2%
3 4401
10.2%
5 3644
8.4%
4 3497
8.1%
6 3462
8.0%
7 3290
 
7.6%
8 3244
 
7.5%
9 2985
 
6.9%
Lowercase Letter
ValueCountFrequency (%)
e 15
53.6%
c 4
 
14.3%
b 3
 
10.7%
m 3
 
10.7%
i 1
 
3.6%
t 1
 
3.6%
y 1
 
3.6%
Other Punctuation
ValueCountFrequency (%)
/ 9
39.1%
. 9
39.1%
& 4
17.4%
# 1
 
4.3%
Space Separator
ValueCountFrequency (%)
55135
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 5986
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 325
100.0%
Math Symbol
ValueCountFrequency (%)
~ 68
100.0%
Open Punctuation
ValueCountFrequency (%)
( 29
100.0%
Close Punctuation
ValueCountFrequency (%)
) 29
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 139046
56.9%
Common 104827
42.9%
Latin 577
 
0.2%

Most frequent character per script

Hangul
ValueCountFrequency (%)
13004
 
9.4%
12931
 
9.3%
9381
 
6.7%
9328
 
6.7%
9323
 
6.7%
9257
 
6.7%
9185
 
6.6%
9174
 
6.6%
7320
 
5.3%
6590
 
4.7%
Other values (364) 43553
31.3%
Latin
ValueCountFrequency (%)
B 104
18.0%
A 88
15.3%
I 68
11.8%
K 40
 
6.9%
L 35
 
6.1%
M 34
 
5.9%
C 31
 
5.4%
Z 25
 
4.3%
P 24
 
4.2%
E 20
 
3.5%
Other values (18) 108
18.7%
Common
ValueCountFrequency (%)
55135
52.6%
1 8239
 
7.9%
2 6051
 
5.8%
- 5986
 
5.7%
0 4419
 
4.2%
3 4401
 
4.2%
5 3644
 
3.5%
4 3497
 
3.3%
6 3462
 
3.3%
7 3290
 
3.1%
Other values (10) 6703
 
6.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 139046
56.9%
ASCII 105404
43.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
55135
52.3%
1 8239
 
7.8%
2 6051
 
5.7%
- 5986
 
5.7%
0 4419
 
4.2%
3 4401
 
4.2%
5 3644
 
3.5%
4 3497
 
3.3%
6 3462
 
3.3%
7 3290
 
3.1%
Other values (38) 7280
 
6.9%
Hangul
ValueCountFrequency (%)
13004
 
9.4%
12931
 
9.3%
9381
 
6.7%
9328
 
6.7%
9323
 
6.7%
9257
 
6.7%
9185
 
6.6%
9174
 
6.6%
7320
 
5.3%
6590
 
4.7%
Other values (364) 43553
31.3%

업무구분
Categorical

CONSTANT 

Distinct1
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
지정폐기물배출자관리
10000 

Length

Max length10
Median length10
Mean length10
Min length10

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row지정폐기물배출자관리
2nd row지정폐기물배출자관리
3rd row지정폐기물배출자관리
4th row지정폐기물배출자관리
5th row지정폐기물배출자관리

Common Values

ValueCountFrequency (%)
지정폐기물배출자관리 10000
100.0%

Length

2024-03-15T08:24:27.235596image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T08:24:27.395777image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
지정폐기물배출자관리 10000
100.0%

Missing values

2024-03-15T08:24:11.981448image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-15T08:24:12.352254image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

상호폐기물 종류사업장도로명주소사업장도로명우편번호사업장지번주소업무구분
8699일산라쥬네스내과손상성폐기물경기도 고양시 일산동구 무궁화로 18 (장항동_남정씨티프라자 3층)<NA>경기도 고양시 일산동구 장항동 760 남정씨티프라자 3층지정폐기물배출자관리
3838나무치과조직물류폐기물(태반을 재활용하는 경우는 제외한다)경기도 고양시 덕양구 신원로 40_ 302호 (신원동)'412070지정폐기물배출자관리
4082백세케어요양원일반의료폐기물경기도 고양시 일산동구 고봉로702번길 21-35 (설문동)<NA>경기도 고양시 일산동구 설문동 756-21지정폐기물배출자관리
5755(주)창조인쇄그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]경기도 고양시 일산동구 장항로 203-68_ 가_ 나동 2층 (장항동)'10432경기도 고양시 일산동구 장항동 601-27지정폐기물배출자관리
1366두승전력(주)그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]<NA>경기도 고양시 덕양구 주교동 772-1지정폐기물배출자관리
2053무지개요양병원격리의료폐기물경기도 고양시 일산서구 덕이로 212_ 백송프라자 (덕이동)'10228경기도 고양시 일산서구 덕이동 1047-1 백송프라자지정폐기물배출자관리
5468고양시건설관리본부석면의 제거작업에 사용된 바닥비닐시트ㆍ방진마스크ㆍ작업복 등<NA>경기도 고양시 덕양구 행신동 산106-3번지지정폐기물배출자관리
10083파이안의원일반의료폐기물경기도 고양시 일산동구 정발산로 43-7_ 401호 (장항동_메리트원)<NA>경기도 고양시 일산동구 장항동 856 메리트원 401호지정폐기물배출자관리
7204리더스치과일반의료폐기물<NA>경기도 고양시 덕양구 고양동 218-2 2층지정폐기물배출자관리
3439위즈펫동물병원킨텍스점일반의료폐기물경기도 고양시 일산서구 주엽로 79_ 1층 (주엽동_ 롯데마트빅마켓킨텍스지하)'411838지정폐기물배출자관리
상호폐기물 종류사업장도로명주소사업장도로명우편번호사업장지번주소업무구분
1657류라인의원생물ㆍ화학폐기물경기도 고양시 일산동구 중앙로1275번길 38-10_ 우림로데오스위트 2층 222호 (장항동)'10401경기도 고양시 일산동구 장항동 771-1 우림로데오스위트지정폐기물배출자관리
2275메이드유의원손상성폐기물경기도 고양시 일산동구 정발산로 43-20_ 센트럴프라자 (장항동)'10402경기도 고양시 일산동구 장항동 846 센트럴프라자지정폐기물배출자관리
5350삼송초등학교폐석면<NA>경기도 고양시 덕양구 삼송동 산 12-7지정폐기물배출자관리
8914윤제우한의원손상성폐기물경기도 고양시 덕양구 화중로 100 (화정동_968번지 비젼타워 207호)<NA>경기도 고양시 덕양구 화정동 968 968번지 비젼타워 207호지정폐기물배출자관리
12668신진카센타그 밖의 폐산경기도 고양시 일산서구 성저로 106 (대화동)<NA>경기도 고양시 일산서구 대화동 2005-2지정폐기물배출자관리
3979프라임모터스그 밖의 폐유기용제경기도 고양시 덕양구 행주산성로120번길 107-4 (행주외동_ (행주외동))'412240지정폐기물배출자관리
4474연세영림의원손상성폐기물경기도 고양시 덕양구 서정마을로 5 (행신동_행신프라자 2층 201_202호)<NA>경기도 고양시 덕양구 행신동 1078 행신프라자 2층 201_202호지정폐기물배출자관리
1029호수마을요양원일반의료폐기물경기도 고양시 일산동구 중앙로1275번길 60-30_ 라페스타B 3층 301호 (장항동)'10401경기도 고양시 일산동구 장항동 768 라페스타B지정폐기물배출자관리
7274문혜경산부인과손상성폐기물경기도 고양시 일산동구 숲속마을1로 73_ 402호 (풍동_ 신성메디컬타운)'410330경기도 고양시 일산동구 풍동 1274-1 3층지정폐기물배출자관리
7959현대카센타그 밖의 광물류<NA>경기도 고양시 덕양구 내유동 444-14지정폐기물배출자관리

Duplicate rows

Most frequently occurring

상호폐기물 종류사업장도로명주소사업장도로명우편번호사업장지번주소업무구분# duplicates
978현대자동차정비가맹점 원효로협의회그 밖의 광물류경기도 고양시 일산서구 송산로 414 (가좌동)'10215지정폐기물배출자관리6
37(주)색을꾸미는사람들그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]경기도 고양시 일산동구 장대길 127-9 (장항동)'10428경기도 고양시 일산동구 장항동 558-8지정폐기물배출자관리5
134고양시 덕양구지회그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]경기도 고양시 덕양구 지도로 60-1 (토당동)<NA>경기도 고양시 덕양구 토당동 373-60지정폐기물배출자관리5
414부광프린팅(주)그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]경기도 고양시 일산동구 고봉로 735 (설문동)<NA>경기도 고양시 일산동구 설문동 722-7지정폐기물배출자관리5
840천지환경연합회그 밖의 폐유기용제경기도 고양시 일산서구 대산로212번길 24-27 (대화동)'10370경기도 고양시 일산서구 대화동 2117-5지정폐기물배출자관리5
4(사)경기도북부자동차정비사업조합폐유성페인트경기도 고양시 일산동구 장진천길 66-4 (설문동)'10253경기도 고양시 일산동구 설문동 190-2 동영빌딩2층지정폐기물배출자관리4
32(주)보광피앤피일산지점그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]경기도 고양시 일산동구 장대길 42-95_ 가동 (장항동)'10431지정폐기물배출자관리4
52(주)중앙이앤피그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]경기도 고양시 일산동구 장항로 203-150 (장항동)'10432경기도 고양시 일산동구 장항동 602-67지정폐기물배출자관리4
57(주)청프린트그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]경기도 고양시 일산동구 장대길 64-47_ 다동 (장항동)'10431경기도 고양시 일산동구 장항동 584-5 다동지정폐기물배출자관리4
112경기북부자동차부분정비사업조합고양시지회그 밖의 폐광물유[아스팔트유ㆍ그리스(grease)ㆍ방청유 및 수용성절삭유_ 20퍼센트 이상의 이물질이 함유된 폐유_ 고체상태의 폐유 등을 말한다]경기도 고양시 일산동구 은행마을로 7 (풍동)'10304경기도 고양시 일산동구 풍동 184-10지정폐기물배출자관리4