Overview

Dataset statistics

Number of variables7
Number of observations200
Missing cells0
Missing cells (%)0.0%
Duplicate rows5
Duplicate rows (%)2.5%
Total size in memory11.1 KiB
Average record size in memory56.7 B

Variable types

Text6
Categorical1

Dataset

Description사업장폐기물 배출자 현황
Author서울특별시 서대문구
URLhttps://www.data.go.kr/data/15062045/fileData.do

Alerts

Dataset has 5 (2.5%) duplicate rowsDuplicates

Reproduction

Analysis started2023-12-12 01:07:39.621755
Analysis finished2023-12-12 01:07:40.791744
Duration1.17 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

상호
Text

Distinct135
Distinct (%)67.5%
Missing0
Missing (%)0.0%
Memory size1.7 KiB
2023-12-12T10:07:41.058944image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length22
Median length19
Mean length8.395
Min length4

Characters and Unicode

Total characters1679
Distinct characters200
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique103 ?
Unique (%)51.5%

Sample

1st row청무이앤씨
2nd row(주)두림개발
3rd row서대문구청 푸른도시과
4th row에스더블유엠(주)
5th row(주)성산정보시스템
ValueCountFrequency (%)
서대문구청(푸른도시과 14
 
6.2%
주식회사 14
 
6.2%
서대문구청 11
 
4.9%
이화여자대학교 8
 
3.5%
롯데건설(주 7
 
3.1%
연세대학교 5
 
2.2%
서울시산림조합 3
 
1.3%
푸른도시과 3
 
1.3%
주)진영종합건설 3
 
1.3%
서대문구청(안전치수과 3
 
1.3%
Other values (128) 155
68.6%
2023-12-12T10:07:41.670289image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
133
 
7.9%
) 131
 
7.8%
( 131
 
7.8%
53
 
3.2%
48
 
2.9%
46
 
2.7%
40
 
2.4%
33
 
2.0%
33
 
2.0%
32
 
1.9%
Other values (190) 999
59.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1388
82.7%
Close Punctuation 131
 
7.8%
Open Punctuation 131
 
7.8%
Space Separator 26
 
1.5%
Uppercase Letter 2
 
0.1%
Other Punctuation 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
133
 
9.6%
53
 
3.8%
48
 
3.5%
46
 
3.3%
40
 
2.9%
33
 
2.4%
33
 
2.4%
32
 
2.3%
32
 
2.3%
29
 
2.1%
Other values (184) 909
65.5%
Uppercase Letter
ValueCountFrequency (%)
K 1
50.0%
S 1
50.0%
Close Punctuation
ValueCountFrequency (%)
) 131
100.0%
Open Punctuation
ValueCountFrequency (%)
( 131
100.0%
Space Separator
ValueCountFrequency (%)
26
100.0%
Other Punctuation
ValueCountFrequency (%)
. 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1388
82.7%
Common 289
 
17.2%
Latin 2
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
133
 
9.6%
53
 
3.8%
48
 
3.5%
46
 
3.3%
40
 
2.9%
33
 
2.4%
33
 
2.4%
32
 
2.3%
32
 
2.3%
29
 
2.1%
Other values (184) 909
65.5%
Common
ValueCountFrequency (%)
) 131
45.3%
( 131
45.3%
26
 
9.0%
. 1
 
0.3%
Latin
ValueCountFrequency (%)
K 1
50.0%
S 1
50.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1388
82.7%
ASCII 291
 
17.3%

Most frequent character per block

Hangul
ValueCountFrequency (%)
133
 
9.6%
53
 
3.8%
48
 
3.5%
46
 
3.3%
40
 
2.9%
33
 
2.4%
33
 
2.4%
32
 
2.3%
32
 
2.3%
29
 
2.1%
Other values (184) 909
65.5%
ASCII
ValueCountFrequency (%)
) 131
45.0%
( 131
45.0%
26
 
8.9%
. 1
 
0.3%
K 1
 
0.3%
S 1
 
0.3%
Distinct133
Distinct (%)66.5%
Missing0
Missing (%)0.0%
Memory size1.7 KiB
2023-12-12T10:07:42.000908image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length15
Median length3
Mean length3.555
Min length2

Characters and Unicode

Total characters711
Distinct characters141
Distinct categories5 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique102 ?
Unique (%)51.0%

Sample

1st row이현희
2nd row김순애
3rd row서대문구청장
4th row박서연
5th row김기주
ValueCountFrequency (%)
서대문구청장 18
 
9.0%
최경희 8
 
4.0%
구청장 8
 
4.0%
박창규 7
 
3.5%
강명자 3
 
1.5%
김재동 3
 
1.5%
최숙자 3
 
1.5%
문석진 2
 
1.0%
정남식 2
 
1.0%
김성례 2
 
1.0%
Other values (124) 145
72.1%
2023-12-12T10:07:42.505426image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
35
 
4.9%
34
 
4.8%
29
 
4.1%
28
 
3.9%
24
 
3.4%
23
 
3.2%
22
 
3.1%
21
 
3.0%
21
 
3.0%
21
 
3.0%
Other values (131) 453
63.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 698
98.2%
Connector Punctuation 6
 
0.8%
Open Punctuation 3
 
0.4%
Close Punctuation 3
 
0.4%
Space Separator 1
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
35
 
5.0%
34
 
4.9%
29
 
4.2%
28
 
4.0%
24
 
3.4%
23
 
3.3%
22
 
3.2%
21
 
3.0%
21
 
3.0%
21
 
3.0%
Other values (127) 440
63.0%
Connector Punctuation
ValueCountFrequency (%)
_ 6
100.0%
Open Punctuation
ValueCountFrequency (%)
( 3
100.0%
Close Punctuation
ValueCountFrequency (%)
) 3
100.0%
Space Separator
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 698
98.2%
Common 13
 
1.8%

Most frequent character per script

Hangul
ValueCountFrequency (%)
35
 
5.0%
34
 
4.9%
29
 
4.2%
28
 
4.0%
24
 
3.4%
23
 
3.3%
22
 
3.2%
21
 
3.0%
21
 
3.0%
21
 
3.0%
Other values (127) 440
63.0%
Common
ValueCountFrequency (%)
_ 6
46.2%
( 3
23.1%
) 3
23.1%
1
 
7.7%

Most occurring blocks

ValueCountFrequency (%)
Hangul 698
98.2%
ASCII 13
 
1.8%

Most frequent character per block

Hangul
ValueCountFrequency (%)
35
 
5.0%
34
 
4.9%
29
 
4.2%
28
 
4.0%
24
 
3.4%
23
 
3.3%
22
 
3.2%
21
 
3.0%
21
 
3.0%
21
 
3.0%
Other values (127) 440
63.0%
ASCII
ValueCountFrequency (%)
_ 6
46.2%
( 3
23.1%
) 3
23.1%
1
 
7.7%
Distinct168
Distinct (%)84.0%
Missing0
Missing (%)0.0%
Memory size1.7 KiB
2023-12-12T10:07:42.877685image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length42
Median length30
Mean length18.68
Min length1

Characters and Unicode

Total characters3736
Distinct characters277
Distinct categories9 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique148 ?
Unique (%)74.0%

Sample

1st row2020년 산사태예방사업(연희동 413-172등 3개소)
2nd row2020년 산사태예방사업
3rd row안산도시자연공원 처리용역
4th row2020년 학교내 수목가지치기 공사(제1권역)
5th row2019년 아연화재 광케이블 본복구공사
ValueCountFrequency (%)
24
 
3.4%
2019년 18
 
2.5%
공사 15
 
2.1%
정비공사 14
 
2.0%
가로수 12
 
1.7%
처리 11
 
1.5%
처리용역 10
 
1.4%
예방 9
 
1.3%
2개소 7
 
1.0%
2016년 7
 
1.0%
Other values (358) 584
82.1%
2023-12-12T10:07:43.401225image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
531
 
14.2%
194
 
5.2%
136
 
3.6%
2 86
 
2.3%
1 78
 
2.1%
67
 
1.8%
0 65
 
1.7%
57
 
1.5%
56
 
1.5%
54
 
1.4%
Other values (267) 2412
64.6%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2763
74.0%
Space Separator 531
 
14.2%
Decimal Number 322
 
8.6%
Open Punctuation 46
 
1.2%
Close Punctuation 46
 
1.2%
Dash Punctuation 14
 
0.4%
Connector Punctuation 6
 
0.2%
Uppercase Letter 5
 
0.1%
Math Symbol 3
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
194
 
7.0%
136
 
4.9%
67
 
2.4%
57
 
2.1%
56
 
2.0%
54
 
2.0%
54
 
2.0%
50
 
1.8%
47
 
1.7%
47
 
1.7%
Other values (247) 2001
72.4%
Decimal Number
ValueCountFrequency (%)
2 86
26.7%
1 78
24.2%
0 65
20.2%
9 21
 
6.5%
3 17
 
5.3%
8 15
 
4.7%
7 12
 
3.7%
6 11
 
3.4%
5 9
 
2.8%
4 8
 
2.5%
Uppercase Letter
ValueCountFrequency (%)
T 2
40.0%
K 1
20.0%
B 1
20.0%
L 1
20.0%
Space Separator
ValueCountFrequency (%)
531
100.0%
Open Punctuation
ValueCountFrequency (%)
( 46
100.0%
Close Punctuation
ValueCountFrequency (%)
) 46
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 14
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 6
100.0%
Math Symbol
ValueCountFrequency (%)
~ 3
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2763
74.0%
Common 968
 
25.9%
Latin 5
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
194
 
7.0%
136
 
4.9%
67
 
2.4%
57
 
2.1%
56
 
2.0%
54
 
2.0%
54
 
2.0%
50
 
1.8%
47
 
1.7%
47
 
1.7%
Other values (247) 2001
72.4%
Common
ValueCountFrequency (%)
531
54.9%
2 86
 
8.9%
1 78
 
8.1%
0 65
 
6.7%
( 46
 
4.8%
) 46
 
4.8%
9 21
 
2.2%
3 17
 
1.8%
8 15
 
1.5%
- 14
 
1.4%
Other values (6) 49
 
5.1%
Latin
ValueCountFrequency (%)
T 2
40.0%
K 1
20.0%
B 1
20.0%
L 1
20.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2763
74.0%
ASCII 973
 
26.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
531
54.6%
2 86
 
8.8%
1 78
 
8.0%
0 65
 
6.7%
( 46
 
4.7%
) 46
 
4.7%
9 21
 
2.2%
3 17
 
1.7%
8 15
 
1.5%
- 14
 
1.4%
Other values (10) 54
 
5.5%
Hangul
ValueCountFrequency (%)
194
 
7.0%
136
 
4.9%
67
 
2.4%
57
 
2.1%
56
 
2.0%
54
 
2.0%
54
 
2.0%
50
 
1.8%
47
 
1.7%
47
 
1.7%
Other values (247) 2001
72.4%

폐기물 종류
Categorical

Distinct30
Distinct (%)15.0%
Missing0
Missing (%)0.0%
Memory size1.7 KiB
임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)
69 
하수준설토
30 
폐목재류 1등급
19 
폐합성고무류
16 
폐합성수지류(폐염화비닐수지류는 제외한다)
16 
Other values (25)
50 

Length

Max length64
Median length57
Mean length25.235
Min length1

Unique

Unique15 ?
Unique (%)7.5%

Sample

1st row임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)
2nd row임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)
3rd row폐합성수지류(폐염화비닐수지류는 제외한다)
4th row임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)
5th row그 밖의 폐합성고분자화합물(합성수지류로 피복된 폐전선을 포함한다)

Common Values

ValueCountFrequency (%)
임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다) 69
34.5%
하수준설토 30
15.0%
폐목재류 1등급 19
 
9.5%
폐합성고무류 16
 
8.0%
폐합성수지류(폐염화비닐수지류는 제외한다) 16
 
8.0%
폐합성수지류 11
 
5.5%
폐목재류(원목의 용도 그대로 사용하는 나무뿌리ㆍ가지 등을 제거한 원줄기는 제외한다.) 7
 
3.5%
그 밖의 폐목재류 3
 
1.5%
음식물류폐기물 2
 
1.0%
2
 
1.0%
Other values (20) 25
 
12.5%

Length

2023-12-12T10:07:43.562711image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
등을 78
 
7.9%
말한다 73
 
7.4%
등의 71
 
7.2%
임목폐목재(건설공사 69
 
7.0%
산지개간 69
 
7.0%
과정에서 69
 
7.0%
발생된 69
 
7.0%
나무뿌리 69
 
7.0%
가지 69
 
7.0%
줄기 69
 
7.0%
Other values (68) 282
28.6%
Distinct134
Distinct (%)67.0%
Missing0
Missing (%)0.0%
Memory size1.7 KiB
2023-12-12T10:07:43.900957image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length46
Median length38
Mean length28.01
Min length1

Characters and Unicode

Total characters5602
Distinct characters234
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique106 ?
Unique (%)53.0%

Sample

1st row서울특별시 송파구 충민로 66_ 가든파이브라이프 (문정동)
2nd row서울특별시 금천구 벚꽃로 244_ 벽산디지털밸리5차 (가산동)
3rd row서울특별시 서대문구 연희로 248 (연희동_서대문구청)
4th row서울특별시 강남구 테헤란로 512_ 신안빌딩 8층 (대치동)
5th row서울특별시 마포구 만리재로 15_ 제일빌딩 1404호 (공덕동)
ValueCountFrequency (%)
서울특별시 169
 
15.8%
서대문구 70
 
6.5%
연희로 28
 
2.6%
248 26
 
2.4%
연희동 21
 
2.0%
서초구 17
 
1.6%
연세로 14
 
1.3%
강남구 12
 
1.1%
신촌동 10
 
0.9%
대현동 9
 
0.8%
Other values (419) 694
64.9%
2023-12-12T10:07:44.519751image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
914
 
16.3%
303
 
5.4%
215
 
3.8%
205
 
3.7%
196
 
3.5%
192
 
3.4%
) 183
 
3.3%
( 183
 
3.3%
174
 
3.1%
169
 
3.0%
Other values (224) 2868
51.2%

Most occurring categories

ValueCountFrequency (%)
Other Letter 3443
61.5%
Space Separator 914
 
16.3%
Decimal Number 724
 
12.9%
Close Punctuation 183
 
3.3%
Open Punctuation 183
 
3.3%
Connector Punctuation 126
 
2.2%
Dash Punctuation 26
 
0.5%
Uppercase Letter 3
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
303
 
8.8%
215
 
6.2%
205
 
6.0%
196
 
5.7%
192
 
5.6%
174
 
5.1%
169
 
4.9%
169
 
4.9%
163
 
4.7%
96
 
2.8%
Other values (206) 1561
45.3%
Decimal Number
ValueCountFrequency (%)
1 120
16.6%
2 119
16.4%
3 86
11.9%
5 85
11.7%
4 76
10.5%
0 74
10.2%
8 56
7.7%
6 50
6.9%
9 30
 
4.1%
7 28
 
3.9%
Uppercase Letter
ValueCountFrequency (%)
K 1
33.3%
S 1
33.3%
A 1
33.3%
Space Separator
ValueCountFrequency (%)
914
100.0%
Close Punctuation
ValueCountFrequency (%)
) 183
100.0%
Open Punctuation
ValueCountFrequency (%)
( 183
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 126
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 26
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 3443
61.5%
Common 2156
38.5%
Latin 3
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
303
 
8.8%
215
 
6.2%
205
 
6.0%
196
 
5.7%
192
 
5.6%
174
 
5.1%
169
 
4.9%
169
 
4.9%
163
 
4.7%
96
 
2.8%
Other values (206) 1561
45.3%
Common
ValueCountFrequency (%)
914
42.4%
) 183
 
8.5%
( 183
 
8.5%
_ 126
 
5.8%
1 120
 
5.6%
2 119
 
5.5%
3 86
 
4.0%
5 85
 
3.9%
4 76
 
3.5%
0 74
 
3.4%
Other values (5) 190
 
8.8%
Latin
ValueCountFrequency (%)
K 1
33.3%
S 1
33.3%
A 1
33.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 3443
61.5%
ASCII 2159
38.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
914
42.3%
) 183
 
8.5%
( 183
 
8.5%
_ 126
 
5.8%
1 120
 
5.6%
2 119
 
5.5%
3 86
 
4.0%
5 85
 
3.9%
4 76
 
3.5%
0 74
 
3.4%
Other values (8) 193
 
8.9%
Hangul
ValueCountFrequency (%)
303
 
8.8%
215
 
6.2%
205
 
6.0%
196
 
5.7%
192
 
5.6%
174
 
5.1%
169
 
4.9%
169
 
4.9%
163
 
4.7%
96
 
2.8%
Other values (206) 1561
45.3%
Distinct94
Distinct (%)47.0%
Missing0
Missing (%)0.0%
Memory size1.7 KiB
2023-12-12T10:07:45.050606image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length36
Median length32
Mean length16.275
Min length1

Characters and Unicode

Total characters3255
Distinct characters179
Distinct categories7 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique72 ?
Unique (%)36.0%

Sample

1st row서울특별시 송파구 문정동 634 가든파이브라이프
2nd row서울특별시 금천구 가산동 60-73 벽산디지털밸리5차
3rd row서울특별시 서대문구 연희동 168-6 서대문구청
4th row서울특별시 강남구 대치동 943-19 신안빌딩
5th row서울특별시 마포구 공덕동 256-13 제일빌딩
ValueCountFrequency (%)
서울특별시 130
 
20.7%
서대문구 57
 
9.1%
연희동 26
 
4.1%
168-6 21
 
3.3%
서대문구청 14
 
2.2%
강남구 13
 
2.1%
서초구 13
 
2.1%
양재동 9
 
1.4%
신촌동 9
 
1.4%
134 7
 
1.1%
Other values (222) 328
52.3%
2023-12-12T10:07:45.895855image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
685
21.0%
231
 
7.1%
154
 
4.7%
143
 
4.4%
141
 
4.3%
134
 
4.1%
130
 
4.0%
130
 
4.0%
1 106
 
3.3%
- 99
 
3.0%
Other values (169) 1302
40.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1933
59.4%
Space Separator 685
 
21.0%
Decimal Number 534
 
16.4%
Dash Punctuation 99
 
3.0%
Uppercase Letter 2
 
0.1%
Open Punctuation 1
 
< 0.1%
Close Punctuation 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
231
 
12.0%
154
 
8.0%
143
 
7.4%
141
 
7.3%
134
 
6.9%
130
 
6.7%
130
 
6.7%
88
 
4.6%
74
 
3.8%
32
 
1.7%
Other values (153) 676
35.0%
Decimal Number
ValueCountFrequency (%)
1 106
19.9%
6 82
15.4%
2 68
12.7%
3 51
9.6%
4 47
8.8%
8 43
8.1%
5 43
8.1%
0 39
 
7.3%
7 31
 
5.8%
9 24
 
4.5%
Uppercase Letter
ValueCountFrequency (%)
K 1
50.0%
S 1
50.0%
Space Separator
ValueCountFrequency (%)
685
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 99
100.0%
Open Punctuation
ValueCountFrequency (%)
( 1
100.0%
Close Punctuation
ValueCountFrequency (%)
) 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1933
59.4%
Common 1320
40.6%
Latin 2
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
231
 
12.0%
154
 
8.0%
143
 
7.4%
141
 
7.3%
134
 
6.9%
130
 
6.7%
130
 
6.7%
88
 
4.6%
74
 
3.8%
32
 
1.7%
Other values (153) 676
35.0%
Common
ValueCountFrequency (%)
685
51.9%
1 106
 
8.0%
- 99
 
7.5%
6 82
 
6.2%
2 68
 
5.2%
3 51
 
3.9%
4 47
 
3.6%
8 43
 
3.3%
5 43
 
3.3%
0 39
 
3.0%
Other values (4) 57
 
4.3%
Latin
ValueCountFrequency (%)
K 1
50.0%
S 1
50.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1933
59.4%
ASCII 1322
40.6%

Most frequent character per block

ASCII
ValueCountFrequency (%)
685
51.8%
1 106
 
8.0%
- 99
 
7.5%
6 82
 
6.2%
2 68
 
5.1%
3 51
 
3.9%
4 47
 
3.6%
8 43
 
3.3%
5 43
 
3.3%
0 39
 
3.0%
Other values (6) 59
 
4.5%
Hangul
ValueCountFrequency (%)
231
 
12.0%
154
 
8.0%
143
 
7.4%
141
 
7.3%
134
 
6.9%
130
 
6.7%
130
 
6.7%
88
 
4.6%
74
 
3.8%
32
 
1.7%
Other values (153) 676
35.0%
Distinct142
Distinct (%)71.0%
Missing0
Missing (%)0.0%
Memory size1.7 KiB
2023-12-12T10:07:46.249433image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length42
Median length33
Mean length18.05
Min length1

Characters and Unicode

Total characters3610
Distinct characters163
Distinct categories11 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique126 ?
Unique (%)63.0%

Sample

1st row서울특별시 서대문구 연희동 168번지 6호 서대문구청
2nd row홍제동 산 1-167등 6개소
3rd row안산도시자연공원(신기한놀이터옆)폐기물 처리 용역
4th row서울특별시 서대문구 연희동 88번지 1호 서울연희초등학교
5th row서울특별시 서대문구 충정로3가 35번지 1호 KT
ValueCountFrequency (%)
서대문구 151
20.6%
서울특별시 106
 
14.5%
연희동 20
 
2.7%
홍제동 18
 
2.5%
홍은동 17
 
2.3%
일원 15
 
2.0%
신촌동 14
 
1.9%
서울 11
 
1.5%
134번지 11
 
1.5%
10
 
1.4%
Other values (238) 360
49.1%
2023-12-12T10:07:46.834283image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
602
 
16.7%
287
 
8.0%
186
 
5.2%
167
 
4.6%
165
 
4.6%
1 135
 
3.7%
128
 
3.5%
124
 
3.4%
117
 
3.2%
106
 
2.9%
Other values (153) 1593
44.1%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2368
65.6%
Space Separator 602
 
16.7%
Decimal Number 537
 
14.9%
Dash Punctuation 71
 
2.0%
Close Punctuation 11
 
0.3%
Open Punctuation 11
 
0.3%
Connector Punctuation 4
 
0.1%
Math Symbol 2
 
0.1%
Uppercase Letter 2
 
0.1%
Other Symbol 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
287
 
12.1%
186
 
7.9%
167
 
7.1%
165
 
7.0%
128
 
5.4%
124
 
5.2%
117
 
4.9%
106
 
4.5%
106
 
4.5%
67
 
2.8%
Other values (133) 915
38.6%
Decimal Number
ValueCountFrequency (%)
1 135
25.1%
3 79
14.7%
2 60
11.2%
4 52
 
9.7%
6 49
 
9.1%
5 42
 
7.8%
8 40
 
7.4%
7 28
 
5.2%
0 28
 
5.2%
9 24
 
4.5%
Uppercase Letter
ValueCountFrequency (%)
K 1
50.0%
T 1
50.0%
Space Separator
ValueCountFrequency (%)
602
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 71
100.0%
Close Punctuation
ValueCountFrequency (%)
) 11
100.0%
Open Punctuation
ValueCountFrequency (%)
( 11
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 4
100.0%
Math Symbol
ValueCountFrequency (%)
~ 2
100.0%
Other Symbol
ValueCountFrequency (%)
1
100.0%
Other Punctuation
ValueCountFrequency (%)
. 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2369
65.6%
Common 1239
34.3%
Latin 2
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
287
 
12.1%
186
 
7.9%
167
 
7.0%
165
 
7.0%
128
 
5.4%
124
 
5.2%
117
 
4.9%
106
 
4.5%
106
 
4.5%
67
 
2.8%
Other values (134) 916
38.7%
Common
ValueCountFrequency (%)
602
48.6%
1 135
 
10.9%
3 79
 
6.4%
- 71
 
5.7%
2 60
 
4.8%
4 52
 
4.2%
6 49
 
4.0%
5 42
 
3.4%
8 40
 
3.2%
7 28
 
2.3%
Other values (7) 81
 
6.5%
Latin
ValueCountFrequency (%)
K 1
50.0%
T 1
50.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2368
65.6%
ASCII 1241
34.4%
None 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
602
48.5%
1 135
 
10.9%
3 79
 
6.4%
- 71
 
5.7%
2 60
 
4.8%
4 52
 
4.2%
6 49
 
3.9%
5 42
 
3.4%
8 40
 
3.2%
7 28
 
2.3%
Other values (9) 83
 
6.7%
Hangul
ValueCountFrequency (%)
287
 
12.1%
186
 
7.9%
167
 
7.1%
165
 
7.0%
128
 
5.4%
124
 
5.2%
117
 
4.9%
106
 
4.5%
106
 
4.5%
67
 
2.8%
Other values (133) 915
38.6%
None
ValueCountFrequency (%)
1
100.0%

Correlations

2023-12-12T10:07:46.990744image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
폐기물 종류사업장지번주소
폐기물 종류1.0000.851
사업장지번주소0.8511.000

Missing values

2023-12-12T10:07:40.584336image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T10:07:40.728952image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

상호대표자공사명폐기물 종류사업장도로명주소사업장지번주소현장지번주소
0청무이앤씨이현희2020년 산사태예방사업(연희동 413-172등 3개소)임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)서울특별시 송파구 충민로 66_ 가든파이브라이프 (문정동)서울특별시 송파구 문정동 634 가든파이브라이프서울특별시 서대문구 연희동 168번지 6호 서대문구청
1(주)두림개발김순애2020년 산사태예방사업임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)서울특별시 금천구 벚꽃로 244_ 벽산디지털밸리5차 (가산동)서울특별시 금천구 가산동 60-73 벽산디지털밸리5차홍제동 산 1-167등 6개소
2서대문구청 푸른도시과서대문구청장안산도시자연공원 처리용역폐합성수지류(폐염화비닐수지류는 제외한다)서울특별시 서대문구 연희로 248 (연희동_서대문구청)서울특별시 서대문구 연희동 168-6 서대문구청안산도시자연공원(신기한놀이터옆)폐기물 처리 용역
3에스더블유엠(주)박서연2020년 학교내 수목가지치기 공사(제1권역)임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)서울특별시 강남구 테헤란로 512_ 신안빌딩 8층 (대치동)서울특별시 강남구 대치동 943-19 신안빌딩서울특별시 서대문구 연희동 88번지 1호 서울연희초등학교
4(주)성산정보시스템김기주2019년 아연화재 광케이블 본복구공사그 밖의 폐합성고분자화합물(합성수지류로 피복된 폐전선을 포함한다)서울특별시 마포구 만리재로 15_ 제일빌딩 1404호 (공덕동)서울특별시 마포구 공덕동 256-13 제일빌딩서울특별시 서대문구 충정로3가 35번지 1호 KT
5원강정보통신 주식회사우강원2019년 아연국사 통신구 화재사고 본복구 시설공사그 밖의 폐합성고분자화합물(합성수지류로 피복된 폐전선을 포함한다)서울특별시 강동구 아리수로64길 38 (고덕동)서울특별시 강동구 고덕동 637서대문구 충정로 3가 35-1
6주식회사 그린이앤씨박은정공원내 수목 정비 사업임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)서울특별시 강서구 양천로49길 25_ 한영빌딩 (가양동)서울특별시 강서구 가양동 185 한영빌딩서울특별시 서대문구 연희동 168번지 6호 서대문구청
7(주)자연에임병준학교내 수목정비사업(상반기)임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)서울시 서대문구 구청 관내
8서대문구청(안전치수과)서대문구청장준설토 운반 및 처리용역하수준설토서울특별시 서대문구 연희동 168-6서울특별시 서대문구 연희동 168-6번지
9나람조경개발이기자2020년 겨울철 가로수 가지치기 공사임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)서울특별시 관악구 남부순환로 1808_ 관악센츄리타워 (봉천동)서울특별시 관악구 봉천동 869-10 관악센츄리타워서대문구 북가좌동 359-10외
상호대표자공사명폐기물 종류사업장도로명주소사업장지번주소현장지번주소
190(주)진영종합건설김재동홍제배수분구 하수관거 종합정비공사(1구역-제2차)하수준설토서울특별시 서대문구 간호대로 16 (홍제동_일대)서울특별시 서대문구 홍제동 285-23 일대서울특별시 서대문구 홍제1동 285번지 23호 홍제배수분구 일원
191(주)핸디하이진허갑용기타그밖의 폐기물(폐의약품)그 밖의 폐기물서울특별시 서대문구 동교로 296 (연희동_우청빌딩 6층)서울특별시 서대문구 연희동 218-19 우청빌딩 6층서울특별시 서대문구 연희동 218번지 19호 우청빌딩 6층
192연세대학교김한중연세대학교 시설물 폐기물처리폐목재류(원목의 용도 그대로 사용하는 나무뿌리ㆍ가지 등을 제거한 원줄기는 제외한다.)서울특별시 서대문구 연세로 50 (신촌동_연세대학교)서울특별시 서대문구 신촌동 134 연세대학교서울특별시 서대문구 신촌동 134번지 연세대학교
193연세대학교김한중연세대학교시설폐기물처리폐합성수지류서울특별시 서대문구 연세로 50 (신촌동_연세대학교)서울특별시 서대문구 신촌동 134 연세대학교서울특별시 서대문구 신촌동 134번지 연세대학교
194롯데건설(주)박창규연세대 암 전문병원수리폐목재류 1등급서울특별시 서대문구 신촌동 134-4 연세의료원건물서울특별시 서대문구 신촌동 134번지 4호 연세의료원건물
195한빛종합건설(주)김기수서대문우체국 신축공사폐섬유서울특별시 서대문구 성산로20길 9 (창천동)서울특별시 서대문구 창천동 98-3서울특별시 서대문구 창천동 98번지 3호 서대문우체국
196한빛종합건설(주)김기수서대문우체국 신축공사폐목재류(원목의 용도 그대로 사용하는 나무뿌리ㆍ가지 등을 제거한 원줄기는 제외한다.)서울특별시 서대문구 성산로20길 9 (창천동)서울특별시 서대문구 창천동 98-3서울특별시 서대문구 창천동 98번지 3호 서대문우체국
197진웅종합건설이정영관내빗물받이 및 연결관 준설공사하수준설토서울특별시 관악구 봉천로 596 (봉천동)서울특별시 관악구 봉천동 1632-3서울특별시 서대문구 연희동 서대문구 관내
198동양환경엔지니어링(주)최동안하수관 공사하수준설토서울특별시 서대문구 연희동 700서울특별시 서대문구 연희동 700번지
199정우개발(주)권혁찬관내하수도 준설공사하수준설토서울특별시 서초구 마방로4길 16-30 (양재동_4층)서울특별시 서초구 양재동 242-1 4층서울특별시 서대문구 연희동 168번지 6호 서대문구 관내 일원

Duplicate rows

Most frequently occurring

상호대표자공사명폐기물 종류사업장도로명주소사업장지번주소현장지번주소# duplicates
1롯데건설(주)박창규폐목재류 1등급서울특별시 서대문구 연세로 50-1 (신촌동)서울특별시 서대문구 신촌동 134번지3
0라운드원코리아 주식회사김남중서울창서초운동장 인조잔디 분리회수 및 재활용 처리 용역폐합성수지류(폐염화비닐수지류는 제외한다)경기도 안양시 동안구 평촌대로 239 (관양동_ 안양시공동구)서울특별시 서대문구 창천동 53-382
2연세대학교 의료원의료원장폐합성수지 배출폐합성수지류서울특별시 서대문구 연세로 50 (신촌동_연세의료원)서울특별시 서대문구 신촌동 134 연세의료원서울특별시 서대문구 신촌동 134번지 연세의료원2
3이화여자대학교최경희사업장생활계폐기물폐합성수지류(폐염화비닐수지류는 제외한다)서울특별시 서대문구 이화여대길 52 (대현동)서울특별시 서대문구 대현동 11-1서울특별시 서대문구 대현동 11-1번지2
4주식회사 동북임업강명자2019년 예방사방공사 (11번 버스종점등 3개소)임목폐목재(건설공사_ 산지개간 등의 과정에서 발생된 나무뿌리_ 가지_ 줄기 등을 말한다)서울특별시 강남구 광평로56길 8-13_ 수서타워 1503호 (수서동)서울특별시 강남구 수서동 725 수서타워홍은동 산 1-71번지외 지역2