Overview

Dataset statistics

Number of variables6
Number of observations10000
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory556.6 KiB
Average record size in memory57.0 B

Variable types

Numeric1
DateTime2
Categorical2
Text1

Dataset

Description파일 다운로드
Author서울특별시
URLhttps://data.seoul.go.kr/dataList/OA-21304/S/1/datasetView.do

Alerts

번호 has unique valuesUnique

Reproduction

Analysis started2024-03-13 17:46:13.126652
Analysis finished2024-03-13 17:46:13.914825
Duration0.79 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

번호
Real number (ℝ)

UNIQUE 

Distinct10000
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean50520.923
Minimum16
Maximum99997
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size166.0 KiB
2024-03-14T02:46:14.003011image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum16
5-th percentile5425.85
Q125379.5
median50269
Q376114.25
95-th percentile95078.8
Maximum99997
Range99981
Interquartile range (IQR)50734.75

Descriptive statistics

Standard deviation28899.457
Coefficient of variation (CV)0.57202949
Kurtosis-1.2168764
Mean50520.923
Median Absolute Deviation (MAD)25308
Skewness-0.011134866
Sum5.0520923 × 108
Variance8.3517864 × 108
MonotonicityNot monotonic
2024-03-14T02:46:14.146576image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
27797 1
 
< 0.1%
74276 1
 
< 0.1%
26068 1
 
< 0.1%
64796 1
 
< 0.1%
49739 1
 
< 0.1%
97161 1
 
< 0.1%
93547 1
 
< 0.1%
99926 1
 
< 0.1%
66475 1
 
< 0.1%
53183 1
 
< 0.1%
Other values (9990) 9990
99.9%
ValueCountFrequency (%)
16 1
< 0.1%
23 1
< 0.1%
28 1
< 0.1%
36 1
< 0.1%
41 1
< 0.1%
45 1
< 0.1%
50 1
< 0.1%
64 1
< 0.1%
69 1
< 0.1%
71 1
< 0.1%
ValueCountFrequency (%)
99997 1
< 0.1%
99988 1
< 0.1%
99976 1
< 0.1%
99974 1
< 0.1%
99970 1
< 0.1%
99962 1
< 0.1%
99954 1
< 0.1%
99953 1
< 0.1%
99935 1
< 0.1%
99928 1
< 0.1%
Distinct441
Distinct (%)4.4%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
Minimum2021-07-15 00:00:00
Maximum2023-04-24 00:00:00
2024-03-14T02:46:14.245000image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-03-14T02:46:14.342874image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

구정보
Categorical

Distinct25
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
마포구
1091 
송파구
915 
강남구
883 
성동구
846 
영등포구
772 
Other values (20)
5493 

Length

Max length4
Median length3
Mean length3.1194
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row양천구
2nd row강남구
3rd row강남구
4th row강동구
5th row중구

Common Values

ValueCountFrequency (%)
마포구 1091
 
10.9%
송파구 915
 
9.2%
강남구 883
 
8.8%
성동구 846
 
8.5%
영등포구 772
 
7.7%
서초구 677
 
6.8%
동작구 571
 
5.7%
관악구 492
 
4.9%
강서구 413
 
4.1%
동대문구 388
 
3.9%
Other values (15) 2952
29.5%

Length

2024-03-14T02:46:14.446466image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
마포구 1091
 
10.9%
송파구 915
 
9.2%
강남구 883
 
8.8%
성동구 846
 
8.5%
영등포구 772
 
7.7%
서초구 677
 
6.8%
동작구 571
 
5.7%
관악구 492
 
4.9%
강서구 413
 
4.1%
동대문구 388
 
3.9%
Other values (15) 2952
29.5%

주소
Text

Distinct5968
Distinct (%)59.7%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-03-14T02:46:14.708542image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length24
Median length23
Mean length19.2917
Min length13

Characters and Unicode

Total characters192917
Distinct characters210
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique4417 ?
Unique (%)44.2%

Sample

1st row서울특별시 양천구 목동 199-51
2nd row서울특별시 강남구 역삼동 801-35
3rd row서울특별시 강남구 일원동 666-11
4th row서울특별시 강동구 상일동 536
5th row서울특별시 중구 황학동 1692
ValueCountFrequency (%)
서울특별시 9999
25.0%
마포구 1091
 
2.7%
송파구 912
 
2.3%
강남구 885
 
2.2%
성동구 847
 
2.1%
영등포구 774
 
1.9%
서초구 676
 
1.7%
동작구 571
 
1.4%
관악구 491
 
1.2%
성수동2가 485
 
1.2%
Other values (5417) 23263
58.2%
2024-03-14T02:46:15.078789image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
29994
15.5%
12138
 
6.3%
12052
 
6.2%
10313
 
5.3%
10000
 
5.2%
10000
 
5.2%
9999
 
5.2%
9999
 
5.2%
1 8332
 
4.3%
- 7869
 
4.1%
Other values (200) 72221
37.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 112901
58.5%
Decimal Number 42153
 
21.9%
Space Separator 29994
 
15.5%
Dash Punctuation 7869
 
4.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
12138
 
10.8%
12052
 
10.7%
10313
 
9.1%
10000
 
8.9%
10000
 
8.9%
9999
 
8.9%
9999
 
8.9%
1944
 
1.7%
1917
 
1.7%
1848
 
1.6%
Other values (188) 32691
29.0%
Decimal Number
ValueCountFrequency (%)
1 8332
19.8%
2 5947
14.1%
3 4495
10.7%
4 4283
10.2%
6 3515
8.3%
5 3446
8.2%
7 3320
 
7.9%
0 3037
 
7.2%
9 2952
 
7.0%
8 2826
 
6.7%
Space Separator
ValueCountFrequency (%)
29994
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 7869
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 112901
58.5%
Common 80016
41.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
12138
 
10.8%
12052
 
10.7%
10313
 
9.1%
10000
 
8.9%
10000
 
8.9%
9999
 
8.9%
9999
 
8.9%
1944
 
1.7%
1917
 
1.7%
1848
 
1.6%
Other values (188) 32691
29.0%
Common
ValueCountFrequency (%)
29994
37.5%
1 8332
 
10.4%
- 7869
 
9.8%
2 5947
 
7.4%
3 4495
 
5.6%
4 4283
 
5.4%
6 3515
 
4.4%
5 3446
 
4.3%
7 3320
 
4.1%
0 3037
 
3.8%
Other values (2) 5778
 
7.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 112901
58.5%
ASCII 80016
41.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
29994
37.5%
1 8332
 
10.4%
- 7869
 
9.8%
2 5947
 
7.4%
3 4495
 
5.6%
4 4283
 
5.4%
6 3515
 
4.4%
5 3446
 
4.3%
7 3320
 
4.1%
0 3037
 
3.8%
Other values (2) 5778
 
7.2%
Hangul
ValueCountFrequency (%)
12138
 
10.8%
12052
 
10.7%
10313
 
9.1%
10000
 
8.9%
10000
 
8.9%
9999
 
8.9%
9999
 
8.9%
1944
 
1.7%
1917
 
1.7%
1848
 
1.6%
Other values (188) 32691
29.0%

유형
Categorical

Distinct12
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
보도와 차도가 구분된 도로의 차도
5128 
횡단보도, 산책로 등
1372 
버스정류장, 택시 승강장
959 
보도 중앙
693 
자전거 도로
572 
Other values (7)
1276 

Length

Max length18
Median length18
Mean length14.0061
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row점자블록, 엘리베이터 입구
2nd row보도와 차도가 구분된 도로의 차도
3rd row보도와 차도가 구분된 도로의 차도
4th row지하철역 진출입로 및 주변
5th row점자블록, 엘리베이터 입구

Common Values

ValueCountFrequency (%)
보도와 차도가 구분된 도로의 차도 5128
51.3%
횡단보도, 산책로 등 1372
 
13.7%
버스정류장, 택시 승강장 959
 
9.6%
보도 중앙 693
 
6.9%
자전거 도로 572
 
5.7%
점자블록, 엘리베이터 입구 476
 
4.8%
지하철역 진출입로 및 주변 373
 
3.7%
기타 351
 
3.5%
건물, 상가 보행자 진출입 37
 
0.4%
오신고 30
 
0.3%
Other values (2) 9
 
0.1%

Length

2024-03-14T02:46:15.196421image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
보도와 5128
13.3%
구분된 5128
13.3%
도로의 5128
13.3%
차도 5128
13.3%
차도가 5128
13.3%
횡단보도 1372
 
3.6%
산책로 1372
 
3.6%
1372
 
3.6%
버스정류장 959
 
2.5%
택시 959
 
2.5%
Other values (24) 6970
18.0%
Distinct441
Distinct (%)4.4%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
Minimum2021-07-15 00:00:00
Maximum2023-04-24 00:00:00
2024-03-14T02:46:15.291107image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-03-14T02:46:15.388522image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

Interactions

2024-03-14T02:46:13.707392image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-03-14T02:46:15.454906image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
번호구정보유형
번호1.0000.4780.465
구정보0.4781.0000.528
유형0.4650.5281.000
2024-03-14T02:46:15.527703image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
유형구정보
유형1.0000.204
구정보0.2041.000
2024-03-14T02:46:15.596113image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
번호구정보유형
번호1.0000.1890.216
구정보0.1891.0000.204
유형0.2160.2041.000

Missing values

2024-03-14T02:46:13.797382image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-14T02:46:13.877701image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

번호신고일구정보주소유형조치일
27796277972022-02-07양천구서울특별시 양천구 목동 199-51점자블록, 엘리베이터 입구2022-02-07
58723587242022-07-20강남구서울특별시 강남구 역삼동 801-35보도와 차도가 구분된 도로의 차도2022-07-20
88909889102023-02-06강남구서울특별시 강남구 일원동 666-11보도와 차도가 구분된 도로의 차도2023-02-06
15830158312021-11-25강동구서울특별시 강동구 상일동 536지하철역 진출입로 및 주변2021-11-25
95690956912023-03-30중구서울특별시 중구 황학동 1692점자블록, 엘리베이터 입구2023-03-30
89170891712023-02-07강남구서울특별시 강남구 역삼동 804보도 중앙2023-02-07
780278032021-09-27동작구서울특별시 동작구 사당동 144-4버스정류장, 택시 승강장2021-09-27
38803388042022-04-01용산구서울특별시 용산구 한강로3가 40-976보도와 차도가 구분된 도로의 차도2022-04-01
35986359872022-03-16용산구서울특별시 용산구 후암동 55-9보도와 차도가 구분된 도로의 차도2022-03-16
19902199032021-12-22동작구서울특별시 동작구 상도동 511점자블록, 엘리베이터 입구2021-12-22
번호신고일구정보주소유형조치일
66778667792022-09-01성동구서울특별시 성동구 용답동 223-21보도와 차도가 구분된 도로의 차도2022-09-01
46380463812022-05-13중랑구서울특별시 중랑구 면목동 294-5보도와 차도가 구분된 도로의 차도2022-05-13
84997849982023-01-03서초구서울특별시 서초구 양재동 311횡단보도, 산책로 등2023-01-03
90826908272023-02-21중구서울특별시 중구 서소문동 37오신고2023-02-23
55960559612022-07-06강남구서울특별시 강남구 삼성동 111-118보도 중앙2022-07-06
24279242802022-01-17영등포구서울특별시 영등포구 문래동3가 55-20버스정류장, 택시 승강장2022-01-17
29101291022022-02-11양천구서울특별시 양천구 목동 131-131횡단보도, 산책로 등2022-02-11
33707337082022-03-07마포구서울특별시 마포구 동교동 155-6버스정류장, 택시 승강장2022-03-07
51415514162022-06-10강서구서울특별시 강서구 내발산동 660-6보도와 차도가 구분된 도로의 차도2022-06-10
83069830702022-12-20노원구서울특별시 성동구 성수동1가 25-3보도와 차도가 구분된 도로의 차도2022-12-20