Overview

Dataset statistics

Number of variables6
Number of observations10000
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory556.6 KiB
Average record size in memory57.0 B

Variable types

Numeric1
DateTime2
Categorical2
Text1

Dataset

Description파일 다운로드
Author서울특별시
URLhttps://data.seoul.go.kr/dataList/OA-21304/S/1/datasetView.do

Alerts

번호 has unique valuesUnique

Reproduction

Analysis started2024-03-13 17:46:00.738175
Analysis finished2024-03-13 17:46:01.331066
Duration0.59 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

번호
Real number (ℝ)

UNIQUE 

Distinct10000
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean30292.774
Minimum4
Maximum60599
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size166.0 KiB
2024-03-14T02:46:01.384759image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum4
5-th percentile3148.55
Q115411.75
median30364.5
Q345224.75
95-th percentile57421.1
Maximum60599
Range60595
Interquartile range (IQR)29813

Descriptive statistics

Standard deviation17383.592
Coefficient of variation (CV)0.57385277
Kurtosis-1.1836484
Mean30292.774
Median Absolute Deviation (MAD)14888
Skewness-0.0013664251
Sum3.0292774 × 108
Variance3.0218928 × 108
MonotonicityNot monotonic
2024-03-14T02:46:01.487447image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
50976 1
 
< 0.1%
1456 1
 
< 0.1%
3493 1
 
< 0.1%
21995 1
 
< 0.1%
31629 1
 
< 0.1%
14866 1
 
< 0.1%
11093 1
 
< 0.1%
26218 1
 
< 0.1%
45135 1
 
< 0.1%
58320 1
 
< 0.1%
Other values (9990) 9990
99.9%
ValueCountFrequency (%)
4 1
< 0.1%
5 1
< 0.1%
9 1
< 0.1%
16 1
< 0.1%
52 1
< 0.1%
54 1
< 0.1%
57 1
< 0.1%
60 1
< 0.1%
72 1
< 0.1%
86 1
< 0.1%
ValueCountFrequency (%)
60599 1
< 0.1%
60593 1
< 0.1%
60591 1
< 0.1%
60587 1
< 0.1%
60580 1
< 0.1%
60561 1
< 0.1%
60559 1
< 0.1%
60541 1
< 0.1%
60536 1
< 0.1%
60534 1
< 0.1%
Distinct258
Distinct (%)2.6%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
Minimum2021-07-15 00:00:00
Maximum2022-07-29 00:00:00
2024-03-14T02:46:01.588355image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-03-14T02:46:01.692955image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

구정보
Categorical

Distinct24
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
마포구
1221 
송파구
1005 
영등포구
888 
성동구
685 
관악구
667 
Other values (19)
5534 

Length

Max length4
Median length3
Mean length3.1292
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row동작구
2nd row강남구
3rd row동대문구
4th row중랑구
5th row성동구

Common Values

ValueCountFrequency (%)
마포구 1221
12.2%
송파구 1005
 
10.1%
영등포구 888
 
8.9%
성동구 685
 
6.9%
관악구 667
 
6.7%
동작구 639
 
6.4%
서초구 572
 
5.7%
강남구 561
 
5.6%
광진구 445
 
4.5%
강서구 405
 
4.0%
Other values (14) 2912
29.1%

Length

2024-03-14T02:46:01.804502image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
마포구 1221
12.2%
송파구 1005
 
10.1%
영등포구 888
 
8.9%
성동구 685
 
6.9%
관악구 667
 
6.7%
동작구 639
 
6.4%
서초구 572
 
5.7%
강남구 561
 
5.6%
광진구 445
 
4.5%
강서구 405
 
4.0%
Other values (14) 2912
29.1%

주소
Text

Distinct5700
Distinct (%)57.0%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2024-03-14T02:46:02.085541image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length24
Median length22
Mean length19.1778
Min length12

Characters and Unicode

Total characters191778
Distinct characters204
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique4113 ?
Unique (%)41.1%

Sample

1st row서울특별시 동작구 사당동 산10-27
2nd row서울특별시 강남구 대치동 1026
3rd row서울특별시 동대문구 장안동 477-14
4th row서울특별시 중랑구 중화동 300-48
5th row서울특별시 성동구 성수동2가 278-50
ValueCountFrequency (%)
서울특별시 10000
25.0%
마포구 1221
 
3.1%
송파구 1005
 
2.5%
영등포구 888
 
2.2%
성동구 685
 
1.7%
관악구 667
 
1.7%
동작구 639
 
1.6%
서초구 572
 
1.4%
강남구 561
 
1.4%
봉천동 454
 
1.1%
Other values (5129) 23299
58.3%
2024-03-14T02:46:02.471862image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
29991
15.6%
12122
 
6.3%
11927
 
6.2%
10509
 
5.5%
10000
 
5.2%
10000
 
5.2%
10000
 
5.2%
10000
 
5.2%
1 8073
 
4.2%
- 7650
 
4.0%
Other values (194) 71506
37.3%

Most occurring categories

ValueCountFrequency (%)
Other Letter 112890
58.9%
Decimal Number 41247
 
21.5%
Space Separator 29991
 
15.6%
Dash Punctuation 7650
 
4.0%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
12122
 
10.7%
11927
 
10.6%
10509
 
9.3%
10000
 
8.9%
10000
 
8.9%
10000
 
8.9%
10000
 
8.9%
2180
 
1.9%
1613
 
1.4%
1581
 
1.4%
Other values (182) 32958
29.2%
Decimal Number
ValueCountFrequency (%)
1 8073
19.6%
2 5723
13.9%
3 4433
10.7%
4 4216
10.2%
6 3463
8.4%
5 3416
8.3%
7 3371
8.2%
0 2977
 
7.2%
9 2881
 
7.0%
8 2694
 
6.5%
Space Separator
ValueCountFrequency (%)
29991
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 7650
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 112890
58.9%
Common 78888
41.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
12122
 
10.7%
11927
 
10.6%
10509
 
9.3%
10000
 
8.9%
10000
 
8.9%
10000
 
8.9%
10000
 
8.9%
2180
 
1.9%
1613
 
1.4%
1581
 
1.4%
Other values (182) 32958
29.2%
Common
ValueCountFrequency (%)
29991
38.0%
1 8073
 
10.2%
- 7650
 
9.7%
2 5723
 
7.3%
3 4433
 
5.6%
4 4216
 
5.3%
6 3463
 
4.4%
5 3416
 
4.3%
7 3371
 
4.3%
0 2977
 
3.8%
Other values (2) 5575
 
7.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 112890
58.9%
ASCII 78888
41.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
29991
38.0%
1 8073
 
10.2%
- 7650
 
9.7%
2 5723
 
7.3%
3 4433
 
5.6%
4 4216
 
5.3%
6 3463
 
4.4%
5 3416
 
4.3%
7 3371
 
4.3%
0 2977
 
3.8%
Other values (2) 5575
 
7.1%
Hangul
ValueCountFrequency (%)
12122
 
10.7%
11927
 
10.6%
10509
 
9.3%
10000
 
8.9%
10000
 
8.9%
10000
 
8.9%
10000
 
8.9%
2180
 
1.9%
1613
 
1.4%
1581
 
1.4%
Other values (182) 32958
29.2%

유형
Categorical

Distinct13
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
보도와 차도가 구분된 도로의 차도
4503 
횡단보도, 산책로 등
1624 
버스정류장, 택시 승강장
1357 
점자블록, 엘리베이터 입구
750 
지하철역 진출입로 및 주변
603 
Other values (8)
1163 

Length

Max length18
Median length14
Mean length14.1504
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row보도와 차도가 구분된 도로의 차도
2nd row자전거 도로
3rd row보도와 차도가 구분된 도로의 차도
4th row보도 중앙
5th row보도와 차도가 구분된 도로의 차도

Common Values

ValueCountFrequency (%)
보도와 차도가 구분된 도로의 차도 4503
45.0%
횡단보도, 산책로 등 1624
 
16.2%
버스정류장, 택시 승강장 1357
 
13.6%
점자블록, 엘리베이터 입구 750
 
7.5%
지하철역 진출입로 및 주변 603
 
6.0%
보도 중앙 493
 
4.9%
자전거 도로 482
 
4.8%
기타 150
 
1.5%
오신고 15
 
0.1%
건물, 상가 보행자 진출입 15
 
0.1%
Other values (3) 8
 
0.1%

Length

2024-03-14T02:46:02.587188image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
보도와 4503
11.8%
도로의 4503
11.8%
차도 4503
11.8%
차도가 4503
11.8%
구분된 4503
11.8%
횡단보도 1624
 
4.2%
산책로 1624
 
4.2%
1624
 
4.2%
버스정류장 1357
 
3.5%
승강장 1357
 
3.5%
Other values (27) 8221
21.5%
Distinct258
Distinct (%)2.6%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
Minimum2021-07-15 00:00:00
Maximum2022-07-29 00:00:00
2024-03-14T02:46:02.684231image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-03-14T02:46:02.789321image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

Interactions

2024-03-14T02:46:01.116722image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-03-14T02:46:02.871006image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
번호구정보유형
번호1.0000.5120.463
구정보0.5121.0000.547
유형0.4630.5471.000
2024-03-14T02:46:02.955385image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
유형구정보
유형1.0000.211
구정보0.2111.000
2024-03-14T02:46:03.035752image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
번호구정보유형
번호1.0000.2140.211
구정보0.2141.0000.211
유형0.2110.2111.000

Missing values

2024-03-14T02:46:01.215128image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-14T02:46:01.293674image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

번호신고일구정보주소유형조치일
50975509762022-06-08동작구서울특별시 동작구 사당동 산10-27보도와 차도가 구분된 도로의 차도2022-06-08
56867568682022-07-11강남구서울특별시 강남구 대치동 1026자전거 도로2022-07-11
35262352632022-03-14동대문구서울특별시 동대문구 장안동 477-14보도와 차도가 구분된 도로의 차도2022-03-14
20562205632021-12-27중랑구서울특별시 중랑구 중화동 300-48보도 중앙2021-12-27
26953269542022-02-03성동구서울특별시 성동구 성수동2가 278-50보도와 차도가 구분된 도로의 차도2022-02-03
304530462021-08-18영등포구서울특별시 영등포구 여의도동 1버스정류장, 택시 승강장2021-08-18
48272482732022-05-24관악구서울특별시 관악구 봉천동 1653-1보도와 차도가 구분된 도로의 차도2022-05-24
17368173692021-12-07마포구서울특별시 마포구 서교동 348-56보도와 차도가 구분된 도로의 차도2021-12-07
790079012021-09-28강동구서울특별시 강동구 암사동 414-2버스정류장, 택시 승강장2021-09-28
452545262021-09-02마포구서울특별시 마포구 상수동 309-18지하철역 진출입로 및 주변2021-09-02
번호신고일구정보주소유형조치일
25704257052022-01-24강남구서울특별시 강남구 삼성동 111-147횡단보도, 산책로 등2022-01-24
47734477352022-05-23강남구서울특별시 강남구 역삼동 676보도와 차도가 구분된 도로의 차도2022-05-23
47625476262022-05-20동작구서울특별시 동작구 사당동 708-1110보도와 차도가 구분된 도로의 차도2022-05-20
50564505652022-06-07영등포구서울특별시 영등포구 여의도동 23-1횡단보도, 산책로 등2022-06-07
59420594212022-07-25도봉구서울특별시 도봉구 방학동 726-100보도와 차도가 구분된 도로의 차도2022-07-25
44732447332022-05-06성동구서울특별시 성동구 행당동보도와 차도가 구분된 도로의 차도2022-05-06
177017712021-08-04영등포구서울특별시 영등포구 여의도동 22버스정류장, 택시 승강장2021-08-04
35915359162022-03-16광진구서울특별시 광진구 화양동 164-9점자블록, 엘리베이터 입구2022-03-16
29495294962022-02-14노원구서울특별시 노원구 상계동 747점자블록, 엘리베이터 입구2022-02-14
40613406142022-04-11중랑구서울특별시 중랑구 면목동 561보도와 차도가 구분된 도로의 차도2022-04-11