Overview

Dataset statistics

Number of variables7
Number of observations5451
Missing cells5451
Missing cells (%)14.3%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory308.9 KiB
Average record size in memory58.0 B

Variable types

Unsupported1
Numeric1
DateTime2
Categorical2
Text1

Dataset

Description파일 다운로드
Author서울특별시
URLhttps://data.seoul.go.kr/dataList/OA-21304/S/1/datasetView.do

Alerts

Unnamed: 0 has 5451 (100.0%) missing valuesMissing
번호 has unique valuesUnique
Unnamed: 0 is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2024-03-13 17:46:08.690036
Analysis finished2024-03-13 17:46:09.169886
Duration0.48 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Unnamed: 0
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing5451
Missing (%)100.0%
Memory size48.0 KiB

번호
Real number (ℝ)

UNIQUE 

Distinct5451
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean2726
Minimum1
Maximum5451
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size48.0 KiB
2024-03-14T02:46:09.224485image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile273.5
Q11363.5
median2726
Q34088.5
95-th percentile5178.5
Maximum5451
Range5450
Interquartile range (IQR)2725

Descriptive statistics

Standard deviation1573.7125
Coefficient of variation (CV)0.57729732
Kurtosis-1.2
Mean2726
Median Absolute Deviation (MAD)1363
Skewness0
Sum14859426
Variance2476571
MonotonicityStrictly increasing
2024-03-14T02:46:09.340529image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 1
 
< 0.1%
3633 1
 
< 0.1%
3641 1
 
< 0.1%
3640 1
 
< 0.1%
3639 1
 
< 0.1%
3638 1
 
< 0.1%
3637 1
 
< 0.1%
3636 1
 
< 0.1%
3635 1
 
< 0.1%
3634 1
 
< 0.1%
Other values (5441) 5441
99.8%
ValueCountFrequency (%)
1 1
< 0.1%
2 1
< 0.1%
3 1
< 0.1%
4 1
< 0.1%
5 1
< 0.1%
6 1
< 0.1%
7 1
< 0.1%
8 1
< 0.1%
9 1
< 0.1%
10 1
< 0.1%
ValueCountFrequency (%)
5451 1
< 0.1%
5450 1
< 0.1%
5449 1
< 0.1%
5448 1
< 0.1%
5447 1
< 0.1%
5446 1
< 0.1%
5445 1
< 0.1%
5444 1
< 0.1%
5443 1
< 0.1%
5442 1
< 0.1%
Distinct19
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size42.7 KiB
Minimum2023-09-01 00:00:00
Maximum2023-09-27 00:00:00
2024-03-14T02:46:09.436248image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-03-14T02:46:09.564602image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=19)

구정보
Categorical

Distinct24
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size42.7 KiB
강남구
535 
송파구
460 
영등포구
427 
서초구
424 
마포구
399 
Other values (19)
3206 

Length

Max length4
Median length3
Mean length3.1377729
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row도봉구
2nd row강동구
3rd row성동구
4th row강동구
5th row마포구

Common Values

ValueCountFrequency (%)
강남구 535
 
9.8%
송파구 460
 
8.4%
영등포구 427
 
7.8%
서초구 424
 
7.8%
마포구 399
 
7.3%
성동구 385
 
7.1%
동대문구 363
 
6.7%
용산구 352
 
6.5%
동작구 260
 
4.8%
관악구 219
 
4.0%
Other values (14) 1627
29.8%

Length

2024-03-14T02:46:09.698365image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
강남구 535
 
9.8%
송파구 460
 
8.4%
영등포구 427
 
7.8%
서초구 424
 
7.8%
마포구 399
 
7.3%
성동구 385
 
7.1%
동대문구 363
 
6.7%
용산구 352
 
6.5%
동작구 260
 
4.8%
관악구 219
 
4.0%
Other values (14) 1627
29.8%

주소
Text

Distinct3250
Distinct (%)59.6%
Missing0
Missing (%)0.0%
Memory size42.7 KiB
2024-03-14T02:46:09.961019image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length26
Median length24
Mean length19.432031
Min length13

Characters and Unicode

Total characters105924
Distinct characters191
Distinct categories4 ?
Distinct scripts2 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique2306 ?
Unique (%)42.3%

Sample

1st row서울특별시 도봉구 쌍문동 482-1
2nd row서울특별시 강동구 성내동 478
3rd row서울특별시 성동구 성수동2가 277-25
4th row서울특별시 강동구 성내동 478
5th row서울특별시 마포구 도화동 81
ValueCountFrequency (%)
서울특별시 5451
25.0%
강남구 535
 
2.5%
송파구 460
 
2.1%
영등포구 427
 
2.0%
서초구 424
 
1.9%
마포구 399
 
1.8%
성동구 385
 
1.8%
동대문구 363
 
1.7%
용산구 352
 
1.6%
동작구 260
 
1.2%
Other values (3271) 12750
58.5%
2024-03-14T02:46:10.330571image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
16355
15.4%
6598
 
6.2%
6508
 
6.1%
5667
 
5.4%
5452
 
5.1%
5451
 
5.1%
5451
 
5.1%
5451
 
5.1%
1 4602
 
4.3%
- 4373
 
4.1%
Other values (181) 40016
37.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 61754
58.3%
Decimal Number 23442
 
22.1%
Space Separator 16355
 
15.4%
Dash Punctuation 4373
 
4.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
6598
 
10.7%
6508
 
10.5%
5667
 
9.2%
5452
 
8.8%
5451
 
8.8%
5451
 
8.8%
5451
 
8.8%
1067
 
1.7%
969
 
1.6%
939
 
1.5%
Other values (169) 18201
29.5%
Decimal Number
ValueCountFrequency (%)
1 4602
19.6%
2 3421
14.6%
3 2436
10.4%
4 2332
9.9%
6 1977
8.4%
5 1942
8.3%
7 1853
7.9%
0 1719
 
7.3%
9 1619
 
6.9%
8 1541
 
6.6%
Space Separator
ValueCountFrequency (%)
16355
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 4373
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 61754
58.3%
Common 44170
41.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
6598
 
10.7%
6508
 
10.5%
5667
 
9.2%
5452
 
8.8%
5451
 
8.8%
5451
 
8.8%
5451
 
8.8%
1067
 
1.7%
969
 
1.6%
939
 
1.5%
Other values (169) 18201
29.5%
Common
ValueCountFrequency (%)
16355
37.0%
1 4602
 
10.4%
- 4373
 
9.9%
2 3421
 
7.7%
3 2436
 
5.5%
4 2332
 
5.3%
6 1977
 
4.5%
5 1942
 
4.4%
7 1853
 
4.2%
0 1719
 
3.9%
Other values (2) 3160
 
7.2%

Most occurring blocks

ValueCountFrequency (%)
Hangul 61754
58.3%
ASCII 44170
41.7%

Most frequent character per block

ASCII
ValueCountFrequency (%)
16355
37.0%
1 4602
 
10.4%
- 4373
 
9.9%
2 3421
 
7.7%
3 2436
 
5.5%
4 2332
 
5.3%
6 1977
 
4.5%
5 1942
 
4.4%
7 1853
 
4.2%
0 1719
 
3.9%
Other values (2) 3160
 
7.2%
Hangul
ValueCountFrequency (%)
6598
 
10.7%
6508
 
10.5%
5667
 
9.2%
5452
 
8.8%
5451
 
8.8%
5451
 
8.8%
5451
 
8.8%
1067
 
1.7%
969
 
1.6%
939
 
1.5%
Other values (169) 18201
29.5%

유형
Categorical

Distinct14
Distinct (%)0.3%
Missing0
Missing (%)0.0%
Memory size42.7 KiB
보도와 차도가 구분된 도로의 차도
2256 
횡단보도, 산책로 등
1164 
보도 중앙
818 
자전거 도로
370 
버스정류장, 택시 승강장
 
201
Other values (9)
642 

Length

Max length18
Median length14
Mean length12.593286
Min length2

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row점자블록, 엘리베이터 입구
2nd row버스정류장, 택시 승강장
3rd row횡단보도, 산책로 등
4th row버스정류장, 택시 승강장
5th row보도와 차도가 구분된 도로의 차도

Common Values

ValueCountFrequency (%)
보도와 차도가 구분된 도로의 차도 2256
41.4%
횡단보도, 산책로 등 1164
21.4%
보도 중앙 818
 
15.0%
자전거 도로 370
 
6.8%
버스정류장, 택시 승강장 201
 
3.7%
기타 198
 
3.6%
점자블록, 엘리베이터 입구 173
 
3.2%
건물, 상가 보행자 진출입 165
 
3.0%
지하철역 진출입로 및 주변 71
 
1.3%
오신고 23
 
0.4%
Other values (4) 12
 
0.2%

Length

2024-03-14T02:46:10.451849image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
보도와 2256
11.6%
구분된 2256
11.6%
도로의 2256
11.6%
차도 2256
11.6%
차도가 2256
11.6%
횡단보도 1164
 
6.0%
산책로 1164
 
6.0%
1164
 
6.0%
보도 818
 
4.2%
중앙 818
 
4.2%
Other values (28) 3064
15.7%
Distinct22
Distinct (%)0.4%
Missing0
Missing (%)0.0%
Memory size42.7 KiB
Minimum2023-09-01 00:00:00
Maximum2023-10-05 00:00:00
2024-03-14T02:46:10.536824image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-03-14T02:46:10.617952image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=22)

Interactions

2024-03-14T02:46:08.959269image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2024-03-14T02:46:10.680361image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
번호신고일구정보유형조치일
번호1.0000.9810.3300.1460.982
신고일0.9811.0000.3770.2030.999
구정보0.3300.3771.0000.6740.401
유형0.1460.2030.6741.0000.537
조치일0.9820.9990.4010.5371.000
2024-03-14T02:46:10.753865image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
유형구정보
유형1.0000.281
구정보0.2811.000
2024-03-14T02:46:10.814364image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
번호구정보유형
번호1.0000.1270.059
구정보0.1271.0000.281
유형0.0590.2811.000

Missing values

2024-03-14T02:46:09.045569image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-14T02:46:09.132627image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

Unnamed: 0번호신고일구정보주소유형조치일
0<NA>12023-09-01도봉구서울특별시 도봉구 쌍문동 482-1점자블록, 엘리베이터 입구2023-09-01
1<NA>22023-09-01강동구서울특별시 강동구 성내동 478버스정류장, 택시 승강장2023-09-01
2<NA>32023-09-01성동구서울특별시 성동구 성수동2가 277-25횡단보도, 산책로 등2023-09-01
3<NA>42023-09-01강동구서울특별시 강동구 성내동 478버스정류장, 택시 승강장2023-09-01
4<NA>52023-09-01마포구서울특별시 마포구 도화동 81보도와 차도가 구분된 도로의 차도2023-09-01
5<NA>62023-09-01성동구서울특별시 성동구 성수동2가 280-48보도와 차도가 구분된 도로의 차도2023-09-01
6<NA>72023-09-01중랑구서울특별시 중랑구 신내동 648보도 중앙2023-09-01
7<NA>82023-09-01강동구서울특별시 강동구 성내동 450-54보도와 차도가 구분된 도로의 차도2023-09-01
8<NA>92023-09-01마포구서울특별시 마포구 도화동 81보도와 차도가 구분된 도로의 차도2023-09-01
9<NA>102023-09-01중랑구서울특별시 중랑구 신내동 654-1보도 중앙2023-09-01
Unnamed: 0번호신고일구정보주소유형조치일
5441<NA>54422023-09-27성동구서울특별시 성동구 성수동2가 277-72보도와 차도가 구분된 도로의 차도2023-09-27
5442<NA>54432023-09-27성동구서울특별시 성동구 성수동2가 277-43보도와 차도가 구분된 도로의 차도2023-09-27
5443<NA>54442023-09-27구로구서울특별시 구로구 구로동 801-70점자블록, 엘리베이터 입구2023-09-27
5444<NA>54452023-09-27성동구서울특별시 성동구 성수동2가 276-5횡단보도, 산책로 등2023-09-27
5445<NA>54462023-09-27성동구서울특별시 성동구 성수동2가 273-14횡단보도, 산책로 등2023-09-27
5446<NA>54472023-09-27성동구서울특별시 성동구 성수동2가 314-20횡단보도, 산책로 등2023-09-27
5447<NA>54482023-09-27관악구서울특별시 관악구 봉천동 961-1횡단보도, 산책로 등2023-09-27
5448<NA>54492023-09-27성동구서울특별시 성동구 성수동1가 14-78점자블록, 엘리베이터 입구2023-09-27
5449<NA>54502023-09-27강남구서울특별시 강남구 역삼동 801-5보도 중앙2023-10-04
5450<NA>54512023-09-18마포구서울특별시 마포구 서교동 343-11보도와 차도가 구분된 도로의 차도2023-10-05