Overview

Dataset statistics

Number of variables3
Number of observations3506
Missing cells1804
Missing cells (%)17.2%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory85.7 KiB
Average record size in memory25.0 B

Variable types

Text2
Numeric1

Dataset

Description충청남도 천안시 도시계획정보시스템(UPIS)의 색채 현황으로 현황도형 관리번호, 구분 코드 변경 부분 설명의 항목을 제공합니다.
Author충청남도 천안시
URLhttps://www.data.go.kr/data/15123833/fileData.do

Alerts

변경 부분 설명 has 1804 (51.5%) missing valuesMissing

Reproduction

Analysis started2023-12-12 14:49:46.990954
Analysis finished2023-12-12 14:49:47.904710
Duration0.91 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct191
Distinct (%)5.4%
Missing0
Missing (%)0.0%
Memory size27.5 KiB
2023-12-12T23:49:48.179201image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length24
Median length24
Mean length24
Min length24

Characters and Unicode

Total characters84144
Distinct characters14
Distinct categories2 ?
Distinct scripts2 ?
Distinct blocks1 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique36 ?
Unique (%)1.0%

Sample

1st row44130UQ161PS200404300001
2nd row44130UQ161PS200404300001
3rd row44130UQ161PS200404300001
4th row44130UQ161PS200404300001
5th row44130UQ161PS200404300001
ValueCountFrequency (%)
44130uq161ps200511300001 786
22.4%
44130uq161ps201306200001 343
 
9.8%
44130uq161ps200404300001 154
 
4.4%
44130uq161ps200002120001 154
 
4.4%
44130uq161ps201305010004 97
 
2.8%
44130uq161ps201302120001 88
 
2.5%
44130uq161ps199701040002 82
 
2.3%
44130uq161ps200901200001 70
 
2.0%
44130uq161ps201207050001 69
 
2.0%
44130uq161ps202211210001 53
 
1.5%
Other values (181) 1610
45.9%
2023-12-12T23:49:48.674613image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
0 24182
28.7%
1 18708
22.2%
4 7981
 
9.5%
2 6096
 
7.2%
3 5893
 
7.0%
6 4328
 
5.1%
U 3506
 
4.2%
Q 3506
 
4.2%
P 3506
 
4.2%
S 3506
 
4.2%
Other values (4) 2932
 
3.5%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 70120
83.3%
Uppercase Letter 14024
 
16.7%

Most frequent character per category

Decimal Number
ValueCountFrequency (%)
0 24182
34.5%
1 18708
26.7%
4 7981
 
11.4%
2 6096
 
8.7%
3 5893
 
8.4%
6 4328
 
6.2%
5 1470
 
2.1%
9 636
 
0.9%
7 546
 
0.8%
8 280
 
0.4%
Uppercase Letter
ValueCountFrequency (%)
U 3506
25.0%
Q 3506
25.0%
P 3506
25.0%
S 3506
25.0%

Most occurring scripts

ValueCountFrequency (%)
Common 70120
83.3%
Latin 14024
 
16.7%

Most frequent character per script

Common
ValueCountFrequency (%)
0 24182
34.5%
1 18708
26.7%
4 7981
 
11.4%
2 6096
 
8.7%
3 5893
 
8.4%
6 4328
 
6.2%
5 1470
 
2.1%
9 636
 
0.9%
7 546
 
0.8%
8 280
 
0.4%
Latin
ValueCountFrequency (%)
U 3506
25.0%
Q 3506
25.0%
P 3506
25.0%
S 3506
25.0%

Most occurring blocks

ValueCountFrequency (%)
ASCII 84144
100.0%

Most frequent character per block

ASCII
ValueCountFrequency (%)
0 24182
28.7%
1 18708
22.2%
4 7981
 
9.5%
2 6096
 
7.2%
3 5893
 
7.0%
6 4328
 
5.1%
U 3506
 
4.2%
Q 3506
 
4.2%
P 3506
 
4.2%
S 3506
 
4.2%
Other values (4) 2932
 
3.5%

구분 코드
Real number (ℝ)

Distinct786
Distinct (%)22.4%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean123.5
Minimum1
Maximum786
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size30.9 KiB
2023-12-12T23:49:48.848380image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile1
Q19
median31
Q3140.75
95-th percentile610.75
Maximum786
Range785
Interquartile range (IQR)131.75

Descriptive statistics

Standard deviation189.93704
Coefficient of variation (CV)1.5379518
Kurtosis2.7147782
Mean123.5
Median Absolute Deviation (MAD)28
Skewness1.9200302
Sum432991
Variance36076.08
MonotonicityNot monotonic
2023-12-12T23:49:49.052282image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
1 190
 
5.4%
2 155
 
4.4%
3 131
 
3.7%
4 101
 
2.9%
5 90
 
2.6%
6 75
 
2.1%
7 70
 
2.0%
8 62
 
1.8%
9 59
 
1.7%
10 55
 
1.6%
Other values (776) 2518
71.8%
ValueCountFrequency (%)
1 190
5.4%
2 155
4.4%
3 131
3.7%
4 101
2.9%
5 90
2.6%
6 75
 
2.1%
7 70
 
2.0%
8 62
 
1.8%
9 59
 
1.7%
10 55
 
1.6%
ValueCountFrequency (%)
786 1
< 0.1%
785 1
< 0.1%
784 1
< 0.1%
783 1
< 0.1%
782 1
< 0.1%
781 1
< 0.1%
780 1
< 0.1%
779 1
< 0.1%
778 1
< 0.1%
777 1
< 0.1%

변경 부분 설명
Text

MISSING 

Distinct118
Distinct (%)6.9%
Missing1804
Missing (%)51.5%
Memory size27.5 KiB
2023-12-12T23:49:49.447222image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length324
Median length204
Mean length52.576381
Min length4

Characters and Unicode

Total characters89485
Distinct characters317
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks4 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique40 ?
Unique (%)2.4%

Sample

1st row외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
2nd row외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
3rd row외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
4th row외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
5th row외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
ValueCountFrequency (%)
1077
 
4.8%
시행지침 850
 
3.8%
참고 572
 
2.6%
외벽의 466
 
2.1%
색채는 459
 
2.1%
색채 446
 
2.0%
385
 
1.7%
계통의 347
 
1.6%
부문 317
 
1.4%
단독주택 310
 
1.4%
Other values (663) 17120
76.6%
2023-12-12T23:49:50.105906image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
20652
23.1%
3925
 
4.4%
2702
 
3.0%
2242
 
2.5%
1658
 
1.9%
1625
 
1.8%
1575
 
1.8%
1515
 
1.7%
1326
 
1.5%
1316
 
1.5%
Other values (307) 50949
56.9%

Most occurring categories

ValueCountFrequency (%)
Other Letter 65050
72.7%
Space Separator 20652
 
23.1%
Other Punctuation 2473
 
2.8%
Decimal Number 713
 
0.8%
Dash Punctuation 276
 
0.3%
Uppercase Letter 92
 
0.1%
Close Punctuation 86
 
0.1%
Open Punctuation 86
 
0.1%
Math Symbol 18
 
< 0.1%
Final Punctuation 13
 
< 0.1%
Other values (2) 26
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
3925
 
6.0%
2702
 
4.2%
2242
 
3.4%
1658
 
2.5%
1625
 
2.5%
1575
 
2.4%
1515
 
2.3%
1326
 
2.0%
1316
 
2.0%
1188
 
1.8%
Other values (272) 45978
70.7%
Decimal Number
ValueCountFrequency (%)
1 219
30.7%
3 136
19.1%
0 124
17.4%
2 112
15.7%
7 84
 
11.8%
5 11
 
1.5%
8 10
 
1.4%
4 8
 
1.1%
6 7
 
1.0%
9 2
 
0.3%
Uppercase Letter
ValueCountFrequency (%)
Y 44
47.8%
R 16
 
17.4%
G 15
 
16.3%
N 6
 
6.5%
B 5
 
5.4%
P 2
 
2.2%
A 2
 
2.2%
T 2
 
2.2%
Other Punctuation
ValueCountFrequency (%)
, 726
29.4%
/ 607
24.5%
: 536
21.7%
. 485
19.6%
% 111
 
4.5%
· 4
 
0.2%
; 4
 
0.2%
Close Punctuation
ValueCountFrequency (%)
) 85
98.8%
1
 
1.2%
Open Punctuation
ValueCountFrequency (%)
( 85
98.8%
1
 
1.2%
Space Separator
ValueCountFrequency (%)
20652
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 276
100.0%
Math Symbol
ValueCountFrequency (%)
~ 18
100.0%
Final Punctuation
ValueCountFrequency (%)
13
100.0%
Lowercase Letter
ValueCountFrequency (%)
m 13
100.0%
Initial Punctuation
ValueCountFrequency (%)
13
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 65050
72.7%
Common 24330
 
27.2%
Latin 105
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
3925
 
6.0%
2702
 
4.2%
2242
 
3.4%
1658
 
2.5%
1625
 
2.5%
1575
 
2.4%
1515
 
2.3%
1326
 
2.0%
1316
 
2.0%
1188
 
1.8%
Other values (272) 45978
70.7%
Common
ValueCountFrequency (%)
20652
84.9%
, 726
 
3.0%
/ 607
 
2.5%
: 536
 
2.2%
. 485
 
2.0%
- 276
 
1.1%
1 219
 
0.9%
3 136
 
0.6%
0 124
 
0.5%
2 112
 
0.5%
Other values (16) 457
 
1.9%
Latin
ValueCountFrequency (%)
Y 44
41.9%
R 16
 
15.2%
G 15
 
14.3%
m 13
 
12.4%
N 6
 
5.7%
B 5
 
4.8%
P 2
 
1.9%
A 2
 
1.9%
T 2
 
1.9%

Most occurring blocks

ValueCountFrequency (%)
Hangul 65050
72.7%
ASCII 24403
 
27.3%
Punctuation 26
 
< 0.1%
None 6
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
20652
84.6%
, 726
 
3.0%
/ 607
 
2.5%
: 536
 
2.2%
. 485
 
2.0%
- 276
 
1.1%
1 219
 
0.9%
3 136
 
0.6%
0 124
 
0.5%
2 112
 
0.5%
Other values (20) 530
 
2.2%
Hangul
ValueCountFrequency (%)
3925
 
6.0%
2702
 
4.2%
2242
 
3.4%
1658
 
2.5%
1625
 
2.5%
1575
 
2.4%
1515
 
2.3%
1326
 
2.0%
1316
 
2.0%
1188
 
1.8%
Other values (272) 45978
70.7%
Punctuation
ValueCountFrequency (%)
13
50.0%
13
50.0%
None
ValueCountFrequency (%)
· 4
66.7%
1
 
16.7%
1
 
16.7%

Interactions

2023-12-12T23:49:47.593068image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Missing values

2023-12-12T23:49:47.757815image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-12T23:49:47.861666image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

현황도형 관리번호구분 코드변경 부분 설명
044130UQ161PS20040430000171외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
144130UQ161PS20040430000172외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
244130UQ161PS20040430000173외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
344130UQ161PS20040430000174외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
444130UQ161PS20040430000175외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
544130UQ161PS20040430000176외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
644130UQ161PS20040430000177외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
744130UQ161PS20040430000178외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
844130UQ161PS20040430000179외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
944130UQ161PS20040430000180외벽의 색채는 시각의 자극을 유발하는 원색사용 지양
현황도형 관리번호구분 코드변경 부분 설명
349644130UQ161PS2013022100023건축물 외벽의 재료 및 색상은 건물전면과 측후면이 동일하거나 유사한 재료 및 색상을 사용
349744130UQ161PS2013022100024건축물 외벽의 재료 및 색상은 건물전면과 측후면이 동일하거나 유사한 재료 및 색상을 사용
349844130UQ161PS2013022100025외벽 및 지붕의 색상은 원색 및 원색에 가까운 색채의 사용을 지양하고, 주변과 어울리는 색상을 사용
349944130UQ161PS2013022100026외벽 및 지붕의 색상은 원색 및 원색에 가까운 색채의 사용을 지양하고, 주변과 어울리는 색상을 사용
350044130UQ161PS2013022100027외벽 및 지붕의 색상은 원색 및 원색에 가까운 색채의 사용을 지양하고, 주변과 어울리는 색상을 사용
350144130UQ161PS2013022100028외벽 및 지붕의 색상은 원색 및 원색에 가까운 색채의 사용을 지양하고, 주변과 어울리는 색상을 사용
350244130UQ161PS2013022100029외벽 및 지붕의 색상은 원색 및 원색에 가까운 색채의 사용을 지양하고, 주변과 어울리는 색상을 사용
350344130UQ161PS20130221000210건축물 외벽의 재료 및 색상은 건물전면과 측후면이 서로 조화가 이룰 수 있도록 하여 통일감 형성
350444130UQ161PS20130221000211건축물 외벽의 재료 및 색상은 건물전면과 측후면이 서로 조화가 이룰 수 있도록 하여 통일감 형성
350544130UQ161PS20130221000212<NA>