Overview

Dataset statistics

Number of variables4
Number of observations30
Missing cells64
Missing cells (%)53.3%
Duplicate rows2
Duplicate rows (%)6.7%
Total size in memory1.1 KiB
Average record size in memory38.4 B

Variable types

Unsupported1
Numeric1
Categorical1
Text1

Dataset

Description파일 다운로드
Author서울특별시
URLhttps://data.seoul.go.kr/dataList/OA-2743/F/1/datasetView.do

Alerts

Dataset has 2 (6.7%) duplicate rowsDuplicates
'서울의 문' 공공미술 사업에 대한 여론조사 is highly overall correlated with Unnamed: 2High correlation
Unnamed: 2 is highly overall correlated with '서울의 문' 공공미술 사업에 대한 여론조사High correlation
Unnamed: 0 has 30 (100.0%) missing valuesMissing
'서울의 문' 공공미술 사업에 대한 여론조사 has 24 (80.0%) missing valuesMissing
Unnamed: 3 has 10 (33.3%) missing valuesMissing
Unnamed: 0 is an unsupported type, check if it needs cleaning or further analysisUnsupported

Reproduction

Analysis started2023-12-11 05:26:18.499704
Analysis finished2023-12-11 05:26:19.094245
Duration0.59 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Unnamed: 0
Unsupported

MISSING  REJECTED  UNSUPPORTED 

Missing30
Missing (%)100.0%
Memory size402.0 B

'서울의 문' 공공미술 사업에 대한 여론조사
Real number (ℝ)

HIGH CORRELATION  MISSING 

Distinct6
Distinct (%)100.0%
Missing24
Missing (%)80.0%
Infinite0
Infinite (%)0.0%
Mean3.5
Minimum1
Maximum6
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size402.0 B
2023-12-11T14:26:19.167875image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum1
5-th percentile1.25
Q12.25
median3.5
Q34.75
95-th percentile5.75
Maximum6
Range5
Interquartile range (IQR)2.5

Descriptive statistics

Standard deviation1.8708287
Coefficient of variation (CV)0.53452248
Kurtosis-1.2
Mean3.5
Median Absolute Deviation (MAD)1.5
Skewness0
Sum21
Variance3.5
MonotonicityStrictly increasing
2023-12-11T14:26:19.300299image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=6)
ValueCountFrequency (%)
1 1
 
3.3%
2 1
 
3.3%
3 1
 
3.3%
4 1
 
3.3%
5 1
 
3.3%
6 1
 
3.3%
(Missing) 24
80.0%
ValueCountFrequency (%)
1 1
3.3%
2 1
3.3%
3 1
3.3%
4 1
3.3%
5 1
3.3%
6 1
3.3%
ValueCountFrequency (%)
6 1
3.3%
5 1
3.3%
4 1
3.3%
3 1
3.3%
2 1
3.3%
1 1
3.3%

Unnamed: 2
Categorical

HIGH CORRELATION 

Distinct13
Distinct (%)43.3%
Missing0
Missing (%)0.0%
Memory size372.0 B
1
2
<NA>
3
99
Other values (8)

Length

Max length103
Median length1
Mean length14
Min length1

Unique

Unique8 ?
Unique (%)26.7%

Sample

1st row<NA>
2nd row<NA>
3rd row<NA>
4th row<NA>
5th row공항에서 서울로 진입하는 경계 3곳에 ‘Seoul Welcomes You’ 라는 영문 표기의 환영표지가 설치되어 있습니다. 선생님께서는 이 표지를 알고 계시거나 보신 적이 있으십니까?

Common Values

ValueCountFrequency (%)
1 6
20.0%
2 5
16.7%
<NA> 4
13.3%
3 4
13.3%
99 3
10.0%
공항에서 서울로 진입하는 경계 3곳에 ‘Seoul Welcomes You’ 라는 영문 표기의 환영표지가 설치되어 있습니다. 선생님께서는 이 표지를 알고 계시거나 보신 적이 있으십니까? 1
 
3.3%
서울을 찾는 내국인과 외국인들의 방문을 반기고 도시의 브랜드 경쟁력을 강화하기 위해 서울로의 진입을 알릴 수 있는 글자, 동상 형태의 조형물을 설치하는 것에 대하여 어떻게 생각하십니까? 1
 
3.3%
4 1
 
3.3%
5 1
 
3.3%
‘서울로의 진입’을 알리는 조형물을 설치한다면 다음 중 어떤 형태가 되어야 한다고 생각하십니까? 1
 
3.3%
Other values (3) 3
10.0%

Length

2023-12-11T14:26:19.437983image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
1 6
 
5.2%
2 5
 
4.3%
na 4
 
3.5%
3 4
 
3.5%
99 3
 
2.6%
서울로의 2
 
1.7%
알리는 2
 
1.7%
생각하십니까 2
 
1.7%
어떻게 2
 
1.7%
진입을 2
 
1.7%
Other values (82) 83
72.2%

Unnamed: 3
Text

MISSING 

Distinct18
Distinct (%)90.0%
Missing10
Missing (%)33.3%
Memory size372.0 B
2023-12-11T14:26:19.731132image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length24
Median length16
Mean length9.35
Min length2

Characters and Unicode

Total characters187
Distinct characters77
Distinct categories7 ?
Distinct scripts2 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique17 ?
Unique (%)85.0%

Sample

1st row환영표지에 대해 알고 있고, 본 적도 있다
2nd row환영표지에 대해 알고 있지만, 본 적은 없다
3rd row오늘 처음 알았다
4th row매우 필요하다
5th row대체로 필요하다
ValueCountFrequency (%)
기타 3
 
5.8%
조형물 3
 
5.8%
필요하다 2
 
3.8%
서울 2
 
3.8%
활용한 2
 
3.8%
않다 2
 
3.8%
환영표지에 2
 
3.8%
필요하지 2
 
3.8%
대해 2
 
3.8%
알고 2
 
3.8%
Other values (29) 30
57.7%
2023-12-11T14:26:20.163533image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
33
 
17.6%
8
 
4.3%
6
 
3.2%
6
 
3.2%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
4
 
2.1%
Other values (67) 110
58.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 145
77.5%
Space Separator 33
 
17.6%
Other Punctuation 3
 
1.6%
Close Punctuation 2
 
1.1%
Open Punctuation 2
 
1.1%
Final Punctuation 1
 
0.5%
Initial Punctuation 1
 
0.5%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
8
 
5.5%
6
 
4.1%
6
 
4.1%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
Other values (61) 97
66.9%
Space Separator
ValueCountFrequency (%)
33
100.0%
Other Punctuation
ValueCountFrequency (%)
, 3
100.0%
Close Punctuation
ValueCountFrequency (%)
) 2
100.0%
Open Punctuation
ValueCountFrequency (%)
( 2
100.0%
Final Punctuation
ValueCountFrequency (%)
1
100.0%
Initial Punctuation
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 145
77.5%
Common 42
 
22.5%

Most frequent character per script

Hangul
ValueCountFrequency (%)
8
 
5.5%
6
 
4.1%
6
 
4.1%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
Other values (61) 97
66.9%
Common
ValueCountFrequency (%)
33
78.6%
, 3
 
7.1%
) 2
 
4.8%
( 2
 
4.8%
1
 
2.4%
1
 
2.4%

Most occurring blocks

ValueCountFrequency (%)
Hangul 145
77.5%
ASCII 40
 
21.4%
Punctuation 2
 
1.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
33
82.5%
, 3
 
7.5%
) 2
 
5.0%
( 2
 
5.0%
Hangul
ValueCountFrequency (%)
8
 
5.5%
6
 
4.1%
6
 
4.1%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
4
 
2.8%
Other values (61) 97
66.9%
Punctuation
ValueCountFrequency (%)
1
50.0%
1
50.0%

Interactions

2023-12-11T14:26:18.647979image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-11T14:26:20.314417image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
'서울의 문' 공공미술 사업에 대한 여론조사Unnamed: 2Unnamed: 3
'서울의 문' 공공미술 사업에 대한 여론조사1.0001.000NaN
Unnamed: 21.0001.0001.000
Unnamed: 3NaN1.0001.000
2023-12-11T14:26:20.446130image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
'서울의 문' 공공미술 사업에 대한 여론조사Unnamed: 2
'서울의 문' 공공미술 사업에 대한 여론조사1.0001.000
Unnamed: 21.0001.000

Missing values

2023-12-11T14:26:18.766400image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-11T14:26:18.863550image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.
2023-12-11T14:26:19.015841image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
The correlation heatmap measures nullity correlation: how strongly the presence or absence of one variable affects the presence of another.

Sample

Unnamed: 0'서울의 문' 공공미술 사업에 대한 여론조사Unnamed: 2Unnamed: 3
0<NA><NA><NA><NA>
1<NA><NA><NA><NA>
2<NA><NA><NA><NA>
3<NA><NA><NA><NA>
4<NA>1공항에서 서울로 진입하는 경계 3곳에 ‘Seoul Welcomes You’ 라는 영문 표기의 환영표지가 설치되어 있습니다. 선생님께서는 이 표지를 알고 계시거나 보신 적이 있으십니까?<NA>
5<NA><NA>1환영표지에 대해 알고 있고, 본 적도 있다
6<NA><NA>2환영표지에 대해 알고 있지만, 본 적은 없다
7<NA><NA>3오늘 처음 알았다
8<NA>2서울을 찾는 내국인과 외국인들의 방문을 반기고 도시의 브랜드 경쟁력을 강화하기 위해 서울로의 진입을 알릴 수 있는 글자, 동상 형태의 조형물을 설치하는 것에 대하여 어떻게 생각하십니까?<NA>
9<NA><NA>1매우 필요하다
Unnamed: 0'서울의 문' 공공미술 사업에 대한 여론조사Unnamed: 2Unnamed: 3
20<NA><NA>1주관식분기용보기
21<NA>5현재 거주하고 계신 지역은 어디입니까?<NA>
22<NA><NA>1서울
23<NA><NA>2수도권(경기, 인천)
24<NA><NA>99기타
25<NA>6선생님의 국적은 어떻게 되십니까?<NA>
26<NA><NA>1내국인
27<NA><NA>2국내거주 외국인
28<NA><NA>3재외국민
29<NA><NA>99기타

Duplicate rows

Most frequently occurring

'서울의 문' 공공미술 사업에 대한 여론조사Unnamed: 2Unnamed: 3# duplicates
1<NA><NA><NA>4
0<NA>99기타3