Overview

Dataset statistics

Number of variables5
Number of observations100
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory4.2 KiB
Average record size in memory43.3 B

Variable types

Categorical3
Numeric1
Text1

Alerts

themepark_fclty_rnewl_de has constant value ""Constant
area_nm is highly overall correlated with themepark_fclty_addrHigh correlation
themepark_fclty_addr is highly overall correlated with area_nmHigh correlation
themepark_cd has unique valuesUnique

Reproduction

Analysis started2023-12-10 09:42:24.860301
Analysis finished2023-12-10 09:42:26.714106
Duration1.85 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

area_nm
Categorical

HIGH CORRELATION 

Distinct12
Distinct (%)12.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
강원 홍천군
49 
강원 춘천시
16 
강원도 강릉시
11 
강원 평창군
강원 강릉시
Other values (7)
10 

Length

Max length7
Median length6
Mean length6.09
Min length3

Unique

Unique4 ?
Unique (%)4.0%

Sample

1st row강원 강릉시
2nd row충북 충주시
3rd row강원 강릉시
4th row강원 강릉시
5th row강원 강릉시

Common Values

ValueCountFrequency (%)
강원 홍천군 49
49.0%
강원 춘천시 16
 
16.0%
강원도 강릉시 11
 
11.0%
강원 평창군 9
 
9.0%
강원 강릉시 5
 
5.0%
충북 충주시 2
 
2.0%
강원 정선군 2
 
2.0%
강원 횡성군 2
 
2.0%
강원 고성군 1
 
1.0%
강원 삼척시 1
 
1.0%
Other values (2) 2
 
2.0%

Length

2023-12-10T18:42:26.965070image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
강원 85
42.7%
홍천군 49
24.6%
춘천시 16
 
8.0%
강릉시 16
 
8.0%
강원도 12
 
6.0%
평창군 9
 
4.5%
충북 2
 
1.0%
충주시 2
 
1.0%
정선군 2
 
1.0%
횡성군 2
 
1.0%
Other values (4) 4
 
2.0%

themepark_cd
Real number (ℝ)

UNIQUE 

Distinct100
Distinct (%)100.0%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean60384.87
Minimum32994
Maximum79194
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size1.0 KiB
2023-12-10T18:42:27.444943image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum32994
5-th percentile40343.95
Q149665.75
median62554.5
Q368486.25
95-th percentile78764.05
Maximum79194
Range46200
Interquartile range (IQR)18820.5

Descriptive statistics

Standard deviation12225.535
Coefficient of variation (CV)0.20246024
Kurtosis-1.0414018
Mean60384.87
Median Absolute Deviation (MAD)11338
Skewness-0.12448158
Sum6038487
Variance1.4946372 × 108
MonotonicityNot monotonic
2023-12-10T18:42:27.903981image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
32994 1
 
1.0%
66207 1
 
1.0%
68637 1
 
1.0%
68436 1
 
1.0%
68088 1
 
1.0%
67934 1
 
1.0%
67726 1
 
1.0%
67563 1
 
1.0%
67249 1
 
1.0%
67064 1
 
1.0%
Other values (90) 90
90.0%
ValueCountFrequency (%)
32994 1
1.0%
36998 1
1.0%
37435 1
1.0%
40041 1
1.0%
40267 1
1.0%
40348 1
1.0%
42451 1
1.0%
43459 1
1.0%
43723 1
1.0%
43827 1
1.0%
ValueCountFrequency (%)
79194 1
1.0%
78768 1
1.0%
78767 1
1.0%
78766 1
1.0%
78765 1
1.0%
78764 1
1.0%
78763 1
1.0%
78762 1
1.0%
78760 1
1.0%
78758 1
1.0%
Distinct88
Distinct (%)88.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
2023-12-10T18:42:28.537387image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length43
Median length31
Mean length23.34
Min length11

Characters and Unicode

Total characters2334
Distinct characters252
Distinct categories12 ?
Distinct scripts3 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique82 ?
Unique (%)82.0%

Sample

1st row[강원 강릉] 애니멀스토리
2nd row[충북 충주] 리쿼리움
3rd row[강원 강릉] 경포아쿠아리움
4th row[강원 강릉] 경포 아쿠아리움 10월
5th row[강원 강릉] 경포아쿠아리움 12월
ValueCountFrequency (%)
강원 52
 
11.0%
알파카월드 35
 
7.4%
홍천 27
 
5.7%
춘천 17
 
3.6%
제이드가든 14
 
3.0%
알파카와 14
 
3.0%
떠나는 14
 
3.0%
힐링여행 12
 
2.5%
11
 
2.3%
평창 10
 
2.1%
Other values (153) 265
56.3%
2023-12-10T18:42:29.488568image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
371
 
15.9%
[ 104
 
4.5%
] 104
 
4.5%
74
 
3.2%
71
 
3.0%
1 66
 
2.8%
65
 
2.8%
64
 
2.7%
63
 
2.7%
57
 
2.4%
Other values (242) 1295
55.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 1469
62.9%
Space Separator 371
 
15.9%
Decimal Number 139
 
6.0%
Open Punctuation 116
 
5.0%
Close Punctuation 116
 
5.0%
Other Punctuation 43
 
1.8%
Other Symbol 36
 
1.5%
Math Symbol 25
 
1.1%
Uppercase Letter 11
 
0.5%
Lowercase Letter 6
 
0.3%
Other values (2) 2
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
74
 
5.0%
71
 
4.8%
65
 
4.4%
64
 
4.4%
63
 
4.3%
57
 
3.9%
57
 
3.9%
54
 
3.7%
47
 
3.2%
44
 
3.0%
Other values (206) 873
59.4%
Decimal Number
ValueCountFrequency (%)
1 66
47.5%
2 27
19.4%
0 15
 
10.8%
9 9
 
6.5%
5 9
 
6.5%
3 7
 
5.0%
7 2
 
1.4%
8 2
 
1.4%
6 2
 
1.4%
Uppercase Letter
ValueCountFrequency (%)
X 5
45.5%
A 1
 
9.1%
S 1
 
9.1%
M 1
 
9.1%
P 1
 
9.1%
G 1
 
9.1%
K 1
 
9.1%
Lowercase Letter
ValueCountFrequency (%)
r 1
16.7%
x 1
16.7%
a 1
16.7%
f 1
16.7%
t 1
16.7%
e 1
16.7%
Other Punctuation
ValueCountFrequency (%)
/ 22
51.2%
, 19
44.2%
: 1
 
2.3%
& 1
 
2.3%
Open Punctuation
ValueCountFrequency (%)
[ 104
89.7%
( 12
 
10.3%
Close Punctuation
ValueCountFrequency (%)
] 104
89.7%
) 12
 
10.3%
Math Symbol
ValueCountFrequency (%)
+ 13
52.0%
~ 12
48.0%
Space Separator
ValueCountFrequency (%)
371
100.0%
Other Symbol
ValueCountFrequency (%)
36
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 1
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 1469
62.9%
Common 848
36.3%
Latin 17
 
0.7%

Most frequent character per script

Hangul
ValueCountFrequency (%)
74
 
5.0%
71
 
4.8%
65
 
4.4%
64
 
4.4%
63
 
4.3%
57
 
3.9%
57
 
3.9%
54
 
3.7%
47
 
3.2%
44
 
3.0%
Other values (206) 873
59.4%
Common
ValueCountFrequency (%)
371
43.8%
[ 104
 
12.3%
] 104
 
12.3%
1 66
 
7.8%
36
 
4.2%
2 27
 
3.2%
/ 22
 
2.6%
, 19
 
2.2%
0 15
 
1.8%
+ 13
 
1.5%
Other values (13) 71
 
8.4%
Latin
ValueCountFrequency (%)
X 5
29.4%
r 1
 
5.9%
x 1
 
5.9%
A 1
 
5.9%
S 1
 
5.9%
M 1
 
5.9%
a 1
 
5.9%
f 1
 
5.9%
t 1
 
5.9%
e 1
 
5.9%
Other values (3) 3
17.6%

Most occurring blocks

ValueCountFrequency (%)
Hangul 1469
62.9%
ASCII 829
35.5%
Misc Symbols 36
 
1.5%

Most frequent character per block

ASCII
ValueCountFrequency (%)
371
44.8%
[ 104
 
12.5%
] 104
 
12.5%
1 66
 
8.0%
2 27
 
3.3%
/ 22
 
2.7%
, 19
 
2.3%
0 15
 
1.8%
+ 13
 
1.6%
) 12
 
1.4%
Other values (25) 76
 
9.2%
Hangul
ValueCountFrequency (%)
74
 
5.0%
71
 
4.8%
65
 
4.4%
64
 
4.4%
63
 
4.3%
57
 
3.9%
57
 
3.9%
54
 
3.7%
47
 
3.2%
44
 
3.0%
Other values (206) 873
59.4%
Misc Symbols
ValueCountFrequency (%)
36
100.0%

themepark_fclty_addr
Categorical

HIGH CORRELATION 

Distinct26
Distinct (%)26.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
강원 홍천군 화촌면 풍천리 310
42 
강원 춘천시 남산면 서천리 산 111
11 
강원도 강릉시 사임당로 129
강원 홍천군 서면 한치골길 262
 
4
강원 평창군 대관령면 올림픽로 715
 
4
Other values (21)
30 

Length

Max length27
Median length24
Mean length18.28
Min length15

Unique

Unique14 ?
Unique (%)14.0%

Sample

1st row강원 강릉시 성산면 성연로 212-10
2nd row충북 충주시 중앙탑면 탑정안길 12
3rd row강원 강릉시 난설헌로 131
4th row강원 강릉시 난설헌로 131
5th row강원 강릉시 난설헌로 131

Common Values

ValueCountFrequency (%)
강원 홍천군 화촌면 풍천리 310 42
42.0%
강원 춘천시 남산면 서천리 산 111 11
 
11.0%
강원도 강릉시 사임당로 129 9
 
9.0%
강원 홍천군 서면 한치골길 262 4
 
4.0%
강원 평창군 대관령면 올림픽로 715 4
 
4.0%
강원 강릉시 난설헌로 131 3
 
3.0%
강원 홍천군 서면 두미리 624-1 3
 
3.0%
강원 춘천시 남산면 북한강변길 688 2
 
2.0%
강원 평창군 대관령면 경강로 5721 2
 
2.0%
강원 춘천시 남산면 햇골길 80 2
 
2.0%
Other values (16) 18
18.0%

Length

2023-12-10T18:42:29.807973image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
강원 85
17.1%
홍천군 49
 
9.9%
화촌면 42
 
8.5%
풍천리 42
 
8.5%
310 42
 
8.5%
춘천시 16
 
3.2%
남산면 16
 
3.2%
강릉시 16
 
3.2%
강원도 12
 
2.4%
서천리 11
 
2.2%
Other values (70) 166
33.4%

themepark_fclty_rnewl_de
Categorical

CONSTANT 

Distinct1
Distinct (%)1.0%
Missing0
Missing (%)0.0%
Memory size932.0 B
20211130
100 

Length

Max length8
Median length8
Mean length8
Min length8

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row20211130
2nd row20211130
3rd row20211130
4th row20211130
5th row20211130

Common Values

ValueCountFrequency (%)
20211130 100
100.0%

Length

2023-12-10T18:42:30.065944image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-10T18:42:30.255919image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
20211130 100
100.0%

Interactions

2023-12-10T18:42:25.608449image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-10T18:42:30.364057image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
area_nmthemepark_cdthemepark_fclty_nmthemepark_fclty_addr
area_nm1.0000.6231.0001.000
themepark_cd0.6231.0000.6430.779
themepark_fclty_nm1.0000.6431.0000.994
themepark_fclty_addr1.0000.7790.9941.000
2023-12-10T18:42:30.548163image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
area_nmthemepark_fclty_addr
area_nm1.0000.917
themepark_fclty_addr0.9171.000
2023-12-10T18:42:30.709662image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
themepark_cdarea_nmthemepark_fclty_addr
themepark_cd1.0000.3220.387
area_nm0.3221.0000.917
themepark_fclty_addr0.3870.9171.000

Missing values

2023-12-10T18:42:26.045295image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-10T18:42:26.463735image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

area_nmthemepark_cdthemepark_fclty_nmthemepark_fclty_addrthemepark_fclty_rnewl_de
0강원 강릉시32994[강원 강릉] 애니멀스토리강원 강릉시 성산면 성연로 212-1020211130
1충북 충주시42451[충북 충주] 리쿼리움충북 충주시 중앙탑면 탑정안길 1220211130
2강원 강릉시46657[강원 강릉] 경포아쿠아리움강원 강릉시 난설헌로 13120211130
3강원 강릉시46897[강원 강릉] 경포 아쿠아리움 10월강원 강릉시 난설헌로 13120211130
4강원 강릉시49723[강원 강릉] 경포아쿠아리움 12월강원 강릉시 난설헌로 13120211130
5강원 강릉시53220[야놀자X강원도] 강릉 애니멀스토리강원 강릉시 성산면 성연로 212-1020211130
6강원 고성군40267[강원 고성] 일성 사계절 눈썰매장강원 고성군 토성면 고성대로 47-2420211130
7충북 충주시48228[충북 충주] 탄금호 사계절 썰매장충북 충주시 중앙탑면 중앙탑길 4220211130
8강원 삼척시49494[강원 삼척] 추추파크 놀이시설 1종 이용권강원 삼척시 도계읍 심포남길 9920211130
9강원 정선군50082[강원 정선] 하이원리조트 스노우월드 오픈 기념 특가 (~3/1)강원 정선군 사북읍 하이원길 17520211130
area_nmthemepark_cdthemepark_fclty_nmthemepark_fclty_addrthemepark_fclty_rnewl_de
90강원도 강릉시78758[강원 태백] 강원투어패스 태백 1+1 (~12/15)강원도 강릉시 사임당로 12920211130
91강원도 강릉시78760[강원 양구] 강원투어패스 양구 1+1 (~12/15)강원도 강릉시 사임당로 12920211130
92강원도 강릉시78762[강원 평창] 강원투어패스 평창 1+1(~12/15)강원도 강릉시 사임당로 12920211130
93강원도 강릉시78763[강원 철원] 강원투어패스 철원 1+1(~12/15)강원도 강릉시 사임당로 12920211130
94강원도 강릉시78764[강원 양양] 강원투어패스 양양 1+1(~12/15)강원도 강릉시 사임당로 12920211130
95강원도 강릉시78765[강원 동해] 강원투어패스 동해1+1(~12/15)강원도 강릉시 사임당로 12920211130
96강원도 강릉시78766[강원 춘천] 강원투어패스 춘천1+1 (~12/15)강원도 강릉시 사임당로 12920211130
97강원도 강릉시78767[강원 영월] 강원투어패스 영월1+1(~12/15)강원도 강릉시 사임당로 12920211130
98강원도 강릉시78768[강원 고성] 강원투어패스 고성1+1(~12/15)강원도 강릉시 사임당로 12920211130
99강원도 속초시77395[속초] 얼라이브하트x다이나믹메이즈강원도 속초시 원암학사평길 8820211130