gimi9 Pandas Profiling

Dataset statistics

Number of variables	3
Number of observations	80
Missing cells	0
Missing cells (%)	0.0%
Duplicate rows	0
Duplicate rows (%)	0.0%
Total size in memory	2.1 KiB
Average record size in memory	26.6 B

Variable types

Numeric	1
Text	2

Dataset

Description	서울특별시 용산구 헬스장 현황에 대한 데이터로 연번, 헬스장 상호명, 헬스장 소재지(지번)에 대한 데이터 항목을 제공합니다.
URL	https://www.data.go.kr/data/15074334/fileData.do

Alerts

`연번` has unique values	Unique
`상호명` has unique values	Unique

Reproduction

Analysis started	2023-12-11 23:15:47.439330
Analysis finished	2023-12-11 23:15:47.894509
Duration	0.46 seconds
Software version	ydata-profiling vv4.5.1
Download configuration	config.json

연번
Real number (ℝ)

UNIQUE

Distinct	80
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Infinite	0
Infinite (%)	0.0%
Mean	40.5

Minimum	1
Maximum	80
Zeros	0
Zeros (%)	0.0%
Negative	0
Negative (%)	0.0%
Memory size	852.0 B

Quantile statistics

Minimum	1
5-th percentile	4.95
Q1	20.75
median	40.5
Q3	60.25
95-th percentile	76.05
Maximum	80
Range	79
Interquartile range (IQR)	39.5

Descriptive statistics

Standard deviation	23.2379
Coefficient of variation (CV)	0.57377531
Kurtosis	-1.2
Mean	40.5
Median Absolute Deviation (MAD)	20
Skewness	0
Sum	3240
Variance	540
Monotonicity	Strictly increasing

Histogram with fixed size bins (bins=50)

Value	Count	Frequency (%)
1	1	1.2%
42	1	1.2%
60	1	1.2%
59	1	1.2%
58	1	1.2%
57	1	1.2%
56	1	1.2%
55	1	1.2%
54	1	1.2%
53	1	1.2%
Other values (70)	70	87.5%

Minimum 10 values
Maximum 10 values

Value	Count	Frequency (%)
1	1	1.2%
2	1	1.2%
3	1	1.2%
4	1	1.2%
5	1	1.2%
6	1	1.2%
7	1	1.2%
8	1	1.2%
9	1	1.2%
10	1	1.2%

Value	Count	Frequency (%)
80	1	1.2%
79	1	1.2%
78	1	1.2%
77	1	1.2%
76	1	1.2%
75	1	1.2%
74	1	1.2%
73	1	1.2%
72	1	1.2%
71	1	1.2%

상호명
Text

UNIQUE

Distinct	80
Distinct (%)	100.0%
Missing	0
Missing (%)	0.0%
Memory size	772.0 B

Length

Max length	38
Median length	13
Mean length	7.8375
Min length	2

Characters and Unicode

Total characters	627
Distinct characters	176
Distinct categories	8 ?
Distinct scripts	3 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	80 ?
Unique (%)	100.0%

Sample

1st row	우노 휘트니스클럽
2nd row	AK운동맞춤센터
3rd row	웰니스짐
4th row	동국스포츠
5th row	리콥 웰니스센터

Value	Count	Frequency (%)
fit	3	2.3%
한남	3	2.3%
웰니스	3	2.3%
스튜디오	3	2.3%
크로스핏	2	1.5%
휘트니스클럽	2	1.5%
리콥	2	1.5%
스포짐	2	1.5%
트레이닝	2	1.5%
짐나우	2	1.5%
Other values (104)	106	81.5%

Most occurring characters

Value	Count	Frequency (%)
	50	8.0%
스	47	7.5%
이	23	3.7%
트	23	3.7%
짐	23	3.7%
니	15	2.4%
레	12	1.9%
닝	10	1.6%
휘	9	1.4%
t	9	1.4%
Other values (166)	406	64.8%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	419	66.8%
Uppercase Letter	77	12.3%
Lowercase Letter	63	10.0%
Space Separator	50	8.0%
Decimal Number	6	1.0%
Open Punctuation	5	0.8%
Close Punctuation	5	0.8%
Other Punctuation	2	0.3%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
스	47	11.2%
이	23	5.5%
트	23	5.5%
짐	23	5.5%
니	15	3.6%
레	12	2.9%
닝	10	2.4%
휘	9	2.1%
핏	8	1.9%
널	7	1.7%
Other values (118)	242	57.8%

Uppercase Letter

Value	Count	Frequency (%)
E	8	10.4%
M	7	9.1%
F	6	7.8%
N	6	7.8%
C	5	6.5%
T	5	6.5%
S	4	5.2%
G	4	5.2%
I	3	3.9%
A	3	3.9%
Other values (13)	26	33.8%

Lowercase Letter

Value	Count	Frequency (%)
t	9	14.3%
n	9	14.3%
i	7	11.1%
a	6	9.5%
e	5	7.9%
l	5	7.9%
o	5	7.9%
u	5	7.9%
s	4	6.3%
r	2	3.2%
Other values (6)	6	9.5%

Decimal Number

Value	Count	Frequency (%)
4	2	33.3%
1	2	33.3%
5	1	16.7%
2	1	16.7%

Other Punctuation

Value	Count	Frequency (%)
'	1	50.0%
&	1	50.0%

Space Separator

Value	Count	Frequency (%)
	50	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	5	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	5	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	419	66.8%
Latin	140	22.3%
Common	68	10.8%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
스	47	11.2%
이	23	5.5%
트	23	5.5%
짐	23	5.5%
니	15	3.6%
레	12	2.9%
닝	10	2.4%
휘	9	2.1%
핏	8	1.9%
널	7	1.7%
Other values (118)	242	57.8%

Latin

Value	Count	Frequency (%)
t	9	6.4%
n	9	6.4%
E	8	5.7%
i	7	5.0%
M	7	5.0%
a	6	4.3%
F	6	4.3%
N	6	4.3%
e	5	3.6%
l	5	3.6%
Other values (29)	72	51.4%

Common

Value	Count	Frequency (%)
	50	73.5%
(	5	7.4%
)	5	7.4%
4	2	2.9%
1	2	2.9%
5	1	1.5%
'	1	1.5%
2	1	1.5%
&	1	1.5%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	419	66.8%
ASCII	208	33.2%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	50	24.0%
t	9	4.3%
n	9	4.3%
E	8	3.8%
i	7	3.4%
M	7	3.4%
a	6	2.9%
F	6	2.9%
N	6	2.9%
e	5	2.4%
Other values (38)	95	45.7%

Hangul

Value	Count	Frequency (%)
스	47	11.2%
이	23	5.5%
트	23	5.5%
짐	23	5.5%
니	15	3.6%
레	12	2.9%
닝	10	2.4%
휘	9	2.1%
핏	8	1.9%
널	7	1.7%
Other values (118)	242	57.8%

소재지(지번)
Text

Distinct	77
Distinct (%)	96.2%
Missing	0
Missing (%)	0.0%
Memory size	772.0 B

Length

Max length	37
Median length	31
Mean length	24.7
Min length	17

Characters and Unicode

Total characters	1976
Distinct characters	122
Distinct categories	8 ?
Distinct scripts	3 ?
Distinct blocks	2 ?

The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique	75 ?
Unique (%)	93.8%

Sample

1st row	서울특별시 용산구 보광동 260-8 지상3층
2nd row	서울특별시 용산구 용산동2가 23
3rd row	서울특별시 용산구 이태원동 226-3 지하1층
4th row	서울특별시 용산구 원효로4가 142-1 2.3층
5th row	서울특별시 용산구 한남동 657-201

Value	Count	Frequency (%)
서울특별시	80	20.8%
용산구	80	20.8%
한남동	26	6.8%
이태원동	8	2.1%
이촌동	7	1.8%
지하1층	6	1.6%
한강로3가	6	1.6%
원효로1가	5	1.3%
4층	5	1.3%
남영동	5	1.3%
Other values (134)	157	40.8%

Most occurring characters

Value	Count	Frequency (%)
	380	19.2%
1	91	4.6%
용	87	4.4%
산	86	4.4%
서	83	4.2%
시	83	4.2%
울	81	4.1%
구	80	4.0%
별	80	4.0%
특	80	4.0%
Other values (112)	845	42.8%

Most occurring categories

Value	Count	Frequency (%)
Other Letter	1107	56.0%
Decimal Number	393	19.9%
Space Separator	380	19.2%
Dash Punctuation	73	3.7%
Uppercase Letter	14	0.7%
Other Punctuation	5	0.3%
Close Punctuation	2	0.1%
Open Punctuation	2	0.1%

Most frequent character per category

Other Letter

Value	Count	Frequency (%)
용	87	7.9%
산	86	7.8%
서	83	7.5%
시	83	7.5%
울	81	7.3%
구	80	7.2%
별	80	7.2%
특	80	7.2%
동	72	6.5%
한	37	3.3%
Other values (85)	338	30.5%

Decimal Number

Value	Count	Frequency (%)
1	91	23.2%
3	58	14.8%
2	51	13.0%
0	43	10.9%
4	36	9.2%
6	35	8.9%
7	28	7.1%
5	22	5.6%
8	18	4.6%
9	11	2.8%

Uppercase Letter

Value	Count	Frequency (%)
I	3	21.4%
B	2	14.3%
G	2	14.3%
A	1	7.1%
V	1	7.1%
S	1	7.1%
L	1	7.1%
T	1	7.1%
H	1	7.1%
E	1	7.1%

Other Punctuation

Value	Count	Frequency (%)
.	2	40.0%
,	2	40.0%
:	1	20.0%

Space Separator

Value	Count	Frequency (%)
	380	100.0%

Dash Punctuation

Value	Count	Frequency (%)
-	73	100.0%

Close Punctuation

Value	Count	Frequency (%)
)	2	100.0%

Open Punctuation

Value	Count	Frequency (%)
(	2	100.0%

Most occurring scripts

Value	Count	Frequency (%)
Hangul	1107	56.0%
Common	855	43.3%
Latin	14	0.7%

Most frequent character per script

Hangul

Value	Count	Frequency (%)
용	87	7.9%
산	86	7.8%
서	83	7.5%
시	83	7.5%
울	81	7.3%
구	80	7.2%
별	80	7.2%
특	80	7.2%
동	72	6.5%
한	37	3.3%
Other values (85)	338	30.5%

Common

Value	Count	Frequency (%)
	380	44.4%
1	91	10.6%
-	73	8.5%
3	58	6.8%
2	51	6.0%
0	43	5.0%
4	36	4.2%
6	35	4.1%
7	28	3.3%
5	22	2.6%
Other values (7)	38	4.4%

Latin

Value	Count	Frequency (%)
I	3	21.4%
B	2	14.3%
G	2	14.3%
A	1	7.1%
V	1	7.1%
S	1	7.1%
L	1	7.1%
T	1	7.1%
H	1	7.1%
E	1	7.1%

Most occurring blocks

Value	Count	Frequency (%)
Hangul	1107	56.0%
ASCII	869	44.0%

Most frequent character per block

ASCII

Value	Count	Frequency (%)
	380	43.7%
1	91	10.5%
-	73	8.4%
3	58	6.7%
2	51	5.9%
0	43	4.9%
4	36	4.1%
6	35	4.0%
7	28	3.2%
5	22	2.5%
Other values (17)	52	6.0%

Hangul

Value	Count	Frequency (%)
용	87	7.9%
산	86	7.8%
서	83	7.5%
시	83	7.5%
울	81	7.3%
구	80	7.2%
별	80	7.2%
특	80	7.2%
동	72	6.5%
한	37	3.3%
Other values (85)	338	30.5%

연번

연번

Phik (φk)

Heatmap
Table

	연번	상호명	소재지(지번)
연번	1.000	1.000	0.983
상호명	1.000	1.000	1.000
소재지(지번)	0.983	1.000	1.000

Count
Matrix

A simple visualization of nullity by column.

Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

First rows
Last rows

	연번	상호명	소재지(지번)
0	1	우노 휘트니스클럽	서울특별시 용산구 보광동 260-8 지상3층
1	2	AK운동맞춤센터	서울특별시 용산구 용산동2가 23
2	3	웰니스짐	서울특별시 용산구 이태원동 226-3 지하1층
3	4	동국스포츠	서울특별시 용산구 원효로4가 142-1 2.3층
4	5	리콥 웰니스센터	서울특별시 용산구 한남동 657-201
5	6	J헬스클럽	서울특별시 용산구 한남동 631-5 4층
6	7	스카이 휘트니스클럽	서울특별시 용산구 남영동 127-1 2층,3층
7	8	해밀톤 휘트니스센터	서울특별시 용산구 이태원동 116-1 지하2층
8	9	드래곤힐스파휘트니스클럽	서울특별시 용산구 한강로3가 40-713 4층
9	10	원짐	서울특별시 용산구 한강로3가 16-85 GS한강에클라트

	연번	상호명	소재지(지번)
70	71	이태원짐	서울특별시 용산구 이태원동 183-1 동호프라자.외환은행
71	72	식스에이엠	서울특별시 용산구 한남동 794-7 B1호
72	73	원(1)GYM	서울특별시 용산구 한강로3가 16-85 지에스 한강에클라트 104호
73	74	크로스핏 남산	서울특별시 용산구 남영동 114-15 17-17
74	75	바른핏	서울특별시 용산구 원효로1가 133-3 리첸시아 용산 A동 210호
75	76	텐세그리티	서울특별시 용산구 후암동 358-17 대원정사 본관 201호
76	77	MCT GYM 용산	서울특별시 용산구 청파동3가 80-6 지층 B01호
77	78	드래곤짐	서울특별시 용산구 한남동 107-4
78	79	상떼(Sante')	서울특별시 용산구 이촌동 302-81
79	80	스카이짐 GDR골프아카데미 헬스	서울특별시 용산구 갈월동 92 용산빌딩

Overview

Variables

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Uppercase Letter

Lowercase Letter

Decimal Number

Other Punctuation

Space Separator

Open Punctuation

Close Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Latin

Common

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Most occurring characters

Most occurring categories

Most frequent character per category

Other Letter

Decimal Number

Uppercase Letter

Other Punctuation

Space Separator

Dash Punctuation

Close Punctuation

Open Punctuation

Most occurring scripts

Most frequent character per script

Hangul

Common

Latin

Most occurring blocks

Most frequent character per block

ASCII

Hangul

Interactions

Correlations

Missing values

Sample