Overview

Dataset statistics

Number of variables1
Number of observations429
Missing cells0
Missing cells (%)0.0%
Duplicate rows10
Duplicate rows (%)2.3%
Total size in memory3.5 KiB
Average record size in memory8.3 B

Variable types

Text1

Dataset

Description서울특별시 강남구에 위치한 400여개 의료기관에 대한 기관명 데이터를 제공합니다.(아랍어) 자세한 사항은 서울특별시 강남구 관관진흥과로 문의하여 주시기 바랍니다.
Author서울특별시 강남구
URLhttps://www.data.go.kr/data/15072589/fileData.do

Alerts

Dataset has 10 (2.3%) duplicate rowsDuplicates

Reproduction

Analysis started2023-12-12 23:15:09.787595
Analysis finished2023-12-12 23:15:09.936624
Duration0.15 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct412
Distinct (%)96.0%
Missing0
Missing (%)0.0%
Memory size3.5 KiB
2023-12-13T08:15:10.048127image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length56
Median length39
Mean length22.417249
Min length3

Characters and Unicode

Total characters9617
Distinct characters110
Distinct categories9 ?
Distinct scripts4 ?
Distinct blocks3 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique402 ?
Unique (%)93.7%

Sample

1st rowتاكو لجراحة التجميل
2nd rowمركز برايت سانت ماري للعيون
3rd rowعيادة هيونداي للتجميل لجراحة التجميل
4th rowجراحة تجميل الوجه
5th rowعيادة جراحة الثدي
ValueCountFrequency (%)
عيادة 186
 
11.8%
التجميل 94
 
6.0%
جراحة 68
 
4.3%
لجراحة 46
 
2.9%
مستشفى 39
 
2.5%
التجميلية 31
 
2.0%
لطب 26
 
1.7%
مركز 25
 
1.6%
الجلدية 23
 
1.5%
سيول 23
 
1.5%
Other values (601) 1010
64.3%
2023-12-13T08:15:10.404129image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1142
 
11.9%
ا 1130
 
11.8%
ل 948
 
9.9%
ي 844
 
8.8%
ج 491
 
5.1%
ة 461
 
4.8%
ن 425
 
4.4%
م 396
 
4.1%
و 374
 
3.9%
ر 358
 
3.7%
Other values (100) 3048
31.7%

Most occurring categories

ValueCountFrequency (%)
Other Letter 7714
80.2%
Space Separator 1142
 
11.9%
Lowercase Letter 395
 
4.1%
Uppercase Letter 313
 
3.3%
Decimal Number 18
 
0.2%
Other Punctuation 17
 
0.2%
Open Punctuation 7
 
0.1%
Close Punctuation 7
 
0.1%
Dash Punctuation 4
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
ا 1130
14.6%
ل 948
12.3%
ي 844
10.9%
ج 491
 
6.4%
ة 461
 
6.0%
ن 425
 
5.5%
م 396
 
5.1%
و 374
 
4.8%
ر 358
 
4.6%
د 333
 
4.3%
Other values (33) 1954
25.3%
Uppercase Letter
ValueCountFrequency (%)
A 27
 
8.6%
I 22
 
7.0%
O 20
 
6.4%
C 19
 
6.1%
J 17
 
5.4%
S 17
 
5.4%
E 17
 
5.4%
G 16
 
5.1%
U 16
 
5.1%
N 14
 
4.5%
Other values (16) 128
40.9%
Lowercase Letter
ValueCountFrequency (%)
e 58
14.7%
n 48
12.2%
o 38
9.6%
a 34
8.6%
i 32
 
8.1%
l 24
 
6.1%
u 24
 
6.1%
g 22
 
5.6%
r 18
 
4.6%
d 15
 
3.8%
Other values (14) 82
20.8%
Decimal Number
ValueCountFrequency (%)
1 3
16.7%
2 3
16.7%
0 2
11.1%
6 2
11.1%
8 2
11.1%
3 2
11.1%
9 2
11.1%
7 1
 
5.6%
5 1
 
5.6%
Other Punctuation
ValueCountFrequency (%)
، 6
35.3%
. 5
29.4%
& 5
29.4%
/ 1
 
5.9%
Space Separator
ValueCountFrequency (%)
1142
100.0%
Open Punctuation
ValueCountFrequency (%)
( 7
100.0%
Close Punctuation
ValueCountFrequency (%)
) 7
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 4
100.0%

Most occurring scripts

ValueCountFrequency (%)
Arabic 7707
80.1%
Common 1195
 
12.4%
Latin 708
 
7.4%
Hangul 7
 
0.1%

Most frequent character per script

Latin
ValueCountFrequency (%)
e 58
 
8.2%
n 48
 
6.8%
o 38
 
5.4%
a 34
 
4.8%
i 32
 
4.5%
A 27
 
3.8%
l 24
 
3.4%
u 24
 
3.4%
I 22
 
3.1%
g 22
 
3.1%
Other values (40) 379
53.5%
Arabic
ValueCountFrequency (%)
ا 1130
14.7%
ل 948
12.3%
ي 844
11.0%
ج 491
 
6.4%
ة 461
 
6.0%
ن 425
 
5.5%
م 396
 
5.1%
و 374
 
4.9%
ر 358
 
4.6%
د 333
 
4.3%
Other values (26) 1947
25.3%
Common
ValueCountFrequency (%)
1142
95.6%
( 7
 
0.6%
) 7
 
0.6%
، 6
 
0.5%
. 5
 
0.4%
& 5
 
0.4%
- 4
 
0.3%
1 3
 
0.3%
2 3
 
0.3%
0 2
 
0.2%
Other values (7) 11
 
0.9%
Hangul
ValueCountFrequency (%)
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%

Most occurring blocks

ValueCountFrequency (%)
Arabic 7713
80.2%
ASCII 1897
 
19.7%
Hangul 7
 
0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1142
60.2%
e 58
 
3.1%
n 48
 
2.5%
o 38
 
2.0%
a 34
 
1.8%
i 32
 
1.7%
A 27
 
1.4%
l 24
 
1.3%
u 24
 
1.3%
I 22
 
1.2%
Other values (56) 448
 
23.6%
Arabic
ValueCountFrequency (%)
ا 1130
14.7%
ل 948
12.3%
ي 844
10.9%
ج 491
 
6.4%
ة 461
 
6.0%
ن 425
 
5.5%
م 396
 
5.1%
و 374
 
4.8%
ر 358
 
4.6%
د 333
 
4.3%
Other values (27) 1953
25.3%
Hangul
ValueCountFrequency (%)
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%
1
14.3%

Missing values

2023-12-13T08:15:09.873258image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T08:15:09.917365image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

의료기관
0تاكو لجراحة التجميل
1مركز برايت سانت ماري للعيون
2عيادة هيونداي للتجميل لجراحة التجميل
3جراحة تجميل الوجه
4عيادة جراحة الثدي
5جراحة البانتنج البلاستيكية
6الجراحة التجميلية الأولى
7أوبرا لجراحة التجميل
8عيادة الأسنان SOJOONG
9للحصول على جراحة التجميل
의료기관
419الجبين
420فندق جانجنام فاميلي
421فندق جراموس
422فندق المصممين
423فندق TRIA
424بست ويسترن بريمير جانجنام
425نوفوتيل سيول أمباسادور جانجنام
426ريتز كارلتون سيول
427فندق JBIS
428مركز Oakwood Premier Coex

Duplicate rows

Most frequently occurring

의료기관# duplicates
1جانجنام سيفيرانس هوسيبيتال6
8مركز سامسونج سيول الطبي5
0اقتراح جراحة التجميل2
2جراحة التجميل JJ2
3جراحة تجميل الوجه2
4جراحة لافيان التجميلية2
5جلوفي لجراحة التجميل2
6عيادة ريبيلو2
7مركز CHA Gangnam الطبي ، جامعة CHA2
9مستشفى سو لطب الاسنان2