Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 399 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.3% |
Total size in memory | 9.5 KiB |
Average record size in memory | 24.3 B |
Variable types
Text | 2 |
---|---|
Categorical | 1 |
Dataset
Description | 충청남도 서산시 내 종교시설 데이터입니다. 항목명은 시설명, 주소, 종교구분으로 이루어져 있습니다. 문의사항은 041-660-2224로 문의주세요. |
---|---|
URL | https://www.data.go.kr/data/15117738/fileData.do |
Dataset has 1 (0.3%) duplicate rows | Duplicates |
종교구분 is highly imbalanced (57.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 06:10:26.660144 |
---|---|
Analysis finished | 2023-12-12 06:10:27.084504 |
Duration | 0.42 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
시설명
Text
Distinct | 390 |
---|---|
Distinct (%) | 97.7% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.2 KiB |
Length
Max length | 23 |
---|---|
Median length | 19 |
Mean length | 8.2406015 |
Min length | 2 |
Characters and Unicode
Total characters | 3288 |
---|---|
Distinct characters | 261 |
Distinct categories | 7 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 381 ? |
---|---|
Unique (%) | 95.5% |
Sample
1st row | 삼마기도원 |
---|---|
2nd row | 로뎀수양관 |
3rd row | 대한연합기도원 |
4th row | 대한기독교 하나님의 성회 임마누엘수양원 |
5th row | 예수교대한성결교회 서울반석교회 수양관 |
Value | Count | Frequency (%) |
기독교대한감리회 | 27 | 4.7% |
대한예수교장로회 | 22 | 3.9% |
기독교대한성결교회 | 21 | 3.7% |
교회 | 11 | 1.9% |
서산교회 | 9 | 1.6% |
예수교대한성결교회 | 6 | 1.1% |
서산 | 4 | 0.7% |
벧엘교회 | 3 | 0.5% |
임마누엘교회 | 3 | 0.5% |
사랑의 | 3 | 0.5% |
Other values (427) | 460 |
Most occurring characters
Value | Count | Frequency (%) |
교 | 463 | 14.1% |
회 | 411 | 12.5% |
172 | 5.2% | |
대 | 130 | 4.0% |
한 | 120 | 3.6% |
기 | 88 | 2.7% |
산 | 82 | 2.5% |
리 | 79 | 2.4% |
성 | 79 | 2.4% |
서 | 67 | 2.0% |
Other values (251) | 1597 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3078 | |
Space Separator | 172 | 5.2% |
Close Punctuation | 16 | 0.5% |
Open Punctuation | 16 | 0.5% |
Lowercase Letter | 4 | 0.1% |
Decimal Number | 1 | < 0.1% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
교 | 463 | 15.0% |
회 | 411 | 13.4% |
대 | 130 | 4.2% |
한 | 120 | 3.9% |
기 | 88 | 2.9% |
산 | 82 | 2.7% |
리 | 79 | 2.6% |
성 | 79 | 2.6% |
서 | 67 | 2.2% |
독 | 65 | 2.1% |
Other values (242) | 1494 |
Lowercase Letter
Value | Count | Frequency (%) |
t | 1 | |
u | 1 | |
r | 1 | |
c | 1 |
Space Separator
Value | Count | Frequency (%) |
172 |
Close Punctuation
Value | Count | Frequency (%) |
) | 16 |
Open Punctuation
Value | Count | Frequency (%) |
( | 16 |
Decimal Number
Value | Count | Frequency (%) |
7 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3078 | |
Common | 206 | 6.3% |
Latin | 4 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
교 | 463 | 15.0% |
회 | 411 | 13.4% |
대 | 130 | 4.2% |
한 | 120 | 3.9% |
기 | 88 | 2.9% |
산 | 82 | 2.7% |
리 | 79 | 2.6% |
성 | 79 | 2.6% |
서 | 67 | 2.2% |
독 | 65 | 2.1% |
Other values (242) | 1494 |
Common
Value | Count | Frequency (%) |
172 | ||
) | 16 | 7.8% |
( | 16 | 7.8% |
7 | 1 | 0.5% |
, | 1 | 0.5% |
Latin
Value | Count | Frequency (%) |
t | 1 | |
u | 1 | |
r | 1 | |
c | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3078 | |
ASCII | 210 | 6.4% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
교 | 463 | 15.0% |
회 | 411 | 13.4% |
대 | 130 | 4.2% |
한 | 120 | 3.9% |
기 | 88 | 2.9% |
산 | 82 | 2.7% |
리 | 79 | 2.6% |
성 | 79 | 2.6% |
서 | 67 | 2.2% |
독 | 65 | 2.1% |
Other values (242) | 1494 |
ASCII
Value | Count | Frequency (%) |
172 | ||
) | 16 | 7.6% |
( | 16 | 7.6% |
t | 1 | 0.5% |
u | 1 | 0.5% |
r | 1 | 0.5% |
7 | 1 | 0.5% |
c | 1 | 0.5% |
, | 1 | 0.5% |
주소
Text
Distinct | 393 |
---|---|
Distinct (%) | 98.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.2 KiB |
Length
Max length | 43 |
---|---|
Median length | 36 |
Mean length | 21.20802 |
Min length | 15 |
Characters and Unicode
Total characters | 8462 |
---|---|
Distinct characters | 205 |
Distinct categories | 7 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 387 ? |
---|---|
Unique (%) | 97.0% |
Sample
1st row | 충청남도 서산시 해미면 삼송장승길 38-96 |
---|---|
2nd row | 충청남도 서산시 해미면 산수1길 210 |
3rd row | 충청남도 서산시 해미면 반양2길 33-13 |
4th row | 충청남도 서산시 해미면 관터로 79-1 |
5th row | 충청남도 서산시 해미면 관터로 355 |
Value | Count | Frequency (%) |
충청남도 | 399 | |
서산시 | 399 | |
대산읍 | 36 | 1.9% |
해미면 | 36 | 1.9% |
음암면 | 33 | 1.7% |
운산면 | 33 | 1.7% |
부석면 | 26 | 1.4% |
인지면 | 24 | 1.3% |
팔봉면 | 22 | 1.2% |
고북면 | 21 | 1.1% |
Other values (627) | 876 |
Most occurring characters
Value | Count | Frequency (%) |
1543 | ||
산 | 519 | 6.1% |
도 | 416 | 4.9% |
서 | 415 | 4.9% |
남 | 414 | 4.9% |
충 | 407 | 4.8% |
시 | 403 | 4.8% |
청 | 401 | 4.7% |
1 | 394 | 4.7% |
면 | 226 | 2.7% |
Other values (195) | 3324 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 5180 | |
Space Separator | 1543 | 18.2% |
Decimal Number | 1478 | 17.5% |
Dash Punctuation | 173 | 2.0% |
Close Punctuation | 38 | 0.4% |
Open Punctuation | 38 | 0.4% |
Other Punctuation | 12 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
산 | 519 | 10.0% |
도 | 416 | 8.0% |
서 | 415 | 8.0% |
남 | 414 | 8.0% |
충 | 407 | 7.9% |
시 | 403 | 7.8% |
청 | 401 | 7.7% |
면 | 226 | 4.4% |
길 | 216 | 4.2% |
로 | 180 | 3.5% |
Other values (180) | 1583 |
Decimal Number
Value | Count | Frequency (%) |
1 | 394 | |
2 | 203 | |
3 | 161 | |
4 | 142 | 9.6% |
5 | 124 | 8.4% |
6 | 104 | 7.0% |
7 | 93 | 6.3% |
9 | 90 | 6.1% |
8 | 85 | 5.8% |
0 | 82 | 5.5% |
Space Separator
Value | Count | Frequency (%) |
1543 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 173 |
Close Punctuation
Value | Count | Frequency (%) |
) | 38 |
Open Punctuation
Value | Count | Frequency (%) |
( | 38 |
Other Punctuation
Value | Count | Frequency (%) |
, | 12 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 5180 | |
Common | 3282 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
산 | 519 | 10.0% |
도 | 416 | 8.0% |
서 | 415 | 8.0% |
남 | 414 | 8.0% |
충 | 407 | 7.9% |
시 | 403 | 7.8% |
청 | 401 | 7.7% |
면 | 226 | 4.4% |
길 | 216 | 4.2% |
로 | 180 | 3.5% |
Other values (180) | 1583 |
Common
Value | Count | Frequency (%) |
1543 | ||
1 | 394 | 12.0% |
2 | 203 | 6.2% |
- | 173 | 5.3% |
3 | 161 | 4.9% |
4 | 142 | 4.3% |
5 | 124 | 3.8% |
6 | 104 | 3.2% |
7 | 93 | 2.8% |
9 | 90 | 2.7% |
Other values (5) | 255 | 7.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 5180 | |
ASCII | 3282 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1543 | ||
1 | 394 | 12.0% |
2 | 203 | 6.2% |
- | 173 | 5.3% |
3 | 161 | 4.9% |
4 | 142 | 4.3% |
5 | 124 | 3.8% |
6 | 104 | 3.2% |
7 | 93 | 2.8% |
9 | 90 | 2.7% |
Other values (5) | 255 | 7.8% |
Hangul
Value | Count | Frequency (%) |
산 | 519 | 10.0% |
도 | 416 | 8.0% |
서 | 415 | 8.0% |
남 | 414 | 8.0% |
충 | 407 | 7.9% |
시 | 403 | 7.8% |
청 | 401 | 7.7% |
면 | 226 | 4.4% |
길 | 216 | 4.2% |
로 | 180 | 3.5% |
Other values (180) | 1583 |
종교구분
Categorical
IMBALANCE
 
Distinct | 6 |
---|---|
Distinct (%) | 1.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.2 KiB |
기독교 | |
---|---|
불교 | |
기도원 | 20 |
천주교 | 9 |
신천지 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.8446115 |
Min length | 2 |
Unique
Unique | 2 ? |
---|---|
Unique (%) | 0.5% |
Sample
1st row | 기도원 |
---|---|
2nd row | 기도원 |
3rd row | 기도원 |
4th row | 기도원 |
5th row | 기도원 |
Common Values
Value | Count | Frequency (%) |
기독교 | 306 | |
불교 | 62 | 15.5% |
기도원 | 20 | 5.0% |
천주교 | 9 | 2.3% |
신천지 | 1 | 0.3% |
이슬람 | 1 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
기독교 | 306 | |
불교 | 62 | 15.5% |
기도원 | 20 | 5.0% |
천주교 | 9 | 2.3% |
신천지 | 1 | 0.3% |
이슬람 | 1 | 0.3% |
시설명 | 주소 | 종교구분 | |
---|---|---|---|
0 | 삼마기도원 | 충청남도 서산시 해미면 삼송장승길 38-96 | 기도원 |
1 | 로뎀수양관 | 충청남도 서산시 해미면 산수1길 210 | 기도원 |
2 | 대한연합기도원 | 충청남도 서산시 해미면 반양2길 33-13 | 기도원 |
3 | 대한기독교 하나님의 성회 임마누엘수양원 | 충청남도 서산시 해미면 관터로 79-1 | 기도원 |
4 | 예수교대한성결교회 서울반석교회 수양관 | 충청남도 서산시 해미면 관터로 355 | 기도원 |
5 | 임마누엘기도원 | 충청남도 서산시 팔봉면 흑석중앙길 40-49 | 기도원 |
6 | 한영장로교회수양관 | 충청남도 서산시 팔봉면 범머리길 507 | 기도원 |
7 | 라마나욧 기도원(예람교회) | 충청남도 서산시 음암면 충청남도 서산시 음암면 황금터길 172-13 | 기도원 |
8 | 예수피난처기도원 | 충청남도 서산시 운산면 해운로 1191 | 기도원 |
9 | 엘림하우스 | 충청남도 서산시 운산면 장생동로 181-54 | 기도원 |
시설명 | 주소 | 종교구분 | |
---|---|---|---|
389 | 이슬람 예배당 | 충청남도 서산시 시장4길 16 2층 | 이슬람 |
390 | 천주교해미성지 | 충청남도 서산시 해미면 성지1로 13 | 천주교 |
391 | 천주교 대전교구 해미성당 | 충청남도 서산시 해미면 남문5로 30-10 | 천주교 |
392 | 석림성당 | 충청남도 서산시 중앙로 210 | 천주교 |
393 | 운산성당 | 충청남도 서산시 운산면 해운로 1125 | 천주교 |
394 | 천주교 대전교구 서산동문교회 | 충청남도 서산시 서령로 53 | 천주교 |
395 | 천주교서산예천동성당 | 충청남도 서산시 무학로 1864-8 | 천주교 |
396 | 대산성당 | 충청남도 서산시 대산읍 충의로 1882-5 | 천주교 |
397 | 천주교 대전교구 성연성당 | 충청남도 서산시 성연면 명천1길 119-3 | 천주교 |
398 | 용성대성당 | 충청남도 서산시 고북면 신성로 330(공군부대내) | 천주교 |
Most frequently occurring
시설명 | 주소 | 종교구분 | # duplicates | |
---|---|---|---|---|
0 | 재림예수교 서산교회 | 충청남도 서산시 주을2길 24 | 기독교 | 2 |