Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 91 |
Missing cells | 3 |
Missing cells (%) | 0.5% |
Duplicate rows | 6 |
Duplicate rows (%) | 6.6% |
Total size in memory | 4.4 KiB |
Average record size in memory | 49.5 B |
Variable types
Text | 3 |
---|---|
Categorical | 3 |
Dataset
Description | 석면 조사 대상 건축물 자료(건물명, 동면, 주소, 구분, 소유자) |
---|---|
Author | 강원도 영월군 |
URL | https://www.data.go.kr/data/15053446/fileData.do |
Dataset has 6 (6.6%) duplicate rows | Duplicates |
소유자 is highly overall correlated with 구분(대분류) | High correlation |
구분(소분류) is highly overall correlated with 구분(대분류) | High correlation |
구분(대분류) is highly overall correlated with 구분(소분류) and 1 other fields | High correlation |
구분(대분류) is highly imbalanced (91.3%) | Imbalance |
건물명 has 1 (1.1%) missing values | Missing |
동명 has 1 (1.1%) missing values | Missing |
주소 has 1 (1.1%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 16:35:41.651049 |
---|---|
Analysis finished | 2023-12-12 16:35:42.571339 |
Duration | 0.92 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
건물명
Text
MISSING
 
Distinct | 63 |
---|---|
Distinct (%) | 70.0% |
Missing | 1 |
Missing (%) | 1.1% |
Memory size | 860.0 B |
Value | Count | Frequency (%) |
영월군 | 13 | 11.5% |
영월교도소 | 10 | 8.8% |
한국남부발전 | 10 | 8.8% |
영월군청 | 3 | 2.7% |
서남농업협동조합 | 3 | 2.7% |
농기계연수동 | 2 | 1.8% |
한국전력공사 | 2 | 1.8% |
환경시설관리사업소 | 2 | 1.8% |
영월교육지원청 | 2 | 1.8% |
농업기술센터 | 2 | 1.8% |
Other values (62) | 64 |
Most occurring characters
Value | Count | Frequency (%) |
영 | 50 | 7.1% |
월 | 50 | 7.1% |
소 | 27 | 3.8% |
24 | 3.4% | |
관 | 22 | 3.1% |
군 | 21 | 3.0% |
사 | 19 | 2.7% |
국 | 18 | 2.6% |
지 | 18 | 2.6% |
도 | 17 | 2.4% |
Other values (124) | 437 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 667 | |
Space Separator | 24 | 3.4% |
Close Punctuation | 4 | 0.6% |
Open Punctuation | 4 | 0.6% |
Connector Punctuation | 2 | 0.3% |
Dash Punctuation | 2 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
영 | 50 | 7.5% |
월 | 50 | 7.5% |
소 | 27 | 4.0% |
관 | 22 | 3.3% |
군 | 21 | 3.1% |
사 | 19 | 2.8% |
국 | 18 | 2.7% |
지 | 18 | 2.7% |
도 | 17 | 2.5% |
동 | 17 | 2.5% |
Other values (119) | 408 |
Space Separator
Value | Count | Frequency (%) |
24 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 667 | |
Common | 36 | 5.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
영 | 50 | 7.5% |
월 | 50 | 7.5% |
소 | 27 | 4.0% |
관 | 22 | 3.3% |
군 | 21 | 3.1% |
사 | 19 | 2.8% |
국 | 18 | 2.7% |
지 | 18 | 2.7% |
도 | 17 | 2.5% |
동 | 17 | 2.5% |
Other values (119) | 408 |
Common
Value | Count | Frequency (%) |
24 | ||
) | 4 | 11.1% |
( | 4 | 11.1% |
_ | 2 | 5.6% |
- | 2 | 5.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 667 | |
ASCII | 36 | 5.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
영 | 50 | 7.5% |
월 | 50 | 7.5% |
소 | 27 | 4.0% |
관 | 22 | 3.3% |
군 | 21 | 3.1% |
사 | 19 | 2.8% |
국 | 18 | 2.7% |
지 | 18 | 2.7% |
도 | 17 | 2.5% |
동 | 17 | 2.5% |
Other values (119) | 408 |
ASCII
Value | Count | Frequency (%) |
24 | ||
) | 4 | 11.1% |
( | 4 | 11.1% |
_ | 2 | 5.6% |
- | 2 | 5.6% |
동명
Text
MISSING
 
Distinct | 63 |
---|---|
Distinct (%) | 70.0% |
Missing | 1 |
Missing (%) | 1.1% |
Memory size | 860.0 B |
Value | Count | Frequency (%) |
영월군 | 14 | 12.4% |
영월교도소 | 10 | 8.8% |
한국남부발전 | 10 | 8.8% |
영월군청 | 3 | 2.7% |
서남농업협동조합 | 3 | 2.7% |
농기계연수동 | 2 | 1.8% |
환경시설관리사업소 | 2 | 1.8% |
영월교육지원청 | 2 | 1.8% |
한국전력공사 | 2 | 1.8% |
농업기술센터 | 2 | 1.8% |
Other values (61) | 63 |
Most occurring characters
Value | Count | Frequency (%) |
영 | 51 | 7.3% |
월 | 51 | 7.3% |
소 | 27 | 3.9% |
24 | 3.4% | |
군 | 22 | 3.1% |
관 | 21 | 3.0% |
사 | 20 | 2.9% |
지 | 18 | 2.6% |
국 | 18 | 2.6% |
도 | 17 | 2.4% |
Other values (121) | 430 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 663 | |
Space Separator | 24 | 3.4% |
Open Punctuation | 4 | 0.6% |
Close Punctuation | 4 | 0.6% |
Connector Punctuation | 2 | 0.3% |
Dash Punctuation | 2 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
영 | 51 | 7.7% |
월 | 51 | 7.7% |
소 | 27 | 4.1% |
군 | 22 | 3.3% |
관 | 21 | 3.2% |
사 | 20 | 3.0% |
지 | 18 | 2.7% |
국 | 18 | 2.7% |
도 | 17 | 2.6% |
동 | 17 | 2.6% |
Other values (116) | 401 |
Space Separator
Value | Count | Frequency (%) |
24 |
Open Punctuation
Value | Count | Frequency (%) |
( | 4 |
Close Punctuation
Value | Count | Frequency (%) |
) | 4 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 2 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 663 | |
Common | 36 | 5.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
영 | 51 | 7.7% |
월 | 51 | 7.7% |
소 | 27 | 4.1% |
군 | 22 | 3.3% |
관 | 21 | 3.2% |
사 | 20 | 3.0% |
지 | 18 | 2.7% |
국 | 18 | 2.7% |
도 | 17 | 2.6% |
동 | 17 | 2.6% |
Other values (116) | 401 |
Common
Value | Count | Frequency (%) |
24 | ||
( | 4 | 11.1% |
) | 4 | 11.1% |
_ | 2 | 5.6% |
- | 2 | 5.6% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 663 | |
ASCII | 36 | 5.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
영 | 51 | 7.7% |
월 | 51 | 7.7% |
소 | 27 | 4.1% |
군 | 22 | 3.3% |
관 | 21 | 3.2% |
사 | 20 | 3.0% |
지 | 18 | 2.7% |
국 | 18 | 2.7% |
도 | 17 | 2.6% |
동 | 17 | 2.6% |
Other values (116) | 401 |
ASCII
Value | Count | Frequency (%) |
24 | ||
( | 4 | 11.1% |
) | 4 | 11.1% |
_ | 2 | 5.6% |
- | 2 | 5.6% |
주소
Text
MISSING
 
Distinct | 57 |
---|---|
Distinct (%) | 63.3% |
Missing | 1 |
Missing (%) | 1.1% |
Memory size | 860.0 B |
Length
Max length | 25 |
---|---|
Median length | 24 |
Mean length | 21.577778 |
Min length | 19 |
Characters and Unicode
Total characters | 1942 |
---|---|
Distinct characters | 80 |
Distinct categories | 4 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 43 ? |
---|---|
Unique (%) | 47.8% |
Sample
1st row | 강원도 영월군 영월읍 하송로 46-43 |
---|---|
2nd row | 강원도 영월군 영월읍 단종로 47-4 |
3rd row | 강원도 영월군 영월읍 단종로 47-4 |
4th row | 강원도 영월군 영월읍 단종로 9-0 |
5th row | 강원도 영월군 김삿갓면 영월동로 1644-0 |
Value | Count | Frequency (%) |
강원도 | 90 | |
영월군 | 90 | |
영월읍 | 60 | |
중앙로 | 13 | 2.9% |
273-0 | 10 | 2.2% |
팔괴로 | 10 | 2.2% |
110-27 | 10 | 2.2% |
주천면 | 7 | 1.6% |
영월로 | 7 | 1.6% |
단종로 | 7 | 1.6% |
Other values (90) | 146 |
Most occurring characters
Value | Count | Frequency (%) |
360 | ||
영 | 161 | 8.3% |
월 | 161 | 8.3% |
도 | 95 | 4.9% |
강 | 92 | 4.7% |
군 | 90 | 4.6% |
원 | 90 | 4.6% |
- | 90 | 4.6% |
0 | 88 | 4.5% |
로 | 69 | 3.6% |
Other values (70) | 646 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1129 | |
Decimal Number | 363 | 18.7% |
Space Separator | 360 | 18.5% |
Dash Punctuation | 90 | 4.6% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
영 | 161 | |
월 | 161 | |
도 | 95 | 8.4% |
강 | 92 | 8.1% |
군 | 90 | 8.0% |
원 | 90 | 8.0% |
로 | 69 | 6.1% |
읍 | 63 | 5.6% |
면 | 27 | 2.4% |
길 | 26 | 2.3% |
Other values (58) | 255 |
Decimal Number
Value | Count | Frequency (%) |
0 | 88 | |
1 | 68 | |
2 | 40 | |
3 | 36 | |
7 | 35 | 9.6% |
4 | 25 | 6.9% |
9 | 23 | 6.3% |
6 | 20 | 5.5% |
8 | 15 | 4.1% |
5 | 13 | 3.6% |
Space Separator
Value | Count | Frequency (%) |
360 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 90 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1129 | |
Common | 813 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
영 | 161 | |
월 | 161 | |
도 | 95 | 8.4% |
강 | 92 | 8.1% |
군 | 90 | 8.0% |
원 | 90 | 8.0% |
로 | 69 | 6.1% |
읍 | 63 | 5.6% |
면 | 27 | 2.4% |
길 | 26 | 2.3% |
Other values (58) | 255 |
Common
Value | Count | Frequency (%) |
360 | ||
- | 90 | 11.1% |
0 | 88 | 10.8% |
1 | 68 | 8.4% |
2 | 40 | 4.9% |
3 | 36 | 4.4% |
7 | 35 | 4.3% |
4 | 25 | 3.1% |
9 | 23 | 2.8% |
6 | 20 | 2.5% |
Other values (2) | 28 | 3.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1129 | |
ASCII | 813 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
360 | ||
- | 90 | 11.1% |
0 | 88 | 10.8% |
1 | 68 | 8.4% |
2 | 40 | 4.9% |
3 | 36 | 4.4% |
7 | 35 | 4.3% |
4 | 25 | 3.1% |
9 | 23 | 2.8% |
6 | 20 | 2.5% |
Other values (2) | 28 | 3.4% |
Hangul
Value | Count | Frequency (%) |
영 | 161 | |
월 | 161 | |
도 | 95 | 8.4% |
강 | 92 | 8.1% |
군 | 90 | 8.0% |
원 | 90 | 8.0% |
로 | 69 | 6.1% |
읍 | 63 | 5.6% |
면 | 27 | 2.4% |
길 | 26 | 2.3% |
Other values (58) | 255 |
구분(대분류)
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 2.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 860.0 B |
공공건축물 | |
---|---|
<NA> | 1 |
Length
Max length | 5 |
---|---|
Median length | 5 |
Mean length | 4.989011 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.1% |
Sample
1st row | 공공건축물 |
---|---|
2nd row | 공공건축물 |
3rd row | 공공건축물 |
4th row | 공공건축물 |
5th row | 공공건축물 |
Common Values
Value | Count | Frequency (%) |
공공건축물 | 90 | |
<NA> | 1 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
공공건축물 | 90 | |
na | 1 | 1.1% |
구분(소분류)
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 5.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 860.0 B |
공공기관 | |
---|---|
특수법인 | |
행정기관 | |
지방공사.공단 | 6 |
<NA> | 1 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 4.1978022 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.1% |
Sample
1st row | 공공기관 |
---|---|
2nd row | 공공기관 |
3rd row | 공공기관 |
4th row | 공공기관 |
5th row | 공공기관 |
Common Values
Value | Count | Frequency (%) |
공공기관 | 67 | |
특수법인 | 9 | 9.9% |
행정기관 | 8 | 8.8% |
지방공사.공단 | 6 | 6.6% |
<NA> | 1 | 1.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
공공기관 | 67 | |
특수법인 | 9 | 9.9% |
행정기관 | 8 | 8.8% |
지방공사.공단 | 6 | 6.6% |
na | 1 | 1.1% |
소유자
Categorical
HIGH CORRELATION
 
Distinct | 24 |
---|---|
Distinct (%) | 26.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 860.0 B |
영월군 | |
---|---|
영월교도소 | |
한국남부발전 | |
강원지방우정청 | 3 |
서남농업협동조합 | 3 |
Other values (19) |
Length
Max length | 20 |
---|---|
Median length | 16 |
Mean length | 5.2527473 |
Min length | 3 |
Unique
Unique | 16 ? |
---|---|
Unique (%) | 17.6% |
Sample
1st row | 영월군 |
---|---|
2nd row | 강원도_병원 |
3rd row | 강원도_진규폐병동 |
4th row | 강원청 영월서 |
5th row | 영월군 |
Common Values
Value | Count | Frequency (%) |
영월군 | 42 | |
영월교도소 | 10 | 11.0% |
한국남부발전 | 10 | 11.0% |
강원지방우정청 | 3 | 3.3% |
서남농업협동조합 | 3 | 3.3% |
영월교육지원청 | 3 | 3.3% |
지식경제부 | 2 | 2.2% |
영월군산림조합 | 2 | 2.2% |
강원도청 | 1 | 1.1% |
강원도_진규폐병동 | 1 | 1.1% |
Other values (14) | 14 | 15.4% |
Length
Value | Count | Frequency (%) |
영월군 | 42 | |
한국남부발전 | 10 | 10.3% |
영월교도소 | 10 | 10.3% |
강원지방우정청 | 3 | 3.1% |
서남농업협동조합 | 3 | 3.1% |
영월교육지원청 | 3 | 3.1% |
동부지방산림청 | 2 | 2.1% |
지식경제부 | 2 | 2.1% |
영월군산림조합 | 2 | 2.1% |
영월출장소 | 1 | 1.0% |
Other values (19) | 19 |
건물명 | 동명 | 주소 | 구분(소분류) | 소유자 | |
---|---|---|---|---|---|
건물명 | 1.000 | 1.000 | 0.999 | 0.986 | 0.997 |
동명 | 1.000 | 1.000 | 0.999 | 0.986 | 0.997 |
주소 | 0.999 | 0.999 | 1.000 | 0.961 | 0.985 |
구분(소분류) | 0.986 | 0.986 | 0.961 | 1.000 | 0.792 |
소유자 | 0.997 | 0.997 | 0.985 | 0.792 | 1.000 |
소유자 | 구분(소분류) | 구분(대분류) | |
---|---|---|---|
소유자 | 1.000 | 0.493 | 1.000 |
구분(소분류) | 0.493 | 1.000 | 1.000 |
구분(대분류) | 1.000 | 1.000 | 1.000 |
구분(대분류) | 구분(소분류) | 소유자 | |
---|---|---|---|
구분(대분류) | 1.000 | 1.000 | 1.000 |
구분(소분류) | 1.000 | 1.000 | 0.493 |
소유자 | 1.000 | 0.493 | 1.000 |
건물명 | 동명 | 주소 | 구분(대분류) | 구분(소분류) | 소유자 | |
---|---|---|---|---|---|---|
0 | (구)보건소 | (구)보건소 | 강원도 영월군 영월읍 하송로 46-43 | 공공건축물 | 공공기관 | 영월군 |
1 | 강원도_병원 | 강원도_병원 | 강원도 영월군 영월읍 단종로 47-4 | 공공건축물 | 공공기관 | 강원도_병원 |
2 | 강원도_진규폐병동 | 강원도_진규폐병동 | 강원도 영월군 영월읍 단종로 47-4 | 공공건축물 | 공공기관 | 강원도_진규폐병동 |
3 | 강원청 영월서 | 강원청 영월서 | 강원도 영월군 영월읍 단종로 9-0 | 공공건축물 | 공공기관 | 강원청 영월서 |
4 | 김삿갓면복지회관 | 김삿갓면복지회관 | 강원도 영월군 김삿갓면 영월동로 1644-0 | 공공건축물 | 공공기관 | 영월군 |
5 | 김삿갓면사무소 | 김삿갓면사무소 | 강원도 영월군 김삿갓면 옥동장터길 34-0 | 공공건축물 | 공공기관 | 영월군 |
6 | 난고김삿갓문학관 | 영월군 | 강원도 영월군 김삿갓면 김삿갓로 216-22 | 공공건축물 | 공공기관 | 영월군 |
7 | 덕포씨름장 | 천하장사의집 | 강원도 영월군 영월읍 덕포우회길 26-0 | 공공건축물 | 지방공사.공단 | 영월군 |
8 | 동부지방산림청 영월국유림관리소(청사) | 동부지방산림청 영월국유림관리소(청사) | 강원도 영월군 영월읍 영월로 1909-1 | 공공건축물 | 공공기관 | 동부지방산림청 영월국유림관리소(청사) |
9 | 동부지방산림청 영월국유림관리소(청사) | 동부지방산림청 영월국유림관리소(청사) | 강원도 영월군 영월읍 영월로 1909-1 | 공공건축물 | 행정기관 | 동부지방산림청 영월국유림관리소 |
건물명 | 동명 | 주소 | 구분(대분류) | 구분(소분류) | 소유자 | |
---|---|---|---|---|---|---|
81 | 한국남부발전 | 한국남부발전 | 강원도 영월군 영월읍 중앙로 273-0 | 공공건축물 | 공공기관 | 한국남부발전 |
82 | 한국남부발전 | 한국남부발전 | 강원도 영월군 영월읍 중앙로 273-0 | 공공건축물 | 공공기관 | 한국남부발전 |
83 | 한국전력공사 영월지사-별관 | 한국전력공사 영월지사-별관 | 강원도 영월군 영월읍 중앙로 239-0 | 공공건축물 | 공공기관 | 지식경제부 |
84 | 한국전력공사 영월지사-본관 | 한국전력공사 영월지사-본관 | 강원도 영월군 영월읍 중앙로 239-0 | 공공건축물 | 특수법인 | 지식경제부 |
85 | 한국철도시설공단 | 한국철도시설공단 | 강원도 영월군 영월읍 중리2길 7-4 | 공공건축물 | 특수법인 | 한국철도시설공단 |
86 | 한반도면복지회관 | 한반도면복지회관 | 강원도 영월군 한반도면 서강로 793-0 | 공공건축물 | 행정기관 | 영월군 |
87 | 한반도면사무소 | 한반도면사무소 | 강원도 영월군 한반도면 신천길 6-6 | 공공건축물 | 공공기관 | 영월군 |
88 | 환경시설관리사업소 | 환경시설관리사업소 | 강원도 영월군 북면 굴앞마을길 48-60 | 공공건축물 | 공공기관 | 영월군 |
89 | 환경시설관리사업소 | 환경시설관리사업소 | 강원도 영월군 북면 굴앞마을길 48-60 | 공공건축물 | 공공기관 | 영월군 |
90 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
건물명 | 동명 | 주소 | 구분(대분류) | 구분(소분류) | 소유자 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | 영월교도소 | 영월교도소 | 강원도 영월군 영월읍 팔괴로 110-27 | 공공건축물 | 공공기관 | 영월교도소 | 10 |
4 | 한국남부발전 | 한국남부발전 | 강원도 영월군 영월읍 중앙로 273-0 | 공공건축물 | 공공기관 | 한국남부발전 | 10 |
1 | 영월군 농기계연수동 | 영월군 농기계연수동 | 강원도 영월군 북면 영월로 1315-0 | 공공건축물 | 공공기관 | 영월군 | 2 |
2 | 영월군 농업기술센터 | 영월군 농업기술센터 | 강원도 영월군 영월읍 덕포우회길 329-0 | 공공건축물 | 공공기관 | 영월군 | 2 |
3 | 영월군청 | 영월군청 | 강원도 영월군 영월읍 하송로 64-0 | 공공건축물 | 행정기관 | 영월군 | 2 |
5 | 환경시설관리사업소 | 환경시설관리사업소 | 강원도 영월군 북면 굴앞마을길 48-60 | 공공건축물 | 공공기관 | 영월군 | 2 |