Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 285 |
Duplicate rows (%) | 2.9% |
Total size in memory | 566.4 KiB |
Average record size in memory | 58.0 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 당진시 공간정보활용시스템에서 관리하는 건물 정보에 대한 데이터로 대분류, 중분류, 소분류, 구지번, 위도, 경도 등의 항목을 제공합니다. |
---|---|
Author | 충청남도 당진시 |
URL | https://www.data.go.kr/data/15091587/fileData.do |
Dataset has 285 (2.9%) duplicate rows | Duplicates |
중분류명 is highly overall correlated with 대분류명 | High correlation |
대분류명 is highly overall correlated with 중분류명 | High correlation |
Reproduction
Analysis started | 2023-12-12 06:18:48.194149 |
---|---|
Analysis finished | 2023-12-12 06:18:49.801089 |
Duration | 1.61 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
대분류명
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
시설물 | |
---|---|
산업 | |
숙박및음식 | |
레저및관광및예술 | |
교육및보건 |
Length
Max length | 8 |
---|---|
Median length | 5 |
Mean length | 3.5757 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 산업 |
---|---|
2nd row | 산업 |
3rd row | 시설물 |
4th row | 시설물 |
5th row | 산업 |
Common Values
Value | Count | Frequency (%) |
시설물 | 4138 | |
산업 | 2582 | |
숙박및음식 | 2016 | |
레저및관광및예술 | 593 | 5.9% |
교육및보건 | 437 | 4.4% |
공공및환경 | 234 | 2.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
시설물 | 4138 | |
산업 | 2582 | |
숙박및음식 | 2016 | |
레저및관광및예술 | 593 | 5.9% |
교육및보건 | 437 | 4.4% |
공공및환경 | 234 | 2.3% |
중분류명
Categorical
HIGH CORRELATION
 
Distinct | 21 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
도로시설 | |
---|---|
음식점 | |
서비스산업 | |
안전시설 | |
원시산업 | |
Other values (16) |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 3.9619 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 제조산업 |
---|---|
2nd row | 서비스산업 |
3rd row | 안전시설 |
4th row | 도로시설 |
5th row | 서비스산업 |
Common Values
Value | Count | Frequency (%) |
도로시설 | 2672 | |
음식점 | 1948 | |
서비스산업 | 1570 | |
안전시설 | 951 | 9.5% |
원시산업 | 538 | 5.4% |
관광지 | 506 | 5.1% |
제조산업 | 464 | 4.6% |
편의시설 | 281 | 2.8% |
교육시설 | 235 | 2.4% |
보건시설 | 202 | 2.0% |
Other values (11) | 633 | 6.3% |
Length
Value | Count | Frequency (%) |
도로시설 | 2672 | |
음식점 | 1948 | |
서비스산업 | 1570 | |
안전시설 | 951 | 9.5% |
원시산업 | 538 | 5.4% |
관광지 | 506 | 5.1% |
제조산업 | 464 | 4.6% |
편의시설 | 281 | 2.8% |
교육시설 | 235 | 2.4% |
보건시설 | 202 | 2.0% |
Other values (11) | 633 | 6.3% |
소분류명
Text
Distinct | 94 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
진출입시설 | 2147 | |
일반음식점 | 1300 | 13.0% |
가로등 | 575 | 5.8% |
농업및축업 | 529 | 5.3% |
전문소매업 | 454 | 4.5% |
기타도로시설물 | 392 | 3.9% |
기타안전시설 | 330 | 3.3% |
제조업 | 312 | 3.1% |
골짜기및고개 | 301 | 3.0% |
기타서비스산업 | 288 | 2.9% |
Other values (84) | 3372 |
Most occurring characters
Value | Count | Frequency (%) |
설 | 3839 | 7.8% |
시 | 3719 | 7.6% |
업 | 2908 | 5.9% |
출 | 2147 | 4.4% |
진 | 2147 | 4.4% |
입 | 2147 | 4.4% |
기 | 1758 | 3.6% |
점 | 1671 | 3.4% |
및 | 1431 | 2.9% |
음 | 1384 | 2.8% |
Other values (146) | 25894 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 49045 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
설 | 3839 | 7.8% |
시 | 3719 | 7.6% |
업 | 2908 | 5.9% |
출 | 2147 | 4.4% |
진 | 2147 | 4.4% |
입 | 2147 | 4.4% |
기 | 1758 | 3.6% |
점 | 1671 | 3.4% |
및 | 1431 | 2.9% |
음 | 1384 | 2.8% |
Other values (146) | 25894 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 49045 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
설 | 3839 | 7.8% |
시 | 3719 | 7.6% |
업 | 2908 | 5.9% |
출 | 2147 | 4.4% |
진 | 2147 | 4.4% |
입 | 2147 | 4.4% |
기 | 1758 | 3.6% |
점 | 1671 | 3.4% |
및 | 1431 | 2.9% |
음 | 1384 | 2.8% |
Other values (146) | 25894 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 49045 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
설 | 3839 | 7.8% |
시 | 3719 | 7.6% |
업 | 2908 | 5.9% |
출 | 2147 | 4.4% |
진 | 2147 | 4.4% |
입 | 2147 | 4.4% |
기 | 1758 | 3.6% |
점 | 1671 | 3.4% |
및 | 1431 | 2.9% |
음 | 1384 | 2.8% |
Other values (146) | 25894 |
구지번
Text
Distinct | 5827 |
---|---|
Distinct (%) | 58.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 35 |
---|---|
Median length | 29 |
Mean length | 18.1357 |
Min length | 1 |
Characters and Unicode
Total characters | 181357 |
---|---|
Distinct characters | 152 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4405 ? |
---|---|
Unique (%) | 44.0% |
Sample
1st row | 충청남도 당진시 대덕동 1689번지 |
---|---|
2nd row | 충청남도 당진시 고대면 항곡리 321-14 |
3rd row | |
4th row | 충청남도 당진시 읍내동 641-7 |
5th row | 충청남도 당진시 원당동 461-2 |
Value | Count | Frequency (%) |
충청남도 | 9094 | |
당진시 | 9093 | |
읍내동 | 1656 | 4.0% |
송악읍 | 1417 | 3.4% |
신평면 | 910 | 2.2% |
합덕읍 | 888 | 2.2% |
석문면 | 604 | 1.5% |
운산리 | 592 | 1.4% |
송산면 | 472 | 1.1% |
복운리 | 408 | 1.0% |
Other values (5075) | 16073 |
Most occurring characters
Value | Count | Frequency (%) |
33017 | ||
당 | 9523 | 5.3% |
시 | 9441 | 5.2% |
청 | 9385 | 5.2% |
진 | 9316 | 5.1% |
도 | 9285 | 5.1% |
남 | 9126 | 5.0% |
충 | 9096 | 5.0% |
1 | 6333 | 3.5% |
- | 5942 | 3.3% |
Other values (142) | 70893 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 110286 | |
Space Separator | 33017 | 18.2% |
Decimal Number | 32107 | 17.7% |
Dash Punctuation | 5942 | 3.3% |
Other Punctuation | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
당 | 9523 | 8.6% |
시 | 9441 | 8.6% |
청 | 9385 | 8.5% |
진 | 9316 | 8.4% |
도 | 9285 | 8.4% |
남 | 9126 | 8.3% |
충 | 9096 | 8.2% |
리 | 5869 | 5.3% |
읍 | 3962 | 3.6% |
면 | 3856 | 3.5% |
Other values (129) | 31427 |
Decimal Number
Value | Count | Frequency (%) |
1 | 6333 | |
2 | 4522 | |
3 | 3537 | |
5 | 3181 | |
6 | 3113 | |
4 | 3024 | |
9 | 2363 | 7.4% |
8 | 2187 | 6.8% |
0 | 1987 | 6.2% |
7 | 1860 | 5.8% |
Space Separator
Value | Count | Frequency (%) |
33017 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5942 |
Other Punctuation
Value | Count | Frequency (%) |
. | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 110286 | |
Common | 71071 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
당 | 9523 | 8.6% |
시 | 9441 | 8.6% |
청 | 9385 | 8.5% |
진 | 9316 | 8.4% |
도 | 9285 | 8.4% |
남 | 9126 | 8.3% |
충 | 9096 | 8.2% |
리 | 5869 | 5.3% |
읍 | 3962 | 3.6% |
면 | 3856 | 3.5% |
Other values (129) | 31427 |
Common
Value | Count | Frequency (%) |
33017 | ||
1 | 6333 | 8.9% |
- | 5942 | 8.4% |
2 | 4522 | 6.4% |
3 | 3537 | 5.0% |
5 | 3181 | 4.5% |
6 | 3113 | 4.4% |
4 | 3024 | 4.3% |
9 | 2363 | 3.3% |
8 | 2187 | 3.1% |
Other values (3) | 3852 | 5.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 110286 | |
ASCII | 71071 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
33017 | ||
1 | 6333 | 8.9% |
- | 5942 | 8.4% |
2 | 4522 | 6.4% |
3 | 3537 | 5.0% |
5 | 3181 | 4.5% |
6 | 3113 | 4.4% |
4 | 3024 | 4.3% |
9 | 2363 | 3.3% |
8 | 2187 | 3.1% |
Other values (3) | 3852 | 5.4% |
Hangul
Value | Count | Frequency (%) |
당 | 9523 | 8.6% |
시 | 9441 | 8.6% |
청 | 9385 | 8.5% |
진 | 9316 | 8.4% |
도 | 9285 | 8.4% |
남 | 9126 | 8.3% |
충 | 9096 | 8.2% |
리 | 5869 | 5.3% |
읍 | 3962 | 3.6% |
면 | 3856 | 3.5% |
Other values (129) | 31427 |
위도
Real number (ℝ)
Distinct | 9173 |
---|---|
Distinct (%) | 91.7% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 126.67567 |
Minimum | 126.40408 |
---|---|
Maximum | 126.85808 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 126.40408 |
---|---|
5-th percentile | 126.54035 |
Q1 | 126.62891 |
median | 126.64677 |
Q3 | 126.75323 |
95-th percentile | 126.78734 |
Maximum | 126.85808 |
Range | 0.4540014 |
Interquartile range (IQR) | 0.1243166 |
Descriptive statistics
Standard deviation | 0.077777784 |
---|---|
Coefficient of variation (CV) | 0.0006139915 |
Kurtosis | -0.5916222 |
Mean | 126.67567 |
Median Absolute Deviation (MAD) | 0.0470785 |
Skewness | -0.01608475 |
Sum | 1266756.7 |
Variance | 0.0060493837 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
126.646029 | 20 | 0.2% |
126.5922214 | 11 | 0.1% |
126.6841659 | 11 | 0.1% |
126.647021 | 8 | 0.1% |
126.62962 | 8 | 0.1% |
126.660444 | 8 | 0.1% |
126.6331 | 7 | 0.1% |
126.6462379 | 7 | 0.1% |
126.645219 | 6 | 0.1% |
126.643611 | 6 | 0.1% |
Other values (9163) | 9908 |
Value | Count | Frequency (%) |
126.4040833 | 1 | |
126.4132222 | 1 | |
126.4134167 | 1 | |
126.4233799 | 1 | |
126.4236389 | 1 | |
126.4241466 | 1 | |
126.4242798 | 2 | |
126.4247552 | 1 | |
126.4249957 | 1 | |
126.4250746 | 1 |
Value | Count | Frequency (%) |
126.8580847 | 1 | |
126.8579152 | 1 | |
126.8577788 | 1 | |
126.8574749 | 1 | |
126.8568655 | 1 | |
126.8562563 | 1 | |
126.8559511 | 1 | |
126.8501443 | 1 | |
126.8429798 | 1 | |
126.8417293 | 1 |
경도
Real number (ℝ)
Distinct | 9194 |
---|---|
Distinct (%) | 91.9% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 36.894926 |
Minimum | 36.760354 |
---|---|
Maximum | 37.056929 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 36.760354 |
---|---|
5-th percentile | 36.806876 |
Q1 | 36.879476 |
median | 36.893683 |
Q3 | 36.913078 |
95-th percentile | 36.99051 |
Maximum | 37.056929 |
Range | 0.29657505 |
Interquartile range (IQR) | 0.033602293 |
Descriptive statistics
Standard deviation | 0.053201326 |
---|---|
Coefficient of variation (CV) | 0.0014419687 |
Kurtosis | 0.54583341 |
Mean | 36.894926 |
Median Absolute Deviation (MAD) | 0.0153216 |
Skewness | 0.27744149 |
Sum | 368949.26 |
Variance | 0.0028303811 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
36.889997 | 20 | 0.2% |
36.90429815 | 11 | 0.1% |
36.89046 | 11 | 0.1% |
36.921711 | 8 | 0.1% |
36.900725 | 8 | 0.1% |
36.888617 | 7 | 0.1% |
36.9010192 | 7 | 0.1% |
36.90574 | 7 | 0.1% |
36.8523536 | 6 | 0.1% |
36.8907122 | 6 | 0.1% |
Other values (9184) | 9909 |
Value | Count | Frequency (%) |
36.76035395 | 1 | |
36.76038884 | 1 | |
36.76162659 | 1 | |
36.762662 | 1 | |
36.76277 | 1 | |
36.76364774 | 1 | |
36.76367662 | 1 | |
36.76419051 | 1 | |
36.76442 | 1 | |
36.7645284 | 1 |
Value | Count | Frequency (%) |
37.056929 | 1 | |
37.05376973 | 1 | |
37.05375279 | 1 | |
37.05361866 | 1 | |
37.05359755 | 1 | |
37.05268611 | 1 | |
37.05267821 | 1 | |
37.052248 | 1 | |
37.05222655 | 1 | |
37.05161412 | 1 |
대분류명 | 중분류명 | 소분류명 | 위도 | 경도 | |
---|---|---|---|---|---|
대분류명 | 1.000 | 1.000 | 1.000 | 0.191 | 0.233 |
중분류명 | 1.000 | 1.000 | 1.000 | 0.360 | 0.412 |
소분류명 | 1.000 | 1.000 | 1.000 | 0.572 | 0.535 |
위도 | 0.191 | 0.360 | 0.572 | 1.000 | 0.770 |
경도 | 0.233 | 0.412 | 0.535 | 0.770 | 1.000 |
중분류명 | 대분류명 | |
---|---|---|
중분류명 | 1.000 | 0.999 |
대분류명 | 0.999 | 1.000 |
위도 | 경도 | 대분류명 | 중분류명 | |
---|---|---|---|---|
위도 | 1.000 | -0.261 | 0.101 | 0.141 |
경도 | -0.261 | 1.000 | 0.124 | 0.165 |
대분류명 | 0.101 | 0.124 | 1.000 | 0.999 |
중분류명 | 0.141 | 0.165 | 0.999 | 1.000 |
대분류명 | 중분류명 | 소분류명 | 구지번 | 위도 | 경도 | |
---|---|---|---|---|---|---|
20373 | 산업 | 제조산업 | 건설업 | 충청남도 당진시 대덕동 1689번지 | 126.63804 | 36.885889 |
26302 | 산업 | 서비스산업 | 전문도매업 | 충청남도 당진시 고대면 항곡리 321-14 | 126.60466 | 36.889541 |
5864 | 시설물 | 안전시설 | 기타안전시설 | 126.609825 | 36.832508 | |
10579 | 시설물 | 도로시설 | 진출입시설 | 충청남도 당진시 읍내동 641-7 | 126.629575 | 36.891334 |
25194 | 산업 | 서비스산업 | 자동차산업 | 충청남도 당진시 원당동 461-2 | 126.649755 | 36.911512 |
23595 | 산업 | 서비스산업 | 임대업 | 충청남도 당진시 송산면 가곡리 386-25 | 126.675103 | 36.971526 |
21851 | 산업 | 원시산업 | 농업및축업 | 충청남도 당진시 신평면 초대리 772 | 126.736047 | 36.896784 |
25248 | 산업 | 서비스산업 | 종합상품판매업 | 충청남도 당진시 채운동 1105 | 126.631573 | 36.886172 |
798 | 레저및관광및예술 | 관광지 | 골짜기및고개 | 충청남도 당진시 대호지면 두산리 | 126.546466 | 36.891889 |
2227 | 교육및보건 | 교육시설 | 중등교육기관 | 충청남도 당진시 원당동 1224 | 126.64092 | 36.900059 |
대분류명 | 중분류명 | 소분류명 | 구지번 | 위도 | 경도 | |
---|---|---|---|---|---|---|
3092 | 공공및환경 | 정치및사회및외교 | 사회복지시설 | 충청남도 당진시 석문면 삼봉리 868-1 | 126.534526 | 37.013943 |
16101 | 숙박및음식 | 음식점 | 기타음식점 | 충청남도 당진시 고대면 용두리 647-6 | 126.602247 | 36.925604 |
21977 | 산업 | 원시산업 | 농업및축업 | 충청남도 당진시 고대면 항곡리 80 | 126.597606 | 36.907961 |
17513 | 숙박및음식 | 음식점 | 주점 | 충청남도 당진시 우강면 송산리 404-43번지 | 126.775415 | 36.810653 |
12382 | 시설물 | 도로시설 | 진출입시설 | 충청남도 당진시 송악읍 복운리 1642-8 | 126.783682 | 36.94127 |
25649 | 산업 | 서비스산업 | 뷰티서비스 | 충청남도 당진시 석문면 교로리 906-15 | 126.512375 | 37.048985 |
15370 | 숙박및음식 | 음식점 | 일반음식점 | 충청남도 당진시 송악읍 기지시리 324-2 | 126.69118 | 36.903084 |
17660 | 숙박및음식 | 음식점 | 디저트 | 충청남도 당진시 합덕읍 운산리 300-50 | 126.77063 | 36.80991 |
3198 | 공공및환경 | 정치및사회및외교 | 사회복지시설 | 충청남도 당진시 채운동 310-3 | 126.624025 | 36.893563 |
293 | 레저및관광및예술 | 관광지 | 골짜기및고개 | 충청남도 당진시 정미면 봉성리 | 126.541583 | 36.842684 |
Most frequently occurring
대분류명 | 중분류명 | 소분류명 | 구지번 | 위도 | 경도 | # duplicates | |
---|---|---|---|---|---|---|---|
242 | 시설물 | 기반시설 | 유통및공급시설 | 충청남도 당진시 시곡동 57-1 | 126.684166 | 36.904298 | 11 |
41 | 산업 | 서비스산업 | 기타서비스산업 | 충청남도 당진시 읍내동 153-69 | 126.6331 | 36.888617 | 7 |
10 | 교육및보건 | 보건시설 | 기타보건시설 | 충청남도 당진시 수청동 1002 | 126.646029 | 36.889997 | 6 |
91 | 산업 | 서비스산업 | 전문소매업 | 충청남도 당진시 수청동 1002 | 126.646029 | 36.889997 | 6 |
99 | 산업 | 서비스산업 | 전문소매업 | 충청남도 당진시 읍내동 145-12 | 126.62962 | 36.89046 | 6 |
196 | 숙박및음식 | 음식점 | 일반음식점 | 충청남도 당진시 신평면 운정리 960-4 | 126.82256 | 36.890712 | 6 |
240 | 시설물 | 기반시설 | 유통및공급시설 | 충청남도 당진시 수청동 1005 | 126.643611 | 36.891667 | 6 |
248 | 시설물 | 기반시설 | 유통및공급시설 | 충청남도 당진시 정미면 덕마리 230-2임 | 126.592221 | 36.853465 | 6 |
264 | 시설물 | 편의시설 | 보행시설 | 충청남도 당진시 송악읍 한진리 318-4 | 126.764453 | 36.968864 | 6 |
7 | 교육및보건 | 교육시설 | 학원 | 충청남도 당진시 수청동 980 | 126.645213 | 36.901479 | 5 |