Dataset statistics
Number of variables | 6 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 296 |
Duplicate rows (%) | 3.0% |
Total size in memory | 566.4 KiB |
Average record size in memory | 58.0 B |
Variable types
Categorical | 2 |
---|---|
Text | 2 |
Numeric | 2 |
Dataset
Description | 당진시 공간정보활용시스템에서 관리하는 건물 정보에 대한 데이터로 대분류, 중분류, 소분류, 구지번, 위도, 경도 등의 항목을 제공합니다. |
---|---|
Author | 충청남도 |
URL | https://alldam.chungnam.go.kr/index.chungnam?menuCd=DOM_000000201001001001&st=&cds=&orgCd=&apiType=&isOpen=Y&pageIndex=323&beforeMenuCd=DOM_000000201001001000&publicdatapk=15091587 |
Dataset has 296 (3.0%) duplicate rows | Duplicates |
대분류명 is highly overall correlated with 중분류명 | High correlation |
중분류명 is highly overall correlated with 대분류명 | High correlation |
Reproduction
Analysis started | 2024-01-09 22:25:06.178729 |
---|---|
Analysis finished | 2024-01-09 22:25:07.075999 |
Duration | 0.9 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
대분류명
Categorical
HIGH CORRELATION
 
Distinct | 6 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
시설물 | |
---|---|
산업 | |
숙박및음식 | |
레저및관광및예술 | |
교육및보건 |
Length
Max length | 8 |
---|---|
Median length | 5 |
Mean length | 3.5612 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 산업 |
---|---|
2nd row | 시설물 |
3rd row | 산업 |
4th row | 시설물 |
5th row | 시설물 |
Common Values
Value | Count | Frequency (%) |
시설물 | 4170 | |
산업 | 2596 | |
숙박및음식 | 1978 | |
레저및관광및예술 | 580 | 5.8% |
교육및보건 | 460 | 4.6% |
공공및환경 | 216 | 2.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
시설물 | 4170 | |
산업 | 2596 | |
숙박및음식 | 1978 | |
레저및관광및예술 | 580 | 5.8% |
교육및보건 | 460 | 4.6% |
공공및환경 | 216 | 2.2% |
중분류명
Categorical
HIGH CORRELATION
 
Distinct | 21 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
도로시설 | |
---|---|
음식점 | |
서비스산업 | |
안전시설 | |
원시산업 | |
Other values (16) |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 3.9621 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 서비스산업 |
---|---|
2nd row | 도로시설 |
3rd row | 서비스산업 |
4th row | 도로시설 |
5th row | 도로시설 |
Common Values
Value | Count | Frequency (%) |
도로시설 | 2694 | |
음식점 | 1909 | |
서비스산업 | 1549 | |
안전시설 | 958 | 9.6% |
원시산업 | 554 | 5.5% |
관광지 | 491 | 4.9% |
제조산업 | 482 | 4.8% |
편의시설 | 283 | 2.8% |
교육시설 | 258 | 2.6% |
보건시설 | 202 | 2.0% |
Other values (11) | 620 | 6.2% |
Length
Value | Count | Frequency (%) |
도로시설 | 2694 | |
음식점 | 1909 | |
서비스산업 | 1549 | |
안전시설 | 958 | 9.6% |
원시산업 | 554 | 5.5% |
관광지 | 491 | 4.9% |
제조산업 | 482 | 4.8% |
편의시설 | 283 | 2.8% |
교육시설 | 258 | 2.6% |
보건시설 | 202 | 2.0% |
Other values (11) | 620 | 6.2% |
소분류명
Text
Distinct | 91 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
진출입시설 | 2173 | |
일반음식점 | 1261 | 12.6% |
가로등 | 566 | 5.7% |
농업및축업 | 548 | 5.5% |
전문소매업 | 449 | 4.5% |
기타도로시설물 | 386 | 3.9% |
기타안전시설 | 349 | 3.5% |
제조업 | 315 | 3.1% |
골짜기및고개 | 306 | 3.1% |
주점 | 302 | 3.0% |
Other values (81) | 3345 |
Most occurring characters
Value | Count | Frequency (%) |
설 | 3900 | 7.9% |
시 | 3772 | 7.7% |
업 | 2963 | 6.0% |
진 | 2173 | 4.4% |
입 | 2173 | 4.4% |
출 | 2173 | 4.4% |
기 | 1788 | 3.6% |
점 | 1649 | 3.4% |
및 | 1478 | 3.0% |
식 | 1347 | 2.7% |
Other values (144) | 25731 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 49147 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
설 | 3900 | 7.9% |
시 | 3772 | 7.7% |
업 | 2963 | 6.0% |
진 | 2173 | 4.4% |
입 | 2173 | 4.4% |
출 | 2173 | 4.4% |
기 | 1788 | 3.6% |
점 | 1649 | 3.4% |
및 | 1478 | 3.0% |
식 | 1347 | 2.7% |
Other values (144) | 25731 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 49147 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
설 | 3900 | 7.9% |
시 | 3772 | 7.7% |
업 | 2963 | 6.0% |
진 | 2173 | 4.4% |
입 | 2173 | 4.4% |
출 | 2173 | 4.4% |
기 | 1788 | 3.6% |
점 | 1649 | 3.4% |
및 | 1478 | 3.0% |
식 | 1347 | 2.7% |
Other values (144) | 25731 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 49147 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
설 | 3900 | 7.9% |
시 | 3772 | 7.7% |
업 | 2963 | 6.0% |
진 | 2173 | 4.4% |
입 | 2173 | 4.4% |
출 | 2173 | 4.4% |
기 | 1788 | 3.6% |
점 | 1649 | 3.4% |
및 | 1478 | 3.0% |
식 | 1347 | 2.7% |
Other values (144) | 25731 |
구지번
Text
Distinct | 5790 |
---|---|
Distinct (%) | 57.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 30 |
---|---|
Median length | 27 |
Mean length | 18.1126 |
Min length | 1 |
Characters and Unicode
Total characters | 181126 |
---|---|
Distinct characters | 141 |
Distinct categories | 5 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 4333 ? |
---|---|
Unique (%) | 43.3% |
Sample
1st row | 충청남도 당진시 읍내동 25-23 |
---|---|
2nd row | 충청남도 당진시 읍내동 |
3rd row | 충청남도 당진시 읍내동 531-12 |
4th row | 충청남도 당진시 합덕읍 운산리 288-3 |
5th row | 충청남도 당진시 송산면 상거리 326-6 |
Value | Count | Frequency (%) |
충청남도 | 9083 | |
당진시 | 9082 | |
읍내동 | 1660 | 4.0% |
송악읍 | 1417 | 3.4% |
신평면 | 914 | 2.2% |
합덕읍 | 886 | 2.2% |
운산리 | 590 | 1.4% |
석문면 | 588 | 1.4% |
송산면 | 460 | 1.1% |
복운리 | 415 | 1.0% |
Other values (5075) | 16079 |
Most occurring characters
Value | Count | Frequency (%) |
33005 | ||
당 | 9533 | 5.3% |
시 | 9416 | 5.2% |
청 | 9365 | 5.2% |
진 | 9342 | 5.2% |
도 | 9268 | 5.1% |
남 | 9113 | 5.0% |
충 | 9086 | 5.0% |
1 | 6370 | 3.5% |
- | 5909 | 3.3% |
Other values (131) | 70719 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 110075 | |
Space Separator | 33005 | 18.2% |
Decimal Number | 32136 | 17.7% |
Dash Punctuation | 5909 | 3.3% |
Other Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
당 | 9533 | 8.7% |
시 | 9416 | 8.6% |
청 | 9365 | 8.5% |
진 | 9342 | 8.5% |
도 | 9268 | 8.4% |
남 | 9113 | 8.3% |
충 | 9086 | 8.3% |
리 | 5854 | 5.3% |
읍 | 3964 | 3.6% |
면 | 3820 | 3.5% |
Other values (118) | 31314 |
Decimal Number
Value | Count | Frequency (%) |
1 | 6370 | |
2 | 4492 | |
3 | 3578 | |
5 | 3121 | |
6 | 3121 | |
4 | 3023 | |
9 | 2410 | 7.5% |
8 | 2138 | 6.7% |
7 | 1954 | 6.1% |
0 | 1929 | 6.0% |
Space Separator
Value | Count | Frequency (%) |
33005 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5909 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 110075 | |
Common | 71051 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
당 | 9533 | 8.7% |
시 | 9416 | 8.6% |
청 | 9365 | 8.5% |
진 | 9342 | 8.5% |
도 | 9268 | 8.4% |
남 | 9113 | 8.3% |
충 | 9086 | 8.3% |
리 | 5854 | 5.3% |
읍 | 3964 | 3.6% |
면 | 3820 | 3.5% |
Other values (118) | 31314 |
Common
Value | Count | Frequency (%) |
33005 | ||
1 | 6370 | 9.0% |
- | 5909 | 8.3% |
2 | 4492 | 6.3% |
3 | 3578 | 5.0% |
5 | 3121 | 4.4% |
6 | 3121 | 4.4% |
4 | 3023 | 4.3% |
9 | 2410 | 3.4% |
8 | 2138 | 3.0% |
Other values (3) | 3884 | 5.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 110075 | |
ASCII | 71051 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
33005 | ||
1 | 6370 | 9.0% |
- | 5909 | 8.3% |
2 | 4492 | 6.3% |
3 | 3578 | 5.0% |
5 | 3121 | 4.4% |
6 | 3121 | 4.4% |
4 | 3023 | 4.3% |
9 | 2410 | 3.4% |
8 | 2138 | 3.0% |
Other values (3) | 3884 | 5.5% |
Hangul
Value | Count | Frequency (%) |
당 | 9533 | 8.7% |
시 | 9416 | 8.6% |
청 | 9365 | 8.5% |
진 | 9342 | 8.5% |
도 | 9268 | 8.4% |
남 | 9113 | 8.3% |
충 | 9086 | 8.3% |
리 | 5854 | 5.3% |
읍 | 3964 | 3.6% |
면 | 3820 | 3.5% |
Other values (118) | 31314 |
위도
Real number (ℝ)
Distinct | 9115 |
---|---|
Distinct (%) | 91.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 126.67585 |
Minimum | 126.41322 |
---|---|
Maximum | 126.85792 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 126.41322 |
---|---|
5-th percentile | 126.54033 |
Q1 | 126.6288 |
median | 126.64626 |
Q3 | 126.75357 |
95-th percentile | 126.7881 |
Maximum | 126.85792 |
Range | 0.444693 |
Interquartile range (IQR) | 0.12476925 |
Descriptive statistics
Standard deviation | 0.077876645 |
---|---|
Coefficient of variation (CV) | 0.00061477104 |
Kurtosis | -0.65319383 |
Mean | 126.67585 |
Median Absolute Deviation (MAD) | 0.0471726 |
Skewness | 0.0047947023 |
Sum | 1266758.5 |
Variance | 0.0060647718 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
126.646029 | 19 | 0.2% |
126.6841659 | 12 | 0.1% |
126.646985 | 11 | 0.1% |
126.6462379 | 9 | 0.1% |
126.660444 | 9 | 0.1% |
126.8229491 | 8 | 0.1% |
126.647021 | 8 | 0.1% |
126.6296073 | 8 | 0.1% |
126.5919436 | 7 | 0.1% |
126.645751 | 7 | 0.1% |
Other values (9105) | 9902 |
Value | Count | Frequency (%) |
126.4132222 | 1 | |
126.4134167 | 1 | |
126.4236389 | 1 | |
126.4241466 | 1 | |
126.4242798 | 1 | |
126.4243321 | 1 | |
126.4302899 | 1 | |
126.4333733 | 1 | |
126.4342164 | 1 | |
126.4348346 | 1 |
Value | Count | Frequency (%) |
126.8579152 | 1 | |
126.8574749 | 1 | |
126.8568655 | 1 | |
126.8562563 | 1 | |
126.8554162 | 1 | |
126.8535416 | 1 | |
126.8508507 | 1 | |
126.8507084 | 1 | |
126.8501413 | 1 | |
126.8470143 | 1 |
경도
Real number (ℝ)
Distinct | 9141 |
---|---|
Distinct (%) | 91.4% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 36.895045 |
Minimum | 36.753511 |
---|---|
Maximum | 37.056929 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | 36.753511 |
---|---|
5-th percentile | 36.806882 |
Q1 | 36.879818 |
median | 36.893754 |
Q3 | 36.913415 |
95-th percentile | 36.991902 |
Maximum | 37.056929 |
Range | 0.30341753 |
Interquartile range (IQR) | 0.033597275 |
Descriptive statistics
Standard deviation | 0.052984424 |
---|---|
Coefficient of variation (CV) | 0.0014360851 |
Kurtosis | 0.57771248 |
Mean | 36.895045 |
Median Absolute Deviation (MAD) | 0.0154227 |
Skewness | 0.27289554 |
Sum | 368950.45 |
Variance | 0.0028073491 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
36.889997 | 19 | 0.2% |
36.90429815 | 12 | 0.1% |
36.90149 | 11 | 0.1% |
36.9010192 | 9 | 0.1% |
36.921711 | 9 | 0.1% |
36.89046 | 8 | 0.1% |
36.8911063 | 8 | 0.1% |
36.900725 | 8 | 0.1% |
36.8899311 | 8 | 0.1% |
36.901485 | 7 | 0.1% |
Other values (9131) | 9901 |
Value | Count | Frequency (%) |
36.75351147 | 1 | |
36.7587866 | 1 | |
36.76162659 | 1 | |
36.762662 | 1 | |
36.76364705 | 1 | |
36.76364774 | 2 | |
36.76367662 | 1 | |
36.76400831 | 1 | |
36.76419051 | 1 | |
36.7645284 | 1 |
Value | Count | Frequency (%) |
37.056929 | 1 | |
37.05387532 | 1 | |
37.05376973 | 1 | |
37.05361866 | 1 | |
37.05267821 | 1 | |
37.0526229 | 1 | |
37.0522783 | 1 | |
37.05225202 | 1 | |
37.0516845 | 1 | |
37.05162077 | 1 |
대분류명 | 중분류명 | 소분류명 | 위도 | 경도 | |
---|---|---|---|---|---|
대분류명 | 1.000 | 1.000 | 1.000 | 0.194 | 0.231 |
중분류명 | 1.000 | 1.000 | 1.000 | 0.353 | 0.400 |
소분류명 | 1.000 | 1.000 | 1.000 | 0.592 | 0.515 |
위도 | 0.194 | 0.353 | 0.592 | 1.000 | 0.768 |
경도 | 0.231 | 0.400 | 0.515 | 0.768 | 1.000 |
대분류명 | 중분류명 | |
---|---|---|
대분류명 | 1.000 | 0.999 |
중분류명 | 0.999 | 1.000 |
위도 | 경도 | 대분류명 | 중분류명 | |
---|---|---|---|---|
위도 | 1.000 | -0.263 | 0.103 | 0.138 |
경도 | -0.263 | 1.000 | 0.123 | 0.159 |
대분류명 | 0.103 | 0.123 | 1.000 | 0.999 |
중분류명 | 0.138 | 0.159 | 0.999 | 1.000 |
대분류명 | 중분류명 | 소분류명 | 구지번 | 위도 | 경도 | |
---|---|---|---|---|---|---|
23645 | 산업 | 서비스산업 | 임대업 | 충청남도 당진시 읍내동 25-23 | 126.63487 | 36.896324 |
12978 | 시설물 | 도로시설 | 기타도로시설물 | 충청남도 당진시 읍내동 | 126.638598 | 36.890789 |
22807 | 산업 | 서비스산업 | 전문소매업 | 충청남도 당진시 읍내동 531-12 | 126.6301 | 36.89332 |
10953 | 시설물 | 도로시설 | 진출입시설 | 충청남도 당진시 합덕읍 운산리 288-3 | 126.773499 | 36.808851 |
10106 | 시설물 | 도로시설 | 진출입시설 | 충청남도 당진시 송산면 상거리 326-6 | 126.679793 | 36.933128 |
3624 | 시설물 | 편의시설 | 보행시설 | 충청남도 당진시 석문면 교로리 944-21 | 126.504954 | 37.049732 |
17953 | 숙박및음식 | 음식점 | 디저트 | 충청남도 당진시 읍내동 528-19 | 126.63036 | 36.893604 |
2100 | 교육및보건 | 교육시설 | 유아교육기관 | 충청남도 당진시 대덕동 947-2 | 126.637331 | 36.87612 |
12241 | 시설물 | 도로시설 | 진출입시설 | 충청남도 당진시 신평면 거산리 443 | 126.741825 | 36.886264 |
26694 | 레저및관광및예술 | 스포츠시설 | 생활스포츠시설 | 충청남도 당진시 합덕읍 석우리 1147 | 126.746815 | 36.80956 |
대분류명 | 중분류명 | 소분류명 | 구지번 | 위도 | 경도 | |
---|---|---|---|---|---|---|
14201 | 시설물 | 교통시설 | 버스터미널및정류장 | 충청남도 당진시 석문면 교로리 | 126.526049 | 37.019033 |
354 | 레저및관광및예술 | 관광지 | 골짜기및고개 | 충청남도 당진시 면천면 성상리 | 126.678302 | 36.81534 |
1179 | 레저및관광및예술 | 관광지 | 들및평야 | 충청남도 당진시 합덕읍 신흥리 | 126.850851 | 36.798516 |
16968 | 숙박및음식 | 음식점 | 일반음식점 | 충청남도 당진시 면천면 문봉리 186-34번지 | 126.711957 | 36.806874 |
6122 | 시설물 | 안전시설 | 기타안전시설 | 126.777987 | 36.809305 | |
7935 | 시설물 | 도로시설 | 진출입시설 | 충청남도 당진시 합덕읍 대전리 134-44 | 126.761771 | 36.765458 |
13583 | 시설물 | 도로시설 | 기타도로시설물 | 충청남도 당진시 합덕읍 운산리 | 126.780007 | 36.801958 |
13975 | 시설물 | 기반시설 | 유통및공급시설 | 충청남도 당진시 채운동 238-21 | 126.626822 | 36.890484 |
25529 | 산업 | 서비스산업 | 언론및미디어 | 충청남도 당진시 읍내동 160-1 | 126.632029 | 36.890936 |
893 | 레저및관광및예술 | 관광지 | 들및평야 | 충청남도 당진시 면천면 송학리 | 126.644723 | 36.82822 |
Most frequently occurring
대분류명 | 중분류명 | 소분류명 | 구지번 | 위도 | 경도 | # duplicates | |
---|---|---|---|---|---|---|---|
255 | 시설물 | 기반시설 | 유통및공급시설 | 충청남도 당진시 시곡동 57-1 | 126.684166 | 36.904298 | 12 |
211 | 숙박및음식 | 음식점 | 일반음식점 | 충청남도 당진시 신평면 운정리 961-3 | 126.822949 | 36.891106 | 8 |
259 | 시설물 | 기반시설 | 유통및공급시설 | 충청남도 당진시 읍내동 232-85 | 126.631666 | 36.893743 | 7 |
268 | 시설물 | 기반시설 | 유통및공급시설 | 충청남도 당진시 정미면 덕마리 379-3 임 | 126.591944 | 36.849854 | 7 |
15 | 교육및보건 | 보건시설 | 기타보건시설 | 충청남도 당진시 수청동 1002 | 126.646029 | 36.889997 | 6 |
188 | 숙박및음식 | 음식점 | 일반음식점 | 충청남도 당진시 수청동 988 | 126.646238 | 36.901019 | 6 |
62 | 산업 | 서비스산업 | 임대업 | 충청남도 당진시 대덕동 1643 | 126.636863 | 36.887074 | 5 |
89 | 산업 | 서비스산업 | 전문도매업 | 충청남도 당진시 읍내동 145-13 | 126.629607 | 36.889931 | 5 |
190 | 숙박및음식 | 음식점 | 일반음식점 | 충청남도 당진시 수청동 988 | 126.646249 | 36.901057 | 5 |
244 | 숙박및음식 | 음식점 | 주점 | 충청남도 당진시 수청동 997 | 126.646985 | 36.90149 | 5 |