Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 1014 |
Missing cells | 45 |
Missing cells (%) | 1.5% |
Duplicate rows | 11 |
Duplicate rows (%) | 1.1% |
Total size in memory | 24.9 KiB |
Average record size in memory | 25.1 B |
Variable types
Text | 2 |
---|---|
Numeric | 1 |
Dataset
Description | 인천광역시 공공건축물에 대한 현황을 보여주는 데이터로 목록으로는 (상호, 주소, 면적)에 대한 정보를 제공합니다. |
---|---|
URL | https://www.data.go.kr/data/15112899/fileData.do |
Dataset has 11 (1.1%) duplicate rows | Duplicates |
상호 has 45 (4.4%) missing values | Missing |
면적 has 13 (1.3%) zeros | Zeros |
Reproduction
Analysis started | 2023-12-12 01:43:46.992977 |
---|---|
Analysis finished | 2023-12-12 01:43:47.539026 |
Duration | 0.55 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상호
Text
MISSING
 
Distinct | 887 |
---|---|
Distinct (%) | 91.5% |
Missing | 45 |
Missing (%) | 4.4% |
Memory size | 8.1 KiB |
Length
Max length | 55 |
---|---|
Median length | 29 |
Mean length | 10.94324 |
Min length | 2 |
Characters and Unicode
Total characters | 10604 |
---|---|
Distinct characters | 421 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 846 ? |
---|---|
Unique (%) | 87.3% |
Sample
1st row | 성산가압펌프장 |
---|---|
2nd row | 성산가압장(경비소) |
3rd row | 풍납취수장(수위실) |
4th row | 풍납취수장(경비소) |
5th row | 풍납취수장(가압펌프장, 수배전반실) |
Value | Count | Frequency (%) |
및 | 24 | 1.5% |
공중화장실 | 20 | 1.2% |
인천광역시 | 19 | 1.2% |
화장실 | 16 | 1.0% |
관리동 | 16 | 1.0% |
동인천역북광장조성사업 | 15 | 0.9% |
인천대공원 | 15 | 0.9% |
검수구실 | 14 | 0.9% |
남동정수사업소 | 13 | 0.8% |
공촌하수종말처리장 | 11 | 0.7% |
Other values (1046) | 1446 |
Most occurring characters
Value | Count | Frequency (%) |
646 | 6.1% | |
수 | 398 | 3.8% |
동 | 334 | 3.1% |
장 | 321 | 3.0% |
소 | 244 | 2.3% |
실 | 234 | 2.2% |
) | 231 | 2.2% |
( | 231 | 2.2% |
사 | 222 | 2.1% |
1 | 207 | 2.0% |
Other values (411) | 7536 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 8868 | |
Space Separator | 646 | 6.1% |
Decimal Number | 488 | 4.6% |
Close Punctuation | 231 | 2.2% |
Open Punctuation | 231 | 2.2% |
Uppercase Letter | 83 | 0.8% |
Dash Punctuation | 25 | 0.2% |
Other Punctuation | 20 | 0.2% |
Math Symbol | 9 | 0.1% |
Letter Number | 3 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
수 | 398 | 4.5% |
동 | 334 | 3.8% |
장 | 321 | 3.6% |
소 | 244 | 2.8% |
실 | 234 | 2.6% |
사 | 222 | 2.5% |
공 | 194 | 2.2% |
관 | 181 | 2.0% |
인 | 168 | 1.9% |
천 | 149 | 1.7% |
Other values (373) | 6423 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 20 | |
A | 16 | |
T | 8 | 9.6% |
C | 6 | 7.2% |
R | 6 | 7.2% |
G | 6 | 7.2% |
P | 3 | 3.6% |
L | 3 | 3.6% |
N | 2 | 2.4% |
E | 2 | 2.4% |
Other values (7) | 11 |
Decimal Number
Value | Count | Frequency (%) |
1 | 207 | |
9 | 66 | 13.5% |
2 | 60 | 12.3% |
3 | 40 | 8.2% |
4 | 28 | 5.7% |
5 | 21 | 4.3% |
6 | 19 | 3.9% |
7 | 18 | 3.7% |
8 | 16 | 3.3% |
0 | 13 | 2.7% |
Other Punctuation
Value | Count | Frequency (%) |
, | 13 | |
/ | 4 | 20.0% |
. | 3 | 15.0% |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 | |
Ⅰ | 1 | |
Ⅲ | 1 |
Space Separator
Value | Count | Frequency (%) |
646 |
Close Punctuation
Value | Count | Frequency (%) |
) | 231 |
Open Punctuation
Value | Count | Frequency (%) |
( | 231 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 25 |
Math Symbol
Value | Count | Frequency (%) |
~ | 9 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 8868 | |
Common | 1650 | 15.6% |
Latin | 86 | 0.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
수 | 398 | 4.5% |
동 | 334 | 3.8% |
장 | 321 | 3.6% |
소 | 244 | 2.8% |
실 | 234 | 2.6% |
사 | 222 | 2.5% |
공 | 194 | 2.2% |
관 | 181 | 2.0% |
인 | 168 | 1.9% |
천 | 149 | 1.7% |
Other values (373) | 6423 |
Latin
Value | Count | Frequency (%) |
B | 20 | |
A | 16 | |
T | 8 | 9.3% |
C | 6 | 7.0% |
R | 6 | 7.0% |
G | 6 | 7.0% |
P | 3 | 3.5% |
L | 3 | 3.5% |
N | 2 | 2.3% |
E | 2 | 2.3% |
Other values (10) | 14 |
Common
Value | Count | Frequency (%) |
646 | ||
) | 231 | 14.0% |
( | 231 | 14.0% |
1 | 207 | 12.5% |
9 | 66 | 4.0% |
2 | 60 | 3.6% |
3 | 40 | 2.4% |
4 | 28 | 1.7% |
- | 25 | 1.5% |
5 | 21 | 1.3% |
Other values (8) | 95 | 5.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 8868 | |
ASCII | 1733 | 16.3% |
Number Forms | 3 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
646 | ||
) | 231 | 13.3% |
( | 231 | 13.3% |
1 | 207 | 11.9% |
9 | 66 | 3.8% |
2 | 60 | 3.5% |
3 | 40 | 2.3% |
4 | 28 | 1.6% |
- | 25 | 1.4% |
5 | 21 | 1.2% |
Other values (25) | 178 | 10.3% |
Hangul
Value | Count | Frequency (%) |
수 | 398 | 4.5% |
동 | 334 | 3.8% |
장 | 321 | 3.6% |
소 | 244 | 2.8% |
실 | 234 | 2.6% |
사 | 222 | 2.5% |
공 | 194 | 2.2% |
관 | 181 | 2.0% |
인 | 168 | 1.9% |
천 | 149 | 1.7% |
Other values (373) | 6423 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 | |
Ⅰ | 1 | |
Ⅲ | 1 |
주소
Text
Distinct | 582 |
---|---|
Distinct (%) | 57.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 8.1 KiB |
Length
Max length | 40 |
---|---|
Median length | 35 |
Mean length | 21.16568 |
Min length | 16 |
Characters and Unicode
Total characters | 21462 |
---|---|
Distinct characters | 204 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 456 ? |
---|---|
Unique (%) | 45.0% |
Sample
1st row | 서울특별시 영등포구 양화동 1-26 |
---|---|
2nd row | 서울특별시 영등포구 양화동 1-26 |
3rd row | 서울특별시 송파구 풍납동 419 |
4th row | 서울특별시 송파구 풍납동 419 |
5th row | 서울특별시 송파구 풍납동 419 |
Value | Count | Frequency (%) |
인천광역시 | 1006 | 21.9% |
서구 | 228 | 5.0% |
남동구 | 183 | 4.0% |
연수구 | 133 | 2.9% |
중구 | 110 | 2.4% |
부평구 | 91 | 2.0% |
외 | 89 | 1.9% |
미추홀구 | 87 | 1.9% |
산 | 68 | 1.5% |
가좌동 | 67 | 1.5% |
Other values (779) | 2529 |
Most occurring characters
Value | Count | Frequency (%) |
4502 | ||
동 | 1223 | 5.7% |
천 | 1017 | 4.7% |
시 | 1015 | 4.7% |
인 | 1010 | 4.7% |
광 | 1006 | 4.7% |
역 | 1006 | 4.7% |
구 | 979 | 4.6% |
1 | 817 | 3.8% |
- | 664 | 3.1% |
Other values (194) | 8223 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 12079 | |
Space Separator | 4502 | 21.0% |
Decimal Number | 4182 | 19.5% |
Dash Punctuation | 664 | 3.1% |
Other Punctuation | 16 | 0.1% |
Open Punctuation | 9 | < 0.1% |
Close Punctuation | 9 | < 0.1% |
Uppercase Letter | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
동 | 1223 | 10.1% |
천 | 1017 | 8.4% |
시 | 1015 | 8.4% |
인 | 1010 | 8.4% |
광 | 1006 | 8.3% |
역 | 1006 | 8.3% |
구 | 979 | 8.1% |
서 | 265 | 2.2% |
수 | 259 | 2.1% |
남 | 193 | 1.6% |
Other values (175) | 4106 |
Decimal Number
Value | Count | Frequency (%) |
1 | 817 | |
2 | 561 | |
5 | 404 | |
4 | 395 | |
0 | 382 | |
9 | 380 | |
3 | 366 | |
8 | 347 | |
7 | 271 | 6.5% |
6 | 259 | 6.2% |
Other Punctuation
Value | Count | Frequency (%) |
, | 12 | |
. | 2 | 12.5% |
: | 1 | 6.2% |
' | 1 | 6.2% |
Space Separator
Value | Count | Frequency (%) |
4502 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 664 |
Open Punctuation
Value | Count | Frequency (%) |
( | 9 |
Close Punctuation
Value | Count | Frequency (%) |
) | 9 |
Uppercase Letter
Value | Count | Frequency (%) |
B | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 12079 | |
Common | 9382 | |
Latin | 1 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
동 | 1223 | 10.1% |
천 | 1017 | 8.4% |
시 | 1015 | 8.4% |
인 | 1010 | 8.4% |
광 | 1006 | 8.3% |
역 | 1006 | 8.3% |
구 | 979 | 8.1% |
서 | 265 | 2.2% |
수 | 259 | 2.1% |
남 | 193 | 1.6% |
Other values (175) | 4106 |
Common
Value | Count | Frequency (%) |
4502 | ||
1 | 817 | 8.7% |
- | 664 | 7.1% |
2 | 561 | 6.0% |
5 | 404 | 4.3% |
4 | 395 | 4.2% |
0 | 382 | 4.1% |
9 | 380 | 4.1% |
3 | 366 | 3.9% |
8 | 347 | 3.7% |
Other values (8) | 564 | 6.0% |
Latin
Value | Count | Frequency (%) |
B | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 12079 | |
ASCII | 9383 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
4502 | ||
1 | 817 | 8.7% |
- | 664 | 7.1% |
2 | 561 | 6.0% |
5 | 404 | 4.3% |
4 | 395 | 4.2% |
0 | 382 | 4.1% |
9 | 380 | 4.0% |
3 | 366 | 3.9% |
8 | 347 | 3.7% |
Other values (9) | 565 | 6.0% |
Hangul
Value | Count | Frequency (%) |
동 | 1223 | 10.1% |
천 | 1017 | 8.4% |
시 | 1015 | 8.4% |
인 | 1010 | 8.4% |
광 | 1006 | 8.3% |
역 | 1006 | 8.3% |
구 | 979 | 8.1% |
서 | 265 | 2.2% |
수 | 259 | 2.1% |
남 | 193 | 1.6% |
Other values (175) | 4106 |
면적
Real number (ℝ)
ZEROS
 
Distinct | 853 |
---|---|
Distinct (%) | 84.1% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 2884.9508 |
Minimum | 0 |
---|---|
Maximum | 205309 |
Zeros | 13 |
Zeros (%) | 1.3% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 9.0 KiB |
Quantile statistics
Minimum | 0 |
---|---|
5-th percentile | 7.6 |
Q1 | 58.86 |
median | 300.91 |
Q3 | 1519.48 |
95-th percentile | 11585.982 |
Maximum | 205309 |
Range | 205309 |
Interquartile range (IQR) | 1460.62 |
Descriptive statistics
Standard deviation | 11530.971 |
---|---|
Coefficient of variation (CV) | 3.9969386 |
Kurtosis | 129.92446 |
Mean | 2884.9508 |
Median Absolute Deviation (MAD) | 280.91 |
Skewness | 9.883666 |
Sum | 2925340.1 |
Variance | 1.329633 × 108 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0.0 | 13 | 1.3% |
25.41 | 8 | 0.8% |
720.0 | 7 | 0.7% |
5.76 | 6 | 0.6% |
12.0 | 6 | 0.6% |
33.0 | 5 | 0.5% |
45.9 | 5 | 0.5% |
27.0 | 5 | 0.5% |
7.6 | 4 | 0.4% |
140.0 | 4 | 0.4% |
Other values (843) | 951 |
Value | Count | Frequency (%) |
0.0 | 13 | |
1.0 | 1 | 0.1% |
2.0 | 1 | 0.1% |
2.25 | 1 | 0.1% |
2.43 | 1 | 0.1% |
2.76 | 1 | 0.1% |
2.8 | 1 | 0.1% |
3.26 | 1 | 0.1% |
3.85 | 1 | 0.1% |
4.09 | 1 | 0.1% |
Value | Count | Frequency (%) |
205309.0 | 1 | |
128870.12 | 1 | |
117163.6 | 1 | |
110153.08 | 1 | |
86164.88 | 1 | |
66630.56 | 1 | |
63195.0 | 2 | |
54428.94 | 1 | |
51977.07 | 1 | |
51681.62 | 1 |
상호 | 주소 | 면적 | |
---|---|---|---|
0 | 성산가압펌프장 | 서울특별시 영등포구 양화동 1-26 | 774.35 |
1 | 성산가압장(경비소) | 서울특별시 영등포구 양화동 1-26 | 2.25 |
2 | 풍납취수장(수위실) | 서울특별시 송파구 풍납동 419 | 13.44 |
3 | 풍납취수장(경비소) | 서울특별시 송파구 풍납동 419 | 2.0 |
4 | 풍납취수장(가압펌프장, 수배전반실) | 서울특별시 송파구 풍납동 419 | 1405.1 |
5 | 풍납취수장(염소투입실) | 서울특별시 송파구 풍납동 419 | 271.76 |
6 | 인천아트플랫폼 | 인천광역시 중구 해안동1가 10-1 | 542.1 |
7 | 미술문화공간조성사업 | 인천광역시 중구 해안동1가 10-1 | 0.0 |
8 | 미술문화공간조성사업 | 인천광역시 중구 해안동1가 10-1 | 0.0 |
9 | 미술문화공간조성사업 | 인천광역시 중구 해안동1가 10-1 | 0.0 |
상호 | 주소 | 면적 | |
---|---|---|---|
1004 | 영흥수협수산물위판장 바동 | 인천광역시 옹진군 영흥면 내리 8-165 | 43.0 |
1005 | 영흥수협수산물위판장 사동 | 인천광역시 옹진군 영흥면 내리 8-165 | 72.0 |
1006 | 아동 | 인천광역시 옹진군 영흥면 내리 8-165 | 82.8 |
1007 | 자월119지역대 | 인천광역시 옹진군 자월면 자월리 1065-11 | 765.78 |
1008 | 대연평도해수담수화시설 당섬담수화시설 | 인천광역시 옹진군 연평면 연평리 산 16-1 | 42.88 |
1009 | 대연평도해수담수화시설 해수취수시설 | 인천광역시 옹진군 연평면 연평리 187-3 | 198.56 |
1010 | 대연평도해수담수화시설 중부리담수화시설 | 인천광역시 옹진군 연평면 연평리 325-160 | 385.34 |
1011 | 연평119지역대 | 인천광역시 옹진군 연평면 연평리 493-3 | 210.73 |
1012 | 군경합동검문소 | 경기도 김포시 대곶면 약암리 437-200 | 777.0 |
1013 | 과적차량 검문소 | 경기도 김포시 대곶면 약암리 1152-3 | 80.5 |
Most frequently occurring
상호 | 주소 | 면적 | # duplicates | |
---|---|---|---|---|
3 | 수산정수사업소(초소동) | 인천광역시 남동구 만수동 산 30 외 60필지 | 7.6 | 4 |
0 | 미술문화공간조성사업 | 인천광역시 중구 해안동1가 10-1 | 0.0 | 3 |
1 | 송도연장선 | 인천광역시 연수구 송도동 48-1 | 63195.0 | 2 |
2 | 송암미술관 | 인천광역시 미추홀구 학익동 587-145 | 2527.43 | 2 |
4 | 약품투입 및 급수시설 | 인천광역시 서구 가좌동 598 | 1270.5 | 2 |
5 | 어린이과학관 | 인천광역시 계양구 방축동 108-1 | 14998.0 | 2 |
6 | 영종도서관건립공사 | 인천광역시 중구 운서동 2709-1 | 0.0 | 2 |
7 | 판매시설(수위실) | 인천광역시 부평구 삼산동 7-1 | 30.55 | 2 |
8 | <NA> | 인천광역시 남동구 구월동 1446 외 2필지 | 98.66 | 2 |
9 | <NA> | 인천광역시 남동구 구월동 1446 외 2필지 | 124.94 | 2 |