Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 1204 |
Missing cells | 5547 |
Missing cells (%) | 65.8% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.1% |
Total size in memory | 68.3 KiB |
Average record size in memory | 58.1 B |
Variable types
Text | 2 |
---|---|
Numeric | 2 |
Categorical | 2 |
DateTime | 1 |
Dataset
Description | 인천광역시 연수구 공중 및 개방화장실 현황의 데이터로 화장실명, 위치 등의 목록- 화장실명, 위치, 구분, 개방 지정일, 유형으로 구분 |
---|---|
Author | 인천광역시 연수구 |
URL | https://data.incheon.go.kr/findData/publicDataDetail?dataId=15087382&srcSe=7661IVAWM27C61E190 |
개방 지정일 has constant value "" | Constant |
Dataset has 1 (0.1%) duplicate rows | Duplicates |
구분 is highly overall correlated with 유형 | High correlation |
유형 is highly overall correlated with 구분 | High correlation |
구분 is highly imbalanced (71.8%) | Imbalance |
유형 is highly imbalanced (80.2%) | Imbalance |
화장실명 has 1086 (90.2%) missing values | Missing |
위치 has 1086 (90.2%) missing values | Missing |
위도 has 1086 (90.2%) missing values | Missing |
경도 has 1086 (90.2%) missing values | Missing |
개방 지정일 has 1203 (99.9%) missing values | Missing |
Reproduction
Analysis started | 2024-01-28 06:15:48.441312 |
---|---|
Analysis finished | 2024-01-28 06:15:49.271747 |
Duration | 0.83 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
화장실명
Text
MISSING
 
Distinct | 118 |
---|---|
Distinct (%) | 100.0% |
Missing | 1086 |
Missing (%) | 90.2% |
Memory size | 9.5 KiB |
Value | Count | Frequency (%) |
주유소 | 16 | 10.7% |
송도점 | 3 | 2.0% |
연수점 | 3 | 2.0% |
미추홀 | 2 | 1.3% |
롯데마트 | 2 | 1.3% |
홈플러스 | 2 | 1.3% |
㈜태화석유 | 1 | 0.7% |
지식정보단지역 | 1 | 0.7% |
국제업무지구역 | 1 | 0.7% |
센트럴파크역 | 1 | 0.7% |
Other values (118) | 118 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 36 | 5.5% |
32 | 4.9% | |
소 | 26 | 4.0% |
유 | 26 | 4.0% |
동 | 20 | 3.1% |
연 | 18 | 2.8% |
수 | 18 | 2.8% |
도 | 17 | 2.6% |
역 | 16 | 2.5% |
송 | 16 | 2.5% |
Other values (173) | 428 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 580 | |
Space Separator | 32 | 4.9% |
Decimal Number | 13 | 2.0% |
Other Symbol | 8 | 1.2% |
Lowercase Letter | 7 | 1.1% |
Uppercase Letter | 6 | 0.9% |
Close Punctuation | 3 | 0.5% |
Open Punctuation | 3 | 0.5% |
Letter Number | 1 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 36 | 6.2% |
소 | 26 | 4.5% |
유 | 26 | 4.5% |
동 | 20 | 3.4% |
연 | 18 | 3.1% |
수 | 18 | 3.1% |
도 | 17 | 2.9% |
역 | 16 | 2.8% |
송 | 16 | 2.8% |
센 | 14 | 2.4% |
Other values (155) | 373 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 1 | |
N | 1 | |
F | 1 | |
L | 1 | |
K | 1 | |
S | 1 |
Lowercase Letter
Value | Count | Frequency (%) |
s | 3 | |
g | 2 | |
l | 1 | 14.3% |
o | 1 | 14.3% |
Decimal Number
Value | Count | Frequency (%) |
3 | 5 | |
2 | 4 | |
1 | 4 |
Space Separator
Value | Count | Frequency (%) |
32 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 8 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 |
Letter Number
Value | Count | Frequency (%) |
Ⅱ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 588 | |
Common | 51 | 7.8% |
Latin | 14 | 2.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 36 | 6.1% |
소 | 26 | 4.4% |
유 | 26 | 4.4% |
동 | 20 | 3.4% |
연 | 18 | 3.1% |
수 | 18 | 3.1% |
도 | 17 | 2.9% |
역 | 16 | 2.7% |
송 | 16 | 2.7% |
센 | 14 | 2.4% |
Other values (156) | 381 |
Latin
Value | Count | Frequency (%) |
s | 3 | |
g | 2 | |
C | 1 | 7.1% |
N | 1 | 7.1% |
F | 1 | 7.1% |
L | 1 | 7.1% |
l | 1 | 7.1% |
o | 1 | 7.1% |
K | 1 | 7.1% |
S | 1 | 7.1% |
Common
Value | Count | Frequency (%) |
32 | ||
3 | 5 | 9.8% |
2 | 4 | 7.8% |
1 | 4 | 7.8% |
) | 3 | 5.9% |
( | 3 | 5.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 580 | |
ASCII | 64 | 9.8% |
None | 8 | 1.2% |
Number Forms | 1 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 36 | 6.2% |
소 | 26 | 4.5% |
유 | 26 | 4.5% |
동 | 20 | 3.4% |
연 | 18 | 3.1% |
수 | 18 | 3.1% |
도 | 17 | 2.9% |
역 | 16 | 2.8% |
송 | 16 | 2.8% |
센 | 14 | 2.4% |
Other values (155) | 373 |
ASCII
Value | Count | Frequency (%) |
32 | ||
3 | 5 | 7.8% |
2 | 4 | 6.2% |
1 | 4 | 6.2% |
s | 3 | 4.7% |
) | 3 | 4.7% |
( | 3 | 4.7% |
g | 2 | 3.1% |
C | 1 | 1.6% |
N | 1 | 1.6% |
Other values (6) | 6 | 9.4% |
None
Value | Count | Frequency (%) |
㈜ | 8 |
Number Forms
Value | Count | Frequency (%) |
Ⅱ | 1 |
위치
Text
MISSING
 
Distinct | 114 |
---|---|
Distinct (%) | 96.6% |
Missing | 1086 |
Missing (%) | 90.2% |
Memory size | 9.5 KiB |
Value | Count | Frequency (%) |
경원대로 | 10 | 4.3% |
연수동 | 9 | 3.8% |
동춘동 | 9 | 3.8% |
원인재로 | 6 | 2.6% |
비류대로 | 6 | 2.6% |
송도국제대로 | 5 | 2.1% |
청능대로 | 5 | 2.1% |
앵고개로 | 5 | 2.1% |
청학동 | 4 | 1.7% |
인천타워대로 | 4 | 1.7% |
Other values (151) | 172 |
Most occurring characters
Value | Count | Frequency (%) |
117 | 10.2% | |
로 | 88 | 7.7% |
1 | 81 | 7.0% |
동 | 69 | 6.0% |
2 | 54 | 4.7% |
5 | 50 | 4.4% |
대 | 44 | 3.8% |
3 | 43 | 3.7% |
4 | 34 | 3.0% |
9 | 29 | 2.5% |
Other values (80) | 540 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 577 | |
Decimal Number | 380 | |
Space Separator | 117 | 10.2% |
Dash Punctuation | 25 | 2.2% |
Close Punctuation | 25 | 2.2% |
Open Punctuation | 25 | 2.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
로 | 88 | 15.3% |
동 | 69 | 12.0% |
대 | 44 | 7.6% |
송 | 22 | 3.8% |
도 | 19 | 3.3% |
번 | 19 | 3.3% |
길 | 16 | 2.8% |
원 | 16 | 2.8% |
학 | 15 | 2.6% |
춘 | 14 | 2.4% |
Other values (66) | 255 |
Decimal Number
Value | Count | Frequency (%) |
1 | 81 | |
2 | 54 | |
5 | 50 | |
3 | 43 | |
4 | 34 | |
9 | 29 | 7.6% |
8 | 26 | 6.8% |
0 | 24 | 6.3% |
6 | 20 | 5.3% |
7 | 19 | 5.0% |
Space Separator
Value | Count | Frequency (%) |
117 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 25 |
Close Punctuation
Value | Count | Frequency (%) |
) | 25 |
Open Punctuation
Value | Count | Frequency (%) |
( | 25 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 577 | |
Common | 572 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
로 | 88 | 15.3% |
동 | 69 | 12.0% |
대 | 44 | 7.6% |
송 | 22 | 3.8% |
도 | 19 | 3.3% |
번 | 19 | 3.3% |
길 | 16 | 2.8% |
원 | 16 | 2.8% |
학 | 15 | 2.6% |
춘 | 14 | 2.4% |
Other values (66) | 255 |
Common
Value | Count | Frequency (%) |
117 | ||
1 | 81 | |
2 | 54 | |
5 | 50 | |
3 | 43 | 7.5% |
4 | 34 | 5.9% |
9 | 29 | 5.1% |
8 | 26 | 4.5% |
- | 25 | 4.4% |
) | 25 | 4.4% |
Other values (4) | 88 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 577 | |
ASCII | 572 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
117 | ||
1 | 81 | |
2 | 54 | |
5 | 50 | |
3 | 43 | 7.5% |
4 | 34 | 5.9% |
9 | 29 | 5.1% |
8 | 26 | 4.5% |
- | 25 | 4.4% |
) | 25 | 4.4% |
Other values (4) | 88 |
Hangul
Value | Count | Frequency (%) |
로 | 88 | 15.3% |
동 | 69 | 12.0% |
대 | 44 | 7.6% |
송 | 22 | 3.8% |
도 | 19 | 3.3% |
번 | 19 | 3.3% |
길 | 16 | 2.8% |
원 | 16 | 2.8% |
학 | 15 | 2.6% |
춘 | 14 | 2.4% |
Other values (66) | 255 |
위도
Real number (ℝ)
MISSING
 
Distinct | 111 |
---|---|
Distinct (%) | 94.1% |
Missing | 1086 |
Missing (%) | 90.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 37.399181 |
Minimum | 35.907757 |
---|---|
Maximum | 37.489775 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.7 KiB |
Quantile statistics
Minimum | 35.907757 |
---|---|
5-th percentile | 37.382413 |
Q1 | 37.40108 |
median | 37.414318 |
Q3 | 37.422641 |
95-th percentile | 37.432071 |
Maximum | 37.489775 |
Range | 1.582018 |
Interquartile range (IQR) | 0.021561 |
Descriptive statistics
Standard deviation | 0.13948127 |
---|---|
Coefficient of variation (CV) | 0.0037295273 |
Kurtosis | 114.52962 |
Mean | 37.399181 |
Median Absolute Deviation (MAD) | 0.009557 |
Skewness | -10.623755 |
Sum | 4413.1034 |
Variance | 0.019455025 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
37.383912 | 2 | 0.2% |
37.398096 | 2 | 0.2% |
37.406106 | 2 | 0.2% |
37.384878 | 2 | 0.2% |
37.409789 | 2 | 0.2% |
37.430122 | 2 | 0.2% |
37.382413 | 2 | 0.2% |
37.404158 | 1 | 0.1% |
37.405395 | 1 | 0.1% |
37.379755 | 1 | 0.1% |
Other values (101) | 101 | 8.4% |
(Missing) | 1086 |
Value | Count | Frequency (%) |
35.907757 | 1 | |
37.366701 | 1 | |
37.378451 | 1 | |
37.379755 | 1 | |
37.381413 | 1 | |
37.382413 | 2 | |
37.3825 | 1 | |
37.383912 | 2 | |
37.384878 | 2 | |
37.387343 | 1 |
Value | Count | Frequency (%) |
37.489775 | 1 | |
37.438592 | 1 | |
37.43494 | 1 | |
37.433917 | 1 | |
37.432719 | 1 | |
37.432187 | 1 | |
37.43205 | 1 | |
37.431419 | 1 | |
37.430405 | 1 | |
37.430122 | 2 |
경도
Real number (ℝ)
MISSING
 
Distinct | 111 |
---|---|
Distinct (%) | 94.1% |
Missing | 1086 |
Missing (%) | 90.2% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 126.67793 |
Minimum | 126.63169 |
---|---|
Maximum | 127.76692 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 10.7 KiB |
Quantile statistics
Minimum | 126.63169 |
---|---|
5-th percentile | 126.6391 |
Q1 | 126.65468 |
median | 126.67013 |
Q3 | 126.68173 |
95-th percentile | 126.69858 |
Maximum | 127.76692 |
Range | 1.135234 |
Interquartile range (IQR) | 0.02704475 |
Descriptive statistics
Standard deviation | 0.10291308 |
---|---|
Coefficient of variation (CV) | 0.00081239947 |
Kurtosis | 109.72631 |
Mean | 126.67793 |
Median Absolute Deviation (MAD) | 0.0137715 |
Skewness | 10.292266 |
Sum | 14947.995 |
Variance | 0.010591102 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
126.643855 | 2 | 0.2% |
126.631688 | 2 | 0.2% |
126.683724 | 2 | 0.2% |
126.658734 | 2 | 0.2% |
126.67832 | 2 | 0.2% |
126.698485 | 2 | 0.2% |
126.656355 | 2 | 0.2% |
126.681106 | 1 | 0.1% |
126.672745 | 1 | 0.1% |
126.644072 | 1 | 0.1% |
Other values (101) | 101 | 8.4% |
(Missing) | 1086 |
Value | Count | Frequency (%) |
126.631688 | 2 | |
126.633304 | 1 | |
126.636717 | 1 | |
126.638248 | 1 | |
126.638565 | 1 | |
126.639197 | 1 | |
126.640168 | 1 | |
126.640779 | 1 | |
126.642309 | 1 | |
126.643219 | 1 |
Value | Count | Frequency (%) |
127.766922 | 1 | |
126.723308 | 1 | |
126.701351 | 1 | |
126.701314 | 1 | |
126.699185 | 1 | |
126.699115 | 1 | |
126.698485 | 2 | |
126.698372 | 1 | |
126.698351 | 1 | |
126.698279 | 1 |
구분
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 4 |
---|---|
Distinct (%) | 0.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.5 KiB |
<NA> | |
---|---|
공중 | 82 |
개방(의무) | 32 |
개방(지정) | 4 |
Length
Max length | 6 |
---|---|
Median length | 4 |
Mean length | 3.923588 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 공중 |
---|---|
2nd row | 공중 |
3rd row | 공중 |
4th row | 공중 |
5th row | 공중 |
Common Values
Value | Count | Frequency (%) |
<NA> | 1086 | |
공중 | 82 | 6.8% |
개방(의무) | 32 | 2.7% |
개방(지정) | 4 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 1086 | |
공중 | 82 | 6.8% |
개방(의무 | 32 | 2.7% |
개방(지정 | 4 | 0.3% |
개방 지정일
Date
CONSTANT
  MISSING
 
Distinct | 1 |
---|---|
Distinct (%) | 100.0% |
Missing | 1203 |
Missing (%) | 99.9% |
Memory size | 9.5 KiB |
Minimum | 2011-05-23 00:00:00 |
---|---|
Maximum | 2011-05-23 00:00:00 |
유형
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 12 |
---|---|
Distinct (%) | 1.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.5 KiB |
<NA> | |
---|---|
공원 | 46 |
주유소 | 22 |
기타(관공서) | 17 |
지하철 | 12 |
Other values (7) | 21 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 3.923588 |
Min length | 2 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 공원 |
---|---|
2nd row | 공원 |
3rd row | 공원 |
4th row | 공원 |
5th row | 공원 |
Common Values
Value | Count | Frequency (%) |
<NA> | 1086 | |
공원 | 46 | 3.8% |
주유소 | 22 | 1.8% |
기타(관공서) | 17 | 1.4% |
지하철 | 12 | 1.0% |
시장 | 12 | 1.0% |
주유소(경기장) | 2 | 0.2% |
기타(빌딩) | 2 | 0.2% |
전철 | 2 | 0.2% |
유원지 | 1 | 0.1% |
Other values (2) | 2 | 0.2% |
Length
Value | Count | Frequency (%) |
na | 1086 | |
공원 | 46 | 3.8% |
주유소 | 22 | 1.8% |
기타(관공서 | 17 | 1.4% |
지하철 | 12 | 1.0% |
시장 | 12 | 1.0% |
주유소(경기장 | 2 | 0.2% |
기타(빌딩 | 2 | 0.2% |
전철 | 2 | 0.2% |
유원지 | 1 | 0.1% |
Other values (2) | 2 | 0.2% |
위도 | 경도 | 구분 | 유형 | |
---|---|---|---|---|
위도 | 1.000 | 0.695 | 0.047 | 0.000 |
경도 | 0.695 | 1.000 | 0.047 | 0.000 |
구분 | 0.047 | 0.047 | 1.000 | 0.943 |
유형 | 0.000 | 0.000 | 0.943 | 1.000 |
유형 | 구분 | |
---|---|---|
유형 | 1.000 | 0.887 |
구분 | 0.887 | 1.000 |
위도 | 경도 | 구분 | 유형 | |
---|---|---|---|---|
위도 | 1.000 | 0.394 | 0.077 | 0.000 |
경도 | 0.394 | 1.000 | 0.077 | 0.000 |
구분 | 0.077 | 0.077 | 1.000 | 0.887 |
유형 | 0.000 | 0.000 | 0.887 | 1.000 |
화장실명 | 위치 | 위도 | 경도 | 구분 | 개방 지정일 | 유형 | |
---|---|---|---|---|---|---|---|
0 | 양지 | 연수동 594-1 | 37.415099 | 126.678723 | 공중 | <NA> | 공원 |
1 | 청학 | 청학동 501 | 37.424563 | 126.665133 | 공중 | <NA> | 공원 |
2 | 용담 | 용담로 61 | 37.418569 | 126.674201 | 공중 | <NA> | 공원 |
3 | 문화 | 연수동 578 | 37.417376 | 126.68144 | 공중 | <NA> | 공원 |
4 | 솔밭 | 연수동 582-1 | 37.416298 | 126.6903 | 공중 | <NA> | 공원 |
5 | 대학 | 함박뫼로 194 | 37.421423 | 126.686352 | 공중 | <NA> | 공원 |
6 | 송도공중화장실 | 능허대로 192 | 37.416787 | 126.647824 | 공중 | <NA> | 유원지 |
7 | 아암도공중화장실 | 아암대로 555 | 37.413854 | 126.642309 | 공중 | <NA> | 기타 |
8 | 두리 | 비류대로541번길 14-7 | 37.423794 | 126.695201 | 공중 | <NA> | 공원 |
9 | 승기 | 선학동 348 | 37.419438 | 126.698372 | 공중 | <NA> | 공원 |
화장실명 | 위치 | 위도 | 경도 | 구분 | 개방 지정일 | 유형 | |
---|---|---|---|---|---|---|---|
1194 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1195 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1196 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1197 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1198 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1199 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1200 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1201 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1202 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
1203 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
화장실명 | 위치 | 위도 | 경도 | 구분 | 개방 지정일 | 유형 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 1086 |