Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 488.3 KiB |
Average record size in memory | 50.0 B |
Variable types
Text | 3 |
---|---|
Categorical | 1 |
Numeric | 1 |
Dataset
Description | 파일 다운로드 |
---|---|
Author | 서울특별시 |
URL | https://data.seoul.go.kr/dataList/OA-15821/S/1/datasetView.do |
Reproduction
Analysis started | 2024-05-18 02:46:33.366947 |
---|---|
Analysis finished | 2024-05-18 02:46:34.784819 |
Duration | 1.42 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
아파트명
Text
Distinct | 2150 |
---|---|
Distinct (%) | 21.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
아파트 | 194 | 1.8% |
래미안 | 53 | 0.5% |
e편한세상 | 32 | 0.3% |
송파 | 22 | 0.2% |
이편한세상 | 22 | 0.2% |
고덕 | 21 | 0.2% |
아이파크 | 21 | 0.2% |
sk뷰 | 17 | 0.2% |
북한산 | 16 | 0.1% |
목동14단지 | 16 | 0.1% |
Other values (2231) | 10513 |
Most occurring characters
Value | Count | Frequency (%) |
아 | 2645 | 3.5% |
파 | 2635 | 3.5% |
트 | 2562 | 3.4% |
지 | 1776 | 2.4% |
동 | 1684 | 2.3% |
대 | 1647 | 2.2% |
이 | 1546 | 2.1% |
신 | 1484 | 2.0% |
차 | 1425 | 1.9% |
단 | 1394 | 1.9% |
Other values (424) | 55822 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 68378 | |
Decimal Number | 3496 | 4.7% |
Space Separator | 1037 | 1.4% |
Uppercase Letter | 844 | 1.1% |
Lowercase Letter | 329 | 0.4% |
Close Punctuation | 154 | 0.2% |
Open Punctuation | 154 | 0.2% |
Other Punctuation | 114 | 0.2% |
Dash Punctuation | 109 | 0.1% |
Letter Number | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
아 | 2645 | 3.9% |
파 | 2635 | 3.9% |
트 | 2562 | 3.7% |
지 | 1776 | 2.6% |
동 | 1684 | 2.5% |
대 | 1647 | 2.4% |
이 | 1546 | 2.3% |
신 | 1484 | 2.2% |
차 | 1425 | 2.1% |
단 | 1394 | 2.0% |
Other values (379) | 49580 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 143 | |
S | 123 | |
D | 113 | |
M | 113 | |
K | 90 | |
H | 39 | 4.6% |
E | 39 | 4.6% |
L | 36 | 4.3% |
I | 35 | 4.1% |
V | 29 | 3.4% |
Other values (7) | 84 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 194 | |
i | 25 | 7.6% |
l | 22 | 6.7% |
s | 21 | 6.4% |
k | 19 | 5.8% |
v | 18 | 5.5% |
w | 12 | 3.6% |
c | 8 | 2.4% |
h | 6 | 1.8% |
a | 2 | 0.6% |
Decimal Number
Value | Count | Frequency (%) |
2 | 1023 | |
1 | 995 | |
3 | 476 | |
4 | 244 | 7.0% |
5 | 222 | 6.4% |
6 | 173 | 4.9% |
7 | 106 | 3.0% |
8 | 105 | 3.0% |
9 | 83 | 2.4% |
0 | 69 | 2.0% |
Other Punctuation
Value | Count | Frequency (%) |
, | 98 | |
. | 16 | 14.0% |
Space Separator
Value | Count | Frequency (%) |
1037 |
Close Punctuation
Value | Count | Frequency (%) |
) | 154 |
Open Punctuation
Value | Count | Frequency (%) |
( | 154 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 109 |
Letter Number
Value | Count | Frequency (%) |
Ⅰ | 5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 68378 | |
Common | 5064 | 6.8% |
Latin | 1178 | 1.6% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
아 | 2645 | 3.9% |
파 | 2635 | 3.9% |
트 | 2562 | 3.7% |
지 | 1776 | 2.6% |
동 | 1684 | 2.5% |
대 | 1647 | 2.4% |
이 | 1546 | 2.3% |
신 | 1484 | 2.2% |
차 | 1425 | 2.1% |
단 | 1394 | 2.0% |
Other values (379) | 49580 |
Latin
Value | Count | Frequency (%) |
e | 194 | |
C | 143 | |
S | 123 | |
D | 113 | |
M | 113 | |
K | 90 | 7.6% |
H | 39 | 3.3% |
E | 39 | 3.3% |
L | 36 | 3.1% |
I | 35 | 3.0% |
Other values (19) | 253 |
Common
Value | Count | Frequency (%) |
1037 | ||
2 | 1023 | |
1 | 995 | |
3 | 476 | |
4 | 244 | 4.8% |
5 | 222 | 4.4% |
6 | 173 | 3.4% |
) | 154 | 3.0% |
( | 154 | 3.0% |
- | 109 | 2.2% |
Other values (6) | 477 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 68378 | |
ASCII | 6237 | 8.4% |
Number Forms | 5 | < 0.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
아 | 2645 | 3.9% |
파 | 2635 | 3.9% |
트 | 2562 | 3.7% |
지 | 1776 | 2.6% |
동 | 1684 | 2.5% |
대 | 1647 | 2.4% |
이 | 1546 | 2.3% |
신 | 1484 | 2.2% |
차 | 1425 | 2.1% |
단 | 1394 | 2.0% |
Other values (379) | 49580 |
ASCII
Value | Count | Frequency (%) |
1037 | ||
2 | 1023 | |
1 | 995 | |
3 | 476 | 7.6% |
4 | 244 | 3.9% |
5 | 222 | 3.6% |
e | 194 | 3.1% |
6 | 173 | 2.8% |
) | 154 | 2.5% |
( | 154 | 2.5% |
Other values (34) | 1565 |
Number Forms
Value | Count | Frequency (%) |
Ⅰ | 5 |
아파트코드
Text
Distinct | 2154 |
---|---|
Distinct (%) | 21.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
a15807606 | 16 | 0.2% |
a13187201 | 13 | 0.1% |
a10024254 | 13 | 0.1% |
a13613009 | 12 | 0.1% |
a13876114 | 12 | 0.1% |
a13981901 | 12 | 0.1% |
a13204104 | 12 | 0.1% |
a12013003 | 12 | 0.1% |
a13813010 | 11 | 0.1% |
a13822002 | 11 | 0.1% |
Other values (2144) | 9876 |
Most occurring characters
Value | Count | Frequency (%) |
0 | 18616 | |
1 | 17305 | |
A | 10000 | |
3 | 8714 | |
2 | 8578 | |
5 | 6164 | 6.8% |
8 | 5599 | 6.2% |
7 | 4532 | 5.0% |
4 | 4138 | 4.6% |
6 | 3434 | 3.8% |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 80000 | |
Uppercase Letter | 10000 | 11.1% |
Most frequent character per category
Decimal Number
Value | Count | Frequency (%) |
0 | 18616 | |
1 | 17305 | |
3 | 8714 | |
2 | 8578 | |
5 | 6164 | 7.7% |
8 | 5599 | 7.0% |
7 | 4532 | 5.7% |
4 | 4138 | 5.2% |
6 | 3434 | 4.3% |
9 | 2920 | 3.6% |
Uppercase Letter
Value | Count | Frequency (%) |
A | 10000 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 80000 | |
Latin | 10000 | 11.1% |
Most frequent character per script
Common
Value | Count | Frequency (%) |
0 | 18616 | |
1 | 17305 | |
3 | 8714 | |
2 | 8578 | |
5 | 6164 | 7.7% |
8 | 5599 | 7.0% |
7 | 4532 | 5.7% |
4 | 4138 | 5.2% |
6 | 3434 | 4.3% |
9 | 2920 | 3.6% |
Latin
Value | Count | Frequency (%) |
A | 10000 |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 90000 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
0 | 18616 | |
1 | 17305 | |
A | 10000 | |
3 | 8714 | |
2 | 8578 | |
5 | 6164 | 6.8% |
8 | 5599 | 6.2% |
7 | 4532 | 5.0% |
4 | 4138 | 4.6% |
6 | 3434 | 3.8% |
비용명
Text
Distinct | 86 |
---|---|
Distinct (%) | 0.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
승강기유지비 | 257 | 2.6% |
수선유지비 | 238 | 2.4% |
급여 | 233 | 2.3% |
통신비 | 230 | 2.3% |
사무용품비 | 223 | 2.2% |
경비비 | 222 | 2.2% |
교육비 | 219 | 2.2% |
소독비 | 215 | 2.1% |
세대전기료 | 210 | 2.1% |
복리후생비 | 210 | 2.1% |
Other values (76) | 7743 |
Most occurring characters
Value | Count | Frequency (%) |
비 | 5457 | 11.3% |
수 | 3490 | 7.3% |
료 | 2101 | 4.4% |
익 | 1978 | 4.1% |
기 | 1378 | 2.9% |
용 | 1371 | 2.8% |
대 | 1082 | 2.2% |
리 | 909 | 1.9% |
지 | 808 | 1.7% |
보 | 801 | 1.7% |
Other values (110) | 28732 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 48107 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
비 | 5457 | 11.3% |
수 | 3490 | 7.3% |
료 | 2101 | 4.4% |
익 | 1978 | 4.1% |
기 | 1378 | 2.9% |
용 | 1371 | 2.8% |
대 | 1082 | 2.2% |
리 | 909 | 1.9% |
지 | 808 | 1.7% |
보 | 801 | 1.7% |
Other values (110) | 28732 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 48107 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
비 | 5457 | 11.3% |
수 | 3490 | 7.3% |
료 | 2101 | 4.4% |
익 | 1978 | 4.1% |
기 | 1378 | 2.9% |
용 | 1371 | 2.8% |
대 | 1082 | 2.2% |
리 | 909 | 1.9% |
지 | 808 | 1.7% |
보 | 801 | 1.7% |
Other values (110) | 28732 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 48107 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
비 | 5457 | 11.3% |
수 | 3490 | 7.3% |
료 | 2101 | 4.4% |
익 | 1978 | 4.1% |
기 | 1378 | 2.9% |
용 | 1371 | 2.8% |
대 | 1082 | 2.2% |
리 | 909 | 1.9% |
지 | 808 | 1.7% |
보 | 801 | 1.7% |
Other values (110) | 28732 |
년월일
Categorical
CONSTANT
 
Distinct | 1 |
---|---|
Distinct (%) | < 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
202312 |
---|
Length
Max length | 6 |
---|---|
Median length | 6 |
Mean length | 6 |
Min length | 6 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 202312 |
---|---|
2nd row | 202312 |
3rd row | 202312 |
4th row | 202312 |
5th row | 202312 |
Common Values
Value | Count | Frequency (%) |
202312 | 10000 |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
202312 | 10000 |
금액
Real number (ℝ)
ZEROS
 
Distinct | 7152 |
---|---|
Distinct (%) | 71.5% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 4630968.1 |
Minimum | -97721050 |
---|---|
Maximum | 5.509708 × 108 |
Zeros | 1309 |
Zeros (%) | 13.1% |
Negative | 21 |
Negative (%) | 0.2% |
Memory size | 166.0 KiB |
Quantile statistics
Minimum | -97721050 |
---|---|
5-th percentile | 0 |
Q1 | 72175 |
median | 328230 |
Q3 | 1602092.5 |
95-th percentile | 22409322 |
Maximum | 5.509708 × 108 |
Range | 6.4869185 × 108 |
Interquartile range (IQR) | 1529917.5 |
Descriptive statistics
Standard deviation | 18633773 |
---|---|
Coefficient of variation (CV) | 4.0237317 |
Kurtosis | 208.16744 |
Mean | 4630968.1 |
Median Absolute Deviation (MAD) | 328230 |
Skewness | 11.672279 |
Sum | 4.6309681 × 1010 |
Variance | 3.472175 × 1014 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
0 | 1309 | 13.1% |
200000 | 63 | 0.6% |
300000 | 59 | 0.6% |
100000 | 57 | 0.6% |
150000 | 50 | 0.5% |
60000 | 31 | 0.3% |
30000 | 30 | 0.3% |
600000 | 30 | 0.3% |
50000 | 29 | 0.3% |
250000 | 29 | 0.3% |
Other values (7142) | 8313 |
Value | Count | Frequency (%) |
-97721050 | 1 | |
-23750000 | 1 | |
-14890911 | 1 | |
-12400000 | 1 | |
-12211328 | 1 | |
-10811000 | 1 | |
-6833040 | 1 | |
-2311700 | 1 | |
-1200000 | 1 | |
-614770 | 1 |
Value | Count | Frequency (%) |
550970800 | 1 | |
415078400 | 1 | |
413106110 | 1 | |
366227130 | 1 | |
361462346 | 1 | |
351480460 | 1 | |
334995005 | 1 | |
288745580 | 1 | |
264658165 | 1 | |
245813329 | 1 |
비용명 | 금액 | |
---|---|---|
비용명 | 1.000 | 0.569 |
금액 | 0.569 | 1.000 |
아파트명 | 아파트코드 | 비용명 | 년월일 | 금액 | |
---|---|---|---|---|---|
34687 | 왕십리풍림아이원 | A13302206 | 급여 | 202312 | 18482170 |
73681 | 자양우성2차 | A14386109 | 정화조관리비 | 202312 | 273005 |
52472 | 반포미도2차 | A13770105 | 승강기유지비 | 202312 | 522500 |
76344 | 당산쌍용예가클래식 | A15072001 | 충당부채전입이자비용 | 202312 | 6322 |
71227 | 래미안미아1차 | A14277601 | 주차장수익 | 202312 | 1417740 |
83402 | 고척벽산블루밍 | A15283711 | 임대료수익 | 202312 | 2400000 |
42980 | 세곡리엔파크3단지 | A13519003 | 소독비 | 202312 | 260000 |
32330 | 창동대동 | A13204501 | 산재보험료 | 202312 | 53770 |
8044 | 이편한세상 상도노빌리티 | A10025768 | 음식물처리비 | 202312 | 1265640 |
38221 | 서울숲한신더휴아파트 | A13386702 | 장기수선비 | 202312 | 30134200 |
아파트명 | 아파트코드 | 비용명 | 년월일 | 금액 | |
---|---|---|---|---|---|
50187 | 종암극동아파트 | A13671207 | 복리후생비 | 202312 | 0 |
74699 | 당산성원아파트 | A15004501 | 연체료수익 | 202312 | 6130 |
61289 | 상계주공16단지 | A13920803 | 충당부채전입이자비용 | 202312 | 4499436 |
91472 | 마곡엠밸리4단지 | A15721008 | 통신비 | 202312 | 118750 |
63327 | 공릉비선 | A13980018 | 감가상각비 | 202312 | 0 |
6841 | 항동하버라인4단지아파트 | A10025302 | 교통비 | 202312 | 0 |
97714 | 목동6단지 | A15875103 | 부과차익 | 202312 | 19864 |
19807 | 마포동원베네스트 | A12170401 | 교통비 | 202312 | 0 |
15457 | 효성주얼리시티아파트 | A11041001 | 보험료 | 202312 | 1438350 |
99431 | 은평뉴타운마고정3단지 | A41279912 | 급여 | 202312 | 15353180 |