Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 1414 |
Missing cells | 9 |
Missing cells (%) | 0.2% |
Duplicate rows | 16 |
Duplicate rows (%) | 1.1% |
Total size in memory | 33.3 KiB |
Average record size in memory | 24.1 B |
Variable types
Text | 2 |
---|---|
Categorical | 1 |
Dataset
Description | 경기도 시흥시 공인 중개사 현황에 대한 데이터로, 시흥시 관내 공인중개사의 상호명, 소재지 (주소) 등으로 구성되어있습니다. |
---|---|
URL | https://www.data.go.kr/data/3071673/fileData.do |
Dataset has 16 (1.1%) duplicate rows | Duplicates |
데이터기준일자 is highly imbalanced (97.2%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 06:05:23.351306 |
---|---|
Analysis finished | 2023-12-12 06:05:24.047406 |
Duration | 0.7 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
상호명
Text
Distinct | 1134 |
---|---|
Distinct (%) | 80.4% |
Missing | 4 |
Missing (%) | 0.3% |
Memory size | 11.2 KiB |
Length
Max length | 33 |
---|---|
Median length | 25 |
Mean length | 12.592908 |
Min length | 5 |
Characters and Unicode
Total characters | 17756 |
---|---|
Distinct characters | 409 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 965 ? |
---|---|
Unique (%) | 68.4% |
Sample
1st row | 탑 공인중개사사무소 |
---|---|
2nd row | 이룸부동산 공인중개사사무소 |
3rd row | 성실 공인중개사사무소 |
4th row | 대동랜드 공인중개사사무소 |
5th row | 시화부동산경매컨설팅 공인중개사 |
Value | Count | Frequency (%) |
공인중개사사무소 | 1251 | |
공인중개사 | 36 | 1.2% |
사무소 | 33 | 1.1% |
부동산 | 15 | 0.5% |
삼성 | 11 | 0.4% |
대우 | 10 | 0.3% |
장현지구 | 9 | 0.3% |
행운 | 9 | 0.3% |
미래 | 9 | 0.3% |
우리 | 8 | 0.3% |
Other values (1111) | 1494 |
Most occurring characters
Value | Count | Frequency (%) |
사 | 2750 | |
1477 | 8.3% | |
중 | 1435 | 8.1% |
개 | 1415 | 8.0% |
인 | 1411 | 7.9% |
공 | 1386 | 7.8% |
소 | 1385 | 7.8% |
무 | 1378 | 7.8% |
동 | 315 | 1.8% |
산 | 299 | 1.7% |
Other values (399) | 4505 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 16055 | |
Space Separator | 1477 | 8.3% |
Uppercase Letter | 81 | 0.5% |
Decimal Number | 78 | 0.4% |
Open Punctuation | 27 | 0.2% |
Close Punctuation | 27 | 0.2% |
Lowercase Letter | 5 | < 0.1% |
Dash Punctuation | 4 | < 0.1% |
Other Punctuation | 2 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
사 | 2750 | |
중 | 1435 | 8.9% |
개 | 1415 | 8.8% |
인 | 1411 | 8.8% |
공 | 1386 | 8.6% |
소 | 1385 | 8.6% |
무 | 1378 | 8.6% |
동 | 315 | 2.0% |
산 | 299 | 1.9% |
부 | 281 | 1.8% |
Other values (363) | 4000 |
Uppercase Letter
Value | Count | Frequency (%) |
K | 15 | |
M | 11 | |
S | 10 | |
T | 9 | |
O | 8 | |
V | 7 | |
B | 4 | 4.9% |
L | 4 | 4.9% |
A | 3 | 3.7% |
P | 2 | 2.5% |
Other values (7) | 8 |
Decimal Number
Value | Count | Frequency (%) |
1 | 35 | |
4 | 11 | 14.1% |
9 | 8 | 10.3% |
5 | 6 | 7.7% |
6 | 5 | 6.4% |
3 | 4 | 5.1% |
2 | 4 | 5.1% |
0 | 3 | 3.8% |
7 | 1 | 1.3% |
8 | 1 | 1.3% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 3 | |
h | 1 | 20.0% |
o | 1 | 20.0% |
Other Punctuation
Value | Count | Frequency (%) |
! | 1 | |
& | 1 |
Space Separator
Value | Count | Frequency (%) |
1477 |
Open Punctuation
Value | Count | Frequency (%) |
( | 27 |
Close Punctuation
Value | Count | Frequency (%) |
) | 27 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 16055 | |
Common | 1615 | 9.1% |
Latin | 86 | 0.5% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
사 | 2750 | |
중 | 1435 | 8.9% |
개 | 1415 | 8.8% |
인 | 1411 | 8.8% |
공 | 1386 | 8.6% |
소 | 1385 | 8.6% |
무 | 1378 | 8.6% |
동 | 315 | 2.0% |
산 | 299 | 1.9% |
부 | 281 | 1.8% |
Other values (363) | 4000 |
Latin
Value | Count | Frequency (%) |
K | 15 | |
M | 11 | |
S | 10 | |
T | 9 | |
O | 8 | |
V | 7 | |
B | 4 | 4.7% |
L | 4 | 4.7% |
e | 3 | 3.5% |
A | 3 | 3.5% |
Other values (10) | 12 |
Common
Value | Count | Frequency (%) |
1477 | ||
1 | 35 | 2.2% |
( | 27 | 1.7% |
) | 27 | 1.7% |
4 | 11 | 0.7% |
9 | 8 | 0.5% |
5 | 6 | 0.4% |
6 | 5 | 0.3% |
- | 4 | 0.2% |
3 | 4 | 0.2% |
Other values (6) | 11 | 0.7% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 16055 | |
ASCII | 1701 | 9.6% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
사 | 2750 | |
중 | 1435 | 8.9% |
개 | 1415 | 8.8% |
인 | 1411 | 8.8% |
공 | 1386 | 8.6% |
소 | 1385 | 8.6% |
무 | 1378 | 8.6% |
동 | 315 | 2.0% |
산 | 299 | 1.9% |
부 | 281 | 1.8% |
Other values (363) | 4000 |
ASCII
Value | Count | Frequency (%) |
1477 | ||
1 | 35 | 2.1% |
( | 27 | 1.6% |
) | 27 | 1.6% |
K | 15 | 0.9% |
M | 11 | 0.6% |
4 | 11 | 0.6% |
S | 10 | 0.6% |
T | 9 | 0.5% |
O | 8 | 0.5% |
Other values (26) | 71 | 4.2% |
소재지
Text
Distinct | 1370 |
---|---|
Distinct (%) | 97.2% |
Missing | 5 |
Missing (%) | 0.4% |
Memory size | 11.2 KiB |
Length
Max length | 62 |
---|---|
Median length | 46 |
Mean length | 32.437899 |
Min length | 15 |
Characters and Unicode
Total characters | 45705 |
---|---|
Distinct characters | 355 |
Distinct categories | 9 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 1334 ? |
---|---|
Unique (%) | 94.7% |
Sample
1st row | 경기도 시흥시 진말로 36-1 103호(장곡동,우성@상가) |
---|---|
2nd row | 경기도 시흥시 하중로 193 102호(하중동) |
3rd row | 경기도 시흥시 정왕시장길 38 (정왕동1동) |
4th row | 경기도 시흥시 함송로29번길 37 |
5th row | 경기도 시흥시 옥구공원로 189 120호(정왕2동) |
Value | Count | Frequency (%) |
경기도 | 1407 | 17.0% |
시흥시 | 1404 | 17.0% |
1층 | 108 | 1.3% |
상가동 | 102 | 1.2% |
공단1대로 | 74 | 0.9% |
101호 | 45 | 0.5% |
244 | 37 | 0.4% |
중심상가로 | 36 | 0.4% |
서울대학로278번길 | 34 | 0.4% |
상가 | 33 | 0.4% |
Other values (1961) | 4997 |
Most occurring characters
Value | Count | Frequency (%) |
6902 | 15.1% | |
시 | 3002 | 6.6% |
1 | 2967 | 6.5% |
동 | 1669 | 3.7% |
흥 | 1495 | 3.3% |
기 | 1469 | 3.2% |
도 | 1460 | 3.2% |
경 | 1425 | 3.1% |
2 | 1289 | 2.8% |
로 | 1246 | 2.7% |
Other values (345) | 22781 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 26049 | |
Decimal Number | 9153 | 20.0% |
Space Separator | 6902 | 15.1% |
Close Punctuation | 1237 | 2.7% |
Open Punctuation | 1236 | 2.7% |
Other Punctuation | 628 | 1.4% |
Dash Punctuation | 326 | 0.7% |
Uppercase Letter | 168 | 0.4% |
Lowercase Letter | 6 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
시 | 3002 | 11.5% |
동 | 1669 | 6.4% |
흥 | 1495 | 5.7% |
기 | 1469 | 5.6% |
도 | 1460 | 5.6% |
경 | 1425 | 5.5% |
로 | 1246 | 4.8% |
호 | 1200 | 4.6% |
길 | 644 | 2.5% |
왕 | 590 | 2.3% |
Other values (309) | 11849 |
Uppercase Letter
Value | Count | Frequency (%) |
A | 43 | |
B | 38 | |
T | 20 | |
S | 15 | 8.9% |
C | 13 | 7.7% |
I | 9 | 5.4% |
N | 9 | 5.4% |
M | 4 | 2.4% |
Y | 4 | 2.4% |
V | 3 | 1.8% |
Other values (5) | 10 | 6.0% |
Decimal Number
Value | Count | Frequency (%) |
1 | 2967 | |
2 | 1289 | |
0 | 1216 | |
3 | 874 | 9.5% |
4 | 810 | 8.8% |
6 | 452 | 4.9% |
7 | 428 | 4.7% |
5 | 423 | 4.6% |
9 | 356 | 3.9% |
8 | 338 | 3.7% |
Lowercase Letter
Value | Count | Frequency (%) |
e | 2 | |
i | 1 | |
s | 1 | |
h | 1 | |
x | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 574 | |
@ | 54 | 8.6% |
Space Separator
Value | Count | Frequency (%) |
6902 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1237 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1236 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 326 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 26049 | |
Common | 19482 | |
Latin | 174 | 0.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
시 | 3002 | 11.5% |
동 | 1669 | 6.4% |
흥 | 1495 | 5.7% |
기 | 1469 | 5.6% |
도 | 1460 | 5.6% |
경 | 1425 | 5.5% |
로 | 1246 | 4.8% |
호 | 1200 | 4.6% |
길 | 644 | 2.5% |
왕 | 590 | 2.3% |
Other values (309) | 11849 |
Latin
Value | Count | Frequency (%) |
A | 43 | |
B | 38 | |
T | 20 | |
S | 15 | 8.6% |
C | 13 | 7.5% |
I | 9 | 5.2% |
N | 9 | 5.2% |
M | 4 | 2.3% |
Y | 4 | 2.3% |
V | 3 | 1.7% |
Other values (10) | 16 | 9.2% |
Common
Value | Count | Frequency (%) |
6902 | ||
1 | 2967 | |
2 | 1289 | 6.6% |
) | 1237 | 6.3% |
( | 1236 | 6.3% |
0 | 1216 | 6.2% |
3 | 874 | 4.5% |
4 | 810 | 4.2% |
, | 574 | 2.9% |
6 | 452 | 2.3% |
Other values (6) | 1925 | 9.9% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 26049 | |
ASCII | 19656 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
6902 | ||
1 | 2967 | |
2 | 1289 | 6.6% |
) | 1237 | 6.3% |
( | 1236 | 6.3% |
0 | 1216 | 6.2% |
3 | 874 | 4.4% |
4 | 810 | 4.1% |
, | 574 | 2.9% |
6 | 452 | 2.3% |
Other values (26) | 2099 | 10.7% |
Hangul
Value | Count | Frequency (%) |
시 | 3002 | 11.5% |
동 | 1669 | 6.4% |
흥 | 1495 | 5.7% |
기 | 1469 | 5.6% |
도 | 1460 | 5.6% |
경 | 1425 | 5.5% |
로 | 1246 | 4.8% |
호 | 1200 | 4.6% |
길 | 644 | 2.5% |
왕 | 590 | 2.3% |
Other values (309) | 11849 |
데이터기준일자
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 11.2 KiB |
2023-08-02 | |
---|---|
<NA> | 4 |
Length
Max length | 10 |
---|---|
Median length | 10 |
Mean length | 9.9830269 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 2023-08-02 |
---|---|
2nd row | 2023-08-02 |
3rd row | 2023-08-02 |
4th row | 2023-08-02 |
5th row | 2023-08-02 |
Common Values
Value | Count | Frequency (%) |
2023-08-02 | 1410 | |
<NA> | 4 | 0.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
2023-08-02 | 1410 | |
na | 4 | 0.3% |
상호명 | 소재지 | 데이터기준일자 | |
---|---|---|---|
0 | 탑 공인중개사사무소 | 경기도 시흥시 진말로 36-1 103호(장곡동,우성@상가) | 2023-08-02 |
1 | 이룸부동산 공인중개사사무소 | 경기도 시흥시 하중로 193 102호(하중동) | 2023-08-02 |
2 | 성실 공인중개사사무소 | 경기도 시흥시 정왕시장길 38 (정왕동1동) | 2023-08-02 |
3 | 대동랜드 공인중개사사무소 | 경기도 시흥시 함송로29번길 37 | 2023-08-02 |
4 | 시화부동산경매컨설팅 공인중개사 | 경기도 시흥시 옥구공원로 189 120호(정왕2동) | 2023-08-02 |
5 | 비전중개인사무소 이봉희 | 경기도 시흥시 호현로 42-19 1층(대야동) | 2023-08-02 |
6 | 롯데 부동산중개사무소 | 경기도 시흥시 호현로34번안길 8 (대야동) | 2023-08-02 |
7 | 경인부동산중개사무소 | 경기도 시흥시 호현로 102 1층(대야동) | 2023-08-02 |
8 | 그랑트리홈즈 공인중개사사무소 | 경기도 시흥시 은계호수로 49 1층 1131호(은행동, 시흥센트럴돔 그랑트리) | 2023-08-02 |
9 | 까치 공인중개사사무소 | 경기도 시흥시 군자로 521 지하 1층 B01호(거모동, ST타워) | 2023-08-02 |
상호명 | 소재지 | 데이터기준일자 | |
---|---|---|---|
1404 | 한라정문 공인중개사사무소 | 경기도 시흥시 서울대학로 172-20 상가2동 101호(배곧2동) | 2023-08-02 |
1405 | 서준 공인중개사사무소 | 경기도 시흥시 신천1길 9 103호(신천동) | 2023-08-02 |
1406 | 금솔부동산 공인중개사사무소 | 경기도 시흥시 목감남서로 92-15 목감중흥레이크힐스 제상가2동 110호(목감동) | 2023-08-02 |
1407 | 호반써밋 공인중개사사무소 | 경기도 시흥시 서울대학로264번길 12 호반써밋플레이스 207동 103호 | 2023-08-02 |
1408 | 더클래스 공인중개사사무소 | 경기도 시흥시 서촌상가1길 13 315호(정왕동, 신안프라자) | 2023-08-02 |
1409 | 풍림아이원 공인중개사사무소 | 경기도 시흥시 월곶중앙로14번길 27 101호(월곶동,풍림아이원4차@상가) | 2023-08-02 |
1410 | <NA> | <NA> | <NA> |
1411 | <NA> | <NA> | <NA> |
1412 | <NA> | <NA> | <NA> |
1413 | <NA> | <NA> | <NA> |
Most frequently occurring
상호명 | 소재지 | 데이터기준일자 | # duplicates | |
---|---|---|---|---|
15 | <NA> | <NA> | <NA> | 4 |
9 | 이화 공인중개사사무소 | 경기도 시흥시 봉우재로 199 103호(정왕본동) | 2023-08-02 | 3 |
0 | 거모 공인중개사사무소 | 경기도 시흥시 군자로 475 102호(거모동) | 2023-08-02 | 2 |
1 | 공장뱅크 공인중개사사무소 | 경기도 시흥시 공단1대로 204 공구상가 32동 210호 | 2023-08-02 | 2 |
2 | 동원베네스트 공인중개사사무소 | 경기도 시흥시 소망공원로 232 103호(정왕1동,시화동원베네스트) | 2023-08-02 | 2 |
3 | 럭키 부동산공인중개사사무소 | 경기도 시흥시 연성로29번길 32 101호(하중동, 참이슬아파트상가동) | 2023-08-02 | 2 |
4 | 매산플러스 공인중개사사무소 | 경기도 시흥시 매화산단2길 31 , 103호 (도창동, TNS프라자 상가) | 2023-08-02 | 2 |
5 | 부동산채널 공인중개사사무소 | 경기도 시흥시 은계남로 12 상가110호(은행동, 시흥은계 호반써밋플레이스 판매시설) | 2023-08-02 | 2 |
6 | 시흥시청역 트리플포레 공인중개사사무소 | 경기도 시흥시 장현천로 61 1층 4호(능곡동) | 2023-08-02 | 2 |
7 | 원룸 공인중개사사무소 | 경기도 시흥시 오이도1길 2 (정왕3동) | 2023-08-02 | 2 |