Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 1218 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 47.7 KiB |
Average record size in memory | 40.1 B |
Variable types
Categorical | 3 |
---|---|
Text | 2 |
Dataset
Description | 소방시설 설계업 현황(2019) |
---|---|
Author | 소방청 |
URL | https://www.data.go.kr/data/15064103/fileData.do |
등록구분 is highly imbalanced (94.3%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 17:26:55.962029 |
---|---|
Analysis finished | 2023-12-12 17:26:56.474386 |
Duration | 0.51 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
지역
Categorical
Distinct | 17 |
---|---|
Distinct (%) | 1.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.6 KiB |
서울특별시 | |
---|---|
경기도 | |
부산광역시 | |
경상북도 | |
경상남도 | |
Other values (12) |
Length
Max length | 7 |
---|---|
Median length | 5 |
Mean length | 4.3850575 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 강원도 |
---|---|
2nd row | 강원도 |
3rd row | 강원도 |
4th row | 강원도 |
5th row | 강원도 |
Common Values
Value | Count | Frequency (%) |
서울특별시 | 369 | |
경기도 | 231 | |
부산광역시 | 91 | 7.5% |
경상북도 | 71 | 5.8% |
경상남도 | 55 | 4.5% |
대구광역시 | 53 | 4.4% |
전라남도 | 48 | 3.9% |
대전광역시 | 44 | 3.6% |
인천광역시 | 44 | 3.6% |
충청남도 | 41 | 3.4% |
Other values (7) | 171 |
Length
Value | Count | Frequency (%) |
서울특별시 | 369 | |
경기도 | 231 | |
부산광역시 | 91 | 7.5% |
경상북도 | 71 | 5.8% |
경상남도 | 55 | 4.5% |
대구광역시 | 53 | 4.4% |
전라남도 | 48 | 3.9% |
인천광역시 | 44 | 3.6% |
대전광역시 | 44 | 3.6% |
충청남도 | 41 | 3.4% |
Other values (7) | 171 |
조회지역
Text
Distinct | 133 |
---|---|
Distinct (%) | 10.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.6 KiB |
Value | Count | Frequency (%) |
송파구 | 68 | 5.6% |
서초구 | 45 | 3.7% |
강남구 | 42 | 3.4% |
서구 | 39 | 3.2% |
금천구 | 35 | 2.9% |
안양시 | 35 | 2.9% |
성남시 | 32 | 2.6% |
남구 | 31 | 2.5% |
창원시 | 30 | 2.5% |
성동구 | 29 | 2.4% |
Other values (123) | 832 |
Most occurring characters
Value | Count | Frequency (%) |
구 | 694 | |
시 | 551 | 15.2% |
남 | 135 | 3.7% |
주 | 123 | 3.4% |
성 | 113 | 3.1% |
천 | 112 | 3.1% |
서 | 110 | 3.0% |
동 | 102 | 2.8% |
안 | 89 | 2.5% |
산 | 79 | 2.2% |
Other values (95) | 1519 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 3627 |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
구 | 694 | |
시 | 551 | 15.2% |
남 | 135 | 3.7% |
주 | 123 | 3.4% |
성 | 113 | 3.1% |
천 | 112 | 3.1% |
서 | 110 | 3.0% |
동 | 102 | 2.8% |
안 | 89 | 2.5% |
산 | 79 | 2.2% |
Other values (95) | 1519 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 3627 |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
구 | 694 | |
시 | 551 | 15.2% |
남 | 135 | 3.7% |
주 | 123 | 3.4% |
성 | 113 | 3.1% |
천 | 112 | 3.1% |
서 | 110 | 3.0% |
동 | 102 | 2.8% |
안 | 89 | 2.5% |
산 | 79 | 2.2% |
Other values (95) | 1519 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 3627 |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
구 | 694 | |
시 | 551 | 15.2% |
남 | 135 | 3.7% |
주 | 123 | 3.4% |
성 | 113 | 3.1% |
천 | 112 | 3.1% |
서 | 110 | 3.0% |
동 | 102 | 2.8% |
안 | 89 | 2.5% |
산 | 79 | 2.2% |
Other values (95) | 1519 |
상호
Text
Distinct | 1201 |
---|---|
Distinct (%) | 98.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.6 KiB |
Value | Count | Frequency (%) |
주식회사 | 254 | 16.8% |
기술사사무소 | 6 | 0.4% |
건축사사무소 | 4 | 0.3% |
엔지니어링 | 3 | 0.2% |
하나이엔지 | 3 | 0.2% |
주)대한소방공사 | 2 | 0.1% |
주)한빛엔지니어링 | 2 | 0.1% |
삼보기술단 | 2 | 0.1% |
유한회사 | 2 | 0.1% |
제일엔지니어링 | 2 | 0.1% |
Other values (1209) | 1229 |
Most occurring characters
Value | Count | Frequency (%) |
주 | 997 | 8.8% |
( | 750 | 6.6% |
) | 750 | 6.6% |
엔 | 515 | 4.5% |
사 | 504 | 4.4% |
이 | 489 | 4.3% |
지 | 470 | 4.1% |
어 | 315 | 2.8% |
니 | 314 | 2.8% |
링 | 310 | 2.7% |
Other values (318) | 5960 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 9433 | |
Open Punctuation | 750 | 6.6% |
Close Punctuation | 750 | 6.6% |
Space Separator | 292 | 2.6% |
Uppercase Letter | 130 | 1.1% |
Lowercase Letter | 9 | 0.1% |
Decimal Number | 6 | 0.1% |
Other Punctuation | 4 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 997 | 10.6% |
엔 | 515 | 5.5% |
사 | 504 | 5.3% |
이 | 489 | 5.2% |
지 | 470 | 5.0% |
어 | 315 | 3.3% |
니 | 314 | 3.3% |
링 | 310 | 3.3% |
기 | 264 | 2.8% |
회 | 259 | 2.7% |
Other values (286) | 4996 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 32 | |
N | 22 | |
G | 20 | |
S | 13 | |
C | 11 | 8.5% |
T | 6 | 4.6% |
M | 4 | 3.1% |
A | 4 | 3.1% |
F | 4 | 3.1% |
J | 3 | 2.3% |
Other values (7) | 11 | 8.5% |
Lowercase Letter
Value | Count | Frequency (%) |
n | 2 | |
o | 2 | |
s | 1 | |
e | 1 | |
k | 1 | |
a | 1 | |
m | 1 |
Decimal Number
Value | Count | Frequency (%) |
1 | 4 | |
9 | 1 | 16.7% |
2 | 1 | 16.7% |
Other Punctuation
Value | Count | Frequency (%) |
& | 2 | |
. | 2 |
Open Punctuation
Value | Count | Frequency (%) |
( | 750 |
Close Punctuation
Value | Count | Frequency (%) |
) | 750 |
Space Separator
Value | Count | Frequency (%) |
292 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 9433 | |
Common | 1802 | 15.8% |
Latin | 139 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 997 | 10.6% |
엔 | 515 | 5.5% |
사 | 504 | 5.3% |
이 | 489 | 5.2% |
지 | 470 | 5.0% |
어 | 315 | 3.3% |
니 | 314 | 3.3% |
링 | 310 | 3.3% |
기 | 264 | 2.8% |
회 | 259 | 2.7% |
Other values (286) | 4996 |
Latin
Value | Count | Frequency (%) |
E | 32 | |
N | 22 | |
G | 20 | |
S | 13 | |
C | 11 | 7.9% |
T | 6 | 4.3% |
M | 4 | 2.9% |
A | 4 | 2.9% |
F | 4 | 2.9% |
J | 3 | 2.2% |
Other values (14) | 20 |
Common
Value | Count | Frequency (%) |
( | 750 | |
) | 750 | |
292 | 16.2% | |
1 | 4 | 0.2% |
& | 2 | 0.1% |
. | 2 | 0.1% |
9 | 1 | 0.1% |
2 | 1 | 0.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 9433 | |
ASCII | 1941 | 17.1% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
주 | 997 | 10.6% |
엔 | 515 | 5.5% |
사 | 504 | 5.3% |
이 | 489 | 5.2% |
지 | 470 | 5.0% |
어 | 315 | 3.3% |
니 | 314 | 3.3% |
링 | 310 | 3.3% |
기 | 264 | 2.8% |
회 | 259 | 2.7% |
Other values (286) | 4996 |
ASCII
Value | Count | Frequency (%) |
( | 750 | |
) | 750 | |
292 | 15.0% | |
E | 32 | 1.6% |
N | 22 | 1.1% |
G | 20 | 1.0% |
S | 13 | 0.7% |
C | 11 | 0.6% |
T | 6 | 0.3% |
1 | 4 | 0.2% |
Other values (22) | 41 | 2.1% |
분야(설계업)
Categorical
Distinct | 5 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.6 KiB |
일반(전기),일반(기계) | |
---|---|
전문 | |
일반(전기) | |
일반(기계) | |
전문,일반(전기),일반(기계) | 1 |
Length
Max length | 16 |
---|---|
Median length | 13 |
Mean length | 9.5139573 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.1% |
Sample
1st row | 일반(전기),일반(기계) |
---|---|
2nd row | 일반(전기),일반(기계) |
3rd row | 일반(전기),일반(기계) |
4th row | 일반(전기),일반(기계) |
5th row | 일반(전기),일반(기계) |
Common Values
Value | Count | Frequency (%) |
일반(전기),일반(기계) | 726 | |
전문 | 203 | 16.7% |
일반(전기) | 162 | 13.3% |
일반(기계) | 126 | 10.3% |
전문,일반(전기),일반(기계) | 1 | 0.1% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
일반(전기),일반(기계 | 726 | |
전문 | 203 | 16.7% |
일반(전기 | 162 | 13.3% |
일반(기계 | 126 | 10.3% |
전문,일반(전기),일반(기계 | 1 | 0.1% |
등록구분
Categorical
IMBALANCE
 
Distinct | 2 |
---|---|
Distinct (%) | 0.2% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 9.6 KiB |
기존 | |
---|---|
휴업 | 8 |
Length
Max length | 2 |
---|---|
Median length | 2 |
Mean length | 2 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기존 |
---|---|
2nd row | 기존 |
3rd row | 기존 |
4th row | 기존 |
5th row | 기존 |
Common Values
Value | Count | Frequency (%) |
기존 | 1210 | |
휴업 | 8 | 0.7% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
기존 | 1210 | |
휴업 | 8 | 0.7% |
지역 | 분야(설계업) | 등록구분 | |
---|---|---|---|
지역 | 1.000 | 0.326 | 0.073 |
분야(설계업) | 0.326 | 1.000 | 0.050 |
등록구분 | 0.073 | 0.050 | 1.000 |
등록구분 | 지역 | 분야(설계업) | |
---|---|---|---|
등록구분 | 1.000 | 0.065 | 0.061 |
지역 | 0.065 | 1.000 | 0.173 |
분야(설계업) | 0.061 | 0.173 | 1.000 |
지역 | 분야(설계업) | 등록구분 | |
---|---|---|---|
지역 | 1.000 | 0.173 | 0.065 |
분야(설계업) | 0.173 | 1.000 | 0.061 |
등록구분 | 0.065 | 0.061 | 1.000 |
지역 | 조회지역 | 상호 | 분야(설계업) | 등록구분 | |
---|---|---|---|---|---|
0 | 강원도 | 강릉시 | 다감이엔지 | 일반(전기),일반(기계) | 기존 |
1 | 강원도 | 강릉시 | 신호ENG | 일반(전기),일반(기계) | 기존 |
2 | 강원도 | 강릉시 | (주)대주기술 | 일반(전기),일반(기계) | 기존 |
3 | 강원도 | 강릉시 | (주)화신엔지니어링 | 일반(전기),일반(기계) | 기존 |
4 | 강원도 | 강릉시 | 인선설계감리 | 일반(전기),일반(기계) | 기존 |
5 | 강원도 | 강릉시 | 다보이엔지 주식회사 | 일반(전기),일반(기계) | 기존 |
6 | 강원도 | 강릉시 | 대현설계감리사무소 | 일반(전기),일반(기계) | 기존 |
7 | 강원도 | 동해시 | 주식회사 동해소방설비 | 일반(전기),일반(기계) | 기존 |
8 | 강원도 | 삼척시 | (주)한일엔지니어링 | 일반(전기),일반(기계) | 기존 |
9 | 강원도 | 속초시 | 주식회사 탑설계감리사무소 | 일반(전기),일반(기계) | 기존 |
지역 | 조회지역 | 상호 | 분야(설계업) | 등록구분 | |
---|---|---|---|---|---|
1208 | 충청북도 | 청주시 | 주식회사 탑테크엔지니어링 | 전문 | 기존 |
1209 | 충청북도 | 청주시 | 주식회사 원 | 일반(전기),일반(기계) | 기존 |
1210 | 충청북도 | 청주시 | 씨케이엔지니어링 | 일반(전기),일반(기계) | 기존 |
1211 | 충청북도 | 청주시 | DS엔지니어링 | 일반(전기),일반(기계) | 기존 |
1212 | 충청북도 | 청주시 | (주)건사엔지니어링 | 전문 | 기존 |
1213 | 충청북도 | 충주시 | 주식회사 중앙방재 | 전문 | 기존 |
1214 | 충청북도 | 충주시 | (주)예원엔지니어링건축사사무소 | 일반(기계) | 기존 |
1215 | 충청북도 | 충주시 | 예인전기기술사사무소 | 일반(전기),일반(기계) | 기존 |
1216 | 충청북도 | 충주시 | 주식회사 에이스소방 | 일반(전기),일반(기계) | 기존 |
1217 | 충청북도 | 충주시 | 주식회사 좋은이엔지 | 일반(전기) | 기존 |