Dataset statistics
Number of variables | 7 |
---|---|
Number of observations | 463 |
Missing cells | 221 |
Missing cells (%) | 6.8% |
Duplicate rows | 3 |
Duplicate rows (%) | 0.6% |
Total size in memory | 25.9 KiB |
Average record size in memory | 57.3 B |
Variable types
DateTime | 2 |
---|---|
Text | 2 |
Numeric | 1 |
Categorical | 1 |
Boolean | 1 |
Dataset
Description | 인천광역시 전기사업체등록 현황(허가일자,상호,설비용량,설치장소, 원동력 종류, 사업개시유무, 사업개시일 등)자료입니다 |
---|---|
Author | 인천광역시 |
URL | https://www.incheon.go.kr/data/DATA010201/view?docId=15030592 |
Dataset has 3 (0.6%) duplicate rows | Duplicates |
원동력 종류 is highly imbalanced (95.0%) | Imbalance |
사업개시일 has 221 (47.7%) missing values | Missing |
Reproduction
Analysis started | 2023-12-11 02:56:38.982473 |
---|---|
Analysis finished | 2023-12-11 02:56:39.694923 |
Duration | 0.71 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
허가일자
Date
Distinct | 255 |
---|---|
Distinct (%) | 55.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
Minimum | 2005-09-30 00:00:00 |
---|---|
Maximum | 2018-07-31 00:00:00 |
상 호
Text
Distinct | 449 |
---|---|
Distinct (%) | 97.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
Length
Max length | 28 |
---|---|
Median length | 23 |
Mean length | 10.784017 |
Min length | 4 |
Characters and Unicode
Total characters | 4993 |
---|---|
Distinct characters | 331 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 3 ? |
Unique
Unique | 435 ? |
---|---|
Unique (%) | 94.0% |
Sample
1st row | 동검 발전소 |
---|---|
2nd row | 기린에코 발전소 |
3rd row | 한국남동발전㈜ 영흥도 태양광 발전소 |
4th row | 해성 태양광발전소 |
5th row | 윤성근 태양광발전소 |
Value | Count | Frequency (%) |
태양광발전소 | 268 | |
발전소 | 22 | 2.6% |
주식회사 | 10 | 1.2% |
다주 | 8 | 0.9% |
태양광발전호 | 5 | 0.6% |
태양광 | 4 | 0.5% |
제1태양광발전소 | 4 | 0.5% |
2호 | 4 | 0.5% |
3호 | 3 | 0.3% |
인천항 | 3 | 0.3% |
Other values (492) | 527 |
Most occurring characters
Value | Count | Frequency (%) |
전 | 451 | 9.0% |
발 | 450 | 9.0% |
소 | 437 | 8.8% |
양 | 419 | 8.4% |
태 | 419 | 8.4% |
광 | 418 | 8.4% |
396 | 7.9% | |
호 | 111 | 2.2% |
이 | 52 | 1.0% |
2 | 52 | 1.0% |
Other values (321) | 1788 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 4311 | |
Space Separator | 396 | 7.9% |
Decimal Number | 165 | 3.3% |
Uppercase Letter | 42 | 0.8% |
Close Punctuation | 30 | 0.6% |
Open Punctuation | 30 | 0.6% |
Lowercase Letter | 9 | 0.2% |
Other Symbol | 8 | 0.2% |
Other Punctuation | 1 | < 0.1% |
Dash Punctuation | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
전 | 451 | 10.5% |
발 | 450 | 10.4% |
소 | 437 | 10.1% |
양 | 419 | 9.7% |
태 | 419 | 9.7% |
광 | 418 | 9.7% |
호 | 111 | 2.6% |
이 | 52 | 1.2% |
주 | 47 | 1.1% |
인 | 38 | 0.9% |
Other values (280) | 1469 |
Uppercase Letter
Value | Count | Frequency (%) |
S | 8 | |
G | 6 | |
C | 4 | |
P | 3 | 7.1% |
E | 3 | 7.1% |
N | 3 | 7.1% |
K | 3 | 7.1% |
T | 2 | 4.8% |
R | 2 | 4.8% |
D | 1 | 2.4% |
Other values (7) | 7 |
Decimal Number
Value | Count | Frequency (%) |
2 | 52 | |
1 | 49 | |
3 | 30 | |
4 | 15 | 9.1% |
5 | 6 | 3.6% |
0 | 4 | 2.4% |
6 | 4 | 2.4% |
8 | 2 | 1.2% |
7 | 2 | 1.2% |
9 | 1 | 0.6% |
Lowercase Letter
Value | Count | Frequency (%) |
o | 2 | |
y | 1 | |
h | 1 | |
g | 1 | |
n | 1 | |
l | 1 | |
e | 1 | |
c | 1 |
Space Separator
Value | Count | Frequency (%) |
396 |
Close Punctuation
Value | Count | Frequency (%) |
) | 30 |
Open Punctuation
Value | Count | Frequency (%) |
( | 30 |
Other Symbol
Value | Count | Frequency (%) |
㈜ | 8 |
Other Punctuation
Value | Count | Frequency (%) |
& | 1 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 4319 | |
Common | 623 | 12.5% |
Latin | 51 | 1.0% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
전 | 451 | 10.4% |
발 | 450 | 10.4% |
소 | 437 | 10.1% |
양 | 419 | 9.7% |
태 | 419 | 9.7% |
광 | 418 | 9.7% |
호 | 111 | 2.6% |
이 | 52 | 1.2% |
주 | 47 | 1.1% |
인 | 38 | 0.9% |
Other values (281) | 1477 |
Latin
Value | Count | Frequency (%) |
S | 8 | |
G | 6 | 11.8% |
C | 4 | 7.8% |
P | 3 | 5.9% |
E | 3 | 5.9% |
N | 3 | 5.9% |
K | 3 | 5.9% |
T | 2 | 3.9% |
R | 2 | 3.9% |
o | 2 | 3.9% |
Other values (15) | 15 |
Common
Value | Count | Frequency (%) |
396 | ||
2 | 52 | 8.3% |
1 | 49 | 7.9% |
3 | 30 | 4.8% |
) | 30 | 4.8% |
( | 30 | 4.8% |
4 | 15 | 2.4% |
5 | 6 | 1.0% |
0 | 4 | 0.6% |
6 | 4 | 0.6% |
Other values (5) | 7 | 1.1% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 4311 | |
ASCII | 674 | 13.5% |
None | 8 | 0.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
전 | 451 | 10.5% |
발 | 450 | 10.4% |
소 | 437 | 10.1% |
양 | 419 | 9.7% |
태 | 419 | 9.7% |
광 | 418 | 9.7% |
호 | 111 | 2.6% |
이 | 52 | 1.2% |
주 | 47 | 1.1% |
인 | 38 | 0.9% |
Other values (280) | 1469 |
ASCII
Value | Count | Frequency (%) |
396 | ||
2 | 52 | 7.7% |
1 | 49 | 7.3% |
3 | 30 | 4.5% |
) | 30 | 4.5% |
( | 30 | 4.5% |
4 | 15 | 2.2% |
S | 8 | 1.2% |
G | 6 | 0.9% |
5 | 6 | 0.9% |
Other values (30) | 52 | 7.7% |
None
Value | Count | Frequency (%) |
㈜ | 8 |
설비용량(kW)
Real number (ℝ)
Distinct | 265 |
---|---|
Distinct (%) | 57.2% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 206.9968 |
Minimum | 3 |
---|---|
Maximum | 3000 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 4.2 KiB |
Quantile statistics
Minimum | 3 |
---|---|
5-th percentile | 15 |
Q1 | 33 |
median | 97.2 |
Q3 | 99.845 |
95-th percentile | 997.92 |
Maximum | 3000 |
Range | 2997 |
Interquartile range (IQR) | 66.845 |
Descriptive statistics
Standard deviation | 407.97249 |
---|---|
Coefficient of variation (CV) | 1.970912 |
Kurtosis | 20.729164 |
Mean | 206.9968 |
Median Absolute Deviation (MAD) | 55.2 |
Skewness | 4.1649144 |
Sum | 95839.52 |
Variance | 166441.55 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
99.0 | 27 | 5.8% |
15.0 | 24 | 5.2% |
30.0 | 18 | 3.9% |
97.2 | 10 | 2.2% |
97.92 | 9 | 1.9% |
96.0 | 9 | 1.9% |
99.2 | 8 | 1.7% |
98.82 | 8 | 1.7% |
99.75 | 6 | 1.3% |
97.9 | 6 | 1.3% |
Other values (255) | 338 |
Value | Count | Frequency (%) |
3.0 | 2 | 0.4% |
6.0 | 1 | 0.2% |
9.0 | 6 | |
10.26 | 1 | 0.2% |
10.8 | 1 | 0.2% |
12.0 | 3 | |
12.24 | 1 | 0.2% |
13.5 | 1 | 0.2% |
14.28 | 1 | 0.2% |
14.84 | 1 | 0.2% |
Value | Count | Frequency (%) |
3000.0 | 1 | |
2993.76 | 2 | |
2929.24 | 1 | |
2081.75 | 1 | |
2003.22 | 1 | |
1900.8 | 1 | |
1620.0 | 1 | |
1584.0 | 1 | |
1566.0 | 1 | |
1506.6 | 1 |
설치장소
Text
Distinct | 419 |
---|---|
Distinct (%) | 90.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
Length
Max length | 63 |
---|---|
Median length | 45 |
Mean length | 23.658747 |
Min length | 11 |
Characters and Unicode
Total characters | 10954 |
---|---|
Distinct characters | 225 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 382 ? |
---|---|
Unique (%) | 82.5% |
Sample
1st row | 강화군 길상면 동검리 555 |
---|---|
2nd row | 옹진군 영흥면 내리 511-8 |
3rd row | 옹진군 영흥면 내리 1703-2 |
4th row | 남구 용현4동 183-6 |
5th row | 강화군 길상면 온수리 산 129-2 |
Value | Count | Frequency (%) |
인천광역시 | 326 | 14.2% |
강화군 | 225 | 9.8% |
서구 | 100 | 4.4% |
길상면 | 44 | 1.9% |
중구 | 41 | 1.8% |
하점면 | 35 | 1.5% |
옹진군 | 29 | 1.3% |
1호 | 27 | 1.2% |
남동구 | 26 | 1.1% |
영흥면 | 22 | 1.0% |
Other values (719) | 1421 |
Most occurring characters
Value | Count | Frequency (%) |
1834 | 16.7% | |
1 | 460 | 4.2% |
천 | 358 | 3.3% |
인 | 350 | 3.2% |
시 | 333 | 3.0% |
역 | 327 | 3.0% |
광 | 327 | 3.0% |
화 | 275 | 2.5% |
3 | 267 | 2.4% |
번 | 265 | 2.4% |
Other values (215) | 6158 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 6405 | |
Decimal Number | 2098 | 19.2% |
Space Separator | 1834 | 16.7% |
Dash Punctuation | 195 | 1.8% |
Close Punctuation | 172 | 1.6% |
Open Punctuation | 172 | 1.6% |
Other Punctuation | 71 | 0.6% |
Uppercase Letter | 7 | 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
천 | 358 | 5.6% |
인 | 350 | 5.5% |
시 | 333 | 5.2% |
역 | 327 | 5.1% |
광 | 327 | 5.1% |
화 | 275 | 4.3% |
번 | 265 | 4.1% |
군 | 254 | 4.0% |
강 | 250 | 3.9% |
면 | 237 | 3.7% |
Other values (194) | 3429 |
Decimal Number
Value | Count | Frequency (%) |
1 | 460 | |
3 | 267 | |
2 | 244 | |
5 | 201 | |
4 | 186 | |
7 | 182 | 8.7% |
6 | 172 | 8.2% |
8 | 135 | 6.4% |
9 | 127 | 6.1% |
0 | 124 | 5.9% |
Uppercase Letter
Value | Count | Frequency (%) |
L | 3 | |
B | 2 | |
O | 1 | 14.3% |
T | 1 | 14.3% |
Other Punctuation
Value | Count | Frequency (%) |
, | 69 | |
. | 1 | 1.4% |
/ | 1 | 1.4% |
Space Separator
Value | Count | Frequency (%) |
1834 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 195 |
Close Punctuation
Value | Count | Frequency (%) |
) | 172 |
Open Punctuation
Value | Count | Frequency (%) |
( | 172 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 6405 | |
Common | 4542 | |
Latin | 7 | 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
천 | 358 | 5.6% |
인 | 350 | 5.5% |
시 | 333 | 5.2% |
역 | 327 | 5.1% |
광 | 327 | 5.1% |
화 | 275 | 4.3% |
번 | 265 | 4.1% |
군 | 254 | 4.0% |
강 | 250 | 3.9% |
면 | 237 | 3.7% |
Other values (194) | 3429 |
Common
Value | Count | Frequency (%) |
1834 | ||
1 | 460 | 10.1% |
3 | 267 | 5.9% |
2 | 244 | 5.4% |
5 | 201 | 4.4% |
- | 195 | 4.3% |
4 | 186 | 4.1% |
7 | 182 | 4.0% |
) | 172 | 3.8% |
( | 172 | 3.8% |
Other values (7) | 629 | 13.8% |
Latin
Value | Count | Frequency (%) |
L | 3 | |
B | 2 | |
O | 1 | 14.3% |
T | 1 | 14.3% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 6405 | |
ASCII | 4549 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
1834 | ||
1 | 460 | 10.1% |
3 | 267 | 5.9% |
2 | 244 | 5.4% |
5 | 201 | 4.4% |
- | 195 | 4.3% |
4 | 186 | 4.1% |
7 | 182 | 4.0% |
) | 172 | 3.8% |
( | 172 | 3.8% |
Other values (11) | 636 | 14.0% |
Hangul
Value | Count | Frequency (%) |
천 | 358 | 5.6% |
인 | 350 | 5.5% |
시 | 333 | 5.2% |
역 | 327 | 5.1% |
광 | 327 | 5.1% |
화 | 275 | 4.3% |
번 | 265 | 4.1% |
군 | 254 | 4.0% |
강 | 250 | 3.9% |
면 | 237 | 3.7% |
Other values (194) | 3429 |
원동력 종류
Categorical
IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 0.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 3.7 KiB |
태양광 | |
---|---|
풍력 | 3 |
소수력 | 1 |
Length
Max length | 3 |
---|---|
Median length | 3 |
Mean length | 2.9935205 |
Min length | 2 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.2% |
Sample
1st row | 태양광 |
---|---|
2nd row | 태양광 |
3rd row | 태양광 |
4th row | 태양광 |
5th row | 태양광 |
Common Values
Value | Count | Frequency (%) |
태양광 | 459 | |
풍력 | 3 | 0.6% |
소수력 | 1 | 0.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
태양광 | 459 | |
풍력 | 3 | 0.6% |
소수력 | 1 | 0.2% |
사업개시유무
Boolean
Distinct | 2 |
---|---|
Distinct (%) | 0.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 595.0 B |
True | |
---|---|
False |
Value | Count | Frequency (%) |
True | 241 | |
False | 222 |
사업개시일
Date
MISSING
 
Distinct | 183 |
---|---|
Distinct (%) | 75.6% |
Missing | 221 |
Missing (%) | 47.7% |
Memory size | 3.7 KiB |
Minimum | 2005-11-23 00:00:00 |
---|---|
Maximum | 2018-08-01 00:00:00 |
설비용량(kW) | 원동력 종류 | 사업개시유무 | |
---|---|---|---|
설비용량(kW) | 1.000 | 0.246 | 0.051 |
원동력 종류 | 0.246 | 1.000 | 0.000 |
사업개시유무 | 0.051 | 0.000 | 1.000 |
원동력 종류 | 사업개시유무 | |
---|---|---|
원동력 종류 | 1.000 | 0.000 |
사업개시유무 | 0.000 | 1.000 |
설비용량(kW) | 원동력 종류 | 사업개시유무 | |
---|---|---|---|
설비용량(kW) | 1.000 | 0.160 | 0.038 |
원동력 종류 | 0.160 | 1.000 | 0.000 |
사업개시유무 | 0.038 | 0.000 | 1.000 |
허가일자 | 상 호 | 설비용량(kW) | 설치장소 | 원동력 종류 | 사업개시유무 | 사업개시일 | |
---|---|---|---|---|---|---|---|
0 | 2005-09-30 | 동검 발전소 | 3.0 | 강화군 길상면 동검리 555 | 태양광 | Y | 2005-11-23 |
1 | 2005-12-12 | 기린에코 발전소 | 3.0 | 옹진군 영흥면 내리 511-8 | 태양광 | Y | 2006-03-27 |
2 | 2006-02-27 | 한국남동발전㈜ 영흥도 태양광 발전소 | 1000.0 | 옹진군 영흥면 내리 1703-2 | 태양광 | Y | 2006-10-04 |
3 | 2007-11-29 | 해성 태양광발전소 | 6.0 | 남구 용현4동 183-6 | 태양광 | Y | 2008-01-02 |
4 | 2008-04-04 | 윤성근 태양광발전소 | 30.0 | 강화군 길상면 온수리 산 129-2 | 태양광 | Y | 2008-05-02 |
5 | 2008-04-04 | 이동근 태양광발전소 | 30.0 | 강화군 길상면 온수리 산 129-3 | 태양광 | Y | 2008-05-02 |
6 | 2008-04-17 | 이건 태양광발전소 | 27.44 | 인천광역시 남구 도화동 967-3 | 태양광 | Y | 2008-05-15 |
7 | 2008-07-10 | 고용민 태양광발전소 | 9.0 | 강화군 길상면 온수리 380-4 | 태양광 | Y | 2008-07-10 |
8 | 2008-08-25 | 신은주 태양광발전소 | 9.0 | 강화군 길상면 길직리 808 | 태양광 | Y | 2008-09-25 |
9 | 2009-04-17 | 국화리 태양광발전소 | 30.0 | 강화군 강화읍 국화리 67 | 태양광 | Y | 2009-07-29 |
허가일자 | 상 호 | 설비용량(kW) | 설치장소 | 원동력 종류 | 사업개시유무 | 사업개시일 | |
---|---|---|---|---|---|---|---|
453 | 2018-07-17 | 천우교양 태양광발전소 | 99.015 | 강화군 양도면 도장리 1647 | 태양광 | N | <NA> |
454 | 2018-07-17 | 햇살가득 태양광발전소 | 99.015 | 강화군 양도면 도장리 1647 | 태양광 | N | <NA> |
455 | 2018-07-23 | 에너지로드 제1태양광발전소 | 226.44 | 서구 검단천로356번길 11(건물위) | 태양광 | N | <NA> |
456 | 2018-07-23 | 원팜 태양광발전소 | 197.1 | 강화군 교동면 봉소리 654 | 태양광 | N | <NA> |
457 | 2018-07-23 | 하음2 태양광발전소 | 86.4 | 강화군 하점면 신봉리 1054-8(건물위) | 태양광 | N | <NA> |
458 | 2018-07-23 | 에너지로드 제1태양광발전소 | 226.44 | 서구 검단천로356번길 11(건물위) | 태양광 | N | <NA> |
459 | 2018-07-24 | 국화 태양광발전소 | 36.0 | 강화군 강화읍 강화대로440번길 5(옥상위) | 태양광 | N | <NA> |
460 | 2018-07-24 | 코퍼스 태양광발전소 | 99.28 | 서구 도담5로 77(건물위) | 태양광 | N | <NA> |
461 | 2018-07-31 | 부흥2 태양광발전소 | 99.96 | 강화군 교동면 고구리 111-5 | 태양광 | N | <NA> |
462 | 2018-07-31 | 아이엠써키트 태양광발전소 | 55.845 | 남동구 남동동로154번길 42(지붕위) | 태양광 | N | <NA> |
Most frequently occurring
허가일자 | 상 호 | 설비용량(kW) | 설치장소 | 원동력 종류 | 사업개시유무 | 사업개시일 | # duplicates | |
---|---|---|---|---|---|---|---|---|
0 | 2018-07-02 | 서경 발전소 | 64.8 | 서구 원창동 381-130(건물위) | 태양광 | N | <NA> | 2 |
1 | 2018-07-09 | 에이제이토탈㈜ 태양광발전소 | 99.0 | 서구 건지로 45-21(지붕위) | 태양광 | N | <NA> | 2 |
2 | 2018-07-23 | 에너지로드 제1태양광발전소 | 226.44 | 서구 검단천로356번길 11(건물위) | 태양광 | N | <NA> | 2 |