Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 253 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 8.3 KiB |
Average record size in memory | 33.5 B |
Variable types
Categorical | 1 |
---|---|
Numeric | 1 |
Text | 1 |
DateTime | 1 |
Dataset
Description | 한국동서발전 발전소별 견학 현황 데이터를 제공합니다. 발전소별 견학 현황은 구분, 인원, 참여그룹, 신청날짜의 항목으로 구성됩니다. |
---|---|
URL | https://www.data.go.kr/data/15009799/fileData.do |
구분 is highly imbalanced (72.7%) | Imbalance |
Reproduction
Analysis started | 2023-12-12 21:08:00.539122 |
---|---|
Analysis finished | 2023-12-12 21:08:00.932485 |
Duration | 0.39 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
구분
Categorical
IMBALANCE
 
Distinct | 5 |
---|---|
Distinct (%) | 2.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
당진발전 | |
---|---|
동해발전 | 11 |
울산발전 | 8 |
일산발전 | 5 |
호남발전 | 1 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 4 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 0.4% |
Sample
1st row | 일산발전 |
---|---|
2nd row | 울산발전 |
3rd row | 당진발전 |
4th row | 동해발전 |
5th row | 동해발전 |
Common Values
Value | Count | Frequency (%) |
당진발전 | 228 | |
동해발전 | 11 | 4.3% |
울산발전 | 8 | 3.2% |
일산발전 | 5 | 2.0% |
호남발전 | 1 | 0.4% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
당진발전 | 228 | |
동해발전 | 11 | 4.3% |
울산발전 | 8 | 3.2% |
일산발전 | 5 | 2.0% |
호남발전 | 1 | 0.4% |
인원
Real number (ℝ)
Distinct | 43 |
---|---|
Distinct (%) | 17.0% |
Missing | 0 |
Missing (%) | 0.0% |
Infinite | 0 |
Infinite (%) | 0.0% |
Mean | 17.885375 |
Minimum | 1 |
---|---|
Maximum | 120 |
Zeros | 0 |
Zeros (%) | 0.0% |
Negative | 0 |
Negative (%) | 0.0% |
Memory size | 2.4 KiB |
Quantile statistics
Minimum | 1 |
---|---|
5-th percentile | 2 |
Q1 | 4 |
median | 11 |
Q3 | 28 |
95-th percentile | 42.8 |
Maximum | 120 |
Range | 119 |
Interquartile range (IQR) | 24 |
Descriptive statistics
Standard deviation | 18.452607 |
---|---|
Coefficient of variation (CV) | 1.0317148 |
Kurtosis | 7.8491982 |
Mean | 17.885375 |
Median Absolute Deviation (MAD) | 8 |
Skewness | 2.3499632 |
Sum | 4525 |
Variance | 340.49871 |
Monotonicity | Not monotonic |
Value | Count | Frequency (%) |
3 | 25 | 9.9% |
4 | 21 | 8.3% |
10 | 19 | 7.5% |
2 | 17 | 6.7% |
30 | 15 | 5.9% |
8 | 11 | 4.3% |
12 | 10 | 4.0% |
7 | 9 | 3.6% |
40 | 8 | 3.2% |
24 | 8 | 3.2% |
Other values (33) | 110 |
Value | Count | Frequency (%) |
1 | 3 | 1.2% |
2 | 17 | |
3 | 25 | |
4 | 21 | |
5 | 7 | 2.8% |
6 | 7 | 2.8% |
7 | 9 | 3.6% |
8 | 11 | |
9 | 4 | 1.6% |
10 | 19 |
Value | Count | Frequency (%) |
120 | 1 | 0.4% |
110 | 1 | 0.4% |
90 | 3 | 1.2% |
80 | 2 | 0.8% |
60 | 2 | 0.8% |
50 | 3 | 1.2% |
44 | 1 | 0.4% |
42 | 2 | 0.8% |
40 | 8 | |
38 | 4 |
참여그룹
Text
Distinct | 238 |
---|---|
Distinct (%) | 94.1% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
Length
Max length | 24 |
---|---|
Median length | 19 |
Mean length | 8.9288538 |
Min length | 2 |
Characters and Unicode
Total characters | 2259 |
---|---|
Distinct characters | 301 |
Distinct categories | 10 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 226 ? |
---|---|
Unique (%) | 89.3% |
Sample
1st row | 일산화력발전소 견학 |
---|---|
2nd row | 서울시 강동구청 녹색에너지과 |
3rd row | 전북대학교 공과대학 |
4th row | 대원연료전지 주주단, SK 건설 |
5th row | 강원도 고성군 간성읍 금수리 주민 외 |
Value | Count | Frequency (%) |
당진시 | 4 | 0.9% |
에너지캠퍼스 | 4 | 0.9% |
동서발전 | 4 | 0.9% |
한국가스공사 | 4 | 0.9% |
서울도시과학기술고등학교(홍보관 | 3 | 0.7% |
한전 | 3 | 0.7% |
주민 | 3 | 0.7% |
인도네시아 | 3 | 0.7% |
본사 | 3 | 0.7% |
당진발전본부 | 3 | 0.7% |
Other values (357) | 408 |
Most occurring characters
Value | Count | Frequency (%) |
193 | 8.5% | |
* | 53 | 2.3% |
전 | 53 | 2.3% |
) | 46 | 2.0% |
( | 46 | 2.0% |
학 | 42 | 1.9% |
지 | 41 | 1.8% |
대 | 41 | 1.8% |
관 | 40 | 1.8% |
부 | 39 | 1.7% |
Other values (291) | 1665 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 1860 | |
Space Separator | 193 | 8.5% |
Other Punctuation | 58 | 2.6% |
Close Punctuation | 46 | 2.0% |
Open Punctuation | 46 | 2.0% |
Decimal Number | 23 | 1.0% |
Lowercase Letter | 15 | 0.7% |
Uppercase Letter | 13 | 0.6% |
Dash Punctuation | 4 | 0.2% |
Math Symbol | 1 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
전 | 53 | 2.8% |
학 | 42 | 2.3% |
지 | 41 | 2.2% |
대 | 41 | 2.2% |
관 | 40 | 2.2% |
부 | 39 | 2.1% |
보 | 38 | 2.0% |
원 | 36 | 1.9% |
발 | 36 | 1.9% |
사 | 35 | 1.9% |
Other values (256) | 1459 |
Lowercase Letter
Value | Count | Frequency (%) |
m | 3 | |
a | 2 | |
i | 2 | |
v | 1 | 6.7% |
k | 1 | 6.7% |
s | 1 | 6.7% |
t | 1 | 6.7% |
u | 1 | 6.7% |
p | 1 | 6.7% |
o | 1 | 6.7% |
Uppercase Letter
Value | Count | Frequency (%) |
S | 3 | |
P | 2 | |
E | 2 | |
W | 1 | 7.7% |
K | 1 | 7.7% |
A | 1 | 7.7% |
B | 1 | 7.7% |
C | 1 | 7.7% |
T | 1 | 7.7% |
Decimal Number
Value | Count | Frequency (%) |
1 | 5 | |
7 | 5 | |
2 | 4 | |
3 | 2 | 8.7% |
5 | 2 | 8.7% |
6 | 2 | 8.7% |
0 | 2 | 8.7% |
4 | 1 | 4.3% |
Other Punctuation
Value | Count | Frequency (%) |
* | 53 | |
, | 5 | 8.6% |
Space Separator
Value | Count | Frequency (%) |
193 |
Close Punctuation
Value | Count | Frequency (%) |
) | 46 |
Open Punctuation
Value | Count | Frequency (%) |
( | 46 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 4 |
Math Symbol
Value | Count | Frequency (%) |
~ | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 1860 | |
Common | 371 | 16.4% |
Latin | 28 | 1.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
전 | 53 | 2.8% |
학 | 42 | 2.3% |
지 | 41 | 2.2% |
대 | 41 | 2.2% |
관 | 40 | 2.2% |
부 | 39 | 2.1% |
보 | 38 | 2.0% |
원 | 36 | 1.9% |
발 | 36 | 1.9% |
사 | 35 | 1.9% |
Other values (256) | 1459 |
Latin
Value | Count | Frequency (%) |
m | 3 | 10.7% |
S | 3 | 10.7% |
a | 2 | 7.1% |
i | 2 | 7.1% |
P | 2 | 7.1% |
E | 2 | 7.1% |
W | 1 | 3.6% |
K | 1 | 3.6% |
v | 1 | 3.6% |
k | 1 | 3.6% |
Other values (10) | 10 |
Common
Value | Count | Frequency (%) |
193 | ||
* | 53 | 14.3% |
) | 46 | 12.4% |
( | 46 | 12.4% |
1 | 5 | 1.3% |
, | 5 | 1.3% |
7 | 5 | 1.3% |
- | 4 | 1.1% |
2 | 4 | 1.1% |
3 | 2 | 0.5% |
Other values (5) | 8 | 2.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 1860 | |
ASCII | 399 | 17.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
193 | ||
* | 53 | 13.3% |
) | 46 | 11.5% |
( | 46 | 11.5% |
1 | 5 | 1.3% |
, | 5 | 1.3% |
7 | 5 | 1.3% |
- | 4 | 1.0% |
2 | 4 | 1.0% |
m | 3 | 0.8% |
Other values (25) | 35 | 8.8% |
Hangul
Value | Count | Frequency (%) |
전 | 53 | 2.8% |
학 | 42 | 2.3% |
지 | 41 | 2.2% |
대 | 41 | 2.2% |
관 | 40 | 2.2% |
부 | 39 | 2.1% |
보 | 38 | 2.0% |
원 | 36 | 1.9% |
발 | 36 | 1.9% |
사 | 35 | 1.9% |
Other values (256) | 1459 |
신청날짜
Date
Distinct | 166 |
---|---|
Distinct (%) | 65.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 2.1 KiB |
Minimum | 2020-10-08 00:00:00 |
---|---|
Maximum | 2023-07-27 00:00:00 |
구분 | 인원 | |
---|---|---|
구분 | 1.000 | 0.000 |
인원 | 0.000 | 1.000 |
인원 | 구분 | |
---|---|---|
인원 | 1.000 | 0.000 |
구분 | 0.000 | 1.000 |
구분 | 인원 | 참여그룹 | 신청날짜 | |
---|---|---|---|---|
0 | 일산발전 | 10 | 일산화력발전소 견학 | 2020-10-08 |
1 | 울산발전 | 10 | 서울시 강동구청 녹색에너지과 | 2020-10-30 |
2 | 당진발전 | 15 | 전북대학교 공과대학 | 2020-10-30 |
3 | 동해발전 | 9 | 대원연료전지 주주단, SK 건설 | 2020-12-08 |
4 | 동해발전 | 16 | 강원도 고성군 간성읍 금수리 주민 외 | 2020-12-14 |
5 | 당진발전 | 10 | 재화엔지니어링 | 2021-01-13 |
6 | 호남발전 | 10 | 포스코에너지 | 2021-03-15 |
7 | 동해발전 | 10 | 한일병원 | 2021-06-28 |
8 | 동해발전 | 10 | 한일병원 | 2021-06-29 |
9 | 울산발전 | 10 | 부산시설공단 | 2021-07-06 |
구분 | 인원 | 참여그룹 | 신청날짜 | |
---|---|---|---|---|
243 | 당진발전 | 38 | 한전인재개발원 송,변전부(홍보관) | 2023-06-23 |
244 | 당진발전 | 14 | 행복플러스보호작업장(빌전소) | 2023-06-23 |
245 | 당진발전 | 14 | 행복플러스보호작업장(홍보관) | 2023-06-23 |
246 | 당진발전 | 9 | 오*미(홍보관) | 2023-06-24 |
247 | 당진발전 | 7 | 전*자(홍보관) | 2023-06-24 |
248 | 동해발전 | 10 | 가스공사 삼척본부 | 2023-06-27 |
249 | 당진발전 | 7 | 청렴시민감사관(홍보관) | 2023-06-27 |
250 | 당진발전 | 5 | 남양주 다산행복지원센터(홍보관) | 2023-06-28 |
251 | 당진발전 | 4 | 남양주 다산행복지원센터(홍보관) | 2023-06-29 |
252 | 동해발전 | 10 | 강원대 학생 견학 | 2023-07-27 |