Dataset statistics
Number of variables | 4 |
---|---|
Number of observations | 10000 |
Missing cells | 0 |
Missing cells (%) | 0.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 390.6 KiB |
Average record size in memory | 40.0 B |
Variable types
Text | 3 |
---|---|
DateTime | 1 |
Dataset
Description | 한국서부발전에서 생산된 문서정보를 제공합니다. 제공데이터는 문서제목,생성일,문서번호,담당부서 입니다. 데이터 예) [탈질설비]고압가스 저장시설 안전점검표,2019-01-01,평(환)-1,환경화학부 |
---|---|
URL | https://www.data.go.kr/data/15044425/fileData.do |
문서번호 has unique values | Unique |
Reproduction
Analysis started | 2023-12-12 09:53:39.447934 |
---|---|
Analysis finished | 2023-12-12 09:53:40.534632 |
Duration | 1.09 second |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
문서제목
Text
Distinct | 9232 |
---|---|
Distinct (%) | 92.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 76 |
---|---|
Median length | 57 |
Mean length | 28.3679 |
Min length | 4 |
Characters and Unicode
Total characters | 283679 |
---|---|
Distinct characters | 763 |
Distinct categories | 15 ? |
Distinct scripts | 5 ? |
Distinct blocks | 9 ? |
Unique
Unique | 8910 ? |
---|---|
Unique (%) | 89.1% |
Sample
1st row | 태안 5,6호기 터빈 경상정비용 안전난간사다리 구매 |
---|---|
2nd row | [2023사업연도]내부회계관리제도 운영계획(안) |
3rd row | 태안 1~4호기 LED 등기구 구매 |
4th row | 한국서부발전 전력거래 전문인력 Pool 특성화 교육 출강 요청 |
5th row | ‘22년도 발전용 연료유 정기재물조사 결과 보고 |
Value | Count | Frequency (%) |
및 | 1396 | 2.3% |
시행 | 1362 | 2.3% |
요청 | 1290 | 2.2% |
알림 | 1252 | 2.1% |
제출 | 1242 | 2.1% |
구매 | 964 | 1.6% |
결과 | 741 | 1.2% |
2022년 | 717 | 1.2% |
2023년 | 633 | 1.1% |
태안 | 527 | 0.9% |
Other values (12622) | 49451 |
Most occurring characters
Value | Count | Frequency (%) |
49961 | 17.6% | |
2 | 8888 | 3.1% |
기 | 5174 | 1.8% |
전 | 4232 | 1.5% |
사 | 3895 | 1.4% |
0 | 3741 | 1.3% |
시 | 3499 | 1.2% |
제 | 3420 | 1.2% |
) | 3245 | 1.1% |
( | 3227 | 1.1% |
Other values (753) | 194397 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 183487 | |
Space Separator | 49961 | 17.6% |
Decimal Number | 20770 | 7.3% |
Uppercase Letter | 8976 | 3.2% |
Lowercase Letter | 7989 | 2.8% |
Close Punctuation | 4715 | 1.7% |
Open Punctuation | 4697 | 1.7% |
Other Punctuation | 1575 | 0.6% |
Dash Punctuation | 555 | 0.2% |
Math Symbol | 517 | 0.2% |
Other values (5) | 437 | 0.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
기 | 5174 | 2.8% |
전 | 4232 | 2.3% |
사 | 3895 | 2.1% |
시 | 3499 | 1.9% |
제 | 3420 | 1.9% |
년 | 3158 | 1.7% |
안 | 3098 | 1.7% |
정 | 2928 | 1.6% |
비 | 2921 | 1.6% |
계 | 2711 | 1.5% |
Other values (646) | 148451 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 1308 | |
S | 969 | 10.8% |
G | 703 | 7.8% |
P | 702 | 7.8% |
T | 609 | 6.8% |
I | 519 | 5.8% |
M | 465 | 5.2% |
O | 385 | 4.3% |
A | 381 | 4.2% |
B | 376 | 4.2% |
Other values (16) | 2559 |
Lowercase Letter
Value | Count | Frequency (%) |
e | 1123 | |
a | 754 | 9.4% |
r | 720 | 9.0% |
l | 632 | 7.9% |
n | 608 | 7.6% |
o | 581 | 7.3% |
i | 576 | 7.2% |
t | 471 | 5.9% |
u | 304 | 3.8% |
s | 262 | 3.3% |
Other values (16) | 1958 |
Other Punctuation
Value | Count | Frequency (%) |
, | 811 | |
· | 299 | 19.0% |
. | 137 | 8.7% |
# | 129 | 8.2% |
/ | 73 | 4.6% |
: | 58 | 3.7% |
& | 28 | 1.8% |
! | 14 | 0.9% |
′ | 7 | 0.4% |
' | 7 | 0.4% |
Other values (4) | 12 | 0.8% |
Decimal Number
Value | Count | Frequency (%) |
2 | 8888 | |
0 | 3741 | |
3 | 2473 | 11.9% |
1 | 2398 | 11.5% |
4 | 805 | 3.9% |
5 | 682 | 3.3% |
8 | 549 | 2.6% |
9 | 508 | 2.4% |
7 | 400 | 1.9% |
6 | 325 | 1.6% |
Math Symbol
Value | Count | Frequency (%) |
~ | 398 | |
∼ | 101 | 19.5% |
↔ | 7 | 1.4% |
~ | 4 | 0.8% |
× | 3 | 0.6% |
→ | 2 | 0.4% |
+ | 1 | 0.2% |
= | 1 | 0.2% |
Close Punctuation
Value | Count | Frequency (%) |
) | 3245 | |
] | 1123 | 23.8% |
】 | 157 | 3.3% |
」 | 156 | 3.3% |
』 | 34 | 0.7% |
Open Punctuation
Value | Count | Frequency (%) |
( | 3227 | |
[ | 1119 | 23.8% |
【 | 161 | 3.4% |
「 | 156 | 3.3% |
『 | 34 | 0.7% |
Other Symbol
Value | Count | Frequency (%) |
㎿ | 6 | |
㎸ | 3 | |
㈜ | 2 | 18.2% |
Initial Punctuation
Value | Count | Frequency (%) |
‘ | 201 | |
“ | 10 | 4.7% |
Modifier Symbol
Value | Count | Frequency (%) |
` | 99 | |
´ | 8 | 7.5% |
Final Punctuation
Value | Count | Frequency (%) |
’ | 87 | |
” | 10 | 10.3% |
Space Separator
Value | Count | Frequency (%) |
49961 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 555 |
Connector Punctuation
Value | Count | Frequency (%) |
_ | 11 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 183440 | |
Common | 83225 | |
Latin | 16963 | 6.0% |
Han | 49 | < 0.1% |
Greek | 2 | < 0.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
기 | 5174 | 2.8% |
전 | 4232 | 2.3% |
사 | 3895 | 2.1% |
시 | 3499 | 1.9% |
제 | 3420 | 1.9% |
년 | 3158 | 1.7% |
안 | 3098 | 1.7% |
정 | 2928 | 1.6% |
비 | 2921 | 1.6% |
계 | 2711 | 1.5% |
Other values (629) | 148404 |
Common
Value | Count | Frequency (%) |
49961 | ||
2 | 8888 | 10.7% |
0 | 3741 | 4.5% |
) | 3245 | 3.9% |
( | 3227 | 3.9% |
3 | 2473 | 3.0% |
1 | 2398 | 2.9% |
] | 1123 | 1.3% |
[ | 1119 | 1.3% |
, | 811 | 1.0% |
Other values (44) | 6239 | 7.5% |
Latin
Value | Count | Frequency (%) |
C | 1308 | 7.7% |
e | 1123 | 6.6% |
S | 969 | 5.7% |
a | 754 | 4.4% |
r | 720 | 4.2% |
G | 703 | 4.1% |
P | 702 | 4.1% |
l | 632 | 3.7% |
T | 609 | 3.6% |
n | 608 | 3.6% |
Other values (41) | 8835 |
Han
Value | Count | Frequency (%) |
社 | 16 | |
大 | 7 | |
新 | 4 | 8.2% |
案 | 3 | 6.1% |
通 | 3 | 6.1% |
全 | 2 | 4.1% |
內 | 2 | 4.1% |
人 | 2 | 4.1% |
中 | 1 | 2.0% |
型 | 1 | 2.0% |
Other values (8) | 8 |
Greek
Value | Count | Frequency (%) |
φ | 2 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 183431 | |
ASCII | 98734 | |
None | 1024 | 0.4% |
Punctuation | 315 | 0.1% |
Math Operators | 101 | < 0.1% |
CJK | 49 | < 0.1% |
Arrows | 9 | < 0.1% |
CJK Compat | 9 | < 0.1% |
Compat Jamo | 7 | < 0.1% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
49961 | ||
2 | 8888 | 9.0% |
0 | 3741 | 3.8% |
) | 3245 | 3.3% |
( | 3227 | 3.3% |
3 | 2473 | 2.5% |
1 | 2398 | 2.4% |
C | 1308 | 1.3% |
e | 1123 | 1.1% |
] | 1123 | 1.1% |
Other values (73) | 21247 |
Hangul
Value | Count | Frequency (%) |
기 | 5174 | 2.8% |
전 | 4232 | 2.3% |
사 | 3895 | 2.1% |
시 | 3499 | 1.9% |
제 | 3420 | 1.9% |
년 | 3158 | 1.7% |
안 | 3098 | 1.7% |
정 | 2928 | 1.6% |
비 | 2921 | 1.6% |
계 | 2711 | 1.5% |
Other values (627) | 148395 |
None
Value | Count | Frequency (%) |
· | 299 | |
【 | 161 | |
】 | 157 | |
」 | 156 | |
「 | 156 | |
『 | 34 | 3.3% |
』 | 34 | 3.3% |
´ | 8 | 0.8% |
' | 7 | 0.7% |
~ | 4 | 0.4% |
Other values (4) | 8 | 0.8% |
Punctuation
Value | Count | Frequency (%) |
‘ | 201 | |
’ | 87 | |
” | 10 | 3.2% |
“ | 10 | 3.2% |
′ | 7 | 2.2% |
Math Operators
Value | Count | Frequency (%) |
∼ | 101 |
CJK
Value | Count | Frequency (%) |
社 | 16 | |
大 | 7 | |
新 | 4 | 8.2% |
案 | 3 | 6.1% |
通 | 3 | 6.1% |
全 | 2 | 4.1% |
內 | 2 | 4.1% |
人 | 2 | 4.1% |
中 | 1 | 2.0% |
型 | 1 | 2.0% |
Other values (8) | 8 |
Compat Jamo
Value | Count | Frequency (%) |
ㆍ | 7 |
Arrows
Value | Count | Frequency (%) |
↔ | 7 | |
→ | 2 | 22.2% |
CJK Compat
Value | Count | Frequency (%) |
㎿ | 6 | |
㎸ | 3 |
생성일
Date
Distinct | 261 |
---|---|
Distinct (%) | 2.6% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Minimum | 2022-08-01 00:00:00 |
---|---|
Maximum | 2023-06-30 00:00:00 |
문서번호
Text
UNIQUE
 
Distinct | 10000 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Length
Max length | 15 |
---|---|
Median length | 14 |
Mean length | 11.1957 |
Min length | 5 |
Characters and Unicode
Total characters | 111957 |
---|---|
Distinct characters | 104 |
Distinct categories | 6 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 10000 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 태2(터)-95063 |
---|---|
2nd row | 기획(예)-35982 |
3rd row | 태1(전)-57036 |
4th row | 발전(전)-85870 |
5th row | 평경(경)-4537 |
Value | Count | Frequency (%) |
태2(터)-95063 | 1 | < 0.1% |
인경(경)-25341 | 1 | < 0.1% |
태1(전)-23894 | 1 | < 0.1% |
태2(보)-79958 | 1 | < 0.1% |
김건(토)-14230 | 1 | < 0.1% |
구건-96280 | 1 | < 0.1% |
군기(기)-93904 | 1 | < 0.1% |
안전(산)-46790 | 1 | < 0.1% |
서(경)-54630 | 1 | < 0.1% |
태3운(계)-7560 | 1 | < 0.1% |
Other values (9990) | 9990 |
Most occurring characters
Value | Count | Frequency (%) |
- | 10000 | 8.9% |
( | 9749 | 8.7% |
) | 9749 | 8.7% |
1 | 6720 | 6.0% |
2 | 5753 | 5.1% |
3 | 5374 | 4.8% |
5 | 5140 | 4.6% |
6 | 4894 | 4.4% |
7 | 4865 | 4.3% |
4 | 4847 | 4.3% |
Other values (94) | 44866 |
Most occurring categories
Value | Count | Frequency (%) |
Decimal Number | 51787 | |
Other Letter | 29443 | |
Dash Punctuation | 10000 | 8.9% |
Open Punctuation | 9749 | 8.7% |
Close Punctuation | 9749 | 8.7% |
Uppercase Letter | 1229 | 1.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
태 | 3962 | 13.5% |
경 | 2383 | 8.1% |
기 | 1809 | 6.1% |
전 | 1301 | 4.4% |
안 | 1299 | 4.4% |
평 | 1168 | 4.0% |
운 | 1138 | 3.9% |
서 | 1036 | 3.5% |
연 | 1029 | 3.5% |
건 | 1015 | 3.4% |
Other values (76) | 13303 |
Decimal Number
Value | Count | Frequency (%) |
1 | 6720 | |
2 | 5753 | |
3 | 5374 | |
5 | 5140 | |
6 | 4894 | |
7 | 4865 | |
4 | 4847 | |
8 | 4831 | |
9 | 4715 | |
0 | 4648 |
Uppercase Letter
Value | Count | Frequency (%) |
I | 553 | |
G | 425 | |
T | 128 | 10.4% |
C | 113 | 9.2% |
L | 10 | 0.8% |
Dash Punctuation
Value | Count | Frequency (%) |
- | 10000 |
Open Punctuation
Value | Count | Frequency (%) |
( | 9749 |
Close Punctuation
Value | Count | Frequency (%) |
) | 9749 |
Most occurring scripts
Value | Count | Frequency (%) |
Common | 81285 | |
Hangul | 29443 | 26.3% |
Latin | 1229 | 1.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
태 | 3962 | 13.5% |
경 | 2383 | 8.1% |
기 | 1809 | 6.1% |
전 | 1301 | 4.4% |
안 | 1299 | 4.4% |
평 | 1168 | 4.0% |
운 | 1138 | 3.9% |
서 | 1036 | 3.5% |
연 | 1029 | 3.5% |
건 | 1015 | 3.4% |
Other values (76) | 13303 |
Common
Value | Count | Frequency (%) |
- | 10000 | |
( | 9749 | |
) | 9749 | |
1 | 6720 | |
2 | 5753 | |
3 | 5374 | 6.6% |
5 | 5140 | 6.3% |
6 | 4894 | 6.0% |
7 | 4865 | 6.0% |
4 | 4847 | 6.0% |
Other values (3) | 14194 |
Latin
Value | Count | Frequency (%) |
I | 553 | |
G | 425 | |
T | 128 | 10.4% |
C | 113 | 9.2% |
L | 10 | 0.8% |
Most occurring blocks
Value | Count | Frequency (%) |
ASCII | 82514 | |
Hangul | 29443 | 26.3% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
- | 10000 | |
( | 9749 | |
) | 9749 | |
1 | 6720 | |
2 | 5753 | 7.0% |
3 | 5374 | 6.5% |
5 | 5140 | 6.2% |
6 | 4894 | 5.9% |
7 | 4865 | 5.9% |
4 | 4847 | 5.9% |
Other values (8) | 15423 |
Hangul
Value | Count | Frequency (%) |
태 | 3962 | 13.5% |
경 | 2383 | 8.1% |
기 | 1809 | 6.1% |
전 | 1301 | 4.4% |
안 | 1299 | 4.4% |
평 | 1168 | 4.0% |
운 | 1138 | 3.9% |
서 | 1036 | 3.5% |
연 | 1029 | 3.5% |
건 | 1015 | 3.4% |
Other values (76) | 13303 |
담당부서
Text
Distinct | 127 |
---|---|
Distinct (%) | 1.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 156.2 KiB |
Value | Count | Frequency (%) |
경영지원부 | 927 | 9.3% |
발전부 | 473 | 4.7% |
전기부 | 423 | 4.2% |
화공설비부 | 414 | 4.1% |
계약부 | 340 | 3.4% |
계측제어부 | 331 | 3.3% |
기계부 | 306 | 3.1% |
환경화학부 | 296 | 3.0% |
안전품질부 | 260 | 2.6% |
터빈부 | 222 | 2.2% |
Other values (118) | 6013 |
Most occurring characters
Value | Count | Frequency (%) |
부 | 8632 | 18.4% |
전 | 2954 | 6.3% |
경 | 1858 | 4.0% |
기 | 1832 | 3.9% |
계 | 1523 | 3.2% |
안 | 1407 | 3.0% |
영 | 1306 | 2.8% |
지 | 1090 | 2.3% |
원 | 1030 | 2.2% |
설 | 1025 | 2.2% |
Other values (126) | 24269 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 45549 | |
Uppercase Letter | 1020 | 2.2% |
Decimal Number | 352 | 0.8% |
Space Separator | 5 | < 0.1% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
부 | 8632 | 19.0% |
전 | 2954 | 6.5% |
경 | 1858 | 4.1% |
기 | 1832 | 4.0% |
계 | 1523 | 3.3% |
안 | 1407 | 3.1% |
영 | 1306 | 2.9% |
지 | 1090 | 2.4% |
원 | 1030 | 2.3% |
설 | 1025 | 2.3% |
Other values (116) | 22892 |
Uppercase Letter
Value | Count | Frequency (%) |
C | 366 | |
I | 312 | |
T | 266 | |
G | 56 | 5.5% |
L | 10 | 1.0% |
N | 10 | 1.0% |
Decimal Number
Value | Count | Frequency (%) |
1 | 181 | |
2 | 125 | |
3 | 46 | 13.1% |
Space Separator
Value | Count | Frequency (%) |
5 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 45549 | |
Latin | 1020 | 2.2% |
Common | 357 | 0.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
부 | 8632 | 19.0% |
전 | 2954 | 6.5% |
경 | 1858 | 4.1% |
기 | 1832 | 4.0% |
계 | 1523 | 3.3% |
안 | 1407 | 3.1% |
영 | 1306 | 2.9% |
지 | 1090 | 2.4% |
원 | 1030 | 2.3% |
설 | 1025 | 2.3% |
Other values (116) | 22892 |
Latin
Value | Count | Frequency (%) |
C | 366 | |
I | 312 | |
T | 266 | |
G | 56 | 5.5% |
L | 10 | 1.0% |
N | 10 | 1.0% |
Common
Value | Count | Frequency (%) |
1 | 181 | |
2 | 125 | |
3 | 46 | 12.9% |
5 | 1.4% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 45549 | |
ASCII | 1377 | 2.9% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
부 | 8632 | 19.0% |
전 | 2954 | 6.5% |
경 | 1858 | 4.1% |
기 | 1832 | 4.0% |
계 | 1523 | 3.3% |
안 | 1407 | 3.1% |
영 | 1306 | 2.9% |
지 | 1090 | 2.4% |
원 | 1030 | 2.3% |
설 | 1025 | 2.3% |
Other values (116) | 22892 |
ASCII
Value | Count | Frequency (%) |
C | 366 | |
I | 312 | |
T | 266 | |
1 | 181 | |
2 | 125 | 9.1% |
G | 56 | 4.1% |
3 | 46 | 3.3% |
L | 10 | 0.7% |
N | 10 | 0.7% |
5 | 0.4% |
문서제목 | 생성일 | 문서번호 | 담당부서 | |
---|---|---|---|---|
22622 | 태안 5,6호기 터빈 경상정비용 안전난간사다리 구매 | 2022-11-25 | 태2(터)-95063 | 터빈부 |
55383 | [2023사업연도]내부회계관리제도 운영계획(안) | 2023-04-24 | 기획(예)-35982 | 재무예산실 |
529 | 태안 1~4호기 LED 등기구 구매 | 2022-08-02 | 태1(전)-57036 | 전기부 |
17291 | 한국서부발전 전력거래 전문인력 Pool 특성화 교육 출강 요청 | 2022-11-01 | 발전(전)-85870 | 전력거래실 |
33789 | ‘22년도 발전용 연료유 정기재물조사 결과 보고 | 2023-01-16 | 평경(경)-4537 | 경영지원부 |
62539 | 2023년도 발전5사 정비적격기업(1차) 현장실사 계획 보고 | 2023-05-30 | 서(안)-46997 | 안전품질부 |
16567 | 업무지시서(근태-22-58) 발전기술원 근무변경 알림 | 2022-10-27 | 태3운(화)-84481 | 화공설비부 |
2985 | 최종방류구 Filter Backwash Water Transfer Pump 구매 | 2022-08-17 | 태1(보)-61050 | 보일러부 |
53879 | 9,10호기 보일러 GAH Ash Blower 에어필터 구매 | 2023-04-17 | 태3(보)-33624 | 보일러부 |
67608 | [IGCC발전처]’23년 설비보강 긴급공사 가동 전 점검 시행(안) | 2023-06-21 | 태IG(공)-54920 | 공정안전부 |
문서제목 | 생성일 | 문서번호 | 담당부서 | |
---|---|---|---|---|
10596 | [9,10호기 수처리설비]RO Membrane 교체 결과 보고 | 2022-09-27 | 태3운(화)-74643 | 화공설비부 |
50758 | 견적의뢰(1호기 GAH Air MTR 및 Mixing HTR 하부 정비) | 2023-03-31 | 태1(보)-28819 | 보일러부 |
27838 | [회사 중요자료 유출방지를 위한]불시 보안점검 계획(안) | 2022-12-21 | 정보(정)-103704 | 정보보안실 |
37103 | 계약의뢰(1~8호기 증기터빈 복수기 진공펌프 Internal Parts 구매) | 2023-02-01 | 서기(기)-9209 | 기계부 |
7928 | 2022년 8월 공시자료 점검관리대장 제출 | 2022-09-14 | 태경(경)-69124 | 경영지원부 |
52762 | 구매계획(1~4호기 원격조작형 차단기 인출입장치 구매) | 2023-04-11 | 태경(계)-31872 | 계약부 |
32120 | 발전부산물(정제회 등) 판매대금 청구내역 및 미납내역 알림 | 2023-01-09 | 태경(경)-2191 | 경영지원부 |
66677 | 오만 마나 태양광 사업 대주단 보험자문계약 체결 | 2023-06-19 | 해외(사업)-53551 | 해외사업실 |
12009 | 2022년 09월 천안청수 연료전지 열요금 청구 알림 | 2022-10-05 | 평복(전)-76901 | 복합전기부 |
44981 | [태안 1∼8호기 탈황폐수 무방류설비]운전원 OJT 교육 결과보고(1분기) | 2023-03-08 | 태1운(화)-20681 | 화공설비부 |