Overview

Dataset statistics

Number of variables11
Number of observations10000
Missing cells0
Missing cells (%)0.0%
Duplicate rows290
Duplicate rows (%)2.9%
Total size in memory966.8 KiB
Average record size in memory99.0 B

Variable types

Categorical7
Text3
Numeric1

Dataset

Description연간 한국남동발전에서 폐기된 기록물 목록입니다. 부서별 생산년도, 보존연한, 폐기 사유 등의 데이터가 포함되어 있습니다.
Author한국남동발전㈜
URLhttps://www.data.go.kr/data/15042773/fileData.do

Alerts

생산년도 has constant value ""Constant
보존년도 has constant value ""Constant
심의위원 의견 has constant value ""Constant
Dataset has 290 (2.9%) duplicate rowsDuplicates
평가의견 is highly overall correlated with 사유High correlation
사유 is highly overall correlated with 평가의견High correlation
처리의견 is highly imbalanced (99.4%)Imbalance
사유 is highly imbalanced (86.0%)Imbalance
평가의견 is highly imbalanced (99.0%)Imbalance
보존연한 has 684 (6.8%) zerosZeros

Reproduction

Analysis started2023-12-12 16:21:38.061641
Analysis finished2023-12-12 16:21:39.969391
Duration1.91 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

부서
Categorical

Distinct8
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
총무부
4213 
기계부
2638 
전기부
1720 
계측제어부
783 
설비운영부
 
311
Other values (3)
 
335

Length

Max length8
Median length3
Mean length3.309
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row설비운영부
2nd row총무부
3rd row기계부
4th row총무부
5th row계측제어부

Common Values

ValueCountFrequency (%)
총무부 4213
42.1%
기계부 2638
26.4%
전기부 1720
17.2%
계측제어부 783
 
7.8%
설비운영부 311
 
3.1%
환경화학부 251
 
2.5%
전기부(광명관) 80
 
0.8%
감사팀 4
 
< 0.1%

Length

2023-12-13T01:21:40.046029image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:21:40.168439image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
총무부 4213
42.1%
기계부 2638
26.4%
전기부 1720
17.2%
계측제어부 783
 
7.8%
설비운영부 311
 
3.1%
환경화학부 251
 
2.5%
전기부(광명관 80
 
0.8%
감사팀 4
 
< 0.1%
Distinct8783
Distinct (%)87.8%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-13T01:21:40.520641image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length121
Median length81
Mean length17.5284
Min length2

Characters and Unicode

Total characters175284
Distinct characters671
Distinct categories17 ?
Distinct scripts5 ?
Distinct blocks12 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique8226 ?
Unique (%)82.3%

Sample

1st row연간단가계약
2nd row2006 회계결의서철
3rd row경상정비 기성고 지급(Ⅱ)
4th rowNCR관련철
5th row취약설비
ValueCountFrequency (%)
531
 
1.6%
1호기 454
 
1.3%
430
 
1.3%
2호기 428
 
1.3%
1 418
 
1.2%
2 389
 
1.2%
영동화력 295
 
0.9%
2008 282
 
0.8%
관련철 248
 
0.7%
2003 231
 
0.7%
Other values (9601) 29995
89.0%
2023-12-13T01:21:41.145018image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
23887
 
13.6%
0 7813
 
4.5%
2 6031
 
3.4%
1 4569
 
2.6%
3553
 
2.0%
2687
 
1.5%
( 2437
 
1.4%
) 2432
 
1.4%
e 2378
 
1.4%
2334
 
1.3%
Other values (661) 117163
66.8%

Most occurring categories

ValueCountFrequency (%)
Other Letter 82341
47.0%
Decimal Number 24865
 
14.2%
Space Separator 23887
 
13.6%
Lowercase Letter 19348
 
11.0%
Uppercase Letter 15211
 
8.7%
Other Punctuation 3081
 
1.8%
Open Punctuation 2438
 
1.4%
Close Punctuation 2433
 
1.4%
Letter Number 573
 
0.3%
Dash Punctuation 502
 
0.3%
Other values (7) 605
 
0.3%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
3553
 
4.3%
2687
 
3.3%
2334
 
2.8%
2002
 
2.4%
1997
 
2.4%
1994
 
2.4%
1952
 
2.4%
1932
 
2.3%
1722
 
2.1%
1482
 
1.8%
Other values (550) 60686
73.7%
Uppercase Letter
ValueCountFrequency (%)
C 1191
 
7.8%
S 1162
 
7.6%
E 1052
 
6.9%
O 1015
 
6.7%
A 980
 
6.4%
T 950
 
6.2%
M 911
 
6.0%
P 892
 
5.9%
L 845
 
5.6%
R 845
 
5.6%
Other values (18) 5368
35.3%
Lowercase Letter
ValueCountFrequency (%)
e 2378
12.3%
a 1708
 
8.8%
t 1656
 
8.6%
r 1566
 
8.1%
n 1554
 
8.0%
l 1424
 
7.4%
o 1401
 
7.2%
i 1329
 
6.9%
s 1116
 
5.8%
c 660
 
3.4%
Other values (17) 4556
23.5%
Other Punctuation
ValueCountFrequency (%)
# 954
31.0%
, 702
22.8%
. 590
19.1%
/ 565
18.3%
& 142
 
4.6%
' 72
 
2.3%
: 26
 
0.8%
· 13
 
0.4%
* 10
 
0.3%
% 5
 
0.2%
Other values (2) 2
 
0.1%
Decimal Number
ValueCountFrequency (%)
0 7813
31.4%
2 6031
24.3%
1 4569
18.4%
9 1278
 
5.1%
3 1116
 
4.5%
5 961
 
3.9%
4 961
 
3.9%
8 818
 
3.3%
7 670
 
2.7%
6 648
 
2.6%
Letter Number
ValueCountFrequency (%)
206
36.0%
143
25.0%
65
 
11.3%
36
 
6.3%
34
 
5.9%
26
 
4.5%
22
 
3.8%
16
 
2.8%
13
 
2.3%
12
 
2.1%
Math Symbol
ValueCountFrequency (%)
~ 305
74.9%
× 87
 
21.4%
5
 
1.2%
> 4
 
1.0%
< 3
 
0.7%
+ 2
 
0.5%
1
 
0.2%
Other Symbol
ValueCountFrequency (%)
10
76.9%
1
 
7.7%
1
 
7.7%
1
 
7.7%
Open Punctuation
ValueCountFrequency (%)
( 2437
> 99.9%
[ 1
 
< 0.1%
Close Punctuation
ValueCountFrequency (%)
) 2432
> 99.9%
] 1
 
< 0.1%
Initial Punctuation
ValueCountFrequency (%)
120
92.3%
10
 
7.7%
Other Number
ValueCountFrequency (%)
2
66.7%
³ 1
33.3%
Space Separator
ValueCountFrequency (%)
23887
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 502
100.0%
Modifier Symbol
ValueCountFrequency (%)
` 40
100.0%
Final Punctuation
ValueCountFrequency (%)
11
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 82308
47.0%
Common 57807
33.0%
Latin 35114
20.0%
Han 43
 
< 0.1%
Greek 12
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
3553
 
4.3%
2687
 
3.3%
2334
 
2.8%
2002
 
2.4%
1997
 
2.4%
1994
 
2.4%
1952
 
2.4%
1932
 
2.3%
1722
 
2.1%
1482
 
1.8%
Other values (520) 60653
73.7%
Latin
ValueCountFrequency (%)
e 2378
 
6.8%
a 1708
 
4.9%
t 1656
 
4.7%
r 1566
 
4.5%
n 1554
 
4.4%
l 1424
 
4.1%
o 1401
 
4.0%
i 1329
 
3.8%
C 1191
 
3.4%
S 1162
 
3.3%
Other values (52) 19745
56.2%
Common
ValueCountFrequency (%)
23887
41.3%
0 7813
 
13.5%
2 6031
 
10.4%
1 4569
 
7.9%
( 2437
 
4.2%
) 2432
 
4.2%
9 1278
 
2.2%
3 1116
 
1.9%
5 961
 
1.7%
4 961
 
1.7%
Other values (36) 6322
 
10.9%
Han
ValueCountFrequency (%)
4
 
9.3%
3
 
7.0%
3
 
7.0%
2
 
4.7%
2
 
4.7%
2
 
4.7%
2
 
4.7%
2
 
4.7%
1
 
2.3%
1
 
2.3%
Other values (21) 21
48.8%
Greek
ValueCountFrequency (%)
Ι 11
91.7%
Φ 1
 
8.3%

Most occurring blocks

ValueCountFrequency (%)
ASCII 92089
52.5%
Hangul 82296
47.0%
Number Forms 573
 
0.3%
Punctuation 141
 
0.1%
None 123
 
0.1%
CJK 43
 
< 0.1%
Letterlike Symbols 6
 
< 0.1%
Arrows 5
 
< 0.1%
CJK Compat 3
 
< 0.1%
Enclosed Alphanum 2
 
< 0.1%
Other values (2) 3
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
23887
25.9%
0 7813
 
8.5%
2 6031
 
6.5%
1 4569
 
5.0%
( 2437
 
2.6%
) 2432
 
2.6%
e 2378
 
2.6%
a 1708
 
1.9%
t 1656
 
1.8%
r 1566
 
1.7%
Other values (75) 37612
40.8%
Hangul
ValueCountFrequency (%)
3553
 
4.3%
2687
 
3.3%
2334
 
2.8%
2002
 
2.4%
1997
 
2.4%
1994
 
2.4%
1952
 
2.4%
1932
 
2.3%
1722
 
2.1%
1482
 
1.8%
Other values (517) 60641
73.7%
Number Forms
ValueCountFrequency (%)
206
36.0%
143
25.0%
65
 
11.3%
36
 
6.3%
34
 
5.9%
26
 
4.5%
22
 
3.8%
16
 
2.8%
13
 
2.3%
12
 
2.1%
Punctuation
ValueCountFrequency (%)
120
85.1%
11
 
7.8%
10
 
7.1%
None
ValueCountFrequency (%)
× 87
70.7%
· 13
 
10.6%
Ι 11
 
8.9%
10
 
8.1%
Φ 1
 
0.8%
³ 1
 
0.8%
Letterlike Symbols
ValueCountFrequency (%)
6
100.0%
Arrows
ValueCountFrequency (%)
5
100.0%
CJK
ValueCountFrequency (%)
4
 
9.3%
3
 
7.0%
3
 
7.0%
2
 
4.7%
2
 
4.7%
2
 
4.7%
2
 
4.7%
2
 
4.7%
1
 
2.3%
1
 
2.3%
Other values (21) 21
48.8%
Enclosed Alphanum
ValueCountFrequency (%)
2
100.0%
Compat Jamo
ValueCountFrequency (%)
1
50.0%
1
50.0%
CJK Compat
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%
Math Operators
ValueCountFrequency (%)
1
100.0%

생산년도
Categorical

CONSTANT 

Distinct1
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
1905
10000 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row1905
2nd row1905
3rd row1905
4th row1905
5th row1905

Common Values

ValueCountFrequency (%)
1905 10000
100.0%

Length

2023-12-13T01:21:41.277128image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:21:41.355128image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
1905 10000
100.0%

보존연한
Real number (ℝ)

ZEROS 

Distinct8
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean4.9207
Minimum0
Maximum20
Zeros684
Zeros (%)6.8%
Negative0
Negative (%)0.0%
Memory size166.0 KiB
2023-12-13T01:21:41.432302image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum0
5-th percentile0
Q13
median3
Q35
95-th percentile10
Maximum20
Range20
Interquartile range (IQR)2

Descriptive statistics

Standard deviation3.0932456
Coefficient of variation (CV)0.62861902
Kurtosis-0.69283369
Mean4.9207
Median Absolute Deviation (MAD)2
Skewness0.65869134
Sum49207
Variance9.5681683
MonotonicityNot monotonic
2023-12-13T01:21:41.529273image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=8)
ValueCountFrequency (%)
3 4412
44.1%
5 2435
24.3%
10 2367
23.7%
0 684
 
6.8%
1 98
 
1.0%
2 2
 
< 0.1%
20 1
 
< 0.1%
4 1
 
< 0.1%
ValueCountFrequency (%)
0 684
 
6.8%
1 98
 
1.0%
2 2
 
< 0.1%
3 4412
44.1%
4 1
 
< 0.1%
5 2435
24.3%
10 2367
23.7%
20 1
 
< 0.1%
ValueCountFrequency (%)
20 1
 
< 0.1%
10 2367
23.7%
5 2435
24.3%
4 1
 
< 0.1%
3 4412
44.1%
2 2
 
< 0.1%
1 98
 
1.0%
0 684
 
6.8%

보존년도
Categorical

CONSTANT 

Distinct1
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
1905
10000 

Length

Max length4
Median length4
Mean length4
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row1905
2nd row1905
3rd row1905
4th row1905
5th row1905

Common Values

ValueCountFrequency (%)
1905 10000
100.0%

Length

2023-12-13T01:21:41.646319image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:21:41.742032image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
1905 10000
100.0%
Distinct561
Distinct (%)5.6%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-13T01:21:42.059844image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length6
Median length5
Mean length3.6726
Min length1

Characters and Unicode

Total characters36726
Distinct characters50
Distinct categories6 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique20 ?
Unique (%)0.2%

Sample

1st row-
2nd rowHS-10
3rd row1137
4th row457-c
5th row723
ValueCountFrequency (%)
172
 
1.7%
이남호 138
 
1.4%
3 74
 
0.7%
hs-28 74
 
0.7%
445-g 72
 
0.7%
445-i 70
 
0.7%
hs-32 62
 
0.6%
442 57
 
0.6%
445-a 57
 
0.6%
445-e 57
 
0.6%
Other values (547) 9305
91.8%
2023-12-13T01:21:42.525285image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
1 7273
19.8%
4 4892
13.3%
0 3101
8.4%
- 2969
8.1%
2 2884
 
7.9%
5 2160
 
5.9%
3 2027
 
5.5%
9 1955
 
5.3%
7 1934
 
5.3%
8 1575
 
4.3%
Other values (40) 5956
16.2%

Most occurring categories

ValueCountFrequency (%)
Decimal Number 29356
79.9%
Dash Punctuation 2969
 
8.1%
Uppercase Letter 2089
 
5.7%
Lowercase Letter 1275
 
3.5%
Other Letter 899
 
2.4%
Space Separator 138
 
0.4%

Most frequent character per category

Lowercase Letter
ValueCountFrequency (%)
a 260
20.4%
b 230
18.0%
c 170
13.3%
g 102
 
8.0%
e 70
 
5.5%
i 70
 
5.5%
d 59
 
4.6%
l 52
 
4.1%
f 44
 
3.5%
h 38
 
3.0%
Other values (8) 180
14.1%
Other Letter
ValueCountFrequency (%)
138
15.4%
138
15.4%
138
15.4%
94
10.5%
94
10.5%
78
8.7%
78
8.7%
38
 
4.2%
38
 
4.2%
18
 
2.0%
Other values (6) 47
 
5.2%
Decimal Number
ValueCountFrequency (%)
1 7273
24.8%
4 4892
16.7%
0 3101
10.6%
2 2884
 
9.8%
5 2160
 
7.4%
3 2027
 
6.9%
9 1955
 
6.7%
7 1934
 
6.6%
8 1575
 
5.4%
6 1555
 
5.3%
Uppercase Letter
ValueCountFrequency (%)
S 1011
48.4%
H 1011
48.4%
B 38
 
1.8%
A 29
 
1.4%
Dash Punctuation
ValueCountFrequency (%)
- 2969
100.0%
Space Separator
ValueCountFrequency (%)
138
100.0%

Most occurring scripts

ValueCountFrequency (%)
Common 32463
88.4%
Latin 3364
 
9.2%
Hangul 899
 
2.4%

Most frequent character per script

Latin
ValueCountFrequency (%)
S 1011
30.1%
H 1011
30.1%
a 260
 
7.7%
b 230
 
6.8%
c 170
 
5.1%
g 102
 
3.0%
e 70
 
2.1%
i 70
 
2.1%
d 59
 
1.8%
l 52
 
1.5%
Other values (12) 329
 
9.8%
Hangul
ValueCountFrequency (%)
138
15.4%
138
15.4%
138
15.4%
94
10.5%
94
10.5%
78
8.7%
78
8.7%
38
 
4.2%
38
 
4.2%
18
 
2.0%
Other values (6) 47
 
5.2%
Common
ValueCountFrequency (%)
1 7273
22.4%
4 4892
15.1%
0 3101
9.6%
- 2969
9.1%
2 2884
 
8.9%
5 2160
 
6.7%
3 2027
 
6.2%
9 1955
 
6.0%
7 1934
 
6.0%
8 1575
 
4.9%
Other values (2) 1693
 
5.2%

Most occurring blocks

ValueCountFrequency (%)
ASCII 35827
97.6%
Hangul 899
 
2.4%

Most frequent character per block

ASCII
ValueCountFrequency (%)
1 7273
20.3%
4 4892
13.7%
0 3101
8.7%
- 2969
8.3%
2 2884
 
8.0%
5 2160
 
6.0%
3 2027
 
5.7%
9 1955
 
5.5%
7 1934
 
5.4%
8 1575
 
4.4%
Other values (24) 5057
14.1%
Hangul
ValueCountFrequency (%)
138
15.4%
138
15.4%
138
15.4%
94
10.5%
94
10.5%
78
8.7%
78
8.7%
38
 
4.2%
38
 
4.2%
18
 
2.0%
Other values (6) 47
 
5.2%

처리의견
Categorical

IMBALANCE 

Distinct6
Distinct (%)0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
폐기
9988 
-
 
4
이관
 
3
2006
 
2
2003
 
2

Length

Max length4
Median length2
Mean length2.0006
Min length1

Unique

Unique1 ?
Unique (%)< 0.1%

Sample

1st row폐기
2nd row폐기
3rd row폐기
4th row폐기
5th row폐기

Common Values

ValueCountFrequency (%)
폐기 9988
99.9%
- 4
 
< 0.1%
이관 3
 
< 0.1%
2006 2
 
< 0.1%
2003 2
 
< 0.1%
2008 1
 
< 0.1%

Length

2023-12-13T01:21:42.679267image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:21:42.776099image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
폐기 9988
99.9%
4
 
< 0.1%
이관 3
 
< 0.1%
2006 2
 
< 0.1%
2003 2
 
< 0.1%
2008 1
 
< 0.1%

사유
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct19
Distinct (%)0.2%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
보존기간 경과로 폐기
9136 
업무참고가치 상실 폐기
 
467
설비개조 및 사본으로 인한 폐기
 
172
원본보관에 따른 사본분 폐기
 
132
참고용 자료로 폐기
 
46
Other values (14)
 
47

Length

Max length21
Median length11
Mean length11.2182
Min length1

Unique

Unique6 ?
Unique (%)0.1%

Sample

1st row설비개조 및 사본으로 인한 폐기
2nd row보존기간 경과로 폐기
3rd row보존기간 경과로 폐기
4th row보존기간 경과로 폐기
5th row보존기간 경과로 폐기

Common Values

ValueCountFrequency (%)
보존기간 경과로 폐기 9136
91.4%
업무참고가치 상실 폐기 467
 
4.7%
설비개조 및 사본으로 인한 폐기 172
 
1.7%
원본보관에 따른 사본분 폐기 132
 
1.3%
참고용 자료로 폐기 46
 
0.5%
설비철거로 구자료 폐기 11
 
0.1%
개인 참고용 자료로 폐기 8
 
0.1%
설비 개조 및 보존기간 경과로 폐기 8
 
0.1%
설비 변경 및 보존기간 경과로 폐기 5
 
0.1%
계측기 신형 구매로 인한 구버전 폐기 3
 
< 0.1%
Other values (9) 12
 
0.1%

Length

2023-12-13T01:21:42.902392image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
폐기 10001
32.7%
보존기간 9151
30.0%
경과로 9151
30.0%
업무참고가치 467
 
1.5%
상실 467
 
1.5%
185
 
0.6%
인한 175
 
0.6%
설비개조 172
 
0.6%
사본으로 172
 
0.6%
원본보관에 132
 
0.4%
Other values (24) 468
 
1.5%

평가의견
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct2
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
폐기
9991 
-
 
9

Length

Max length2
Median length2
Mean length1.9991
Min length1

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row폐기
2nd row폐기
3rd row폐기
4th row폐기
5th row폐기

Common Values

ValueCountFrequency (%)
폐기 9991
99.9%
- 9
 
0.1%

Length

2023-12-13T01:21:43.037941image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:21:43.118926image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
폐기 9991
99.9%
9
 
0.1%
Distinct184
Distinct (%)1.8%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
2023-12-13T01:21:43.389887image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length138
Median length115
Mean length40.5484
Min length1

Characters and Unicode

Total characters405484
Distinct characters270
Distinct categories8 ?
Distinct scripts3 ?
Distinct blocks2 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique33 ?
Unique (%)0.3%

Sample

1st row설비개조 등의 이유로 업무참고적 가치를 상실하였으므로 폐기로 심의함
2nd row회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함
3rd row보존기간이 기 경과하였으므로 폐기로 심의함
4th row업무참고적 가치를 상실하여 폐기로 심의함
5th row업무참고적 가치를 상실하여 폐기로 심의함
ValueCountFrequency (%)
심의함 9997
 
11.7%
폐기로 9978
 
11.7%
보존기간이 7438
 
8.7%
경과하였으므로 4995
 
5.8%
가치를 4817
 
5.6%
업무참고적 4135
 
4.8%
3573
 
4.2%
상실하여 2424
 
2.8%
이를 2136
 
2.5%
이미 2135
 
2.5%
Other values (479) 33875
39.6%
2023-12-13T01:21:43.861011image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
75506
 
18.6%
28909
 
7.1%
21733
 
5.4%
15556
 
3.8%
15095
 
3.7%
11600
 
2.9%
10430
 
2.6%
10002
 
2.5%
10000
 
2.5%
9991
 
2.5%
Other values (260) 196662
48.5%

Most occurring categories

ValueCountFrequency (%)
Other Letter 323728
79.8%
Space Separator 75506
 
18.6%
Decimal Number 5891
 
1.5%
Other Punctuation 349
 
0.1%
Open Punctuation 3
 
< 0.1%
Close Punctuation 3
 
< 0.1%
Uppercase Letter 3
 
< 0.1%
Dash Punctuation 1
 
< 0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
28909
 
8.9%
21733
 
6.7%
15556
 
4.8%
15095
 
4.7%
11600
 
3.6%
10430
 
3.2%
10002
 
3.1%
10000
 
3.1%
9991
 
3.1%
9677
 
3.0%
Other values (246) 180735
55.8%
Decimal Number
ValueCountFrequency (%)
1 2171
36.9%
0 2107
35.8%
5 1382
23.5%
3 231
 
3.9%
Other Punctuation
ValueCountFrequency (%)
, 184
52.7%
" 164
47.0%
: 1
 
0.3%
Uppercase Letter
ValueCountFrequency (%)
R 1
33.3%
P 1
33.3%
E 1
33.3%
Space Separator
ValueCountFrequency (%)
75506
100.0%
Open Punctuation
ValueCountFrequency (%)
( 3
100.0%
Close Punctuation
ValueCountFrequency (%)
) 3
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 323728
79.8%
Common 81753
 
20.2%
Latin 3
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
28909
 
8.9%
21733
 
6.7%
15556
 
4.8%
15095
 
4.7%
11600
 
3.6%
10430
 
3.2%
10002
 
3.1%
10000
 
3.1%
9991
 
3.1%
9677
 
3.0%
Other values (246) 180735
55.8%
Common
ValueCountFrequency (%)
75506
92.4%
1 2171
 
2.7%
0 2107
 
2.6%
5 1382
 
1.7%
3 231
 
0.3%
, 184
 
0.2%
" 164
 
0.2%
( 3
 
< 0.1%
) 3
 
< 0.1%
: 1
 
< 0.1%
Latin
ValueCountFrequency (%)
R 1
33.3%
P 1
33.3%
E 1
33.3%

Most occurring blocks

ValueCountFrequency (%)
Hangul 323728
79.8%
ASCII 81756
 
20.2%

Most frequent character per block

ASCII
ValueCountFrequency (%)
75506
92.4%
1 2171
 
2.7%
0 2107
 
2.6%
5 1382
 
1.7%
3 231
 
0.3%
, 184
 
0.2%
" 164
 
0.2%
( 3
 
< 0.1%
) 3
 
< 0.1%
: 1
 
< 0.1%
Other values (4) 4
 
< 0.1%
Hangul
ValueCountFrequency (%)
28909
 
8.9%
21733
 
6.7%
15556
 
4.8%
15095
 
4.7%
11600
 
3.6%
10430
 
3.2%
10002
 
3.1%
10000
 
3.1%
9991
 
3.1%
9677
 
3.0%
Other values (246) 180735
55.8%

심의위원 의견
Categorical

CONSTANT 

Distinct1
Distinct (%)< 0.1%
Missing0
Missing (%)0.0%
Memory size156.2 KiB
폐기
10000 

Length

Max length2
Median length2
Mean length2
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row폐기
2nd row폐기
3rd row폐기
4th row폐기
5th row폐기

Common Values

ValueCountFrequency (%)
폐기 10000
100.0%

Length

2023-12-13T01:21:44.001848image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T01:21:44.120105image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
폐기 10000
100.0%

Interactions

2023-12-13T01:21:39.505296image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T01:21:44.239479image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
부서보존연한처리의견사유평가의견
부서1.0000.6400.0560.6570.116
보존연한0.6401.0000.0360.7470.273
처리의견0.0560.0361.0000.4410.000
사유0.6570.7470.4411.0000.957
평가의견0.1160.2730.0000.9571.000
2023-12-13T01:21:44.351683image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
평가의견부서처리의견사유
평가의견1.0000.0870.0000.942
부서0.0871.0000.0310.347
처리의견0.0000.0311.0000.222
사유0.9420.3470.2221.000
2023-12-13T01:21:44.439935image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
보존연한부서처리의견사유평가의견
보존연한1.0000.4630.0340.4880.334
부서0.4631.0000.0310.3470.087
처리의견0.0340.0311.0000.2220.000
사유0.4880.3470.2221.0000.942
평가의견0.3340.0870.0000.9421.000

Missing values

2023-12-13T01:21:39.708180image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T01:21:39.889001image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

부서기록물철 제목생산년도보존연한보존년도박스번호처리의견사유평가의견상세 사유심의위원 의견
5232설비운영부연간단가계약190501905-폐기설비개조 및 사본으로 인한 폐기폐기설비개조 등의 이유로 업무참고적 가치를 상실하였으므로 폐기로 심의함폐기
3035총무부2006 회계결의서철190551905HS-10폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기
5893기계부경상정비 기성고 지급(Ⅱ)1905319051137폐기보존기간 경과로 폐기폐기보존기간이 기 경과하였으므로 폐기로 심의함폐기
2765총무부NCR관련철190551905457-c폐기보존기간 경과로 폐기폐기업무참고적 가치를 상실하여 폐기로 심의함폐기
11250계측제어부취약설비1905101905723폐기보존기간 경과로 폐기폐기업무참고적 가치를 상실하여 폐기로 심의함폐기
5465기계부운영계획철1905319051114폐기보존기간 경과로 폐기폐기보존기간이 기 경과하였으므로 폐기로 심의함폐기
1239총무부2007 6월 급여및장려금190551905460-n폐기보존기간 경과로 폐기폐기정부산하기록물관리지침 "급여일반"의 보존기간 5년을 준수하여 이를 적용하고 보존기간이 기 경과하였으므로 폐기로 심의함폐기
7865기계부예산관리1905319051220폐기보존기간 경과로 폐기폐기보존기간이 기 경과하였으므로 폐기로 심의함폐기
6622기계부영동화력발전소 1&2호기 1 입찰안내서(회반출설비)1905319051167폐기원본보관에 따른 사본분 폐기폐기원본이 아닌 사본이므로 폐기로 심의함폐기
11242계측제어부08-09 일반교육190551905716폐기보존기간 경과로 폐기폐기업무참고적 가치를 상실하여 폐기로 심의함폐기
부서기록물철 제목생산년도보존연한보존년도박스번호처리의견사유평가의견상세 사유심의위원 의견
11108계측제어부CATHODIC PROTECTION1905101905172폐기보존기간 경과로 폐기폐기업무참고적 가치를 상실하여 폐기로 심의함폐기
9249전기부전기설비 점검표19053190548폐기보존기간 경과로 폐기폐기업무참고적 가치를 상실하여 폐기로 심의함폐기
7834기계부지입자재검사철1905319051217폐기보존기간 경과로 폐기폐기보존기간이 기 경과하였으므로 폐기로 심의함폐기
6205기계부#1,2 전기집진기1905319051152폐기설비철거로 구자료 폐기폐기설비개조로 인한 기록물의 가치가 상실되었으므로 폐기로 심의함폐기
771총무부간이공사철Ⅶ190551905499-15폐기보존기간 경과로 폐기폐기간이공사기록물은 업무의 빈도를 고려할때 보존기간은 5년이 적정하고 이를 적용하였을때 보존기간이 기 경과하였으므로 폐기로 심의함폐기
9494전기부2009 1호기 MILL O/H19055190562폐기보존기간 경과로 폐기폐기계획예방정비와 관련된 기록물은 보존기간이 10년이나, 업무참고적 가치를 고려하였을때 본 기록물은 보존기간이 5년이 적정하므로 이를 적용하면 보존기간이 기경과하였으므로 폐기로 심의함폐기
3955총무부2001 1호기 정밀진단대비 보온보강공사1905101905HS-43폐기보존기간 경과로 폐기폐기용역구매공사 계약기록물은 보존기간이 10년이며 이를 적용하면 보존기간이 경과하였으므로 폐기로 심의함폐기
10145전기부#2 BREAK190501905110폐기업무참고가치 상실 폐기폐기업무참고적 가치를 상실하였고 연도 및 정보를 확인하기 어려운 상태로 손상되어 정보로써의 가치를 상실하였기에 폐기로 심의함폐기
3774총무부2010 2호기 탈황 흡수탑 Gas duct pipe (FRP) 구입 (설치조건부)1905101905HS-38폐기보존기간 경과로 폐기폐기구매 계약 용역기록물은 보존기간이 10년이므로 이를 적용하면 이미 보존기간이 경과하였으므로 폐기로 심의함폐기
7000기계부중기점검 수리의뢰서1905319051184폐기보존기간 경과로 폐기폐기보존기간이 기 경과하였으므로 폐기로 심의함폐기

Duplicate rows

Most frequently occurring

부서기록물철 제목생산년도보존연한보존년도박스번호처리의견사유평가의견상세 사유심의위원 의견# duplicates
140총무부2003 회계결의서철190551905HS-19폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기16
136총무부2001 회계결의서철190551905HS-12폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기14
144총무부2004 회계결의서철190551905HS-20폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기14
143총무부2004 회계결의서철190551905HS-18폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기12
142총무부2004 회계결의서철190551905HS-14폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기10
155총무부2007 회계결의서철190551905HS-17폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기9
159총무부2008 회계결의서철190551905HS-16폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기9
220총무부일일보안점검일지190511905414폐기보존기간 경과로 폐기폐기일일보안점검과 관련된 업무로써 업무의 빈도를 고려할때 보존기간은 1년이 적정하므로 이를 적용하면 보존기간이 기 경과하였으므로 폐기로 심의함폐기9
147총무부2005 회계결의서철190551905HS-13폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기8
148총무부2005 회계결의서철190551905HS-15폐기보존기간 경과로 폐기폐기회계처리와 관련된 기록물은 보존기간이 5년으로 책정되어 있으므로 이를 적용하여 보존기간이 기 경과하였으므로 폐기로 심의함폐기8