Overview

Dataset statistics

Number of variables7
Number of observations711
Missing cells0
Missing cells (%)0.0%
Duplicate rows0
Duplicate rows (%)0.0%
Total size in memory39.7 KiB
Average record size in memory57.2 B

Variable types

Numeric1
DateTime1
Text1
Categorical4

Dataset

Description한국남동발전의 청구내역 현황입니다. 접수번호, 접수일, 청구제목 공개방법, 처리구분 등의 정보를 포함하고 있습니다.
URLhttps://www.data.go.kr/data/15064136/fileData.do

Alerts

처리상태 is highly overall correlated with 결정구분 and 1 other fieldsHigh correlation
비공개사유 is highly overall correlated with 처리상태High correlation
결정구분 is highly overall correlated with 처리상태High correlation
공개방법 is highly imbalanced (92.4%)Imbalance
비공개사유 is highly imbalanced (64.9%)Imbalance

Reproduction

Analysis started2023-12-12 17:03:18.892402
Analysis finished2023-12-12 17:03:19.885625
Duration0.99 seconds
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

접수번호
Real number (ℝ)

Distinct710
Distinct (%)99.9%
Missing0
Missing (%)0.0%
Infinite0
Infinite (%)0.0%
Mean8111896.1
Minimum6331872
Maximum10213509
Zeros0
Zeros (%)0.0%
Negative0
Negative (%)0.0%
Memory size6.4 KiB
2023-12-13T02:03:19.967468image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Quantile statistics

Minimum6331872
5-th percentile6569301.5
Q17237968
median7898502
Q38970385
95-th percentile9970702.5
Maximum10213509
Range3881637
Interquartile range (IQR)1732417

Descriptive statistics

Standard deviation1071868.3
Coefficient of variation (CV)0.13213536
Kurtosis-1.0496181
Mean8111896.1
Median Absolute Deviation (MAD)870754
Skewness0.25516912
Sum5.7675581 × 109
Variance1.1489017 × 1012
MonotonicityNot monotonic
2023-12-13T02:03:20.123516image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
ValueCountFrequency (%)
7081967 2
 
0.3%
8683430 1
 
0.1%
8531824 1
 
0.1%
8514089 1
 
0.1%
8520796 1
 
0.1%
8520795 1
 
0.1%
8532125 1
 
0.1%
8532041 1
 
0.1%
8531988 1
 
0.1%
8531930 1
 
0.1%
Other values (700) 700
98.5%
ValueCountFrequency (%)
6331872 1
0.1%
6347667 1
0.1%
6349786 1
0.1%
6353565 1
0.1%
6363941 1
0.1%
6364670 1
0.1%
6375094 1
0.1%
6384238 1
0.1%
6385186 1
0.1%
6388757 1
0.1%
ValueCountFrequency (%)
10213509 1
0.1%
10206239 1
0.1%
10201216 1
0.1%
10186956 1
0.1%
10179136 1
0.1%
10179116 1
0.1%
10169486 1
0.1%
10163363 1
0.1%
10150812 1
0.1%
10146559 1
0.1%
Distinct437
Distinct (%)61.5%
Missing0
Missing (%)0.0%
Memory size5.7 KiB
Minimum2020-01-03 00:00:00
Maximum2022-12-29 00:00:00
2023-12-13T02:03:20.278666image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2023-12-13T02:03:20.430079image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)
Distinct654
Distinct (%)92.0%
Missing0
Missing (%)0.0%
Memory size5.7 KiB
2023-12-13T02:03:20.816241image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length87
Median length65
Mean length36.908579
Min length2

Characters and Unicode

Total characters26242
Distinct characters637
Distinct categories14 ?
Distinct scripts4 ?
Distinct blocks7 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique615 ?
Unique (%)86.5%

Sample

1st row언론사 주최 ESG 관련 행사·모임 등에 대한 참여 내역
2nd row2021년도 기관경영평가 보고서 정보공개 신청
3rd row(2)국민권익위원장 전현희, 중앙행정심판위원장 김기표 년 놈들아 월급버러지가 아니라면 답변,, 이렇게 간단한 문제도 정도로 무능하면 애를 보러
4th row(ESG혁신부-185) '2021년도 KOEN 시민참여지수 측정 결과보고' 문서를 정보공개 청구합니다.
5th row(2)국토부장관 노형욱, 1차관 윤성원, 주택토지실장 김수상, 주택정책관 김영한, 주택건설공급과장 김경헌 개자식들아 공동주택관리규약을 개정한
ValueCountFrequency (%)
정보공개 154
 
2.8%
129
 
2.4%
요청 114
 
2.1%
청구합니다 106
 
1.9%
문서를 92
 
1.7%
관련 73
 
1.3%
한국남동발전 60
 
1.1%
공개 52
 
1.0%
현황 52
 
1.0%
채용 49
 
0.9%
Other values (2559) 4565
83.8%
2023-12-13T02:03:21.378628image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
4845
 
18.5%
549
 
2.1%
458
 
1.7%
2 395
 
1.5%
388
 
1.5%
374
 
1.4%
371
 
1.4%
367
 
1.4%
331
 
1.3%
326
 
1.2%
Other values (627) 17838
68.0%

Most occurring categories

ValueCountFrequency (%)
Other Letter 17935
68.3%
Space Separator 4845
 
18.5%
Decimal Number 1324
 
5.0%
Other Punctuation 801
 
3.1%
Uppercase Letter 312
 
1.2%
Open Punctuation 293
 
1.1%
Close Punctuation 293
 
1.1%
Lowercase Letter 292
 
1.1%
Dash Punctuation 119
 
0.5%
Final Punctuation 9
 
< 0.1%
Other values (4) 19
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
549
 
3.1%
458
 
2.6%
388
 
2.2%
374
 
2.1%
371
 
2.1%
367
 
2.0%
331
 
1.8%
326
 
1.8%
295
 
1.6%
262
 
1.5%
Other values (550) 14214
79.3%
Lowercase Letter
ValueCountFrequency (%)
s 46
15.8%
c 39
13.4%
n 33
11.3%
o 24
 
8.2%
h 18
 
6.2%
y 16
 
5.5%
e 11
 
3.8%
a 10
 
3.4%
r 10
 
3.4%
p 9
 
3.1%
Other values (13) 76
26.0%
Uppercase Letter
ValueCountFrequency (%)
C 47
15.1%
S 35
11.2%
T 27
 
8.7%
N 24
 
7.7%
E 20
 
6.4%
O 18
 
5.8%
P 16
 
5.1%
I 15
 
4.8%
L 13
 
4.2%
V 13
 
4.2%
Other values (12) 84
26.9%
Decimal Number
ValueCountFrequency (%)
2 395
29.8%
0 266
20.1%
1 265
20.0%
5 82
 
6.2%
3 71
 
5.4%
9 61
 
4.6%
4 49
 
3.7%
8 46
 
3.5%
6 45
 
3.4%
7 44
 
3.3%
Other Punctuation
ValueCountFrequency (%)
. 314
39.2%
, 248
31.0%
' 215
26.8%
· 14
 
1.7%
! 6
 
0.7%
& 2
 
0.2%
? 1
 
0.1%
# 1
 
0.1%
Open Punctuation
ValueCountFrequency (%)
( 290
99.0%
[ 2
 
0.7%
1
 
0.3%
Close Punctuation
ValueCountFrequency (%)
) 290
99.0%
] 2
 
0.7%
1
 
0.3%
Other Symbol
ValueCountFrequency (%)
5
83.3%
1
 
16.7%
Space Separator
ValueCountFrequency (%)
4845
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 119
100.0%
Final Punctuation
ValueCountFrequency (%)
9
100.0%
Initial Punctuation
ValueCountFrequency (%)
8
100.0%
Math Symbol
ValueCountFrequency (%)
~ 4
100.0%
Connector Punctuation
ValueCountFrequency (%)
_ 1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 17927
68.3%
Common 7702
29.3%
Latin 604
 
2.3%
Han 9
 
< 0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
549
 
3.1%
458
 
2.6%
388
 
2.2%
374
 
2.1%
371
 
2.1%
367
 
2.0%
331
 
1.8%
326
 
1.8%
295
 
1.6%
262
 
1.5%
Other values (543) 14206
79.2%
Latin
ValueCountFrequency (%)
C 47
 
7.8%
s 46
 
7.6%
c 39
 
6.5%
S 35
 
5.8%
n 33
 
5.5%
T 27
 
4.5%
N 24
 
4.0%
o 24
 
4.0%
E 20
 
3.3%
h 18
 
3.0%
Other values (35) 291
48.2%
Common
ValueCountFrequency (%)
4845
62.9%
2 395
 
5.1%
. 314
 
4.1%
( 290
 
3.8%
) 290
 
3.8%
0 266
 
3.5%
1 265
 
3.4%
, 248
 
3.2%
' 215
 
2.8%
- 119
 
1.5%
Other values (21) 455
 
5.9%
Han
ValueCountFrequency (%)
2
22.2%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%

Most occurring blocks

ValueCountFrequency (%)
Hangul 17923
68.3%
ASCII 8268
31.5%
None 17
 
0.1%
Punctuation 17
 
0.1%
CJK 9
 
< 0.1%
Geometric Shapes 5
 
< 0.1%
Compat Jamo 3
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
4845
58.6%
2 395
 
4.8%
. 314
 
3.8%
( 290
 
3.5%
) 290
 
3.5%
0 266
 
3.2%
1 265
 
3.2%
, 248
 
3.0%
' 215
 
2.6%
- 119
 
1.4%
Other values (60) 1021
 
12.3%
Hangul
ValueCountFrequency (%)
549
 
3.1%
458
 
2.6%
388
 
2.2%
374
 
2.1%
371
 
2.1%
367
 
2.0%
331
 
1.8%
326
 
1.8%
295
 
1.6%
262
 
1.5%
Other values (539) 14202
79.2%
None
ValueCountFrequency (%)
· 14
82.4%
1
 
5.9%
1
 
5.9%
1
 
5.9%
Punctuation
ValueCountFrequency (%)
9
52.9%
8
47.1%
Geometric Shapes
ValueCountFrequency (%)
5
100.0%
CJK
ValueCountFrequency (%)
2
22.2%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
1
11.1%
Compat Jamo
ValueCountFrequency (%)
1
33.3%
1
33.3%
1
33.3%

공개방법
Categorical

IMBALANCE 

Distinct4
Distinct (%)0.6%
Missing0
Missing (%)0.0%
Memory size5.7 KiB
전자파일
698 
사본·출력물
 
9
열람·시청
 
3
복제·인화물
 
1

Length

Max length6
Median length4
Mean length4.0323488
Min length4

Unique

Unique1 ?
Unique (%)0.1%

Sample

1st row전자파일
2nd row전자파일
3rd row전자파일
4th row전자파일
5th row전자파일

Common Values

ValueCountFrequency (%)
전자파일 698
98.2%
사본·출력물 9
 
1.3%
열람·시청 3
 
0.4%
복제·인화물 1
 
0.1%

Length

2023-12-13T02:03:21.549594image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T02:03:21.667162image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
전자파일 698
98.2%
사본·출력물 9
 
1.3%
열람·시청 3
 
0.4%
복제·인화물 1
 
0.1%

결정구분
Categorical

HIGH CORRELATION 

Distinct9
Distinct (%)1.3%
Missing0
Missing (%)0.0%
Memory size5.7 KiB
공개
323 
종결처리통지완료
96 
부분공개
79 
비공개
66 
청구취하
63 
Other values (4)
84 

Length

Max length9
Median length8
Mean length3.6160338
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row공개
2nd row비공개
3rd row종결처리통지완료
4th row종결처리통지완료
5th row청구취하

Common Values

ValueCountFrequency (%)
공개 323
45.4%
종결처리통지완료 96
 
13.5%
부분공개 79
 
11.1%
비공개 66
 
9.3%
청구취하 63
 
8.9%
<NA> 40
 
5.6%
종결처리 30
 
4.2%
정보부존재통지완료 11
 
1.5%
이송완료 3
 
0.4%

Length

2023-12-13T02:03:21.792186image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T02:03:21.924711image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
공개 323
45.4%
종결처리통지완료 96
 
13.5%
부분공개 79
 
11.1%
비공개 66
 
9.3%
청구취하 63
 
8.9%
na 40
 
5.6%
종결처리 30
 
4.2%
정보부존재통지완료 11
 
1.5%
이송완료 3
 
0.4%

처리상태
Categorical

HIGH CORRELATION 

Distinct6
Distinct (%)0.8%
Missing0
Missing (%)0.0%
Memory size5.7 KiB
공개완료
508 
종결처리통지완료
96 
청구취하
63 
종결처리
 
30
정보부존재통지완료
 
11

Length

Max length9
Median length4
Mean length4.6174402
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row공개완료
2nd row공개완료
3rd row종결처리통지완료
4th row공개완료
5th row종결처리통지완료

Common Values

ValueCountFrequency (%)
공개완료 508
71.4%
종결처리통지완료 96
 
13.5%
청구취하 63
 
8.9%
종결처리 30
 
4.2%
정보부존재통지완료 11
 
1.5%
이송완료 3
 
0.4%

Length

2023-12-13T02:03:22.075465image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T02:03:22.215824image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
공개완료 508
71.4%
종결처리통지완료 96
 
13.5%
청구취하 63
 
8.9%
종결처리 30
 
4.2%
정보부존재통지완료 11
 
1.5%
이송완료 3
 
0.4%

비공개사유
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct9
Distinct (%)1.3%
Missing0
Missing (%)0.0%
Memory size5.7 KiB
<NA>
556 
법인 등 영업상 비밀침해
83 
공정한 업무수행 지장 등
 
52
개인사생활 침해
 
11
국방 등 국익침해
 
4
Other values (4)
 
5

Length

Max length13
Median length4
Mean length5.8452883
Min length4

Unique

Unique3 ?
Unique (%)0.4%

Sample

1st row<NA>
2nd row공정한 업무수행 지장 등
3rd row<NA>
4th row법인 등 영업상 비밀침해
5th row<NA>

Common Values

ValueCountFrequency (%)
<NA> 556
78.2%
법인 등 영업상 비밀침해 83
 
11.7%
공정한 업무수행 지장 등 52
 
7.3%
개인사생활 침해 11
 
1.5%
국방 등 국익침해 4
 
0.6%
법령상 비밀·비공개 2
 
0.3%
국민의 생명 등 공익침해 1
 
0.1%
특정인의 이익·불이익 1
 
0.1%
재판관련 정보 등 1
 
0.1%

Length

2023-12-13T02:03:22.368058image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2023-12-13T02:03:22.585545image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
na 556
48.6%
141
 
12.3%
영업상 83
 
7.3%
비밀침해 83
 
7.3%
법인 83
 
7.3%
공정한 52
 
4.5%
업무수행 52
 
4.5%
지장 52
 
4.5%
개인사생활 11
 
1.0%
침해 11
 
1.0%
Other values (11) 19
 
1.7%

Interactions

2023-12-13T02:03:19.539673image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Correlations

2023-12-13T02:03:22.714392image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
접수번호공개방법결정구분처리상태비공개사유
접수번호1.0000.1690.5520.4140.191
공개방법0.1691.0000.0000.0000.000
결정구분0.5520.0001.0000.9370.567
처리상태0.4140.0000.9371.000NaN
비공개사유0.1910.0000.567NaN1.000
2023-12-13T02:03:22.847487image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
처리상태비공개사유결정구분공개방법
처리상태1.0001.0000.8490.000
비공개사유1.0001.0000.2780.000
결정구분0.8490.2781.0000.000
공개방법0.0000.0000.0001.000
2023-12-13T02:03:22.992982image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
접수번호공개방법결정구분처리상태비공개사유
접수번호1.0000.1010.3020.2320.089
공개방법0.1011.0000.0000.0000.000
결정구분0.3020.0001.0000.8490.278
처리상태0.2320.0000.8491.0001.000
비공개사유0.0890.0000.2781.0001.000

Missing values

2023-12-13T02:03:19.715013image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2023-12-13T02:03:19.833213image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

접수번호접수일청구제목공개방법결정구분처리상태비공개사유
086834302022-01-03언론사 주최 ESG 관련 행사·모임 등에 대한 참여 내역전자파일공개공개완료<NA>
186817082022-01-032021년도 기관경영평가 보고서 정보공개 신청전자파일비공개공개완료공정한 업무수행 지장 등
286938522022-01-04(2)국민권익위원장 전현희, 중앙행정심판위원장 김기표 년 놈들아 월급버러지가 아니라면 답변,, 이렇게 간단한 문제도 정도로 무능하면 애를 보러전자파일종결처리통지완료종결처리통지완료<NA>
387043992022-01-05(ESG혁신부-185) '2021년도 KOEN 시민참여지수 측정 결과보고' 문서를 정보공개 청구합니다.전자파일종결처리통지완료공개완료법인 등 영업상 비밀침해
487029082022-01-05(2)국토부장관 노형욱, 1차관 윤성원, 주택토지실장 김수상, 주택정책관 김영한, 주택건설공급과장 김경헌 개자식들아 공동주택관리규약을 개정한전자파일청구취하종결처리통지완료<NA>
587115302022-01-062021년도 장애인 고용현황 및 2022년 계획에 대한 정보공개를 요청합니다.전자파일종결처리통지완료청구취하<NA>
687105292022-01-062021년도 장애인 고용현황 및 2022년 계획에 대한 정보공개를 요청합니다.전자파일종결처리통지완료공개완료<NA>
787225472022-01-07개봉하지 않은 등기우편물 3통,,또 보낼 고양지청 902호 검사는 국고도 아끼고 상식도 기르시오. 나는 평생 진정해 본 적이 없는 사람이오.전자파일종결처리통지완료종결처리통지완료<NA>
887323222022-01-10(3) 전현희 3종에 수 천 개의 증거가 있다고 해도,, 전결자 마음대로 유권해석을 하면,, 그게 나라 김부겸과 같이 무능한 놈이 국무총리이니,, 여하 간에전자파일종결처리통지완료종결처리통지완료<NA>
987306442022-01-102020년 남동발전 석탄발전기별 온실가스 및 대기오염물질 배출량 정보공개청구 합니다.전자파일종결처리통지완료공개완료<NA>
접수번호접수일청구제목공개방법결정구분처리상태비공개사유
70173371952020-12-18'성과연봉제 조기도입 성과급' 환수 현황 및 환수된 성과급의 출연, 증여(기부 및 후원 등) 내역전자파일공개공개완료<NA>
70273413492020-12-21남동발전 분당복합 업무동 관련 정보공개 청구임.전자파일부분공개공개완료공정한 업무수행 지장 등
70373456292020-12-22발전용 석탄 건조관련 정보공개 요청전자파일공개공개완료<NA>
70473446882020-12-22공기업 인원현황 및 청렴도와 고객만족도 결과 자료 요청전자파일부분공개공개완료공정한 업무수행 지장 등
70573483392020-12-232015년부터 2019년까지 연도별 비정규직(기간제 중 전일제) 신규 채용 인원 수에 대한 정보공개 청구전자파일공개공개완료<NA>
70673527872020-12-24지방세 납부 현황 외전자파일공개공개완료<NA>
70773583372020-12-28한국남동발전(진주본사) 방역전자파일공개공개완료<NA>
70873562772020-12-28에프엑스팩토리, 토리게임즈, 티노게임즈, 노바운더리와의 각종 계약 내역 청구 건전자파일공개공개완료<NA>
70973600622020-12-29연료전지 타입, 주기기 제작사, 사업비 규모전자파일부분공개공개완료법인 등 영업상 비밀침해
71073528262020-12-31지방세 납부 현황 외전자파일종결처리종결처리<NA>