Overview

Dataset statistics

Number of variables7
Number of observations120
Missing cells0
Missing cells (%)0.0%
Duplicate rows1
Duplicate rows (%)0.8%
Total size in memory6.7 KiB
Average record size in memory57.1 B

Variable types

DateTime1
Categorical5
Text1

Dataset

Description인천광역시서구시설관리공단 2023년 정보공개청구 현황을 청구일, 청구인, 청구인구분, 청구제목, 공개방법, 결정구분, 비공개사유, 청구방법으로 구분하여 공개합니다.
Author인천광역시서구시설관리공단
URLhttps://www.data.go.kr/data/15126888/fileData.do

Alerts

Dataset has 1 (0.8%) duplicate rowsDuplicates
청구인 is highly overall correlated with 청구인구분 and 1 other fieldsHigh correlation
청구인구분 is highly overall correlated with 청구인High correlation
청구방법 is highly overall correlated with 청구인High correlation
청구인구분 is highly imbalanced (60.9%)Imbalance
공개방법 is highly imbalanced (84.6%)Imbalance

Reproduction

Analysis started2024-03-15 00:09:23.034606
Analysis finished2024-03-15 00:09:24.404352
Duration1.37 second
Software versionydata-profiling vv4.5.1
Download configurationconfig.json

Variables

Distinct86
Distinct (%)71.7%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
Minimum2023-01-01 00:00:00
Maximum2023-12-26 00:00:00
2024-03-15T09:09:24.604388image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
2024-03-15T09:09:25.043267image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram with fixed size bins (bins=50)

청구인
Categorical

HIGH CORRELATION 

Distinct36
Distinct (%)30.0%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
김○○
35 
이○○
17 
박○○
스○○O
최○○
Other values (31)
49 

Length

Max length15
Median length3
Mean length3.35
Min length3

Unique

Unique20 ?
Unique (%)16.7%

Sample

1st row이○○
2nd row우○○
3rd row황○○
4th row김○○
5th row홍○○

Common Values

ValueCountFrequency (%)
김○○ 35
29.2%
이○○ 17
14.2%
박○○ 8
 
6.7%
스○○O 6
 
5.0%
최○○ 5
 
4.2%
홍○○ 4
 
3.3%
조○○ 4
 
3.3%
강○○ 4
 
3.3%
황○○ 3
 
2.5%
양○○ 2
 
1.7%
Other values (26) 32
26.7%

Length

2024-03-15T09:09:25.521379image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
김○○ 35
28.2%
이○○ 17
13.7%
박○○ 8
 
6.5%
스○○o 6
 
4.8%
최○○ 5
 
4.0%
홍○○ 4
 
3.2%
조○○ 4
 
3.2%
강○○ 4
 
3.2%
황○○ 3
 
2.4%
우○○ 2
 
1.6%
Other values (30) 36
29.0%

청구인구분
Categorical

HIGH CORRELATION  IMBALANCE 

Distinct3
Distinct (%)2.5%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
개인(내국인)
106 
단체
 
10
법인(국내)
 
4

Length

Max length7
Median length7
Mean length6.55
Min length2

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row개인(내국인)
2nd row개인(내국인)
3rd row개인(내국인)
4th row개인(내국인)
5th row개인(내국인)

Common Values

ValueCountFrequency (%)
개인(내국인) 106
88.3%
단체 10
 
8.3%
법인(국내) 4
 
3.3%

Length

2024-03-15T09:09:25.920938image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T09:09:26.248152image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
개인(내국인 106
88.3%
단체 10
 
8.3%
법인(국내 4
 
3.3%
Distinct109
Distinct (%)90.8%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
2024-03-15T09:09:27.415353image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Length

Max length83
Median length46
Mean length32.95
Min length3

Characters and Unicode

Total characters3954
Distinct characters375
Distinct categories12 ?
Distinct scripts4 ?
Distinct blocks5 ?
The Unicode Standard assigns character properties to each code point, which can be used to analyse textual variables.

Unique

Unique98 ?
Unique (%)81.7%

Sample

1st row당장 폐지해야 할 기관과 없애거나 개선이 필요한 제도
2nd row내부결재 된 년도별 주요업무보고(수정본 및 첨부자료 포함) 정보공개 청구
3rd row채용형 시간선택제 근로자 현황(2014년 이후) 정보공개청구
4th row기관 일반직 직군통합 추진실적 문의
5th row2023년 공공기관 ESG 운영현황 정보공개 청구의 건
ValueCountFrequency (%)
점수 14
 
1.6%
정보공개 14
 
1.6%
11
 
1.2%
청구 10
 
1.1%
블라인드 10
 
1.1%
요청 9
 
1.0%
2023년 9
 
1.0%
8
 
0.9%
현황 7
 
0.8%
청구합니다 7
 
0.8%
Other values (473) 800
89.0%
2024-03-15T09:09:29.259384image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/

Most occurring characters

ValueCountFrequency (%)
788
 
19.9%
80
 
2.0%
59
 
1.5%
54
 
1.4%
51
 
1.3%
47
 
1.2%
46
 
1.2%
43
 
1.1%
2 42
 
1.1%
39
 
1.0%
Other values (365) 2705
68.4%

Most occurring categories

ValueCountFrequency (%)
Other Letter 2794
70.7%
Space Separator 788
 
19.9%
Decimal Number 155
 
3.9%
Lowercase Letter 95
 
2.4%
Other Punctuation 35
 
0.9%
Uppercase Letter 28
 
0.7%
Open Punctuation 22
 
0.6%
Close Punctuation 18
 
0.5%
Other Symbol 10
 
0.3%
Dash Punctuation 7
 
0.2%
Other values (2) 2
 
0.1%

Most frequent character per category

Other Letter
ValueCountFrequency (%)
80
 
2.9%
59
 
2.1%
54
 
1.9%
51
 
1.8%
47
 
1.7%
46
 
1.6%
43
 
1.5%
39
 
1.4%
38
 
1.4%
35
 
1.3%
Other values (319) 2302
82.4%
Lowercase Letter
ValueCountFrequency (%)
c 23
24.2%
m 16
16.8%
n 9
 
9.5%
v 8
 
8.4%
t 8
 
8.4%
h 8
 
8.4%
s 6
 
6.3%
k 4
 
4.2%
p 4
 
4.2%
i 2
 
2.1%
Other values (5) 7
 
7.4%
Uppercase Letter
ValueCountFrequency (%)
C 8
28.6%
S 4
14.3%
N 3
 
10.7%
T 2
 
7.1%
D 2
 
7.1%
A 2
 
7.1%
Q 2
 
7.1%
V 2
 
7.1%
E 1
 
3.6%
G 1
 
3.6%
Decimal Number
ValueCountFrequency (%)
2 42
27.1%
3 29
18.7%
0 23
14.8%
1 22
14.2%
9 8
 
5.2%
4 8
 
5.2%
6 7
 
4.5%
5 6
 
3.9%
8 6
 
3.9%
7 4
 
2.6%
Other Punctuation
ValueCountFrequency (%)
. 23
65.7%
, 12
34.3%
Other Symbol
ValueCountFrequency (%)
6
60.0%
4
40.0%
Space Separator
ValueCountFrequency (%)
788
100.0%
Open Punctuation
ValueCountFrequency (%)
( 22
100.0%
Close Punctuation
ValueCountFrequency (%)
) 18
100.0%
Dash Punctuation
ValueCountFrequency (%)
- 7
100.0%
Letter Number
ValueCountFrequency (%)
1
100.0%
Control
ValueCountFrequency (%)
1
100.0%

Most occurring scripts

ValueCountFrequency (%)
Hangul 2792
70.6%
Common 1036
 
26.2%
Latin 124
 
3.1%
Han 2
 
0.1%

Most frequent character per script

Hangul
ValueCountFrequency (%)
80
 
2.9%
59
 
2.1%
54
 
1.9%
51
 
1.8%
47
 
1.7%
46
 
1.6%
43
 
1.5%
39
 
1.4%
38
 
1.4%
35
 
1.3%
Other values (317) 2300
82.4%
Latin
ValueCountFrequency (%)
c 23
18.5%
m 16
12.9%
n 9
 
7.3%
v 8
 
6.5%
t 8
 
6.5%
h 8
 
6.5%
C 8
 
6.5%
s 6
 
4.8%
S 4
 
3.2%
k 4
 
3.2%
Other values (17) 30
24.2%
Common
ValueCountFrequency (%)
788
76.1%
2 42
 
4.1%
3 29
 
2.8%
0 23
 
2.2%
. 23
 
2.2%
1 22
 
2.1%
( 22
 
2.1%
) 18
 
1.7%
, 12
 
1.2%
9 8
 
0.8%
Other values (9) 49
 
4.7%
Han
ValueCountFrequency (%)
1
50.0%
1
50.0%

Most occurring blocks

ValueCountFrequency (%)
Hangul 2792
70.6%
ASCII 1149
29.1%
Geometric Shapes 10
 
0.3%
CJK 2
 
0.1%
Number Forms 1
 
< 0.1%

Most frequent character per block

ASCII
ValueCountFrequency (%)
788
68.6%
2 42
 
3.7%
3 29
 
2.5%
0 23
 
2.0%
. 23
 
2.0%
c 23
 
2.0%
1 22
 
1.9%
( 22
 
1.9%
) 18
 
1.6%
m 16
 
1.4%
Other values (33) 143
 
12.4%
Hangul
ValueCountFrequency (%)
80
 
2.9%
59
 
2.1%
54
 
1.9%
51
 
1.8%
47
 
1.7%
46
 
1.6%
43
 
1.5%
39
 
1.4%
38
 
1.4%
35
 
1.3%
Other values (317) 2300
82.4%
Geometric Shapes
ValueCountFrequency (%)
6
60.0%
4
40.0%
CJK
ValueCountFrequency (%)
1
50.0%
1
50.0%
Number Forms
ValueCountFrequency (%)
1
100.0%

공개방법
Categorical

IMBALANCE 

Distinct3
Distinct (%)2.5%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
전자파일
116 
열람·시청
 
2
사본·출력물
 
2

Length

Max length6
Median length4
Mean length4.05
Min length4

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row전자파일
2nd row전자파일
3rd row전자파일
4th row전자파일
5th row전자파일

Common Values

ValueCountFrequency (%)
전자파일 116
96.7%
열람·시청 2
 
1.7%
사본·출력물 2
 
1.7%

Length

2024-03-15T09:09:29.711790image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T09:09:30.035792image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
전자파일 116
96.7%
열람·시청 2
 
1.7%
사본·출력물 2
 
1.7%

결정구분
Categorical

Distinct12
Distinct (%)10.0%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
정보부존재
27 
공개
24 
즉시공개
20 
종결
19 
청구취하
10 
Other values (7)
20 

Length

Max length5
Median length4
Mean length3.4333333
Min length2

Unique

Unique3 ?
Unique (%)2.5%

Sample

1st row종결
2nd row공개
3rd row공개
4th row공개
5th row공개

Common Values

ValueCountFrequency (%)
정보부존재 27
22.5%
공개 24
20.0%
즉시공개 20
16.7%
종결 19
15.8%
청구취하 10
 
8.3%
기관이송 8
 
6.7%
정보 5
 
4.2%
부분공개 2
 
1.7%
종결처리통 2
 
1.7%
진정질의 1
 
0.8%
Other values (2) 2
 
1.7%

Length

2024-03-15T09:09:30.416786image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category
ValueCountFrequency (%)
정보부존재 27
22.5%
공개 24
20.0%
즉시공개 20
16.7%
종결 19
15.8%
청구취하 10
 
8.3%
기관이송 8
 
6.7%
정보 5
 
4.2%
부분공개 2
 
1.7%
종결처리통 2
 
1.7%
진정질의 1
 
0.8%
Other values (2) 2
 
1.7%

청구방법
Categorical

HIGH CORRELATION 

Distinct2
Distinct (%)1.7%
Missing0
Missing (%)0.0%
Memory size1.1 KiB
온라인
103 
모바일
17 

Length

Max length3
Median length3
Mean length3
Min length3

Unique

Unique0 ?
Unique (%)0.0%

Sample

1st row온라인
2nd row온라인
3rd row온라인
4th row온라인
5th row온라인

Common Values

ValueCountFrequency (%)
온라인 103
85.8%
모바일 17
 
14.2%

Length

2024-03-15T09:09:30.816921image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Histogram of lengths of the category

Common Values (Plot)

2024-03-15T09:09:31.003022image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
ValueCountFrequency (%)
온라인 103
85.8%
모바일 17
 
14.2%

Correlations

2024-03-15T09:09:31.120110image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
청구일청구인청구인구분공개방법결정구분청구방법
청구일1.0000.8251.0001.0000.8290.000
청구인0.8251.0001.0000.7650.5190.819
청구인구분1.0001.0001.0000.0000.4930.044
공개방법1.0000.7650.0001.0000.0000.200
결정구분0.8290.5190.4930.0001.0000.456
청구방법0.0000.8190.0440.2000.4561.000
2024-03-15T09:09:31.298658image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
청구인청구방법공개방법청구인구분결정구분
청구인1.0000.5740.4260.8470.146
청구방법0.5741.0000.3260.0710.338
공개방법0.4260.3261.0000.0000.000
청구인구분0.8470.0710.0001.0000.245
결정구분0.1460.3380.0000.2451.000
2024-03-15T09:09:31.597109image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
청구인청구인구분공개방법결정구분청구방법
청구인1.0000.8470.4260.1460.574
청구인구분0.8471.0000.0000.2450.071
공개방법0.4260.0001.0000.0000.326
결정구분0.1460.2450.0001.0000.338
청구방법0.5740.0710.3260.3381.000

Missing values

2024-03-15T09:09:23.861275image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
A simple visualization of nullity by column.
2024-03-15T09:09:24.255497image/svg+xmlMatplotlib v3.7.2, https://matplotlib.org/
Nullity matrix is a data-dense display which lets you quickly visually pick out patterns in data completion.

Sample

청구일청구인청구인구분청구제목공개방법결정구분청구방법
02023-01-01이○○개인(내국인)당장 폐지해야 할 기관과 없애거나 개선이 필요한 제도전자파일종결온라인
12023-01-04우○○개인(내국인)내부결재 된 년도별 주요업무보고(수정본 및 첨부자료 포함) 정보공개 청구전자파일공개온라인
22023-01-09황○○개인(내국인)채용형 시간선택제 근로자 현황(2014년 이후) 정보공개청구전자파일공개온라인
32023-01-14김○○개인(내국인)기관 일반직 직군통합 추진실적 문의전자파일공개온라인
42023-01-18홍○○개인(내국인)2023년 공공기관 ESG 운영현황 정보공개 청구의 건전자파일공개온라인
52023-01-20조○○개인(내국인)노정희 조국 박찬주의 장년 이혼녀 초혼녀 인적세탁 총각 협박 강제결혼 목적사찰전자파일정보부존재온라인
62023-01-30최○○개인(내국인)주차중 차량파손 후 도주열람·시청청구취하모바일
72023-02-01바○○면단체석면 발주계획을 정보공개 청구 합니다.전자파일정보부존재온라인
82023-02-08김○○개인(내국인)2023년 예산안 정보공개 청구합니다.전자파일즉시공개온라인
92023-02-09강○○개인(내국인)수영장시설 운영인력전자파일공개온라인
청구일청구인청구인구분청구제목공개방법결정구분청구방법
1102023-11-25김○○개인(내국인)강석훈 행장님이 hmm 동원산업 우선지정시 25년까지 3.36신주 전환으로 무조건 도산해 악의적 정성평가 부정입니다.전자파일정보온라인
1112023-11-28이○○개인(내국인)2023년 11월 22일 오후 7시 검단신도시 원당동에서 교통사고로 인하여 cctv 자료를 정보공개 청구합니다전자파일이송온라인
1122023-12-07서○○개인(내국인)인천광역시 서구시설관리공단 임직원들의 주거지역 현황 공개요청전자파일청구취하온라인
1132023-12-10김○○개인(내국인)강석훈은 경력(산자, 정책실장, 서초을)위해 유찰 혹은 하림 우협선정해야전자파일정보온라인
1142023-12-13손○○개인(내국인)아이의 등교길cctv열람 청구합니다전자파일청구취하모바일
1152023-12-17김○○개인(내국인)강석훈이 hmm 유찰 지연하는 이유는 미국 한국 증시사이클에서 주주 수익 저지 손실을 목적으로 지시받은 것전자파일종결온라인
1162023-12-17김○○개인(내국인)강석훈이 hmm 유찰 지연하는 이유는 미국 한국 증시사이클에서 주주 수익 저지 손실을 목적으로 지시받은 것전자파일종결온라인
1172023-12-17김○○개인(내국인)강석훈은 경력(산자부, 정책실장, 서초을) 생각해 유찰 혹은 하림 우협 선정해야전자파일종결온라인
1182023-12-25강○○개인(내국인)전라도천년사 폐기가 답이다전자파일정보부존재온라인
1192023-12-26배○○개인(내국인)공공기관 민간위탁 전체사무 대상 정보공개 요청전자파일정보부존재온라인

Duplicate rows

Most frequently occurring

청구일청구인청구인구분청구제목공개방법결정구분청구방법# duplicates
02023-12-17김○○개인(내국인)강석훈이 hmm 유찰 지연하는 이유는 미국 한국 증시사이클에서 주주 수익 저지 손실을 목적으로 지시받은 것전자파일종결온라인2