Dataset statistics
Number of variables | 5 |
---|---|
Number of observations | 22 |
Missing cells | 11 |
Missing cells (%) | 10.0% |
Duplicate rows | 0 |
Duplicate rows (%) | 0.0% |
Total size in memory | 1012.0 B |
Average record size in memory | 46.0 B |
Variable types
Text | 3 |
---|---|
Categorical | 2 |
Dataset
Description | 용인도시공사가 보유하고 있는 개인정보파일 현황입니다. 개인정보파일 보유기간 만료 및 신규 파일 추가가 있을 때마다 변경됩니다. |
---|---|
URL | https://www.data.go.kr/data/15060015/fileData.do |
보유기간 is highly overall correlated with 개인정보 처리방법 | High correlation |
개인정보 처리방법 is highly overall correlated with 보유기간 | High correlation |
개인정보의항목(선택) has 11 (50.0%) missing values | Missing |
파일명 has unique values | Unique |
Reproduction
Analysis started | 2023-12-11 23:58:05.542461 |
---|---|
Analysis finished | 2023-12-11 23:58:05.925000 |
Duration | 0.38 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
파일명
Text
UNIQUE
 
Distinct | 22 |
---|---|
Distinct (%) | 100.0% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
Length
Max length | 23 |
---|---|
Median length | 19 |
Mean length | 14.363636 |
Min length | 10 |
Characters and Unicode
Total characters | 316 |
---|---|
Distinct characters | 102 |
Distinct categories | 6 ? |
Distinct scripts | 2 ? |
Distinct blocks | 2 ? |
Unique
Unique | 22 ? |
---|---|
Unique (%) | 100.0% |
Sample
1st row | 기술자문위원회 위원 |
---|---|
2nd row | 기존주택 전세임대사업 |
3rd row | 광교, 흥덕 분양 입주자 정보 |
4th row | 역분 분양입주자 정보 |
5th row | 주차미납압류 대상자 정보 |
Value | Count | Frequency (%) |
정보 | 11 | 15.7% |
회원 | 4 | 5.7% |
관계인 | 3 | 4.3% |
및 | 3 | 4.3% |
보상관련 | 3 | 4.3% |
소유자 | 3 | 4.3% |
홈페이지 | 3 | 4.3% |
회원관리 | 2 | 2.9% |
교통약자 | 2 | 2.9% |
회원정보 | 2 | 2.9% |
Other values (34) | 34 |
Most occurring characters
Value | Count | Frequency (%) |
48 | 15.2% | |
보 | 21 | 6.6% |
정 | 18 | 5.7% |
자 | 11 | 3.5% |
관 | 11 | 3.5% |
원 | 10 | 3.2% |
회 | 10 | 3.2% |
인 | 6 | 1.9% |
지 | 5 | 1.6% |
시 | 5 | 1.6% |
Other values (92) | 171 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 260 | |
Space Separator | 48 | 15.2% |
Open Punctuation | 3 | 0.9% |
Close Punctuation | 3 | 0.9% |
Decimal Number | 1 | 0.3% |
Other Punctuation | 1 | 0.3% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
보 | 21 | 8.1% |
정 | 18 | 6.9% |
자 | 11 | 4.2% |
관 | 11 | 4.2% |
원 | 10 | 3.8% |
회 | 10 | 3.8% |
인 | 6 | 2.3% |
지 | 5 | 1.9% |
시 | 5 | 1.9% |
터 | 5 | 1.9% |
Other values (87) | 158 |
Space Separator
Value | Count | Frequency (%) |
48 |
Open Punctuation
Value | Count | Frequency (%) |
( | 3 |
Close Punctuation
Value | Count | Frequency (%) |
) | 3 |
Decimal Number
Value | Count | Frequency (%) |
1 | 1 |
Other Punctuation
Value | Count | Frequency (%) |
, | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 260 | |
Common | 56 | 17.7% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
보 | 21 | 8.1% |
정 | 18 | 6.9% |
자 | 11 | 4.2% |
관 | 11 | 4.2% |
원 | 10 | 3.8% |
회 | 10 | 3.8% |
인 | 6 | 2.3% |
지 | 5 | 1.9% |
시 | 5 | 1.9% |
터 | 5 | 1.9% |
Other values (87) | 158 |
Common
Value | Count | Frequency (%) |
48 | ||
( | 3 | 5.4% |
) | 3 | 5.4% |
1 | 1 | 1.8% |
, | 1 | 1.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 260 | |
ASCII | 56 | 17.7% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
48 | ||
( | 3 | 5.4% |
) | 3 | 5.4% |
1 | 1 | 1.8% |
, | 1 | 1.8% |
Hangul
Value | Count | Frequency (%) |
보 | 21 | 8.1% |
정 | 18 | 6.9% |
자 | 11 | 4.2% |
관 | 11 | 4.2% |
원 | 10 | 3.8% |
회 | 10 | 3.8% |
인 | 6 | 2.3% |
지 | 5 | 1.9% |
시 | 5 | 1.9% |
터 | 5 | 1.9% |
Other values (87) | 158 |
보유기간
Categorical
HIGH CORRELATION
 
Distinct | 10 |
---|---|
Distinct (%) | 45.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
회원탈퇴시 까지 | |
---|---|
영구 | |
준영구 | |
5년 | |
3년 | |
Other values (5) |
Length
Max length | 13 |
---|---|
Median length | 8 |
Mean length | 4.9545455 |
Min length | 2 |
Unique
Unique | 5 ? |
---|---|
Unique (%) | 22.7% |
Sample
1st row | 2년 |
---|---|
2nd row | 영구 |
3rd row | 준영구 |
4th row | 준영구 |
5th row | 영구 |
Common Values
Value | Count | Frequency (%) |
회원탈퇴시 까지 | 8 | |
영구 | 3 | 13.6% |
준영구 | 2 | 9.1% |
5년 | 2 | 9.1% |
3년 | 2 | 9.1% |
2년 | 1 | 4.5% |
협약해지시 | 1 | 4.5% |
10년 | 1 | 4.5% |
1년 | 1 | 4.5% |
지정판매소 해지(폐업)시 | 1 | 4.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
회원탈퇴시 | 8 | |
까지 | 8 | |
영구 | 3 | 9.7% |
준영구 | 2 | 6.5% |
5년 | 2 | 6.5% |
3년 | 2 | 6.5% |
2년 | 1 | 3.2% |
협약해지시 | 1 | 3.2% |
10년 | 1 | 3.2% |
1년 | 1 | 3.2% |
Other values (2) | 2 | 6.5% |
개인정보의항목(필수)
Text
Distinct | 19 |
---|---|
Distinct (%) | 86.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
Length
Max length | 45 |
---|---|
Median length | 32 |
Mean length | 23.545455 |
Min length | 7 |
Characters and Unicode
Total characters | 518 |
---|---|
Distinct characters | 51 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 17 ? |
---|---|
Unique (%) | 77.3% |
Sample
1st row | 이름, 생년월일, 집연락처, 집주소, 핸드폰, E-Mail, 직장연락처, 직장주소 |
---|---|
2nd row | 이름, 핸드폰, 주민번호, 집주소 |
3rd row | 이름, 핸드폰, 주민등록번호 |
4th row | 이름, 집주소, 핸드폰, 주민번호 |
5th row | 이름, 집주소, 차량번호 |
Value | Count | Frequency (%) |
이름 | 22 | |
집주소 | 17 | |
핸드폰 | 17 | |
생년월일 | 13 | |
7 | 6.9% | |
주민번호 | 7 | 6.9% |
외국인등록번호 | 3 | 3.0% |
직장주소 | 3 | 3.0% |
차량번호 | 2 | 2.0% |
핸드폰(연락처 | 2 | 2.0% |
Other values (7) | 8 | 7.9% |
Most occurring characters
Value | Count | Frequency (%) |
80 | ||
, | 78 | |
주 | 28 | 5.4% |
이 | 22 | 4.2% |
름 | 22 | 4.2% |
소 | 20 | 3.9% |
집 | 19 | 3.7% |
핸 | 19 | 3.7% |
드 | 19 | 3.7% |
폰 | 19 | 3.7% |
Other values (41) | 192 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 314 | |
Space Separator | 80 | 15.4% |
Other Punctuation | 78 | 15.1% |
Lowercase Letter | 24 | 4.6% |
Uppercase Letter | 11 | 2.1% |
Dash Punctuation | 7 | 1.4% |
Open Punctuation | 2 | 0.4% |
Close Punctuation | 2 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
주 | 28 | 8.9% |
이 | 22 | 7.0% |
름 | 22 | 7.0% |
소 | 20 | 6.4% |
집 | 19 | 6.1% |
핸 | 19 | 6.1% |
드 | 19 | 6.1% |
폰 | 19 | 6.1% |
번 | 14 | 4.5% |
호 | 14 | 4.5% |
Other values (30) | 118 |
Lowercase Letter
Value | Count | Frequency (%) |
l | 7 | |
i | 7 | |
a | 7 | |
m | 3 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 7 | |
M | 4 |
Space Separator
Value | Count | Frequency (%) |
80 |
Other Punctuation
Value | Count | Frequency (%) |
, | 78 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 7 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 314 | |
Common | 169 | |
Latin | 35 | 6.8% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
주 | 28 | 8.9% |
이 | 22 | 7.0% |
름 | 22 | 7.0% |
소 | 20 | 6.4% |
집 | 19 | 6.1% |
핸 | 19 | 6.1% |
드 | 19 | 6.1% |
폰 | 19 | 6.1% |
번 | 14 | 4.5% |
호 | 14 | 4.5% |
Other values (30) | 118 |
Latin
Value | Count | Frequency (%) |
E | 7 | |
l | 7 | |
i | 7 | |
a | 7 | |
M | 4 | |
m | 3 |
Common
Value | Count | Frequency (%) |
80 | ||
, | 78 | |
- | 7 | 4.1% |
( | 2 | 1.2% |
) | 2 | 1.2% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 314 | |
ASCII | 204 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
80 | ||
, | 78 | |
E | 7 | 3.4% |
l | 7 | 3.4% |
i | 7 | 3.4% |
a | 7 | 3.4% |
- | 7 | 3.4% |
M | 4 | 2.0% |
m | 3 | 1.5% |
( | 2 | 1.0% |
Hangul
Value | Count | Frequency (%) |
주 | 28 | 8.9% |
이 | 22 | 7.0% |
름 | 22 | 7.0% |
소 | 20 | 6.4% |
집 | 19 | 6.1% |
핸 | 19 | 6.1% |
드 | 19 | 6.1% |
폰 | 19 | 6.1% |
번 | 14 | 4.5% |
호 | 14 | 4.5% |
Other values (30) | 118 |
개인정보의항목(선택)
Text
MISSING
 
Distinct | 9 |
---|---|
Distinct (%) | 81.8% |
Missing | 11 |
Missing (%) | 50.0% |
Memory size | 308.0 B |
Length
Max length | 68 |
---|---|
Median length | 47 |
Mean length | 20.454545 |
Min length | 4 |
Characters and Unicode
Total characters | 225 |
---|---|
Distinct characters | 69 |
Distinct categories | 8 ? |
Distinct scripts | 3 ? |
Distinct blocks | 2 ? |
Unique
Unique | 8 ? |
---|---|
Unique (%) | 72.7% |
Sample
1st row | E-mail, 집연락처, 직장연락처 ,여권번호, 외국인등록번호 |
---|---|
2nd row | 집연락처, 집주소, E-Mail, 직장연락처, 직장주소, 운전면허번호, 외국인등록번호 |
3rd row | 감면정보 등록사항(차량등록증, 장애인 복지카드, 고엽제후유의중환자 여부, 국가유공자 여부, 주민등록등본, 병역명문가 여부) |
4th row | 집연락처 |
5th row | 집연락처, 핸드폰, E-Mail |
Value | Count | Frequency (%) |
직장주소 | 5 | |
집연락처 | 5 | |
5 | ||
직장연락처 | 4 | |
여부 | 3 | 8.1% |
외국인등록번호 | 2 | 5.4% |
고엽제후유의중환자 | 1 | 2.7% |
핸드폰 | 1 | 2.7% |
병역명문가 | 1 | 2.7% |
주민등록등본 | 1 | 2.7% |
Other values (9) | 9 |
Most occurring characters
Value | Count | Frequency (%) |
27 | 12.0% | |
, | 21 | 9.3% |
장 | 10 | 4.4% |
직 | 9 | 4.0% |
처 | 9 | 4.0% |
락 | 9 | 4.0% |
연 | 9 | 4.0% |
주 | 7 | 3.1% |
집 | 6 | 2.7% |
등 | 6 | 2.7% |
Other values (59) | 112 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 145 | |
Space Separator | 27 | 12.0% |
Other Punctuation | 21 | 9.3% |
Lowercase Letter | 18 | 8.0% |
Uppercase Letter | 7 | 3.1% |
Dash Punctuation | 5 | 2.2% |
Close Punctuation | 1 | 0.4% |
Open Punctuation | 1 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
장 | 10 | 6.9% |
직 | 9 | 6.2% |
처 | 9 | 6.2% |
락 | 9 | 6.2% |
연 | 9 | 6.2% |
주 | 7 | 4.8% |
집 | 6 | 4.1% |
등 | 6 | 4.1% |
소 | 6 | 4.1% |
록 | 5 | 3.4% |
Other values (48) | 69 |
Lowercase Letter
Value | Count | Frequency (%) |
i | 5 | |
l | 5 | |
a | 5 | |
m | 3 |
Uppercase Letter
Value | Count | Frequency (%) |
E | 5 | |
M | 2 | 28.6% |
Space Separator
Value | Count | Frequency (%) |
27 |
Other Punctuation
Value | Count | Frequency (%) |
, | 21 |
Dash Punctuation
Value | Count | Frequency (%) |
- | 5 |
Close Punctuation
Value | Count | Frequency (%) |
) | 1 |
Open Punctuation
Value | Count | Frequency (%) |
( | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 145 | |
Common | 55 | 24.4% |
Latin | 25 | 11.1% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
장 | 10 | 6.9% |
직 | 9 | 6.2% |
처 | 9 | 6.2% |
락 | 9 | 6.2% |
연 | 9 | 6.2% |
주 | 7 | 4.8% |
집 | 6 | 4.1% |
등 | 6 | 4.1% |
소 | 6 | 4.1% |
록 | 5 | 3.4% |
Other values (48) | 69 |
Latin
Value | Count | Frequency (%) |
E | 5 | |
i | 5 | |
l | 5 | |
a | 5 | |
m | 3 | |
M | 2 | 8.0% |
Common
Value | Count | Frequency (%) |
27 | ||
, | 21 | |
- | 5 | 9.1% |
) | 1 | 1.8% |
( | 1 | 1.8% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 145 | |
ASCII | 80 |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
27 | ||
, | 21 | |
E | 5 | 6.2% |
i | 5 | 6.2% |
l | 5 | 6.2% |
- | 5 | 6.2% |
a | 5 | 6.2% |
m | 3 | 3.8% |
M | 2 | 2.5% |
) | 1 | 1.2% |
Hangul
Value | Count | Frequency (%) |
장 | 10 | 6.9% |
직 | 9 | 6.2% |
처 | 9 | 6.2% |
락 | 9 | 6.2% |
연 | 9 | 6.2% |
주 | 7 | 4.8% |
집 | 6 | 4.1% |
등 | 6 | 4.1% |
소 | 6 | 4.1% |
록 | 5 | 3.4% |
Other values (48) | 69 |
개인정보 처리방법
Categorical
HIGH CORRELATION
 
Distinct | 9 |
---|---|
Distinct (%) | 40.9% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 308.0 B |
개인정보처리시스템 | |
---|---|
개인정보처리시스템, 업무용PC, 종이문서 | |
종이문서 | |
개인정보처리시스템, 업무용 PC | |
업무용 PC | |
Other values (4) |
Length
Max length | 22 |
---|---|
Median length | 17 |
Mean length | 12.181818 |
Min length | 4 |
Unique
Unique | 3 ? |
---|---|
Unique (%) | 13.6% |
Sample
1st row | 업무용 PC |
---|---|
2nd row | 개인정보처리시스템, 업무용PC, 종이문서 |
3rd row | 종이문서 |
4th row | 종이문서 |
5th row | 개인정보처리시스템, 업무용 PC |
Common Values
Value | Count | Frequency (%) |
개인정보처리시스템 | 6 | |
개인정보처리시스템, 업무용PC, 종이문서 | 3 | |
종이문서 | 3 | |
개인정보처리시스템, 업무용 PC | 3 | |
업무용 PC | 2 | 9.1% |
개인정보시스템, 업무용 PC, 종이문서 | 2 | 9.1% |
업무용PC, 종이문서 | 1 | 4.5% |
<NA> | 1 | 4.5% |
개인정보처리시스템, 업무용PC | 1 | 4.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
개인정보처리시스템 | 13 | |
종이문서 | 9 | |
업무용 | 7 | |
pc | 7 | |
업무용pc | 5 | 11.4% |
개인정보시스템 | 2 | 4.5% |
na | 1 | 2.3% |
파일명 | 보유기간 | 개인정보의항목(필수) | 개인정보의항목(선택) | 개인정보 처리방법 | |
---|---|---|---|---|---|
파일명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
보유기간 | 1.000 | 1.000 | 0.924 | 0.820 | 0.857 |
개인정보의항목(필수) | 1.000 | 0.924 | 1.000 | 1.000 | 0.930 |
개인정보의항목(선택) | 1.000 | 0.820 | 1.000 | 1.000 | 0.931 |
개인정보 처리방법 | 1.000 | 0.857 | 0.930 | 0.931 | 1.000 |
개인정보 처리방법 | 보유기간 | |
---|---|---|
개인정보 처리방법 | 1.000 | 0.572 |
보유기간 | 0.572 | 1.000 |
보유기간 | 개인정보 처리방법 | |
---|---|---|
보유기간 | 1.000 | 0.572 |
개인정보 처리방법 | 0.572 | 1.000 |
파일명 | 보유기간 | 개인정보의항목(필수) | 개인정보의항목(선택) | 개인정보 처리방법 | |
---|---|---|---|---|---|
0 | 기술자문위원회 위원 | 2년 | 이름, 생년월일, 집연락처, 집주소, 핸드폰, E-Mail, 직장연락처, 직장주소 | <NA> | 업무용 PC |
1 | 기존주택 전세임대사업 | 영구 | 이름, 핸드폰, 주민번호, 집주소 | E-mail, 집연락처, 직장연락처 ,여권번호, 외국인등록번호 | 개인정보처리시스템, 업무용PC, 종이문서 |
2 | 광교, 흥덕 분양 입주자 정보 | 준영구 | 이름, 핸드폰, 주민등록번호 | 집연락처, 집주소, E-Mail, 직장연락처, 직장주소, 운전면허번호, 외국인등록번호 | 종이문서 |
3 | 역분 분양입주자 정보 | 준영구 | 이름, 집주소, 핸드폰, 주민번호 | <NA> | 종이문서 |
4 | 주차미납압류 대상자 정보 | 영구 | 이름, 집주소, 차량번호 | <NA> | 개인정보처리시스템, 업무용 PC |
5 | 용인시공영주차장 홈페이지 회원 정보 | 회원탈퇴시 까지 | 이름, 집주소, 핸드폰, E-Mail, 차량번호, 감면관련 자료 | 감면정보 등록사항(차량등록증, 장애인 복지카드, 고엽제후유의중환자 여부, 국가유공자 여부, 주민등록등본, 병역명문가 여부) | 개인정보처리시스템, 업무용 PC |
6 | 교통약자 이용자 정보 | 회원탈퇴시 까지 | 이름, 생년월일, 핸드폰, 건강정보 | 집연락처 | 개인정보시스템, 업무용 PC, 종이문서 |
7 | 교통약자 개인콜택시 기사관리 | 협약해지시 | 이름, 생년월일, 집주소, 핸드폰, 운전면허번호 | <NA> | 개인정보시스템, 업무용 PC, 종이문서 |
8 | 남사스포츠센터 회원관리 | 회원탈퇴시 까지 | 이름, 생년월일, 집주소 | 집연락처, 핸드폰, E-Mail | 개인정보처리시스템 |
9 | 정보공개모니터단 정보 | 10년 | 이름, 생년월일, 집주소, 핸드폰, E-mail, 주민번호 | 집연락처, 직장연락처, 직장주소 | 업무용PC, 종이문서 |
파일명 | 보유기간 | 개인정보의항목(필수) | 개인정보의항목(선택) | 개인정보 처리방법 | |
---|---|---|---|---|---|
12 | 미르스타디움 대관자 정보 | 5년 | 이름, 핸드폰 | 직장주소 | 종이문서 |
13 | 보상관련 소유자 및 관계인 정보(보상1팀) | 영구 | 이름, 생년월일, 집주소, 핸드폰, 주민번호, 외국인등록번호 | <NA> | 개인정보처리시스템, 업무용 PC |
14 | 보상관련 소유자 및 관계인 정보(반도체) | 3년 | 이름, 생년월일, 집주소, 핸드폰, 주민번호, 외국인등록번호 | 직장주소 | 개인정보처리시스템, 업무용PC, 종이문서 |
15 | 보상관련 소유자 및 관계인 정보(플랫폼) | 3년 | 이름, 생년월일, 집주소, 핸드폰, 주민번호, 외국인등록번호 | 직장주소 | 개인정보처리시스템, 업무용PC, 종이문서 |
16 | 모현복지회관 회원 정보 | 5년 | 이름, 생년월일, 집주소, 핸드폰 | <NA> | <NA> |
17 | 종량제물품 지정판매소 정보 | 지정판매소 해지(폐업)시 | 이름, 직장주소 | 생년월일, E-mail, 직장연락처 | 개인정보처리시스템 |
18 | 시민체육센터 회원 정보 | 회원탈퇴시 까지 | 이름, 집주소, 직장주소, E-Mail, 핸드폰(연락처), 생년월일 | <NA> | 개인정보처리시스템 |
19 | 생활체육실 회원 정보 | 회원탈퇴시 까지 | 이름, 생년월일, 집주소, 핸드폰 | <NA> | 개인정보처리시스템 |
20 | 아르피아스포츠센터 회원관리 | 회원탈퇴시 까지 | 이름, 생년월일, 집연락처, 집주소, 핸드폰 | 개인정보처리시스템 | |
21 | 용인평온의숲 홈페이지 회원정보 | 회원탈퇴시 까지 | 이름, 집주소, 핸드폰(연락처), E-Mail | <NA> | 개인정보처리시스템, 업무용PC |