Dataset statistics
Number of variables | 10 |
---|---|
Number of observations | 85 |
Missing cells | 412 |
Missing cells (%) | 48.5% |
Duplicate rows | 1 |
Duplicate rows (%) | 1.2% |
Total size in memory | 7.1 KiB |
Average record size in memory | 85.6 B |
Variable types
Categorical | 5 |
---|---|
Text | 1 |
Unsupported | 4 |
Dataset
Description | 경상남도 김해시 쓰레기바코드시스템 개방 가능 DB 정보로 운영부서, 정보시스템명, DB명, 영문테이블명 등의 데이터로 구성되어 있습니다. |
---|---|
Author | 경상남도 김해시 |
URL | https://bigdata.gyeongnam.go.kr/index.gn?menuCd=DOM_000000114002001000&publicdatapk=15063876 |
Dataset has 1 (1.2%) duplicate rows | Duplicates |
정보시스템명 is highly overall correlated with 운영부서 and 3 other fields | High correlation |
영문 테이블명 is highly overall correlated with 운영부서 and 2 other fields | High correlation |
한글 테이블명 is highly overall correlated with 운영부서 and 2 other fields | High correlation |
DB명 is highly overall correlated with 운영부서 and 3 other fields | High correlation |
운영부서 is highly overall correlated with 정보시스템명 and 3 other fields | High correlation |
영문 테이블명 is highly imbalanced (57.3%) | Imbalance |
한글 테이블명 is highly imbalanced (57.3%) | Imbalance |
한글 컬럼명 has 72 (84.7%) missing values | Missing |
Unnamed: 6 has 85 (100.0%) missing values | Missing |
Unnamed: 7 has 85 (100.0%) missing values | Missing |
Unnamed: 8 has 85 (100.0%) missing values | Missing |
Unnamed: 9 has 85 (100.0%) missing values | Missing |
Unnamed: 6 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 7 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 8 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Unnamed: 9 is an unsupported type, check if it needs cleaning or further analysis | Unsupported |
Reproduction
Analysis started | 2023-12-11 00:46:53.959808 |
---|---|
Analysis finished | 2023-12-11 00:46:54.484467 |
Duration | 0.52 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
운영부서
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 812.0 B |
<NA> | |
---|---|
청소과 |
Length
Max length | 4 |
---|---|
Median length | 4 |
Mean length | 3.8470588 |
Min length | 3 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 청소과 |
---|---|
2nd row | 청소과 |
3rd row | 청소과 |
4th row | 청소과 |
5th row | 청소과 |
Common Values
Value | Count | Frequency (%) |
<NA> | 72 | |
청소과 | 13 | 15.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 72 | |
청소과 | 13 | 15.3% |
정보시스템명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 812.0 B |
<NA> | |
---|---|
쓰레기바코드시스템 |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 4.7647059 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 쓰레기바코드시스템 |
---|---|
2nd row | 쓰레기바코드시스템 |
3rd row | 쓰레기바코드시스템 |
4th row | 쓰레기바코드시스템 |
5th row | 쓰레기바코드시스템 |
Common Values
Value | Count | Frequency (%) |
<NA> | 72 | |
쓰레기바코드시스템 | 13 | 15.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 72 | |
쓰레기바코드시스템 | 13 | 15.3% |
DB명
Categorical
HIGH CORRELATION
 
Distinct | 2 |
---|---|
Distinct (%) | 2.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 812.0 B |
<NA> | |
---|---|
SMTSERVER |
Length
Max length | 9 |
---|---|
Median length | 4 |
Mean length | 4.7647059 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | SMTSERVER |
---|---|
2nd row | SMTSERVER |
3rd row | SMTSERVER |
4th row | SMTSERVER |
5th row | SMTSERVER |
Common Values
Value | Count | Frequency (%) |
<NA> | 72 | |
SMTSERVER | 13 | 15.3% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 72 | |
smtserver | 13 | 15.3% |
영문 테이블명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 812.0 B |
<NA> | |
---|---|
GBMT110 | |
GBTT011 | 1 |
Length
Max length | 7 |
---|---|
Median length | 4 |
Mean length | 4.4588235 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.2% |
Sample
1st row | GBTT011 |
---|---|
2nd row | GBMT110 |
3rd row | GBMT110 |
4th row | GBMT110 |
5th row | GBMT110 |
Common Values
Value | Count | Frequency (%) |
<NA> | 72 | |
GBMT110 | 12 | 14.1% |
GBTT011 | 1 | 1.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 72 | |
gbmt110 | 12 | 14.1% |
gbtt011 | 1 | 1.2% |
한글 테이블명
Categorical
HIGH CORRELATION
  IMBALANCE
 
Distinct | 3 |
---|---|
Distinct (%) | 3.5% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 812.0 B |
<NA> | |
---|---|
포장단위 | |
발주 상세 내역 | 1 |
Length
Max length | 8 |
---|---|
Median length | 4 |
Mean length | 4.0470588 |
Min length | 4 |
Unique
Unique | 1 ? |
---|---|
Unique (%) | 1.2% |
Sample
1st row | 발주 상세 내역 |
---|---|
2nd row | 포장단위 |
3rd row | 포장단위 |
4th row | 포장단위 |
5th row | 포장단위 |
Common Values
Value | Count | Frequency (%) |
<NA> | 72 | |
포장단위 | 12 | 14.1% |
발주 상세 내역 | 1 | 1.2% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 72 | |
포장단위 | 12 | 13.8% |
발주 | 1 | 1.1% |
상세 | 1 | 1.1% |
내역 | 1 | 1.1% |
한글 컬럼명
Text
MISSING
 
Distinct | 13 |
---|---|
Distinct (%) | 100.0% |
Missing | 72 |
Missing (%) | 84.7% |
Memory size | 812.0 B |
Value | Count | Frequency (%) |
구.군코드 | 1 | 7.7% |
지정코드 | 1 | 7.7% |
봉투구분 | 1 | 7.7% |
봉투재질 | 1 | 7.7% |
봉투용량 | 1 | 7.7% |
박스 | 1 | 7.7% |
팩 | 1 | 7.7% |
낱장구분 | 1 | 7.7% |
만료기간 | 1 | 7.7% |
수량 | 1 | 7.7% |
Other values (3) | 3 |
Most occurring characters
Value | Count | Frequency (%) |
봉 | 4 | 8.7% |
투 | 4 | 8.7% |
구 | 3 | 6.5% |
코 | 3 | 6.5% |
드 | 3 | 6.5% |
량 | 2 | 4.3% |
용 | 2 | 4.3% |
분 | 2 | 4.3% |
자 | 1 | 2.2% |
만 | 1 | 2.2% |
Other values (21) | 21 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 45 | |
Other Punctuation | 1 | 2.2% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
봉 | 4 | 8.9% |
투 | 4 | 8.9% |
구 | 3 | 6.7% |
코 | 3 | 6.7% |
드 | 3 | 6.7% |
량 | 2 | 4.4% |
용 | 2 | 4.4% |
분 | 2 | 4.4% |
자 | 1 | 2.2% |
만 | 1 | 2.2% |
Other values (20) | 20 |
Other Punctuation
Value | Count | Frequency (%) |
. | 1 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 45 | |
Common | 1 | 2.2% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
봉 | 4 | 8.9% |
투 | 4 | 8.9% |
구 | 3 | 6.7% |
코 | 3 | 6.7% |
드 | 3 | 6.7% |
량 | 2 | 4.4% |
용 | 2 | 4.4% |
분 | 2 | 4.4% |
자 | 1 | 2.2% |
만 | 1 | 2.2% |
Other values (20) | 20 |
Common
Value | Count | Frequency (%) |
. | 1 |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 45 | |
ASCII | 1 | 2.2% |
Most frequent character per block
Hangul
Value | Count | Frequency (%) |
봉 | 4 | 8.9% |
투 | 4 | 8.9% |
구 | 3 | 6.7% |
코 | 3 | 6.7% |
드 | 3 | 6.7% |
량 | 2 | 4.4% |
용 | 2 | 4.4% |
분 | 2 | 4.4% |
자 | 1 | 2.2% |
만 | 1 | 2.2% |
Other values (20) | 20 |
ASCII
Value | Count | Frequency (%) |
. | 1 |
Unnamed: 6
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 85 |
---|---|
Missing (%) | 100.0% |
Memory size | 897.0 B |
Unnamed: 7
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 85 |
---|---|
Missing (%) | 100.0% |
Memory size | 897.0 B |
Unnamed: 8
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 85 |
---|---|
Missing (%) | 100.0% |
Memory size | 897.0 B |
Unnamed: 9
Unsupported
MISSING
  REJECTED
  UNSUPPORTED
 
Missing | 85 |
---|---|
Missing (%) | 100.0% |
Memory size | 897.0 B |
영문 테이블명 | 한글 테이블명 | 한글 컬럼명 | |
---|---|---|---|
영문 테이블명 | 1.000 | 0.562 | 1.000 |
한글 테이블명 | 0.562 | 1.000 | 1.000 |
한글 컬럼명 | 1.000 | 1.000 | 1.000 |
정보시스템명 | 영문 테이블명 | 한글 테이블명 | DB명 | 운영부서 | |
---|---|---|---|---|---|
정보시스템명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
영문 테이블명 | 1.000 | 1.000 | 0.372 | 1.000 | 1.000 |
한글 테이블명 | 1.000 | 0.372 | 1.000 | 1.000 | 1.000 |
DB명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
운영부서 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
운영부서 | 정보시스템명 | DB명 | 영문 테이블명 | 한글 테이블명 | |
---|---|---|---|---|---|
운영부서 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
정보시스템명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
DB명 | 1.000 | 1.000 | 1.000 | 1.000 | 1.000 |
영문 테이블명 | 1.000 | 1.000 | 1.000 | 1.000 | 0.372 |
한글 테이블명 | 1.000 | 1.000 | 1.000 | 0.372 | 1.000 |
운영부서 | 정보시스템명 | DB명 | 영문 테이블명 | 한글 테이블명 | 한글 컬럼명 | Unnamed: 6 | Unnamed: 7 | Unnamed: 8 | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBTT011 | 발주 상세 내역 | 구.군코드 | <NA> | <NA> | <NA> | <NA> |
1 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 지정코드 | <NA> | <NA> | <NA> | <NA> |
2 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 봉투구분 | <NA> | <NA> | <NA> | <NA> |
3 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 봉투재질 | <NA> | <NA> | <NA> | <NA> |
4 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 봉투용량 | <NA> | <NA> | <NA> | <NA> |
5 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 박스 | <NA> | <NA> | <NA> | <NA> |
6 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 팩 | <NA> | <NA> | <NA> | <NA> |
7 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 낱장구분 | <NA> | <NA> | <NA> | <NA> |
8 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 만료기간 | <NA> | <NA> | <NA> | <NA> |
9 | 청소과 | 쓰레기바코드시스템 | SMTSERVER | GBMT110 | 포장단위 | 수량 | <NA> | <NA> | <NA> | <NA> |
운영부서 | 정보시스템명 | DB명 | 영문 테이블명 | 한글 테이블명 | 한글 컬럼명 | Unnamed: 6 | Unnamed: 7 | Unnamed: 8 | Unnamed: 9 | |
---|---|---|---|---|---|---|---|---|---|---|
75 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
76 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
77 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
78 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
79 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
80 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
81 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
82 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
83 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
84 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> |
Most frequently occurring
운영부서 | 정보시스템명 | DB명 | 영문 테이블명 | 한글 테이블명 | 한글 컬럼명 | # duplicates | |
---|---|---|---|---|---|---|---|
0 | <NA> | <NA> | <NA> | <NA> | <NA> | <NA> | 72 |