Dataset statistics
Number of variables | 3 |
---|---|
Number of observations | 153 |
Missing cells | 69 |
Missing cells (%) | 15.0% |
Duplicate rows | 1 |
Duplicate rows (%) | 0.7% |
Total size in memory | 3.7 KiB |
Average record size in memory | 24.9 B |
Variable types
Categorical | 2 |
---|---|
Text | 1 |
Dataset
Description | 본 데이터는 환경산업기술원에서 구축 중인 챗봇의 질문답변 세트(21.9.19 기준)의 기준이 되는 항목 분류코드를 정리한 내용입니다. |
---|---|
Author | 한국환경산업기술원 |
URL | https://www.data.go.kr/data/15089192/fileData.do |
Dataset has 1 (0.7%) duplicate rows | Duplicates |
카테고리 대분류-필수 is highly overall correlated with 카테고리 중분류-필수 | High correlation |
카테고리 중분류-필수 is highly overall correlated with 카테고리 대분류-필수 | High correlation |
카테고리 소분류-필수 has 69 (45.1%) missing values | Missing |
Reproduction
Analysis started | 2023-12-12 09:04:35.838015 |
---|---|
Analysis finished | 2023-12-12 09:04:36.178529 |
Duration | 0.34 seconds |
Software version | ydata-profiling vv4.5.1 |
Download configuration | config.json |
카테고리 대분류-필수
Categorical
HIGH CORRELATION
 
Distinct | 5 |
---|---|
Distinct (%) | 3.3% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
<NA> | |
---|---|
환경정보공개 | |
환경표지인증 | |
가정용보일러인증 | |
녹색구매·제품정보 |
Length
Max length | 9 |
---|---|
Median length | 8 |
Mean length | 5.620915 |
Min length | 4 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 가정용보일러인증 |
---|---|
2nd row | 가정용보일러인증 |
3rd row | 가정용보일러인증 |
4th row | 가정용보일러인증 |
5th row | 가정용보일러인증 |
Common Values
Value | Count | Frequency (%) |
<NA> | 69 | |
환경정보공개 | 27 | 17.6% |
환경표지인증 | 25 | 16.3% |
가정용보일러인증 | 16 | 10.5% |
녹색구매·제품정보 | 16 | 10.5% |
Length
Common Values (Plot)
Value | Count | Frequency (%) |
na | 69 | |
환경정보공개 | 27 | 17.6% |
환경표지인증 | 25 | 16.3% |
가정용보일러인증 | 16 | 10.5% |
녹색구매·제품정보 | 16 | 10.5% |
카테고리 중분류-필수
Categorical
HIGH CORRELATION
 
Distinct | 22 |
---|---|
Distinct (%) | 14.4% |
Missing | 0 |
Missing (%) | 0.0% |
Memory size | 1.3 KiB |
<NA> | |
---|---|
정보 등록방법 | |
기타 | |
인증신청 | |
(기관용)구매실적 | |
Other values (17) |
Length
Max length | 10 |
---|---|
Median length | 4 |
Mean length | 4.9673203 |
Min length | 2 |
Unique
Unique | 0 ? |
---|---|
Unique (%) | 0.0% |
Sample
1st row | 기타 |
---|---|
2nd row | 기타 |
3rd row | 기타 |
4th row | 인증신청 |
5th row | 인증신청 |
Common Values
Value | Count | Frequency (%) |
<NA> | 69 | |
정보 등록방법 | 10 | 6.5% |
기타 | 10 | 6.5% |
인증신청 | 8 | 5.2% |
(기관용)구매실적 | 7 | 4.6% |
인증정보 | 6 | 3.9% |
인증결과 | 5 | 3.3% |
서류 및 현장검증 | 4 | 2.6% |
시상식 | 3 | 2.0% |
계정관리 및 로그인 | 3 | 2.0% |
Other values (12) | 28 |
Length
Value | Count | Frequency (%) |
na | 69 | |
및 | 13 | 6.8% |
등록방법 | 10 | 5.2% |
기타 | 10 | 5.2% |
정보 | 10 | 5.2% |
인증신청 | 8 | 4.2% |
기관용)구매실적 | 7 | 3.6% |
인증정보 | 6 | 3.1% |
인증결과 | 5 | 2.6% |
서류 | 4 | 2.1% |
Other values (19) | 50 |
카테고리 소분류-필수
Text
MISSING
 
Distinct | 74 |
---|---|
Distinct (%) | 88.1% |
Missing | 69 |
Missing (%) | 45.1% |
Memory size | 1.3 KiB |
Value | Count | Frequency (%) |
및 | 5 | 4.3% |
신청방법 | 4 | 3.4% |
가능여부 | 4 | 3.4% |
사용량 | 3 | 2.6% |
로그인 | 2 | 1.7% |
실적제출 | 2 | 1.7% |
조회 | 2 | 1.7% |
시험성적서 | 2 | 1.7% |
교육 | 2 | 1.7% |
기타 | 2 | 1.7% |
Other values (84) | 88 |
Most occurring characters
Value | Count | Frequency (%) |
32 | 6.8% | |
인 | 19 | 4.0% |
증 | 17 | 3.6% |
제 | 12 | 2.5% |
법 | 11 | 2.3% |
기 | 11 | 2.3% |
청 | 10 | 2.1% |
신 | 10 | 2.1% |
방 | 10 | 2.1% |
적 | 9 | 1.9% |
Other values (130) | 333 |
Most occurring categories
Value | Count | Frequency (%) |
Other Letter | 434 | |
Space Separator | 32 | 6.8% |
Other Punctuation | 4 | 0.8% |
Open Punctuation | 2 | 0.4% |
Close Punctuation | 2 | 0.4% |
Most frequent character per category
Other Letter
Value | Count | Frequency (%) |
인 | 19 | 4.4% |
증 | 17 | 3.9% |
제 | 12 | 2.8% |
법 | 11 | 2.5% |
기 | 11 | 2.5% |
청 | 10 | 2.3% |
신 | 10 | 2.3% |
방 | 10 | 2.3% |
적 | 9 | 2.1% |
사 | 9 | 2.1% |
Other values (125) | 316 |
Other Punctuation
Value | Count | Frequency (%) |
· | 3 | |
/ | 1 | 25.0% |
Space Separator
Value | Count | Frequency (%) |
32 |
Open Punctuation
Value | Count | Frequency (%) |
( | 2 |
Close Punctuation
Value | Count | Frequency (%) |
) | 2 |
Most occurring scripts
Value | Count | Frequency (%) |
Hangul | 434 | |
Common | 40 | 8.4% |
Most frequent character per script
Hangul
Value | Count | Frequency (%) |
인 | 19 | 4.4% |
증 | 17 | 3.9% |
제 | 12 | 2.8% |
법 | 11 | 2.5% |
기 | 11 | 2.5% |
청 | 10 | 2.3% |
신 | 10 | 2.3% |
방 | 10 | 2.3% |
적 | 9 | 2.1% |
사 | 9 | 2.1% |
Other values (125) | 316 |
Common
Value | Count | Frequency (%) |
32 | ||
· | 3 | 7.5% |
( | 2 | 5.0% |
) | 2 | 5.0% |
/ | 1 | 2.5% |
Most occurring blocks
Value | Count | Frequency (%) |
Hangul | 434 | |
ASCII | 37 | 7.8% |
None | 3 | 0.6% |
Most frequent character per block
ASCII
Value | Count | Frequency (%) |
32 | ||
( | 2 | 5.4% |
) | 2 | 5.4% |
/ | 1 | 2.7% |
Hangul
Value | Count | Frequency (%) |
인 | 19 | 4.4% |
증 | 17 | 3.9% |
제 | 12 | 2.8% |
법 | 11 | 2.5% |
기 | 11 | 2.5% |
청 | 10 | 2.3% |
신 | 10 | 2.3% |
방 | 10 | 2.3% |
적 | 9 | 2.1% |
사 | 9 | 2.1% |
Other values (125) | 316 |
None
Value | Count | Frequency (%) |
· | 3 |
카테고리 대분류-필수 | 카테고리 중분류-필수 | 카테고리 소분류-필수 | |
---|---|---|---|
카테고리 대분류-필수 | 1.000 | 0.955 | 0.918 |
카테고리 중분류-필수 | 0.955 | 1.000 | 0.000 |
카테고리 소분류-필수 | 0.918 | 0.000 | 1.000 |
카테고리 중분류-필수 | 카테고리 대분류-필수 | |
---|---|---|
카테고리 중분류-필수 | 1.000 | 0.760 |
카테고리 대분류-필수 | 0.760 | 1.000 |
카테고리 대분류-필수 | 카테고리 중분류-필수 | |
---|---|---|
카테고리 대분류-필수 | 1.000 | 0.760 |
카테고리 중분류-필수 | 0.760 | 1.000 |
카테고리 대분류-필수 | 카테고리 중분류-필수 | 카테고리 소분류-필수 | |
---|---|---|---|
0 | 가정용보일러인증 | 기타 | 보조금 |
1 | 가정용보일러인증 | 기타 | 컨설팅 |
2 | 가정용보일러인증 | 기타 | 계정분실 |
3 | 가정용보일러인증 | 인증신청 | 신규신청 |
4 | 가정용보일러인증 | 인증신청 | 변경신청 |
5 | 가정용보일러인증 | 인증신청 | 처리기간 |
6 | 가정용보일러인증 | 인증정보 | 국내판매 |
7 | 가정용보일러인증 | 인증정보 | 인증제품조회 |
8 | 가정용보일러인증 | 인증정보 | 인증종류 |
9 | 가정용보일러인증 | 인증정보 | 인증필수 |
카테고리 대분류-필수 | 카테고리 중분류-필수 | 카테고리 소분류-필수 | |
---|---|---|---|
143 | <NA> | <NA> | <NA> |
144 | <NA> | <NA> | <NA> |
145 | <NA> | <NA> | <NA> |
146 | <NA> | <NA> | <NA> |
147 | <NA> | <NA> | <NA> |
148 | <NA> | <NA> | <NA> |
149 | <NA> | <NA> | <NA> |
150 | <NA> | <NA> | <NA> |
151 | <NA> | <NA> | <NA> |
152 | <NA> | <NA> | <NA> |
Most frequently occurring
카테고리 대분류-필수 | 카테고리 중분류-필수 | 카테고리 소분류-필수 | # duplicates | |
---|---|---|---|---|
0 | <NA> | <NA> | <NA> | 69 |